왓츠앱

gImageReader – Linux의 이미지 및 PDF에서 텍스트 추출

Anonim

gImageReader는 이미지와 PDF에서 텍스트를 추출할 수 있는 무료 오픈 소스 PDF 리더입니다. Tesseract-OCR의 간단한 Gtk/Qt 프런트 엔드로 구축되어 을 사용하여 문서 및 이미지의 텍스트와 패턴을 인식하는 오픈 소스 OCR 엔진입니다. 인공지능

Tesseract는 그 자체로 터미널에 익숙한 Linux 사용자만 사용할 수 있는 명령줄 도구입니다. gImageReader 덕분에 이제 누구나 엔진의 OCR 효율성을 활용할 수 있습니다.

gImageReader 유니코드 문자 덕분에 지원하는 여러 언어로 된 PDF 또는 그림 파일의 텍스트를 스캔하여 작동합니다. . 맞춤법 검사 및 번역 작업을 수행할 수 있는 간단하고 잘 구성된 사용자 정의 가능한 사용자 인터페이스가 특징입니다.

gImageReader의 기능

gImageReader는 사용하기 쉽고 소프트 카피 문서 작업과 업로드된 미디어의 스냅샷을 지원합니다. 스크린샷. 관심 있는 텍스트 영역을 선택하고 필요한 텍스트만 추가할 수도 있습니다. 궁극적으로 gImagereader는 PDF 리더 및 텍스트 추출 도구로 작동합니다. 바보 같은 것들.

Linux에 gImageReader 설치

gImageReader를 최대한 활용하려면 Tesseract를 수동으로 설치해야 합니다. 언어 팩으로 이미지와 파일을 제대로 분석할 수 있습니다.패키지 이름은 'Tesseract-ocr-eng'이며 Debian의 소프트웨어 관리자에서 사용할 수 있습니다.및 Fedora 배포판.

Ubuntu를 실행 중인 경우 PPA아래 명령을 사용하여 설치 명령을 실행합니다.

$ sudo add-apt-repository ppa:sandromani/gimagereader
$ sudo 적절한 업데이트
$ sudo apt 설치 gimagereader

켜기 Debian, Fedora OpenSUSE 패키지 관리자에서 설치합니다.

$ sudo apt 설치 gimagereader
$ sudo dnf 설치 gimagereader
$ sudo zypper 설치 gimagereader

Arch Linux 또는 그 파생물을 실행 중인 경우 소외감을 느끼지 마십시오. AUR가 귀하를 보호했습니다. 소스에서 앱을 다시 빌드하려는 경우 지침은 GitHub 리포지토리 위키 링크에 있습니다.

당신은 이미지에서 인쇄된 텍스트를 추출하는 사람입니까? 휴대폰으로 선택한 영역의 스냅샷을 찍어 노트북에 업로드할 수도 있습니다. 더 멋진 점은 다국어 지원입니다. 비록 완벽하지는 않지만 현재 커뮤니티에서 이미 최고의 옵션 중 하나입니다.

gImageReader는 특히 OCR 기능을 갖춘 오픈 소스 세계 최고의 PDF 리더 중 하나이므로 사용해 보고 바로 확인하십시오. 당신이 그것을 좋아하는 방법.

평소와 같이 앱 사용 경험이 있는 경우 저희와 공유하실 수 있습니다. 그리고 아래 댓글 섹션에 다른 제안을 추가합니다.