Om du är student eller om ditt arbete innebär att arbeta med massor av bilder och PDF-filer, skulle du någon gång ha känt ett behov av att extrahera text från en bild eller ett dokument.

Lyckligtvis gör textextraktion detta möjligt. Och det finns flera verktyg som du kan använda för att göra detta. gImageReader är ett av många verktyg. Det är gratis att använda och fungerar med både bildfiler och PDF-dokument.

Låt oss dyka in för att kolla in gImageReader i detalj och se hur du kan använda den för att extrahera text från bilder och PDF-filer.

Vad är gImageReader?

gImageReader är en app som låter dig extrahera text från bilder och PDF-filer på Linux. Det är i huvudsak ett GUI eller front-end till Tesseract OCR-motorn, en öppen källa motor utvecklad av Hewlett-Packard som anses vara en av de bästa OCR-motorerna som finns.

Med gImageReader kan du enkelt och ganska exakt extrahera text från bilder eller PDF-dokument med några enkla klick. Du kan sedan exportera den extraherade texten till en text- eller PDF-fil för vidare användning.

instagram viewer

Funktioner i gImageReader

gImageReader har följande funktioner:

  • Importera PDF-dokument och bilder från olika källor (disk, skanningsenheter, urklipp och skärmdump)
  • Batchbearbeta bilder eller dokument, d.v.s. extrahera text från flera bilder eller dokument samtidigt
  • Känn igen textavsnitt som vanlig text eller hOCR-dokument
  • Inbyggd stavningskontroll
  • Automatisk detektering av textområde
  • Grundläggande bild-/dokumentredigering
  • Spara utdata som en textfil

Hur man installerar gImageReader på Linux

gImageReader är tillgänglig på de flesta större Linux-distros. Men innan du fortsätter med installationen måste du installera Tesseract OCR-motorn på ditt system.

För att göra detta, öppna Programvaruhanterare på ditt system och sök efter tesserakt. När det returnerar en lista med resultat, installera tesseract-ocr och tesseract-ocr-eng paket. Du kan också använda kommandoradspakethanterare för att installera paketet om du är mer bekväm med terminalen.

Efter detta, kolla in installationsinstruktionerna i följande avsnitt för att installera gImageReader på din dator.

Om du använder Debian eller Ubuntu, öppna terminalen och kör följande kommandon för att installera gImageReader:

sudo add-apt-repository ppa: sandromani/gimagereader
sudo apt-skaffa sig uppdatering
sudo apt Installera gimagereader

På Fedora, CentOS eller Red Hat Enterprise Linux (RHEL):

sudo dnf Installera gimagereader-qt 

Arch Linux eller Manjaro:

sudo pacman -S gimagereader

openSUSE-användare kan installera gImageReader med:

sudo zypper Installera gimagereader

Om du använder någon annan Linux-distro kan du bygga gImageReader från källan genom att följa instruktionerna på gImageReaders GitHub.

Hur man använder gImageReader på Linux

gImageReader är ganska lätt att använda och fungerar med alla typer av bildfiler såväl som PDF-dokument. Följ instruktionerna nedan för att extrahera text från bilder eller PDF-filer på Linux.

Öppna applikationsmenyn, sök efter gImageReader, och starta appen. Slå Maximera knappen i gImageReader-fönstret för att öppna det i helskärmsvy.

Klicka nu på Lägg till bilder knappen i den vänstra rutan under verktygsfältet och använd filläsaren för att välja den eller de bilder eller PDF-filer som du vill extrahera text från.

Klick Ok för att importera bilden/bilderna eller PDF: erna till gImageReader. Eller, om du vill extrahera text från det som visas på skärmen, klicka på rullgardinsmenyn bredvid Lägg till bilder knappen och välj Ta skärmdump. gImageReader tar en skärmdump av skärmens innehåll.

När du har lagt till bilden i gImageReader klickar du på Växla utdatapanel knappen (en med anteckningsblocksikonen) för att ta fram utdatarutan. Det är här texten du extraherar från bilder eller PDF-filer visas.

Beroende på hur du vill gå tillväga har du nu möjlighet att identifiera texten i bilden eller PDF automatiskt eller manuellt. För att göra detta automatiskt, klicka på Autoupptäck layout knappen, och den kommer att markera alla textblock i den valda bilden eller PDF-dokumentet.

Efter detta, tryck på Identifiera val > Aktuell sida för att påbörja textextraktionsprocessen.

Alternativt, för att markera texten manuellt, håll muspekaren över texten du vill extrahera och rita en ruta runt området där du vill extrahera texten med hjälp av hårkorset. Tryck sedan på Känn igen urval knappen för att fortsätta.

Om det är ett PDF-dokument och du vill extrahera text från olika sidor, tryck på Plus (+) för att vända sidorna.

För att gå tillbaka, tryck på Minus (-) knapp. Och välj sedan texten du vill extrahera och tryck på Känn igen urval knappen för att extrahera den.

Även om det är sällsynt kan det finnas tillfällen då gImageReader returnerar den extraherade texten på ett annat språk än engelska. När detta händer, tryck helt enkelt på rullgardinsknappen bredvid Känn igen urval och välj ett av de engelska alternativen.

Slutligen, för att spara den extraherade texten, klicka på Spara utdata knapp. Detta kommer att ta upp fönstret Spara. Här, ge ett namn till filen och tryck Ok.

Vad mer kan du göra med gImageReader?

Som tidigare nämnts ger gImageReader dig också möjligheten att ändra vissa aspekter av de importerade bilderna eller dokumenten, som deras ljusstyrka, kontrast och upplösning. Dessutom kan du även invertera färger eller rotera bilderna eller dokumenten om det behövs.

De flesta av dessa alternativ kan visa sig vara användbara när texten i en bild eller ett dokument inte är läsbar för gImageReader, och därför hindrar verktyget från att känna igen texten.

För att komma åt något av dessa redigeringsalternativ, klicka på Bildkontroller knappen, och den visar ett miniverktygsfält under huvudverktygsfältet. Härifrån väljer du lämpliga knappar för att utföra önskad redigering av bilden eller dokumentet.

Textextraktion på Linux på ett enkelt sätt med gImageReader

Textextraktion kräver ofta rätt verktyg: ett som använder en pålitlig och exakt OCR-motor som gör det möjligt för den att effektivt identifiera text i en bild eller ett dokument, så att du kan extrahera den effektivt utan någon krångel.

gImageReader åstadkommer detta på ett bra sätt, tack vare Tesseract OCR-motorn som den använder i bakgrunden. Med tanke på dess användarvänlighet är gImageReader utan tvekan ett av de bästa textextraktionsverktygen som finns tillgängliga för Linux.

Alternativt, om du letar efter en enklare lösning kan du kolla in TextSnatcher, som är snabb och ganska enkel att använda.