Annons

Javier frågar:

Jag är en författare av noveller och berättelser. Jag letar efter en gratis Optisk teckenigenkänning (OCR) eller Intelligent karaktärigenkänning (ICR) -program för att skanna mina gamla manuskript från bilder eller fotografier så att jag kan konvertera dem till Microsoft Word-filer.

Finns det några gratis och exakta program som kan göra detta? Tyvärr har jag inte en skanner, men jag har tillgång till en digitalkamera med en 20 megapixels upplösning.

manuskript

Kannons svar:

Som du redan har nämnt finns det flera typer av teckenigenkänningstekniker som automatiskt kan konvertera handskrivna eller skrivna skrifter till digitala tecken. Nivån av noggrannhet för dessa typer av programvara varierar mycket mellan olika implementationer. Vissa konverterar på bokstav för brev och andra kan konvertera hela ord. Det finns tre allmänna kategorier av den här programvaran:

  • Optisk karaktärigenkänning (OCR)
  • Intelligent Character Recognition (ICR)
  • Intelligent ordigenkänning (IWR)

Optisk teckenigenkänning

instagram viewer

I själva verket är OCR en generisk term och ofta kallas alla metoder som beskrivs i den här artikeln OCR - Wikipedia ger emellertid OCR sin egen klassificering, men moderna implementationer tenderar att klumpa samman flera metoder. Så vad gör det? OCR konverterar enskilda – typade eller handskrivna bokstäver till digitala tecken. Så programvaran tittar på ett dokument och försöker sedan konvertera det till vanlig text genom att gissa vad varje karaktär är.

Programvaran är inte perfekt. OCR-programvara kan tolka enskilda karaktärer med liknande utseende, vilket kan leda till felstavade ord och felaktiga utgångar. Oftast kan användare kopiera texten som genereras av ett OCR-program till en ordbehandlare och automatiskt fixa stavfel. Ofta visas fel som liknande tecken. Till exempel kan bokstaven "d" representeras som "cl".

Men när det gäller handskrivna texter klarar OCR inte så bra. Åtminstone är majoriteten av de fria implementeringarna tragiskt dåliga. Det finns några kommersiella produkter som kan verkligen spikar handskrivna transkription, men deras prissättning placerar dem helt utom räckhåll för allmänheten. Till exempel finns Lexmarks ReadSoft OCR-programvara. Den här programvaran endast för företagskostnader tusentals dollar.

kommenterad text

Intelligent karaktärigenkänning

ICR är en delmängd av OCR som är specialiserad på att konvertera handskriven text till enskilda digitala tecken. Med tanke på att dina anteckningar och manuskript är handskrivna är ett ICR-program det mest användbara. Jag är dock inte säker på hur exakt de kan konvertera texter skrivna på främmande språk, som spanska. Liksom med OCR kan användare förbättra kvaliteten på de utmatade texterna genom att kopiera dem till en ordbehandlare med stavningskorrigering aktiverad och sedan korrekturläsning för hand.

Ett karaktärstest: 10 teckensnitt som bevisar typografi kan vara roliga

Intelligent ordigenkänning

Den senaste utvecklingen av OCR och ICR är Intelligent ordigenkänning programvara. I stället för att känna igen enskilda karaktärer försöker den översätta hela handskrivna ord. Liksom OCR och ICR omväxlar intelligenta ordigenkänningar ofta ord och kräver att användaren manuellt korrigerar eventuella misstag.

Vad är den bästa gratis OCR-programvaran?

Det finns många alternativ tillgängliga. tesseract är förmodligen den bästa öppen källa (och gratis) OCR-programvara där ute. Såvitt jag vet så ser det bara på enskilda karaktärer och inte hela ord.

Eftersom du använder Microsoft Word (som har det bästa, mest anpassningsbara stavningskontroll Hur stavning och grammatik kontrolleras i Microsoft WordDu kan anpassa Microsoft Words inbyggda stavnings- och grammatikontrollverktyg för att tillgodose dina behov. Du kan till och med använda AutoCorrect för att påskynda din skrivning. Läs mer i företagen) kan du bara kopiera hela texten till Word och sedan köra en stavkontroll för att rensa felstavningar.

Tesseract är faktiskt en OCR-motor som går från kommandoraden. Om du inte är villig att hantera svårigheten att använda ett kommandoradsverktyg, kommer du sannolikt att vilja installera något mer användarvänligt. Det finns ett nedladdningsbart "front-end" (eller ett grafiskt användargränssnitt) som låter dig använda Tesseract som ett drag-and-drop-verktyg: PDF OCR X. Installera först programvarupaketet och kör sedan det. Du kommer då att se ett fönster:

PDF OCR-gränssnitt

Sedan drar du bara och släpper bildfilen till fönstret. När bilden laddas kör du OCR-transkriptionsprogramvaran. Det kan ta ungefär en minut.

Tyvärr visade det sig helt otillräckligt för att hantera din text. Så här ser det ut efter att ha extraherat text från dokumentet:

OCR-bildekstraktion med tesseract

Eftersom det verkar som om du redan använder Microsoft Office är det bästa alternativet troligen också från Microsoft. Jag kommer att gissa att du äger en kopia av Microsoft Office, som inkluderar OneNote. Detta är utrustat med ganska avancerad OCR-teknik.

Också på båda iOS och Android, det finns också det helt gratis Microsoft Office-objektiv, som kan konvertera JPEG (och andra bildformat) direkt till text. Det som gör mobilversionerna så underbara är att du kan fotografera en bild, ladda upp den till Microsofts molnberäkningssystem och sedan köra textuttag från OneNote på ett skrivbord.

Processen är ganska enkel. Ta först ett foto av din text. Om du har beslutat att använda OneNote-appen behöver du bara spara filen på ditt OneDrive-konto. Annars kan du överföra bilden till din dator och släppa till OneNote.

Högerklicka sedan på bilden och välj KopiaText från bild från snabbmenyn.

onenote extraktion av text

Högerklicka sedan på en tom del av OneNote (eller i en applikation för textläsning) och klistra in texten i. Den utmatade texten från ditt dokument ser ut så här:

onenote OCR text extraktion

Tyvärr gör inte resultaten från OneNote det var som helst nära ett bra jobb, producerar fullständig nonsens. Detta kan orsakas av en kombination av faktorer, till exempel en förvrängd bild eller skrivning som inte görs i en rak linje, eller helt enkelt för att programvaran inte är tillräckligt bra.

Just nu är den bästa lösningen för OCR på handskrivna dokument relaterad till maskininlärning: Speciellt djupinlärning. Deep-learning är en sofistikerad metod för att utbilda en dator för att utföra uppgifter som tidigare bara mänskligt utmärkt sig på, såsom ansiktsigenkänning (Picasa gör ansiktsigenkänning Hur man använder ansiktsigenkänning i Picasa webbalbum Läs mer , tro det eller ej). Google köpte nyligen DeepMind, som utvecklas djupinlärningsteknologi Coola forskningsprojekt som kan förändra framtidenKommer megaföretag som Google, Microsoft, IBM och Intel fortsätta att ge kommande generationer världen som vi bara kan föreställa oss nu? Dessa spännande forskningsprojekt säger att det är ett löfte de kommer att hålla. Läs mer . Detta nyckelförvärv hade en stor effekt: Microsoft tappar till Google i OCR Microsoft vs Google - Vem leder det artificiella intelligensloppet?Artificiella intelligensforskare gör konkreta framsteg, och människor börjar prata allvarligt om AI igen. De två titanerna som leder den artificiella intelligensen är Google och Microsoft. Läs mer . Just nu erbjuder Google en av de mest avancerade (och gratis) metoderna: Google Keep.

Google Keep (som vi först granskade 2013 Enkla anteckningar på språng: Google Keep For Android-granskadDet finns några fantastiska anteckningsappar där ute, men här är en som förtjänar en närmare titt: Google Keep, en anteckningshållare som har både en snygg Android-app och en snygg webapp. Läs mer ) erbjuder också en mobilversion av deras app för Android. Som med OneNote kan du ta bilden och överföra den direkt till Googles moln. Dra bara bilden till Google Keep-fönstret. Klicka sedan på menyknappen (tre vertikala prickar) och välj Ta bildtext från snabbmenyn.

google keep

Så här ser det ut efter att ha extraherat texten:

2015-07-18_19h45_34

Google Keep vinner

Som du ser dominerar Google Keep i tävlingen. Resultaten kan förbättras ytterligare genom att använda en bildredigeringsverktyg 10 gratis verktyg för fotoredigerare för att få ut så mycket som möjligt av dina bilderVad hände med alla ögonblicksbilder du har tagit tidigare? Om du har planer och idéer, här är några fantastiska Windows och några plattformsverktyg att bearbeta dem med. Läs mer för att öka kontrasten och räta upp bilden.

Förhoppningsvis hjälper dessa alternativ. Om du behöver fler OCR-alternativ, vänligen kolla in 5 bästa OCR-verktyg De 5 bästa OCR-verktygen för att extrahera text från bilderNär du har pappersremsor, hur får du all den tryckta texten omvandlad till något som ett digitalt program kommer att kunna identifiera och indexera? Håll en bra OCR-programvara i närheten. Läs mer , för mer information.

Kannon är en teknisk journalist (BA) med bakgrund i internationella frågor (MA) med tonvikt på ekonomisk utveckling och internationell handel. Hans passioner är i kinesiska apparater, informationsteknologi (som RSS) och produktivitetstips och tricks.