Annons
Om du vill konvertera tryckt text till digital text som du kan kopiera, klistra in, redigera och söka måste du använda OCR-skannrar (Optical Character Recognition).
När du väljer att skanna eller ta ett foto av ett dokument sparas detta i ett format som JPEG eller PDF. OCR-programvara kan sedan känna igen bokstäver och siffror i dessa dokument och konvertera dem till en sökbar PDF 4 metoder för att skapa och redigera PDF-filer gratisAv alla vanliga filtyper som finns i vår datormiljö är PDF troligen en av de mest restriktiva, samtidigt som alla är tillgängliga för alla att använda (främst för att läsa) ... Läs mer , eller till en fil som du kan redigera i program som Microsoft Word.
Problemet är att vissa OCR-skannrar fungerar mycket bättre än andra, med det allra bästa ganska tungt på plånboken.
Omnipage18 kostar till exempel $ 150, men är särskilt bra på att känna igen olika språk. Adobe Acrobat Pro DC kostar 400 $ iögonfallande men har otrolig noggrannhet. ABBYY FineReader kostar 150 $, men är fantastiskt att konvertera dokument som tidskrifter och broschyrer till sökbar text. Vi kommer att testa ABBYYs erbjudande online senare i den här artikeln.
Men om du letar efter gratisalternativ som du kan ladda ner och använda på Windows eller OS X, bör du prova dessa OCR-verktyg De 5 bästa OCR-verktygen för att extrahera text från bilderNär du har pappersremsor, hur får du all den tryckta texten omvandlad till något som ett digitalt program kommer att kunna identifiera och indexera? Håll en bra OCR-programvara i närheten. Läs mer . Men om du hellre vill använda en gratis, uppkopplad OCR-verktyg, fortsätt att läsa, eftersom vi har testat de bästa få, med resultaten nedan.
Testet
Verkar som de flesta använder nu sina smartphones för att göra sin skanning efter dem Skanna och hantera dina kvitton, spara utrymme, papper och tidPapperskvitton går lätt förlorade och svårt att hitta när du behöver dem mest. Tack och lov löser digitala båda dessa problem. Läs mer , Jag bestämde mig för att använda Evernotes skannbara app (Gratis på iOS och Android). Jag skannade den första sidan av Richard Dawkins Klättringsmontering Troligt, för att se vilka resultat vi kan få med mycket grundläggande formatering. Jag skannade också en sida av Tim Ferriss ' Den 4-timmars kocken att testa skannrarna med lite mer komplicerad formatering. Jag sparat alla dessa filer som en PDF.
Dessa dokument kördes sedan igenom några av de förmodligen bästa OCR-verktygen för att se hur bra de gick.
Gratis OCR online [Längre tillgängligt]
Lyckligtvis krävs ingen registrering för att använda gratis online-OCR. Och jag blev dubbelt imponerad när jag såg deras påstående att behålla formateringen och utformningen av mitt dokument.
Webbplatsen påstår sig kunna stödja PDF, GIF, BMP, JPEG, TIFF och PNG som input. Utgångar kan antingen vara DOC, ett PDF-textdokument, RTF och TXT. Tyvärr kunde jag inte ta reda på om de hade en filstorleksgräns.
Grundläggande dokument till PDF
Konverterade helt perfekt. Det finns inte mycket mer att säga! Vi är på väg till en mycket bra start.
Grundläggande dokument till DOC
De verkliga orden tycks ha konverterat felfritt, bortsett från "ount" från "Mount Rushmore" på något sätt AWOL. Formateringen är dock en annan historia. Många komma ersattes med understreck och slumpmässiga utrymmen infördes i punkter i hela dokumentet. När du senare ser hur premiumprogramvaran presterade i detta test är detta dock inte en dålig ansträngning alls.
Komplexa dokument till PDF
Att konvertera dokumentet tog 120 sekunder! När den var klar hade all text konverterats med cirka 95% noggrannhet, även om texten i den separata rutan längst upp till höger på sidan var osökbar. Några andra tecken i PDF-filen var också felaktiga.
Komplexa dokument till DOC
Denna gång tog konverteringen bara 10 sekunder, med texten omvandlad igen med cirka 95% noggrannhet. Det fanns några konstiga avståndsproblem, och programvaran hade problem med att konvertera teckensnittet längst upp till höger i dokumentet och missade några tecken här och där.
Dom
Om du vill konvertera enkla formaterade dokument till PDF är detta ett fantastiskt verktyg. När det gäller konvertering till DOC var resultaten inte något att skriva hem om.
i2OCR gör några imponerande påståenden. Verktyget känner igen 60 språk, kan hantera layouter med flera kolumner (genom att ta bort formateringen), har inga filstorleksgränser, kan konvertera uppladdade filer och från URL: er. Och du behöver inte registrera dig för att använda det här verktyget heller.
Tjänsten fungerar genom att helt enkelt extrahera texten från din bild och sedan mata ut oformaterad text. Du kan snabbt korrigera eventuella misstag i vyn sida vid sida innan du kopierar texten till andra program eller laddar ner som DOC, PDF eller HTML.
Obs! När jag försökte ladda upp mina PDF-dokument avvisades dessa av i2OCR, så jag behövde konvertera dessa till JPEG (genom att ta en skärmdump av dem och sedan ladda upp filerna).
Grundläggande dokument till vanlig text
På grund av hur detta verktyg fungerar går all formatering bort, även om konverteringen från bild till text var nästan perfekt. Det fanns några små fel som avsnittavstånd, och vissa komma ersattes med perioder, men det här är små nigglar.
Komplexa dokument till vanlig text
Majoriteten av texten konverterades utan för många misstag, förutom titeln och receptet uppe till höger, vilket var oläsligt för det här verktyget. Hur kolumnerna konverterades till vanlig text var långt ifrån idealiska. Om du vill göra denna konvertering användbar skulle det behövas mycket tid för att ordna om raderna till sammanhängande meningar.
Dom
För basdokument fungerar i2OCR utmärkt. Möjligheten att redigera texten innan du laddar ner är också en mycket fin touch. För mer komplexa dokument är konverteringen dock fortfarande ganska korrekt, men hur texten matas ut kommer inte att göra ditt liv mycket lättare.
Online OCR stöder för närvarande 46 olika språk och kan konvertera PDF, JPG, BMP, TIFF och GIF till Word-, Excel- eller Plain Text-format. Webbplatsen hävdar att "konverterade dokument ser exakt ut som originalet - tabeller, kolumner och grafik".
Den version du kan använda utan att registrera dig låter dig konvertera upp till 15 bilder per timme (5 MB gräns). Om du registrerar dig för ett konto kan du köpa fler sidor ovanför denna gräns, samtidigt som du också kan konvertera flersidiga dokument och ZIP-arkiv också.
Grundläggande dokument till DOC
Basdokumentet konverterade felfritt bortsett från det romerska numret jag inte plockas upp. Som webbplatsen lovade var formateringen exakt som i boken. Kudos till det här verktyget.
Komplexa dokument till DOC
Efter att ha varit besviken över de tidigare OCR-verktygen när jag konverterade det komplexa dokumentet imponerades jag massivt av online OCR. Layouten var nära perfekt, som du kan se ovan. Än en gång plockades receptet inte så bra, men andra mindre misstag var försumbara.
Dom
Helt fantastiska resultat från Online OCR. Den enda nackdelen som jag ser är att det inte finns något sätt att ladda ner de konverterade dokumenten som PDF-filer eftersom de nämnda utgångsformaten inkluderar endast DOCX, XLSX och TXT.
Som nämnts tidigare är ABBYY en av marknadsledarna inom OCR-programvara och kostar cirka $ 150 för deras fulla nedladdningsbara program. De erbjuder en Testversion på 10 sidor för deras onlineverktyg, dock (registrering krävs). För ett abonnemang på $ 5 kommer deras onlineverktyg att du kan konvertera 200 sidor varje månad.
Filer som accepteras kan vara upp till 100 MB i något av dessa format: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP och PNG. ABBYY känner också igenom nästan 200 språk. Utgångarna är särskilt imponerande, med valet mellan DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 och EPUB.
Du kan till och med pröva ett par BETA-funktioner under provperioden. Det första är alternativet att översätta ditt dokument till ett annat språk. Den andra är att exportera ditt konverterade dokument till ditt molnlagringskonto, vare sig det är Dropbox, Google Drive, Evernote, Microsoft OneDrive eller Box.
Grundläggande dokument till DOCX
De totala resultaten var bra, men inte fantastiskt med tanke på att detta är en premiumprodukt. Flera komma och perioder byttes, flera inverterade komma ersattes med en asterix, ett par stora bokstäver saknades och ett ord (bokstavlig) stavades felaktigt.
Komplexa dokument till DOCX
När konverteringen hade konverterats fanns det mycket få fel i texten i dokumentet (förutom att OCR kämpade med receptets typsnitt igen!), Men formateringen lämnade mycket att önska.
De tre kolumnerna tog på något sätt två sidor med den centrala kolumnen endast visas på andra sidan. Om du ville faktiskt do någonting med det här konverterade dokumentet, du skulle i slutändan dra ut håret.
Grundläggande dokument till PDF
När jag granskade den konverterade PDF-filen kunde jag inte hitta något fel alls. Kanske har vi hittat var ABBYY utmärker sig. Fantastiska resultat.
Komplexa dokument till PDF
Återigen kunde jag inte hitta några fel i den konverterade filen. ABBYY vet uppenbarligen hur man konverterar till PDF exceptionellt bra.
Dom
Om du är glad att betala några dollar, verkar konvertering till PDF fungera fenomenalt bra med den här tjänsten och vara att synkronisera konverterade filer till din molnlagring är särskilt användbart om du skannar en stor volym dokument. Liksom med de andra alternativen har ABBYY fortfarande inte kommit fram till hur man felfritt konverterar dokument till DOC för enkel redigering.
Slutresultatet
Om du, precis som de flesta, bara vill skanna några tidskriftsartiklar och några hushållsräkningar, behöver du inte redigera dessa dokument. Därför är konvertering direkt till en PDF lämplig för dig eftersom du fortfarande kan söka i dessa dokument. För detta var Free Online OCR definitivt det bästa gratisverktyget vi testade. Med det sagt, om du är villig att betala $ 5 per månad för nästan perfektion, ABBYY: s FineReader Online var lite mer exakt.
När det gäller konvertering av dokument till DOC lyckades vi inte hitta någon perfekt lösning, men de absolut bästa resultaten kom från Online OCR. Konverteringen var inte perfekt, men formateringens integritet hölls till stor del intakt och misstag var försumbara. När vi jämför dessa resultat med "premium"-erbjudandet från ABBYY, kan du inte låta bli att bli imponerad massivt.
Vi inkluderade inte Google Drive: s OCR-funktioner i det här inlägget; lite för Googles allvarlighet, men mer för det faktum att vi ville testa några andra gratis OCR-tjänster där ute.
Till dig: Vilka andra online OCR-verktyg skulle du rekommendera våra läsare? Och vilket har du försökt att du aldrig skulle använda igen?
Rob Nightingale har en examen i filosofi från University of York, Storbritannien. Han har arbetat som social media manager och konsult i över fem år, samtidigt som han har jobbat i flera länder. Under de senaste två åren har Rob också varit teknikförfattare och är MakeUseOfs sociala mediehanterare och nyhetsbrevredaktör. Du hittar vanligtvis honom reser...