Att transkribera ljud kan vara jobbigt. Oavsett om du behöver bildtexter för en video eller vill ha en tryckt version av en ljudinspelning kan det vara en börda att göra. Bra att det finns en tjänst som gör jobbet åt dig: Rev. Men hur exakta är dess transkriptioner? Låt oss ta reda på.
Vad är Rev?
Varv är en webbtjänst som skapar texttranskriptioner och översättningar av ljudfiler. Dessa kan göras via maskingenerering eller av ett team av liveproffs. Men för idag ska vi bara titta på transkriptionstjänsten.
Att skapa ett konto är gratis, men du kommer att faktureras baserat på längden på dina ljudfiler och den metod du väljer för dina transkriptioner. Automatiserade transkriptioner kostar $0,25 per minut, medan mänskliga transkriptioner kostar $1,50 per minut. Om du tycker att detta är en bra sidospelning kan du också kolla in vår guide på hur du kan bli transkriptionist.
Det är möjligt att "uppgradera" från automatiserad transkription till mänsklig transkription även efter att du har lagt beställningen.
Prismodellen är särskilt vänlig för personer som inte använder tjänsten hela tiden eftersom du inte betalar för ett månadsabonnemang om du bara behöver en tillfällig transkription. Om du behöver transkriptioner regelbundet, inkluderar ett månatligt prenumerationsalternativ gratis transkriptioner från ett länkat Zoom-konto.
Hur fungerar Rev?
Det finns två sätt att använda Rev: lämna webbsidan öppen och spela in ljudet direkt via webbplatsen eller ladda upp ljudfiler från en annan app. Om ljudet är tillgängligt online kan du också ange en länk.
När Rev har din ljudfil visas den som en "beställning" på ditt konto som innehåller en statusrad. Du kan titta på sidan för att se när transkriptionen är klar, men Rev kommer också att maila adressen som är kopplad till ditt konto för att meddela dig när arbetet är klart.
Transkriptionstiden varierar beroende på dokumentets längd, om du valde automatisk eller mänsklig transkription, och om du valde alternativet Rush My Order. Automatiserad transkription tar vanligtvis mindre än en timme, men mänsklig transkription kan ta så lång tid som sex dagar.
När transkriptionen är klar kan du se det skrivna verket direkt i din webbläsare eller ladda ner det som ett Word-dokument, en PDF eller ett vanligt textdokument. Transkriptionen innehåller redan högtalarnamn, men du måste välja alternativet Tidsstämpling, en extra $0,30 per minut, för att få tidsstämplar på varje högtalare.
Hur bra fungerar Rev?
Två huvudfaktorer avgör hur exakt Rev transkriberar dina ljudfiler. Den första är vilken transkriptionsmetod du väljer. Rev kommer att automatiserade transkriptioner inte är lika tillförlitliga som mänskliga transkriptioner. Den andra faktorn är miljön där ditt ljud togs.
Så om du vill ha det mest exakta resultatet, är inspelning i en studio eller en lugn plats bäst. Du kan också kolla in dessa Gör-det-själv-hack för att förbättra din hemmastudio om du redan har en.
För den här artikeln transkriberade vi två inspelningar med Rev. Båda samtalen spelades in på samma enhet och hade även handskrivna anteckningar. Den första inspelningen inkluderade flera högtalare, med inspelaren placerad cirka fem fot från den närmaste högtalaren men flera fot från den längsta högtalaren. Det här var inspelningen av lägre kvalitet, och vi använde mänsklig transkription för den.
Den andra inspelningen gjordes i en liten, sluten miljö med endast tre högtalare. För den här ljudfilen använde vi automatisk transkription för att få snabbare resultat.
Transkriptionsresultat från inspelning av en
Ljudinspelningen med flera högtalare från ett större avstånd hade bra transkription för vissa högtalare och sämre resultat för andra. Detta kan bero på att den mänskliga transkriberaren har större svårigheter att förstå vissa talare än andra eller kan ha berott på de olika avstånden från mikrofonen.
Ett mer konsekvent problem vi märkte var dock att raderna i transkriptionen som säger vilken talare som talade helt missade målet. Men eftersom vi har tidsstämplar hade vi inte svårt att rekonstruera en fullständig och korrekt avskrift mellan Rev-avskriften och de levande anteckningarna.
Automatiska transkriptionsresultat för inspelning av två
Ljudinspelningen med endast tre högtalare i ett slutet rum hade utmärkt transkription. Det största felet var att saker som varumärken och specifik terminologi uppenbarligen bara gissades av det automatiserade transkriptionsprogrammet. Förmodligen är det dessa punkter där en mänsklig transkription skulle ha gjort mycket bättre.
Den här transkriptionen var också mycket bättre när det gäller att tillskriva innehåll till rätt högtalare, även om den inte var perfekt. Den ena misstaget var när en textrad tillskrevs en "Speaker 4". Högtalare 4 finns inte; istället var det också högtalare 1, som maskinen misstog för en annan person. Det här var inte Rev som transkriberar ett elektroniskt röstfenomen.
Är Rev värt det?
Även om den första inspelningens transkription inte var så exakt som vi skulle ha velat, var det fortfarande mycket bättre än att göra det själva. Det tog förmodligen också den mänskliga transkriptionsmannen som Rev tilldelade vår inspelning mycket arbete för att transkribera den, med tanke på ljudkvaliteten.
När det gäller den andra inspelningen av bättre kvalitet var maskintranskriptionen korrekt, med undantag för märkesnamnen och jargongen som den missade. Förutom de mindre redigeringarna skulle filen som Rev genererade redan ha varit publicerbar.
Rev It Up
Rätt ljudinspelning, med korrekt Rev-inställning, kan innebära en nästan omedelbart publicerbar transkription av ditt ljud. Och även om du har en inspelning av dålig kvalitet är Revs tjänst ett utmärkt sätt att hjälpa dig skapa korrekta skrivna anteckningar. Så om transkribering av ljud- eller videofiler är något du fruktar, var inte rädd för att utforska den här tjänsten.