Annons
ì´ ì›¹ì‚¬ì´íŠ¸ì— 환ì˜. ì´ê²ƒì€ 보기 ì›ë³¸ì´ë‹¤
Vad för språk är detta? kinesiska? Japanska?
Det är faktiskt koreanskt. Att upptäcka detta manuellt skulle ha tagit mig mycket tid. Lyckligtvis hittade jag några mycket exakta verktyg som kan göra detta automatiskt. De är alla listade nedan.
Experimentet: Jag testade webbplatserna med exempeltext (1-2 meningar med 8 ord) från följande språk: portugisiska, ryska, koreanska, vietnamesiska, italienska, turkiska, polska, ukrainska, azerbajdzjanska, slovenska, makedonska, holländska, filippinska (tagalog), grekiska, galiciska, tjeckiska, vitryska, finska, tatariska och norska.
Totalt sett testade jag 20 olika språk.
3 verktyg för att upptäcka okänt språktext
1. LangId (godkände 18 av 20 tester, klarade inte tatariska och vitryska)

Fördelar: Sammantaget ett bra onlineverktyg. Det erbjuder grundläggande textdetekteringsfunktioner och de har också Twitter och e-postdetekteringsbotar för ännu snabbare resultat.
Nackdelar: Deras motor är baserad på Google API men de verkar ha bättre resultat än Google-detektorn som beskrivs nedan. Det verkar som om de vet hur man använder saker väldigt bra. Jag gillade inte att de inte har sin egen unika algoritm för att upptäcka språk.
2. Googles språkdetektor [inte längre tillgänglig] (godkänt 17 av 20 tester, klarade inte portugisiska, taglog och vitryska)

Fördelar: Google har ett av världens bästa API för språkdetektering. Det som är bra är att du kan se sannolikheten för att resultatet de visar är sant. De klarade de flesta proven.
Nackdelar: Jag blev ganska förvånad över att de inte klarade det portugisiska testet. Det verkar som om de har en (hoppas tillfälligt) bugg med detta språk. De kan också säkert göra ett bättre jobb med att göra siddesignen bättre.
3. Vad för språk är detta (godkände 11 av 20 tester, klarade inte ryska, koreanska, ukrainska, azerbajdzjanska, makedonska, tagalog, grekiska, galiciska och tatariska)

Fördelar: Vissa språk som de sydslaviska (serbiska, kroatiska, slovenska) är ganska lika. Om du anger någon kroatisk text, låt oss säga, den här webbplatsen kommer att berätta för dig att texten också kan vara serbisk eller slovensk.
Nackdelar: De måste arbeta med att göra sitt detektionssystem mer sofistikerat. Jag tänkte sätta Translated.net (en annan webbplats för språkdetektering) istället för den här, men Translated lovade upptäckt av fler språk och gjorde faktiskt sämre än WhatLanguageIsThis.com.
2 verktyg för att upptäcka webbplatser på okända språk
4. Google översätt med Upptäck språk som det första alternativet
Passerade: 18 av 20, klarade inte vitryska och tatariska.
Fördelar: Detta verktyg gör sitt jobb mycket bra. Det jag gillar med Google översätt Google Translate 2.1 dyker upp med inbyggt iOS 7-tangentbord och mer språkstödUppdatera till Google Translate 2.1 på din iOS-enhet och bär med dig stöd för översättning och handskriftsinmatning för nya språk. Google Translate får äntligen ett nytt iOS 7-tangentbord för att göra allt... Läs mer är att om det inte stöder ett specifikt språk visas följande skärm:

Det är en bra språkdetektor om du frågar mig!
5. Microsoft Bing Translator med Automatisk upptäckt som det första alternativet.

Passerade: 8 av 20, klarade inte holländska, vietnamesiska, turkiska, ukrainska, azerbajdzjanska, slovenska, makedonska, tagalog, grekiska, galiciska, tjeckiska och vitryska
Fördelar: Den stöder ett begränsat antal språk. För de språken gör den sitt jobb bra.
Nackdelar: Jag är mycket besviken på Microsoft. De har ett mycket begränsat antal språk för upptäckt& översättning Glöm Google Translate: 3 sätt att få en korrekt, snabb översättningOavsett om du planerar att söka jobb eller en lägenhet utomlands, eller funderar på att översätta din webbsida, måste du få saker rätt även med ett främmande språk. Läs mer och deras Auto-Detect-funktion är fruktansvärd. Om du anger ett språk som de inte stöder får du ett felaktigt resultat istället för att tala om för dig att de inte stöder det språket.
Tankar
Sammantaget är min åsikt att ovanstående verktyg är på väg i en bra riktning. De är för närvarande de bästa för att upptäcka språk online och gör sitt jobb ganska bra när det kommer till populära språk. De måste dock arbeta med att lägga till mer obskyra språk (inga av verktygen kunde känna igen tatariska) och jag är säker på att alla, särskilt Google, kommer att gå i den riktningen inom en snar framtid.
Bildkredit: Kanko*
Jag heter Darko (smeknamn Darren.) Jag gillar Web 2.0, att skapa nischade webbplatser (mitt senaste projekt är folksökning) och så vidare...vad kan jag säga mer om mig i en så kort profil, följ min på Twitter om du vill veta mer :)