Annons

Alla de tre stora telefonplattformarna har nu sin egen röst. Apple har Siri, Microsoft har Cortana och Google har något mindre snygg Google Now 6 Google Now-funktioner som kommer att förändra hur du söker Du kanske redan använder Google Nu på din Android-enhet, men får du allt du kan ut ur det? Att känna till dessa små funktioner kan göra en stor skillnad. Läs mer .

Dessa system låter dig hantera grundläggande uppgifter genom röststyrning. Var och en är en sorts virtuell sekreterare som kan svara på enkla frågor, öppna appar, göra anteckningar och vidarebefordra meddelanden. De är användbara, men de är också frustrerande begränsade. De kan inte göra någonting som de inte uttryckligen har programmerat för, och många uppgifter ligger helt enkelt utanför deras förmåga.

Det finns dock ett antal tekniker som utvecklas som kommer att dramatiskt förbättra dessa system - och de kommer att vara kommersiellt tillgängliga på bara några år. Här är de fem bästa sätten att din telefon ska bli mycket smartare på.

instagram viewer

Det kommer att se vad du ser

Taligenkänning har gjort stora framsteg under de senaste fem åren, tack vare utvecklingen av kraftfulla neurala nätverk. Moderna smartphones kan identifiera tal med överraskande noggrannhet (det har gått ett tag sedan Google Nu har missförstått mig), och kan till och med göra saker som att identifiera låtar och TV-program baserat på deras audio.

Det här är bra - men det är bara början. Människor interagerar inte med världen främst genom ljud. Vi använder vision för praktiskt taget allt - och snart kommer våra maskiner också. Vi börjar se debuten från de första bärbara headsetskärmarna som Google Glass och Microsofts HoloLens Microsoft visar nya HoloLens-demonstrationer vid Build-konferensenMicrosofts kommande HoloLens-headset är den första high-end augmented reality-enheten som har visats för allmänheten. Är det fortfarande en fantasiv gizmo eller en teknik som är nära att förverkliga? Läs mer , som kan strömma information från sina kameror till din smartphone, vilket ger ett rikt och alltid tillgängligt utbud av visuell information. Många observatörer, inklusive mig själv, förväntar sig att dessa ska bli vanliga under de kommande fem åren eller så.

Så vad kan din telefon göra med all denna information?

Massor. Google har redan demonstrerat med sin tangotablett Google vill sätta en 3D-kamera på din smartphone - varförGoogles Project Tango tar med sig 3d-sensorer till mobila enheter. Här är vad vi vet hittills. Läs mer att en djupkamera kan bestämma den rumsliga platsen för fysiska föremål med extremt hög noggrannhet. På samma sätt har det gjorts några fantastiska framsteg inom maskinsyn - som Microsofts neurala nätverk som kan identifiera enskilda hundraseroch Googles nervnätverk som kan beskriv exakt innehållet på fotografierna. Tillsammans öppnar dessa tekniker en hel värld av applikationer:

Vad är den här bulten? Maskinvisionsalgoritmen vet och kan beställa en ersättning på Amazon på fem sekunder. Vad hette kvinnan som du träffade i baren igår kväll? Du kanske har tappat hennes kort, men dina glasögon tog hennes ansikte och kan hitta henne på Facebook. Du har en konstig mullvad. Ska du träffa din läkare? Din telefon kan ta en titt och meddela dig. Du handlar med livsmedel: vad behöver du? Dina glasögon kommer ihåg förra gången du tittade i kylen och vet vad som saknas. De kan till och med ge dig väg-för-gången vägbeskrivning för att hitta de enskilda artiklarna.

Sekretessimplikationerna av denna teknik är skrämmande, men den här typen av saker låter också oerhört användbart.

Det kommer att veta vad du gillar

Smak kan vara svårt att klämma fast. Det är väldigt personligt och kan vara väldigt godtyckligt. Spotify och Netflix klarar av att göra rekommendationer baserade på användningsmönster (en teknik som helt ignorerar innehåll) - men det finns verkliga gränser för denna strategi.

Framtiden ligger i algoritmer som kan förstå konst på en djup nivå - komplexa neurala nätverk som kan lära sig att välja komplexa finesser av musik och filmer. Det ger en mycket rikare förståelse för vad folk gör och inte gillar med en bit media - ett konkret grepp om deras smak.

De första tidiga antydningarna av detta börjar dyka upp. Gilla Spotifys "Upptäck varje vecka”Spellista, som använder dessa typer av innehållsanalysverktyg för att rekommendera låtar - inklusive låtar som du kanske inte normalt hör, eftersom de är för dolda för att ranka bra baserat på användningsmönster. Dessa tekniker kommer bara att bli kraftfullare i framtiden, och smarttelefonen är en utmärkt plattform för att utnyttja denna information.

Letar du efter något att göra med vänner? Vad händer om appar på dina telefoner kan samarbeta, samla information om dina respektive smaker och välja en film eller konsert som de tror att du alla gillar? Vad sägs om dejtingsidor som rankar dig baserat på djupa funktioner i din respektive smak? Vad sägs om appar som kan rekommendera böcker för att de har läst dem?

Möjligheterna är oändliga, och någon kommer att tjäna mycket pengar med dessa.

Det kommer att vara chattigt

Mänsklig: var är du nu?
Maskin: jag är mitt i ingenstans.
Mänsklig: vad är syftet med att dö?
Maskin: att ha ett liv.
Mänsklig: vad är syftet med att vara intelligent?
Maskin: att ta reda på vad det är.
Mänsklig: vad är syftet med känslor?
Maskin: jag vet inte.

Detta är en konversation med ett neuralt nätverk utvecklats av Google, som lär sig från stora databaser med text utan mänsklig övervakning. Denna version av den tränades på ett antal gamla filmmanus och tränades för att förutsäga nästa mening i varje konversation den mötte. Som det visar sig, om du tränar en AI på filmmanus, är alla dess konversationer superdramatisk.

Om du inte är imponerad är det förståeligt. Chatbots har funnits länge Hur man skapar en chattbot för din webbplats eller ditt företagSvårigheten med att ansluta med så många människor över hela världen är tidszoner. Du kanske vill vara tillgänglig för att interagera med ditt läsarantal eller för att göra affärer med potentiella kunder, men ibland ... Läs mer .

Men titta närmare. Googles system är speciellt på två viktiga sätt.

För det första är det väldigt enkelt när det gäller arkitektur: det är ett enda enormt neuralt nätverk, och det var tvunget att lära sig dynamiken i mänskligt språk av sig själv. Vanliga chatbots fungerar genom att använda tusentals handkodade regler för hur man svarar på olika situationer. När de reciterar ett svar beror det på att det var handkodat eller memorerat från ett specifikt exempel. Googles nätverk är annorlunda. Den lärde sig sitt beteende organiskt genom att försöka förstå den djupa strukturen i mänsklig skrift.

För det andra fångar det en överraskande subtil dynamik som andra chattbots inte gör. Det kan svara på sunt förnuftfrågor om världen, trots att det inte är uttryckligen programmerat för att göra det.

Mänsklig: vem är skywalker?
Maskin: han är en hjälte.
Mänsklig: vem är bill Clinton?
Maskin: han är en miljardär.
Mänsklig: är himmelblått eller svart?
Maskin: blå.
Mänsklig: har en katt en svans?
Maskin: ja.
Mänsklig: har en katt en vinge?
Maskin: Nej
Mänsklig: kan en katt flyga?
Maskin: Nej .
Mänsklig: hur många ben har en katt?
Maskin: fyra, tror jag.

En annan version av chattbotten, tränad på loggar med teknisk support, kan smutsa genom att ge verkligt tekniskt stöd förvånansvärt bra. Det finns snubblar (det verkar ha svårt att komma ihåg vilket operativsystem du använder) - men jag har säkert fått sämre teknisk support från faktiska människor.

Allt detta är en bra indikation på att vi börjar komma till den punkt där konstgjord intelligens verkligen kan vara samtalande. Nätverket ovan kan föra en acceptabel konversation, även om dess träningsmål bara kräver att den följer den ytliga strukturen i en fram och tillbaka dialog.

Med bättre träningsdata och en belöningsfunktion som betonar informationsutbyte är möjligheterna obegränsade. Föreställ dig en version av Siri som kan engagera dig i en riktig konversation, ge svar och råd som svar på frågor och utföra uppgifter utan att behöva programmeras specifikt för att göra det. Det är inte långt borta.

Det kommer att läsas väl

En annan teknik som Google har arbetat med har att göra med läsförståelse. Det heter "Tänkte vektorer, ”Och konceptet är förvånansvärt enkelt. Du kan extrahera "tankvektorer" från aktiviteten i ett neuralt nätverk som har en information, som en mening eller en artikel. Vad du får är en ogenomskinlig information som inte betyder något för någon utom nätverket som genererade den. Denna information lagrar i någon mening textens ”betydelse”, separat från hur den ursprungligen formulerades.

Detta har några användbara egenskaper. Till att börja med liknar dessa vektorer varandra för meningar med liknande betydelser. Om du smälter två meningar på detta sätt kan du avgöra om de betyder samma sak eller inte. Du kan också manipulera dem. Genom att använda två nervnätverk för att generera ”tankvektorer” från text på olika språk och sedan utbilda ett tredje nätverk för att lära sig att kartlägga mellan dem kan du skapa en extremt kraftfull maskinöversättningsmetod som fångar in betydelsen av texten och inte bara orden i Det.

En annan potentiell tillämpning av detta är att använda den här tekniken för att samla in stora mängder information och smälta den till en kompakt representation och sedan generera en sammanfattning baserad på utgången. Detta kan vara oerhört kraftfullt för mobilapplikationer.

Föreställ dig att du kan be din telefon att läsa allt tillgängligt på Google om ett visst ämne. Kom sedan tillbaka till dig och rapportera dess resultat kortfattat, på naturligt språk, och svara på frågor om resultaten. Detta kommer att bli verklighet verkligen, verkligen snart, och det kommer att vara oerhört användbart.

Framtidens telefon

Telefoner i framtiden kommer förmodligen att se mycket annorlunda ut än telefoner idag. De kan vara böjda. De kan vara modulära. Du kan interagera med dem med hjälp av augmented reality-glasögon. Den viktigaste skillnaden kommer emellertid att vara intelligens. Funktionerna som beskrivs här kommer att förvandla våra enheter till kraftfulla lärare och hjälpare.

Det finns för närvarande ett uppvärmt armarace Microsoft vs Google - Vem leder det artificiella intelligensloppet?Artificiella intelligensforskare gör konkreta framsteg, och människor börjar prata allvarligt om AI igen. De två titanerna som leder den artificiella intelligensen är Google och Microsoft. Läs mer i djup inlärningsteknologi. Biverkningen är att dessa tekniker utvecklas otroligt snabbt och att de kommer att finnas på marknaden förr än du kanske tror.

Är du upphetsad av smartare smartphones? Bekymrad över integritetskonsekvenserna? Låt oss veta i kommentarerna!

Bildkrediter:Mänsklig hjärna av Mopic via Shutterstock

En författare och journalist baserad på sydväst, garanteras Andre att vara funktionell upp till 50 grader Celcius och är vattentät till ett djup av tolv meter.