ChatGPT, Bing AI och Google Bard är några av de mest kända namnen i världen av konstgjord konsumentintelligens. Alla tre produkterna har en sak gemensamt – de är alla generativa AI-produkter.
Men vad exakt är generativ AI, och vad har väckt den senaste fascinationen för detta återuppväckta AI-utrymme?
Vad är Generativ AI?
Generativ AI, förkortning för "generativ artificiell intelligens", är en typ av AI-system som kan generera unikt eller originellt innehåll som text, ljud, videor eller bilder på begäran. Till skillnad från vissa traditionella AI-system designade för uppgifter som dataklassificering eller analys, generativ AI modeller är mer intresserade av att producera nya eller kreativa resultat baserat på de instruktioner de är given.
Även om generativ AI kan verka som en ny teknik, har den faktiskt funnits i årtionden. Flera iterationer och former har funnits åtminstone så tidigt som på 1960-talet. Artificiell intelligens är ett stort område, och generativ AI är bara en underavdelning.
En av de mest fascinerande aspekterna av att använda en generativa AI-verktyg som ChatGPT eller Googles Bard AI är förmågan hos dessa verktyg att generera innehåll som matchar din begäran. Du ber ChatGPT att skriva en dikt i stil med William Shakespeare, och du får något slående likt Shakespeares verk. Du ber den att skapa ett tal i stil med Donald Trump, och du skulle få något som imponerande efterliknar tonen hos den tidigare amerikanska presidenten. Så, hur är detta möjligt? Hur kan generativ AI åstadkomma en så fascinerande bedrift?
Hur generativ AI fungerar
Arbetsmekanismen för en generativ AI-modell involverar ett komplext samspel mellan olika djupinlärningstekniker och algoritmer. De exakta detaljerna om hur en generativ modell fungerar beror på dess mål och den underliggande arkitekturen. Till exempel kommer en generativ modell för att generera ljudavsnitt ha en annan arbetsmekanism än en som är avsedd för att generera videor eller text.
Men i sin kärna fungerar de flesta, om inte alla, generativa modeller på liknande sätt på grundnivå. De lär sig av en stor mängd data, fångar in mönster och stilar av datan, och använder sedan dessa fångade mönster för att reproducera prov som liknar det de har lärt sig i sin träningsdata.
Du kan tänka på generativa AI-verktyg som musikkompositör. Föreställ dig att denna musikkompositör har lyssnat på otaliga låtar och studerat harmonier, melodier, rytmer och strukturer i ett antal musikgenrer. Denna kompositör har med andra ord en omfattande kunskap om musikgenrerna. Med denna kunskap kan kompositören skapa original eller unik musik inspirerad av vad de har lärt sig.
Så om de har lärt sig mycket om popmusik kan du be dem att komponera en poplåt, och de kommer inte ha några problem att göra det. Den komponerade musiken skulle då vara ett uttryck för kompositörens förståelse för hur popmusik ska se ut utifrån vad de har lärt sig. På samma sätt är produkten av generativ AI ett uttryck för AI-modellens förståelse av de underliggande koncepten som lärts av dess träningsdata.
Så om du vill skapa en generativ AI-modell som genererar bilder av bilar, måste du mata modellen med en enorm datauppsättning av bilbilder. För att skapa en imponerande modell måste du mata den med bilder på så många bilmärken och modeller du kan tänka dig. Med tillräckligt med träning kommer algoritmen att lära sig hur varje bilmärke eller modell ser ut, och vi kommer att kunna skapa bilder av nästan vilken bil du kan tänka dig på begäran.
Populära generativa AI-modeller
Det finns hundratals generativa AI-modeller för närvarande under utveckling eller som redan distribueras på konsumentmarknaden för AI. Några av de populäraste du bör känna till inkluderar:
1. Generativ förtränad transformator (GPT)
GPT, utvecklat av OpenAI, är bland de mest kända namnen i det generativa AI-utrymmet. Dess popularitet beror på dess effektivitet som en konversations-AI-modell och den virala framgången för ChatGPT-chatboten, som använder GPT som sin underliggande teknologi. Det är en stor språkmodell utformad för att generera människoliknande text när du uppmanas. Typiskt för alla generativa AI-modeller, alla iterationer av GPT-modellen har utbildats på en enorm mängd olika textdata.
2. Pathways Language Model (PaLM)
PaLM, en experimentell storspråksmodell av Google, är en kraftfull generativ AI-modell som kan utföra ett stort intervall av uppgifter som kreativt skrivande, kodgenerering, språköversättning och ett antal andra textbaserade naturliga språk uppgifter. Precis som GPT utbildades PaLM på en stor korpus av textdata som hämtats från ett brett spektrum av källor över hela webben. Det är AI-modellen som driver Googles Bard AI.
3. Musikspråkmodell (MusicLM)
MusicLM är en annan generativ AI-modell från Google. Den är utformad för att generera "high-fidelity"-musik från enkla textmeddelanden. Utbildad på tusentals timmar av musik över olika genrer, kan den generativa modellen skapa unik musik genom att använda enkla beskrivningar av musiken du behöver som input. Om du undrar hur bra det är, här är vår recension av MusicLM-modellen.
4. DALL-E
DALL-E är OpenAI: s AI-bildgenereringsmodell designad för att skapa flera stilar av unika bilder från textmeddelanden. Det är en multimodal implementering av GPT-modellen, tränad på många text-bildpar från olika källor över internet.
Utöver generativa AI-modeller hittar du också generativa AI-produkter som Midjourney, DALL-E bildgenerator, Stable Diffusion bildgenerator, Hugging Chat och flera andra imponerande AI-produkter som drivs av generativ AI modeller.
Varför har generativ AI exploderat i popularitet?
Den 30 november 2022 tillkännagav OpenAI CEO Sam Altman lanseringen av ChatGPT i en tweet. Trots att han var OpenAI: s VD var Altman relativt okänd i det större internetsamhället, och hans tweet kom med lite eller ingen fanfar.
Fem dagar senare hade ChatGPT samlat sina första en miljon användare; det gjorde det i en takt som inte hörts av någon app. Det samlade flera miljoner till så småningom gör ChatGPT till den snabbast växande appen genom tiderna. Även om ChatGPT inte är den första generativa AI-produkten, förde dess ankomst till AI-produktscenen generativ AI till allmänhetens medvetande mer än någon annan teknisk produkt före den.
Även om ChatGPT har varit spjutspetsen för att driva fram hypen kring generativ AI, gjorde det det inte ensamt. 2022 kommer att bli ihågkommen som året som generativa AI-verktyg blev mainstream. Från konversationsbaserade AI-chatbotar till kod- och konstgeneratorer, andra halvan av 2022 var första gången flera AI-verktyg som hade både masstilltal och praktisk daglig användning hade kommit ut på marknaden. Med dessa verktyg kom populariteten för dess underliggande teknologi – generativ AI.
Generativa AI-verktyg som Bing AI, Googles Bard, DALL-E, ChatGPT och Midjourney har sömlöst vävt in sig i vårt dagliga liv och ständigt presenterar oss deras anmärkningsvärda skapelser. Oavsett om det är de fängslande skrivningarna skapade av ChatGPT eller de förvånansvärt verklighetstrogna bilderna trollad av Midjourney har generativ AI blivit en ständigt närvarande följeslagare som följer oss dag in och dag ut. Detta är uppkomsten av den senaste populariteten för generativ AI.
Omfamna generativ AI
Populariteten för generativa AI-verktyg är inte en modefluga. Till skillnad från några nyare tekniska trender som blev populära och försvunnit med tiden, är generativ AI en teknik som har faktiska praktiska fördelar. Eftersom denna återuppväckta tekniknisch myser in i nästan alla aspekter av vårt digitala liv, är det bäst att söka efter sätt att utnyttja tekniken på bästa sätt i stället för att bli förbryllad över den.