Det finns några viktiga skillnader mellan den äldre GPT-3.5-modellen och den glänsande nya GPT-4-modellen.

Efter alla spekulationer och påståenden om förmågan hos GPT-4, lanserades den efterlängtade fjärde versionen av GPT-familjen av språkmodeller den 14 mars 2023.

GPT-4 kom inte med några av de mycket omtalade funktionerna som det ryktades ha. Den senaste modellen förbättras dock avsevärt jämfört med GPT-3.5 och dess föregångare. Men hur skiljer sig GPT-4 från GPT-3.5? Vi tar dig igenom några viktiga skillnader mellan GPT-4 och GPT-3.5.

1. GPT-4 vs. GPT-3.5: Kreativitet

En av de mest uttalade fördelarna med GPT-4-modellen jämfört med GPT-3.5 är dess förmåga att ge mer kreativa svar på uppmaningar. Missförstå mig inte; GPT-3.5 är väldigt kreativ. Det finns en lång lista på kreativa saker du kan göra med ChatGPT som använder modellen. Men det överträffar redan många stora språkmodeller när det gäller kreativitet.

GPT-4 höjer dock ribban ytterligare. Även om GPT-4s kreativa fördel kanske inte är uppenbar när man försöker lösa grundläggande problem, är skillnaden i kreativitet mellan båda modellerna blir uppenbar när uppgiften blir svårare och kräver en högre nivå av kreativitet.

instagram viewer

Om du till exempel ber båda modellerna att slutföra en kreativ uppgift som att skriva en dikt med både engelska och franska på varje rad i dikten, ChatGPT drivs av den senaste GPT-4-modellen kommer att ge bättre resultat. Medan GPT-4:s svar skulle använda båda språken på varje rad, skulle GPT-3.5 växla mellan båda språken istället, där varje rad använder ett språk och nästa använder det andra.

2. GPT-4 vs. GPT-3.5: Bild eller visuella ingångar

Medan GPT-3.5 bara kan acceptera textuppmaningar, är GPT-4 multimodal och kan acceptera både text och visuella input. För att vara tydlig, när vi säger visuella input, behöver bilden inte vara en bild av en maskinskriven prompt – den kan vara en bild av vad som helst. Så från en bild av ett handskrivet matematiskt problem till Reddit-memes kan GPT-4 förstå och beskriva nästan vilken bild som helst.

Till skillnad från GPT-3 är GPT-4 både ett språk och en visuell modell.

Under GPT-4-tillkännagivandet livestream matade en OpenAI-ingenjör modellen med en skärmdump av en Discord-server. GPT-4 skulle kunna beskriva varje detalj på den, inklusive namnen på användare online vid den tiden. En bild av en handritad mockup av en skämtwebbplats matades också till modellen med instruktioner till förvandla den till en webbplats, och otroligt nog gav GPT-4 en fungerande kod för en webbplats som matchade bild.

3. GPT-4 vs. GPT-3.5: Säkrare svar

Även om GPT-4 inte är perfekt, är de åtgärder som den vidtar för att säkerställa säkrare svar en välkommen uppgradering från GPT-3.5-modellen. Med GPT-3.5 tog OpenAI en mer måttfull inställning till säkerhet. Vissa av säkerhetsåtgärderna var med andra ord mer av en eftertanke. OpenAI övervakade vad användarna gjorde och frågorna de ställde, identifierade brister och försökte åtgärda dem på språng.

Med GPT-4 är de flesta säkerhetsåtgärder redan inbakade i systemet på modellnivå. För att förstå skillnaden är det som att bygga ett hus med robusta material från början kontra att använda allt som går och sedan försöka lappa saker när fel uppstår. Enligt OpenAI: s GPT-4 tekniska rapport [PDF], GPT-4 ger toxiska svar endast 0,73 % av gångerna jämfört med GPT-3.5:s 6,48 % av toxiska svar.

4. GPT-4 vs. GPT-3.5: Svarets fakta

En av GPT-3.5:s brister är dess tendens att producera meningslös och osanning med tillförsikt. På AI-språk kallas detta "AI-hallucination" och kan orsaka misstro mot AI-genererad information.

​​​​​​

I GPT-4 är hallucination fortfarande ett problem. Enligt den tekniska rapporten från GPT-4 har den nya modellen 19 till 29 % mindre sannolikhet att hallucinera jämfört med GPT-3.5-modellen. Men det här handlar inte bara om den tekniska rapporten. Svar från GPT-4-modellen på ChatGPT är märkbart mer sakliga.

5. GPT-4 vs. GPT-3.5: Kontextfönster

En mindre omtalad skillnad mellan GPT-4 och GPT-3.5 är kontextfönstret och kontextstorleken. Ett sammanhangsfönster är hur mycket data en modell kan behålla i sitt "minne" under en chattsession och hur länge. GPT-4 har en betydligt bättre kontextstorlek och fönster än sin föregångare.

Rent praktiskt betyder det att GPT-4 bättre kan komma ihåg konversationens sammanhang längre, samt instruktionerna som ges under samtalet.

Ett problem med GPT-3.5 är modellens benägenhet att gå utanför ämnet eller misslyckas med att följa instruktionerna när du utvecklas under en konversation. Du kan till exempel säga till modellen att tilltala dig med ditt namn, och det skulle göra det ett tag men sedan misslyckas med att följa instruktionerna på vägen. Även om detta problem fortfarande finns med GPT-4-modellen är det mindre problem på grund av ett bättre sammanhangsfönster.

Ett annat problem är begränsningen av volymen text som du kan använda i en prompt på en gång. Att sammanfatta lång text med GPT-3 innebär vanligtvis att dela upp texten i flera bitar och sammanfatta dem bit för bit. Förbättringen av kontextlängden i GPT-4-modellen innebär att du kan klistra in hela PDF-filer på en gång och få modellen att sammanfatta utan att dela upp den i bitar.

GPT-4: Ett steg upp från GPT-3.5

Utan tvekan är GPT-4 ett betydande steg upp från sina föregångare. Även om det fortfarande plågas av några av begränsningarna i GPT-3.5, betydande förbättringar på flera områden och tillägg av nya funktioner gör modellen till ett spännande nytt steg i jakten på ett verkligt intelligent AI-språk modeller.