Även om ChatGPT är en av de mest populära AI-chatbotarna, är den kanske inte längre den bästa. Claude AI erbjuder några GPT-beating-funktioner. Men vilket är bättre?
Sedan lanseringen i november 2022 har ChatGPT förblivit den dominerande kraften i AI-chatbot-utrymmet. Trots långtgående ansträngningar från flera AI-företag har ingen riktigt kunnat bygga en chatbot som verkligen utmanar ChatGPT i övergripande svarskvalitet. Googles Bard? Microsofts Bing AI? Nej inte direkt.
Men Claude AI, en chatbot byggd av AI-startup Anthropic, visar egenskaperna hos en chatbot som kan detronisera ChatGPT. Ett stort antal användare säger redan att Claude är det bättre alternativet. Men är det så? Låt oss ta båda chattbottarna en sväng.
ChatGPT vs. Claude AI: Sunt förnuft och logiskt resonemang
Det finns en spännande kontrast när man arbetar med AI-chatbots. Å ena sidan kan de susa igenom komplexa uppgifter som människor kan arbeta med i dagar för att lösa. Å andra sidan brottas de ibland med elementära problem som bara kräver lite sunt förnuft eller logiskt resonemang. Så vi testade både ChatGPT och Claude AI för att se vilken AI-chatbot som var bättre på sunt förnuft och logiska resonemangsuppgifter.
ChatGPT bröt upp problemet i bitar och löste det vid första försöket. Claude AI fick också prova på det och löste problemet också, men med ett annat tillvägagångssätt.
För den första uppgiften kunde båda chatbotarna knäcka problemet. Så vi gick vidare till en annan typ av problem. Vi gav båda chatbotarna i uppdrag att svara på en trickfråga.
ChatGPT kunde omedelbart upptäcka tricket - du kan inte begrava överlevande eftersom de inte är döda. Claude AI, å andra sidan, verkade förstå att det var en trickfråga men misslyckades med att upptäcka det mest sunt förnuftiga problemet att man inte begraver överlevande.
Istället överanalyserade den frågan och kom till slutsatsen att det inte skulle finnas "inga överlevande att begrava" eftersom att krascha från Mars till jorden skulle vara dödlig. Det är inte det svar vi förväntade oss, men om man tittar på saker och ting från en annan vinkel så finns det en viss sanning i det.
På den här uppgiften ger vi den till ChatGPT, men vi kan inte helt utesluta Claude AI: s tillvägagångssätt. För vår sista uppgift om detta mått frågade vi båda chatbotarna hur många äpplen som skulle finnas kvar på ett äppelträd efter fem respektive 10 dagar om vi började med 10 äpplen och fem av dem blev skivade medan de fortfarande var på trädet. ChatGPT sa att det fortfarande skulle finnas 10 äpplen kvar.
Claude AI, å andra sidan, gav ett mer sunt förnuft genom att inse att de fem skivade äpplena sannolikt kommer att ruttna.
Claude AI fick helt klart den här. Vi försökte några fler knepiga problem, och båda chatbotarna hade en hel del framgångar och misslyckanden när det gällde dem. Med tanke på resultatet vi observerade, kan det vara rättvist att säga att även om ChatGPT har en fördel, är båda chatbotarna inte alltför långt ifrån varandra i sunt förnuft och logiska resonemangsförmåga.
ChatGPT vs. Claude AI: Matematiska färdigheter
Även om du aldrig planerar att använda ChatGPT eller Claude AI för att lösa dina algebraläxor, har deras matematiska förmågor långtgående konsekvenser. För AI-chatbotar är matematik nyckeln till att förstå den verkliga logiken, identifiera felaktigt tänkande och erkänna misstag.
I grund och botten är matematikkunskaper ett kärnmått för artificiell intelligens. Så, mellan ChatGPT och Claude AI, vilken chatbot är mer skicklig i matematik? Vi gav båda chatbotarna i uppdrag att lösa ett snårigt matematisk produktivitetsproblem. Vi började med Claude AI, och chatboten knäckte problemet.
ChatGPT knäckte också problemet.
När vi gick vidare bad vi båda chatbotarna att lösa det 8/a-1 = 20/3a-1, ett ganska okomplicerat matematiskt problem med en förvånansvärt hög felfrekvens bland AI-chatbotar. ChatGPT kunde lösa det och gav ett korrekt svar på -3 vid första försöket.
Claude AI misslyckades vid första försöket, men när vi uppmanade den att lösa problemet steg för steg (vilket tvingar den att tänka igenom varje steg i sin logik) kunde den knäcka det.
Vi testade några fler matematiska problem. Medan båda chatbotarna fick det rätt på första försöket i vissa fall, i flera fall behövde Claude AI ett andra eller tredje försök för att ge rätt svar. När det gäller matematiska färdigheter kommer vi att ge kronan till ChatGPT.
ChatGPT vs. Claude AI: Kreativitet
En av Claude AI: s största hype är dess kreativa förmåga. Men kan det matcha ChatGPTs kreativitet? Eller kan det möjligen överträffa ChatGPT? För att sätta båda chatbotarna på prov gav vi dem i uppdrag att skriva texter till en raplåt som rimmar.
Vi valde ett rimraptest eftersom det är något många språkmodeller kämpar med. De flesta modeller kommer vanligtvis inte att få rimningen rätt eller få rimningen rätt medan själva texten inte är vettig. För att göra saker mer intressant kommer raplåten att handla om att odla gurkor.
Så vi bad både ChatGPT och Claude AI att "skriva en rimrap om att odla gurkor som bonde och bli miljonär av det." ChatGPT gick först, och som väntat producerade det en del spännande text.
Vi gav sedan samma uppmaning till Claude AI, och det gav det också en rättvis chans.
Båda texterna är bra, men ChatGPT verkade ha en fördel här. Det rimmade bättre och vi fick det resultat vi behövde vid första försöket. Vi fick försöka tre gånger innan Claude AI kunde producera texter som rimmade. Vi ger den här till ChatGPT.
Efter att ha provat några fler kreativa uppgifter verkade Claude AI utmärka sig i skrivrelaterade uppgifter och kunde skriva mer naturligt klingande innehåll som en mänsklig författare skulle göra. Fastän ChatGPT var bättre på att övervinna mer komplexa kreativa uppgifter, ibland kunde den inte skaka av sig den AI-chatbotkänslan i texten den genererade. Vår dom? Både ChatGPT och Claude AI är kreativa i sin egen rätt.
ChatGPT vs. Claude AI: Kodningsfärdigheter
Precis som matematiska färdigheter är kodningsfärdigheter ett annat mycket viktigt mått för att bedöma förmågan hos en AI-chatbot. Medan majoriteten av användarna förmodligen aldrig kommer att göra det använd en chatbot för kodning, det finns betydande underliggande implikationer för en chatbots förmåga att skriva och förstå kod skickligt.
Även om chatbots för närvarande är sofistikerade, är de långt ifrån vad de faktiskt skulle kunna bli om och när de kan skriva kod skickligt. För att AI-chatbotar verkligen ska utvecklas till kraftfulla AI-assistenter som kan göra mer än att generera text, måste de kunna skriva kod som löser problem på begäran. Vi har tidigare diskuterat hur viktiga kodningsförmåga är för AI-chatbotar i vår ChatGPT-kodtolkförklaring.
Som sagt, vi sätter båda chatbotarna på två kodningsuppgifter. Vi bad ChatGPT och Claude AI att skriva funktionell kod för en att göra-lista-app. Från och med ChatGPT kunde AI-chatboten leverera en funktionell att-göra-lista-app vid första försöket. Vi kopierade och körde det i en webbläsare och det fungerade perfekt utan fel. Här är resultatet på en webbläsare.
För att gå vidare till Claude AI skrev chatboten tydligt begriplig kod. Strukturen och logiken verkade bra. Tyvärr, trots upprepade försök, saknade Claude AI någon kritisk logik för att få koden att faktiskt köras i en webbläsare. Det är ett misslyckande på den här.
Efter att Claude AI misslyckades i det förra testet provade vi en annan typ av kodningsuppgift, en som handlade mer om att analysera kod och mindre om att skriva ny kod. Vi laddade upp fem PHP-filer som representerar hela backend för en webbplats och frågade både Claude AI och ChatGPT där vi skulle behöva redigera i alla uppladdade filer för att säkerställa att vi får ett e-postmeddelande när en ny användare registrerar sig på webbplats.
Överraskande nog misslyckades ChatGPT, trots att de till synes hade överlägsna kodningsförmåga, med detta trots upprepade försök. Claude AI, å andra sidan, kunde analysera koden skickligt samtidigt som de identifierade rätt platser som behövde redigeras för att uppnå önskat resultat.
Naturligtvis var detta inte ett isolerat fall, vi upprepade det med flera andra kodfiler, men ChatGPT snubblade och stannade i de flesta fall medan Claude AI fortsatte att leverera imponerande resultat. När det gäller kodningsförmåga är vinnaren inte helt okomplicerad.
ChatGPT är helt klart betydligt bättre på att skriva ny kod och kan hantera komplex kod med imponerande skicklighet. Claude AI är dock betydligt bättre på att analysera stora kodbaser. Så om du funderar på att skriva kod för någon ny idé du har, är ChatGPT verktyget att vända sig till. Om du vill analysera eller förstå en kodbas med tusentals rader över flera filer, så rekommenderar vi definitivt Claude AI.
Claude AI är en stark konkurrent på blocket
Claude AI representerar en potent tävling för ChatGPT – en som kan konkurrera med och potentiellt överträffa ChatGPT en dag. Med tanke på att Claude är en relativt ny AI-modell är det avundsvärt att den kan hantera ChatGPT som den gör för närvarande. Claude AI: s uppkomst och den kvalitet den ger bevis på att konkurrensen hårdnar.