Många av oss har hört namnet DALL-E sväva runt, men du kanske inte är säker på vad det är. Kort sagt, det är en generativ AI-modell som kan skapa bilder som aldrig funnits tidigare, allt du behöver göra är att berätta för den vad du vill skapa.
När uppföljningsversionen, kallad DALL-E 2, släpptes blev den verkligen berömmelse. Bilderna som den kunde producera var av så hög kvalitet och så välgenererade att man knappt kunde se att en maskin gjorde det.
Här är vad du behöver veta om DALL-E och hur det fungerar.
Vad är DALL-E?
DALL-E är en generativ AI-modell utvecklad av Open AI som kan generera bilder och konst från en textprompt. Med andra ord kan du skriva en mening som beskriver exakt vad du vill se och DALL-E kan skapa den bilden åt dig på några sekunder.
DALL-E släpptes först i januari 2021 och har sedan dess uppgraderats avsevärt i sin andra version kallad DALL-E 2. Det var en av några olika AI-konstgeneratorer som blev enormt populär för sin förmåga att skapa vackra bilder och konst från grunden.
Eftersom du bara behöver skriva några få beskrivande ord för att skapa en bild, har det lockat många icke-konstnärer som tycker att verktyget är otroligt roligt och lätt att använda.
Bilderna som DALL-E producerar är så övertygande att de lätt kan misstas för konst gjord av en människa. Förutom att ha förmågan att avbilda föremål och landskap från världen omkring oss, kan den återge dessa bilder i en specifik stil, som digital konst, akvarell eller impressionism.
DALL-E har fått sitt namn från konstnären Salvador Dalí och en robot som heter WALL-E från en animerad Pixar-film. DALL-E: s namn ger oss verkligen en uppfattning om hur företaget siktade på att kombinera konst och AI-teknik.
Du kan ta reda på allt om hur man använder Dall-E 2 för att skapa AI-bilder i vår djupgående guide, inklusive hur man får åtkomst och hur man redigerar specifika delar av bilden.
Hur fungerar DALL-E?
Det finns en hel del olika tekniker bakom DALL-E. Men utan att dyka in i den komplexa matematiken, låt oss börja med hur DALL-E tränades på miljontals bilder från hela internet.
Bilderna som används för träning kommer från dataset som innehåller ett enormt antal bilder som har en textbild. Som du kanske föreställer dig, med tillräckligt mycket data kan AI-modellen lära sig hur man känner igen vad ett objekt är och hur det kan se ut i en bild.
Datauppsättningen som används för att träna DALL-E har inte avslöjats, men du kan fortfarande ta reda på om dina bilder har tränat en AI-modell och välja bort.
DALL-E byggdes också med hjälp av en språkmodell som heter GPT-3, eller Generative Pre-trained Transformer. Det blev till stor del populär när Open AI släppte ChatGPT, en AI-chatbot som du enkelt kan prata med på naturligt mänskligt språk. Denna teknik överbryggar klyftan mellan text och bild och hjälper till att förvandla orden du skriver till en bild på skärmen som består av pixlar.
En annan central del av DALL-E är användningen av en diffusionsmodell. Den här modellen tar en brusig bild – tänk på en mycket pixilerad bild som inte går att känna igen – och arbetar bakåt för att producera en tydlig bild som matchar textbeskrivningen du angav.
Vad kan du göra med DALL-E?
Folk använder DALL-E för alla möjliga saker. Du kan prova på att vara en AI-artist, använda den för att remixa ett berömt konstverk eller ta ett originalkonstverk och utöka det med DALL-E: s redigeringsfunktioner.
Outpainting är en funktion i DALL-E som låter dig skapa ännu större verk genom att du kan fästa nygenererade bildpaneler på ett befintligt konstverk. Lära sig hur man använder outpainting i Dall-E 2 för att se hur långt du kan utöka dina AI-genererade bilder.
Skapa AI-genererade bilder med DALL-E
DALL-E är ett lättillgängligt AI-verktyg som du kan använda för att skapa konst eller generera bilder, av vilka ingen någonsin har funnits tidigare. Den använder sig av otroliga framsteg inom maskininlärning, inklusive GPT-3 och diffusionsmodeller. DALL-E: s kunskap om den mänskliga världen, inklusive konstens historia, kommer från miljontals bilder som sannolikt har samlats in från internet.
Kombinationen av flera nya teknologier inom generativ AI gör att du får njuta av att väcka din fantasi till liv med bara ord för att måla en bild.