För bara några månader sedan, om du ville skapa en bild av något, var du tvungen att kunna skissa, måla eller använda ett av de photoshopping-verktyg som andra fortsätter att prata om. Efter 2022 förändrades dock allt, allt tack vare AI – ja, som i "artificiell intelligens".

Istället för att försöka dominera världen kan konstnärligt benägna AI-verktyg förvandla allt du beskriver för dem till en bild.

Följ med oss ​​när vi går in i en värld av AI-driven textvisualisering och se hur du kan använda sådana verktyg för att omvandla dina tankar till faktiska bilder genom att bara skriva vad du har i åtanke.

Dall-E: Den konstnärliga sidan av OpenAI: s GPT-3

De första AI-drivna verktygen som blev populära var baserade på OpenAI: s GPT-3. En av anledningarna var projektets öppenhet för extern tillgång, vilket ledde till några förslag som GPT-3 är framtiden för kreativt arbete.

Idag kan du använda de officiella verktygen du kan hitta på OpenAI: s betasida eller tredjepartslösningar som drar fördel av dess språkliga superkrafter. Du kan till exempel be GPT-3 att komma med ett utkast till ett inlägg, svara på enkla frågor eller till och med revidera eller översätta en del text.

instagram viewer

2022 avslöjade OpenAI att GPT-3 var lika bra på att skapa bilder. DALL-E-projektet, en pjäs om Pixars WALL-E-film och Dalis namn, använder GPT-3 inte för att arbeta med text utan som en bildframställningsmotor.

Precis som med GPT-3 och text är DALL-E inte riktigt ett kreativt geni, som materialiserar bilder ur tomma intet. Istället har den "utbildats" på miljontals bilder som redan finns online. Dess AI-krafter ligger i att analysera dessa bilder, ta element från dem, justera, modifiera, justera och slutligen kombinera dem till nya bilder.

Det är åtminstone en förenklad version av vad som händer i bakgrunden. De flesta människor bryr sig bara om vad de ser framför sig, och det är en textruta där du kan skriva något och se det förvandlas till en bild efter några minuter.

Googles bildsvar

Google är en av de tre bästa "spelarna" inom AI-forskning. Ändå är deras framsteg inte lätt märkbara, och inte heller är dess implementeringar i produkter lika tillgängliga som OpenAIs erbjudanden.

En av Google AI: s första allmänt tillgängliga implementeringar var i Google Docs och Gmail, i form av mer intelligent autokomplettering och förslag, känd som Smart Compose. Vi kommer inte att dyka in i detaljer eftersom vi tidigare har täckt Smart Compose (och hur du kan använda det).

När dessa funktioner är aktiva jämför Googles webbappar vad användaren skriver med vad miljontals andra skrev tidigare. Sedan föreslår det vad de skrev efteråt.

Det är ett bevis på att trots vad vi tycker om att tro så är vi inte så olika. Om 99 av 100 personer skriver "senare" efter "vi ses", är det förmodligen vad vi skulle fortsätta att skriva också.

Vi har alla använt någon form av autokomplettering, även från "dumbphone"-erans T9-prediktiva textsystem. Det var därför Googles AI-verktyg inte verkade lika intelligenta som OpenAI: s GPT-3. De kändes inte lika mycket mer använda än ett bättre T9-system som förbättrats för 2000-talet. Och det är också därför Imagens avslöjande var lite av en chock.

Som en DALL-E på steroider är Imagen ett verktyg för textvisualisering. Baserat på vad som är tillgängligt idag kan Imagen producera "renare" och mer levande bilder samtidigt som man vet hur man hanterar avancerade funktioner som spridning och transparens.

Tyvärr är tillgången till Imagen fortfarande begränsad i skrivande stund, så vi kunde inte prova det.

DALL-E Mini and Friends: Open for Business

Du kan inte fritt komma åt DALL-E och Imagen—ännu. Ändå finns många alternativ redan tillgängliga om du vill busa med AI-driven textbildsgenerering.

Med tanke på att det är de tidiga dagarna och att resultaten eller användarupplevelsen de erbjuder kan vara långt ifrån optimala, är det fortfarande värt att kolla in några av följande.

Gör memes med Dall-E Mini

Tack vare en kombination av mer än tillräckliga resultat och ett användarvänligt gränssnitt, men ännu viktigare, dess breda tillgänglighet, blev DALL-E mini en av de mest populära AI-textvisualiserarna.

Långt ifrån perfekta, ibland kunde DALL-E minis resultat vara mer abstrakta än tänkt.

Andra gånger kanske det misslyckas med att skapa det du hade i åtanke men kan komma ganska nära.

Efter dess explosion i popularitet flyttade DALL-E minis skapare in den i ett nytt hem under nytt varumärke. Nu kan du hitta DALL-E minis senaste version som Craiyon på sin egen sida.

Att använda Craiyon idag är lika enkelt som att söka online efter en befintlig bild. Du kan besöka dess webbplats, skriva en beskrivning av din bild i dess textfält och trycka på Retur. Efter ett tag ser du resultatet på skärmen.

Det som är slående är hur bra Craiyon och liknande verktyg är på att efterlikna visuella stilar. Vi har till exempel bett den att trolla fram bilder av en valp på en skateboard:

Sedan använde vi den exakta frasen men lade till en "Pixar-stil" efter den. Efter ett tag visade Craiyon ett rutnät av mer "tecknade" bilder, närmare vad vi uppfattar som Pixars strålspårade grafik i deras älskade filmer.

Craiyon gav oss ännu bättre resultat när vi ersatte "Pixar style" med "anime style" i samma prompt.

Anime är mer stiliserad i sitt utseende än Pixars mer realistiska bildspråk, vilket verkar ha hjälpt Craiyon att producera några nästan färdiga att använda bilder.

Lurar Med Latent Diffusion

Latent Diffusion-modellen tränad på LAION-400M-datauppsättningen är en annan intressant AI-textvisualiserare. Men det är också mer komplicerat att använda. Du måste köra den online i en virtuell maskin och leka med dess olika parametrar istället för att bara skriva i ett textfält. Ändå är det lättare än det låter.

  1. Besök Google Latent Diffusion colab-utrymme det är för närvarande dess hem.
  2. Scrolla lite nedåt och lägg märke till Prompt fält under Parametrar. Ersätt standardprompten med det du vill att din bild ska avbilda.
  3. Välja Kör alla från Körning menyn eller tryck CTRL + F9.
  4. Om du vill kunna exportera de producerade bilderna direkt från verktyget, svara positivt på frågan om du vill länka det till ditt Google Drive-konto. Verktyget tar ett tag att slutföra sin konfiguration och behöver ladda ner några filer under processen.

Öka värdena för Steg, Iterationer, och Samples_in_parallel, kan leda till mer detaljerade resultat. Verktyget är dock extremt krävande i resurser på Googles servrar. Som ett resultat kan det krascha om du ökar dessa värden för mycket, eller processen att skapa en viss bild blir mer komplicerad än förväntat.

Intressanta alternativ

Vi har ägnat mycket tid åt att testa DALL-E mini och Latent Diffusion. Vår vetenskapliga metod bestod av två distinkta delar. Först var vi tvungna att komma på begrepp som exakt kunde beskrivas som galna. Be sedan dessa AI-visualiserare att förvandla dem till bilder. Oftare än väntat lyckades de, när de kom nära den allmänna uppställningen vi hade tänkt oss.

Vi har också provat några av de tillgängliga alternativen för den här artikeln. Vi väntar fortfarande på tillgång till andra. Några av de som är värda att kolla in är (i ingen speciell ordning):

  • Midjourney
  • MindsEye beta
  • StarryAI
  • Dröm
  • Disco Diffusion

Kommer AI-genererad konst att ersätta bildkonst?

Överflödet och den ständigt ökande populariteten hos bildgenererande AI-drivna verktyg får många att dra slutsatsen att bildkonsten snart kommer att dö. Vad är poängen med att investera tid och energi för att lära sig rita eller använda komplicerad programvara för att visualisera saker när en AI kan göra det snabbare (och snart bättre) än du?

Om du märkte, är alla dessa verktyg "tränade på datamängder." På ren engelska betyder det att de gör vad de gör tack vare att människor redan har gjort samma sak tidigare.

Det är tipset om varför dessa verktyg inte kan ersätta mänskligt konstnärskap, kreativitet och uppfinningsrikedom. De är härmar, smarta replikatorer. Utan de mänskligt producerade originalen som de är utbildade på, skulle de inte kunna producera någon produktion.

Ändå är det nu, och vi erkänner att vi inte vet vad framtiden har att erbjuda. Tills vidare kan bildkonstnärer sova tryggt. I den takt AI utvecklas, är dock många specialister på ämnet överens om att det inte är en fråga om det någonsin kommer att ersätta arbetet för människor som du. Det är bara en fråga om när.

Men hey, det är inte bara undergång och dysterhet. Medan Skynet förbereder sig för att ta vårt jobb, kan vi åtminstone förgylla vårt humör genom att enkelt skapa bilder av valpar på skateboards!