Vill du förse ChatGPT med dina anpassade data? Här är ett steg-för-steg om hur du gör just det!
Genom att tillhandahålla GPT-teknik i en kraftfull och lättanvänd chatbot har ChatGPT blivit världens mest populära AI-verktyg. Många människor använder ChatGPT för att tillhandahålla engagerande konversationer, svara på frågor, erbjuda kreativa förslag och hjälpa till med kodning och skrivning. ChatGPT är dock begränsad eftersom du inte kan lagra dina data för långvarig personlig användning, och dess gräns för kunskapsdata från september 2021.
Som en lösning kan vi använda OpenAI: s API och LangChain för att förse ChatGPT med anpassad data och uppdaterad information efter 2021 för att skapa en anpassad ChatGPT-instans.
Varför tillhandahålla ChatGPT med anpassade data?
Att mata ChatGPT med anpassad data och tillhandahålla uppdaterad information bortom sitt gränsdatum för kunskap ger flera fördelar jämfört med att bara använda ChatGPT som vanligt. Här är några av dem:
- Personliga interaktioner: Genom att förse ChatGPT med anpassad data kan användare skapa en mer anpassad upplevelse. Modellen kan tränas på specifika datauppsättningar som är relevanta för enskilda användare eller organisationer, vilket resulterar i svar som är skräddarsydda för deras unika behov och preferenser.
- Domänspecifik expertis: Anpassad dataintegration gör att ChatGPT kan specialisera sig på särskilda domäner eller branscher. Det kan tränas på branschspecifik kunskap, terminologi och trender, vilket möjliggör mer exakta och insiktsfulla svar inom dessa specifika områden.
- Aktuell och korrekt information: Tillgång till uppdaterad information säkerställer att ChatGPT håller sig uppdaterad med den senaste utvecklingen och kunskapen. Det kan ge korrekta svar baserat på senaste händelser, nyheter eller forskning, vilket gör det till en mer pålitlig informationskälla.
Nu när du förstår vikten av att tillhandahålla anpassade data till ChatGPT, här är ett steg-för-steg om hur du gör det på din lokala dator.
Steg 1: Installera och ladda ner programvara och färdigt skript
Observera att följande instruktioner är för en Windows 10- eller Windows 11-maskin.
För att tillhandahålla anpassade data till ChatGPT måste du installera och ladda ner det senaste Python3, Git, Microsoft C++ och ChatGPT-hämtningsskriptet från GitHub. Om du redan har en del av mjukvaran installerad på din PC, se till att de är uppdaterade med den senaste versionen för att undvika några hicka under processen.
Börja med att installera:
- Ladda ner:Python3 (Fri)
- Ladda ner:Git (Fri)
- Ladda ner:Microsoft Visual Build-verktyg (Fri)
Installationsanteckningar för Python3 och Microsoft C++
När du installerar Python3, se till att du markerar Lägg till python.exe till PATH alternativet innan du klickar Installera nu. Detta är viktigt eftersom det låter dig komma åt Python i vilken katalog som helst på din dator.
När du installerar Microsoft C++ vill du installera Byggverktyg för Microsoft Visual Studio först. När det är installerat kan du markera Desktoputveckling med C++ alternativet och klicka Installera med alla valfria verktyg automatiskt bockade i den högra sidofältet.
Nu när du har installerat de senaste versionerna av Python3, Git och Microsoft C++ kan du ladda ner Python-skriptet för att enkelt söka efter anpassade lokala data.
Ladda ner: ChatGPT-hämtningsskript (Fri)
För att ladda ner skriptet, klicka på Koda, välj sedan Ladda ner ZIP. Detta bör ladda ner Python-skriptet till din standard- eller valda katalog.
När vi har laddat ned kan vi nu ställa in en lokal miljö.
Steg 2: Ställ in den lokala miljön
För att ställa in miljön måste du öppna en terminal i chatgpt-retrieval-main-mappen som du laddade ner. För att göra det, öppna chatgpt-retrieval-main högerklicka och välj Öppna i Terminal.
När terminalen är öppen, kopiera och klistra in detta kommando:
pip installera langkedja openai chromadb tiktoken ostrukturerad
Detta kommando använder Pythons pakethanterare för att skapa och hantera den virtuella Python-miljön behövs.
Efter att ha skapat den virtuella miljön måste vi tillhandahålla en OpenAI API-nyckel för att komma åt deras tjänster. Vi måste först generera en API-nyckel från Webbplats för OpenAI API-nycklar genom att klicka på Skapa ny hemlig nyckel, lägg till ett namn för nyckeln och tryck sedan på Skapa hemlig nyckel-knapp.
Du kommer att få en sträng med tecken. Detta är din OpenAI API-nyckel. Kopiera den genom att klicka på kopieringsikonen på sidan av API-nyckeln. Observera att denna API-nyckel bör hållas hemlig. Dela den inte med andra om du inte verkligen har för avsikt att de ska använda den med dig.
När du har kopierat, gå tillbaka till chatgpt-retrieval-huvudmappen och öppna konstanter med Anteckningsblock. Ersätt nu platshållaren med din API-nyckel. Kom ihåg att spara filen!
Nu när du framgångsrikt har konfigurerat din virtuella miljö och lagt till din OpenAI API-nyckel som en miljövariabel. Du kan nu tillhandahålla dina anpassade data till ChatGPT.
Steg 3: Lägga till anpassade data
För att lägga till anpassade data, placera alla dina anpassade textdata i data mapp i chatgpt-retrieval-main. Formatet på textdata kan vara i form av en PDF, TXT eller DOC.
Som du kan se från skärmdumpen ovan har jag lagt till en textfil som innehåller ett personligt schema, en artikel jag skrev på AMD: s instinktacceleratoreroch ett PDF-dokument.
Steg 4: Fråga ChatGPT genom terminalen
Python-skriptet låter oss fråga data från de anpassade data som vi har lagt till i datamappen och internet. Med andra ord kommer du att ha tillgång till den vanliga ChatGPT-backend och all data lagrad lokalt i datamappen.
För att använda skriptet, kör python chatgpt.py skript och lägg sedan till din fråga eller fråga som argument.
pytonorm chatgpt.py "DIN FRÅGA"
Se till att ställa dina frågor inom citattecken.
För att testa om vi framgångsrikt har matat ChatGPT med vår data kommer jag att ställa en personlig fråga angående Personlig Sched.txt fil.
Det fungerade! Detta innebär att ChatGPT kunde läsa den personliga Sched.txt som tillhandahållits tidigare. Låt oss nu se om vi framgångsrikt har matat ChatGPT med information som den inte känner till på grund av dess gränsdatum för kunskap.
Som du kan se beskrev den korrekt AMD Instinct MI250x, som släpptes efter ChatGPT -3:s slutdatum för kunskap.
Begränsningar för Custom ChatGPT
Även om matning av GPT-3.5 med anpassade data öppnar fler sätt att tillämpa och använda LLM, finns det några nackdelar och begränsningar.
För det första måste du tillhandahålla all data själv. Du kan fortfarande få tillgång till all kunskap om GPT-3.5 fram till dess slutdatum för kunskapen; du måste dock tillhandahålla all extra information. Detta innebär att om du vill att din lokala modell ska vara kunnig om ett visst ämne på internet som GPT-3.5 inte redan känner till, du måste gå till internet och skrapa data själv och spara den som en text i datamappen på chatgpt-retrieval-main.
Ett annat problem är att det tar längre tid att ladda in ChatGPT på det här sättet jämfört med att fråga ChatGPT direkt.
Slutligen är den enda modellen som finns tillgänglig för närvarande GPT-3.5 Turbo. Så även om du har tillgång till GPT-4 kommer du inte att kunna använda den för att driva din anpassade ChatGPT-instans.
Custom ChatGPT är fantastiskt men begränsat
Att tillhandahålla anpassade data till ChatGPT är ett kraftfullt sätt att få ut mer av modellen. Genom den här metoden kan du mata modellen med vilken textdata du vill och fråga den precis som vanlig ChatGPT, om än med vissa begränsningar. Detta kommer dock att förändras i framtiden eftersom det blir lättare att integrera vår data med LLM, tillsammans med tillgång till den senaste GPT-4-modellen.