Så här använder du Excels inbyggda verktyg för att göra statistisk analys enklare.

Restdiagram spelar en viktig roll i regressionsanalys. De berättar hur exakt din regressionslinje representerar förhållandet mellan två variabler. Följande guide förklarar hur man beräknar och plottar Excel-rester med två metoder.

Men innan vi kommer till de bra sakerna, låt oss kortfattat förstå rester och deras betydelse i en regressionsanalys.

Vad är rester och varför är de viktiga?

En residual är en skillnad mellan det observerade (faktiska) värdet och det förutsagda värdet. I enklare termer är en rest ett fel. Till exempel, om det observerade värdet är 10 och din modell gav värdet 8, så skulle restvärdet vara 2.

Å andra sidan är ett residualplot ett spridningsdiagram där den oberoende variabeln (åldern) plottas på den horisontella axeln och residualerna (felen) plottas på den vertikala axeln.

Ok, du vet vad rester är, men varför är de viktiga? För att förstå det, överväg följande fall:

Vi vill förstå sambandet mellan ålder och sparande. För det ritar vi en regressionslinje. Vi är dock osäkra på om regressionslinjen korrekt representerar förhållandet mellan de två variablerna. Det är där rester kommer in. Vi använder en restplot för att kontrollera regressionslinjens noggrannhet.

instagram viewer

Nu när du vet vad rester är, låt oss lära oss hur man skapar en restplot i Excel:

Hur man skapar en återstående plot med hjälp av trendlinjeekvation

Den första metoden för att plotta residualer i Excel använder en trendlinjeekvation för att beräkna de förutsagda värdena för våra data. När vi väl har det kan vi beräkna residualerna genom att subtrahera de förutsagda värdena från de observerade värdena. Slutligen skapar vi ett spridningsdiagram med prediktorerna på den horisontella axeln och residualerna på den vertikala axeln.

Även om den här metoden kräver fler steg än den andra metoden, är det ett bra sätt att förstå konceptet. När du väl har en anständig förståelse kan du använda den andra metoden, som kräver mindre tid och ansträngning.

Låt oss gå igenom processen, ett steg i taget:

Steg 1: Ange data

Vi börjar med att ange värdena för prediktorn (under X kolumn) och de observerade värdena (under Y kolumn):

Steg 2: Skapa en scatterplot av data

Nu skapar vi ett spridningsdiagram av data genom att följa stegen nedan:

Om du inte är bekant med scatter plots, här är en omfattande artikel om skapa ett spridningsdiagram i Excel och presentera dina data. Du kan också lära dig använd ett spridningsdiagram i Excel för att förutsäga databeteende.

  1. Välj data (under X och Y kolumner).
  2. Gå till Excel-band och klicka Föra in.
  3. I den Diagram klickar du på pilen under Scatterplot alternativ.
  4. Välj den första scatterplotten (Strö med endast markörer).
  5. Du får ett spridningsdiagram som liknar följande diagram:

Steg 3: Lägg till en trendlinje och visa trendlinjeekvationen på scatterplot

Följ stegen nedan för att lägga till en trendlinje till spridningsdiagrammet:

  1. Klicka på spridningsdiagrammet.
  2. Gå till Excel-band och klicka Layout.
  3. I den Bakgrund klickar du på pilen under Trendlinje ikon.
  4. Välj Linjär trendlinje alternativ.

Du kommer nu att se en linje (trendlinje) som skär punkterna på din spridningsdiagram. För att visa trendlinjeekvationen på spridningsdiagrammet, följ stegen nedan:

  1. Gå igen till Trendlinje ikonen och klicka på pilen under den.
  2. Klick Fler trendlinjealternativ.
  3. A Formatera trendlinje dialogrutan visas.
  4. Kolla Visa ekvation på diagrammet alternativet längst ned på Formatera trendlinje dialog ruta. Trendlinjeekvationen kommer att visas på grafen.

Steg 4: Beräkna de förutsagda värdena

För att beräkna de förutsagda värdena, skapa en annan kolumn (Z) bredvid dina data och följ stegen nedan:

  1. Ange trendlinjeformeln som visas på grafen och klistra in den under Z-kolumnen (cell C2). Ändra x i formeln med värden under X-kolumnen.
  2. Så för det första förutsagda värdet skulle formeln ges enligt följande:
    =1,5115*A2+23,133
  3. Byta ut A2 med A3 i trendlinjeformeln för det andra predikerade värdet.
  4. För det tredje förutsagda värdet, ersätt A3 med A4, och så vidare, tills du får alla predikterade värden för deras motsvarande prediktorer.

Steg 5: Hitta restvärdena

Nu när vi har de förutsagda värdena kan vi hitta restvärdena genom att subtrahera de förutsagda värdena från de observerade (faktiska) värdena under Y-kolumnen. Formeln för det första restvärdet skulle vara =B2-C2. För det andra skulle formeln vara =B3-C3, och så vidare.

Steg 6: Skapa den återstående plotten

För att skapa en restplot behöver vi prediktorn och restvärden. Nu när vi har båda, följ stegen nedan:

  1. Välj kolumner Y och Z.
  2. Högerklicka och välj Dölj.
  3. Välj nu X och Rester kolumner.
  4. Gå till Föra in fliken i Excel-bandet.
  5. Klicka på pilen under Sprida ut ikon.
  6. Välj Sprid med endast markörer alternativ.
  7. Du får din återstående tomt, som visas nedan.

För den andra metoden är allt du behöver göra att förse Excel med data, och det gör allt arbete. Du kan skapa en återstående plot med bara några få klick. Men för det måste du ladda Excels Analysis Toolpak. Låt oss börja:

  1. Gå till Fil fliken och klicka Alternativ.
  2. De Excel-alternativ dialogrutan visas.
  3. Gå till Hantera rutan (längst ned), välj Excel-tillägg, och klicka .
  4. En Tillägg dialogrutan visas.
  5. Kolla Analys ToolPak rutan och klicka ok.
  6. Gå nu till Excel-band och klicka Data.
  7. Du hittar Dataanalys ikonen i Analys sektion.

Steg 2: Ange data

  1. Välj kolumner A och D, och högerklicka med musen. Klick Visa upp.
  2. Kopiera nu X och Y kolumner.

    Du kommer att märka att grafen har ändrats efter att kolumnerna har visats. För att ändra den tillbaka till den ursprungliga återstående plotten måste vi dölja Y och Z kolumner (genom att välja Y och Z kolumner, högerklicka med musen och välj Dölj).

  3. Öppna ett nytt Excel-ark och klistra in X och Y kolumner.
  4. Klicka på den nyligen visades Dataanalys alternativet i Analys avsnitt av Data flik.
  5. A Dataanalys dialogrutan visas.
  6. Hitta och välj Regression under Analysverktyg.
  7. Klick OK. De Regression dialogrutan visas.
  8. Ange värdena i Y kolumn (prediktorerna, B2:B11) i Ingång Y-intervall fält.
  9. Ange cellintervallet i X kolumn (de oberoende variablerna, A2:A11) i Ingång X-intervall fält.

Steg 3: Skapa den återstående plotten

I den Regression dialogrutan under Utgångsalternativ, kolla upp Nytt arbetsblad, och klicka OK.

Excel skapar automatiskt restdiagrammet tillsammans med följande utdata som du kan använda för att kontrollera tillförlitligheten hos din regressionsmodell:

  • Regressionsstatistik
  • ANOVA bord
  • Koefficienttabell
  • Återstående utgång

Excels Analysis ToolPak erbjuder en rad värdefulla statistikfunktioner som du kan använda för att analysera dina datamängder. Efter att ha skapat restdiagrammet genom Excels Analysis ToolPak kan du börja klia dig i huvudet medan du tittar på alla komplicerade tabeller. Men när du väl lär dig hur man gör grundläggande dataanalys i Excel ser siffrorna inte så skrämmande ut.