När du använder Google Kalkylark för att arbeta med två datamängder kanske du vill jämföra de två genom att bestämma i vilken grad den ena påverkar den andra.
Korrelationer kan ge insikt om huruvida det finns ett prediktivt samband mellan x- och y-plan, men de indikerar inte nödvändigtvis kausalitet. Så här kan du använda Google Kalkylark för att identifiera samband i din data.
Vad är korrelation och vad kan du använda det till?
När två variabler är korrelerade kan den ena bestämma hur en variabel påverkar den andra. Men det är viktigt att komma ihåg att korrelation inte innebär tillit i det här fallet; det visar bara hur nära och snabbt två variabler jämför eller relaterar.
Statistiska mått hjälper till att förstå underliggande trender i dataanalys. Korrelation är bland de mest använda statistiska måtten, och den avgör hur nära relaterade eller beroende två variabler är.
Förstå korrelationskoefficienten i Google Sheets
I Google Sheets beräknas en korrelationskoefficient med hjälp av CORREL-funktionen. Korrelationskoefficienten fungerar som en mätare för hur nära sammankopplade datauppsättningarna är. Den kan användas för att få Pearsons produkt-moment korrelationskoefficient (r) om du har två variabla uppsättningar data. Om du vill lära dig mer om denna koefficient kan du läsa mer i den här guiden från
Statistik på Leard.Man kan stöta på en av tre korrelationsmått. Varje mätning definierar sambanden mellan variabler på olika sätt. Dess värde är mellan -1 och +1:
- -1 anger en perfekt negativ korrelation: När en korrelation har en korrelationskoefficient som är lika med eller under -0,9, anges den vara starkt negativ. Det är en indikation på att data korrelerar. Variabeln x fortsätter dock att öka, medan variabeln y fortsätter att minska.
- 0 anger ingen anslutning: Variabler anses inte korrelera om korrelationskoefficienten är större än 0,01 men mindre än 0,1 eftersom det inte finns ett urskiljbart samband mellan varje variabel. De är oberoende av varandra.
- +1 anger en perfekt positiv korrelation: När en korrelationskoefficient faller mellan 0,9 och 1 anses den vara mycket positiv. Det indikerar att det har skett en ökning av de två variabeluppsättningarna.
Det högsta värdet på en koefficient kan ha varit en korrelationskoefficient på 1. När korrelationsvärdet är 1, innebär det att om du skulle plotta data, skulle det vara helt justerat för att skapa en rät linje.
Om du fortfarande är lite vilsen, oroa dig inte. Vi kommer att förklara syntaxen för CORREL-funktionen och sedan dyka in i några verkliga exempel för att hjälpa dig förstå den bättre. Förstå linjer av bästa passform och hur man gör trendlinjer i Google Sheets hjälper dig med detta.
CORREL Funktionssyntax i Google Sheets
=CORREL(data_y; data_x)
Låt oss dela upp detta i dess delar och bättre förstå vad varje fras betyder:
- =CORREL: Det här är Google Sheet-funktionen som bestämmer r, (datauppsättningens korrelationskoefficient för Pearson-produktmoment).
- data_y: Detta hänvisar till gruppen av celler som innehåller beroende data eller värdeintervallet för dessa celler.
- data x: Detta är antingen en referens till arrayen av celler med oberoende data eller värdeintervallet för dessa celler.
Om du skulle plotta datapunkterna skulle data_y vara Y-axeln och data_x X-axeln. Du kommer att märka att det finns två olika sätt att ange dataintervallet. Antingen ett referenscellsområde eller rak datainmatning i funktionen är alternativ.
I de flesta fall är användningen av referenscellers intervall att föredra. Det beror på att kalkylarket med största sannolikhet redan innehåller dina data. Användning av ett referenscellsområde kan undvika överdriven inmatning som kan leda till användarfel.
Exempel på CORREL-funktioner i Google Sheets
Låt oss ta en titt på några exempel för att förstå hur du använder CORREL-funktionen i Google Sheets.
Exempel 1: En stark positiv korrelation
För detta första exempel, låt oss låtsas att vi arbetar i fastighetsbranschen. I kalkylarket nedan har vi uppdelningar av hektar mark som du säljer och antalet sålda enheter av de olika markernas data i ditt Google-ark.
- Om du följer med i ett ark, börjar du med att knappa in variablernas data i ditt kalkylblad, som visas nedan:
- Klicka på cell C2
- Typ =CORREL(
- Du kommer sedan att gå vidare till att skriva data_y, som i vårt fall är det refererade cellintervallet A2:A6, skriv sedan ett kommatecken.
- Fortsätt till skriv data_x, som i vårt fall refereras till som B2:B6.
- Avsluta med en avslutande konsol, som visas nedan:
- Tryck till sist Stiga på för att returnera korrelationskoefficienten för de två databitarna i cellen C2.
Med hjälp av exemplet som just visas ovan har du fått en korrelationskoefficient på 0,90, vilket är en stark positiv korrelation eftersom dess värde ligger mellan 0,9 och 1. Därför indikerar detta att när y ändras ändras x också på ett väsentligen jämförbart sätt.
Nedan är en representation av våra exempeldata på ett XY-spridningsdiagram. Som du kan se är linjen för bästa passform nära datapunkterna på grafen, vilket stöder tanken att siffrorna är starkt korrelerade.
Du kan lära dig mer om skapa XY-spridningsdiagram i Google Sheets i vår andra artikel.
Exempel 2: En svag negativ korrelation
Den här gången kommer vi att använda ett mer generiskt exempel på "variabel x och y" i vårt kalkylblad. Vi har målmedvetet inkluderat siffror för att visa en negativ korrelation, vilket CORREL-funktionen visar nedan:
Det finns inget starkt samband mellan variablerna y och x, så resultatet vi får är en mindre signifikant korrelationskoefficient än i föregående exempel. Resultatet vi uppnådde är -0,47. Detta betyder dock inte att det inte finns någon korrelation alls. Låt oss titta på en linje med bästa passform igen för att förstå det.
Som du kan se av spridningsdiagrammet är datapunkterna längre från linjen för bästa passform. Det finns därför mindre korrelation än i det första exemplet, men inte någon. Du kommer också att märka att linjen för bästa passform minskar. Detta visar en negativ korrelation, ett värde minskar när det andra ökar.
Exempel 3: Ingen anslutning
Här har vi en uppsättning helt slumpmässiga tal. Låt oss snabbt beröra hur du använder CORREL-funktionen igen:
- Skriv i cell C2 formeln CORREL
- Våra argument är A2:A10 och B2:B10
- Tryck på Enter
Värdet som returneras på C2 är 0,02. Om en korrelationskoefficient faller mellan 0,01 och 0,1 fastställs att de aktuella variablerna inte korrelerar eftersom det inte finns något urskiljbart samband mellan dem. Relationerna mellan variabler är helt oberoende.
Nedan visas representationen av densamma på en spridningsgraf. Linjen för bästa passform är nästan platt, vilket indikerar liten korrelation mellan de två datamängderna.
Korrelera enkelt dina data i Google Sheets
Korrelation kan vara ett utmanande ämne om du inte arbetade mycket med det på gymnasiet. Den här guiden täckte alla grunderna, men du måste fortsätta använda CORREL-funktionen i Google Sheets för att hålla den fräsch i minnet.
Detta är en kraftfull funktion eftersom den hjälper till att undvika att skapa spridningsgrafer och snabbt kan hitta trender i din data. Var ändå inte rädd för att lägga till diagram för att hjälpa andra användare att bättre förstå informationen i dina kalkylblad.