Letar du efter gratis data för att träna dina dataanalysfärdigheter? Här är några av de bästa webbplatserna att kolla in.
Oavsett om du genomför marknadsundersökningar, bygger din portfölj som analytiker eller söker insikter för att utöka din marknadsräckvidd, är värdefull och tillförlitlig data avgörande för välgrundat beslutsfattande.
Att söka på internet efter gratis, pålitlig och tillgänglig data har dock vissa utmaningar. Den här artikeln kommer att göra din datajaktsuppdrag mindre utmanande genom att introducera dig till några av de bästa webbplatserna för att få tillgång till gratis data.
Google Trends är en gratistjänst utvecklad av Google som ger användare ofiltrerade dataprover av sökförfrågningar till Google. Även om den här tjänsten visar tidsseriedata från 2004 till idag på både global och stadsnivå, visar den inte de personliga uppgifterna om sökmotoranvändarna.
Du kan också begränsa data till att fokusera på kategorier, språk, enheter eller populära sökningar på Google med Google Trender
. Exempel på tillgängliga data inkluderar dagliga söktrender och söktrender i realtid, som visar data för de senaste sju dagarna.FiveThirtyEight är en datajournalistikwebbplats som har data om omröstningsanalys, sport, popkultur, politik, vetenskap och ekonomiska händelser.
Det fina med webbplatsen är att du kan ladda ner data från deras webbplats eller deras officiellt GitHub-förråd och använd din datavisualiseringsverktyg för att skapa fängslande datajournalistikbilder för din publik. Några exempel på intressanta tillgängliga data inkluderar förutsägelser om världscupen och 2022-23 NHL prognoser data.
BuzzFeed News är en amerikansk plattform för senaste nyheter och originalrapportering som rapporterar allt från journalistik, teknik, underhållning, kändisnyheter, kultur och gör-det-själv-hack till hälsa och politik.
På sin GitHub gör BuzzFeed News sin datauppsättning, verktyg och analys från BuzzFeeds nyhetsrum öppen källkod, tillgänglig och tillgänglig. Ett exempel inkluderar FBI NICS bakgrundskontrolldata för skjutvapen.
Data.gov är USA: s regerings webbplats för öppna data som är värd för över 250 000 allmänt tillgängliga, väldokumenterade datauppsättningar från internationella och flera federala myndigheter. Tanken bakom detta initiativ var att ge en öppen och transparent regering.
Du kan komma åt data från webbplatsen baserat på ämne och byrå eller organisation. Några exempel på data du kan hitta på Data.gov är nationella studielånsdatasystemet och befolkningsdata för elfordon.
Kaggle är en offentlig datalekplats som förvärvats av Google som erbjuder ett brett utbud av datauppsättningar om olika ämnen. Den här gemenskapsplattformen låter dig dela dina koder, lära dig, samarbeta med andra dataproffs och utvecklas. Kaggle är även värd för datavetenskapstävlingar där du kan vinna olika priser.
Denna guide ger en nybörjarguide om hur du kommer igång med Kaggle för datavetenskap. Ett exempel är Global YouTube-statistik 2023.
EarthData är ett datainitiativ från NASA som fungerar som ett arkiv för jorddata från 1994 till nu. Du kan få data relaterad från den avlägsna satellitinformationen till data om jordens atmosfär, hav och terrestra hydrosfär.
Du kan bläddra i olika ämnen och komma åt data som extrem värmedata. Du måste dock utforska NASA: s planetdatasystem för icke-jorddata.
IMDb tillhandahåller data om filmer, TV-serier, hemvideor, poddsändningar, videospel, strömmande information och kändisinnehåll. Ett exempel är IMDb icke-kommersiella datamängder.
AWS Public Dataset är en webbplats som är värd för över 3000 datamängder av datamängder som görs offentligt tillgängliga via AWS-tjänster. De flesta av datamängderna här är projektbaserade. Några få inkluderar cancergenomatlas och Foldingathome COVID-19-dataset.
Inside Airbnb är en övervakningswebbplats som lanserats av Murray Cox. Den här webbplatsen hämtar information som är allmänt tillgänglig från Airbnb, en plattform som erbjuder användare budgetvänliga rum över hela världen. Du kan använda information från denna webbplats för att utföra analyser som hyresanalys av Montreal.
Google Dataset Search är en datauppsättningssökmotor skapad av Google som är värd för över 20 miljoner datauppsättningar. Precis som deras sökmotor kan du få data från nästan vad som helst. Ett bra exempel är Kanadensiska nationella långsiktiga övervakningsdata för vattenkvalitet.
UC Irvine Machine Learning Repository är hemmet för 624 datauppsättningar för maskininlärningsgemenskapen i världen. Den här webbplatsen har ett starkt rykte i samhället eftersom datamängderna är kategoriserade baserat på de maskininlärningsuppgifter de är lämpade för. Ett exempel är Iris dataset, en berömd klassificerings- och klustringsmodelldatauppsättning.
Datahub som plattform har många datamängder som täcker ett brett spektrum av ämnen som 10-åriga amerikanska statsobligationsräntor (långfristig ränta). Förutom data visar de också dataverktyg och verktygssatser som kan komma in för dataproffs.
Detta är den första webbplatsen på vår lista för exklusiv hälsodata. Global Health Observatory fungerar som ett datalager som visar hälsorelaterad statistik för över 1 000 indikatorer för WHO: s 194 medlemsländer. Uppgifterna registreras för att övervaka dessa medlemsländers framsteg mot SDG-målen. Du kan få data genom att filtrera tema, kategori, metadata och indikator för data.
Denna plattform är verkligen nischbaserad. Det visar forskningsdata och marknadsinformation som siffror för helgens biljettkassor och relaterade uppgifter om den brittiska filmindustrin.
GitHub är mer än bara hemmet för miljontals samarbetsprojekt och projekt med öppen källkod. Plattformen är också värd för många repositories som syftar till att hålla gratis, offentliga och öppen källkodsdatauppsättningar. Även BuzzFeedNews har ett GitHub-förråd med öppen källkod.
Andra exempel är Fantastiskt arkiv för offentliga datauppsättningar och lyfter du ens datasetet. Du kan också bidra till dessa open source-projekt på GitHub.
Data.world är en datagemenskap och samarbetsplattform som är värd för dataprojekt och datauppsättningar. Medan ett fåtal datauppsättningar betalas, huvudsakligen av data på plattformen, som Makeover måndagens 2021/W16: månatliga flygpassagerare i Amerika, är gratis och kan enkelt laddas ner lokalt eller nås via deras API.
World Bank Open Data är en katalog över globala ekonomiska och utvecklingsdata. Du kan bläddra och filtrera data, till exempel global statistik om kostnaden och överkomligheten för hälsosamma kostvanor efter indikator och land.
Nasdaq Data Link är för allt finansiell, ekonomisk och alternativ data. Du kan komma åt data som US Federal Reserves datasläpp via ett kalkylblad som Excel eller ett API.
NYC Taxi and Limousine Commission dataplattform registrerar och är värd för information som t.ex gula och gröna taxiresor över hela New York City. Det fina med den här webbplatsen är att den visar information om allt, från hämtning/lämning till taxizonen och resepriser.
Academic Torrents är en datakatalog med över 127,15 TB forskningsdata. Den byggdes, som man säger, för forskare och av forskare.
Utforska och lär
Förhoppningsvis kan du med den här listan få data som kan forma ditt affärslandskap, driva din marknadsundersökning, få en konkurrensfördel och hjälpa dig att bygga den unika dataportföljen utan kostnad. Så omfamna möjligheterna, utforska och ha en mindre utmanande datajaktuppdrag.