Pandas är ett Python-bibliotek med öppen källkod som huvudsakligen används för datamanipulation och analys. Det är byggt ovanpå NumPy-biblioteket och tillhandahåller högpresterande, lättanvända datastrukturer och dataanalysverktyg för programmeringsspråket Python.

I den här artikeln kommer du att lära dig hur du utför 6 grundläggande operationer med Pandas.

Använda Pandas exempel

Du kan köra exemplen i den här artikeln med datoranteckningsböcker som Jupyter anteckningsbok, Google Colab, etc. Du kan också köra exemplen genom att skriva in koden direkt i Python-tolken i interaktivt läge.

Om du vill ta en titt på den fullständiga källkoden som används i den här artikeln kan du komma åt Python Notebook-filen från denna GitHub-förråd.

1. Hur man importerar pandor som pd och skriver ut versionsnumret

Du måste använda importera nyckelord för att importera valfritt bibliotek i Python. Pandas importeras vanligtvis under pd alias. Med detta tillvägagångssätt kan du hänvisa till Pandas-paketet som pd istället för pandor.

instagram viewer
importera pandor som pd
print (pd.__version__)

Produktion:

1.2.4

2. Hur man skapar en serie i Pandas

Pandas Series är en endimensionell array som innehåller data av alla slag. Det är som en kolumn i en tabell. Du kan skapa en serie med hjälp av numpy-arrayer, numpy-funktioner, listor, ordböcker, skalära värden, etc.

Seriens värden är märkta med deras indexnummer. Som standard har det första värdet index 0, det andra värdet har index 1, och så vidare. För att namnge dina egna etiketter måste du använda index argument.

Hur man skapar en tom serie

s = pd. Serie (dtype='float64')
s

Produktion:

Series([], dtype: float64)

I exemplet ovan visas en tom serie med flyta datatyp skapas.

Hur man skapar en serie med NumPy Array

importera pandor som pd
importera numpy som np
d = np.array([1, 2, 3, 4, 5])
s = pd. Serie (d)
s

Produktion:

0 1
1 2
2 3
3 4
4 5
dtype: int32

Relaterad: NumPy Operations för nybörjare

Hur man skapar en serie med hjälp av lista

d = [1, 2, 3, 4, 5]
s = pd. Serie (d)
s

Produktion:

0 1
1 2
2 3
3 4
4 5
dtype: int64

Hur man skapar en serie med index

För att skapa en serie med ett index måste du använda index argument. Antalet index måste vara lika med antalet element i serien.

d = [1, 2, 3, 4, 5]
s = pd. Serie (d, index=["ett", "två", "tre", "fyra", "fem")])
s

Produktion:

en 1
två 2
tre 3
fyra 4
fem 5
dtype: int64

Hur man skapar en serie med hjälp av ordbok

Ordbokens nycklar blir seriens etiketter.

d = {"one": 1,
"två": 2,
"tre": 3,
"fyra": 4,
"fem": 5}
s = pd. Serie (d)
s

Produktion:

en 1
två 2
tre 3
fyra 4
fem 5
dtype: int64

Hur man skapar en serie med skalärt värde

Om du vill skapa en serie med ett skalärt värde måste du ange index argument.

s = pd. Serie (1, index = ["a", "b", "c", "d"])
s

Produktion:

en 1
b 1
c 1
d 1
dtype: int64

3. Hur man skapar en dataram i Pandas

En DataFrame är en tvådimensionell datastruktur där data justeras i form av rader och kolumner. En DataFrame kan skapas med hjälp av ordlistor, listor, en lista med ordböcker, numpy arrays, etc. I den verkliga världen skapas DataFrames med hjälp av befintlig lagring som CSV-filer, Excel-filer, SQL-databaser, etc.

DataFrame-objektet stöder ett antal attribut och metoder. Om du vill veta mer om dem kan du kolla in den officiella dokumentationen för pandas dataram.

Hur man skapar en tom dataram

df = pd. DataFrame()
print (df)

Produktion:

Tom DataFrame
Kolumner: []
Index: []

Hur man skapar en dataram med hjälp av lista

listObj = ["MUO", "teknik", "förenklat"]
df = pd. DataFrame (listObj)
print (df)

Produktion:

 0
0 MUO
1 teknik
2 förenklat

Hur man skapar en dataram med hjälp av Dictionary of ndarray/Lists

batmanData = {'Movie Name': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
'Utgivningsår': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
print (df)

Produktion:

 Filmens namn Utgivningsår
0 Batman börjar 2005
1 The Dark Knight 2008
2 The Dark Knight Rises 2012

Hur man skapar en dataram med hjälp av listor

data = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (data, kolumner = ['Namn', 'Rullnr.'])
print (df)

Produktion:

 Namnrulle nr.
0 Alex 601
1 Bob 602
2 Cataline 603

Hur man skapar en dataram med hjälp av en lista med ordböcker

data = [{'Name': 'Alex', 'Roll No.': 601},
{'Name': 'Bob', 'Roll No.': 602},
{'Name': 'Cataline', 'Roll No.': 603}]
df = pd. DataFrame (data)
print (df)

Produktion:

 Namnrulle nr.
0 Alex 601
1 Bob 602
2 Cataline 603

Relaterad: Hur man konverterar en lista till en ordbok i Python

Hur man skapar en dataram med hjälp av zip()-funktionen

Använd blixtlås() funktion för att slå samman listor i Python.

Namn = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = lista (zip (namn, RollNo))
df = pd. DataFrame (listOfTuples, kolumner = ['Namn', 'Rullnr.'])
print (df)

Produktion:

 Namnrulle nr.
0 Alex 601
1 Bob 602
2 Cataline 603

4. Hur man läser CSV-data i Pandas

En "kommaseparerade värden"-fil (CSV) är en avgränsad textfil som använder kommatecken för att separera värden. Du kan läsa en CSV-fil med hjälp av read_csv() metod i pandor. Om du vill skriva ut hela DataFrame, använd att stränga() metod.

I detta och nästa exempel, detta CSV-fil kommer att användas för att utföra operationerna.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.to_string())

Produktion:

5. Hur man analyserar dataramar med metoderna head(), tail() och info().

Hur man visar data med hjälp av metoden head().

De huvud() metod är ett av de bästa sätten att få en snabb överblick över DataFrame. Denna metod returnerar rubriken och det angivna antalet rader, med början från toppen.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.head (10))

Produktion:

Om du inte anger antalet rader kommer de första 5 raderna att returneras.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.head())

Produktion:

Hur man visar data med tail()-metoden

De svans() metod returnerar rubriken och det angivna antalet rader, med början från botten.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.tail (10))

Produktion:

Om du inte anger antalet rader kommer de sista 5 raderna att returneras.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.tail())

Produktion:

Hur man får information om data

De info() metoder returnerar en kort sammanfattning av en DataFrame inklusive index dtype och kolumn dtypes, icke-nullvärden och minnesanvändning.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.info())

Produktion:

6. Hur man läser JSON-data i Pandas

JSON (JavaSskript Object Notation) är ett lättviktsformat för datautbyte. Du kan läsa en JSON-fil med hjälp av read_json() metod i pandor. Om du vill skriva ut hela DataFrame, använd att stränga() metod.

I exemplet nedan, detta JSON-fil används för att utföra operationerna.

Relaterad: Vad är JSON? En lekmans översikt

df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
print (df.to_string())

Produktion:

Uppdatera dina Python-kunskaper med inbyggda funktioner och metoder

Funktioner hjälper till att förkorta din kod och förbättra dess effektivitet. Funktioner och metoder som minska(), dela(), räkna upp(), eval(), runda(), etc. kan göra din kod robust och lätt att förstå. Det är alltid bra att veta om inbyggda funktioner och metoder eftersom de kan förenkla dina programmeringsuppgifter i stor utsträckning.

Dela med sigTweetE-post
20 Python-funktioner du bör känna till

Python Standard Library innehåller många funktioner som hjälper dig med dina programmeringsuppgifter. Lär dig mer om det mest användbara och skapa mer robust kod.

Läs Nästa

Relaterade ämnen
  • Programmering
  • Pytonorm
  • Webbutveckling
  • Programmering
  • Dataanalys
Om författaren
Yuvraj Chandra (69 publicerade artiklar)

Yuvraj är en datavetenskapsstudent vid University of Delhi, Indien. Han brinner för Full Stack Web Development. När han inte skriver undersöker han djupet i olika teknologier.

Mer från Yuvraj Chandra

Prenumerera på vårt nyhetsbrev

Gå med i vårt nyhetsbrev för tekniska tips, recensioner, gratis e-böcker och exklusiva erbjudanden!

Klicka här för att prenumerera