Python, som språk, är värdefullt övermått, speciellt när du vill arbeta med strukturerad data. Eftersom människor lagrar mycket data i Excel-filer är det absolut nödvändigt att konsolidera flera filer för att spara tid och ansträngning.

Python låter dig göra precis det; oavsett hur många Excel-filer du vill kombinera kan du göra det relativt enkelt. Med tanke på dess utbud av bibliotek och tredjepartsresurser kan du importera och använda Pythons mångfacetterade verktyg för att göra dina bud.

I den här guiden måste du installera och använda Pandas-biblioteken för att importera data till Python innan du konsoliderar dem.

Installera Pandas Libraries i Python

Pandas är ett tredjepartsbibliotek som du kan installera i Python. Vissa IDE: er har redan Pandas installerade i sig.

Om du använder en IDE-version som inte kommer med förinstallerade pandor, var säker, du kan installera den direkt i Python.

Så här installerar du Pandas:

pip installera pandor

Om du använder Jupyter Notebook kan du installera Pandas direkt med

instagram viewer
PIP-kommando. Oftast, när du har installerat Jupyter med Anaconda, finns det stora chanser att redan ha Pandas tillgängliga för direkt användning.

Om du inte kan ringa Pandas kan du använda kommandot ovan för att installera dem direkt.

Kombinera Excel-filer med Python

Först måste du skapa en mapp på din föredragna plats med alla Excel-filer. När mappen är klar kan du börja skriva koden för att importera biblioteken.

Du kommer att använda två variabler i den här koden:

  1. Pandas: Pandas-biblioteket tillhandahåller dataramar för att lagra Excel-filer.
  2. OS: Biblioteket är användbart för att läsa data från din maskins mapp

För att importera dessa bibliotek, använd dessa kommandon:

Importera pandor som pd
Importera OS
  • Importera: Python-syntax som används för att importera biblioteken i Python
  • Pandas: Bibliotekets namn
  • pd: Alias ​​som ges till biblioteket
  • OS: Ett bibliotek för att komma åt systemmappen

När du har importerat biblioteken, skapa två variabler för att lagra indata- och utdatafilens sökväg. Inmatningsfilens sökväg behövs för att komma åt filernas mapp. Utdatafilens sökväg är nödvändig eftersom den kombinerade filen kommer att exporteras dit.

Om du använder Python, se till att du ändrar snedstrecket till framåt-snedstreck (\ till /)

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel-filer/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

Lägg till / i slutet också för att slutföra banorna.

Mappens filer finns tillgängliga i en lista. Skapa en lista för att lagra alla filreferenser för inmatningsmappen med hjälp av listdir funktion från OS bibliotek.

Om du är osäker på vilka funktioner som finns tillgängliga i ett bibliotek kan du använda dir funktion med biblioteksnamnet. Till exempel, för att kontrollera den exakta versionen av listdir-funktionen, kan du använda kommandot enligt följande:

dir (OS)

Utdata kommer att bestå av alla associerade funktioner som är tillgängliga i OS-biblioteket. Listdir-funktionen är en av många funktioner som finns tillgängliga i detta bibliotek.

Skapa en ny variabel för att lagra indatafilerna från mappen.

excel_file_list = os.listdir (input_file_path)

Skriv ut denna variabel för att se namnen på filerna som är lagrade i mappen. Alla filer som lagras i mappen visas när du använder utskriftsfunktionen.

print (excel_file_list)

Därefter måste du lägga till en ny dataram för att lagra varje Excel-fil. Föreställ dig en dataram som en behållare för att lagra data. Här är kommandot för att skapa en dataram.

df = pd. DataFrame()
  • df: Variabel för att lagra värdet på DataFrame
  • pd: Alias ​​för Pandas bibliotek
  • DataFrame: Standardsyntax för att lägga till en dataram

Inmatningsmappen har tre .xlsx filer i detta exempel. Filnamnen är:

Fil1_excel.xlsx
Fil2_excel.xlsx
File3_excel.xlsx

För att öppna varje fil från den här mappen måste du köra en loop. Slingan kommer att köras för var och en av filerna i listan som skapats ovan.

Så här kan du göra det:

för excel_filer i excel_file_list:

Därefter är det nödvändigt att kontrollera filtilläggen eftersom koden endast öppnar XLSX-filer. För att kontrollera dessa filer kan du använda en Om påstående.

Använd slutar med funktion för detta ändamål, enligt följande:

för excel_filer i excel_file_list:

if excel_files.endswith(".xlsx"):

  • excel_filer: Lista med alla filvärden
  • slutar med: Funktion för att kontrollera filtillägget
  • (".xlsx"): Detta strängvärde kan ändras beroende på vad du vill söka efter

Nu när du har identifierat Excel-filerna kan du skapa en ny dataram för att läsa och lagra filerna individuellt.

för excel_filer i excel_file_list:

if excel_files.endswith(".xlsx"):

df1 = pd.read_excel (input_file_path+excel_files)

  • df1: Ny dataram
  • pd: Pandas bibliotek
  • read_excel: Funktion för att läsa Excel-filer i Pandas bibliotek
  • input_file_path: Sökväg till mappen där filerna lagras
  • excel_filer: Vilken variabel som helst som används i for-loopen

För att börja lägga till filerna måste du använda bifoga fungera.

för excel_filer i excel_file_list:

if excel_files.endswith(".xlsx"):

df1 = pd.read_excel (input_file_path+excel_files)
df = df.append (df1)

Slutligen, nu när den konsoliderade dataramen är klar kan du exportera den till utdataplatsen. I det här fallet exporterar du dataramen till en XLSX-fil.

df.to_excel (output_file_path+"Consolidated_file.xlsx")
  • df: Dataram att exportera
  • att_excel: Kommando som används för att exportera data
  • output_file_path: Sökväg definierad för att lagra utdata
  • Consolidated_file.xlsx: Namnet på den konsoliderade filen

Låt oss nu titta på den slutliga koden:

#Pandas används som en dataram för att hantera Excel-filer
importera pandor som pd
importera os

# ändra snedstrecket från "\" till "/", om du använder Windows-enheter

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel-filer/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

#skapa en lista för att lagra alla filreferenser för inmatningsmappen med hjälp av listdir-funktionen från OS-biblioteket.
#För att se innehållet i ett bibliotek (som listdir-funktionen kan du använda dir-funktionen på biblioteksnamnet).
#Använd dir (library_name) för att lista innehåll

excel_file_list = os.listdir (input_file_path)

#skriv ut alla filer som finns lagrade i mappen efter att ha definierat listan
excel_file_list

#När varje fil öppnas, använd appen tillägg för att börja konsolidera data som lagras i flera filer

#skapa en ny, tom dataram för att hantera excel-filimporterna
df = pd. DataFrame()

#Kör en för loop till loop genom varje fil i listan
för excel_filer i excel_file_list:
#check endast efter .xlsx-suffixfiler
if excel_files.endswith(".xlsx"):
#skapa en ny dataram för att läsa/öppna varje Excel-fil från listan över filer som skapats ovan
df1 = pd.read_excel (input_file_path+excel_files)
#lägg till varje fil i den ursprungliga tomma dataramen
df = df.append (df1)

#transfer slutlig utdata till en Excel-fil (xlsx) på utdatasökvägen
df.to_excel (output_file_path+"Consolidated_file.xlsx")

Använda Python för att kombinera flera Excel-arbetsböcker

Pythons Pandas är ett utmärkt verktyg för både nybörjare och avancerade användare. Biblioteket används flitigt av utvecklare som vill behärska Python.

Även om du är nybörjare kan du få enorma fördelar genom att lära dig nyanserna av Pandas och hur biblioteket används inom Python.

6 Panda-operationer för nybörjare

Få kläm på Pandas med dessa nybörjaroperationer.

Läs Nästa

Dela med sigTweetE-post
Relaterade ämnen
  • Programmering
  • Pytonorm
  • Microsoft excel
  • Kalkylblad
Om författaren
Gaurav Siyal (59 artiklar publicerade)

Gaurav Siyal har två års erfarenhet av att skriva, skriva för en rad digitala marknadsföringsföretag och programvarulivscykeldokument.

Mer från Gaurav Siyal

Prenumerera på vårt nyhetsbrev

Gå med i vårt nyhetsbrev för tekniska tips, recensioner, gratis e-böcker och exklusiva erbjudanden!

Klicka här för att prenumerera