Hur man laddar filer i Python med pandas read_csv()

Innehåll

Python pandas read_csv() är en av de vanligaste metoderna för att läsa in CSV-filer i pandas och lagra dem som DataFrames. CSV-filer (kommaseparerade värden) är ett vanligt format för lagring av tabelldata och stöds av många applikationer.

Vad är syntaxen för Python pandas `read_csv()`?

pandas.read_csv() skapar en pandas DataFrame från en CSV-fil. Den grundläggande syntaxen för funktionen ser ut så här:

import pandas as pd
df = pd.read_csv(filepath_or_buffer, sep=',', header='infer', names=None, index_col=None, usecols=None, dtype=None, ...)

python

Vilka är de viktigaste parametrarna för `pandas.read_csv()`?

pandas.read_csv() kan acceptera en mängd olika parametrar. För att göra det enkelt fokuserar vi på de viktigaste argumenten. Här är en översikt över de viktigaste parametrarna som du kan använda för att ange hur funktionen ska fungera:

Parameter	Betydelse	Standardvärde
`filepath_or_buffer`	Detta är en Python-sträng som representerar sökvägen till CSV-filen eller en databuffert, till exempel en URL.
`sep`	Detta anger avgränsaren mellan värden.	`,`
`header`	Anger vilken rad som ska användas som rubrik.	`infer` (första raden)
`names`	Om `header=None` är inställt kan du använda `names` för att ange en Python-lista med kolumnnamn.
`index_col`	Bestämmer vilken kolumn som ska användas som index.	`None`
`usecols`	Med denna parameter kan du välja vilka kolumner du vill ladda in i DataFrame.	`None`
`dtype`	Anger datatypen för kolumnerna.	`None`

Du hittar en omfattande lista över parametrarna för denna funktion i pandas-dokumentationen.

Hur man öppnar CSV-filer steg för steg

Med pandas.read_csv() kan du enkelt överföra data från CSV-filer till Python i bara några få steg.

I följande exempel kommer vi att arbeta med en CSV-fil som är strukturerad enligt följande:

1,John Avery,35,Nottingham,50000
2,Adelaide Smith,29,London,62000
3,Michael Rivera,41,Cardiff,40000
4,Grace Kim,33,Hull,35000
5,Tyler Johnson,28,Kent,52000

Steg 1: Importera pandas

Importera först pandas-biblioteket till ditt Python-skript.

import pandas as pd

python

Steg 2: Ladda CSV-filen

Nu kan du ladda din CSV-fil till Python pandas med hjälp av funktionen read_csv(). Skicka bara filvägen till funktionen. I följande kod använder vi en fil med namnet data.csv, som är sparad i samma katalog som skriptet:

df = pd.read_csv('data.csv')

python

Koden ovan lagrar filen i ett DataFrame-objekt (df), som vi sedan kan arbeta med. Pandas tolkar automatiskt den första raden som kolumnrubriker om du inte anger något annat.

Steg 3: Visa CSV-filen

Det är en bra idé att titta på de första raderna i DataFrame för att kontrollera att filen har laddats korrekt. Du kan använda funktionen DataFrame.head() för detta. Som standard visar den de första fem raderna i DataFrame, vilket ger dig en snabb översikt över datastrukturen:

print(df.head())

python

Resultatet ser ut så här:

0  1        John Avery   35      Nottingham  	50000
1  2    Adelaide Smith   29   	 London 	    62000
2  3   Michael Rivera    41      Cardiff	   	40000
3  4        Grace Kim    33      Hull 		    35000
4  5    Tyler Johnson    28      Kent   		52000

Steg 4: Ändra kolumnnamnen (valfritt)

Om din CSV-fil inte har en rubrikrad kan du definiera kolumnnamnen manuellt:

df = pd.read_csv('data.csv', header=None, names=['ID', 'Name', 'Age', 'City', 'Salary'])

python

I det här exemplet har vi namngett kolumnerna ID, Namn, Ålder, Stad och Lön. Resultatet ser ut så här:

ID                Name    	Age            City    	Salary
0  1          John Avery    	35        Nottingham    50000
1  2     Adelaide Smith    	29    	London        62000
2  3    Michael Rivera    	41        Cardiff    	40000
3  4          Grace Kim    	33        Hull        	35000
4  5     Tyler Johnson    	28        Kent        52000

Relaterade artiklar

BEST-BACKGROUNDSShutterstock

Hur man loopar genom DataFrames med pandas iterrows()

Pandas DataFrame.iterrows() är en användbar funktion för att loopa igenom rader i en DataFrame, särskilt när du behöver bearbeta data rad för rad. Detta är särskilt användbart för beräkningar eller villkorslogik. I den här artikeln går vi igenom syntaxen för panda iterrows() och…

Läs mer

Mr. Kosalshutterstock

Hur man indexerar pandas DataFrames

Pandas DataFrame-indexering är ett kraftfullt verktyg för effektiv och ändamålsenlig datahantering. Med olika metoder kan du rikta in dig på specifika data och delmängder i din DataFrame. I den här artikeln ska vi undersöka vad pandas DataFrame-index är, hur man får åtkomst till…

Läs mer

BEST-BACKGROUNDSShutterstock

Hur man rensar data i pandas med dropna()

Pandas-funktionen DataFrame.dropna() är ett kraftfullt verktyg för att rensa datamängder. Funktionen tar effektivt bort saknade värden och kan användas med olika parametrar, vilket gör det möjligt för programmerare att ange olika krav för datarensning. Lär dig mer om syntaxen,…

Läs mer

Mr. Kosalshutterstock

Vad är Python pandas any() och hur fungerar det?

I pandas är metoden DataFrame any() ett effektivt verktyg för att snabbt kontrollera om det finns minst ett sant värde längs en axel i en DataFrame. Denna metod är särskilt användbar för dataanalys och validering. I den här artikeln visar vi dig syntaxen för denna funktion, hur…

Läs mer

ESB Professionalshutterstock

Hur man använder Pandas DataFrame för att snabbt manipulera tabeller i Python

Pandas-modulen är ett av de mest kraftfulla verktygen för datahantering i Python. En av de centrala datastrukturerna i Pandas är DataFrame. DataFrames kan användas för att hantera tvådimensionella, strukturerade data på ett effektivt sätt. Vi förklarar datastrukturens uppbyggnad…

Läs mer

UndreyShutterstock

Vad är Python pandas-egenskapen iloc[]?

När man arbetar med DataFrames i Python pandas är inte alla rader eller kolumner i en DataFrame alltid relevanta för dataanalys. Pandas DataFrame-egenskapen iloc[] är ett användbart verktyg för att välja rader eller kolumner med hjälp av deras index. I den här artikeln tittar vi…

Läs mer

Hur man laddar filer i Python med pandas read_csv()

Vad är syntaxen för Python pandas read_csv()?

Vilka är de vik­ti­gas­te pa­ra­met­rar­na för pandas.read_csv()?

Hur man öppnar CSV-filer steg för steg

Steg 1: Importera pandas

Steg 2: Ladda CSV-filen

Steg 3: Visa CSV-filen

Steg 4: Ändra ko­lumn­nam­nen (valfritt)

Vad är syntaxen för Python pandas `read_csv()`?

Vilka är de viktigaste parametrarna för `pandas.read_csv()`?

Steg 4: Ändra kolumnnamnen (valfritt)