Python pandas read_csv() är en av de vanligaste metoderna för att läsa in CSV-filer i pandas och lagra dem som DataFrames. CSV-filer (kommaseparerade värden) är ett vanligt format för lagring av tabelldata och stöds av många applikationer.

Vad är syntaxen för Python pandas read_csv()?

pandas.read_csv() skapar en pandas DataFrame från en CSV-fil. Den grundläggande syntaxen för funktionen ser ut så här:

import pandas as pd
df = pd.read_csv(filepath_or_buffer, sep=',', header='infer', names=None, index_col=None, usecols=None, dtype=None, ...)
python

Vilka är de viktigaste parametrarna för pandas.read_csv()?

pandas.read_csv() kan acceptera en mängd olika parametrar. För att göra det enkelt fokuserar vi på de viktigaste argumenten. Här är en översikt över de viktigaste parametrarna som du kan använda för att ange hur funktionen ska fungera:

Parameter Betydelse Standardvärde
filepath_or_buffer Detta är en Python-sträng som representerar sökvägen till CSV-filen eller en databuffert, till exempel en URL.
sep Detta anger avgränsaren mellan värden. ,
header Anger vilken rad som ska användas som rubrik. infer (första raden)
names Om header=None är inställt kan du använda names för att ange en Python-lista med kolumnnamn.
index_col Bestämmer vilken kolumn som ska användas som index. None
usecols Med denna parameter kan du välja vilka kolumner du vill ladda in i DataFrame. None
dtype Anger datatypen för kolumnerna. None

Du hittar en omfattande lista över parametrarna för denna funktion i pandas-dokumentationen.

Hur man öppnar CSV-filer steg för steg

Med pandas.read_csv() kan du enkelt överföra data från CSV-filer till Python i bara några få steg.

I följande exempel kommer vi att arbeta med en CSV-fil som är strukturerad enligt följande:

1,John Avery,35,Nottingham,50000
2,Adelaide Smith,29,London,62000
3,Michael Rivera,41,Cardiff,40000
4,Grace Kim,33,Hull,35000
5,Tyler Johnson,28,Kent,52000

Steg 1: Importera pandas

Importera först pandas-biblioteket till ditt Python-skript.

import pandas as pd
python

Steg 2: Ladda CSV-filen

Nu kan du ladda din CSV-fil till Python pandas med hjälp av funktionen read_csv(). Skicka bara filvägen till funktionen. I följande kod använder vi en fil med namnet data.csv, som är sparad i samma katalog som skriptet:

df = pd.read_csv('data.csv')
python

Koden ovan lagrar filen i ett DataFrame-objekt (df), som vi sedan kan arbeta med. Pandas tolkar automatiskt den första raden som kolumnrubriker om du inte anger något annat.

Steg 3: Visa CSV-filen

Det är en bra idé att titta på de första raderna i DataFrame för att kontrollera att filen har laddats korrekt. Du kan använda funktionen DataFrame.head() för detta. Som standard visar den de första fem raderna i DataFrame, vilket ger dig en snabb översikt över datastrukturen:

print(df.head())
python

Resultatet ser ut så här:

0  1        John Avery   35      Nottingham  	50000
1  2    Adelaide Smith   29   	 London 	    62000
2  3   Michael Rivera    41      Cardiff	   	40000
3  4        Grace Kim    33      Hull 		    35000
4  5    Tyler Johnson    28      Kent   		52000

Steg 4: Ändra kolumnnamnen (valfritt)

Om din CSV-fil inte har en rubrikrad kan du definiera kolumnnamnen manuellt:

df = pd.read_csv('data.csv', header=None, names=['ID', 'Name', 'Age', 'City', 'Salary'])
python

I det här exemplet har vi namngett kolumnerna ID, Namn, Ålder, Stad och Lön. Resultatet ser ut så här:

ID                Name    	Age            City    	Salary
0  1          John Avery    	35        Nottingham    50000
1  2     Adelaide Smith    	29    	London        62000
2  3    Michael Rivera    	41        Cardiff    	40000
3  4          Grace Kim    	33        Hull        	35000
4  5     Tyler Johnson    	28        Kent        52000
Gå till huvudmeny