Python pandas read_csv() är en av de van­li­gas­te metoderna för att läsa in CSV-filer i pandas och lagra dem som Da­taFrames. CSV-filer (kom­ma­se­pa­re­ra­de värden) är ett vanligt format för lagring av ta­bell­da­ta och stöds av många ap­pli­ka­tio­ner.

Vad är syntaxen för Python pandas read_csv()?

pandas.read_csv() skapar en pandas DataFrame från en CSV-fil. Den grund­läg­gan­de syntaxen för funk­tio­nen ser ut så här:

import pandas as pd
df = pd.read_csv(filepath_or_buffer, sep=',', header='infer', names=None, index_col=None, usecols=None, dtype=None, ...)
python

Vilka är de vik­ti­gas­te pa­ra­met­rar­na för pandas.read_csv()?

pandas.read_csv() kan acceptera en mängd olika pa­ra­met­rar. För att göra det enkelt fokuserar vi på de vik­ti­gas­te ar­gu­men­ten. Här är en översikt över de vik­ti­gas­te pa­ra­met­rar­na som du kan använda för att ange hur funk­tio­nen ska fungera:

Parameter Betydelse Stan­dard­vär­de
filepath_or_buffer Detta är en Python-sträng som re­pre­sen­te­rar sökvägen till CSV-filen eller en da­ta­buf­fert, till exempel en URL.
sep Detta anger av­grän­sa­ren mellan värden. ,
header Anger vilken rad som ska användas som rubrik. infer (första raden)
names Om header=None är inställt kan du använda names för att ange en Python-lista med ko­lumn­namn.
index_col Bestämmer vilken kolumn som ska användas som index. None
usecols Med denna parameter kan du välja vilka kolumner du vill ladda in i DataFrame. None
dtype Anger datatypen för ko­lum­ner­na. None

Du hittar en om­fat­tan­de lista över pa­ra­met­rar­na för denna funktion i pandas-do­ku­men­ta­tio­nen.

Hur man öppnar CSV-filer steg för steg

Med pandas.read_csv() kan du enkelt överföra data från CSV-filer till Python i bara några få steg.

I följande exempel kommer vi att arbeta med en CSV-fil som är struk­tu­re­rad enligt följande:

1,John Avery,35,Nottingham,50000
2,Adelaide Smith,29,London,62000
3,Michael Rivera,41,Cardiff,40000
4,Grace Kim,33,Hull,35000
5,Tyler Johnson,28,Kent,52000

Steg 1: Importera pandas

Importera först pandas-bib­li­o­te­ket till ditt Python-skript.

import pandas as pd
python

Steg 2: Ladda CSV-filen

Nu kan du ladda din CSV-fil till Python pandas med hjälp av funk­tio­nen read_csv(). Skicka bara filvägen till funk­tio­nen. I följande kod använder vi en fil med namnet data.csv, som är sparad i samma katalog som skriptet:

df = pd.read_csv('data.csv')
python

Koden ovan lagrar filen i ett DataFrame-objekt (df), som vi sedan kan arbeta med. Pandas tolkar au­to­ma­tiskt den första raden som ko­lumn­ru­bri­ker om du inte anger något annat.

Steg 3: Visa CSV-filen

Det är en bra idé att titta på de första raderna i DataFrame för att kon­trol­le­ra att filen har laddats korrekt. Du kan använda funk­tio­nen DataFrame.head() för detta. Som standard visar den de första fem raderna i DataFrame, vilket ger dig en snabb översikt över da­ta­struk­tu­ren:

print(df.head())
python

Re­sul­ta­tet ser ut så här:

0  1        John Avery   35      Nottingham  	50000
1  2    Adelaide Smith   29   	 London 	    62000
2  3   Michael Rivera    41      Cardiff	   	40000
3  4        Grace Kim    33      Hull 		    35000
4  5    Tyler Johnson    28      Kent   		52000

Steg 4: Ändra ko­lumn­nam­nen (valfritt)

Om din CSV-fil inte har en rubrikrad kan du definiera ko­lumn­nam­nen manuellt:

df = pd.read_csv('data.csv', header=None, names=['ID', 'Name', 'Age', 'City', 'Salary'])
python

I det här exemplet har vi namngett ko­lum­ner­na ID, Namn, Ålder, Stad och Lön. Re­sul­ta­tet ser ut så här:

ID                Name    	Age            City    	Salary
0  1          John Avery    	35        Nottingham    50000
1  2     Adelaide Smith    	29    	London        62000
2  3    Michael Rivera    	41        Cardiff    	40000
3  4          Grace Kim    	33        Hull        	35000
4  5     Tyler Johnson    	28        Kent        52000
Gå till huvudmeny