Hur man laddar filer i Python med pandas read_csv()
Python pandas read_csv() är en av de vanligaste metoderna för att läsa in CSV-filer i pandas och lagra dem som DataFrames. CSV-filer (kommaseparerade värden) är ett vanligt format för lagring av tabelldata och stöds av många applikationer.
Vad är syntaxen för Python pandas read_csv()?
pandas.read_csv() skapar en pandas DataFrame från en CSV-fil. Den grundläggande syntaxen för funktionen ser ut så här:
import pandas as pd
df = pd.read_csv(filepath_or_buffer, sep=',', header='infer', names=None, index_col=None, usecols=None, dtype=None, ...)pythonVilka är de viktigaste parametrarna för pandas.read_csv()?
pandas.read_csv() kan acceptera en mängd olika parametrar. För att göra det enkelt fokuserar vi på de viktigaste argumenten. Här är en översikt över de viktigaste parametrarna som du kan använda för att ange hur funktionen ska fungera:
| Parameter | Betydelse | Standardvärde |
|---|---|---|
filepath_or_buffer
|
Detta är en Python-sträng som representerar sökvägen till CSV-filen eller en databuffert, till exempel en URL. | |
sep
|
Detta anger avgränsaren mellan värden. | ,
|
header
|
Anger vilken rad som ska användas som rubrik. | infer (första raden)
|
names
|
Om header=None är inställt kan du använda names för att ange en Python-lista med kolumnnamn.
|
|
index_col
|
Bestämmer vilken kolumn som ska användas som index. | None
|
usecols
|
Med denna parameter kan du välja vilka kolumner du vill ladda in i DataFrame. | None
|
dtype
|
Anger datatypen för kolumnerna. | None
|
Du hittar en omfattande lista över parametrarna för denna funktion i pandas-dokumentationen.
Hur man öppnar CSV-filer steg för steg
Med pandas.read_csv() kan du enkelt överföra data från CSV-filer till Python i bara några få steg.
I följande exempel kommer vi att arbeta med en CSV-fil som är strukturerad enligt följande:
1,John Avery,35,Nottingham,50000
2,Adelaide Smith,29,London,62000
3,Michael Rivera,41,Cardiff,40000
4,Grace Kim,33,Hull,35000
5,Tyler Johnson,28,Kent,52000Steg 1: Importera pandas
Importera först pandas-biblioteket till ditt Python-skript.
import pandas as pdpythonSteg 2: Ladda CSV-filen
Nu kan du ladda din CSV-fil till Python pandas med hjälp av funktionen read_csv(). Skicka bara filvägen till funktionen. I följande kod använder vi en fil med namnet data.csv, som är sparad i samma katalog som skriptet:
df = pd.read_csv('data.csv')pythonKoden ovan lagrar filen i ett DataFrame-objekt (df), som vi sedan kan arbeta med. Pandas tolkar automatiskt den första raden som kolumnrubriker om du inte anger något annat.
Steg 3: Visa CSV-filen
Det är en bra idé att titta på de första raderna i DataFrame för att kontrollera att filen har laddats korrekt. Du kan använda funktionen DataFrame.head() för detta. Som standard visar den de första fem raderna i DataFrame, vilket ger dig en snabb översikt över datastrukturen:
print(df.head())pythonResultatet ser ut så här:
0 1 John Avery 35 Nottingham 50000
1 2 Adelaide Smith 29 London 62000
2 3 Michael Rivera 41 Cardiff 40000
3 4 Grace Kim 33 Hull 35000
4 5 Tyler Johnson 28 Kent 52000Steg 4: Ändra kolumnnamnen (valfritt)
Om din CSV-fil inte har en rubrikrad kan du definiera kolumnnamnen manuellt:
df = pd.read_csv('data.csv', header=None, names=['ID', 'Name', 'Age', 'City', 'Salary'])pythonI det här exemplet har vi namngett kolumnerna ID, Namn, Ålder, Stad och Lön. Resultatet ser ut så här:
ID Name Age City Salary
0 1 John Avery 35 Nottingham 50000
1 2 Adelaide Smith 29 London 62000
2 3 Michael Rivera 41 Cardiff 40000
3 4 Grace Kim 33 Hull 35000
4 5 Tyler Johnson 28 Kent 52000