Python -funk­tio­nen pandas DataFrame.isna() hjälper användare att iden­ti­fi­e­ra saknade data (NaN eller None) i en DataFrame. Detta kan vara särskilt an­vänd­bart för att se om data behöver rensas innan analysen påbörjas.

Vad är syntaxen för pandas isna()?

Eftersom pandas isna() inte tar några pa­ra­met­rar är dess syntax ganska enkel:

DataFrame.isna()
python

Hur man använder funk­tio­nen pandas isna()

När isna() tillämpas på en DataFrame skapas en ny DataFrame med booleska värden. Om ett värde i den ur­sprung­li­ga DataFrame saknas (t.ex. markerat som NaN eller None) visar isna() True där värdet finns. I annat fall visar funk­tio­nen False.

Notis

Om du, förutom att iden­ti­fi­e­ra NaN eller None värden, också vill ta bort dem, kan du kolla in pandas-funk­tio­nen dropna(). Om du inte vill ta bort dessa värden, utan istället sys­te­ma­tiskt ersätta dem, är funk­tio­nen fillna() ett an­vänd­bart verktyg för detta.

Iden­ti­fi­e­ra saknade värden i en DataFrame

I följande exempel används en DataFrame med data om olika individer, där viss in­for­ma­tion saknas.

import pandas as pd
# Create DataFrame example
data = {
    'Name': ['Alice', 'Bob', None, 'David'],
    'Age': [25, None, 35, 40],
    'City': ['Nottingham', 'London', 'Cardiff', None]
}
df = pd.DataFrame(data)
print(df)
python

DataFrame ser ut så här:

Name   Age         City
0  Alice  25.0     Nottingham
1    Bob   NaN  	London
2   None  35.0      Cardiff
3  David  40.0         None

Den in­for­ma­tion som saknas har markerats som None eller NaN. För att se exakt vilka värden som saknas kan du ringa isna() på DataFrame.

# Applying  pandas isna()
missing_values = df.isna()
print(missing_values)
python

Funk­tions­an­ro­pet re­tur­ne­rar en ny DataFrame, där saknade värden från ori­gi­nal­da­ta markeras som True, medan värden som finns markeras som False. Här är re­sul­ta­tet:

Name    Age   City
0  False  False  False
1  False   True  False
2   True  False  False
3  False  False   True

Räkna antalet saknade värden per kolumn

Det kan också vara an­vänd­bart att veta hur många värden som saknas i varje kolumn för att hjälpa dig att bestämma hur du ska hantera dem. Du kan använda isna() till­sam­mans med Pythons sum() för att räkna antalet saknade värden i varje kolumn.

# Count missing values per column
missing_count = df.isna().sum()
print(missing_count)
python

Detta visar antalet saknade värden i varje kolumn:

Name     1
Age      1
City     1
dtype: int64
Gå till huvudmeny