I Python pandas kan du använda funk­tio­nen unique() för att iden­ti­fi­e­ra unika värden i en kolumn i en DataFrame. Detta gör det enkelt att få en snabb överblick över de olika värdena i din dataset.

Vad är syntaxen för pandas DataFrame[].unique()?

Den grund­läg­gan­de syntaxen för att använda pandas unique() är enkel. Detta beror på att funk­tio­nen inte tar några pa­ra­met­rar:

DataFrame['column_name'].unique()
python

Tänk på att unique() endast kan tillämpas på en kolumn. Innan du anropar funk­tio­nen måste du ange vilken kolumn du vill utvärdera. Funk­tio­nen unique() re­tur­ne­rar en numpy-matris som in­ne­hål­ler alla olika värden i den ordning de visas, med du­pli­ce­ra­de värden i kolumnen borttagna. Den sorterar dock inte värdena.

Notis

Om du har arbetat med Python ett tag kanske du känner till numpy-mot­sva­rig­he­ten till pandas unique(). Av ef­fek­ti­vi­tets­skäl är pandas-versionen i allmänhet att föredra.

Hur man använder pandas DataFrame[].unique()

För att använda unique() i en pandas DataFrame måste du först ange vilken kolumn du vill kon­trol­le­ra. I följande exempel använder vi en DataFrame som in­ne­hål­ler in­for­ma­tion om ålder och hemort för en grupp individer.

import pandas as pd
# Create a sample DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
    'Age': [24, 27, 22, 32, 29],
    'City': ['Newcastle', 'London', 'Newcastle', 'Cardiff', 'London']
}
df = pd.DataFrame(data)
print(df)
python

Den re­sul­te­ran­de DataFrame ser ut så här:

Name  	Age       City
0    Alice    	24    	Newcastle
1    Bob    	27  		London
2  Charlie    	22    	Newcastle
3    David    	32    	Cardiff
4   Edward    	29  		London

Låt oss nu säga att vi vill skapa en lista över alla städer där per­so­ner­na i DataFrame bor. Vi kan tillämpa pandas unique() på kolumnen som in­ne­hål­ler städerna.

# Find different cities
unique_cities = df['City'].unique()
print(unique_cities)
python

Re­sul­ta­tet är en numpy-matris som listar varje stad en gång och visar att in­di­vi­der­na i DataFrame kommer från totalt tre städer: Newcastle, London och Cardiff.

['Newcastle' 'London' 'Cardiff']
Gå till huvudmeny