Vad är predict() i R?
Med funktionen predict() i R kan du göra förutsägelser för nya, osedda data. Denna funktion är ett viktigt verktyg för maskininlärning.
Vad används predict() i R till?
R-funktionen predict() är ett mångsidigt verktyg som används i prediktiv modellering. Den genererar förutsägelser för nya eller befintliga datapunkter baserat på tidigare utformade statistiska modeller, såsom linjär regression, logisk regression, beslutsträd och andra modelleringstekniker.
Vad är syntaxen för predict() i R?
R:s funktion predict() tar som argument en tränad modell och de datapunkter som förutsägelsen ska tillämpas på. Du kan ange olika alternativ och parametrar baserat på vilken typ av modell som används. Resultatet är en vektor med förutsägelser som kan vara användbar för olika analytiska ändamål, inklusive utvärdering av en modells prestanda, beslutsfattande eller illustration av de resulterande uppgifterna.
predict(object, newdata, interval)Robject: Den tränade modellen som förutsägelserna tillämpas pånewdata: Datapunkten för förutsägelseninterval: Valfritt argument för att ange typen av konfidensintervall (confidenceför medelvärdesintervall,predictionför förutsägelser)
Exempel på hur man använder predict() i R
Följande exempel illustrerar hur funktionen predict() i R fungerar. Vi använder en användardefinierad datamängd med värden för hastighet och avstånd.
Skapa och visa data
# Creating a data frame with custom speed and distance values
custom_data <- data.frame(speed = c(15, 20, 25, 30, 35),
distance = c(30, 40, 50, 60, 70))
# Displaying the custom data frame
print("Custom Data Frame:")
print(custom_data)RFörst skapar vi en användardefinierad datamängd för att utvärdera sambandet mellan hastighet och avstånd. Vi använder funktionen data.frame() för att skapa en dataram och definierar sedan värdena för variablerna speed och distance som c(15, 20, 25, 30, 35) respektive c(30, 40, 50, 60, 70).
När vi har skapat datauppsättningen visar vi den med hjälp av funktionen print(). På så sätt kan vi kontrollera strukturen och de tilldelade värdena i vår nya dataram.
Utgång:
"Custom Data Frame:"
speed distance
1 15 30
2 20 40
3 25 50
4 30 60
5 35 70RSkapa en linjär modell
# Creating a linear model for the custom data frame
custom_model <- lm(distance ~ speed, data = custom_data)
# Printing the model results
print("Model Results:")
print(summary(custom_model))RUtgång:
"Model Results:"
Call:
lm(formula = distance ~ speed, data = custom_data)
Residuals:
1 2 3 4 5
-2 -1 1 0 2
Coefficients:
(Intercept) -10.00 15.81 -0.632 0.55897
speed 2.00 0.47 4.254 0.01205RI resultatet ser vi en linjär modell (custom_model) som genererades för datauppsättningen och modellerar förhållandet mellan hastighet och avstånd. Vi får resultatet av modellen, inklusive koefficienter och statistisk information.
Definiera nya hastighetsvärden och göra förutsägelser
# Creating a data frame with new speed values
new_speed_values <- data.frame(speed = c(40, 45, 50, 55, 60))
# Predicting future distance values using the linear model
predicted_distance <- predict(custom_model, newdata = new_speed_values)RVi har nu skapat en ny datamängd (new_speed_values) med nya värden för hastighet. Sedan använde vi R predict() för att göra förutsägelser för motsvarande avståndsvärden med hjälp av den linjära modell vi skapade ovan.
Visa förutsägelserna
# Displaying the predicted values
print("Predicted Distance Values:")
print(predicted_distance)RUtmatningen visar avståndsvärdena som förutsägs baserat på hastigheten:
"Predicted Distance Values:"
1 2 3 4 5
80.0000 90.0000 100.0000 110.0000 120.0000R
