regresie multiplă (liniară)

r oferă suport cuprinzător pentru regresie liniară multiplă. Subiectele de mai jos sunt furnizate în ordinea creșterii complexității.

Montarea Model

# Multiple Linear Regression Example
fit <- lm(y ~ x1 + x2 + x3, data=mydata)
summary(fit) # show results

Diagnostic Parcele

Diagnostic parcele oferă controale pentru heteroscedasticitatea, normalitate, și influente observerations.,

# diagnostic plots
layout(matrix(c(1,2,3,4),2,2)) # optional 4 graphs/page
plot(fit)

click pentru a vedea

Pentru o mai cuprinzătoare evaluare de model se potrivesc vedea regresie diagnosticare sau exercițiile din acest curs interactiv pe regresie.

compararea modelelor

puteți compara modelele imbricate cu funcția anova (). Următorul cod oferă un test simultan pe care x3 și x4 îl adaugă predicției liniare deasupra și dincolo de x1 și x2.

# compare models
fit1 <- lm(y ~ x1 + x2 + x3 + x4, data=mydata)
fit2 <- lm(y ~ x1 + x2)
anova(fit1, fit2)

validarea încrucișată

puteți face validarea încrucișată K-Fold folosind cv-ul.lm () funcția în pachetul DAAG.,

# K-fold cross-validation
library(DAAG)
cv.lm(df=mydata, fit, m=3) # 3 fold cross-validation

Sumați MSE pentru fiecare pliu, împărțiți la numărul de observații și luați rădăcina pătrată pentru a obține eroarea standard de estimare validată încrucișat.

puteți evalua contracția R2 prin validarea încrucișată K-fold. Folosind crossval() funcția de bootstrap pachet, face următoarele:

Variabila de Selecție

Selectarea unui subset de variabile predictor dintr-un set mai mare (de exemplu, în trepte de selecție) este un subiect controversat. Puteți efectua selecția în trepte (înainte, înapoi, ambele) folosind funcția stepAIC () din pachetul de masă., stepAIC () efectuează selectarea modelului în trepte prin AIC exact. în mod alternativ, puteți efectua regresia tuturor subseturilor utilizând funcția leaps () din pachetul leaps. În următorul cod nbest indică numărul de subseturi din fiecare dimensiune de raportat. Aici, cele mai bune zece modele vor fi raportate pentru fiecare dimensiune subset (1 predictor, 2 predictori, etc.).

click pentru a vedea

Alte opțiuni pentru complot( ) sunt bic, Cp, și adjr2. Alte opțiuni pentru trasarea cu
subset () sunt bic, cp, addr2 și rss.,

importanța relativă

pachetul relaimpo oferă măsuri de importanță relativă pentru fiecare dintre predictorii din model. A se vedea Ajutor(calc.relimp) pentru detalii privind cele patru măsuri de importanță relativă furnizate.

click pentru a vedea

Grafic Îmbunătățiri,

masina pachet oferă o mare varietate de terenuri pentru regresie, inclusiv a adăugat variabilă parcele, și îmbunătățită de diagnostic și Scatterplots.

Mergând mai departe

regresie neliniară

pachetul nls oferă funcții pentru regresie neliniară., A se vedea regresie neliniară John Fox și cel neliniar pătrate pentru o imagine de ansamblu. Huet și instrumentele statistice ale colegilor pentru regresia neliniară: un ghid practic cu exemple S-PLUS și R este o carte de referință valoroasă.

regresie robustă

există multe funcții în R pentru a ajuta la regresia robustă. De exemplu, puteți efectua o regresie robustă cu funcția rlm( ) din pachetul de masă. John Fox (cine altcineva?) Regresia robustă oferă o imagine de ansamblu bună. Site-ul web UCLA Statistical Computing are Exemple robuste de regresie., pachetul robust oferă o bibliotecă cuprinzătoare de metode robuste, inclusiv regresie. Pachetul robustbase oferă, de asemenea, statistici robuste de bază, inclusiv metode de selecție a modelelor. Și David Olive a oferit o revizuire on-line detaliată a statisticilor robuste aplicate cu codul R eșantion. acest curs de învățare automată în R include exerciții în regresie multiplă și validare încrucișată.

Author: admin

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *