Merhabalar: Bir veri çerçevesinde tidyr ve dplyr kullanılarak oluşturulan bir dizi doğrusal modelim var. Aşağıdakine benziyor. Her modelden, sabit bir newdata kümesiyle tahmin edilen değerler üretmeye nasıl başlarım? Gerçekte ben 10 bağımlı değişkenleri, ama sadece iki bağımsız değişkenleriBir dizi doğrusal modelden tahmin edilen değerler
#random data
x1<-rnorm(100, mean=10, sd=5)
x2<-rnorm(100, mean=5, sd=2)
y1<-rnorm(100, mean=5, sd=1)
y2<-rnorm(100, mean=3, sd=1)
#create test data farame
df<-data.frame(y1, y2, x1, x2)
#create models
df%>%
gather(dv, value, y1, y2, -x1,-x2) %>%
group_by(dv)%>%
do(mod=lm(value~x1+x2, data=.))
Benimkinden daha iyi yanıt. Teşekkürler, hala dplyr öğreniyorum ve bu yararlıdır. (Seninki daha zarif ve daha iyi yazıldığından beri cevabımı sildi) –
Bu harika. Verilerin ve yeni veri argümanlarının neden belirtilmesi gerektiğini açıklayabilir misiniz? Bana göre, model orijinal veri çerçevesine (df) uygun olmalı, ancak tahmin edilen değerler newdata (df2) – spindoctor
@ spindoctor ile üretilmelidir. Öngörü için “augment” kullanırken sadece 'newdata' argümanına ihtiyacınız var. – aosmith