İkili verilerim var Aşağıda, örnek veriler üzerinde bir sağkalım analizi yapmaya çalışıyorum. n
, her gruptaki, zaman, hata göstergesi kombinasyonundaki birimlerin sayısıdır.İkili verilerde sağkalım
> df <- structure(list(group = structure(c(2L, 2L, 2L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 3L), .Label = c("", "A", "B"), class = "factor"), t = c(0L, 1L, 2L, 3L, 1L, 2L, 3L, 0L, 1L, 2L, 3L, 1L, 2L, 3L), failure = c(0L, 0L, 0L, 0L, 1L, 1L, 1L, 0L, 0L, 0L, 0L, 1L, 1L, 1L), n = c(40000L, 30000L, 20000L, 10000L, 5L, 4L, 3L, 20000L, 15000L, 14000L, 11000L, 10L, 6L, 4L)), .Names = c("group", "t", "failure", "n"), row.names = c(NA, 14L), class = "data.frame")
> df
group t failure n
1 A 0 0 40000
2 A 1 0 30000
3 A 2 0 20000
4 A 3 0 10000
5 A 1 1 5
6 A 2 1 4
7 A 3 1 3
8 B 0 0 20000
9 B 1 0 15000
10 B 2 0 14000
11 B 3 0 11000
12 B 1 1 10
13 B 2 1 6
14 B 3 1 4
bundan emin N kolonuyla rep
df her bir satır bir birimdir:
> library(survival)
> df2 <- df[rep(rownames(df),df$n),]
> sfit <- survfit(Surv(t,failure)~group, data = df2)
Ancak, benim gerçek veri yaklaşık 10 milyon adet vardır (ref How do I create a survival object in R?.). 10 milyon satırlık veri çerçevesi oluşturmaktan kaçınmak için bir sayım/frekans değişkeni ile hayatta kalmanın bir yolu var mı?
İyi cevap, ancak tüm regresyon fonksiyonları "ağırlıkları kullanmak bir uyarı olmalıdır "parametre aynı şekilde. Bunlar "çoğaltma" ağırlıklarıdır. –
42. katılıyorum, ağırlıkların açıklamasını (survfit.formula altında) bulamadım: "Ağırlıklar negatif olmalı ve kesinlikle ağır olmalıdır, çünkü sıfır ağırlıklar belirsizdir. altkümenin argümanı. " – bigjim