Yalnızca yılda en çok kez görünen konuları tutmak istediğim panel verilerini (konu/yıl) kullanıyorum. Veri kümesi büyük olduğundan data.table paketini kullanıyorum. Aşağıda denediğimden daha zarif bir çözüm var mı?R data.table sayım paneli verileri
library(data.table)
DT <- data.table(SUBJECT=c(rep('John',3), rep('Paul',2),
rep('George',3), rep('Ringo',2),
rep('John',2), rep('Paul',4),
rep('George',2), rep('Ringo',4)),
YEAR=c(rep(2011,10), rep(2012,12)),
HEIGHT=rnorm(22),
WEIGHT=rnorm(22))
DT
DT[, COUNT := .N, by='SUBJECT,YEAR']
DT[, MAXCOUNT := max(COUNT), by='YEAR']
DT <- DT[COUNT==MAXCOUNT]
DT <- DT[, c('COUNT','MAXCOUNT') := NULL]
DT
Öyleyse, temel olarak, her bir veri için en çok veri açısından zengin olan tüm verilerden bir data.table ister misiniz? –
Bunu düşünmeye gelince, 'data.table'' j' ifadelerinde olduğu gibi ''' ifadesinde aynı' '' yeteneklerin bazılarına sahip olsaydı iyi olurdu. –