2014-07-14 14 views
49

Ben data.table 1.9.3 üzerindeyim ve belki de yanıldım, ama daha önce beklenecek olan hatırlamıyorum.Devralınan verilerle birlikte data.table içine alın.

Ben dta 2 data.tables oluşturmak ve dtb

> dta 
    idx vala fdx 
1: 1 2 a 
2: 2 4 a 
3: 3 6 b 

> dtb 
    idx valb 
1: 1 3 
2: 4 6 

> dput(x = dta) 
structure(list(idx = c(1, 2, 3), vala = c(2, 4, 6), fdx = c("a", 
"a", "b")), .Names = c("idx", "vala", "fdx"), row.names = c(NA, 
-3L), class = c("data.table", "data.frame"), .internal.selfref = 
<pointer: 0x0000000000110788>, sorted = "idx") 

> dput(x = dtb) 
structure(list(idx = c(1, 4), valb = c(3, 6)), .Names = c("idx", 
"valb"), row.names = c(NA, -2L), class = c("data.table", "data.frame" 
), .internal.selfref = <pointer: 0x0000000000110788>, sorted = "idx") 

anahtar her iki durumda da idx olduğunu.

tabii şu işleri,

> dta[dtb, sum(valb)] 
[1] 9 

Ancak bu

> dta[dtb, sum(valb), by = fdx] 
Error in `[.data.table`(dta, dtb, sum(valb), by = fdx) : 
    object 'valb' not found 

değil Ama biz ara adım

> dta[dtb] 
    idx vala fdx valb 
1: 1 2 a 3 
2: 4 NA NA 6 
görürseniz bu

> dta[dtb][, sum(valb), by = fdx] 
    fdx V1 
1: a 3 
2: NA 6 

yapar

ben yanlış gitmiş

dta[dtb, sum(valb), by = fdx] == dta[dtb][, sum(valb), by = fdx] 

beklerdik?

+6

Bu sorunu [FR # 733] olarak yayımladı (https://github.com/Rdatatable/data.table/issues/733). Ayrıca bir ilgili [FR # 732] (https://github.com/Rdatatable/data.table/issues/732) dosyalandı. Teşekkürler. – Arun

+0

Bu davranışı yeniden oluşturabilirim (= hata?) Data.table 1.9.4 de, herhangi bir haber var mı? –

cevap

1

Eğer

dta[dtb, sum(valb), by=fdx] 
ararsanız

library(data.table) 

dta <- data.frame(idx=c(1,2,3), 
        vala=c(2,4,6), 
        fdx=c('a','a','b')) 
dta <- data.table(dta) 

dtb <- data.frame(idx=c(1,4), 
        valb=c(3,6)) 
dtb <- data.table(dtb) 

setkey(dta,idx) 
setkey(dtb,idx) 

Yani

dta[dtb, sum(valb)] 

çağırdığınızda onu, Ancak

tmp <- dta[dtb] 
attach(tmp) 
sum(valb) 
detach(tmp) 

arayarak gibiler Sadece bir tahmin 10

bunun ne tür ek argümanlar ile ne bilmiyor

tmp <- dta[dtb] 
# attach(tmp) : attach doesn't happen 
sum(valb) 
# detach(tmp) : detach doesn't happen 

işlevi çağırarak gibi. Örneğin, bu da bir hata atmak olacaktır:

dta[dtb, class(fdx), sum(valb)] 

Ancak bu tür

tmp <- dta[dtb] 
tmp[, sum(valb), by=fdx] 

Dediğim gibi gibi olan

dta[dtb][, sum(valb), by=fdx] 

işleri bu kadar sadece bir tahmin olduğunu işlev neden beklendiği gibi çalışmayabilir.