2016-04-07 37 views
0

'daki iki veri kümesi arasındaki negatif eşleşme istatistiklerde hala yeniyim ve 19000 ve 18000 satırları içeren iki veri kümesi arasında negatif eşleşme bulunmasında sorun yaşıyorum. Ben unix içinde R veya unix

diff -u file1 file2 

çalıştı ama hat sayısı doğru değil bu yüzden diff bazı kısaltılmış sözdizimi kullanıyor. Ayrıca tüm satırları dosya2'den döndürdüğüm de

. R ve unix kullanıyorum, bu yüzden herhangi bir yardım iyidir! Ne almak istiyorum listesidir

File1 a b c d f g h i 
File2 a b c e f g j k 

şuna benzer olduğunu:

d 
e 
h 
j 
i 
k 

cevap

1

Sen deneyebilirsiniz: için

setdiff(c(File1, File2), intersect(File1,File2)) 
[1] "d" "h" "i" "e" "j" "k" 
0

bak benim verileri bu gibi göründüğünü varsayalım benzersiz çizgiler

sort file1 file2 | uniq -u