R veya unix

'daki iki veri kümesi arasındaki negatif eşleşme istatistiklerde hala yeniyim ve 19000 ve 18000 satırları içeren iki veri kümesi arasında negatif eşleşme bulunmasında sorun yaşıyorum. Ben unix içinde R veya unix

diff -u file1 file2

çalıştı ama hat sayısı doğru değil bu yüzden diff bazı kısaltılmış sözdizimi kullanıyor. Ayrıca tüm satırları dosya2'den döndürdüğüm de

. R ve unix kullanıyorum, bu yüzden herhangi bir yardım iyidir! Ne almak istiyorum listesidir

File1 a b c d f g h i 
File2 a b c e f g j k

şuna benzer olduğunu:

d 
e 
h 
j 
i 
k

kaynak

2016-04-07 Doro

Sen deneyebilirsiniz: için

setdiff(c(File1, File2), intersect(File1,File2)) 
[1] "d" "h" "i" "e" "j" "k"

kaynak

2016-04-07 10:16:21 DatamineR

bak benim verileri bu gibi göründüğünü varsayalım benzersiz çizgiler

sort file1 file2 | uniq -u

kaynak

2016-04-07 21:24:19

cevap

İlgili konular