Farz edelim Tek bir boyut veri kümesine sahibiz, birçok aynı sayıyı içerir, örneğin veri seti S = c(rep(4, times(1000)), rep(5, times(808)), rep(9, times(990)))
. R'de k-aracı yapmak için etkili yollar var mı? Aslında verilerimde sadece yaklaşık 20 farklı nokta var, ancak her biri 100000 kez görünüyor, çok yavaş çalışıyor. Bu yüzden daha verimli bir yol olup olmadığını merak ediyorum.k-ortalamaları birçok farklı nokta için R
0
A
cevap
0
K-araçları ağırlıkları ile uygulanabilir. Bunu yapmak çok kolay.
Ancak IIRC, R ile gelen sürüm bu şekilde uygulanmamıştır. flexcluster
numaralı versiyonun numaralı versiyonu, ancak R değeri ve çok daha yavaştır.
Her iki durumda da, bunu normal bir kilometre sürümü gibi Fortran veya C'de uygulamak isteyeceksiniz. Belki zaten iyi bir uygulama olan bir paket bulabilirsiniz.
Teşekkür ederiz. İyi çalışan bir kmeansW {FactoClass} fonksiyonu buluyorum. –