Verilerimi görselleştirmek için Boyut Azaltma (DR) tekniğini ve bunların birbirleriyle ne kadar ilişkili olduğunu görmek istiyorum. Barnes-hut tsne kullanmayı planlıyorum, ancak örnek uygulama user guide göre düzenli matris biçiminde verileri olduğundan, TSNE'ye nasıl girdi sağlayacağımı alamıyorum. 5000 farklı değerde yaklaşık 12 milyon kayıt var ve bunları ana belleğe kaydedemiyorum. Boyut küçültmeyi (DR) gerçekleştirmek istiyorum, böylece bu farklı değerleri 2 boyutlu dağılım grafiğinde görüntüledim. Bitişik liste formundaki verilerim var (çok seyrek olduğu için).Seyrek Matriste Boyut Azaltma (TSNE/PCA)
Let Kayıtları şu var ki:
2 3 10
4 6
7
7 9 10
2
5 6
Bunlar benim ilk 6 kayıt olması gerekiyordu. Ve bu durumda, sadece 10 ayrı değere sahibim. Ve yukarıdaki matris (tablo), 1. kaydın 1, 2, diğer sütunlar ise 0 (bitişik liste) olduğunu gösterir.
Bu farklı değerler, belgede (kayıtlarda) bulunan sözcüklere (etiketlere) eşlenir.
Bu tür verilerle hızlı TSNE'yi nasıl uygularım? Ya da bunu TSNE'nin gerektirdiği uyumlu formatta nasıl dönüştürebilirim? Hangi dili tercih etmeliyim?
Python veya Matlab kullanmayı tercih ediyorum ama başka bir şey de iyi. Önerilerinizi bana bildirin.
P.S. Görevi yapmak için çok yüksek bilgisayar makinem var.