Birden fazla anket katılımcısının birden fazla bilgi parçasını izlemek için giyilebilir teknolojiyi kullanarak birden çok müzik parçasını dinlediği bir deneme gerçekleştirdim, iki örnek BPM
(Kalp Hızı) ve T
(Vücut ısısı). Amaç, her bir müzik parçasının (kullanıcı geri bildirimleri ile karakterize edilen) insan duyguları üzerindeki etkisini ölçmektir.Python Pandalar: Birden çok kullanıcı için birden fazla öznitelik için birden çok zaman aralığı değişkenini depolayın
/user_1
/BPM
song_1.txt
76
78
song_2.txt
76
78
85
/T
song_1.txt
35.7
35.3
35.3
35.3
35.3
song_2.txt
32.2
32.4
37.8
32.4
37.8
Her bir .txt
dosya olabilir: tüm verileri aşağıdaki yapıya sahip birden dizinleri (bir metin dosyasındaki her satır bir giriş vardır) .txt
dosyalarına saklanmış anda
BPM
ve
T
için zaman serileri farklı uzunluklarda olabilir.
Tüm dosyaların değerlerini okumak ve okumak için Python kodunu zaten yazdım. Şu anda
, ben aşağıdaki gibi bir DataFrame oluşturma düşünüyorum:User_ID Song_ID BPM T
1 1 [65,...] [36,...]
1 2 [65,...] [36,...]
2 1 [65,...] [36,...]
2 2 [65,...] [36,...]
Ama zor verilerin standartlaştırılması gibi görevleri yapabilir her hücrede bir dizi depolama endişeliyim - Şimdi merak ediyorum orada Bunu Pandalar'da saklamak için MultiIndex'den yararlanmak için daha iyi bir yol var mı?
Kullanıldığından daha az hataya eğilimlidir x xarray' kütüphanesine baktınız mı? Bilimsel veri analizi için tasarlanmıştır ve Panda'ları çok boyutlu dizilere genişletir. –
Kütüphane iyi görünüyor, bu özel kullanım durumunda verebileceğiniz başka tavsiyeler var mı? – jfive