Aşağıdaki problemi çözmek için araştırmam gereken teknikler/algoritmalar hakkında biraz bilgi arıyorum. Şu anda akustik parmak izi kullanarak benzer çalınan mp3'leri kuran bir algoritma var. Her bir kümede, her dosya için tüm farklı meta verilere (şarkı/sanatçı/albüm) sahibim. Bu küme için veritabanımda varolan bir satıra uyan "en iyi" şarkı/sanatçı/albüm meta verilerini seçmek isterim veya en iyi eşleşme yoksa yeni bir satır eklemeye karar verdim. Bir küme için Veri sınıflandırması için makine öğrenme algoritması.
, genellikle bazı doğru meta vardır, ancak bireysel dosyalar sorunların çoğunu türleri vardır:- Sanatçı/şarkılar tamamen misnamed, ya da sadece biraz yanlış yazılmış olan
- sanatçı/şarkı/albüm eksik, ancak bilgileri geri kalanı
- şarkı canlı kayıt aslında orada, ama sadece kümedeki dosyaların bazılarını bu şekilde etiketlenir olduğunu. song.mp3 veya sanatçı - - albüm - song.mp3 veya başka varyasyonu
Basit oylama algoritması eserler
Teşekkürler!
Büyük soru - İnsanlar burada ile gelip ne olduğunu görmek için ilgileniyorum. Belki bir çeşit karar ağacı öğrenme yaklaşımının bir kümedeki “en iyi” şarkıyı tanımlamaya yardımcı olup olmadığını merak ediyorum. Elbette denetimsiz öğrenim veya makine öğrenimi ile ilgili wiki sayfaları size biraz daha ilham verebilir. – awshepard
burada bazı dersler izlerken deneyin: [Makine Öğrenimi Ders] (https://www.coursera.org/course/ml) birçok uygulanabilir teknikleri kapsayacak şekilde. – mlepage