2011-08-23 20 views
9

Uygulamamın bir parçası olarak, konuşma tanıma özelliğini eklemek istiyorum, ancak geleneksel anlamda gerçekten değil. Birisi tarafından söylenen bir dizi şarkı (ayetlere bölünmüş) var ve bu fikir, ekranda hangi ayetin söylendiğini bulmaktır.Şarkı söylerken sürekli konuşma tanıma?

Sfenks ile oynadım ve bazı temel örnekler hazırladım ve çalışıyordum, ancak bir gecikme için bekleyebileceğiniz sözlü metni kaydetme konusunda bir sürü dokümantasyon var gibi görünüyor. Sürekli cümleleri tanıma fikrini çok fazla bulmak. Elbette sözlerin söylendiği ve konuşulmadığı yere gelmeden önce!

Bu konuda herhangi bir tecrübesi olan var mı, eğer varsa, iyi bir başlangıç ​​noktası sağlayacak herhangi bir yer var mı? Ya da sfenks ile çok iddialı bir şekilde başarabilmek için uğraştığım şey ve gerçekten hiç düzgün çalışmayacak mı? Diğer kütüphanelere bakmaya açığım ama özgür olmalılar ve sfenks en çok kazandığım biri hakkında konuşuldu.

+1

Büyük bir sorun, uygun bir antrenman seti veya sınırlı ebattan birinden bagaj kayması elde etmede büyük bir sorun olacaktır. – Eamorr

+2

Birisi bu düşüşün nedenini açıklayabilir mi? – berry120

+0

Ggogle, sorgunuzu bir aramada kullandığımda [bu makale] 'de (http://www.hindawi.com/journals/asmp/2010/546047/) hata veriyor. Belirli bir kütüphaneyi ararken çok yardım etmiyorum korkuyorum ama kendiniz bir şey inşa etmeniz gerekiyorsa sizi takip etmenize yardımcı olabilir. – Wivani

cevap

3

Konuşma, küçük bir gecikme ile telaffuz edilir edilmez kabul edilmek mükemmel bir şekilde mümkündür. Üstelik, daha çok veya daha az şey anlarsanız, ne elde etmeyi umarsınız. Buna "kısmi sonuç" denir ve API aracılığıyla tüm CMUSphinx kod çözücülerinde kullanılabilir. Temel olarak, süreçte hipotezi alabilirsiniz.

olabilir müziği verilen bu teknik backtracking denir ve kolayca şarkı için

uygulanabilecek (bunun istikrarlı bir kısmını ayıklamak için nasıl), ancak bu sonucu stabilize etmek için nasıl dikkate almak küçük bir sorun vardır filtrelenmiş de yapılabilir.