Konuşulan bir kaydı bilinen bir metne göre senkronize etmek istiyorum. Bunu kolaylaştıracak bir konuşma-metin/doğal dil işleme kütüphanesi var mı? Sözcük sınırlarını tespit etmek ve bir adayın aday eşleşmelerini hesaplamak istediğimi hayal ediyorum. SO üzerinde bulduğum soruların çoğu yazılı dil ile ilgilidir.Metin ve ses senkronizasyonu. Bunu yapmak için bir NLP/konuşma-metin kütüphanesi var mı?
İstenilen, ancak gerekli değildir: Amerikan İngilizcesi ile
- Açık Kaynak dışı-box
- Çapraz platform
- iyice belgelenmiş
Düzenleme : Bunun çok geniş, hatta saf bir soru olduğunu anlıyorum, bu yüzden rehberlik için şimdiden teşekkürler.
Ben şimdiye kadar bulduğum Ne:
- OpenEars (iOS Sphinx/Flite sarıcı)
Aynı şeyi yapmak istiyorum, Sphinx aşırı büyük ve düzensiz belgelenmiş görünüyor. Sonunda neler olup bittiğini merak ediyorsanız ve daha güncel bir şeyden haberdarsanız - bu sorunun 2 yıl geri gittiğini görüyorum, o zamandan beri işler değişmeli mi? –
Tartışmaya daha fazla katkıda bulunmak için yeterince öğrenmeden önce projeden ayrıldım. – Justin
Kayıt için: Python/C zorunlu hizalayıcısını şu durumlarda koruyorum: https://github.com/readbeyond/aeneas/ –