Mozilla通用語音更新 將幫助訓練基於語音的網頁閱讀

Mozilla今天公佈瞭Common Voice的最新版本,該版本是其轉錄語音數據的開源鳩合,供始創公司、研究人員和喜好者構建語音功能的運用、服務和裝備。Common Voice現在包括54種不同言語的超過7226小時的總奉獻語音數據,比2019年2月18種言語的1400小時有所增多。

Common Voice不隻包含語音片段,還包含對訓練語音引擎有用的自願奉獻的元數據,如講話者的年齡、性別和口音。它被設計為與DeepSpeech集成,DeepSpeech是一套開源的語音到文本、文本到語音引擎,以及由Mozilla的機器學習小組保護的訓練模型。

搜集Common Voice中超過550萬個片段須要大量的工作,不過,到當前為止,在7226個小時中,有5591個小時被該項目奉獻者確以為有效。而依據Mozilla的數據,Common Voice中的五種言語–英語、德語、法語、意大利語和西班牙語現在已經有超過5000名獨特的運用者,而七種言語英語、德語、法語、卡比勒語、加泰羅尼亞語、西班牙語和基尼亞盧旺達語則有超過500小時的記載。

今天還公佈瞭Mozilla有史以來第一個數據集目的段,旨在為特定目的和用例搜集語音數據。這個細分市場包含數字 \”0 \”到 \”9\”,以及 \”是\”、\”不是\”、\”嘿 \”和 \”火狐 \”等詞語,共有1.1萬人在18種言語中說瞭120個小時。

Common Voice刷新以後,DeepSpeech進行瞭巨大更新,歸入瞭迄今為止最快的開源語音辨認模型之一。最新版本增多瞭對TensorFlow Lite的支持,TensorFlow Lite是googleTensorFlow機器學習框架的發行版,針對計算受限的挪動和嵌入式裝備進行瞭優化,並將DeepSpeech的內存斲喪減少瞭22倍,同時將其啟動速度提高瞭500多倍。

Common Voice和DeepSpeech都為Mozilla項目工作提供瞭參考,譬如Firefox Voice,這是一個為Firefox增多語音辨認支持的閱讀器擴展。當前,Firefox Voice能夠瞭解 \”天氣怎樣 \”和 \”查找Gmail標簽 \”等命令,但目的是增進僅運用語音與網站進行 \”故意義的互動\”。

发表评论