大刀闊斧提示您:看後求收藏(奇妙書庫www.qmshu.tw),接著再看更方便。
統一的語調和節律,就像一個能講雙語的人講出來的話。這個雙語語音合成系統在可懂度與自然度上都取得了較好的效果。我們將這個系統命名為木蘭。木蘭就是這樣誕生的。
(TTS系統中的木蘭形象)
之後的一段時間裡,我們致力於不斷提高木蘭的聲音質量,並從應用角度探索如何將語音合成技術方便人們的日常生活, 例如語音聊天室(一方輸入文字,另一方聽到聲音)、動畫配音(為孩子DIY動畫故事)、個性化聲音加工等等。在我們完成了一個又一個有趣的研究專案的過程中,木蘭長大了,成熟了。
木蘭“嫁”入Vista
在2003年之際,微軟公司在著力開發新一代作業系統Vista,當時總部產品部門基本準備購買其他公司的一套現成的語音合成軟體。在他們對木蘭有所瞭解後,最終決定採用我們的技術成果。這對TTS研究團隊無疑是一件歡欣鼓舞的事情,因為能把自己的研究成果轉化到服務於使用者的產品中是我們的夢想。可是,事情運作起來遠沒有想象的那麼簡單。所有的開發和單元測試工作都必須在北京做。而我們這個以研究為主的團隊,寫程式不是我們最擅長的能力,而且勢必佔用我們很多做研究的時間。但是,為了一個共同的目標——把自己的研究成果做進微軟產品,我們團隊的每一個人都非常投入地做這個專案。
剛開始,我們只有5個人,三個來自TTS組,兩個來自技術轉化組。大家分擔著產品開發環節中的各個角色,PM、SDE、SEET ,每天都超負荷運轉著。正巧,專案啟動後不久,微軟亞洲工程院宣佈成立,它成立的使命是把研究院的最新技術孵化進產品中去,TTS專案也就成了工程院的第一批專案之一。 電子書 分享網站
“木蘭”媽媽 初敏(2)
我們從總部爭取到了更多的人員指標,TTS開發組逐漸擴大了,有了專職PM、Developer和Tester。當然,任務也更多了,不光要把TTS做進作業系統,還要做到所有需要TTS技術的產品中去。不光要做中文、英文,還要做西班牙語、日語、法語等二十多種語言。大概在2004年8月份左右,在工程院中,我們已經孵化出一支完整的TTS開發團隊,而我們幾個仍想致力於研究工作的人逐漸抽身,開始考慮下一步的研究方向。而那時候,為Vista做的工作已經完成了80%以上。
當我的木蘭最終“嫁”了出去後,有段時間我產生了一種空落感,茫然若失。TTS作為一個產品化了的技術算是大功告成了,那麼接下來應該怎麼走,還能做些什麼?在這些問題上我們的團隊做了很多思考。在隨後的兩年中,我們主要在語音合成技術的應用化、個性化層面進行大膽的探索,透過把十餘種較有代表性的地方方言運用到語音的表達中,試圖使對話效果更富趣味性、擬人性和娛樂性。在這個創意的基礎上,我們做出了一些原型系統,效果還很不錯。這些工作都是木蘭的延伸。
18年的緣份,妙不可言
回想起來,我與語音合成這個研究方向已經結緣十多年了。這緣分源自於碩士入學之初的一次選擇。
當時我從西北工業大學保送到哈爾濱船舶工程學院讀研究生,訊號處理專業有兩個方向供我們選擇,圖象處理和語音處理,當時圖象處理很熱,好幾個同學想選,我就決定不湊熱鬧了,選了語音處理。後來發現這個方向還蠻有意思的,就開始投入其中。等兩年後報考中科院聲學所博士時,我依然申請了語音合成方向。就這樣,我的碩士、博士論文工作奠定了我之後長達十多年的研究興趣。
大家都說愛一行,幹一行。從碩士階段開始算起,到後來留在聲學所工作、直到在微軟亞洲研究院工作到2007年,我已經在這個領域奮戰了近18個年頭了。我一直覺得自己是個很專注的人,但是仍不敢想象這種執著竟堅持了這麼久。
語音合成是一個交叉學科,既要懂得語音訊號處理,還要掌握語言內部的音韻、語法等系統的知識,並且需要能將這些知識很好的融合到語音合成系統之中。此外,還需要了解心理學實驗方法,透過各種實驗來幫助我們更好地理解人的聽覺特點,從而更好的滿足使用者的需求。正是因為它所要求的相關學科的知識面比較廣,才吸引我投入了這麼多時間在上面。
而研究院,也是從事這樣專注研究的一個好地方,它為每個研究員提供了很好的平臺與環境,還有做事情的自由,每個人有很大的自由決定想做什麼,不做什麼。而且,只要要求合