2011年10月16日星期日

Siri在面對中國人時,會水土不服嗎

Siri的智能,是以準確的語音識別為前提。雖然目前看到的視頻中,Siri對各種英語口音的兼容性很好,但是,我對它在中文環境中的表現頗為擔心。


根據我看電影和各種國外視頻資料的經驗,在母語為英語的地區中,美語的南北方口音、黑人口音以及英國、澳洲、加拿大口音互相之間的區別,大概相當於中文裏普通話、北京話、東北話和台灣標準國語之間的區別。這些中文口語中的發音差異,與中國的方言系統中的發音差別相比的話,簡直就是沒有差別,基本上,你能聽懂普通話,就能毫不費力地聽懂講得不是非常快的北京話、東北話和台灣標準國語,反之亦然。


但是,中國的方言系統,大概是全世界最複雜的,雖然書面文字區別不大(除粵語外),口語發音卻是千差萬別。長江以北,包括西南地區的方言還勉強可以交流,過了長江,情況就變得極為複雜,僅僅沿海一帶,就有吳、越、閩、粵四種體系,發音上的區別,基本上是英語、法語、西班牙語、德語之間的差異度。方言上巨大的差異,造成了帶有各種口音的普通話(包括所謂的台灣腔國語),粵語甚至作為獨立的發音標準體系而在普通話之外另立門戶。口音重的話,人聽起來都非常吃力,更別說機器了。有時候我會接到一些長途騷擾電話,基本都是南方人,上來打完招呼就嘰哩呱啦地一通業務介紹,如果是口音重的人,我只能理解其中的七成左右。以前在南方,和當地人面對面的交流,也經常誤會意思。


沒聽說蘋果在中國有研發團隊,很好奇蘋果的工程師們是如何調試Siri的中文識別準確率的。其他的語音識別技術,我用過IBM、NOKIA、GOOGLE,對普通話的識別都不錯,IBM的語音識別,唸《人民日報》的話,準確率可以達到98%以上;NOKIA的語音撥號,準確率也非常高,而且完全不用口音適應,這是我最懷念的NOKIA手機功能;Android手機上的語音搜索功能很不錯,只是可惜不能自動生成通訊錄裏聯繫人名字的詞庫,而語音命令功能(Voice Commands)雖然能語音撥號,卻不支持中文,啟動時間也很長。這些語音識別技術,在中國都遇到了口音問題,不只是江南,包括西南、華中地區也有大量的操濃重鄉音的人群,口音問題,直接影響了這些語音識別技術的接受度和普通度。


語音識別,在國外已經是非常成熟的技術,在中國卻極少被關注,口音差異應該是根本原因。現在,以智能化的Siri為賣點的愛瘋死愛死來了,它能聽懂中國人在說什麼嗎。。。

没有评论:

发表评论

歡迎說三道四