【明報專訊】Google昨推出廣東話語音搜尋服務,用家只需透過Android或iPhone手機下載免費的應用程式(app),點擊咪高峰符號,再說出關鍵字,熒幕隨即顯示搜尋結果。由於港人懶音甚多,Google找來逾500名市民協助錄音製作資料庫,懶音亦一併收錄,令系統懂得自動將「痕身銀行」糾正為「恒生銀行」。
本報靜房試50字 準確率七成
有關系統的語音辨別準確率有多高?Google並沒說明。本報自行測試,隨機抽選50個廣東話流行詞句,在寧靜的房間內以iPhone4測試,最後手機準確辨認出35個字,準確率達七成(見圖)。然而,在嘈雜的環境下使用,準確率會打折扣。
該廣東話版本的語音搜尋,是繼普通話及台灣國語之後,第三個中文版本。外語版本則已有英、日、法、韓語等。現時美國Android或iPhone手機用家中,有25%會使用「語音搜尋」。
Google技術總監陸韵晟昨聯同研究科學家宋雲軒出席發布會,示範使用搜尋器。他舉例說,只要開啟app的語音搜尋功能,然後說︰「香港尖沙嘴日本料理」,手機熒幕會隨即顯出Google搜尋到的食店網站及相關地圖位置。陸指廣東話語句經常中英夾雜,如「爛gag」等詞語,在語音搜尋器一樣能辨認。
城大邀500市民錄音助研發
Google年初開始與城大電腦科學系視像、影像及音頻分析實驗室合作研發。城大助理教授陳萬師博士說,廣東話有9音,電腦要準確辨認不容易,故大學找來500名市民錄音,當中男女比例平均分佈,且有長者、小孩,每人讀出100句句子,懶音也不糾正,數據統統載入資料庫。研發團隊會將一個音調加一個母音的組合當成一個辨識單元,為整個系統準確性奠下基礎。
愈多人搜尋關鍵字 愈準確
廣東話亦有許多同音字,如理大的「理」及李小龍的「李」,如何令系統準確辨認?宋雲軒解釋,Google使用DataHound收集技術,透過智能手機錄下用家聲線及上載大量義工的廣東話聲音樣本,並配合網站搜尋紀錄的文字數據庫作雲端運算,愈多人搜尋的關鍵字,系統愈準確。
陸表示,環境噪音對辨識語音有直接影響,建議用家不要在車廂等嘈吵地方使用。此外系統亦有其他限制,如某些不常見的用字,若難見於文字數據庫,語音搜尋也未必找到。
■如何下載有關應用程式?
iPhone﹕在App Store搜尋
「Google Moble App」
Android﹕在Market搜尋
「Google Voice Search」
服務使用示範短片﹕
www.google.com.hk/intl/zh-TW/mobile/voice-search/