跳到主要內容

辨識相片App自學外語不求人 可辨認逾千種物件 與網上字典互補長青網文章

2015年10月05日
檢視個人資料
Submitted by 長青人 on 2015年10月05日 06:35
2015年10月05日 06:35
新聞類別
財經
詳情#
【明報專訊】學習外語,最令人感到不便和困擾的,是想發問時沒有人可以問。有本地初創公司就採用嶄新的人工智能技術,開發出一個手機App和背後的雲端軟件,可以直接利用相片來辨認物件,再提供多種語言翻譯和發音。


Axon Labs Limited行政總裁覃紹禮、科技總裁歐陽靖民表示,他們最初是因為看到,在人工智能技術當中,「深度學習」(Deep Learning)技術越來越受關注和重視,而想到這種技術可否應用於日常生活和學習。


具「深度學習」人工智能技術

他們解釋,辨認物件的人工智能(AI)技術主要有兩大類。一種是需要開發者向電腦軟件提供每種物件的多個特徵。另一種則是讓電腦軟件從例子中自行觀察和學習,以找出某種物件的特徵,後者就是「深度學習」技術。前者的缺點是,很難向電腦軟件準確地提供每種物件的所有特徵。例如櫈子可有1隻至7隻腳、有轆或無轆、圓的或方的、靠背或沒有靠背的,很難向電腦軟件描述。而「深度學習」技術卻不同,開發者毋須向電腦軟件提供物件的特徵,只需給予大量例子,告訴它這些都是某種物件就行。軟件會自動從這些物件的相片中總結經驗,找出共通點。因此,「深度學習」技術相對較為靈活,長遠來說,其準確率應該會比前者更高。


今年初,他們萌生意念,可以將這種技術用來協助人們學習各種語言的生字。這是因為,一般人學習外語,都會有一些被動。網上字典和翻譯軟件能夠提供相當程度的幫助,但就需要用戶花些少時間輸入辭彙。更重要的是,如果當事人根本不知道某個國家的某些物件是甚麼,仍然會查無可查。因此,他們便想到,可以開發一個手機App,直接利用相片來辨認物件,再提供外語的翻譯和發音。


兩人用了大約3個月來開發SnapWord,以及雲端的人工智能軟件,便將SnapWord推出。截至訪問時,SnapWord已可以辨認到超過1000種物件,這乃是從超過100萬幅相片學習而來。此外,它更能提供10種語言的單字翻譯和電腦發音功能,包括:日、韓、法、德、廣東話、普通話、英語、西班牙語、俄語及冰島語。


辨識準確率仍有待提高

不過,根據記者的試用,其辨認物件的準確度還不算很高。覃紹禮和歐陽靖民亦承認這點。他們估計,SnapWord辨認物件的平均準確率暫時只是介乎七八成。若是食物或服裝,準確率會特別低。尤其是全世界各國的食物,因為有很多形態,還需要找到很多相片,才能顯著提高這方面的準確率。


他們指出,每種物件都要至少提供200至500幅相片給雲端的人工智能軟件參考,那才能達到一定的準確率。其實,現時該公司每天仍繼續向該人工智能軟件提供大量相片作為例子。一方面,是利用他們編寫的自動化程式,從網上搜尋一些有註解的相片,送到該人工智能軟件。估計到了明年4月,該人工智能軟件將會透過這方式,累積學習到200萬幅相片。


另外,則是善用那些用戶使用時辨認不到的相片。因為SnapWord對於不太肯定的物件,會提供3個選擇,以及None of the above(以上都不是),共4個選項。若用戶對那3個選擇都不滿意,就可以點選None of the above。這些辨認不到的相片,就會傳送給該公司的員工,以人腦和人手處理,以告訴該人工智能軟件,那是甚麼物件。理論上,這樣做是可以漸漸提高到辨認那些種類的物件的準確率。


此外,他們亦提供了一些日常使用SnapWord時的貼士,有助提高辨認物件的準確率。例如,拍照時,背景最好沒有其他雜物(以免人工智能軟件被擾亂);背景最好是單色的;物件和背景的顏色對比越強越好;物件最好放置在相框中央;最好是拍攝物件的正面,而非側面或背面等。現時,SnapWord是可以免費下載的。若不使用發聲功能,也是免費的。若使用發聲功能,則每種語言會收取1美元。


明報記者

[薛偉傑 新經濟新天地]

0
0
0
書籤
留言 (0)
確定