業(yè)界大佬Facebook計劃從VR頭顯入局語音助手領(lǐng)域
- 來源:87870
- 作者:忽悠你傳火
- 編輯:ChunTian
Push和pull
數(shù)個月內(nèi),F(xiàn)acebook以樂庫恩研究部門的技術(shù)為基礎(chǔ),開發(fā)出適合在市場上發(fā)布的產(chǎn)品。Facebook后來成立了應(yīng)用機器學(xué)習(xí)部門,負(fù)責(zé)人是坎德拉——曾在微軟研究院任職。
盡管最近數(shù)年Alphabet、蘋果和微軟一直在大肆宣揚系統(tǒng)精度的提升,但Facebook在語音識別領(lǐng)域卻相當(dāng)?shù)驼{(diào)。
坎德拉表示,約2年半前,他的部門開始開發(fā)語音增強產(chǎn)品,并得到Jibbigo——Facebook 2013年收購的一家創(chuàng)業(yè)公司——的幫助。
坎德拉說,F(xiàn)acebook的研發(fā)活動分為兩大類:Push和Pull。“Push”指認(rèn)為某一技術(shù)未來會有多方面用途,然后開始開發(fā);“Pull”指工程師提出需要開發(fā)的技術(shù)。語音識別屬于“Push”類技術(shù)。
研究人員提到的語音識別技術(shù)的一種使用場景,是自動生成視頻字幕。谷歌在2009年就開始這一方面的研究。
發(fā)現(xiàn)問題
Facebook最初專注于廣告。當(dāng)時的情況是,用戶在關(guān)閉聲音的情況下翻看自己的信息流,為了使廣告更容易被用戶注意到,廣告客戶需要在視頻中添加文本。
Facebook語音架構(gòu)集團工程師雷娜·菲利普(Reena Philip)表示,通過與廣告團隊合作,“我們開發(fā)出了原型產(chǎn)品”。
Facebook去年第二季度發(fā)布了這一功能。Facebook則繼續(xù)深挖這一技術(shù),自動為發(fā)布到其服務(wù)中的視頻生成字幕。
坎德拉說,“我們進行過試驗——增添字幕后,視頻觀看量增長了2位數(shù)。”
與視頻字幕生成系統(tǒng)不同的是,Oculus語音識別功能是“Pull”的一個案例。
隨著應(yīng)用和游戲越來越多,Gear VR用戶要找到喜歡的內(nèi)容越來越困難。大聲說出來成為獲得具體內(nèi)容的一種方法。
Facebook還需要確保與Gear VR配套的三星智能手機也能響應(yīng)“Hey Oculus”命令。與Oculus Rift不同的是,Gear VR由配套手機提供運算能力,它本身沒有強大的運算能力。
蘋果和谷歌已經(jīng)把語音激活開關(guān)整合到手機中,現(xiàn)在Facebook也要這樣做。
菲利普表示,語音識別技術(shù)第四季度登陸Oculus時,它只支持美國英語,但團隊已經(jīng)開始為它增添更多種類的英語“方言”。
菲利普說,隨著時間推移,F(xiàn)acebook可能使Oculus語音識別技術(shù)能在線下運行。Facebook還可能最終支持英語之外的其他語言。
除此之外,F(xiàn)acebook員工并不清楚公司在語音識別技術(shù)領(lǐng)域未來的發(fā)展。
目前,F(xiàn)acebook主要業(yè)務(wù)是社區(qū)。這可能決定Facebook語音識別技術(shù)的未來發(fā)展方向。Facebook產(chǎn)品經(jīng)理默林·鄧(Merlyn Deng)說,“我們未來的語音識別技術(shù)必須與公司使命,以及我們掌握的數(shù)據(jù)相契合”。

玩家點評 (0人參與,0條評論)
熱門評論
全部評論