風靡全球
率先扎進智能音箱領(lǐng)域的亞馬遜可能沒有想到,它的一次嘗試居然讓這個行業(yè)在4年后影響了全世界。從2018年第一季度全球智能音箱920萬個的出貨數(shù)據(jù)上就能看出,越來越多的智能音箱產(chǎn)品正在走進人們的日常生活。如今,依托互聯(lián)網(wǎng)技術(shù)的服務(wù)能力,智能音箱已經(jīng)擁有涵蓋影音娛樂、新聞資訊、購物外賣、家居控制、生活助手、兒童教育等領(lǐng)域的100多項技能。全球的互聯(lián)網(wǎng)大佬都在追逐這一潮流,連一向“高冷”的美國蘋果公司今年初也推出了內(nèi)置人工智能語音助手的智能音箱。“我們認為,客戶將被它的音頻質(zhì)量震驚。”蘋果公司全球營銷高級副總裁菲利普·席勒對自家產(chǎn)品充滿自信。
亞馬遜和谷歌兩家公司則更早布局市場。亞馬遜于2014年推出的智能音箱目前已經(jīng)售出數(shù)千萬臺,在智能音箱市場處于領(lǐng)先位置。谷歌的智能音箱于2016年在年度開發(fā)者大會上推出,一直是該公司深受歡迎的產(chǎn)品之一,占據(jù)智能音箱市場第二的位置。
在中國市場,智能音箱行業(yè)同樣引領(lǐng)潮流,互聯(lián)網(wǎng)企業(yè)忙著搶占風口:百度推出“小度”,騰訊推出“聽聽”,京東推出“叮咚”,小米推出“小愛同學”……市場反應(yīng)積極熱烈,在1月24日的天貓年貨節(jié)首日,開場1小時,智能音箱“天貓精靈”就賣出近3萬臺。
彎道超車
智能音箱風靡的背后,是智能語音識別和機器學習技術(shù)的快速發(fā)展,這兩個技術(shù),一個讓音箱“聽得見,說得出”,一個讓音箱“聽得懂”。而這一次,中國的企業(yè)沒有掉隊。
科大訊飛是中國智能語音識別領(lǐng)域的王牌企業(yè)。在日前于貴陽舉行的“2018中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會”上,科大訊飛展出了一系列新產(chǎn)品,包括智能客服、曉曼智能音箱、曉譯人工智能助理等。據(jù)工作人員介紹,這是當前人工智能領(lǐng)域的語音識別、語音合成、自然語言理解等技術(shù)的綜合應(yīng)用。“我們最新推出的訊飛翻譯機2.0,能支持中文與33種語言互譯,粵語、四川話等方言也都能翻譯成外語。”
語音識別解決了“主人說的話是什么內(nèi)容”的問題,機器學習解決的則是“主人說的話是什么意思,我該怎么響應(yīng)”的問題。通過“吃進去”大量數(shù)據(jù),智能音箱逐漸學會把用戶指令和相應(yīng)操作一一對應(yīng)起來。說“播放新聞”就打開新聞客戶端,說“播放音樂”就打開音樂播放器。伴隨著與用戶的持續(xù)互動,智能音箱還能不斷進化成長,實現(xiàn)“千人千面”,能夠根據(jù)每個人的喜好進行內(nèi)容設(shè)定和推薦。
智能音箱也能成為智能家居“指揮部”。通過聲紋識別技術(shù),智能音箱能“認識”主人,分辨出陌生人的聲音,主人只需對智能音箱發(fā)號施令,不用伸手、不出房間,就能遙控位于家中各處的門窗、電燈、空調(diào)或熱水器。
“中國在這次科技浪潮上是趕在前面的,深度學習有超過40%的論文是華人發(fā)表的。我們有很好的數(shù)據(jù)、巨大的樣本群,有很好的工程師隊伍,又有全球一流的制造能力。”獵豹移動創(chuàng)始人兼首席執(zhí)行官傅盛表示:“未來是人與機器人共存的時代,中國存在彎道超車的機會。”
服務(wù)生活
目前,市面上大多數(shù)智能音箱產(chǎn)品的用戶體驗都有很大改善空間,在語音交互、語義理解等方面還不夠“智能”,這也是很多廠商現(xiàn)階段的攻堅重點。小米“小愛”團隊采用的是交互式學習的算法,其總監(jiān)王剛博士表示:“剛開始小愛也沒有這么聰明,很多東西聽不懂,但與用戶的交流會讓它越來越聰明,更多的用戶數(shù)據(jù)會讓小愛自己學習理解以前聽不懂的問題。”
智能音箱只是一種形式,實際上語音交互才是最核心的突破。“其實我們推動產(chǎn)品落地有很多種方式,智能音箱只是其中的一個。讓語音交互與別的形式結(jié)合,也有可能。”阿里人工智能實驗室相關(guān)負責人表示。
不管是什么形式,服務(wù)人類生活是最根本的目的。“人工智能技術(shù)的不斷發(fā)展必將不斷重塑各行各業(yè)以及改變我們的生活。”微軟亞洲研究院副院長張益肇將這種“重塑”概括為3個方面:推動產(chǎn)業(yè)向智能化轉(zhuǎn)變、引發(fā)商業(yè)創(chuàng)新、讓人們的生活更美好。
南京工業(yè)大學碩士研究生宋昊旻的故事正印證著這一點。宋昊旻在1歲時失去聽力,被診斷為終身聽力嚴重損傷。在上月舉行的微軟人工智能大會上,他體驗了一款語音服務(wù)設(shè)備,這款設(shè)備能夠把宋昊旻努力發(fā)出的聲音以極高準確度轉(zhuǎn)換成文字,還能同步翻譯成英語或其他語種,真正實現(xiàn)無障礙溝通。語音交互技術(shù)或?qū)⒏淖兯酉聛淼娜松?/span>
這就是技術(shù)變革給人類帶來的福音。
(轉(zhuǎn)載自搜狐網(wǎng))