基于語音技術(shù)的人工智能聊天機(jī)器人“小冰”火了!在微博平臺上,“小冰”與無數(shù)“大V”聊天,并創(chuàng)下了72小時內(nèi)1.3億人次的對話量。截至7月11日,“小冰”的微博粉絲數(shù)已超過77萬。曾有專家表示,智能語音五年火一次,經(jīng)歷著“熱一陣、死一陣”的輪回,此番技術(shù)浪潮能否打破這個魔咒還需企業(yè)自己選擇,是打造無所不能的“變形金剛”,還是心無旁騖力爭在小范圍做精做細(xì),不同的方向會帶來不同的命運。
國際巨頭搶灘市場
在開發(fā)者的構(gòu)想中,蘋果的Siri應(yīng)該是一個“任務(wù)引擎”,可以預(yù)測到用戶需要什么,并在用戶提出要求之前就打點好一切。但是它的使用率不夠理想,一項調(diào)查顯示,Siri推出兩年后,2330名iPhone用戶中僅有15.2%使用過Siri。
Google Now是谷歌在I/O開發(fā)者大會上隨安卓4.1系統(tǒng)同時推出的一款重量級應(yīng)用。GoogleNow優(yōu)于Siri的一個先天優(yōu)勢在于與谷歌搜索功能的結(jié)合,用戶搜索的關(guān)鍵詞被記錄下來,GoogleNow智能化讀取關(guān)鍵詞后,為用戶提供相關(guān)的語音服務(wù)。此外,該應(yīng)用的語音識別功能也得以加強(qiáng),加上谷歌強(qiáng)大的“知識圖”,語音搜索結(jié)果非常準(zhǔn)確?上У氖牵珿oogleNow只是作為Google Search的一個插件,僅將自然語義的語音搜索做到了應(yīng)用里。
微軟宣布將在下一代移動操作系統(tǒng)中加入智能語音系統(tǒng),取名Cortana(“小娜”)。這個號稱“全球首個真正的個人數(shù)字助理”擁有強(qiáng)大的學(xué)習(xí)和上下文聯(lián)想功能。“小娜”還能兼容第三方應(yīng)用程序,極大地豐富了使用體驗。可見“小娜”的方向是朝著人工智能和移動端在布局。
IBM的聊天語音助手“Cognea”目前已經(jīng)有4萬多用戶,這些用戶能在Cognea所提供的免費語音助手定制平臺上獲得專屬于自己的“語音機(jī)器人”。IBM目前正在努力將其開發(fā)的最新系統(tǒng)Watson打造成現(xiàn)實版的人機(jī)智能對話類電腦系統(tǒng),以期擊垮“Siri姐”和“小娜妹”。
國內(nèi)IT企業(yè)“不等閑”
目前,我國語音技術(shù)廠商基本分為三類:第一類是傳統(tǒng)語音技術(shù)廠商,一般從科研院所基礎(chǔ)研究脫胎,包括像科大訊飛(中國科技大學(xué))、捷通華聲(清華大學(xué)、中科院聲學(xué)所、北京大學(xué))等,其中訊飛語點是由科大訊飛推出的類Siri中文語音助手,目前已經(jīng)推出Android、iOS版,并成功進(jìn)入AppStore,和Siri展開正面競爭。
第二類是互聯(lián)網(wǎng)廠商,包括百度、騰訊等,他們?yōu)榻o其廣大的互聯(lián)網(wǎng)用戶提供更好的增值服務(wù),普遍采用戰(zhàn)略合作或者收購等方式,掌握智能語音技術(shù),推廣語音服務(wù)。其中,百度語音助手是一款支持語音指令、語音搜索、語音對話功能的智能語音服務(wù)軟件。
第三類是創(chuàng)業(yè)企業(yè),像云知聲、思必馳等,他們專注于某些行業(yè)領(lǐng)域,比如汽車、家電、教育、社交網(wǎng)絡(luò)來推廣自己的語音技術(shù)和產(chǎn)品。小i機(jī)器人公司一直以來長期專注于智能機(jī)器人技術(shù)的研發(fā)及產(chǎn)業(yè)應(yīng)用。目前服務(wù)的用戶超過2億,每年有上百億次的對話互動。小i機(jī)器人廣泛應(yīng)用于互聯(lián)網(wǎng)、運營商、金融、航空、汽車、電子政務(wù)等領(lǐng)域。
在糾結(jié)中發(fā)展
望洋興嘆:海量知識vs技術(shù)局限
在“語音識別”方面,目前智能語音軟件的表現(xiàn)都不俗,但“語義分析”則不同,它需要軟件開發(fā)者掌握大量語言數(shù)據(jù)。互聯(lián)網(wǎng)中已經(jīng)積累了大量的用戶產(chǎn)生的知識,主要存在于以下這幾類網(wǎng)站中:一是問答類網(wǎng)站,如百度知道;二是維基百科;三是書籍電影等開放評價網(wǎng)站,如豆瓣;四是美食評價網(wǎng)站,如大眾點評;五是商品評價信息,如淘寶網(wǎng)。由于智能語音應(yīng)用尚未有能力整合這些互聯(lián)網(wǎng)的大量信息,無法提供全面的數(shù)據(jù)支持。此外,由于中文方言繁多,對口音甚至方言的識別,需要大量語料積累,非經(jīng)濟(jì)實力和用戶基礎(chǔ)雄厚不能做到。
一廂情愿:產(chǎn)品vs用戶認(rèn)可
經(jīng)過短暫的嘗鮮階段后,這些智能語音應(yīng)用似乎并沒有我們想象中的火爆。大多數(shù)用戶都把它們當(dāng)成了玩具,試用幾次后就不再感興趣,究其原因,是這種新型的交互方式不能滿足人們的剛性生活需求!2014第一季度中國手機(jī)輸入法市場季度監(jiān)測報告》顯示,在對手機(jī)輸入法用戶關(guān)于語音輸入調(diào)查中發(fā)現(xiàn),語音輸入使用場景限制太多,語音輸入率在用戶中仍然不高,完全不使用以及幾乎不使用語音輸入的用戶合計占比達(dá)67.9%。
整個市場從熱度轉(zhuǎn)換為實實在在的“力量”還有些距離。業(yè)界談?wù)摳嗟氖侨绾翁嵘夹g(shù)、突破技術(shù)難度,而不是順應(yīng)消費者需要,推出更多黏性強(qiáng)、服務(wù)能力強(qiáng)的應(yīng)用和產(chǎn)品。今后的語音技術(shù)和產(chǎn)品,應(yīng)該從技術(shù)導(dǎo)向向消費者導(dǎo)向轉(zhuǎn)移,企業(yè)應(yīng)該推出更多消費者愿意用、發(fā)自內(nèi)心喜歡用的語音產(chǎn)品和服務(wù)。
逆水行舟:投入vs產(chǎn)出
眾多競爭者的加入僅是一個開始,由Siri帶動的此輪“面向移動終端”的智能語音浪潮,盈利能力還有待觀察。從全球看,IBM、微軟、Nuance等跨國IT巨頭在語音識別技術(shù)上具有雄厚的綜合實力、技術(shù)基礎(chǔ)和行業(yè)經(jīng)驗,但是他們語音產(chǎn)品的盈利模式也尚在探討之中。目前,憑借“只要占領(lǐng)市場,取得盈利指日可待”的信念激勵著開發(fā)者向智能語音市場不斷沖鋒陷陣,“不拋棄,不放棄”的代價是否能讓市場埋單,依然是個未知數(shù)。
盲人摸象:行業(yè)發(fā)展vs市場標(biāo)準(zhǔn)
這一輪的智能語音熱潮起于蘋果公司發(fā)布智能語音工具Siri,但其漢語服務(wù)推出相對滯后,給中國本土公司以成長機(jī)會。我國智能語音產(chǎn)業(yè)正在快速發(fā)展,2013年,全球智能語音產(chǎn)業(yè)規(guī)模達(dá)到30億美元以上,其中我國智能語音產(chǎn)業(yè)規(guī)模超過15億元。然而,目前智能語音市場上有些公司開發(fā)的軟件還是以國外產(chǎn)品的漢化為主,缺乏獨立的市場創(chuàng)新。政府應(yīng)該積極推動建立市場標(biāo)準(zhǔn),扶持產(chǎn)業(yè)發(fā)展。
* * *
智能語音不僅僅是一款語音助手的應(yīng)用程序,與現(xiàn)實生活相結(jié)合,接地氣才能將其發(fā)揚光大。智能語音產(chǎn)業(yè)的特殊之處也就是在一定程度上依附于其他產(chǎn)業(yè)而存在,無論可穿戴、智能手表、智能家居、智能醫(yī)療和智能交通,未來每個領(lǐng)域都會進(jìn)行數(shù)據(jù)開放,智能語音將引領(lǐng)產(chǎn)業(yè)重大變革。而智能語音的特點是大量的積累,這就決定智能語音產(chǎn)業(yè)是“一根針刺破天”的專業(yè)領(lǐng)域,而不是用一個鐵錘砸出一片聲勢的產(chǎn)業(yè),需要深耕久釀。