這個(gè)場(chǎng)景你一定不陌生:一群人盯著手機(jī),仿佛要被那小小的玻璃屏吸進(jìn)去了。他們點(diǎn)啊,點(diǎn)啊,滑啊,等公交的時(shí)候是這樣,走路的時(shí)候是這樣,葛優(yōu)癱的時(shí)候是這樣,甚至是熱熱鬧鬧的派對(duì),也因?yàn)檫@樣而了無(wú)生趣。自從10年前iPhone帶著觸摸屏問(wèn)世以來(lái),人類(lèi)的整個(gè)世界,從抬頭便成了低頭。
今天,分析師預(yù)計(jì),全世界安卓設(shè)備超過(guò)20億臺(tái),蘋(píng)果設(shè)備也有7億臺(tái)。一整代人——尤其是印度和中國(guó)等市場(chǎng)——都通過(guò)手機(jī)上網(wǎng),敲鍵盤(pán)摁鼠標(biāo)的時(shí)代呼嘯而過(guò)。從前我們敲、敲、摁,現(xiàn)在我們點(diǎn)、點(diǎn)、滑。
這種火箭般的發(fā)展速度讓設(shè)備制造商們不禁幻想,如果再出現(xiàn)什么爆款產(chǎn)品該多好啊。但眼下來(lái)看,似乎還沒(méi)有什么能取代觸摸屏手機(jī)。你看,谷歌眼鏡、Apple Watch、Oculus Rift,這些前前后后問(wèn)世的產(chǎn)品,有哪個(gè)能讓大家把頭抬起來(lái)?我們?nèi)匀皇牵狐c(diǎn)、點(diǎn)、滑。
然而,當(dāng)我們把注意力都放在手腕和面部產(chǎn)品時(shí),另一重大科技轉(zhuǎn)變也在同時(shí)發(fā)生,并即將成為主流,這就是下一代計(jì)算界面——聲音。聲音也是世界上最古老的界面,我們通過(guò)它與他人交流,在文字和語(yǔ)言尚未誕生時(shí),聲音卻早已存在。
起初,我們并不全然清楚手機(jī)能夠引起多大的風(fēng)潮,因?yàn)樗B鍵盤(pán)都沒(méi)有。而如今,它讓我們足不出戶(hù),從一塊玻璃屏中審視著全世界的信息。這種手指控制的視覺(jué)系統(tǒng),原來(lái)?yè)碛腥绱藦?qiáng)大的力量。
然而,聲音是自智能手機(jī)出現(xiàn)以來(lái),人機(jī)交互歷史上最大的變革。當(dāng)語(yǔ)音設(shè)備出現(xiàn),大家都開(kāi)始說(shuō),好像缺了點(diǎn)什么:屏幕。尤其是對(duì)于我們大多數(shù)人來(lái)說(shuō),第一次和語(yǔ)音界面互動(dòng),就是通過(guò)觸摸屏手機(jī)—— Siri。
不過(guò),當(dāng)鍵盤(pán)消失的時(shí)候,有趣的事情也就發(fā)生了:計(jì)算更加私人了。很快,我們下達(dá)的指令不會(huì)再有多復(fù)雜,可能只是一句話(huà),可能是手指一點(diǎn),或一個(gè)手勢(shì),一個(gè)轉(zhuǎn)頭,甚至是臉上的表情。如果計(jì)算機(jī)能準(zhǔn)確解讀這些信號(hào),那么它們不僅能理解我們的表面意思,還能最終深入我們的大腦讀取思想。
在不久的未來(lái),語(yǔ)音計(jì)算將無(wú)處不在——汽車(chē)?yán)?,家具中,攪拌器,地鐵票柜臺(tái)等等,它們傾聽(tīng)我們的話(huà)語(yǔ),解讀我們的要求。
先進(jìn)的超級(jí)計(jì)算機(jī)將藏于日常物品中,你會(huì)問(wèn)你的路由器:“哎WiFi,你出什么毛病了?”或者冰箱,“給我推薦一個(gè)菜譜,把冰箱里快壞的蔬菜都用上?!鄙踔聊氵€可以問(wèn)房間,“我要不要加件外套?”
最棒的是,大多數(shù)人都能承受得起這些設(shè)備,而不只是那些科技達(dá)人。語(yǔ)音設(shè)備和鍵盤(pán)、鼠標(biāo)不同,不需要任何訓(xùn)練和聯(lián)系。未來(lái),你可以使用自然語(yǔ)言來(lái)操控語(yǔ)音設(shè)備,就好像跟你的孩子、同事對(duì)話(huà)一樣。
不過(guò),不要以為觸摸屏就這樣消失了。我們將生活在一個(gè)遍布攝像頭、觸摸屏、麥克風(fēng)和揚(yáng)聲器的世界,一切都連接在云服務(wù)商,它們會(huì)伴隨我們?nèi)ネ魈?,解讀我們的意圖,可能通過(guò)語(yǔ)言,可能通過(guò)手勢(shì),或者觸摸鍵盤(pán)。
歡迎來(lái)到“無(wú)所不計(jì)算”的時(shí)代。
亞馬遜 —— 崛起于“無(wú)屏”時(shí)代
Dotsy住在佛羅里達(dá)州棕櫚灘,她不肯告訴我她的年紀(jì)。“你可以谷歌??!”她大笑著說(shuō)道,“說(shuō)出這話(huà)其實(shí)讓我挺害怕的?!?
這位80幾歲的老人活得很酷,一個(gè)月前,她開(kāi)始學(xué)敲鼓,還跑到朋友家秀了一番。她總是把日程安排得很滿(mǎn),學(xué)習(xí)新東西。但在看東西上,Dotsy需要一點(diǎn)幫助。
Dotsy買(mǎi)了兩款亞馬遜產(chǎn)品,房間里的Dot(當(dāng)作鬧鐘用),和門(mén)廊上搭載了Alexa語(yǔ)音助手的智能音箱Echo。Alexa在Dotsy的生活總起著非常重要的作用,可以在她看不清東西的時(shí)候幫她一把?!拔矣X(jué)得報(bào)時(shí)功能非常實(shí)用!我視力不太好,看時(shí)間對(duì)我來(lái)說(shuō)是件很討厭的事?!?
因?yàn)橐暳ο陆?,Dotsy沒(méi)法用電腦,更別提手機(jī)。但她很喜歡問(wèn)Alexa問(wèn)題,或者讓Alexa給她讀書(shū)。
簡(jiǎn)單來(lái)說(shuō),Dotsy說(shuō),“Alexa棒呆了!”有時(shí)候,當(dāng)Alexa給出她滿(mǎn)意的答案時(shí),Dotsy會(huì)說(shuō):“謝謝你?!盇lexa回答她說(shuō),“很榮幸為您服務(wù)?!?
我們看到,對(duì)于那些沒(méi)有移動(dòng)設(shè)備或筆記本電腦的人來(lái)說(shuō),以人工智能為基礎(chǔ)的Echo是上網(wǎng)的好工具,而且它很強(qiáng)大。
當(dāng)然,Alexa和Echo還有很大的提升空間。比方說(shuō),Dotsy還沒(méi)法自己更改設(shè)置,因?yàn)樾枰贏lexa的應(yīng)用內(nèi)完成。盡管如此,亞馬遜還是通過(guò)Echo表達(dá)了其對(duì)語(yǔ)音計(jì)算的定位:用戶(hù)的私人空間。
在Alexa出現(xiàn)之前,谷歌和蘋(píng)果就已經(jīng)開(kāi)發(fā)了語(yǔ)音助手,但都和手機(jī)綁定在一起。這也就意味著,想要使用語(yǔ)音助手,你就得把它從口袋里掏出來(lái),手機(jī)沒(méi)電它也就用不了,如果手機(jī)落在別的地方,那就更別提了。Echo則完全不同,它鑲嵌在墻壁上,永遠(yuǎn)處于使用狀態(tài),永遠(yuǎn)在關(guān)注你,永遠(yuǎn)在傾聽(tīng)。而且,也不是你說(shuō)什么話(huà)它都會(huì)應(yīng)答的,只有在聽(tīng)到所謂“喚醒詞語(yǔ)”的時(shí)候——比方說(shuō)“Alexa”或“電腦”——它才會(huì)啟動(dòng)。當(dāng)你手頭上忙著自己的事情時(shí),它也僅支持幾個(gè)基本功能,比方說(shuō)你切著蔬菜,疊衣服或早晨穿衣服的時(shí)候,Echo可以給你弄個(gè)播客聽(tīng)聽(tīng),設(shè)置鬧鐘,開(kāi)開(kāi)燈或者預(yù)約出租車(chē)。
Alexa體驗(yàn)與Echo設(shè)備副總裁Toni Reid Thomelin表示:“現(xiàn)在許多個(gè)人助手使用時(shí)都存在痛點(diǎn)。在我們?cè)O(shè)想的未來(lái)里,痛點(diǎn)是不存在的。只有在科技“隱身”之后,用戶(hù)才可以更多體會(huì)到生活的美好。”
Alexa的出現(xiàn),給了沉睡中的科技公司一記當(dāng)頭棒喝。不過(guò),亞馬遜從來(lái)不肯公開(kāi)Echo的銷(xiāo)售數(shù)據(jù)(只說(shuō)每天有百萬(wàn)用戶(hù)對(duì)Alexa提出數(shù)百萬(wàn)問(wèn)題)。最近的一份調(diào)查顯示,自這款產(chǎn)品2014年上市以來(lái),其銷(xiāo)售量已經(jīng)增長(zhǎng)了一倍,預(yù)計(jì)用戶(hù)達(dá)到1070萬(wàn),而這當(dāng)中有許多人還購(gòu)買(mǎi)了不止一個(gè)Echo。
雖然和Siri以及谷歌助手相比,Echo所能觸及的用戶(hù)范圍還比較小,但它正日益成為主流產(chǎn)品之一,并擁有一眾狂熱粉絲,這可是其他私人助手望塵莫及的。在亞馬遜上,Echo共獲得29000條評(píng)價(jià),其中24000條對(duì)它予以肯定。
為了轉(zhuǎn)型成為電商巨頭,亞馬遜從最初的在線書(shū)店開(kāi)始,多年默默攻關(guān)語(yǔ)音AI技術(shù)。跟隨公司近20年的Thomelin表示:“很長(zhǎng)一段時(shí)間以?xún)?nèi),我們會(huì)在亞馬遜內(nèi)部使用機(jī)器學(xué)習(xí)算法。最初的時(shí)候,我們用它來(lái)開(kāi)發(fā)推薦系統(tǒng),后來(lái)推薦系統(tǒng)大獲成功之后,我們想,該怎樣將這項(xiàng)技術(shù)用在亞馬遜的其他方面呢?這時(shí)我們構(gòu)思出Echo的重要一步。”
云計(jì)算技術(shù)的突飛猛進(jìn)在Echo的開(kāi)發(fā)中也起了至關(guān)重要的作用。Thomelin說(shuō):“大約5年前,我們內(nèi)部看到云計(jì)算技術(shù)伴隨AWS飛速發(fā)展,于是我們決定利用好它,并開(kāi)發(fā)Echo這樣的產(chǎn)品系列?!?
不過(guò),Echo的魔力并不在于它有多聰明,而是它非常善于傾聽(tīng)。哪怕在房間對(duì)角,或者電視正在播著節(jié)目,它都能聽(tīng)到用戶(hù)的指示,其他只會(huì)說(shuō)“對(duì)不起,我沒(méi)聽(tīng)清”的語(yǔ)音助手則顯得遜色得多。
Alexa機(jī)器學(xué)習(xí)副總裁Rohit Prasad表示,剛開(kāi)始開(kāi)發(fā)語(yǔ)音用戶(hù)界面時(shí),團(tuán)隊(duì)都認(rèn)為這是一個(gè)遙不可及的想法?!按蠖鄶?shù)人,包括科技行業(yè)專(zhuān)家,都對(duì)語(yǔ)音識(shí)別充滿(mǎn)懷疑,認(rèn)為它沒(méi)法獲得較高的準(zhǔn)確率?!?
亞馬遜正在迅速推進(jìn)語(yǔ)音助手技術(shù)的研發(fā),僅Alexa一個(gè)部門(mén)就有數(shù)千人。與此同時(shí),該公司還大筆投資那些有意將Alexa整合進(jìn)其產(chǎn)品的公司,比方說(shuō)智能恒溫器制造商Ecobee,此前亞馬遜領(lǐng)投了該公司的一輪3500萬(wàn)美元融資。今年4月,Alexa語(yǔ)音服務(wù)副總裁Steve Rabuchin表示,團(tuán)隊(duì)現(xiàn)在的工作重點(diǎn)是將Alexa與其他產(chǎn)品進(jìn)行整合,包括可穿戴設(shè)備、汽車(chē)、家用電器,以及智能家居產(chǎn)品。
大規(guī)模推進(jìn)語(yǔ)音助手的開(kāi)發(fā)并不讓人驚訝。亞馬遜確實(shí)擁有了一款為人稱(chēng)道的AI助手,但和谷歌、蘋(píng)果甚至微軟相比,亞馬遜的動(dòng)作已經(jīng)晚了。而且,Alexa還面對(duì)著一個(gè)強(qiáng)有力的競(jìng)爭(zhēng)者,也就是我們無(wú)時(shí)無(wú)刻不帶在身邊的——手機(jī)。
蘋(píng)果 —— 優(yōu)勢(shì)明顯
2016年末,蘋(píng)果打敗三星成為世界第一智能手機(jī)制造商,僅第四季度就賣(mài)出7830萬(wàn)臺(tái)iPhone,同期三星產(chǎn)品銷(xiāo)售量為7750萬(wàn)臺(tái)。對(duì)此感到心慌的不光是三星,還有其他所有巨頭。畢竟,每一臺(tái)iPhone上都搭載了Siri。
2010年,蘋(píng)果收購(gòu)語(yǔ)音指令應(yīng)用開(kāi)發(fā)公司Siri,并在2011年的4S中得到整合。Siri首登市場(chǎng),就成了使用人數(shù)最多的語(yǔ)音助手。
唯一的問(wèn)題?Siri弱爆了。
雖然在這幾年里,它的識(shí)別能力已經(jīng)得到大幅提升,但是因?yàn)榉稿e(cuò)率高,Siri從上線的第一天就被無(wú)情吐槽。
去年10月,Siri迎來(lái)5周年生日,該應(yīng)用開(kāi)發(fā)人Julian Lepinski指出,用戶(hù)之所以無(wú)法和Siri建立“深厚的友誼”,是因?yàn)樗麄儽旧砭筒恍湃嗡?。“蘋(píng)果沒(méi)有考慮到錯(cuò)誤問(wèn)答帶來(lái)的嚴(yán)重性,用戶(hù)對(duì)Siri的信心從這里就開(kāi)始支離破碎了。”
目前,Siri是使用最為廣泛的語(yǔ)音助手,支持34個(gè)國(guó)家的用戶(hù)使用,有21種語(yǔ)言可選。谷歌助手支持7種語(yǔ)言,Alexa僅支持2種。但是,Siri卻沒(méi)有達(dá)到自己的目標(biāo)。蘋(píng)果透露,每周Siri會(huì)收到20億次提問(wèn),而全球iPhone活躍用戶(hù)達(dá)7億,也就是說(shuō),用戶(hù)每周只會(huì)問(wèn)Siri兩次問(wèn)題。
不僅如此,Siri還面臨著四面八方的競(jìng)爭(zhēng)?,F(xiàn)在,iPhone用戶(hù)可以選擇多款語(yǔ)音助手,各個(gè)紅著眼想成為用戶(hù)最心儀的對(duì)象。今年,亞馬遜在其iPhone應(yīng)用中整合了Alexa,谷歌也發(fā)布了iOS版本的谷歌助手。當(dāng)然,兩家公司的深入程度都還不及Siri。
與此同時(shí),蘋(píng)果也在極力扭轉(zhuǎn)Siri的形象。在2016年8月的一次采訪中,CEO蒂姆·庫(kù)克被問(wèn)到蘋(píng)果在人工智能上能否追趕Facebook、谷歌和亞馬遜,庫(kù)克回答說(shuō):“我不贊同你的問(wèn)題,你似乎暗示我們?cè)谶@方面落后于其他公司?!?
庫(kù)克宣傳說(shuō),Siri永遠(yuǎn)都陪著你,而且能夠保護(hù)隱私。
在今年1月的一次電話(huà)采訪中,庫(kù)克強(qiáng)調(diào),在推出HomeKit平臺(tái)之后,Siri已經(jīng)成為Echo想要成為的智能家居中心。他每天早上會(huì)對(duì)Siri說(shuō)早安,讓Siri打開(kāi)燈,然后開(kāi)始煮咖啡。
但在某些方面,Siri與Alexa還有些距離,尤其是第三方整合。2015年,亞馬遜開(kāi)始支持開(kāi)發(fā)者定制Alexa語(yǔ)音功能,如今已經(jīng)有超過(guò)12000項(xiàng)功能。蘋(píng)果也在謹(jǐn)慎、緩慢地向開(kāi)發(fā)者開(kāi)放資源,希望改變Siri在人們心中的形象。
谷歌 —— 學(xué)術(shù)“領(lǐng)袖”
在谷歌位于加州山景城的總部辦公室里,私人助手產(chǎn)品主管兼前Siri產(chǎn)品副總裁Gummi Hafsteinsson正揮舞著雙手,想要表達(dá)自己的觀點(diǎn)。
“交流不只是語(yǔ)音。如果我想交流,那用手就可以?!彼f(shuō)這,把手在空中揮了揮,“或者指著什么東西。語(yǔ)音是一種你來(lái)我往的信息交換,也是我們正在嘗試打造的東西。”
不久之前,在一年一度的I/O開(kāi)發(fā)者大會(huì)上,谷歌宣布對(duì)其助手進(jìn)行兩項(xiàng)更新,一是當(dāng)你無(wú)法大聲說(shuō)出某項(xiàng)請(qǐng)求時(shí),可以打字實(shí)現(xiàn);二是通過(guò)Google Lens讓谷歌助手“看到”這個(gè)世界。
谷歌采取的戰(zhàn)略和蘋(píng)果及亞馬遜完全不同,他們希望能維持對(duì)話(huà)的持續(xù)性,也就是讓用戶(hù)不斷和各類(lèi)設(shè)備進(jìn)行溝通。谷歌想做的不只是一款助手,雖然谷歌助手已經(jīng)登陸1億多臺(tái)設(shè)備,但他們更想做的,是讓人工智能適應(yīng)你所處的所有環(huán)境。
“關(guān)鍵問(wèn)題在于,即便在家里和車(chē)?yán)锸褂闷饋?lái)很便利,它還是要適應(yīng)其他場(chǎng)合的。一旦離開(kāi)汽車(chē),谷歌助手的能力立馬下降,如果能全天候不分場(chǎng)合保證服務(wù)質(zhì)量,那將是非常厲害的一件事?!?
谷歌從2012年起開(kāi)始開(kāi)發(fā)個(gè)人智能助手(當(dāng)時(shí)叫做GoogleNow)和語(yǔ)音搜索系統(tǒng),其中后者是Hafsteinsson于2008年推出的。去年秋天,谷歌推出智能音箱Google Home,功能類(lèi)似Echo,通過(guò)“OK,谷歌”或“嗨,谷歌”這樣的話(huà)觸發(fā)系統(tǒng)。
看起來(lái),亞馬遜和谷歌好像在玩一場(chǎng)貓捉老鼠的游戲,爭(zhēng)奪用戶(hù)起居室的控制權(quán)。今年2月,《時(shí)代》周刊報(bào)道稱(chēng),亞馬遜正在開(kāi)發(fā)叫做“Voice ID”的語(yǔ)音識(shí)別功能,讓Alexa能夠識(shí)別不同的聲音。兩個(gè)月后,谷歌宣布Home將支持語(yǔ)音識(shí)別。本月早些時(shí)候,亞馬遜推出Alexa語(yǔ)音和視頻電話(huà)功能;一周后,谷歌緊接著也宣布Home將支持語(yǔ)音電話(huà)。
那么,Home和Echo之間最大的區(qū)別是什么呢?那就是,谷歌Home更智能。谷歌所掌握的海量數(shù)據(jù)和先進(jìn)的機(jī)器學(xué)習(xí)技術(shù),讓Home成了目前市面上最強(qiáng)大的人工智能設(shè)備,準(zhǔn)確率達(dá)到95%。機(jī)器人能夠表現(xiàn)自然,有人的特性,根本原因就在于人工智能技術(shù),自2001年起,谷歌已經(jīng)在這方面的研究成果已經(jīng)有750篇論文。
Hafsteinsson表示:“谷歌在自然語(yǔ)言理解、深度學(xué)習(xí)、計(jì)算機(jī)視覺(jué)和用戶(hù)背景理解融合方面擁有豐富的經(jīng)驗(yàn),因此我們認(rèn)為自己能領(lǐng)先其他公司一大步。我們可以理解話(huà)語(yǔ)背后的意圖,從而更好地解決后續(xù)問(wèn)題,完成復(fù)雜的多步驟任務(wù)?!?
和其他私人助手不同的是,谷歌助手能夠準(zhǔn)確地理解上下文的關(guān)系。比方說(shuō)如果你問(wèn),“印度總統(tǒng)是誰(shuí)?”,然后你接著問(wèn)“他的生日是哪一天?”。谷歌助手可以準(zhǔn)確知道你說(shuō)的“他”是誰(shuí),但Alexa還不知道。
還不止如此,在機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù)的支撐下,谷歌助手可以教你如何用越南語(yǔ)說(shuō)“謝謝”,如何用意大利語(yǔ)說(shuō)“火車(chē)站在哪兒?”;在有了Lens之后,你還可以?huà)呙枞瘴幕驖h字翻譯出來(lái)。這些功能Alexa和Siri都做不到。
當(dāng)我們談?wù)搧嗰R遜Echo,谷歌Home,蘋(píng)果AirPods,或來(lái)自三星、微軟、IBM、百度的機(jī)器人時(shí),話(huà)鋒常常會(huì)轉(zhuǎn)移到機(jī)器人背后的人工智能技術(shù)、麥克風(fēng)陣列和云服務(wù)。這是必然的,因?yàn)檎沁@些技術(shù)讓語(yǔ)音計(jì)算成為現(xiàn)實(shí)。但從另一個(gè)角度來(lái)說(shuō),它們也只是速度和信息流的另一種形式。這些技術(shù)之所以能夠成為主流,在于它們相互結(jié)合的力量;而它們的進(jìn)一步發(fā)展,也讓消費(fèi)者能夠在自己家里享受到《星際迷航》中的無(wú)敵計(jì)算機(jī)。
未來(lái),這些助手的功能會(huì)更多,會(huì)更智能,更易理解我們的需求。它們會(huì)越來(lái)越像人,這不僅意味著它們將學(xué)會(huì)我們的語(yǔ)言,更意味著最終會(huì)學(xué)習(xí)到如何取代我們。今天,語(yǔ)音助手能控制家里的電燈,預(yù)定洗發(fā)水,非常強(qiáng)大,實(shí)用!但在以后,它們還會(huì)更加智能,比方說(shuō)學(xué)會(huì)調(diào)制咖啡,做賬、報(bào)道新聞,甚至推銷(xiāo)保險(xiǎn)。
去年,在Code Conference上,亞馬遜CEO杰夫·貝佐斯是這樣評(píng)價(jià)語(yǔ)音人工智能技術(shù)的,“這項(xiàng)技術(shù)在未來(lái)20年內(nèi)給社會(huì)帶來(lái)的影響,怎么形容都不為過(guò)?!?
人機(jī)互動(dòng)的下一次風(fēng)云轉(zhuǎn)變已經(jīng)來(lái)臨,你或許看不到它,卻親耳聽(tīng)到了它的影響。語(yǔ)音還只是第一步,更先進(jìn)的技術(shù)正逐漸走來(lái)。