專訪驀然認(rèn)知:AI是實(shí)現(xiàn)目的的工具 服務(wù)和產(chǎn)品才是未來(lái)

  來(lái)源:騰訊網(wǎng)韓依民2018-01-31
打印本文
核心提示:深藍(lán),,就是人工智能,。 整整20年前IBM公司創(chuàng)造的超級(jí)計(jì)算機(jī)深藍(lán)第一次戰(zhàn)勝了國(guó)際象棋世界冠軍卡斯帕羅夫,,而今天我們用它的名字來(lái)命名這個(gè)全新的人工智能報(bào)道品牌,。

導(dǎo)讀

深藍(lán),就是人工智能,。

整整20年前IBM公司創(chuàng)造的超級(jí)計(jì)算機(jī)深藍(lán)第一次戰(zhàn)勝了國(guó)際象棋世界冠軍卡斯帕羅夫,,而今天我們用它的名字來(lái)命名這個(gè)全新的人工智能報(bào)道品牌,。

從大部分人看不懂的理論到每一個(gè)人都會(huì)使用的產(chǎn)品,,技術(shù)到應(yīng)用的轉(zhuǎn)化,,通常與工業(yè)界的探索息息相關(guān)。在人工智能熱潮大背景下,,智能駕駛,、NLP/人機(jī)交互、圖像識(shí)別、語(yǔ)音識(shí)別,、大數(shù)據(jù),、智能硬件等不同分支都涌現(xiàn)了大量先行者。

無(wú)論是大公司還是初創(chuàng)企業(yè),,在追逐自己商業(yè)夢(mèng)想的同時(shí),它們的努力,,也將影響人工智能落地日常生活的具體形態(tài),。它們是將人工智能與普通人連接起來(lái)的橋梁,是窺探人工智能發(fā)展的一個(gè)窗口,。

為此,,深藍(lán)將對(duì)人工智能不同方向內(nèi)最具代表性的公司進(jìn)行報(bào)道,了解技術(shù),,剖析商業(yè),,一同看清潮水的方向。

語(yǔ)言是人類溝通的重要工具,,是人類傳達(dá)信息的基本載體,。NLP(自然語(yǔ)言處理)旨在幫助機(jī)器理解人類的語(yǔ)言,通過(guò)理解語(yǔ)言來(lái)理解人類的想法和意圖,,是人工智能中最具魅力和挑戰(zhàn)的問(wèn)題之一,。NLP的進(jìn)步,會(huì)直接影響人類與機(jī)器溝通的效果,。

因此,,深藍(lán)的第一個(gè)系列報(bào)道將以NLP為主題,我們選取了國(guó)內(nèi)NLP領(lǐng)域最具代表性的企業(yè),,圍繞他們的技術(shù)路徑,、商業(yè)模式,進(jìn)行深度解析,。

基本信息:

成立時(shí)間:2016年5月

產(chǎn)品名稱:Mor小驀機(jī)器人

團(tuán)隊(duì)情況:創(chuàng)始人戴帥湘,,原百度大搜主任架構(gòu)師

融資情況:

2016.12.31,A輪,,1000萬(wàn)美元,,經(jīng)緯中國(guó)、源碼資本,、襄禾資本

2016.06.30,,天使輪,200萬(wàn)美元,,襄禾資本,、經(jīng)緯中國(guó)

在電視上訂一杯咖啡,這是驀然認(rèn)知的員工最愛給訪客演示的產(chǎn)品之一。

看上去,,這與過(guò)去兩年O2O熱潮中涌現(xiàn)出的那批公司沒什么兩樣,,但實(shí)際上,驀然認(rèn)知是一家以NLP(自然語(yǔ)言處理)為主攻方向的人工智能初創(chuàng)企業(yè),,它的創(chuàng)始人來(lái)自百度,。

物聯(lián)網(wǎng)及人工智能技術(shù)進(jìn)步等多重因素,讓越來(lái)越多人將語(yǔ)音交互視為互聯(lián)網(wǎng)的下一代交互方式,,想想iPhone帶來(lái)的觸摸交互開創(chuàng)了一個(gè)怎樣的時(shí)代,,就不難理解下一代交互方式的巨大意義。但現(xiàn)實(shí)情況是,,當(dāng)下的語(yǔ)音交互距離理想狀態(tài)仍有很大差距,。

可觀的市場(chǎng)前景與巨大的現(xiàn)實(shí)落差往往意味著難得的淘金機(jī)會(huì),這吸引了大量的玩家投身其中,,戴帥湘及其創(chuàng)辦的驀然認(rèn)知便是其中一個(gè),。

身為驀然認(rèn)知的創(chuàng)始人,戴帥湘在百度搜索技術(shù)部門擁有超過(guò)九年的從業(yè)經(jīng)歷,。去年5月,,他選擇離職創(chuàng)業(yè),驀然認(rèn)知是他從大公司離開后,,為實(shí)現(xiàn)語(yǔ)音交互真正落地而開拓的一片新實(shí)驗(yàn)場(chǎng),。

在百度的九年里,戴帥湘的主要工作是分析用戶在搜索框中輸入的query究竟為何意,,理解它們是給出準(zhǔn)確搜索結(jié)果的前提,。

在驀然認(rèn)知的一年半時(shí)間里,戴帥湘的主要工作是讓用戶與機(jī)器之間的溝通從單次搜索進(jìn)化到多輪對(duì)話,,做到這一點(diǎn)是實(shí)現(xiàn)語(yǔ)音交互的前提,。

NLP仍是戴帥湘及其團(tuán)隊(duì)主攻的技術(shù)方向,但要達(dá)到理想效果,,意味著仍有多個(gè)技術(shù)難點(diǎn)需要解決,。

人工智能熱潮下,技術(shù)已經(jīng)成為創(chuàng)業(yè)者,、大公司甚至普通人津津樂道的話題,,而技術(shù)實(shí)力也決定著一家人工智能初創(chuàng)公司在投資者眼中的價(jià)值。因此,,技術(shù)顯然是驀然認(rèn)知得以成立,、運(yùn)轉(zhuǎn)、發(fā)展的支點(diǎn),,但卻并非它的終點(diǎn),,甚至在戴帥湘勾勒的商業(yè)版圖中,,技術(shù)也不是或者說(shuō)不是唯一核心。

在熱衷談?wù)摷夹g(shù)的新時(shí)尚下,,技術(shù)出身的戴帥湘有點(diǎn)反其道而行之,,他更樂意以技術(shù)為切入點(diǎn),講述驀然認(rèn)知規(guī)劃中更大的商業(yè)故事,。這是當(dāng)下人工智能創(chuàng)業(yè)熱潮中,,一個(gè)頗為另類的樣本。

從單輪到多輪

了解驀然認(rèn)知的技術(shù)路徑,,是了解它其他故事的前提,。

回到文章開頭的那個(gè)場(chǎng)景:在電視上訂一杯咖啡。這一過(guò)程可以更詳細(xì)的描述為:通過(guò)語(yǔ)音交互,,進(jìn)入訂咖啡的場(chǎng)景,,完成購(gòu)買咖啡的交易,。整個(gè)過(guò)程基于云端解決方案,,無(wú)需額外安裝服務(wù)應(yīng)用。

例如,,你可以直接對(duì)著電視說(shuō)“我要一杯美式咖啡和兩杯星冰樂”,,也可以進(jìn)行多輪對(duì)話,“星巴克最近有什么新品(出現(xiàn)篩選結(jié)果),,我要第一個(gè)(冰拿鐵),,確認(rèn)支付”,隨即就通過(guò)全程語(yǔ)音完成了訂咖啡的服務(wù)閉環(huán),。

上述交易包含如下環(huán)節(jié):語(yǔ)音識(shí)別,、語(yǔ)義理解、多輪對(duì)話,、調(diào)取服務(wù),、完成支付。其中,,語(yǔ)義理解和多輪對(duì)話是驀然認(rèn)知的技術(shù)核心,。在戴帥湘眼中,多輪對(duì)話的實(shí)現(xiàn)效果是這家公司在技術(shù)上的殺手锏,。

對(duì)機(jī)器說(shuō)一句話與對(duì)機(jī)器說(shuō)多句話,,在普通用戶的感知中差別并不大,但實(shí)際上,,這中間有很大區(qū)別,。

說(shuō)一句話的情形下,機(jī)器只需理解該句話的意思,,然后輸出一個(gè)結(jié)果反饋回去即可,。但在說(shuō)多句話的情況下,,機(jī)器需要記憶多句話內(nèi)容,并結(jié)合上下文語(yǔ)境,,才能理解用戶表達(dá)的真正意思,,進(jìn)而給出正確反饋。

“你說(shuō)一句話,,它就是一個(gè)動(dòng)作返回,;你說(shuō)多句話,它是一個(gè)動(dòng)作序列,。一個(gè)動(dòng)作序列就可以完成一個(gè)任務(wù)了,,所以這里面核心的,是一個(gè)連續(xù)對(duì)話的過(guò)程,?!?

單輪對(duì)話的典型場(chǎng)景是搜索,用戶輸入得到結(jié)果,,交互結(jié)束,。而多輪對(duì)話的典型場(chǎng)景目前仍存在于電影中,電影《Her》里如同真人陪伴般的語(yǔ)音助手是所有投身語(yǔ)音交互行業(yè)人員的終極夢(mèng)想,,目前沒有任何公司或團(tuán)隊(duì)真正實(shí)現(xiàn)上述效果,,大家在朝著同樣的目標(biāo)努力,盡管選擇的方式可能并不相同,。

戴帥湘懷揣同樣的理想:“我在百度做那么多年,,我一切的目標(biāo)就是讓機(jī)器能非常非常流暢的理解人的語(yǔ)言,特別是能做到上下文的連續(xù)理解,,現(xiàn)在你們可能叫多輪對(duì)話,,在我們看來(lái)就是一個(gè)上下文的連續(xù)理解?!?

百度的多年歷練讓戴帥湘積累了實(shí)現(xiàn)上下文連續(xù)理解的技術(shù)能力,,這一能力是構(gòu)建驀然認(rèn)知技術(shù)的基礎(chǔ)。

知識(shí)圖譜,、對(duì)話模型和學(xué)習(xí)系統(tǒng),,是驀然認(rèn)知發(fā)展多輪對(duì)話的技術(shù)路徑。戴帥湘告訴深網(wǎng),,驀然認(rèn)知在去年已經(jīng)把整個(gè)技術(shù)框架做出來(lái),。

而NLP、支持服務(wù),、對(duì)話,、學(xué)習(xí)則是驀然認(rèn)知整體架構(gòu)的四個(gè)核心。要真正理解驀然認(rèn)知在多輪對(duì)話上的實(shí)現(xiàn)效果,,需要將其放在驀然認(rèn)知的整體商業(yè)邏輯中,。

技術(shù)終將平庸

“通過(guò)技術(shù)掙錢的東西是不長(zhǎng)久的”,,在驀然認(rèn)知的辦公室里,戴帥湘對(duì)深網(wǎng)說(shuō)道,,“長(zhǎng)遠(yuǎn)來(lái)說(shuō)技術(shù)會(huì)變得平庸化,,二是技術(shù)會(huì)變得免費(fèi)起來(lái),所以你最終還是要有一個(gè)完整的產(chǎn)品和平臺(tái),,平臺(tái)要有盈利模式,。”

這一理解源于戴帥湘過(guò)往的從業(yè)經(jīng)歷:“我在百度也是做技術(shù)的,,我要把這些技術(shù)讓搜索產(chǎn)品,、廣告產(chǎn)品、貼吧,、知道用,,你必須站在它的角度著想,給它帶來(lái)流量,、收入,,帶來(lái)流量,你才能給搜索用,,帶來(lái)搜索,,才能給廣告產(chǎn)品用,,這是很現(xiàn)實(shí)的,。”

對(duì)技術(shù)的理念很大程度上決定了驀然認(rèn)知業(yè)務(wù)運(yùn)轉(zhuǎn)的邏輯,,驀然認(rèn)知不直接向客戶販賣技術(shù),,而是出售一套產(chǎn)品和解決方案,這套產(chǎn)品和解決方案不僅包括了其自研的多輪對(duì)話技術(shù),,還包括基于技術(shù)所延展出的硬件,、語(yǔ)音識(shí)別解決方案,以及更重要的,,技術(shù)所對(duì)接的服務(wù),。

這一鏈條中,語(yǔ)義理解,、多輪對(duì)話是驀然認(rèn)知的技術(shù)核心,,而硬件、語(yǔ)音識(shí)別以及服務(wù),,都通過(guò)第三方合作進(jìn)行,。

戴帥湘的辦公室被改造成了驀然認(rèn)知產(chǎn)品的展示中心,坐在深網(wǎng)面前,,他拿起了一個(gè)帶有語(yǔ)音輸入功能的電視遙控器,,用語(yǔ)音與電視交互,,要為在場(chǎng)的人各訂一杯咖啡。同時(shí),,他還通過(guò)電視遙控器,,演示了開關(guān)辦公室窗簾、臺(tái)燈的效果,。

根據(jù)介紹,,驀然認(rèn)知已經(jīng)對(duì)接的服務(wù)有外賣、電影票,,并正在接入更多的服務(wù),,如代駕、停車,、跑腿,、購(gòu)物等。

戴帥湘特別強(qiáng)調(diào),,驀然認(rèn)知的產(chǎn)品能直接用語(yǔ)音交互調(diào)取服務(wù),、進(jìn)入相關(guān)服務(wù)商的支付環(huán)節(jié),完成交易,。

在此之前,,其他一些語(yǔ)音交互產(chǎn)品到交易環(huán)節(jié),就必須依賴人工介入才能完成,。這里面考驗(yàn)的核心能力即語(yǔ)義理解和多輪對(duì)話,。

“其實(shí)我們整個(gè)多輪對(duì)話的框架沒怎么變化,從創(chuàng)業(yè)到現(xiàn)在基本上是這樣的框架,,我們不斷地優(yōu)化這個(gè)框架,,現(xiàn)在也沒人做到我們這個(gè)水平。所以我們有半年到一年的領(lǐng)先時(shí)間,,我現(xiàn)在發(fā)現(xiàn)其實(shí)我們領(lǐng)先的時(shí)間可能更長(zhǎng),。”

從接入的服務(wù)中獲得的數(shù)據(jù)對(duì)驀然認(rèn)知非常重要,,這些數(shù)據(jù)是驀然認(rèn)知不斷完善技術(shù)模型的材料,。戴帥湘介紹,驀然認(rèn)知的團(tuán)隊(duì)具備加工新數(shù)據(jù),、從已有數(shù)據(jù)中處理出有用數(shù)據(jù)的能力,,同時(shí),也有在小數(shù)據(jù)集上訓(xùn)練處有效模型的能力,。

將接入的諸如咖啡,、外賣、電影票等服務(wù)的數(shù)據(jù)進(jìn)行深加工,,同時(shí)將用戶的語(yǔ)言對(duì)應(yīng)到服務(wù)上,,接入交易的閉環(huán),。用特定場(chǎng)景下的數(shù)據(jù)不斷優(yōu)化模型,打造產(chǎn)品,,然后向客戶輸出,,這是驀然認(rèn)知的大概業(yè)務(wù)邏輯。

這意味著,,驀然認(rèn)知不僅需要做好技術(shù),,還需要有連接服務(wù)的能力。

拓展場(chǎng)景

“對(duì)話即應(yīng)用”,,這是驀然認(rèn)知提出的一個(gè)概念,,這個(gè)概念的核心理念是用戶可以通過(guò)語(yǔ)音交互直接調(diào)取各種服務(wù),其中蘊(yùn)含的不僅是產(chǎn)品形態(tài),,還有商業(yè)模式,。

驀然認(rèn)知市場(chǎng)總監(jiān)龔思穎介紹,是否能夠滿足用戶的頭部需求是他們選擇接入服務(wù)的評(píng)價(jià)標(biāo)準(zhǔn),。

“不管是Echo也好,,還是國(guó)內(nèi)之后跟風(fēng)的這些音箱也好,都沒有真正把語(yǔ)音交互落地,,為什么,?因?yàn)樗械臇|西都沒有解決用戶的頭部需求,沒有解決用戶的頭部需求,,你就很難讓用戶去用你的語(yǔ)音,。”談及為何要接入服務(wù),,驀然認(rèn)知市場(chǎng)總監(jiān)龔思穎如此解釋,。

那么什么是真正的頭部需求,?在龔思穎看來(lái),,頭部需求就是衣食住行,因此當(dāng)前驀然認(rèn)知已經(jīng)接入的都是與日常生活相關(guān)的基本服務(wù),。

接入服務(wù)對(duì)驀然認(rèn)知的商業(yè)模式意義重大,,戴帥湘介紹,接入服務(wù)本身就是有價(jià)值的,,當(dāng)語(yǔ)音交互占領(lǐng)了越來(lái)越多的設(shè)備,,服務(wù)商必然需要通過(guò)新的渠道觸達(dá)用戶;而在接入服務(wù)的同時(shí),,驀然認(rèn)知可以基于對(duì)用戶的了解,,推送精準(zhǔn)廣告;一旦發(fā)生交易,,驀然認(rèn)知,、服務(wù)商,、設(shè)備商三方會(huì)進(jìn)行分成,未來(lái),,基于傳感器或者用戶歷史行為,,驀然認(rèn)知可以主動(dòng)為用戶推薦產(chǎn)品。

“我們是一個(gè)2B2C的模式,,用戶不一定需要知道他使用的產(chǎn)品是驀然認(rèn)知提供的,,但是我們2B的最終目的是2C?!?

根據(jù)設(shè)想,,驀然認(rèn)知可以通過(guò)2B2C的模式獲得用戶并贏得商業(yè)回報(bào),實(shí)現(xiàn)理想效果的前提是獲得客戶,、進(jìn)入更多設(shè)備,、接入更多服務(wù)、提升產(chǎn)品體驗(yàn),。

目前,,驀然認(rèn)知正努力在家和車的兩個(gè)垂類中拓展場(chǎng)景,戴帥湘透露,,他們已經(jīng)與四大電視廠商和兩大車廠達(dá)成了合作,,不過(guò)由于需配合合作方的節(jié)奏,現(xiàn)在尚不能透露具體廠商名稱,。

在進(jìn)入家庭和車內(nèi)場(chǎng)景后,,驀然認(rèn)知的下一步是計(jì)劃擴(kuò)展并打通更多設(shè)備,“優(yōu)先做電視和汽車兩個(gè)垂直的場(chǎng)景,,好好把這個(gè)場(chǎng)景做好,,交互得舒服,然后再以這兩個(gè)為中心擴(kuò)展周邊的設(shè)備,?!?

對(duì)于技術(shù)男戴帥湘而言,當(dāng)下最大的挑戰(zhàn)來(lái)自于市場(chǎng),。怎樣讓更多目標(biāo)客戶真正成為合作伙伴,,需要不斷的向?qū)Ψ捷敵鲇^點(diǎn)。

龔思穎告訴深網(wǎng),,他們與車廠的合作就受到市場(chǎng)環(huán)境的很大影響,,今年CES上福特與亞馬遜的合作是一劑催化劑,直接促使驀然認(rèn)知在落地車企上取得了實(shí)質(zhì)性進(jìn)展,。

要實(shí)現(xiàn)目標(biāo),,落地還需加快,而除了依賴大環(huán)境的轉(zhuǎn)變,接下來(lái)這家人工智能初創(chuàng)公司,,還需在市場(chǎng)和商務(wù)上,,接受更多考驗(yàn)。

(編輯:此夕)


 

免責(zé)聲明:

1,、本網(wǎng)內(nèi)容凡注明"來(lái)源:315記者攝影家網(wǎng)"的所有文字,、圖片和音視頻資料,版權(quán)均屬315記者攝影家網(wǎng)所有,,轉(zhuǎn)載,、下載須通知本網(wǎng)授權(quán),不得商用,,在轉(zhuǎn)載時(shí)必須注明"稿件來(lái)源:315記者攝影家網(wǎng)",,違者本網(wǎng)將依法追究責(zé)任。
2,、本文系本網(wǎng)編輯轉(zhuǎn)載,,轉(zhuǎn)載出于研究學(xué)習(xí)之目的,為北京正念正心國(guó)學(xué)文化研究院藝術(shù)學(xué)研究,、宗教學(xué)研究,、教育學(xué)研究、文學(xué)研究,、新聞學(xué)與傳播學(xué)研究,、考古學(xué)研究的研究員研究學(xué)習(xí),并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),。
3,、如涉及作品、圖片等內(nèi)容,、版權(quán)和其它問(wèn)題,,請(qǐng)作者看到后一周內(nèi)來(lái)電或來(lái)函聯(lián)系刪除。