但實(shí)際上,人類之間的語音交互都會拉開一定距離。所以,現(xiàn)在我們開始需要機(jī)器適應(yīng)人類的遠(yuǎn)場語音交互。
機(jī)器適應(yīng)人類,這可以說是計算機(jī)技術(shù)的一個巨大進(jìn)步,也是人工智能得以實(shí)現(xiàn)的核心要素之一。
這并非聲學(xué)領(lǐng)域特有的問題,當(dāng)汽車安裝攝像頭和雷達(dá),以及自行車安裝 GPS 時,場景變化帶來的技術(shù)挑戰(zhàn)才會凸顯出來,因為真實(shí)場景所需要的技術(shù)并非是簡單升級而是顛覆性創(chuàng)新。這也是當(dāng)前技術(shù)型創(chuàng)業(yè)公司被青睞的主要原因。
然而,單一傳感方式所帶來的影響總是有限,不足以推動整個技術(shù)和社會的變革。例如,麥克風(fēng)陣列可以采集人類自然對話的語音信息,從而逐漸演化、理解人類語言。這意味著將來機(jī)器可以讀懂我們的思想,十分可怕。但這種理解其實(shí)還比較片面,缺乏圖像、位置等其他傳感信息的支持。
從這個層面來說,人工智能必須融合多種傳感方式,而非局限于聲、光、電、熱、力、磁,再加上強(qiáng)大的計算和存儲能力,才能在某些領(lǐng)域超越人類,從而看懂世界,推動更多新商業(yè)模式的誕生。
當(dāng)機(jī)器獲取的融合數(shù)據(jù)足以覆蓋人類產(chǎn)生的數(shù)據(jù)的十分之一時,大多時候,人類只需要說一說、看一看或者想一想,機(jī)器就能捕捉到背后的思想。
未來到底會產(chǎn)生哪些新的商業(yè)模式,我們尚不可知。但有一點(diǎn)可以肯定,廣告模式肯定不是人工智能時代的商業(yè)模式