目前,TWS耳機依舊是一個重“聽”的功能硬件,但隨著微軟、百度等互聯網公司進入,TWS人工智能交互時代已然來臨,耳機不僅會聽,還會說。
12月29日,旭日大數據將在深圳深鐵皇冠假日酒店舉行全球TWS開發者大會暨TWS產業領袖峰會,屆時,微軟(中國)有限公司首席技術顧問管震蒞臨現場,發表《人工智能是如何幫耳機聽懂用戶的》主題演講。
TWS耳機會說話?乍一聽,或許你我都很難相信,不過管震告訴數據君,微軟的人工智能技術已經可以實現這一點,只不過硬件上還沒有落地。
管震坦言,微軟有深厚的人工智能交互技術積累,但沒有真正落地TWS耳機,需要與產業鏈企業有更多合作。“我們只有技術上的想像,結合硬件的很多想像是微軟想不出的,希望借助這次全球TWS開發者大會推一把,和更多產業鏈同仁擦出火花。”管震表示。
TWS+人工智能
微軟在人工智能技術上的積累與沉淀,應用于TWS耳機使之成為語音交互的入口,有無限的想象空間。
“一是從語音到語義的理解,即Speech To Text,人工智能把人聲準確轉化成文字;二是高度模擬人聲語音輸出,也就是Text To Speech,人工智能輸出的聲音并非機器聲,而是有恐懼、高興、煩躁、傷心等十幾種情緒人聲;三是理解交互內容,用戶可在同一場景下與人工智能多輪對話,層層深入,直到問題解決。”管震表示。
簡而言之,微軟的人工智能技術能夠在內容深度理解的基礎上,提升語音交互的體驗感。
也就是說,當你戴著耳機和人工智能對話,就像和一個有豐富情緒的人溝通,電影《Her》中的“虛擬女友”似乎近在咫尺,在你提問時以更具人情味的方式給你意想不到的回答,想想都激動。
當然,這不是誰都能做的。相比普通TWS廠商,互聯網公司、人工智能技術公司在實現TWS智能化上更占優。
“這個事情不是那么容易做的,沒有互聯網平臺支持,最終的功能不會那么好。”12月11日,深圳市三諾數字科技有限公司耳機業務總經理湯磊光與數據君探討TWS翻譯耳機時表示。
2019年,微軟發布了一款TWS耳機Surface Earbuds,除了60國翻譯功能、也支持微軟Microsoft Teams、Office 365服務,此外還有Cortana語音助理。
這只是微軟的一款常規型TWS耳機,雖然有Cortana語音助理,但并非是人工智能語音交互,因為Cortana和蘋果siri、華為小藝都是任務型交互,即一問一答,執行單一任務,無法形成多輪對話,當然,這也是目前智能語音助手普遍存在的弊端。
微軟能夠實現的,就是在特定場景下形成多輪有效溝通,促進一個問題解決。
“比如我在機場,戴著耳機執行從買票,選地點、選艙位、選優惠套餐再到付款等一系列步驟,和人工智能的對話會層層遞進,如果問完一個問題喚醒一次再問,還不如手動操作方便。”管震笑著說。
人工智能+內容服務
隨著TWS耳機逐漸走向智能化,人工智能交互技術與內容服務的結合也早已啟動。例如酷狗TWS音樂耳機、喜馬拉雅TWS聽書耳機、百度翻譯TWS耳機……
管震表示,內容廠商最終目的還是要靠內容服務賺錢。雖然內容廠商和硬件廠商合作推出了與各自APP深度綁定的TWS耳機,可通過語音操作APP大部分功能,但從未來看,內容廠商一定會把自己這套內容服務的SDK開放給所有TWS耳機廠商。
或大膽猜測,未來所有品牌TWS耳機不僅會接入喜馬拉雅,還會接入酷狗、QQ音樂、網易云音樂等手機內容APP。
“未來TWS內容服務是能力與能力的結合,而非誰獨占誰。”管震表示,在他看來,微軟的人工智能交互技術能輔助內容服務賦能TWS耳機,雙方可以互幫互助。
松耦合還是緊耦合
目前,蘋果、華為等品牌手機廠商,都在努力以內容服務為核心,延伸硬件產品,內容服務主要集成在手機上。
“TWS耳機還是要和手機連接,即便手表早已可插eSIM卡成為獨立的智能終端,但對于依賴手機的大多數人來說,還是習慣連接手機。”小雅智能TWS聽書耳機發布后,數據君第一時間致電喜馬拉雅中層,對方這樣告訴數據君。
不過在管震看來,內容服務既可以放在手機上,也可以放在耳機、云端、5G基站。
“云邊端未來可能是混合模式,可根據場景和不同需要來設計TWS應用的技術架構。”也就意味著,TWS耳機脫離手機并非沒有可能,相反,在不同的特定場景下都有很大的想象空間。
“未來TWS耳機與手機的關系,是松耦合,非緊耦合。”管震表示,如果是緊耦合,廠商希望把所有周邊IOT產品捆綁在手機上,但場景限制多,例如戴著TWS耳機跑步時不得不帶上手機;如果是松耦合,則不一定要以手機為中心,只要后端有內容服務支持,在特定場景下TWS耳機可以獨立實現特定功能,比如跑步時只戴一個TWS耳機,不帶手機進工廠、用TWS耳機替代對講機工作……
12月29日,管震將來到全球TWS開發者大會,深度剖析有關微軟對人工智能與TWS耳機結合的未來發展前景,會議詳情如下。