指紋識別自20世紀初開始在警用領域獲得應用,到2013年后借助在智能手機等消費電子市場的快速爆發走入大眾視野,用了近100年;而人臉識別只用了五六年就造就了商湯、依圖、曠視、云從等“獨角獸”企業,并在安防領域廣泛應用。這個令人驚嘆的發展速度背后,是人工智能產業憑借深度學習算法上取得的突破、并在計算機視覺領域應用的結果。同樣應用深度學習算法技術的計算機聽覺與生物識別的結合——聲紋識別,或將成為繼人臉識別之后的下一個爆發的增長點。作為國內屈指可數的聲紋識別技術開創者是如何看待這項技術未來的發展?聲揚科技聯合創始人、CEO李亞桐近日在36氪WISE超級進化者大會的主題演講中,分享了他作為生物識別從業者十五年來的洞見與思考。
身份認證需求升級推動AI技術與生物識別加速融合
近20年來,隨著互聯網和移動互聯網的快速發展,人們生活、工作、交流的方式都發生了翻天覆地的變化,越來越多原先“需要本人到現場辦理”的事項,都可以通過打電話、發短信、上網或在手機APP上操作來遠程自助辦理,隨之而來的是在沒有本人到場時仍能準確認證身份的安全問題——身份證件、數字密碼等存在的造假盜用成本低、容易丟失遺忘等弊端,引發了人們對更高安全性、便捷性的身份認證方式的需求,而指紋、人臉、聲紋、虹膜、DNA等生物識別方式憑借“不會丟、不會忘、不易仿冒”的特性成為了身份認證的主要方式。而人工智能技術的發展應用在生物識別領域,大大提升了效率、準確率和體驗。“時不時會有人問我,人臉識別、指紋識別已經很好用了,你們做聲紋識別如何與這些技術競爭?”
聲揚科技李亞桐演講時說到,“各項生物識別技術都存在自身的局限性、應用場景的無限豐富性這些問題,比如很多老人的指紋已經磨損難以識別、打電話的過程中難以采集人臉和指紋等。因此,沒有任何一種生物識別技術可以滿足所有場景的需要,多種生物識別結合使用也成為滿足安全性、易用性和成本控制等方面的綜合需要。所以,聲紋識別與人臉識別或者指紋識別不是對立、競爭的關系,而是融合、互補的關系,實現1+1>2的效果。”
“錦上添花”和“非它不可”如何選擇
不同于指紋、虹膜、人臉等靜態的生理特征,聲紋蘊含于千變萬化的動態語音之中。即便同一個人兩次讀相同的內容,也不一定能發出完全相同的聲音。正是聲紋這種“蘊不變于萬變中”的特性,使得聲紋特征偽造起來更為困難,因此認證強度更高、更安全。同時,人類語音中還蘊含著說話內容、語義、語氣、語速、發音等豐富的信息,可與聲紋識別結合進一步加強安全性。
正是關注到了聲紋作為動態行為特征在應用中帶來的安全性和易用性,扎根生物識別行業十五年的聲揚科技CEO李亞桐,在完整經歷了指紋、掌紋、靜脈、虹膜、人臉識別的應用發展后,選擇將聲紋識別技術直接應用到對安全等級要求最高的領域。
“創業之初,聲揚科技就掌握聲紋識別、語音識別、前端語音信號處理等多項技術,在尋找落地應用場景時,我們把能為客戶創造獨特價值放在第一位。我們認為好的AI技術應該是可靠的工具而非玩具,用語音識別身份在一些場景下非常有必要。比如幫助銀行、保險、社保等金融機構識別欺詐行為、降低貸款壞賬率、識別騙保行為、減少養老金流失等,又比如在公安系統內利用語音作為電子物證,縮小嫌疑人偵查范圍、加快案件偵破速度、甚至對潛在的犯罪行為進行監測預警等,這才是我們技術創新者最期待看到的。”
經得起高安全應用場景考驗的聲紋識別,才能玩得轉下一個十年的語音交互
人工智能技術的發展在近60年來經歷三起三落,資本市場目前對于人工智能企業也從狂熱趨向于冷靜務實,技術壁壘與落地應用、平衡當前與未來巨大的技術研發投入和營收回報,是投資人同等看重的。李亞桐也在演講中分享了聲揚科技的未來戰略,他認為在未來兩到三年,只有經過金融業、公安部門對安全、性能、技術、服務要求最苛刻的檢驗和打磨,再面向更多通過金融和公安領域認識到聲紋識別技術價值的行業去應用時,才會帶來符合用戶對智能語音交互預期的體驗,從而推動整個智能語音產業持續發展。而聲揚科技也會在智能語音發展的浪潮中,堅持技術創新并將新技術投入社會最需要、哪怕是最難的領域,讓AI真正發揮價值。