Kinect或?qū)⒊蔀榈谌稳藱C交互革命的原點,不僅因為其全新的操作方式,更因為其背后所蘊含的創(chuàng)新精神。
2010年11月初,微軟家用視頻游戲主機Xbox 360的體感外設(shè)Kinect正式公開銷售,之后在包含圣誕假期在內(nèi)的60天內(nèi),Kinect共賣出去800萬臺。
“在大多數(shù)商店,Kinect確實都已經(jīng)賣光了。”微軟亞洲硬件中心總經(jīng)理胡君明在接受采訪時說。他還提到一件趣事,微軟亞太研發(fā)集團主席張亞勤在 CES(美國消費電子展)期間,想在洛杉磯買幾臺Kinect,卻發(fā)現(xiàn)到處斷貨,連微軟自己的員工商店都賣光了。最后他回到雷德蒙,在微軟總部的商店才買到。由此可見市場的火爆。
在如此短的時間內(nèi)賣出800萬臺,這實在是一個令人咋舌的數(shù)字。如果簡單對比,Kinect的銷售速度是iPad的兩倍;再以收入規(guī)模考量,只用了兩個月的時間,它就變成了一個價值10億美元以上的生意。
毫無疑問,Kinect已經(jīng)成為微軟最為耀眼的新星,也是這家軟件巨人歷史上在硬件外設(shè)領(lǐng)域最成功的產(chǎn)品。微軟在硬件上如此吸引人眼球,還是在5年前Xbox 360游戲機發(fā)售的時候。
在全球一片暮氣沉沉的家用游戲機市場,Kinect重新喚回了大眾的激情——用它近乎神奇的人機交互方式。借助Kinect,普通人不需要使用任何手柄、搖桿、鼠標(biāo)或者其他遙控器,即可用身體直接控制游戲。
比如要玩體育游戲,你只需要接通電源,然后站到電視機前面即可。所有對游戲角色的操控都用一種最自然的方式完成,不管是乒乓球的揮拍還是保齡球的擊打,你只需要像現(xiàn)實中那樣擺出動作即可。
又比如賽車,如何控制方向?想象你真的在開車,把雙手舉到空中就像握著一個方向盤,左右轉(zhuǎn)動就行了。對了,你還可以在空中模擬掛擋。
與其將這稱之為“體感”,不如說是“自然人機交互”。在拋開遙控器之后,人能夠以身體最自然的方式與終端進(jìn)行信息的交互并完成互動。Kinect有句廣告語——“You are the controller”(你就是遙控器),不需要去適應(yīng)游戲手柄上的搖桿和按鍵,普通人玩游戲的門檻被大大降低。
有許多變革是由娛樂開始,而Kinect或許正是人機交互方式變革的又一個起點。
Kinect是如何煉成的
對微軟而言,Kinect的重要性表現(xiàn)在兩個方面:它大大延長了Xbox 360游戲機的生命周期,并成功為它帶來了大量新用戶;它證明了微軟有時候并不保守,在創(chuàng)新上仍然具有巨大的能量,不管是觀念的前瞻性還是對新產(chǎn)品的執(zhí)行力上。
但這樣一款產(chǎn)品,在其研發(fā)階段的初期卻并不被人所看好。“我們最初都覺得這個項目難以成功,它涉及太多技術(shù),包括紅外線視頻捕捉等,而其中一些技術(shù)并不是微軟的。”微軟亞洲工程院院長張宏江說,“但最后圍繞產(chǎn)品,通過合作等形式,Kinect整合了微軟內(nèi)外部的種種技術(shù),走到了最后。它不僅是一個產(chǎn)品的成功,也為我們從工程學(xué)的角度去思考如何做產(chǎn)品,提供了一個很好的例證。”
時間回到2008年夏天,以色列一家名為Prime Sense的公司來到硅谷,向許多企業(yè)展示他們革命性的3D圖像識別及動作捕捉技術(shù),這一技術(shù)能夠讓用戶以身體替代遙控器。技術(shù)迅速引起了一票游戲、科技和消費數(shù)碼公司的注意,其中就包括了剛以多點觸摸的技術(shù)引領(lǐng)潮流的蘋果公司。
據(jù)該公司首席執(zhí)行官Inon Beracha回憶,“蘋果實在討厭”,雖然這一技術(shù)與蘋果公司有著許多天然的共性,但蘋果迅速拿出一系列法律文檔和保密協(xié)議,嚇退了Beracha。
與此同時,微軟游戲開發(fā)部門也盯上了該技術(shù)。此時,正是任天堂Wii游戲機如日中天的時候,Wii游戲手柄新奇的人機互動方式激發(fā)微軟和索尼開始尋找相關(guān)領(lǐng)域的機會。雖然有許多人認(rèn)為“Natal”(Kinect開發(fā)代號)的想法過于激進(jìn),對其能否量產(chǎn)化存在疑慮,但“讓用戶有與Wii完全不同的體驗”最終占據(jù)了上風(fēng)。
在1年多的時間里,從技術(shù)概念到產(chǎn)品實現(xiàn),中間許多設(shè)計幾經(jīng)改動。胡君明舉了一個例子:美國設(shè)計的產(chǎn)品原型要求Kinect必須放兩個麥克風(fēng),這樣就能隔離噪音,但麥克風(fēng)的角度應(yīng)該怎么放才能達(dá)到最好效果?“在我們深圳的聲學(xué)實驗室嘗試了很多次,原來是45度,再到46度,現(xiàn)在改成50度。這個變化并不大,但許多細(xì)節(jié)累積起來,指引我們向著最佳體驗的方向走。”
真正游戲的時候,這種感覺更加明顯。當(dāng)玩家的虛擬形象站在大體育場上的時候,如果揮動手臂,會發(fā)現(xiàn)觀眾會與你互動;擲標(biāo)槍的時候,玩家跑步的頻率會決定他的速度,投擲的角度也被完全識別,并最終表現(xiàn)在成績上。
革命性的技術(shù)——3D圖片識別與視頻捕捉,加上硬件體驗的不斷優(yōu)化,再加上對應(yīng)其特性的專屬游戲開發(fā),在游戲這一特定的應(yīng)用場景對技術(shù)的強化,最終塑造了Kinect這一人機互動的革命性產(chǎn)品。
跳出游戲
雖然從Xbox和相關(guān)游戲出發(fā),但Kinect生來具有強大的外延性。捕捉動作、識別成命令、在終端中執(zhí)行,當(dāng)它從以色列Prime Sense那幫軍工工程師的實驗室中走出來,在微軟的推動與整合下成為普通人可以輕易獲取的具體產(chǎn)品之后,它馬上引爆了全球用戶的想象力。
雖然不符合商業(yè)規(guī)范,但Kinect的破解方法迅速流傳在互聯(lián)網(wǎng)上,用戶主動地去不停延展它的邊界。首先,開發(fā)者或說“黑客”們想辦法讓它與PC連接起來,在此基礎(chǔ)上,許多富有想象力的應(yīng)用場景開始陸續(xù)出現(xiàn)。
有些是惡搞,比如有人將它連在了“超級馬里奧”游戲上,用身體去控制馬里奧頂磚頭、下水管、吃蘑菇,樂趣雖然增添了很多,但要想救下公主,玩家身體要頻繁運動,需要足夠的體力支撐。還有一些是實用派,直接用體感來打開瀏覽器上網(wǎng),將身體的各種運動方法變成了鼠標(biāo)點擊的各項命令。最近出來的一項應(yīng)用,是在一個虛擬世界,讓玩家能以各種動作來搭建萬物,體驗做上帝的樂趣。
顯然,微軟也看到了Kinect的外延趨勢勢不可當(dāng),但其路線將會符合微軟的自身戰(zhàn)略。在2011年的CES上,微軟展示了Kinect基于虛擬形象的又一項應(yīng)用場景——社交。因為本身自帶攝像頭、麥克風(fēng),Kinect能夠迅速識別人臉并轉(zhuǎn)化為每個人獨有的虛擬形象,而新的應(yīng)用場景允許多個虛擬形象聚集在一個房間之中聊天說話,所有的動作實時捕捉。這使得相隔很遠(yuǎn)的朋友們能夠在一個互聯(lián)網(wǎng)中的房間更加充分地互動,同時又具有游戲的某些樂趣。在 Kinect的社交方式強化了Xbox Live之后,后者能夠延伸到其他終端產(chǎn)品上,比如Windows Phone 7,并借助大量的新用戶信息,串起這些產(chǎn)品。
據(jù)悉,微軟的下一代操作系統(tǒng)Windows 8將會支持Kinect,這或許是一次里程碑式的兼容——它將標(biāo)志著Kinect從游戲外設(shè)的定位中走出來,與鼠標(biāo)、鍵盤、攝像頭一起,成為新的普遍意義上的人機交互工具。
人機交互的三次革命
從世界上有計算機開始,人機交互就伴隨著計算機的進(jìn)化而進(jìn)化。這在很大程度上是顯而易見的,因為我們必須讓計算機讀懂我們所輸入的命令,并根據(jù)命令來運算和反饋。所謂人機交互,就是人與計算機打交道的方式。
這一歷史最早可追溯到1880年,美國人口調(diào)查局的赫曼·霍列瑞斯由于疲于手工處理人口普查數(shù)據(jù),開始尋求用機器制表的方式。其成果是穿孔卡計算機的出現(xiàn),而霍列瑞斯也因此被稱為“數(shù)據(jù)處理之父”。現(xiàn)在的人很難想象,原始的人機交互就是通過“卡槽”來定位信息,然后用機器來讀懂它。
一直到真正的計算機出現(xiàn),都沿用著打字機時代“鍵盤”這一傳統(tǒng)人機交互方式。但1983年,鼠標(biāo)出現(xiàn)了。
鼠標(biāo)的學(xué)名叫“顯示系統(tǒng)縱橫位置指示器”,其原理和用法不用贅述。與鍵盤中的方向鍵相比,它顯然更加符合人的自然習(xí)慣。這是人機交互的第一次革命,鼠標(biāo)也已經(jīng)成為今天絕大多數(shù)電腦用戶不可或缺的工具。
值得一提的是鼠標(biāo)的普及路徑。1983年,第一款鼠標(biāo)是伴隨蘋果公司Lisa電腦發(fā)布的;隨后不久,微軟操作系統(tǒng)Windows 3.1宣布對其兼容,然后從Windows 95開始,鼠標(biāo)伴隨操作系統(tǒng)和電腦的普及開始變成標(biāo)配產(chǎn)品——這與今天Kinect的路徑似乎異曲同工,只不過我們還不知道微軟能將操作系統(tǒng)與 Kinect兼容到何種程度,或者是否會為Kinect開發(fā)出全新的操作界面與操作方式。
鍵盤與鼠標(biāo)的人機交互組合,從PC時代一直延續(xù)到互聯(lián)網(wǎng)時代,并無太大改變,直到智能手機和多點觸摸的出現(xiàn)。
迅速普及的多點觸摸技術(shù),是人機交互史上的第二次革命,而引領(lǐng)它的又是蘋果公司與它的革命性手機iPhone。
在iPhone問世之前,智能手機一直在沿襲鍵盤和鼠標(biāo)的信息輸入方式。鍵盤是必須有的,不能少于10個;鼠標(biāo)太大,對位置的指示采用觸摸的方式完成。
但多點觸摸打開了另外一扇窗戶,它讓所有人意識到其實鍵盤可以成為觸摸的一部分,而很多命令其實能通過多個手指在觸摸屏上劃動方式的不同來完成,比如放大和縮小圖片。
這樣的整合,讓移動終端真正擺脫了傳統(tǒng)PC終端的思維桎梏。多點觸摸以手勢來完成人機交互,更易于上手,同時也更加自然。
對有過iPad使用體驗的人,感受將尤為明顯。“學(xué)電腦”一度是一個名詞,孩子可能需要長到七八歲才能開始學(xué)習(xí)并熟練使用鍵盤,但現(xiàn)在一個不到兩歲的孩子已經(jīng)能熟練地在iPad上進(jìn)行娛樂,甚至據(jù)說不足3歲的孩子就可以自行從軟件商店中下載游戲。
得益于新的人機交互技術(shù),人對機器的使用門檻在進(jìn)一步降低,因為計算機已經(jīng)越來越能讀懂人在自然狀態(tài)所傳遞的命令。
由此看Kinect,其普適化的征程才剛剛開始。
未來照進(jìn)現(xiàn)實
很難相信就在兩個月前,微軟對Kinect的期望還是“將游戲推進(jìn)千家萬戶”。當(dāng)許多新用戶買Kinect不是為了游戲,而是為了體驗更加未來與 “科幻”的操控方式,為了體驗全新的人機交互體驗,所有具備敏銳洞察力的企業(yè)都不會忽視人們的這種渴望。“這對微軟來說是一個驚喜,現(xiàn)在來看,這件事的意義遠(yuǎn)遠(yuǎn)比游戲要大。”胡君明說,“Kinect將會是一個歷史性產(chǎn)品,這樣的人機交互方式一定會用在其他產(chǎn)品上,一定會用在PC上。”
不難想象有了Kinect之后的電腦操控方式。鍵盤或許還在,但鼠標(biāo)將逐漸消失,因為只要在紅外攝像頭所能捕捉的有效范圍內(nèi),手指的任意移動都能精確地進(jìn)行位置確認(rèn)。五指張開,頁面放大;手上下?lián)]動,頁面移動;雙手合攏,頁面關(guān)閉……在更加自然的操控界面中進(jìn)行更加自然的人機交互,這一切還僅僅是基本。
而在視頻捕捉技術(shù)之外,語音識別技術(shù)或許也將由此激發(fā)。Kinect自帶的麥克風(fēng)可供用戶進(jìn)行簡單的命令操作,但很多人都不知道其實從 Windows Vista開始,PC操作系統(tǒng)就自帶了非常強大的語音識別功能,且能天然識別包括中文在內(nèi)的主要語言。語音技術(shù)實際上已經(jīng)非常成熟,它所缺乏的只是一個普遍使用的應(yīng)用場景,就如游戲之于Kinect。
這樣的場景正在開始出現(xiàn)、積聚。比如在谷歌地圖和許多手機的谷歌客戶端中,已經(jīng)支持語音輸入,如果你在地圖中已經(jīng)用GPS定位了自己的位置,說“咖啡”一詞,馬上地圖上就會顯示在你周圍的咖啡館信息。蘋果新的iOS系統(tǒng)中,也已經(jīng)集成了語音識別,長摁屏幕下方的Home鍵呼叫出界面之后,你能用“打給某某人”的語音命令來直接撥打電話,或者用“播放誰誰誰”來播放某個歌星的歌曲。
更加富于想象力的人機交互方式其實已經(jīng)產(chǎn)生。在麻省理工學(xué)院,一個名叫Pranav Mistry學(xué)生極富想象力地將手勢識別、攝像頭、投影和云計算結(jié)合在一起,發(fā)明了名為“第六感”的技術(shù)——不用攜帶任何大尺寸的東西,所有的終端都濃縮在胸口的掛飾和貼在手指的膠片中,當(dāng)你想要拍照時,只需要用四根手指擺出一個框的形狀;當(dāng)你想要玩游戲,比如賽車時,隨手拿過一張紙,它就能瞬間變成顯示屏,而手指則是方向盤。
許許多多的創(chuàng)新交互方式,實際上缺少的是應(yīng)用到何種產(chǎn)品、何種場景中,以及如何量產(chǎn)化銷售的難題。很多時候連技術(shù)所能應(yīng)用的場景都已經(jīng)具備,新的人機交互與民眾普及之間,只有“量產(chǎn)化”這一層薄薄的窗戶紙。
是的,這層窗戶紙現(xiàn)在已經(jīng)被Kinect捅破了。
當(dāng)?shù)谝粋€顯得甚至有些“激進(jìn)”的全新交互產(chǎn)品出現(xiàn)并大獲成功,可以預(yù)見的是,必然會有追隨者出現(xiàn)。起碼在家用游戲機領(lǐng)域,任天堂和索尼不會聽任微軟攜Xbox 360和Kinect一騎絕塵。如果Kinect的互動方式經(jīng)由Windows 8而得到更廣泛的普及,蘋果也不會坐視不理。
在人機交互領(lǐng)域,更加大膽的創(chuàng)新精神正在被喚醒,而在此之前,它正是那些技術(shù)積累豐厚、產(chǎn)品實踐強悍、聰明卻又保守的大公司遲遲無法邁出的一步。