3sNews訊 在2012年(第十二屆)北京汽車展上,由上汽集團(tuán)自主研發(fā)的人機(jī)語音交互系統(tǒng)IVoka再次亮相,現(xiàn)由上汽名爵MG5及上汽榮威350兩種車型上搭載。
早在2011年廣州車展上,IVoka就與觀眾們見了面,這項(xiàng)中國首創(chuàng)的人車交互平臺也在當(dāng)時榮膺廣州車展最佳領(lǐng)先科技獎,但是去年IVoka并未正式推出和投放市場。在今年的北京車展,IVoka不再是讓人們垂涎欲滴的單純展覽品。
在人車智能語音交互技術(shù)方面,科大訊飛作為IVoka的技術(shù)提供商,提供了中文語音合成技術(shù)、語音識別技術(shù)、語音評測技術(shù)、聲紋識別技術(shù)、自然語言聽讀技術(shù)等具有專利性的國際領(lǐng)先技術(shù)成果。這些技術(shù)實(shí)現(xiàn)了人與機(jī)器之間溝通像人與人之間交流一樣容易和智能,極大地促進(jìn)了機(jī)器智能化和物聯(lián)網(wǎng)科技的發(fā)展。
IVoka北京車展現(xiàn)場
成功搭載在MG5和榮威350上并開始在市場上銷售的車聯(lián)網(wǎng)平臺IVoka,如今給我們帶來哪些驚喜呢?3sNews記者在名爵MG5的展車上對這款具有里程碑意義的產(chǎn)品進(jìn)行了深入的了解。
IVoka配備的模擬器
作為一款人機(jī)語音交互系統(tǒng),IVoka的語音設(shè)備安置在了駕駛者的頭頂,方便駕駛員的語音消息被設(shè)備所采集。
汽車內(nèi)部的語音接收設(shè)備
IVoka有著高度準(zhǔn)確的“聽力”?,F(xiàn)場的技術(shù)開發(fā)人員向記者演示IVoka的語音導(dǎo)航功能,開發(fā)人員打開語音通話功能開關(guān),只要說一句“導(dǎo)航到天安門”或者“帶我去天安門”,系統(tǒng)只需經(jīng)過幾秒鐘的短暫思考,就自動切入到電子導(dǎo)航地圖,規(guī)劃出一條從北京中國國際展覽中心到天安門的導(dǎo)航路徑。記者在說這些話時,有意將說話速度放緩、加快或故意改變聲調(diào),IVoka都能成功地辨識。
IVoka正在進(jìn)行短暫的“思考”
觸發(fā)語音功能的快捷按鍵在方向盤上手指容易觸及的地方,這給一些正在駕車的司機(jī)帶來極大的方便,避免了再手動打開電子地圖和輸入路線的不安全行為。
開發(fā)人員告訴我們,除了快捷、安全的語音導(dǎo)航這一核心功能外,IVoka的語音交互還有許許多多的用武之地,只要你能想的到的,IVoka都能實(shí)現(xiàn)。[page]
相信很多朋友在開車時有聽新聞的習(xí)慣,IVoka在遠(yuǎn)端服務(wù)器中,儲存了信息量龐大的新聞節(jié)目庫,如果想聽新聞,只要激活方向盤上的語音通話快捷鍵,告訴IVoka“我想看新聞”,新聞欄目就自動打開,自動播放滾動新聞內(nèi)容。讓人眼前一亮的是,IVoka的電子語音播放聲音接近真人播報新聞的聲音,十分逼真、有條理,一點(diǎn)也不生澀。當(dāng)然如果想聽廣播電臺的話,只要知會一聲IVoka“我要聽廣播”,廣播節(jié)目也會自動打開。
IVoka的新聞播報功能
IVoka最精彩的地方要數(shù)其語音打電話和發(fā)短信功能了,這也是利用了IVoka語音交互功能的精髓所在。司機(jī)朋友們都明白,在汽車上接聽手機(jī)的行為是極為危險的一件事情。IVoka在這方面做到了已經(jīng)實(shí)現(xiàn)了安全打電話甚至是發(fā)短信的功能。開發(fā)人員向我們演示如何方便地?fù)芡▌e人的電話,記者用自己的手機(jī)進(jìn)行了測試。同樣,先激活方形盤上的語音通話按鍵,告訴IVoka“打電話給1361134xxxx”,隨即記者馬上便收到了一個手機(jī)電話號碼的來電。開發(fā)人員告訴記者,IVoka的硬件平臺中,有一個可以插手機(jī)sim卡的接口,因此只需要辦一張普通的手機(jī)sim卡,就能實(shí)現(xiàn)像手機(jī)一樣打電話的功能。發(fā)短信同樣如此,告知IVoka發(fā)送短信的對象號碼或姓名,IVoka自動找到發(fā)短信的對象,之后只需要用嘴敘述短信內(nèi)容即可,IVoka的語音文字輸入準(zhǔn)確率之高也是讓人贊嘆的地方。
由于記者在車展會場中,有很強(qiáng)的外界聲音干擾(比如高音量的舞臺音響),IVoka在聽手機(jī)號碼或者短信內(nèi)容的過程中,會被“打算思路”,導(dǎo)致錄入中斷,開發(fā)人員向記者解釋,IVoka的語音導(dǎo)航十分靈敏,對于一些較大的聲音,就會使系統(tǒng)中斷思考,導(dǎo)致錄入的內(nèi)容可能只有一半了。因此在和IVoka對話時,應(yīng)該盡量避免其他人的說話聲音或者外界干擾。但是只要IVoka聽到的,都幾乎是準(zhǔn)確無誤的。
IVoka作為一個綜合的智能語音交互平臺,還具備很多功能,比如你可以問IVoka“北京今天天氣如何?”、“我現(xiàn)在去哪吃飯?”、“現(xiàn)在幾點(diǎn)鐘?”,這些問題都能得到滿意的答復(fù),甚至你可以問點(diǎn)無聊的問題,比如“你跟蘋果比誰聰明?”,IVoka都能告訴你“蘋果的語音不懂中文!”,等等。此外,對于一些具有地方口音的司機(jī),只要你能說出稍微標(biāo)準(zhǔn)一點(diǎn)的普通話,IVoka都能聽得懂,記者在展會中采訪的開發(fā)人員,就帶有明顯的南方口音,但I(xiàn)Voka完全能辨析出開發(fā)人員說的內(nèi)容。當(dāng)記者詢問IVoka是否支持地方方言時,開發(fā)人員表示,目前IVoka暫不支持任何地方的方言,將來何時能夠推出也還不確定。
只需要說一聲IVoka的天氣播報就能打開
IVoka語音智能能夠做到的功能非常多,如果你實(shí)在不知道IVoka還能干點(diǎn)啥,干脆直接問問IVoka,就問一句“你能干什么?”,IVoka馬上告知你想要的答案。
IVoka在介紹自己的功能[page]
IVoka優(yōu)點(diǎn)眾多,例如憑借其安卓平臺的特性,可以使用很多軟件應(yīng)用、能夠?qū)崿F(xiàn)3G上網(wǎng)等等。但I(xiàn)Voka也存在著一些不足。
記者發(fā)現(xiàn),IVoka平臺的屏幕靈敏度不夠好,如果通過觸摸屏來使用一些功能的話,會有一種很“鈍”的感覺,缺乏流暢度。另外在進(jìn)行像翻頁、切換功能的時候,也會有延遲和“卡”的現(xiàn)象。這些不得不讓記者想到,如果在IVoka平臺裝了很多軟件應(yīng)用,或者平臺使用時間久了,會不會影響IVoka的語音接收工作效率以及影響平臺系統(tǒng)響應(yīng)速度等問題。開發(fā)人員表示,IVoka平臺目前采用的是電阻屏設(shè)計(jì),所以不能與目前我們的手機(jī)所廣泛使用的電容屏相比。由于現(xiàn)在導(dǎo)航市場上大多數(shù)產(chǎn)品還是采用的電阻屏,IVoka依舊采用這樣的設(shè)計(jì)可能會讓我們在硬件設(shè)施上有些失望。
在語音交流方面,IVoka目前還不能做到人機(jī)真正的人性化交流,在利用語音導(dǎo)航時只支持一些固定的表述方法,比如“導(dǎo)航到豪景大廈”、“帶我去豪景大廈”、“豪景大廈”這三種表述方法IVoka都可以聽懂,但是如果說的更加隨意點(diǎn)“去豪景”或者“去KFC”等縮略形式,IVoka就可能無法準(zhǔn)確導(dǎo)航了。另外,當(dāng)用戶啟動IVoka時,IVoka的問好有些生硬,有時還會說“老板好”,這對于IVoka配備在榮威350和MG5兩款主打的家用經(jīng)濟(jì)車型來說,感覺會很不協(xié)調(diào)。所以,IVoka距離真正的智能助手,即讓我們想怎么說就能怎么做這種智慧地處理語音信息的要求還有一段距離。
總結(jié):
總體說來,IVoka的出色表現(xiàn)使得它瑕不掩瑜,它對于國內(nèi)車聯(lián)網(wǎng)技術(shù)的推動和發(fā)展確實(shí)起到了舉足輕重的作用,特別是它現(xiàn)在瞄準(zhǔn)的是中低端車型市場,對于大眾市場的車聯(lián)網(wǎng)技術(shù)的普及是非常具有意義的,同時,這也讓我們看到了智能語音交互技術(shù)成為了未來車聯(lián)網(wǎng)平臺發(fā)展的主流趨勢。讓我們期待IVoka在2012年智能導(dǎo)航平臺市場中的表現(xiàn)吧!(陳啟臨)
{{item.content}}