777精品久无码人妻蜜桃,国产日本精品视频在线观看 ,国产亚洲99久久精品熟女av,brazzersvideosex欧美最新版,人人爽人人人爽人人爽

2025全球時(shí)空智能大會(huì)
5月21-22日 北京
開(kāi)幕在即!WGDC25全球時(shí)空智能大會(huì)完整日程公布
即刻注冊(cè)  鎖定席位
分享
Scan me 分享到微信

你好Siri 語(yǔ)音技術(shù)助推互聯(lián)網(wǎng)演進(jìn)智能化

Siri的發(fā)布打破了語(yǔ)音技術(shù)一直不溫不火的局面,很多科技媒體在對(duì)2012年的技術(shù)發(fā)展趨勢(shì)進(jìn)行展望時(shí),紛紛將語(yǔ)音技術(shù)列為其中之一。語(yǔ)音技術(shù)也被譽(yù)為繼鼠標(biāo)、觸摸屏之后的又一種人機(jī)交互方式。

  手機(jī)除了能夠打電話(huà)、發(fā)短信之外還能夠做什么?這看似是一個(gè)非常容易回答的問(wèn)題:可以拍照片、聽(tīng)音樂(lè)、看視頻、瀏覽網(wǎng)頁(yè),甚至充當(dāng)導(dǎo)航設(shè)備……技術(shù)的發(fā)展讓手機(jī)早已超越了最初對(duì)它的定義。那是否想過(guò)手機(jī)還能夠成為和人們進(jìn)行交流互動(dòng)的“機(jī)器人”呢?集成了Siri功能的iPhone 4S發(fā)布后,讓這種設(shè)想成為了可能。

  與以往借助語(yǔ)音識(shí)別發(fā)布控制命令的工具不同,Siri更加智能。用戶(hù)和它進(jìn)行交流的時(shí)候不需要拘泥于嚴(yán)格的語(yǔ)法結(jié)構(gòu)和格式,Siri能夠理解人們的自然語(yǔ)言,當(dāng)用戶(hù)詢(xún)問(wèn)天氣情況、設(shè)置起床時(shí)間、進(jìn)行日程安排等,Siri都可以給出答案,或者執(zhí)行相應(yīng)的操作。當(dāng)然,用戶(hù)也可以和Siri閑聊,甚至向Siri表達(dá)自己的愛(ài)慕之情,而Siri也會(huì)一一化解這些難題。

  Siri的發(fā)布打破了語(yǔ)音技術(shù)一直不溫不火的局面,很多科技媒體在對(duì)2012年的技術(shù)發(fā)展趨勢(shì)進(jìn)行展望時(shí),紛紛將語(yǔ)音技術(shù)列為其中之一。語(yǔ)音技術(shù)也被譽(yù)為繼鼠標(biāo)、觸摸屏之后的又一種人機(jī)交互方式。目前,語(yǔ)音技術(shù)在語(yǔ)音識(shí)別(讓計(jì)算機(jī)能夠聽(tīng)懂人們說(shuō)什么)、語(yǔ)音合成(將文本信息轉(zhuǎn)換成語(yǔ)音)方面的應(yīng)用已經(jīng)成熟,比如語(yǔ)音撥號(hào),只要說(shuō)出想要聯(lián)系的人名,手機(jī)就會(huì)撥打此人的電話(huà),不過(guò)這基于的是手機(jī)自身的數(shù)據(jù)庫(kù)。而現(xiàn)在,以Siri為代表,結(jié)合人工智能、知識(shí)庫(kù)、云計(jì)算等技術(shù),對(duì)自然語(yǔ)言進(jìn)行理解將會(huì)成為語(yǔ)音技術(shù)未來(lái)的發(fā)展方向。

  Siri之所以如此智能,是因?yàn)樵谄浔澈笥兄S基百科、Wolfram Alpha、Yelp等身影,分別應(yīng)用到了知識(shí)庫(kù)技術(shù)、知識(shí)搜索技術(shù)以及問(wèn)答推薦技術(shù),這些后臺(tái)技術(shù)可以在接受到用戶(hù)的請(qǐng)求之后,通過(guò)云計(jì)算,返回最匹配的結(jié)果。而作為最基本的語(yǔ)音技術(shù)支撐,則是由一家叫做Nuance Communications(紐昂斯通訊)的公司提供。

  總部位于美國(guó)的紐昂斯是家著名的語(yǔ)音和圖像解決方案提供商,同時(shí)也是全球最大的專(zhuān)業(yè)從事語(yǔ)音識(shí)別軟件研發(fā)及銷(xiāo)售的公司。此外,紐昂斯還提供多款圖像軟件、輸入法軟件等產(chǎn)品。對(duì)于語(yǔ)音技術(shù)而言,語(yǔ)音庫(kù)的豐富程度決定了其語(yǔ)音識(shí)別率的高低。據(jù)了解,紐昂斯的語(yǔ)音技術(shù)目前能夠識(shí)別約60種語(yǔ)言及方言,語(yǔ)音合成39種語(yǔ)言,幾乎占據(jù)了全球語(yǔ)音市場(chǎng)2/3的份額。

  在國(guó)內(nèi),也有家致力于語(yǔ)音技術(shù)發(fā)展的公司——科大訊飛。這家位于合肥的公司在中文語(yǔ)音市場(chǎng)占據(jù)主導(dǎo)地位,擁有中文語(yǔ)音技術(shù)市場(chǎng)60%以上的市場(chǎng)份額,其產(chǎn)品能夠覆蓋從大型電信級(jí)應(yīng)用到小型嵌入式應(yīng)用,目前與科大訊飛進(jìn)行合作的開(kāi)發(fā)伙伴已經(jīng)超過(guò)了1500家,形成了以其為核心的中文語(yǔ)音產(chǎn)業(yè)鏈。

  在2011年舉行的第九屆廣州國(guó)際汽車(chē)展覽會(huì)上,上海汽車(chē)展示了基于科大訊飛智能語(yǔ)音技術(shù)的“語(yǔ)音云駕駛系統(tǒng)iVoka”,這款應(yīng)用于榮威350的系統(tǒng)可以實(shí)現(xiàn)智能的“人車(chē)對(duì)話(huà)”:了解天氣情況、進(jìn)行周邊搜索與導(dǎo)航、播放音樂(lè)、收發(fā)短信……車(chē)主甚至還可以在駕車(chē)過(guò)程中與該系統(tǒng)進(jìn)行簡(jiǎn)單的“嘮嗑”,解除長(zhǎng)時(shí)間駕車(chē)的疲乏。語(yǔ)音技術(shù)在汽車(chē)環(huán)境中的運(yùn)用可以極大的“解放”車(chē)主的雙手,提高了駕車(chē)的安全性能。在未來(lái),語(yǔ)音技術(shù)或會(huì)成為車(chē)聯(lián)網(wǎng)解決方案中必備的要素之一。

  在語(yǔ)音技術(shù)領(lǐng)域,Google、微軟等科技巨頭也投入了巨大的精力。Google關(guān)注語(yǔ)音技術(shù)由來(lái)已久,2008年其收購(gòu)了一家名為GrandCentral的公司,并在次年向用戶(hù)提供語(yǔ)音服務(wù)“Google Voice”,在移動(dòng)設(shè)備上滿(mǎn)足用戶(hù)利用語(yǔ)音指令發(fā)送郵件、短信、撥打電話(huà)、進(jìn)行互聯(lián)網(wǎng)搜索的需求。在Android平臺(tái)上,目前也有很多第三方的語(yǔ)音識(shí)別軟件可以使用。但就智能性而言,目前還是落后于Siri。

  微軟對(duì)語(yǔ)音技術(shù)的研究則更早,其在2005年就開(kāi)發(fā)出了語(yǔ)音識(shí)別軟件,使用戶(hù)能夠利用語(yǔ)音命令輸入文字,并通過(guò)語(yǔ)音控制鍵盤(pán)和鼠標(biāo)。此外,微軟還提供了Microsoft Speech SDK,利用這個(gè)軟件開(kāi)發(fā)包,用戶(hù)可以在自己開(kāi)發(fā)的軟件里應(yīng)用語(yǔ)音識(shí)別和合成功能,實(shí)現(xiàn)“人機(jī)對(duì)話(huà)”。


3sNews 配圖

  在我們的手機(jī)客戶(hù)端軟件中,語(yǔ)音技術(shù)幾乎已經(jīng)成為了大多數(shù)應(yīng)用的必備要素。比如,最新版本的UC瀏覽器、搜狗輸入法就已經(jīng)集成了語(yǔ)音技術(shù)。

  近期發(fā)布和更新的多款手機(jī)地圖軟件也緊隨潮流加入了語(yǔ)音功能。最新版本的高德地圖Android和iPhone客戶(hù)端都新增了語(yǔ)音搜索輸入功能;凱立德也新近發(fā)布了全新的“隨意說(shuō)”智能聲控導(dǎo)航系統(tǒng),聲稱(chēng)用戶(hù)只需要像日常交流一樣對(duì)著導(dǎo)航系統(tǒng)說(shuō)話(huà),就可以控制各種導(dǎo)航功能。

  不過(guò),更多的導(dǎo)航軟件目前對(duì)于語(yǔ)音技術(shù)的應(yīng)用僅是停留在語(yǔ)音合成層面,也就是對(duì)規(guī)劃好的導(dǎo)航路線(xiàn)盡可能用自然的語(yǔ)調(diào)進(jìn)行播報(bào),而不像Siri一樣,涉及到對(duì)語(yǔ)義的理解。

  搜狗地圖總經(jīng)理孔祥來(lái)表示,“語(yǔ)音技術(shù)在識(shí)別方面做得比較成熟。但如果要將語(yǔ)音技術(shù)推到用戶(hù)面前,真正讓用戶(hù)喜愛(ài)去用,而不是抱著一種嘗鮮的態(tài)度,還是需要解決語(yǔ)義理解的問(wèn)題,讓程序足夠聰明到理解用戶(hù)的意圖。”這也反映了目前多數(shù)軟件在應(yīng)用語(yǔ)音技術(shù)時(shí)這一現(xiàn)狀:只是將平臺(tái)的語(yǔ)音識(shí)別模塊嫁接到軟件中,并沒(méi)有解決語(yǔ)音識(shí)別后如何將內(nèi)容“翻譯”成機(jī)器理解的指令的問(wèn)題??紫閬?lái)認(rèn)為,如果這點(diǎn)沒(méi)有解決,語(yǔ)音技術(shù)也僅僅是一個(gè)聽(tīng)寫(xiě)引擎。

  在導(dǎo)航領(lǐng)域,除了手機(jī)地圖這樣的應(yīng)用層面在積極探索和語(yǔ)音技術(shù)結(jié)合的可能性外,在地圖數(shù)據(jù)層面,四維圖新與前文提到的紐昂斯達(dá)成了合作協(xié)議,雙方將共同開(kāi)發(fā)導(dǎo)航用的語(yǔ)音地圖數(shù)據(jù),并將在發(fā)布新版地圖的同時(shí)推出語(yǔ)音導(dǎo)航數(shù)據(jù)。據(jù)了解,四維圖新的合作伙伴在未來(lái)都能以單獨(dú)API的方式獲得該功能。四維圖新總裁孫玉國(guó)認(rèn)為:更加精確的語(yǔ)音功能是導(dǎo)航過(guò)程中不可或缺的一項(xiàng)功能和未來(lái)導(dǎo)航市場(chǎng)的發(fā)展趨勢(shì),因此引入先進(jìn)的語(yǔ)音轉(zhuǎn)換技術(shù)已經(jīng)成為一種必然。

  雖然Siri已經(jīng)發(fā)布了,但蘋(píng)果仍然將其定位在“Beta”階段,它還需要繼續(xù)完善。不過(guò),由它開(kāi)啟的“語(yǔ)音互聯(lián)網(wǎng)”時(shí)代卻已經(jīng)到來(lái)。這不僅僅限于我們所能看到的手機(jī)上的應(yīng)用,它會(huì)應(yīng)用在更廣泛的領(lǐng)域。

  前不久,有國(guó)外的科技博客就報(bào)道稱(chēng)Google正在申請(qǐng)一項(xiàng)專(zhuān)利,該專(zhuān)利描述了基于云計(jì)算的系統(tǒng),能夠通過(guò)Android手機(jī)發(fā)出語(yǔ)音命令,以控制機(jī)頂盒、智能手機(jī)和數(shù)字?jǐn)z錄機(jī)等設(shè)備。

  瞧,電視也能用語(yǔ)音進(jìn)行控制了。(文|張凱)

喜歡您正在閱讀的內(nèi)容嗎?歡迎免費(fèi)訂閱泰伯每周精選電郵。 立即訂閱

參與評(píng)論

【登錄后才能評(píng)論哦!點(diǎn)擊

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回復(fù){{item.replynum}}
    {{child.username}} 回復(fù) {{child.to_username}}:{{child.content}}

更多精選文章推薦