777精品久无码人妻蜜桃,国产日本精品视频在线观看 ,国产亚洲99久久精品熟女av,brazzersvideosex欧美最新版,人人爽人人人爽人人爽

2025全球時空智能大會
5月21-22日 北京
開幕在即!WGDC25全球時空智能大會完整日程公布
即刻注冊  鎖定席位
分享
Scan me 分享到微信

谷歌發(fā)布最新視覺“黑科技”:搜索3D化,代碼僅100KB,無需高端設(shè)備即可運行

科技之于人類,本就應(yīng)該扮演這樣的角色。

     美國時間 5 月 7 日,谷歌 2019 年 I/O 開發(fā)者大會在山景城總部開幕,為期三天。

     在開幕式上,谷歌宣布了諸多亮點,比如更貼近用戶的搜索功能,更強大的 AI 與語音助手,內(nèi)置在安卓系統(tǒng)中的語音轉(zhuǎn)文字功能,新款 Pixel 3a 和 3a XL 中端手機,Nest Hub Max 智能家居設(shè)備,還有安卓 Q 系統(tǒng)更新等等。

     “To Be Helpful”是整場大會的主題之一。因此,無論是產(chǎn)品演示,還是演講者,幾乎全都從安全、隱私和實用的理念出發(fā),透露出與往屆 I/O 大會不同的務(wù)實風(fēng)格。

圖 | 谷歌AI領(lǐng)軍人 Jeff Dean: 為每一個人打造一個更有幫助的谷歌

     即使是最后登場的谷歌 AI 領(lǐng)軍人 Jeff Dean,也是以現(xiàn)有研究成果出發(fā),強調(diào)了 BERT 模型在自然語言處理領(lǐng)域取得的建樹,以及 AI 技術(shù)在健康和環(huán)境領(lǐng)域的應(yīng)用潛力,并未帶來令人眼前一亮的驚艷機器學(xué)習(xí)新成果。

     不過從另一個角度來看,這或許才是科技本身應(yīng)有的樣子:一項高科技,無論初見有多驚艷,最終只有成為像空氣一般的存在,讓我們幾乎察覺不到它,卻又依賴于它,才能讓我們開始享受它的價值,進而真正地享受生活。

     這也是谷歌 2019 年 I/O 開發(fā)者大會帶給我們的啟示。

圖 | 谷歌I/O大會開場

   “黑科技”開場,奠定務(wù)實風(fēng)格

     一開場,谷歌就遵循一貫風(fēng)格,直接亮出了人們喜聞樂見的“黑科技”。

     副總裁 Aparna Chennapragada 率先介紹了谷歌的最新視覺技術(shù):巧妙地整合攝像頭和增強現(xiàn)實(AR)技術(shù),強化谷歌搜索結(jié)果的互動性和實用性。

     她在谷歌上搜索出的二維圖片,可以直接轉(zhuǎn)換成三維模型,并通過攝像頭放在真實環(huán)境中。

     無論你搜索的是人體骨骼,一雙鞋,還是一條鯊魚,都沒問題,只要谷歌制作了 3D 模型,就可以通過攝像頭,展示在現(xiàn)實場景中,供用戶查看效果。它們不僅可以活動,還能夠接受放大、縮小、運動和轉(zhuǎn)移等操作指令。

     可以肯定的是,3D 化的搜索結(jié)果不僅僅停留在有趣這一階段,它可以給用戶帶來更直觀的使用體驗和感受,加深對物體運作機制的理解程度。

     想象一下,如果你想知道心臟長什么樣子,除了看到實物,有什么東西能比一個會跳動的、可以放大縮小和分解的立體模型更加形象的呢?尤其是它可以隨時隨地出現(xiàn)在任何地方,AR 技術(shù)的價值進一步得到了挖掘。

圖 | 搜索出的大白鯊以 AR 形式出現(xiàn)在演講臺上

     除了強化搜索結(jié)果,谷歌還通過 Google Lens 程序,讓手機攝像頭變得更有價值。

     如果你新到一家餐館,不知道有什么特色菜,沒關(guān)系,只要拿出手機,打開 Google Lens 程序,對準(zhǔn)菜單,它就可以根據(jù)已有點評,標(biāo)注出大多數(shù)人推薦的特色菜。

     如果你去法國旅游,卻不會法語,看不懂路標(biāo),沒關(guān)系,只要拿出手機,打開 Google Lens 程序,對準(zhǔn)路標(biāo),它就可以識別上面的法語,直接翻譯成中文和英語等十多種語言,還可以直接朗讀出來,讓語言不再成為交流和旅游的障礙。

     如果你想看菜譜學(xué)做菜,沒問題,Google Lens 配合食譜制造商,錄制預(yù)先制作的烹飪視頻,只要將鏡頭對準(zhǔn)菜譜文字,就會有實際演示視頻跳出來,為你展示如何操作。

     這些都是非常貼近日常生活的實用功能,如果實際操作效果與演示效果相符,那么將極大地方便我們的生活。

圖 | Google Lens可以翻譯多種語言的不同標(biāo)志

     谷歌在現(xiàn)場播放了一段視頻,講述了印度的試點項目。視頻中,一名不識字的印度母親依靠著 Google Lens 程序,終于可以以聽的方式理解書上的內(nèi)容,孩子的作業(yè),路上的標(biāo)識,餐館的菜單等等,最后無需別人的幫助,單獨完成很多任務(wù)。

     雖然在普通人看來,她完成的都是些瑣碎小事,比如去 ATM 取錢和預(yù)訂火車票,但對于她來說,這就像打開了生活的另一扇門。

     由此可見,谷歌貫徹的“To Be Helpful”的理念,意味著技術(shù)應(yīng)該能夠真正幫助有需要的人提高生活質(zhì)量。

圖| 印度母親使用Google Lens 幫助自己看懂包裝盒上的字

     谷歌最后強調(diào),這種技術(shù)結(jié)合了自然語言處理、機器視覺、以及谷歌 20 多年來的搜索信息才能實現(xiàn),但代碼只有 100 KB 左右,所以無需高端設(shè)備就可以運行。

     這項功能將加入 Google Go 應(yīng)用中。對視覺障礙者,以及不會外語的人來說,這無疑是獲取信息的新方式。目前,Google Go 已經(jīng)能支持?jǐn)?shù)十種語言,售價為 35 美元。

     不得不說,谷歌選擇用直觀的視覺技術(shù)作為開場,非常機智。不僅契合主題,突出了實用性,還成功塑造出眼前一亮的感覺,調(diào)動了觀眾的積極性。但是稍顯可惜的是,這些演示或許是整場大會最有看點的部分了。

   更強大、更懂你的AI語音助手

     在去年的 I/O 大會上,谷歌的語音助理技術(shù)推出新功能 Google Duplex,讓 AI 打電話預(yù)訂餐廳,因其聲調(diào)語氣相當(dāng)逼真,接電話的人沒察覺,該技術(shù)一鳴驚人,但引起了一些爭議。

     在今年的 I/O 大會上,谷歌也演示了新功能,包括一句話開啟駕駛模式和更先進的 Duplex on the web,也就是“Duplex 可以幫忙執(zhí)行網(wǎng)頁上的任務(wù)”。

     例如用戶可以呼出語音助理,要求它上網(wǎng)幫你預(yù)訂一臺車,然后語音助理就會進入租車網(wǎng)站,幫你填寫姓名、住址,甚至是偏好車型等信息,并要求你確認(rèn)。

圖 | 語音助手幫你租車

     它還利用知識圖譜來進行個人推薦。根據(jù)用戶的使用習(xí)慣,AI 能更好地理解用戶的語音指令,可以通過語音瞬間打開 App,并且可以使用連續(xù)的語音指令,而不需要每次都說出喚醒詞。比如 AI 可以追蹤一連串語音指令:打開地圖,播放音樂,打開相冊,搜索有動物的照片,發(fā)送給某人,它能根據(jù)一系列語音指令按順序完成相應(yīng)動作。

     谷歌認(rèn)為此功能擁有很大的應(yīng)用前景,并強調(diào)隨著深度學(xué)習(xí)的進展,把 AI 模型放置到移動裝置將是一種范式的轉(zhuǎn)換。他們希望可以把 100GB 的語音識別模型縮小到 0.5GB,并放在終端設(shè)備上,讓用戶更方便使用。

     不過谷歌表示,目前該功能還在完善階段,預(yù)計今年晚些時間才會公布更多細節(jié),并透露在今年晚些會推出新的 Pixel 手機。

   安卓內(nèi)置語音轉(zhuǎn)文字功能

     作為一家以人性化為核心的公司,谷歌這次格外考慮到了聽覺或語言障礙人士,推出了 Live Caption(實時字幕)技術(shù)。

圖 | 實時字幕技術(shù)演示

     該技術(shù)由循環(huán)神經(jīng)網(wǎng)絡(luò)支持,可以把手機中的視頻和音頻內(nèi)容實時轉(zhuǎn)化成文字,類似于微信的語音信息轉(zhuǎn)文字。

     不過更重要的是,Live Caption 是原生存在于安卓系統(tǒng)中的功能,意味著它能夠契合所有的應(yīng)用,適用于視頻聊天、電話、錄像,甚至是游戲中,而且使用全程可在設(shè)備端進行處理,不需要聯(lián)網(wǎng),從而進一步保障用戶隱私。

     對于普通人來說,如果不想外放語音,一副耳機就可以解決。但對于聽覺或語言障礙人士來說,這項功能可以發(fā)揮很大的作用,幫助他們更好地與人溝通。

     在此基礎(chǔ)上,谷歌推出了 Project Euphonia,通過機器學(xué)習(xí)來了解語言障礙者的對話模式,來實現(xiàn)精準(zhǔn)的語音轉(zhuǎn)寫。

   安卓Q圍繞安全和隱私等優(yōu)化

     盡管谷歌有許多平臺,像是 Chrome,但安卓系統(tǒng)依舊是最重要、裝機量最大的那一個,目前全球已有超過 25 億臺安卓設(shè)備。

     谷歌在今天也發(fā)布了最新安卓 Q Beta 3 版本,圍繞安全和隱私等核心問題進行優(yōu)化,12 家 OEM 廠商的 21 個手機機種都可以升級,包括華為、小米、Vivo 等。

     除了支持上述的 Live Caption 功能,安卓 Q Beta 3 還適配可折疊屏幕,游戲應(yīng)用可以直接在兩種模式下無縫流暢轉(zhuǎn)換,并且加入了用戶期待已久的黑暗主題。

圖 | Q Beta 3 適配折疊屏

     此外,谷歌還推出了其它新功能,比如 Focus Mode 專注模式,可以讓用戶暫時停止使用一些容易打擾人的應(yīng)用;Smart Reply 功能,可以預(yù)測和提供智能回復(fù)建議,能夠通過任何應(yīng)用快速發(fā)送回復(fù);以及針對小孩的父母管理機制。

     值得一提的是,安卓 Q 已經(jīng)增加了 5G 網(wǎng)絡(luò)支持,為未來 OEM 廠商推出 5G 手機打下了基礎(chǔ)。

   強調(diào)隱私保護,Nest Hub Max 誕生

     智能家居一直是各家業(yè)者都想爭取的市場,Nest 是谷歌旗下專注智能家居的獨立團隊,已有家庭安全攝像頭和帶有顯示屏的 Home Hub 等智能家居產(chǎn)品。

圖 | 推出新版 Nest Hub Max

     谷歌在大會上表示,智能家居必須非常重視用戶的隱私,并且宣布,將 Home Hub 更名為 Nest Hub,同時推出升級版 Nest Hub Max,裝有更大的 10 英寸顯示屏,直接與 Facebook Portal 和亞馬遜 Echo Show 等同類產(chǎn)品競爭。

     谷歌強調(diào),沒有用戶允許絕不會啟動攝像頭,另外拍下或錄下的數(shù)據(jù)只會存在終端上,并使用 FaceMatch 面部識別用戶,支持手勢操作。

     屏幕較大的 Nest Hub Max 售價 229 元,現(xiàn)有的 Nest Hub 則降價 20 美元至 129 美元。

   推出兩款Pixel,進軍中端智能手機市場

     隨后谷歌帶來了兩款 Pixel 系列手機,Pixel 3a 與 Pixel 3a XL,售價分別是 399 美元和 479 美元,前者即日起開售,后者今年暑期上市。這也是谷歌首次推出中端智能手機。

圖 | 新款Pixel 3a售價399美元,即日發(fā)售

     兩個機型在外觀上依然延續(xù) Pixel 家族的特點,無劉海屏幕,后置單攝像頭,提升拍照質(zhì)量主要靠搭載谷歌自研 Pixel Visual Core 圖像處理單元,還繼續(xù)使用后置指紋識別,保留有 3.5mm 耳機孔,一次充電可以支撐 30 小時,并且配有 Titan M 安全芯片,專門用來保護用戶隱私。

     至于硬件配置,谷歌大會上并沒有給出詳細參數(shù),但已有媒體爆出了比較可信的數(shù)據(jù),其中 Pixel 3a 搭載高通驍龍 670 處理器,配備 4GB 內(nèi)存+ 64GB 存儲,分辨率為 1080×2160 ;Pixel 3a XL 搭載高通驍龍 710 處理器,配備 4GB 內(nèi)存+128GB 存儲,分辨率為 2220×1080。

     相比 Pixel 3 的 799 美元售價,兩款中端手機的價格更加親民,這在一定程度上可以刺激目前較為疲軟的 Pixel 銷量,但隨著全球整體智能手機市場逐漸飽和,再加上谷歌在大會上暗示今年晚些時候?qū)⑼瞥鲂?Pixel 高端機,它們究竟能夠為谷歌帶來多少收益還不得而知。

     就像在剛剛過去的第一季度財報會議上,谷歌 CEO Pichai 表示的那樣,“在硬件之路上,谷歌還處于早期階段”。

   Jeff Dean登場,壓軸的谷歌 AI

     在大會的最后,谷歌 AI 領(lǐng)軍人物 Jeff Dean 壓軸登場,介紹了自己團隊一直以來的研究目標(biāo)和方向。從推動計算機視覺的極限,到語音識別,他們研究的領(lǐng)域涵蓋生活中的方方面面。

圖 | Jeff 介紹谷歌AI 團隊的研究進展

     在Jeff 看來,最讓他激動的AI技術(shù)進展是語言理解。

     遵循這一思想,谷歌 AI 一直在努力提高計算機對語言的理解能力,希望有朝一日能媲美人類的水平。最新的研究成果就是自然語言處理領(lǐng)域大名鼎鼎的 BERT 模型(Bidirectional Encoder Representation from Transformers)。

     BERT 模型突破了傳統(tǒng) RNN 模型的限制,不再局限于單個關(guān)鍵詞詞義的理解,而是結(jié)合上下文分析語義,能夠在大段文字下更好地理解語境和整體內(nèi)容。

     該模型于 2018 年 11 月推出,直接刷新了自然語言處理任務(wù)的 11 項紀(jì)錄,同時啟發(fā)了多個研究團隊,后續(xù)衍生模型不斷刷新著新的紀(jì)錄。

     谷歌團隊更是將其直接定義為:BERT 模型開啟了自然語言處理的新時代!

     隨后,谷歌 AI 介紹了 AI for Social Good 項目,旨在將 AI 技術(shù)推廣到各個領(lǐng)域。

圖 | 谷歌用AI 檢測肺癌

     他們將 AI 運用于醫(yī)療保健,建立了 CT 掃描圖預(yù)測模型,可以幫助檢測肺癌。他們還將 AI 運用在自然災(zāi)害預(yù)測領(lǐng)域,建立了一個洪水預(yù)測模型,預(yù)測洪水會出現(xiàn)在何時何地。該模型結(jié)合了深度學(xué)習(xí)、衛(wèi)星影像與以現(xiàn)實為基礎(chǔ)的情境模擬,并且會將信息共享給可能會受到影響的個人。

     除此之外,谷歌的 AI for Social Good 項目還包括地震余震預(yù)測、全球漁業(yè)活動預(yù)測等等,都突顯出 AI 技術(shù)的實用價值。

圖 - 用 AI 模型預(yù)測地震余震

   結(jié)語

     最近一兩年,數(shù)據(jù)隱私和 AI 道德問題持續(xù)困擾著美國科技巨頭們,特別是用戶體量巨大、掌握海量數(shù)據(jù)的 Facebook 和谷歌。

     上周的 Facebook F8 大會,扎克伯格三句話不離數(shù)據(jù)隱私保護,力求挽回形象,而在谷歌 I/O 大會開幕式上,我們似乎也感受到了谷歌的刻意“保守”。

     去年,谷歌在大會上演示了 Google Duplex,讓 AI 打電話訂位,AI 模仿人類太成功,接聽電話的店員根本沒有察覺有異,不料卻引起外界憂心技術(shù)被用來欺騙人類。

     隨后,谷歌遭人詬病的事一樁接著一樁,一下子員工聯(lián)名抗議用 AI 做軍事生意,導(dǎo)致云計算部門高管的離職潮,一下子又反對 AI 道德委員會的某些外部成員,使得該組織才成立一周就被迫解散。這讓曾經(jīng)確立“AI 優(yōu)先”戰(zhàn)略的谷歌不得不重新思考技術(shù)的發(fā)展走向和展示策略。

     所以,今年的 I/O 大會在展示 AI 技術(shù)時,更多演示 AI 對于人類帶來正面效益的應(yīng)用,塑造出一種“谷歌是你的好幫手”的感覺,例如幫助聽力或語言障礙人士更好地與世界溝通,在談?wù)摲?wù)及硬件設(shè)備時,也不斷重申數(shù)據(jù)保護、攝像頭絕不會監(jiān)視用戶等,深怕又被外界抓了小辮子。

     或許正是因為如此,今年的大會才略顯平淡,少了曾經(jīng)的驚艷。

     但就像開頭所說,以創(chuàng)新力聞名的谷歌能帶來顛覆性技術(shù)突破固然令人興奮,可是相比于過分激進,轉(zhuǎn)型成為這樣一種幫手型角色,對于普通用戶、谷歌自身和社會發(fā)展來說,未嘗不是一件好事。

     科技之于人類,本就應(yīng)該扮演這樣的角色。

喜歡您正在閱讀的內(nèi)容嗎?歡迎免費訂閱泰伯每周精選電郵。 立即訂閱

參與評論

【登錄后才能評論哦!點擊

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回復(fù){{item.replynum}}
    {{child.username}} 回復(fù) {{child.to_username}}:{{child.content}}

更多精選文章推薦