美國時間 5 月 7 日，谷歌 2019 年 I/O 開發(fā)者大會在山景城總部開幕，為期三天。

在開幕式上，谷歌宣布了諸多亮點，比如更貼近用戶的搜索功能，更強大的 AI 與語音助手，內(nèi)置在安卓系統(tǒng)中的語音轉(zhuǎn)文字功能，新款 Pixel 3a 和 3a XL 中端手機，Nest Hub Max 智能家居設(shè)備，還有安卓 Q 系統(tǒng)更新等等。

“To Be Helpful”是整場大會的主題之一。因此，無論是產(chǎn)品演示，還是演講者，幾乎全都從安全、隱私和實用的理念出發(fā)，透露出與往屆 I/O 大會不同的務(wù)實風(fēng)格。

圖 | 谷歌AI領(lǐng)軍人 Jeff Dean: 為每一個人打造一個更有幫助的谷歌

即使是最后登場的谷歌 AI 領(lǐng)軍人 Jeff Dean，也是以現(xiàn)有研究成果出發(fā)，強調(diào)了 BERT 模型在自然語言處理領(lǐng)域取得的建樹，以及 AI 技術(shù)在健康和環(huán)境領(lǐng)域的應(yīng)用潛力，并未帶來令人眼前一亮的驚艷機器學(xué)習(xí)新成果。

不過從另一個角度來看，這或許才是科技本身應(yīng)有的樣子：一項高科技，無論初見有多驚艷，最終只有成為像空氣一般的存在，讓我們幾乎察覺不到它，卻又依賴于它，才能讓我們開始享受它的價值，進而真正地享受生活。

這也是谷歌 2019 年 I/O 開發(fā)者大會帶給我們的啟示。

圖 | 谷歌I/O大會開場

“黑科技”開場，奠定務(wù)實風(fēng)格

一開場，谷歌就遵循一貫風(fēng)格，直接亮出了人們喜聞樂見的“黑科技”。

副總裁 Aparna Chennapragada 率先介紹了谷歌的最新視覺技術(shù)：巧妙地整合攝像頭和增強現(xiàn)實（AR）技術(shù)，強化谷歌搜索結(jié)果的互動性和實用性。

她在谷歌上搜索出的二維圖片，可以直接轉(zhuǎn)換成三維模型，并通過攝像頭放在真實環(huán)境中。

無論你搜索的是人體骨骼，一雙鞋，還是一條鯊魚，都沒問題，只要谷歌制作了 3D 模型，就可以通過攝像頭，展示在現(xiàn)實場景中，供用戶查看效果。它們不僅可以活動，還能夠接受放大、縮小、運動和轉(zhuǎn)移等操作指令。

可以肯定的是，3D 化的搜索結(jié)果不僅僅停留在有趣這一階段，它可以給用戶帶來更直觀的使用體驗和感受，加深對物體運作機制的理解程度。

想象一下，如果你想知道心臟長什么樣子，除了看到實物，有什么東西能比一個會跳動的、可以放大縮小和分解的立體模型更加形象的呢？尤其是它可以隨時隨地出現(xiàn)在任何地方，AR 技術(shù)的價值進一步得到了挖掘。

圖 | 搜索出的大白鯊以 AR 形式出現(xiàn)在演講臺上

除了強化搜索結(jié)果，谷歌還通過 Google Lens 程序，讓手機攝像頭變得更有價值。

如果你新到一家餐館，不知道有什么特色菜，沒關(guān)系，只要拿出手機，打開 Google Lens 程序，對準(zhǔn)菜單，它就可以根據(jù)已有點評，標(biāo)注出大多數(shù)人推薦的特色菜。

如果你去法國旅游，卻不會法語，看不懂路標(biāo)，沒關(guān)系，只要拿出手機，打開 Google Lens 程序，對準(zhǔn)路標(biāo)，它就可以識別上面的法語，直接翻譯成中文和英語等十多種語言，還可以直接朗讀出來，讓語言不再成為交流和旅游的障礙。

如果你想看菜譜學(xué)做菜，沒問題，Google Lens 配合食譜制造商，錄制預(yù)先制作的烹飪視頻，只要將鏡頭對準(zhǔn)菜譜文字，就會有實際演示視頻跳出來，為你展示如何操作。

這些都是非常貼近日常生活的實用功能，如果實際操作效果與演示效果相符，那么將極大地方便我們的生活。

圖 | Google Lens可以翻譯多種語言的不同標(biāo)志

谷歌在現(xiàn)場播放了一段視頻，講述了印度的試點項目。視頻中，一名不識字的印度母親依靠著 Google Lens 程序，終于可以以聽的方式理解書上的內(nèi)容，孩子的作業(yè)，路上的標(biāo)識，餐館的菜單等等，最后無需別人的幫助，單獨完成很多任務(wù)。

雖然在普通人看來，她完成的都是些瑣碎小事，比如去 ATM 取錢和預(yù)訂火車票，但對于她來說，這就像打開了生活的另一扇門。

由此可見，谷歌貫徹的“To Be Helpful”的理念，意味著技術(shù)應(yīng)該能夠真正幫助有需要的人提高生活質(zhì)量。

圖| 印度母親使用Google Lens 幫助自己看懂包裝盒上的字

谷歌最后強調(diào)，這種技術(shù)結(jié)合了自然語言處理、機器視覺、以及谷歌 20 多年來的搜索信息才能實現(xiàn)，但代碼只有 100 KB 左右，所以無需高端設(shè)備就可以運行。

這項功能將加入 Google Go 應(yīng)用中。對視覺障礙者，以及不會外語的人來說，這無疑是獲取信息的新方式。目前，Google Go 已經(jīng)能支持?jǐn)?shù)十種語言，售價為 35 美元。

不得不說，谷歌選擇用直觀的視覺技術(shù)作為開場，非常機智。不僅契合主題，突出了實用性，還成功塑造出眼前一亮的感覺，調(diào)動了觀眾的積極性。但是稍顯可惜的是，這些演示或許是整場大會最有看點的部分了。

更強大、更懂你的AI語音助手

在去年的 I/O 大會上，谷歌的語音助理技術(shù)推出新功能 Google Duplex，讓 AI 打電話預(yù)訂餐廳，因其聲調(diào)語氣相當(dāng)逼真，接電話的人沒察覺，該技術(shù)一鳴驚人，但引起了一些爭議。

在今年的 I/O 大會上，谷歌也演示了新功能，包括一句話開啟駕駛模式和更先進的 Duplex on the web，也就是“Duplex 可以幫忙執(zhí)行網(wǎng)頁上的任務(wù)”。

例如用戶可以呼出語音助理，要求它上網(wǎng)幫你預(yù)訂一臺車，然后語音助理就會進入租車網(wǎng)站，幫你填寫姓名、住址，甚至是偏好車型等信息，并要求你確認(rèn)。

圖 | 語音助手幫你租車

它還利用知識圖譜來進行個人推薦。根據(jù)用戶的使用習(xí)慣，AI 能更好地理解用戶的語音指令，可以通過語音瞬間打開 App，并且可以使用連續(xù)的語音指令，而不需要每次都說出喚醒詞。比如 AI 可以追蹤一連串語音指令：打開地圖，播放音樂，打開相冊，搜索有動物的照片，發(fā)送給某人，它能根據(jù)一系列語音指令按順序完成相應(yīng)動作。

谷歌認(rèn)為此功能擁有很大的應(yīng)用前景，并強調(diào)隨著深度學(xué)習(xí)的進展，把 AI 模型放置到移動裝置將是一種范式的轉(zhuǎn)換。他們希望可以把 100GB 的語音識別模型縮小到 0.5GB，并放在終端設(shè)備上，讓用戶更方便使用。

不過谷歌表示，目前該功能還在完善階段，預(yù)計今年晚些時間才會公布更多細節(jié)，并透露在今年晚些會推出新的 Pixel 手機。

安卓內(nèi)置語音轉(zhuǎn)文字功能

作為一家以人性化為核心的公司，谷歌這次格外考慮到了聽覺或語言障礙人士，推出了 Live Caption（實時字幕）技術(shù)。

圖 | 實時字幕技術(shù)演示

該技術(shù)由循環(huán)神經(jīng)網(wǎng)絡(luò)支持，可以把手機中的視頻和音頻內(nèi)容實時轉(zhuǎn)化成文字，類似于微信的語音信息轉(zhuǎn)文字。

不過更重要的是，Live Caption 是原生存在于安卓系統(tǒng)中的功能，意味著它能夠契合所有的應(yīng)用，適用于視頻聊天、電話、錄像，甚至是游戲中，而且使用全程可在設(shè)備端進行處理，不需要聯(lián)網(wǎng)，從而進一步保障用戶隱私。

對于普通人來說，如果不想外放語音，一副耳機就可以解決。但對于聽覺或語言障礙人士來說，這項功能可以發(fā)揮很大的作用，幫助他們更好地與人溝通。

在此基礎(chǔ)上，谷歌推出了 Project Euphonia，通過機器學(xué)習(xí)來了解語言障礙者的對話模式，來實現(xiàn)精準(zhǔn)的語音轉(zhuǎn)寫。

安卓Q圍繞安全和隱私等優(yōu)化

盡管谷歌有許多平臺，像是 Chrome，但安卓系統(tǒng)依舊是最重要、裝機量最大的那一個，目前全球已有超過 25 億臺安卓設(shè)備。

谷歌在今天也發(fā)布了最新安卓 Q Beta 3 版本，圍繞安全和隱私等核心問題進行優(yōu)化，12 家 OEM 廠商的 21 個手機機種都可以升級，包括華為、小米、Vivo 等。

除了支持上述的 Live Caption 功能，安卓 Q Beta 3 還適配可折疊屏幕，游戲應(yīng)用可以直接在兩種模式下無縫流暢轉(zhuǎn)換，并且加入了用戶期待已久的黑暗主題。

圖 | Q Beta 3 適配折疊屏

此外，谷歌還推出了其它新功能，比如 Focus Mode 專注模式，可以讓用戶暫時停止使用一些容易打擾人的應(yīng)用；Smart Reply 功能，可以預(yù)測和提供智能回復(fù)建議，能夠通過任何應(yīng)用快速發(fā)送回復(fù)；以及針對小孩的父母管理機制。

值得一提的是，安卓 Q 已經(jīng)增加了 5G 網(wǎng)絡(luò)支持，為未來 OEM 廠商推出 5G 手機打下了基礎(chǔ)。

強調(diào)隱私保護，Nest Hub Max 誕生

智能家居一直是各家業(yè)者都想爭取的市場，Nest 是谷歌旗下專注智能家居的獨立團隊，已有家庭安全攝像頭和帶有顯示屏的 Home Hub 等智能家居產(chǎn)品。

圖 | 推出新版 Nest Hub Max

谷歌在大會上表示，智能家居必須非常重視用戶的隱私，并且宣布，將 Home Hub 更名為 Nest Hub，同時推出升級版 Nest Hub Ｍax，裝有更大的 10 英寸顯示屏，直接與 Facebook Portal 和亞馬遜 Echo Show 等同類產(chǎn)品競爭。

谷歌強調(diào)，沒有用戶允許絕不會啟動攝像頭，另外拍下或錄下的數(shù)據(jù)只會存在終端上，并使用 FaceMatch 面部識別用戶，支持手勢操作。

屏幕較大的 Nest Hub Ｍax 售價 229 元，現(xiàn)有的 Nest Hub 則降價 20 美元至 129 美元。

推出兩款Pixel，進軍中端智能手機市場

隨后谷歌帶來了兩款 Pixel 系列手機，Pixel 3a 與 Pixel 3a XL，售價分別是 399 美元和 479 美元，前者即日起開售，后者今年暑期上市。這也是谷歌首次推出中端智能手機。

圖 | 新款Pixel 3a售價399美元，即日發(fā)售

兩個機型在外觀上依然延續(xù) Pixel 家族的特點，無劉海屏幕，后置單攝像頭，提升拍照質(zhì)量主要靠搭載谷歌自研 Pixel Visual Core 圖像處理單元，還繼續(xù)使用后置指紋識別，保留有 3.5mm 耳機孔，一次充電可以支撐 30 小時，并且配有 Titan M 安全芯片，專門用來保護用戶隱私。

至于硬件配置，谷歌大會上并沒有給出詳細參數(shù)，但已有媒體爆出了比較可信的數(shù)據(jù)，其中 Pixel 3a 搭載高通驍龍 670 處理器，配備 4GB 內(nèi)存+ 64GB 存儲，分辨率為 1080×2160 ；Pixel 3a XL 搭載高通驍龍 710 處理器，配備 4GB 內(nèi)存+128GB 存儲，分辨率為 2220×1080。

相比 Pixel 3 的 799 美元售價，兩款中端手機的價格更加親民，這在一定程度上可以刺激目前較為疲軟的 Pixel 銷量，但隨著全球整體智能手機市場逐漸飽和，再加上谷歌在大會上暗示今年晚些時候?qū)⑼瞥鲂?Pixel 高端機，它們究竟能夠為谷歌帶來多少收益還不得而知。

就像在剛剛過去的第一季度財報會議上，谷歌 CEO Pichai 表示的那樣，“在硬件之路上，谷歌還處于早期階段”。

Jeff Dean登場，壓軸的谷歌 AI

在大會的最后，谷歌 AI 領(lǐng)軍人物 Jeff Dean 壓軸登場，介紹了自己團隊一直以來的研究目標(biāo)和方向。從推動計算機視覺的極限，到語音識別，他們研究的領(lǐng)域涵蓋生活中的方方面面。

圖 | Jeff 介紹谷歌AI 團隊的研究進展

在Jeff 看來，最讓他激動的AI技術(shù)進展是語言理解。

遵循這一思想，谷歌 AI 一直在努力提高計算機對語言的理解能力，希望有朝一日能媲美人類的水平。最新的研究成果就是自然語言處理領(lǐng)域大名鼎鼎的 BERT 模型（Bidirectional Encoder Representation from Transformers）。

BERT 模型突破了傳統(tǒng) RNN 模型的限制，不再局限于單個關(guān)鍵詞詞義的理解，而是結(jié)合上下文分析語義，能夠在大段文字下更好地理解語境和整體內(nèi)容。

該模型于 2018 年 11 月推出，直接刷新了自然語言處理任務(wù)的 11 項紀(jì)錄，同時啟發(fā)了多個研究團隊，后續(xù)衍生模型不斷刷新著新的紀(jì)錄。

谷歌團隊更是將其直接定義為：BERT 模型開啟了自然語言處理的新時代！

隨后，谷歌 AI 介紹了 AI for Social Good 項目，旨在將 AI 技術(shù)推廣到各個領(lǐng)域。

圖 | 谷歌用AI 檢測肺癌

他們將 AI 運用于醫(yī)療保健，建立了 CT 掃描圖預(yù)測模型，可以幫助檢測肺癌。他們還將 AI 運用在自然災(zāi)害預(yù)測領(lǐng)域，建立了一個洪水預(yù)測模型，預(yù)測洪水會出現(xiàn)在何時何地。該模型結(jié)合了深度學(xué)習(xí)、衛(wèi)星影像與以現(xiàn)實為基礎(chǔ)的情境模擬，并且會將信息共享給可能會受到影響的個人。

除此之外，谷歌的 AI for Social Good 項目還包括地震余震預(yù)測、全球漁業(yè)活動預(yù)測等等，都突顯出 AI 技術(shù)的實用價值。

圖 - 用 AI 模型預(yù)測地震余震

結(jié)語

最近一兩年，數(shù)據(jù)隱私和 AI 道德問題持續(xù)困擾著美國科技巨頭們，特別是用戶體量巨大、掌握海量數(shù)據(jù)的 Facebook 和谷歌。

上周的 Facebook F8 大會，扎克伯格三句話不離數(shù)據(jù)隱私保護，力求挽回形象，而在谷歌 I/O 大會開幕式上，我們似乎也感受到了谷歌的刻意“保守”。

去年，谷歌在大會上演示了 Google Duplex，讓 AI 打電話訂位，AI 模仿人類太成功，接聽電話的店員根本沒有察覺有異，不料卻引起外界憂心技術(shù)被用來欺騙人類。

隨后，谷歌遭人詬病的事一樁接著一樁，一下子員工聯(lián)名抗議用 AI 做軍事生意，導(dǎo)致云計算部門高管的離職潮，一下子又反對 AI 道德委員會的某些外部成員，使得該組織才成立一周就被迫解散。這讓曾經(jīng)確立“AI 優(yōu)先”戰(zhàn)略的谷歌不得不重新思考技術(shù)的發(fā)展走向和展示策略。

所以，今年的 I/O 大會在展示 AI 技術(shù)時，更多演示 AI 對于人類帶來正面效益的應(yīng)用，塑造出一種“谷歌是你的好幫手”的感覺，例如幫助聽力或語言障礙人士更好地與世界溝通，在談?wù)摲?wù)及硬件設(shè)備時，也不斷重申數(shù)據(jù)保護、攝像頭絕不會監(jiān)視用戶等，深怕又被外界抓了小辮子。

或許正是因為如此，今年的大會才略顯平淡，少了曾經(jīng)的驚艷。

但就像開頭所說，以創(chuàng)新力聞名的谷歌能帶來顛覆性技術(shù)突破固然令人興奮，可是相比于過分激進，轉(zhuǎn)型成為這樣一種幫手型角色，對于普通用戶、谷歌自身和社會發(fā)展來說，未嘗不是一件好事。

科技之于人類，本就應(yīng)該扮演這樣的角色。