777精品久无码人妻蜜桃,国产日本精品视频在线观看 ,国产亚洲99久久精品熟女av,brazzersvideosex欧美最新版,人人爽人人人爽人人爽

2025全球時空智能大會
5月21-22日 北京
開幕在即!WGDC25全球時空智能大會完整日程公布
即刻注冊  鎖定席位
分享
Scan me 分享到微信

2019AI大勢:自動駕駛寒冬、NLP大躍進、Deepfake已成魔

這一年注定是充滿了里程碑的一年。

  2019年已經(jīng)走過了98%,再過幾天,20后就要誕生了!

  這一年注定是充滿了里程碑的一年。它將大眾從《西部世界》、《終結(jié)者》等好萊塢科幻電影不切實際的虛幻場景中抽離出來,讓人們認識到,AI其實是世界上的有形力量而非夢幻,從而開始認真討論AI對社會,經(jīng)濟,政治和國際力量平衡的影響。

  本文回顧了語言模型成績斐然、人臉識別遭遇阻礙、自動駕駛遲遲未實現(xiàn)、DeepFake進入主流等等AI領(lǐng)域的發(fā)展現(xiàn)狀:有哪些技術(shù)突破面世,又遭遇了哪些新的困難?一起跟隨吳恩達的Deeplearning.ai,來看今年AI最重要領(lǐng)域內(nèi)的六大標(biāo)志性事件和趨勢。

  自動駕駛:在寒冬中孕育希望

  就在幾年前,一些汽車公司還在承諾,最早在2017年就可推出可上路的自動駕駛汽車。不過,今年1月《華爾街日報》報道,Waymo首席執(zhí)行官約翰·克拉夫奇克(John Krafcik)表示,自動駕駛汽車可能永遠無法在全路況條件下行駛。他的這一表態(tài)也成為2019年汽車行業(yè)的大裁員定下了基調(diào)。

  自動駕駛在2019年遭遇瓶頸,幾家在自動駕駛領(lǐng)域活躍的公司的商業(yè)化擴展的速度明顯放緩。GM Cruise和特斯拉已經(jīng)將自家旗下的自動駕駛出租車的最后期限推遲到2020年。

  對于Waymo和Lyft而言,盡管美國鳳凰城監(jiān)管部門在2018年就已允許這兩家公司開展自動駕駛出租車的運營業(yè)務(wù),但到目前為止,這項服務(wù)僅在少數(shù)有限地區(qū)開展,愿意選擇這項服務(wù)的人群也是寥寥無幾。商用業(yè)務(wù)進展不順,今年11月,Waymo宣布關(guān)閉在德州奧斯汀的自動駕駛汽車研發(fā)機構(gòu)。

  從技術(shù)上看,城市中道路的實時駕駛環(huán)境比路測更復(fù)雜,可能出現(xiàn)的極端危險情況也明顯增多。但如此多的極端情況,能實際出現(xiàn)的幾率卻很低,這就造成了一個麻煩,工程師們可能無法獲得足夠的模擬數(shù)據(jù)再現(xiàn)這些情況。目前來看,一些行駛路線相對固定,可預(yù)測性較高的車輛,比如自動駕駛公交車、貨車等,這些車可能比私家車和出租車更有希望嘗到自動駕駛技術(shù)落地的真正甜頭。

  從成本上看,傳感器(尤其是激光雷達)成本居高不下,而且供應(yīng)量吃緊,汽車企業(yè)成本控制,更多地選擇自己嘗試制造這些設(shè)備,同時勢必對車輛上的傳感器數(shù)量進行縮減,而傳感器數(shù)量的減少意味著訓(xùn)練和認知數(shù)據(jù)量的下降,如果傳感器的性能提升速度無法彌補這個下降,威脅到的將是自動駕駛技術(shù)的重中之重——安全性。

  從市場環(huán)境上看,2019年是全球汽車企業(yè)大裁員的一年。在全球經(jīng)濟下行、新車需求減少的背景下,日美歐各大車企先后宣布了大裁員計劃。據(jù)不完全統(tǒng)計,全球每三家汽車公司中就有一家正在裁員。自動駕駛是個燒錢的行業(yè),新技術(shù)的研發(fā)離不開傳統(tǒng)車企的技術(shù)和資金支持,目前這個環(huán)境下,過去的富爸爸們也顯得捉襟見肘了。

  當(dāng)然,也不是沒有好消息,中國就正在嘗試另一種思路。不再訓(xùn)練自動駕駛汽車在現(xiàn)有的城市環(huán)境中進行導(dǎo)航,而是對現(xiàn)有城市進行數(shù)字化改造,以適應(yīng)并促進自動駕駛技術(shù)的發(fā)展。這被稱為“智能城市”建設(shè),包括路邊傳感器設(shè)備的完善,這些傳感器會根據(jù)導(dǎo)航提示(例如車道變化和限速牌)傳遞更豐富的道路信息。

  總體來看,2019年是自動駕駛行業(yè)內(nèi)劃分進一步細化的一年,技術(shù)瓶頸和資金緊縮讓企業(yè)無法維系大而全的業(yè)務(wù)線,轉(zhuǎn)而專攻一個個自己擅長的專門領(lǐng)域。

  傳統(tǒng)汽車制造商,比如福特和梅賽德斯,將重點放在了輔助駕駛功能上,背靠谷歌的Waymo則繼續(xù)致力于全自動駕駛汽車,一些小公司則努力在有限場景中部署全自動駕駛,這些公司的目標(biāo)會隨著時間的推移而不斷擴展。

  Deepfake:技術(shù)孕育的妖怪如何收服?

  2018年底開始,一批能夠生成高度還原圖像的模型陸續(xù)誕生,如BigGAN和StyleGAN,前者可以生成ImageNet中發(fā)現(xiàn)的類的圖像,后者能夠生成姿勢,發(fā)型和衣服等要素的逼真變化。

  2019年,基于深度學(xué)習(xí)技術(shù)生成的“Deepfake”假視頻開始泛濫,這些視頻能夠憑空制造根本不存在的名人或政治人物的演講內(nèi)容,這些逼真的視頻讓人們發(fā)出“技術(shù)無所不能”的贊嘆,同時,也引發(fā)了更多的人對技術(shù)濫用和不可控的擔(dān)憂,甚至是恐懼。

  Deepfake的出現(xiàn)實現(xiàn)了“以假亂真”的合成技術(shù)從圖像到視頻的跨越。

  在Deepfake視頻中,英國足球明星大衛(wèi)·貝克漢姆(David Beckham)可以用9種語言傳達抗瘧疾信息。中國科技企業(yè)發(fā)布基于同樣技術(shù)的應(yīng)用ZAO,可以將視頻中用戶的臉換到流行的電影場景中的演員身上,讓用戶感覺就像是自己在演電影一樣。

  不過,與惡搞娛樂和公益相比,Deepfake更多地顯示了技術(shù)的“陰暗獠牙”。利用Deepfake偽造的演講視頻已經(jīng)對馬來西亞和加蓬的政治丑聞產(chǎn)生影響。

  據(jù)Deepfake檢測軟件的DeeptraceLabs的一份報告稱,目前在線的Deepfake視頻中有96%是非自愿拍攝的“換頭”片,片中人的臉往往被換成了女性名人的臉。這已經(jīng)超出了惡搞的范疇,觸及違法的邊緣。

  “妖怪”已經(jīng)從瓶中放出,我們應(yīng)如何應(yīng)對?科技企業(yè)和政府立法部門已經(jīng)開始努力。Facebook宣布了開啟一項總獎金高達1000萬美元的競賽,開發(fā)Deepfake假視頻的自動檢測技術(shù)。中國政府頒布了關(guān)于禁止傳播虛假視頻的相關(guān)規(guī)定。美國加州也通過了一項類似的法律,眾議院則在考慮推動對抗Deepfake假視頻的國家層面的立法。

  這可能是一場曠日持久的“貓捉老鼠”的高科技比拼。南加州大學(xué)計算機科學(xué)教授黎顥表示,這場比拼中,當(dāng)貓的一方前景可能并不樂觀,盡管今天的Deepfake視頻仍有明顯特征,但一年之后,這些假視頻和真視頻可能就根本沒有區(qū)別了。

  人臉識別落地受挫,政府插手立法遏制

  相比NLP領(lǐng)域的蓬勃發(fā)展,人臉識別卻在前進路上遭遇到了嚴重的抵制。國際反監(jiān)視情緒的推波助瀾,阻礙了人臉識別系統(tǒng)的進一步泛濫。

  公眾出于對自身隱私、肖像被濫用的擔(dān)憂,美國和歐洲的維權(quán)人士以及監(jiān)督組織對人臉識別可能導(dǎo)致公民人身權(quán)利遭到潛在危害而深感憂慮,于是促使立法來限制該技術(shù)的使用。

  他們的努力推動了國家禁止對該技術(shù)的公共和私人使用的勢頭,讓剛剛嶄露頭角、準(zhǔn)備大干一場的人臉識別大規(guī)模商用遭受當(dāng)頭一棒,

  如今隨著美國聯(lián)邦政府對問題進行審議,美國多個城市通過了反面部識別法。而歐盟也正在努力制定自己的限制標(biāo)準(zhǔn)。下面我們回顧一下今年幾起標(biāo)志性的事件。

  今年5月,舊金山成為美國第一個禁止警察和其他政府官員使用人臉識別的大城市;馬薩諸塞州波士頓的薩默維爾地區(qū)則緊隨其后。在接下來的幾個月內(nèi),舊金山的鄰居奧克蘭和伯克利也通過了類似的法律。這些法律是由美國公民自由聯(lián)盟牽頭的,該聯(lián)盟旨在促進國家立法。

  在華盛頓,美國國會議員抨擊了國土安全部對該機構(gòu)在機場和邊境使用該技術(shù)的計劃。參議院和眾議院的立法者提出了至少十二項法案,其中許多法案得到了兩黨的支持。這些法案旨在限制使用面部識別在壓制人身,剝奪住房和創(chuàng)造利潤方面的影響。

  歐洲監(jiān)管機構(gòu)推動將面部圖像分類為符合現(xiàn)有隱私法規(guī)的生物識別數(shù)據(jù)。歐盟委員會正在考慮立法來針對私人組織和公共機構(gòu)“不加區(qū)別地使用”面部識別的行為。盡管如此,法國還是在10月準(zhǔn)備了一項基于該技術(shù)的國家識別項目。

  中國對人臉識別的使用在美國引起了反對,美國聯(lián)邦貿(mào)易當(dāng)局禁止向幾家中國公司出口美國技術(shù)。

  2016年,美國國家電信和信息管理局發(fā)布了人臉識別指南,要求公司保持透明,實行良好的數(shù)據(jù)管理并允許公眾對與第三方共享人臉數(shù)據(jù)的某些控制權(quán)。盡管該技術(shù)的主要供應(yīng)商是NTIA的成員,但尚不清楚他們是否遵守這些準(zhǔn)則。

  雖然立法限制使用人臉識別的初衷是為了保護公民的隱私,但不同的立場以及各自為政的作風(fēng),反而可能帶來一些負面的效果。

  今年6月份,亞馬遜網(wǎng)絡(luò)服務(wù)公司首席執(zhí)行官Andy Jassy大吐苦水:“求求國會趕緊統(tǒng)一立法的吧,要不然我們將會面對的是:在美國50個州有50種不同的法律法規(guī)!”這樣的混亂局面甚至可能讓當(dāng)?shù)氐膱?zhí)法部門都陷入困惑之中。

  NLP飛躍,語言模型變得精通語言

  早期由Word2Vec和GloVe embeddings支持的語言模型產(chǎn)生了令人困惑的聊天機器人、具有中學(xué)閱讀理解能力的語法工具,以及勉強能看的翻譯。但新一代的語言模型變得如此之好,甚至有人認為它們很危險。

  2019年自然語言處理領(lǐng)域發(fā)生了什么呢?一個新的語言模型生成了新聞文章,讀者評價其和《紐約時報》一樣可信;同樣的語言模型還為《紐約客》的一篇文章做出了貢獻。令人欣慰的是,這些模型沒有像人們擔(dān)憂的那樣散布大量虛假信息。

  2019年,研究人員在讓機器理解自然語言方面取得了飛躍。通過對巨大的、未標(biāo)記的數(shù)據(jù)集進行預(yù)訓(xùn)練,新模型通??梢允炀氄莆兆匀徽Z言。然后,他們通過在專門語料庫上進行微調(diào)來掌握給定的任務(wù)或主題。

  早期的模型如ULMFiT(由Jeremy Howard和Sebastian Ruder提出)和ELMo(來自艾倫人工智能研究所和華盛頓大學(xué))展示了預(yù)訓(xùn)練的潛力,而谷歌的BERT是這種方法的第一個突破性的成功。BERT于2018年底發(fā)布,在GLUE閱讀理解基準(zhǔn)測試中得分之高,以至于測試的組織者首次將模型的表現(xiàn)與人類的baseline分數(shù)進行了比較。今年6月,微軟的MT-DNN模型首次擊敗了人類。

  今年2月中旬,OpenAI發(fā)布了GPT-2,一個預(yù)訓(xùn)練的通用語言模型,其創(chuàng)建者甚至認為它太過危險而不能發(fā)布,因為它有能力生成令人信服的文章。GPT-2使用40GB的Reddit評論進行了訓(xùn)練,并沒有引發(fā)假新聞的大災(zāi)難,但確實為一部小說、一首前衛(wèi)的歌詞,以及《權(quán)力的游戲》的同人小說做出了貢獻。OpenAI最終在11月發(fā)布了完整版本的模型。

  在這期間,來自百度、卡內(nèi)基梅隆大學(xué)、谷歌大腦、Facebook等其他機構(gòu)的一系列模型依次超越了NLP基準(zhǔn)。其中許多都基于transformer架構(gòu),并利用了BERT風(fēng)格的雙向編碼。

  新聞的背后:2018年7月,就在BERT誕生前不久,DeepMind研究員Sebastian Ruder預(yù)測了預(yù)訓(xùn)練對自然語言處理的影響。此外,他還預(yù)測,NLP的突破將徹底改變整個人工智能。他的論點基于2012年前后預(yù)訓(xùn)練對計算機視覺模型的激發(fā)。許多業(yè)內(nèi)人士將深度學(xué)習(xí)的爆炸式增長追溯到這一刻。

  現(xiàn)狀:盡管經(jīng)過了一年的創(chuàng)新,語言模型仍然有很大的增長空間:即使是1.5萬億參數(shù)的GPT-2也經(jīng)常吐出一堆令人費解的文字。至于新的模型是否有能力用鋪天蓋地的虛假信息擾亂民主,即將到來的美國選舉季將檢驗這一點。

  從《星際爭霸II》到機器手解魔方:機器學(xué)習(xí)更多地依賴模擬數(shù)據(jù)

  機器學(xué)習(xí)的未來可能更少地依賴于收集真實數(shù)據(jù),而更多地依賴模擬環(huán)境。

  有了足夠的高質(zhì)量數(shù)據(jù),深度學(xué)習(xí)就像變魔術(shù)一樣有效。但是,當(dāng)樣本很少的時候,研究人員就用模擬數(shù)據(jù)來填補空白。

  2019年,在模擬環(huán)境中訓(xùn)練的模型完成了比該領(lǐng)域先前工作更復(fù)雜、更多樣的壯舉。在強化學(xué)習(xí)方面,DeepMind的AlphaStar在復(fù)雜戰(zhàn)略游戲《星際爭霸II》(StarCraft II)中取得了特級大師段位——能夠打敗99.8%的人類玩家。OpenAI Five訓(xùn)練了一個由5個神經(jīng)網(wǎng)絡(luò)組成的團隊,打敗了Dota 2的世界冠軍。但這些模型在模擬世界學(xué)習(xí),學(xué)會的是在模擬世界中行動。其他研究人員將AI在模擬中學(xué)習(xí)到的技能遷移到現(xiàn)實世界中。

  OpenAI的Dactyl機械臂在虛擬環(huán)境中花費了相當(dāng)于13000年的模擬時間,開發(fā)出操作魔方所需的靈活性。然后將這些技能應(yīng)用到一個真實魔方上。當(dāng)還原一個魔方需要15次以內(nèi)的旋轉(zhuǎn)時,它的成功率達到60%。當(dāng)還原魔方需要更多次操作時,它的成功率下降到20%。

  加州理工學(xué)院的研究人員訓(xùn)練了一個神經(jīng)網(wǎng)絡(luò)來區(qū)分重疊地震和同時發(fā)生的地震,方法是模擬橫跨加州和日本的地震波,并將模擬結(jié)果作為訓(xùn)練數(shù)據(jù)。

  亞馬遜旗下的Aurora自動駕駛汽車部門同時進行數(shù)百次模擬,以訓(xùn)練其模型在城市環(huán)境中導(dǎo)航。該公司正在以類似的方式訓(xùn)練Alexa的對話能力、送貨無人機和機器人。

  模擬環(huán)境,諸如Facebook的AI Habitat,谷歌的強化學(xué)習(xí)行為套件,以及OpenAI的Gym,都可以為AI掌握任務(wù)提供資源,例如優(yōu)化紡織生產(chǎn)線,填充3D圖像中的空白點,以及在嘈雜的環(huán)境中檢測對象。在不久的將來,模型可以探索分子模擬,以了解如何設(shè)計具有預(yù)期結(jié)果的藥物。

  沖突爆發(fā):符號主義和連接主義的古老爭論再燃

  以Twitter為陣地,以加里·馬庫斯(Gary Marcus)為首的長達一年的爭論,為圍繞人工智能發(fā)展方向數(shù)十年的爭論注入了新的活力。

  馬庫斯是紐約大學(xué)教授、作家、企業(yè)家,以及基于邏輯的AI的鼓吹者,他發(fā)起了不懈的Twitter爭論,試圖打破深度學(xué)習(xí)的根基,并推廣其他人工智能方法。

  馬庫斯重新點燃了所謂的符號主義者和連接主義者之間的古老爭論,前者堅持認為基于規(guī)則的算法對認知至關(guān)重要,而后者則認為將足夠多的神經(jīng)元與正確的損失函數(shù)連接起來是獲得機器智能的最佳途徑。

  與馬庫斯針鋒相對的AI從業(yè)者重新熟悉了象征主義的方法,以免連接主義的局限性導(dǎo)致資金崩潰,或人工智能陷入寒冬。這一爭論促使人們對人工智能的未來做出了清醒的評估,并在12月23日由馬庫斯和深度學(xué)習(xí)先驅(qū)、蒙特利爾大學(xué)Yoshua Bengio教授的一場現(xiàn)場辯論中達到高潮。辯論過程非常有禮貌,雙方都承認兩個黨派之間需要合作。

  2018年12月,馬庫斯向深度學(xué)習(xí)支持者的“帝國主義”態(tài)度發(fā)起了挑戰(zhàn),開始了自己的進攻。他繼而鞭策Facebook的深度學(xué)習(xí)先驅(qū)Yann LeCun,要他選擇一方:是把自己的信仰寄托在純粹的深度學(xué)習(xí)上,還是有好的“出色的老式人工智能”(good old-fashioned AI)的一席之地?

  OpenAI在10月份提出的混合模型成為頭條新聞。它的機械手通過深度強化學(xué)習(xí)和經(jīng)典的Kociemba算法的結(jié)合解決了魔方難題。雖然馬庫斯指出是Kociemba算法計算出了解決方案,而不是深度學(xué)習(xí),但其他人斷言機器人可以通過進一步的訓(xùn)練來學(xué)習(xí)這項技能。

  去年12月,微軟提出“神經(jīng)符號人工智能”(neurosymbolic AI),填補了這一空缺。這是一個旨在彌合神經(jīng)表示和符號表示之間差距的模型架構(gòu)。

  隨著2019年臨近結(jié)束,NeurIPS會議強調(diào)了人工智能社區(qū)的soul searching。谷歌研究員Blaise Aguera y Arcas在一次主題演講中表示:“我們目前所有的訓(xùn)練模式都是為了讓AI在特定任務(wù)中取得勝利或者贏得高分,但這并不是智能的全部。”

  符號主義者和連接主義者之間的敵意可以追溯到半個多世紀(jì)以前。1969年,馬文·明斯基和西摩爾·派普特在《Perceptrons》書中,仔細分析了以感知機為代表的單層神經(jīng)網(wǎng)絡(luò)系統(tǒng)的功能及局限,證明感知機不能解決簡單的異或(XOR)等線性不可分問題,幫助觸發(fā)了第一個AI冬天。

  第二個AI寒冬是在將近20年后,部分原因是符號AI依賴于LISP計算機,而LISP計算機已經(jīng)隨著PC的出現(xiàn)變得過時了。

  神經(jīng)網(wǎng)絡(luò)在20世紀(jì)90年代開始普及,并在過去十年計算能力和數(shù)據(jù)的爆炸式增長中取得了主導(dǎo)地位。 當(dāng)連接主義者和符號主義者齊頭并進,或者直到一個派別消滅另一個派別時,我們期待著激動人心的新時代。?

喜歡您正在閱讀的內(nèi)容嗎?歡迎免費訂閱泰伯每周精選電郵。 立即訂閱

參與評論

【登錄后才能評論哦!點擊

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回復(fù){{item.replynum}}
    {{child.username}} 回復(fù) {{child.to_username}}:{{child.content}}

更多精選文章推薦