人工智能正在大范圍地回歸到我們的生活中。機器(或是一組機器)已可以戰(zhàn)勝國際象棋冠軍,或是從“危險邊緣”節(jié)目的參賽者中脫穎而出。我們正身處這樣趣味無窮的時代。計算的可用性在不斷增加,數(shù)據(jù)量也在極大的豐富。從這種似乎是未來的人機大戰(zhàn)中,企業(yè)已意識到自己正把持著迄今尚未有效利用的海量數(shù)據(jù)。無論是對購買模式的預(yù)測,還是對消費設(shè)備故障的預(yù)測,人工智能技術(shù)的使用無疑將顯著地提升企業(yè)解決方案的競爭優(yōu)勢。由此,在認(rèn)知解決方案上的競賽已經(jīng)開始。
企業(yè)需要跟上時代的步伐。其中首要也是最為重要的挑戰(zhàn),是對開發(fā)人員而言,人工智能無疑就像是十分難以掌握的火箭科學(xué),學(xué)習(xí)曲線陡峭。
其次,傳統(tǒng)的軟件開發(fā)方法并不適用于人工智能。根據(jù)環(huán)境的不同,一組輸入可能會產(chǎn)生多種輸出,這導(dǎo)致以測試為驅(qū)動的開發(fā)難以維系。
最后,人工智能并不具有一套統(tǒng)一的 API,雖然在不同的平臺上可能會使用相似的技術(shù),但是解決方案很難在平臺間遷移。
就此問題,InfoQ 聯(lián)系了幾位人工智能領(lǐng)域的專家,開展了一次虛擬的專家研討會。他們分別是:來自 Uber 的 Prakhar Mehrotra,DeepGrammar 的聯(lián)合創(chuàng)始人 Jonathan Mugan 博士,以及 LinkedIn 的 Kumar Chellapilla 博士。訪談內(nèi)容涉及:如何闡釋與人工智能相關(guān)的多個技術(shù)問題,以及企業(yè)開發(fā)人員如何利用這些技術(shù)改進企業(yè)解決方案的智能化程度。
人工智能會是曇花一現(xiàn)嗎?
InfoQ:記得我在讀研期間,學(xué)習(xí)過 Prolog 和 Lisp。那時人工智能雖是呼之即出,但卻是波瀾不驚。為什么會是這樣?似乎人工智能當(dāng)前再一次成為熱點,這將會是曇花一現(xiàn),還是將持續(xù)下去?
Mehrotra:我認(rèn)為人工智能的熱度將持續(xù)下去!在學(xué)術(shù)界,人工智能一直是一個熱門的研究方向。在工業(yè)界,人工智能也得到了廣泛的應(yīng)用。Google、Facebook、Amazon、Microsoft 和 Apple 等科技巨頭做了大力的投入,例如 iPhone 中的 Siri、Alexa、Google Home 以及最近的無人駕駛汽車。在過去的十年中,我們能看到兩項巨大的技術(shù)轉(zhuǎn)變,即轉(zhuǎn)向移動端,以及云的出現(xiàn)。這兩者都導(dǎo)致了數(shù)據(jù)量發(fā)生爆炸性增長。更便宜的計算成本和硬件成本,使得學(xué)校和工業(yè)界的研究人員能夠改進神經(jīng)網(wǎng)絡(luò)等關(guān)鍵人工智能算法的性能。這提高了現(xiàn)實世界中應(yīng)用的精度,例如圖像分類和搜索,文本挖掘和語音識別等。另一個影響人工智能被廣為采納的因素是成本問題。Google 等科技巨頭提出了實現(xiàn)人工智能“人人可用”(democratizing)的理念,并提供了 TensorFlow 等系統(tǒng),使得任何人都能運行算法并開展實驗。因此,精度更高的算法以及更低的運行成本,這將導(dǎo)致人工智能的熱潮將持續(xù)下去。
Mugan:我認(rèn)為向更智能的機器發(fā)展是一種長期的趨勢,但這種發(fā)展是循環(huán)往復(fù)的。人工智能目前涵蓋很廣,部分原因在于深度學(xué)習(xí)提供了一種新的錘子,人工智能的從業(yè)人員就可以不斷地去尋找能被該錘子敲擊的問題,社會發(fā)展將從這一過程中持續(xù)受益。Prolog 和 Lisp 都是符號運算系統(tǒng),這樣的系統(tǒng)是脆弱的,因為本質(zhì)上開發(fā)人員必須在計算機可認(rèn)知的范圍內(nèi)編寫代碼,總不可避免會有用例被開發(fā)人員所遺漏。但是,符號系統(tǒng)在編碼先驗知識和特征上表現(xiàn)良好。如何將它們與深度學(xué)習(xí)結(jié)合起來,這依然是一個開放的問題。
Chellapilla:人工智能正變得越來越好。期望與現(xiàn)實間的差距,真實地反映了我們對科學(xué)能快速實現(xiàn)我們科幻夢想的樂觀心態(tài)。在我們的成長過程中,曾夢想著太空旅行、通信器(譯者注:即 Communicator,出自《星際迷航》)、飛行汽車、HAL(譯者注:出自克拉克的科幻小說《2001:太空漫游》。HAL 分別為 IBM 的前一個字母,表示比 IBM 更先進的電腦)能在生活中成為現(xiàn)實。在上世紀(jì) 60 至 80 年代的人工智能浪潮中,我們嚴(yán)重低估了一些人工智能問題的難度。語音識別和對象檢測與識別就是兩個很好的例子,這兩個問題的解決過程歷經(jīng)了幾十年的時間。直到最近,我們才給出了很好的解決方案,使解決方案不僅具有競爭力,而且能夠超越人類的自然能力。這些近期的突破取決于更強大的計算能力、大量數(shù)據(jù)的獲取以及深度學(xué)習(xí)的進步。當(dāng)前,人工智能開發(fā)人員或科學(xué)家通常可駕馭超百萬次計算(從 GigaFlops 到 PetaFlops)和百萬字節(jié)數(shù)據(jù)(從 GigaBytes 到 PetaBytes)。這是非常令人興奮!此外,開源工具包和云技術(shù)的成熟,大大加快了人工智能社區(qū)的規(guī)模和創(chuàng)新的速度。
統(tǒng)計學(xué)與機器學(xué)習(xí)的差異
InfoQ:認(rèn)知計算的范圍涵蓋了數(shù)據(jù)科學(xué)、機器學(xué)習(xí)、深度學(xué)習(xí)、人工智能等。你們認(rèn)為計算機視覺,神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)這三者是否是同義詞?你們能否做一個簡潔的澄清,理解三者間的區(qū)別是如何幫助開發(fā)人員和架構(gòu)師設(shè)計解決方案的?
Mehrotra:這個問題很好!當(dāng)然,根據(jù)我個人在行業(yè)中的經(jīng)驗,我曾看到人工智能、機器學(xué)習(xí)和深度學(xué)習(xí)這三個術(shù)語被作為同義詞使用,尤其是在企業(yè)環(huán)境中。事實上它們根本不是同義詞。人工智能是一個更為廣泛的研究領(lǐng)域,意在構(gòu)建“智能”的系統(tǒng)。如果一個系統(tǒng)旨在模仿人類的智力,并且能像人類一樣思考(例如通過圖靈測試等),那么我們稱這樣的系統(tǒng)為“人造通用智能”(AGI,Artificial General Intelligence)或“強人工智能”。人工智能和 AGI 間的差異在于問題和建模領(lǐng)域的范圍上。機器學(xué)習(xí)是應(yīng)用數(shù)學(xué)的一個分支,也是構(gòu)建人工智能系統(tǒng)的技術(shù)之一。搜索、優(yōu)化、控制理論、邏輯推理等都是人工智能技術(shù)。
機器學(xué)習(xí)與經(jīng)典統(tǒng)計學(xué)的不同之處在于,機器學(xué)習(xí)很少強調(diào)置信區(qū)間,而置信區(qū)間是經(jīng)典統(tǒng)計學(xué)家的最基本手段(譯者注:原文為“面包和黃油”)。深度學(xué)習(xí)是機器學(xué)習(xí)領(lǐng)域中的一種算法。其它的算法實例還包括邏輯斯蒂回歸、貝葉斯網(wǎng)絡(luò)和支持向量機等。神經(jīng)網(wǎng)絡(luò)(有時也稱為人工神經(jīng)網(wǎng)絡(luò))并非一個十分嚴(yán)謹(jǐn)?shù)男g(shù)語。在學(xué)術(shù)界,它被用于指代前饋神經(jīng)網(wǎng)絡(luò)。如果一個神經(jīng)網(wǎng)絡(luò)具有很多層,那么我們稱該神經(jīng)網(wǎng)絡(luò)非常“深”。簡單回顧一下,人工智能是一個超集,機器新學(xué)習(xí)是人工智能的一個子集,而深度學(xué)習(xí)是人工智能的一個子集。
Mugan:人工智能關(guān)注的是如何能讓計算機變得更加聰明。機器學(xué)習(xí)是如何通過使用經(jīng)驗讓計算機在特定任務(wù)上表現(xiàn)得更好。而機器學(xué)習(xí)是一種實現(xiàn)人工智能的方式(另一種方式是直接對智能設(shè)備編程)。神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)均為一種機器學(xué)習(xí)方式,兩者近乎同義。隨著神經(jīng)網(wǎng)絡(luò)的不斷擴大,我們開始稱該方法為深度學(xué)習(xí)。計算機視覺是計算機獲得智能所需的眾多功能之一,可以通過機器學(xué)習(xí)實現(xiàn)計算機視覺,這種機器學(xué)習(xí)可以采用神經(jīng)網(wǎng)絡(luò)(深度學(xué)習(xí))實現(xiàn)。 數(shù)據(jù)科學(xué)就是如何使數(shù)據(jù)對人類決策者有用的科學(xué)。雖然它可能會涉及人工智能和機器學(xué)習(xí),但其目標(biāo)是讓人類做出決策。
Chellapilla:這三個概念非常令人困惑,難道不是嗎?它們是相關(guān)的,盡管在使用時看上去是類似的,但卻是不一樣的。人工智能是一個宏偉愿景。在三者中,人工智能的表示范圍最為寬泛,涵蓋了一些應(yīng)用人類編程和機器學(xué)習(xí)的領(lǐng)域。相比之下,機器學(xué)習(xí)僅包括一系列用于機器的工具和技術(shù),在人類創(chuàng)作者盡可能少地干預(yù)的情況下,實現(xiàn)從大量數(shù)據(jù)中學(xué)習(xí)。例如,Deep Blue 和 AlphaGo 都是使用人工智能構(gòu)建的游戲程序。Deep Blue 戰(zhàn)勝 Gary Kasparov 贏得了人機國際象棋錦標(biāo)賽,這是一個很好的例子,其中使用了人機編程實現(xiàn)的智能,而非使用機器學(xué)習(xí)構(gòu)建人工智能技術(shù)。與之相對比的是,AlphaGo 中大量使用了機器學(xué)習(xí)技術(shù),它在去年(即 2016 年)首次贏得了與人類職業(yè)選手的比賽。AlphaGo 使用的深層神經(jīng)網(wǎng)絡(luò)是一類機器學(xué)習(xí)模型,這里并非用于計算機視覺目的。因此,計算機視覺,神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)并不是同義詞。深度學(xué)習(xí)基本上可稱為神經(jīng)網(wǎng)絡(luò) 2.0,它是更大、更好及更深層次的神經(jīng)網(wǎng)絡(luò)。計算機視覺是一種人工智能技術(shù),意在使得機器可以“看得到”,即獲得對圖像,視頻和 3D 空間的高級理解。這里的問題涉及如何檢測圖像中的一些感興趣事物(例如面部和物體等),對它們做實時跟蹤,并通過建立事物周邊世界的 3D 模型來預(yù)測結(jié)果。當(dāng)前,構(gòu)建計算機視覺人工智能的最佳機器學(xué)習(xí)模型是卷積神經(jīng)網(wǎng)絡(luò),這是深度神經(jīng)網(wǎng)絡(luò)的一個子類型。
是什么導(dǎo)致數(shù)據(jù)利用率小?
InfoQ:這些不同領(lǐng)域的基礎(chǔ)在于數(shù)據(jù)的可用性。很多企業(yè)抱怨說,自己已經(jīng)擁有了如此之多的數(shù)據(jù),但只能使用其中一小部分的可用數(shù)據(jù)。什么是阻礙了企業(yè)對更多數(shù)據(jù)的使用?是否存在數(shù)據(jù)過多的情況?
Mehrotra:這是一個人力資源范疇的問題!我們將知道如何對數(shù)據(jù)進行理解的人稱為“數(shù)據(jù)科學(xué)家”。事實證明,數(shù)據(jù)科學(xué)家存在大量的短缺。大學(xué)正在緊追這種需求。我曾經(jīng)讀過一份麥肯錫給出的大數(shù)據(jù)報告,記得其中提及到 2018 年,美國的數(shù)據(jù)科學(xué)家的空缺將達約 15 萬個。
Mugan:我并不認(rèn)為這是一個數(shù)據(jù)過多的問題。挑戰(zhàn)在于如何獲取數(shù)據(jù)的格式以便將數(shù)據(jù)輸入計算機。對此很難找出最有效的算法。一旦擁有正確的算法,你就不會認(rèn)為數(shù)據(jù)過多。
Chellapilla:最大的阻礙在于數(shù)據(jù)的質(zhì)量和可訪問性。當(dāng)一個企業(yè)說自身具有大量的數(shù)據(jù)時,通常它指的是一些非?;祀s的原始數(shù)據(jù),這些數(shù)據(jù)不能被程序和編程人員直接使用。需要公司在數(shù)據(jù)科學(xué)和工程資源上進行投資,建立管道和平臺,消化原始數(shù)據(jù)為結(jié)構(gòu)化和半結(jié)構(gòu)化形式,之后才能被傳統(tǒng)的程序所接收。通常在這些轉(zhuǎn)換中,會大量地用到統(tǒng)計學(xué)和機器學(xué)習(xí)的算法。一旦公司對此做出了投資,就不再存在數(shù)據(jù)過多的問題。
數(shù)據(jù)科學(xué)家應(yīng)該以什么姿態(tài)學(xué)習(xí)人工智能?
InfoQ: 人工智能的學(xué)習(xí)曲線是否過高?有哪些人工智能平臺和 API 能很好地簡化那些開發(fā)人員和架構(gòu)師所必須掌握的復(fù)雜問題?例如,partnersonai.org 平臺是由很多軟件廠商和第三方合作組建的,請你們對這類簡化了開發(fā)人員生活的工作做出評價。
Mehrotra:這取決于人們想要開發(fā)的人工智能系統(tǒng)的類別。例如,如果要構(gòu)建的人工智能系統(tǒng)是用于下象棋,或是查找最優(yōu)或最短路徑,或是決定是否發(fā)放貸款(信用違約推薦系統(tǒng)),那么最困難的部分并非在于科學(xué)本身,而是在于計算能力。所以從這個意義上講,學(xué)習(xí)曲線并不陡峭。但是,如果你要建立的是一個可以理解新語言的系統(tǒng),或是想要構(gòu)建一個自動駕駛系統(tǒng),這時我們會說學(xué)習(xí)曲線的確非常陡峭。例如,對于語言處理,我們可以使用統(tǒng)計方法解碼并理解其中的一部分句子和模式。但是要使用該語言進行交互,我們需要了解上下文。雖然人類以掌握這一技能,但機器卻仍未掌握。
在所有能對復(fù)雜性進行抽象的平臺中,IBM Watson 脫穎而出。它為非硅谷的開發(fā)人員提供了很好的平臺,使他們能迅速地加入到機器學(xué)習(xí)的浪潮中,并學(xué)以致用。這里我想推薦的另一個很好的模式識別 API 就是 Google Prediction API。
Mugan:在人工智能和機器學(xué)習(xí)中,存在著大量需要學(xué)習(xí)的知識,網(wǎng)上有大量的資源可用于起步。很多時候,雖然我們從簡單的算法中就能受益匪淺。但我們似乎總是想從最為強大的深度學(xué)習(xí)算法開始,我認(rèn)為通常并不需要這樣做。在很多情況下,像決策樹這類簡單的算法就能給出很好的效果。我無法專門針對 partnersai.org 發(fā)表評論。
Chellapilla:我認(rèn)為,構(gòu)建人工智能解決方案的學(xué)習(xí)曲線正變得越來越陡峭。一般可以通過開源軟件包和云 API 獲取構(gòu)建人工智能系統(tǒng)所用到的基本組成部分。Google 和 Microsoft 的云端 API 可以提供文字、圖像、視頻、語音和機器翻譯功能。這些工具足以使工程師快速構(gòu)建人工智能驅(qū)動的簡單用戶體驗和產(chǎn)品。然而,許多產(chǎn)品需要定制的人工智能解決方案,甚至需要開展人工智能研究并取得突破才能獲得成功。需要指出的是,R、scikit-learning、TensorFlow 等開源工具非常有幫助,但是掌握它們需具備一些重要技能。
學(xué)習(xí)曲線中最難的部分是如何改變開發(fā)人員的設(shè)計思維。這是建立無故障系統(tǒng)所必需的,雖然這種無故障僅具有統(tǒng)計意義上的性能保證。人工智能開發(fā)人員不僅要了解 API,還需要深入地掌握數(shù)學(xué)問題,包括概率、統(tǒng)計和優(yōu)化等。這些基礎(chǔ)知識對于迭代地改進他們的人工智能系統(tǒng)以減少故障是十分必要的。最重要的是,開發(fā)人員必須消除通過添加規(guī)則來修復(fù)故障這一直覺本能,這是在修復(fù)傳統(tǒng)的軟件錯誤中所使用的方法。
InfoQ: 除了 API 之外,在開展數(shù)據(jù)科學(xué)項目時,數(shù)據(jù)科學(xué)家和開發(fā)人員還應(yīng)了解哪些相關(guān)的開發(fā)工具和工具包?
Mehrotra: Google 開發(fā)的 TensorFlow,Python 中的 Theano 庫,使用 Java 和 JVM 的開發(fā)人員應(yīng)了解 Deeplearning4j。此外,當(dāng)需要快速地驗證想法時,R 中的包 rpart、glmnet 也十分有用。
Mugan: 我關(guān)注的是 Python 編程。我常使用 scikit-learning 和 TensorFlow。對于自然語言處理,spaCy 是一個不錯的選擇。
Chellapilla: 對于起步者,我建議選擇 R,scikit-learn,NLTK/spaCy 和 TensorFlow。 對于中高級用戶,可選擇的工具非常多。這一生態(tài)系統(tǒng)非常豐富和動態(tài),并處于不斷地發(fā)展中。
你的項目中該如何使用預(yù)測算法?
InfoQ: 對未來的預(yù)測總是受人矚目,例如購買習(xí)慣,可維護性問題等。你們能評論一下在這方面上的進展嗎?當(dāng)前這些算法和方法的復(fù)雜性如何?開發(fā)人員和架構(gòu)師如何將這些算法納入自身的解決方案中?
Mehrotra: Neils Bohr 曾指出:“預(yù)測是非常困難的,尤其是關(guān)于未來的預(yù)測”。當(dāng)關(guān)乎人的因素時,預(yù)測中最困難部分就是語境。舉個例子,我每個星期五晚八點左右,會從同一披薩連鎖店訂購披薩。最近的兩個星期五,我都這樣做了,因此推薦系統(tǒng)會認(rèn)為我將在這個星期五也這樣做。該連鎖店的數(shù)據(jù)科學(xué)家有兩種選擇:使用這些信息向我的手機屏幕發(fā)送一個彈出窗口,或者是自動為我訂購披薩并發(fā)送已訂購披薩的通知信息。如果我的確要在本周五訂購披薩,那么看看,這是一個多么驚人的人工智能!它能預(yù)測到我的行為。但是,如果公司已為我訂購了披薩,并且我也沒有心情再訂購一個,那么我可能會不高興,會去質(zhì)疑人工智能。因此大多數(shù)公司出于經(jīng)濟上的考慮,會訴諸實施后果不太嚴(yán)重的替代方案,即在用戶移動屏幕上彈出提示窗口。
對于算法的復(fù)雜性,根據(jù)我的經(jīng)驗,預(yù)測更像是給出一個強烈的信號,而非實現(xiàn)一個復(fù)雜的算法。例如,如果訓(xùn)練數(shù)據(jù)未受到類別偏斜問題的影響(也可以說,數(shù)據(jù)中具有足夠的可用于訓(xùn)練算法的默認(rèn)用例),那么對于預(yù)測貸款違約的概率,組合使用邏輯斯蒂回歸和隨機森林會比復(fù)雜的神經(jīng)網(wǎng)絡(luò)給出更好的結(jié)果。這就是說,好的數(shù)據(jù)要比復(fù)雜的算法更為有用。
Mugan: 推薦引擎試圖預(yù)測我們下一步的需求,正如Amazon 或 Netflix 所做的。目前尚不清楚我們可以在多大程度上采用這些算法。你是否記得在 1997 年上映的 Michael Douglas 主演的電影《心理游戲》,其中一些人可以預(yù)測到男主角的一舉一動。我不認(rèn)為對個人行為的預(yù)測可以達到這種精確度。
Chellapilla:特定用戶的行為是很難預(yù)測的,事實上是非常難的。然而,了解和預(yù)測用戶群體的趨勢和行為的方法已相當(dāng)先進,尤其是在線廣告和收入預(yù)測。這些廣告匹配和服務(wù)算法在很大程度上依賴于用戶的行為信號。用戶對這些算法(例如,用戶的 Amazon Prime 帳戶購買歷史記錄或 YouTube 觀看記錄)共享的數(shù)據(jù)越多,算法就會變得越好。從廣告客戶的角度來看,這些算法有助于預(yù)測受眾群體的規(guī)模、系列廣告的支出率,并對廣告客戶的出價提供參考。從人工智能技術(shù)的角度看,這些解決方案需要強大的算法。算法不僅可以利用歷史數(shù)據(jù),而且能對用戶在線行為的變化做出快速的響應(yīng)。雖然這些模型十分簡單,但是需求導(dǎo)致了相當(dāng)復(fù)雜的實現(xiàn)方式,其中未來追蹤在線采購行為的每日趨勢,組合使用了冷啟動、熱啟動以及實時學(xué)習(xí)。
企業(yè)如何在項目中逐步使用深度學(xué)習(xí)技術(shù)?
InfoQ: 許多創(chuàng)業(yè)公司已經(jīng)引入了深度學(xué)習(xí)。為什么在大企業(yè)中的采用仍然相對較慢?你們能否針對通過引入一些人工智能技術(shù)而得到了顯著改善的應(yīng)用,詳細(xì)提供一些知名的或企業(yè)內(nèi)部的應(yīng)用情況?
Mehrotra:企業(yè)采納緩慢的原因在于我上面所介紹的那些平臺。雖然這些平臺可以輕松地實現(xiàn)一些基本技術(shù)。但是當(dāng)公司采用這些平臺時,很快就會在如何修改平臺以滿足企業(yè)的特定需求上遇到問題(例如缺少數(shù)據(jù)科學(xué)部門)。對于任何企業(yè)解決方案,取得成功的關(guān)鍵都在于服務(wù)支持。在我看來,Cloudera 和 Hortonworks 在服務(wù)支持方面做得很好,它們可以解決這些障礙。
Mugan: 企業(yè)無論大小,都在使用深度學(xué)習(xí)。目前,深度學(xué)習(xí)最適合的是感知相關(guān)的應(yīng)用,例如計算機視覺。而大多數(shù)公司所處理的是更具結(jié)構(gòu)化的數(shù)據(jù)。例如,我們尚不清楚如何利用深度學(xué)習(xí)獲取對大型 SQL 數(shù)據(jù)庫的洞察。
Chellapilla:深度學(xué)習(xí)已在企業(yè)中得到了廣泛的應(yīng)用。初創(chuàng)企業(yè)的產(chǎn)出通常是利基產(chǎn)品,因此通常是從零開始構(gòu)建解決方案,這樣直接從深度神經(jīng)網(wǎng)絡(luò)開始是合理的。對于那些已具有數(shù)據(jù)產(chǎn)品的企業(yè),一般已經(jīng)具有了一些人工智能和機器學(xué)習(xí)的解決方案,這些解決方案在企業(yè)自身的領(lǐng)域運行得很好。正如 KISS 原則所指出的,如果邏輯斯蒂回歸模型等簡單算法已經(jīng)運用于生產(chǎn)中并且運行良好,那么完全沒有必要再去尋找更復(fù)雜的模型。因此我們會看到,在使用深度神經(jīng)網(wǎng)絡(luò)問題上,企業(yè)會更為審慎,僅將它們應(yīng)用到一些有希望獲得收益的問題上。
另一方面,企業(yè)采納緩慢也是由于數(shù)據(jù)的規(guī)模和隱私問題。與一開始就利用云 API 和服務(wù)的創(chuàng)業(yè)公司不同,企業(yè)可能會有數(shù)據(jù)規(guī)模和客戶隱私上的限制,不能輕易地將其內(nèi)部數(shù)據(jù)傳輸?shù)皆品?wù)上。需要在企業(yè)內(nèi)部構(gòu)建定制的解決方案,這可能會更慢。企業(yè)也需要盡早解決數(shù)據(jù)規(guī)模問題。我們可以理解,如果企業(yè)需要在內(nèi)部構(gòu)建一個可擴展到數(shù)億乃至數(shù)十億用戶的深度學(xué)習(xí)解決方案,那么可能會需要更長的時間。
InfoQ: 對于正致力于深度學(xué)習(xí)和人工智能項目的開發(fā)人員,你們能提供一些最佳實踐嗎?
Mehrotra:了解問題,明確界定所需的系統(tǒng),并對輸出做出假設(shè)。在工程上,確保你擁有強大的數(shù)據(jù)管道,并且數(shù)據(jù)管道應(yīng)在整個項目過程中保持穩(wěn)固。如果你并不具有數(shù)據(jù),或者是無法可靠地獲取數(shù)據(jù),那么你終究要花費一些時間去搞定數(shù)據(jù)問題。我們希望數(shù)據(jù)科學(xué)家能將時間用于如何開展科學(xué)研究,而非如何維護數(shù)據(jù)。在項目管理上,應(yīng)從一個簡單的目標(biāo)開始。向利益攸關(guān)者展示這些信息,盡早地獲得信任。一旦你做到了這些,回到項目中,并開始開展特征工程。正如 Google 的 Martin Zinkevich 所說:好的結(jié)果來自于好的特性,而非復(fù)雜的算法!
Mugan:從簡單處開始。首先,在整個運行流程中使用最簡單的算法,并對結(jié)果做出評估。完成這樣的操作后,就可以使用更復(fù)雜的算法,迭代地對結(jié)果進行改進。
Chellapilla:我的建議是,首先要理解深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和自身具體問題的領(lǐng)域。深度學(xué)習(xí)是一種構(gòu)建人工智能解決方案中所采用的方法。對于人工智能開發(fā)人員,理解其它的技術(shù)也是同等重要的,例如線性模型、邏輯斯蒂回歸、決策樹、組合學(xué)習(xí)等。深度學(xué)習(xí)是否是最佳的選擇,取決于我們正試圖解決的問題,以及人工智能解決方案所需的屬性。通常,領(lǐng)域的專業(yè)知識和簡單性勝過其他因素。簡單模型易于調(diào)試和優(yōu)化。對于構(gòu)建好的特性,對產(chǎn)品的洞察和實驗非常有價值,它與選取正確的模型和學(xué)習(xí)算法同等重要。
人工智能的未來
InfoQ: 最后一個問題,大家能構(gòu)想一下人工智能的未來發(fā)展嗎?有一個十分極端的看法,那就是機器最終會占領(lǐng)世界并使人類成為犧牲者。你們能緩解人們的這種擔(dān)心嗎?
Mehrotra:我們所構(gòu)建的人工智能系統(tǒng),應(yīng)該是有助于整個人類社會的。機器不會接管世界,也不會有變形金剛。正如導(dǎo)彈或核彈本身并不會消滅這個世界。相反,這一切都掌握在人類的手中,由人們判斷是否要使用導(dǎo)彈。在我看來,機器將接管世界這一極端想法,可能來自于機器(通過自動化)將取代人類職位這一理論,該理論導(dǎo)致人們產(chǎn)生了對機器接管世界的恐懼。2017 年 ASILOMAR 會議為制定人工智能研究和倫理學(xué)的指導(dǎo)原則做了很好的工作。
Mugan:在我看來,機器永遠不會比人類更聰明,但似乎機器也不可避免地變得越來越聰明。機器每年都會變得更加智能,而我們?nèi)祟悈s保持不變。我們擔(dān)心機器將會接管這個世界,正如我們?nèi)祟愃龅哪菢?。但是機器并不像我們?nèi)祟悾覀兪峭ㄟ^牙齒和爪子進化的,而機器是設(shè)計用于為人類提供幫助的。總而言之,我更害怕的是人類,而非機器。我們?nèi)祟惖纳鐣€有很多問題需要解決,我們希望機器能幫助我們繁榮發(fā)展。我也希望,有一天電腦足以聰明到可解釋宇宙的奧秘。
Chellapilla:不應(yīng)對人工智能的發(fā)展產(chǎn)生恐懼情緒。當(dāng)今,我們應(yīng)該更加信任機器,而不是去考慮人工智能中所隱含的危險。人類一直是工具制造者和掌控者。隨著時間的推移,這些科技創(chuàng)新給人類帶來了許多繁榮和幸福。我相信這將繼續(xù)下去。人工智能將會使這些工具更加通用、獨立和強大。也就是說,能力增加的同時,會帶來責(zé)任的增加。能力在本質(zhì)上沒有好壞之分。所以,在構(gòu)建更強大的人工智能系統(tǒng)時,責(zé)任在我們這樣的系統(tǒng)創(chuàng)建者身上,應(yīng)確保人工智能系統(tǒng)不僅能夠傳承原始智力這樣的人類屬性,而且可以傳承人類的社會情感價值觀。而后者是建立人類可完全信任的、具有社會責(zé)任的人工智能系統(tǒng)的關(guān)鍵所在。
結(jié)論
上述專家觀點表達了多方面的意見,并且在很多問題上取得了一致。對于初入人工智能領(lǐng)域門檻的人而言,會感到需要面對過多的術(shù)語,常常無法厘清數(shù)據(jù)科學(xué)、機器學(xué)習(xí)、深度學(xué)習(xí)和人工智能間的區(qū)別。然而這些問題并不重要,因為這些方法間具有相似性,都是基于持續(xù)反饋回路對算法進行調(diào)優(yōu)。
這次專家研討會的主流觀點是,該領(lǐng)域?qū)W習(xí)曲線的陡峭性正在降低,因為一些平臺提供了快速的入門。研討會中所談及的技術(shù)已經(jīng)被一些初創(chuàng)公司所采納,大型企業(yè)對技術(shù)的采用也并未落后很多。
正如研討會上部分專家所建議的,該領(lǐng)域中的工作應(yīng)從細(xì)微處著手,給出明確定義的需求、模型和假設(shè)。然后對假設(shè)進行驗證,并根據(jù)結(jié)果不斷地調(diào)優(yōu)模型。這種做法有助于對算法內(nèi)部工作機制的理解。此外,當(dāng)前已有一些平臺使開發(fā)人員和架構(gòu)師能夠更輕松地運用這些算法,并通過對算法的反復(fù)嘗試而獲得更好的理解。
對于人工智能是否將會取代人類智慧這一議題,研討會專家一致認(rèn)為,我們這些智能系統(tǒng)的構(gòu)建者負(fù)有道義上的責(zé)任。當(dāng)發(fā)生這種情況時,這些系統(tǒng)所具備的能力,應(yīng)用于為人類獲取更大的利益。與大多數(shù)其它類似問題一樣,在技術(shù)人員不斷地以瘋狂的速度進行創(chuàng)新時,應(yīng)由社會來界定創(chuàng)新的界限所在。
作者介紹
Prakhar Mehrotra,當(dāng)前任 Uber 數(shù)據(jù)科學(xué)和金融主管,領(lǐng)導(dǎo)著一個研究人員團隊。他所在的研究組關(guān)注預(yù)測、優(yōu)化并構(gòu)建模擬,力圖更好地理解在市場中網(wǎng)絡(luò)的影響作用。任職于 Uber 前,他在 Twitter 的銷售與盈利團隊擔(dān)任量化分析師,致力于構(gòu)建預(yù)測算法去預(yù)測營收。他學(xué)習(xí)的是航空學(xué)專業(yè),畢業(yè)于帕薩迪納市加利福尼亞理工學(xué)院和巴黎綜合理工學(xué)院。
Jonathan Mugan博士是 DeepGrammer 的聯(lián)合創(chuàng)始人兼 CEO。他專注于人工智能和機器學(xué)習(xí),在當(dāng)前的研究中,關(guān)注深度學(xué)習(xí)領(lǐng)域,探索如何獲取可讓計算機理解微妙意義的抽象表示。Mugan 博士畢業(yè)于德克薩斯州大學(xué)奧斯汀分校,獲計算機科學(xué)博士學(xué)位。他的博士論文工作涉及機器人的研發(fā)領(lǐng)域,側(cè)重于研究如何能構(gòu)建像兒童一樣學(xué)習(xí)世界的機器人。
Kumar Chellapilla是 LinkedIn 貨幣化相關(guān)性(Monetization Relevance)部門主管,致力于改進 LinkedIn 付費產(chǎn)品的相關(guān)性,包括 Recruiter、Premium Subions、Ads、Sales Navigator、ProFinder 和 Referrals 等。他的研究關(guān)注點在于,如何通過解決機器學(xué)習(xí)和人工智能領(lǐng)域難題而駕馭產(chǎn)品和研究創(chuàng)新。任職于 LinkedIn 之前,Kumar 曾就職于 Twitter 的廣告質(zhì)量部門(Ads Quality)和 Microsoft 研究院 Bing 的 Web 搜索組。他從加州大學(xué)圣迭戈分校獲得博士學(xué)位,博士期間研究如何訓(xùn)練可以玩游戲的神經(jīng)網(wǎng)絡(luò)。
{{item.content}}