777精品久无码人妻蜜桃,国产日本精品视频在线观看 ,国产亚洲99久久精品熟女av,brazzersvideosex欧美最新版,人人爽人人人爽人人爽

2025全球時空智能大會
5月21-22日 北京
開幕在即!WGDC25全球時空智能大會完整日程公布
即刻注冊  鎖定席位
分享
Scan me 分享到微信

為何數(shù)據(jù)科學(xué)最早應(yīng)用于農(nóng)業(yè)?

“數(shù)據(jù)科學(xué)家”被追捧為最性感的職業(yè)。但數(shù)據(jù)科學(xué)最早的應(yīng)用,卻發(fā)生在不顯眼的農(nóng)業(yè)。

  作者:Vamei

  近年來,數(shù)據(jù)科學(xué)成為一門顯學(xué)。數(shù)據(jù)科學(xué)利用數(shù)據(jù)學(xué)習(xí)知識,其目標(biāo)是通過從數(shù)據(jù)中提取出有價值的部分來生產(chǎn)數(shù)據(jù)產(chǎn)品。這門學(xué)科橫跨了統(tǒng)計、人工智能、高性能計算等諸多領(lǐng)域,并為很多大企業(yè)創(chuàng)造了核心業(yè)務(wù)價值。“數(shù)據(jù)科學(xué)家”被追捧為最性感的職業(yè)。但數(shù)據(jù)科學(xué)最早的應(yīng)用,卻發(fā)生在不顯眼的農(nóng)業(yè)。

  引領(lǐng)數(shù)據(jù)科學(xué)應(yīng)用的,是羅納德·費舍爾。1919年,29歲的費舍爾來到英國東部的赫特福德郡。赫特福德郡有一個古老的農(nóng)業(yè)研究機構(gòu)——羅森斯得農(nóng)業(yè)實驗站,費舍爾剛剛成為這個實驗站的研究員。費舍爾是畢業(yè)于劍橋大學(xué)的天文學(xué)家,并曾做過一段時間的數(shù)學(xué)講師。但此后的十四年里,費舍爾都會和田里的泥巴打交道。

  早在1843年, 富商約翰·本尼特·勞斯就創(chuàng)立了羅森斯得農(nóng)業(yè)實驗站。這個實驗站是一個農(nóng)業(yè)科研機構(gòu)。勞斯的財富來自化肥生意,因此一直想尋找最有效的化肥配方。化學(xué)家、植物學(xué)家、園藝學(xué)家紛紛加入科研機構(gòu)。根據(jù)不同學(xué)科的理論,科學(xué)家們設(shè)計并進行了大量的實驗。經(jīng)過半個多世紀(jì)的積累,實驗站積累了不少數(shù)據(jù)。這個時候,數(shù)據(jù)的問題卻越來越突出。很多研究員都在抱怨,無法從數(shù)據(jù)中獲得結(jié)論。

  用于處理數(shù)據(jù)的統(tǒng)計方法已經(jīng)誕生了兩百多年。早期統(tǒng)計學(xué)偏重數(shù)據(jù)探索,只采用了簡單的求和、求平均、求百分比等算術(shù)方法。這些方法能發(fā)現(xiàn)數(shù)據(jù)中的一些淺層結(jié)論。比如17世紀(jì)的數(shù)據(jù)科學(xué)家約翰·葛蘭特,就通過死亡統(tǒng)計表來發(fā)現(xiàn)城市居民死因。此外,統(tǒng)計主要用于物理和化學(xué)的實驗結(jié)果分析。這兩門學(xué)科都有嚴(yán)格的科學(xué)定律來說明因果關(guān)系,并且實驗環(huán)境非??煽?。因此,測量誤差相對微小??茖W(xué)家可以通過多次重復(fù)實驗來檢驗科學(xué)定律是否成立。

  但農(nóng)業(yè)提出的問題完全不同。在費舍爾的時代,DNA還沒有發(fā)現(xiàn),就連達爾文提出的“進化論”也充滿爭議。所以農(nóng)業(yè)完全沒有科學(xué)定律可以參考。即便能寫出數(shù)學(xué)公式,還是沒法解決所有問題。物理學(xué)家做實驗時,會在室內(nèi)使用簡單的小球。但農(nóng)業(yè)研究的對象是復(fù)雜的生物,而且這些生物必須存活于開放的室外環(huán)境。田里作物長勢如何,除了化肥起作用,陽光、灌溉、病蟲害、土壤肥力、耕作方式等諸多因素都要摻合。某個季節(jié)的一陣風(fēng),就可能造成兩塊田地完全不同的產(chǎn)量。如果用一般的統(tǒng)計方法進行分析,實驗站至少要把每種情況的數(shù)據(jù)都收集一遍。

  因此,在農(nóng)業(yè)這種復(fù)雜系統(tǒng)的研究中,數(shù)據(jù)科學(xué)家必須滿足于有限的少量數(shù)據(jù)樣本。要知道,數(shù)據(jù)科學(xué)家那里,大數(shù)據(jù)能減少不確定性,是一件絕對的好事。但復(fù)雜系統(tǒng)的研究沒法提供那么奢侈的條件。農(nóng)業(yè)實驗的周期非常漫長?;瘜W(xué)家一個小時能做好幾組實驗??勺魑锏氖斋@,至少需要幾個月的時間。如果按照物理化學(xué)那樣通過大量重復(fù)實驗來控制誤差,那農(nóng)業(yè)研究永遠都無法達成。

  費舍爾最大的貢獻,是變換了數(shù)據(jù)分析的視角。他不再試圖從完整的群體數(shù)據(jù)中獲得結(jié)論,而是把少量數(shù)據(jù)當(dāng)做從一個理想群體抽樣,然后用概率的方式“猜測”這個抽樣告訴我們什么樣的群體信息。用樣本來推測群體的信息,這被稱為“統(tǒng)計推斷”。費舍爾發(fā)展出一系列統(tǒng)計推斷方法,如ANOVA、F分布檢驗、p值分析。此外,費舍爾還提出用統(tǒng)計推斷的思路來設(shè)計農(nóng)業(yè)實驗,從而降低農(nóng)業(yè)實驗成本。他的所有努力最終解決了一個簡單的農(nóng)業(yè)問題:選擇最佳化肥。

  費舍爾有一個簡單的例子能說明這個問題。就拿上海這個2000多萬人口的城市來說,我們想知道所有人的平均身高。由于調(diào)查上的困難,我們對這個平均身高是多少一無所知,我找到身邊的兩位朋友,小明和老陳。小明身高182,老陳身高175。既然對群體的平均身高沒有任何知識,那小明的身高有一半的概率比平均身高高。老陳也是一樣。因此,平均身高有50%的概率落在175和182之間。因此,即使只抽出兩個樣本,我們還是以概率的形式獲得群體的一些有用信息。

  人們可能難以想象,20世紀(jì)最重要的數(shù)學(xué)發(fā)展居然是為了解決一個看似簡單的農(nóng)業(yè)生產(chǎn)問題。但我們不必對產(chǎn)業(yè)厚此薄彼。農(nóng)業(yè)提供著人類生存必須的食物。在技術(shù)革命和工業(yè)革命之前,農(nóng)業(yè)革命都會先行。在19世紀(jì)工業(yè)革命之前,英國引領(lǐng)的四輪耕作、育種等農(nóng)業(yè)革命已經(jīng)悄然進行了將近一百年。費舍爾的農(nóng)業(yè)統(tǒng)計工作,也可以算作這場革命的后期發(fā)展部分。一批專業(yè)的化肥公司、種子公司和牲畜育種公司采用費舍爾的數(shù)據(jù)方法,成為最早享受數(shù)據(jù)紅利的產(chǎn)業(yè)公司。其中一部分公司建立起強大的數(shù)據(jù)壁壘,因此成為延續(xù)到今天的百年企業(yè)。

  值得注意的是,刺激農(nóng)業(yè)大發(fā)展的那套數(shù)據(jù)方法,要等到二戰(zhàn)之后才在工業(yè)上推廣使用。一方面,這可以歸因于產(chǎn)業(yè)發(fā)展的優(yōu)先級。在任何時候,食物供應(yīng)比槍炮子彈都要重要。墨索里尼在推動意大利糧食自給時,就特別倡導(dǎo)農(nóng)業(yè)育種新方法的推廣應(yīng)用。另一方面,工業(yè)環(huán)境類似于物理化學(xué)實驗室,環(huán)境相對可控。工業(yè)產(chǎn)品的隨機浮動不像農(nóng)產(chǎn)品那么大。早期工業(yè)把注意力放在產(chǎn)品和產(chǎn)線的設(shè)計上。直到二戰(zhàn)后,工業(yè)精度和工業(yè)效率都大為提高,數(shù)據(jù)方法才成為工業(yè)發(fā)展的新動力。通過采用數(shù)據(jù)方法,二戰(zhàn)后的日本制造業(yè)才實現(xiàn)彎道超車,在質(zhì)量和效率兩個方面都趕超了美國。

  農(nóng)業(yè)在技術(shù)應(yīng)用上的領(lǐng)先并不鮮見。農(nóng)業(yè)對技術(shù)的要求相對寬松,并能直接產(chǎn)生經(jīng)濟效益和戰(zhàn)略意義。早在80年代,遙感和地理信息技術(shù)就大規(guī)模應(yīng)用于農(nóng)業(yè)。這比地圖軟件和打車軟件領(lǐng)先了四分之一個世紀(jì)。率先推廣的美國在農(nóng)產(chǎn)品生產(chǎn)和農(nóng)產(chǎn)品貿(mào)易方面獲得信息優(yōu)勢,因此鞏固了農(nóng)業(yè)霸主地位。在最新的智能化運動中,農(nóng)業(yè)已經(jīng)在暗中打磨“智慧農(nóng)業(yè)”。物聯(lián)網(wǎng)和AI技術(shù)已經(jīng)在不斷提高農(nóng)業(yè)效率,自動駕駛等技術(shù)也被引入農(nóng)機。美、日等國已經(jīng)研發(fā)出成熟的自動駕駛農(nóng)機,中國的科技公司也開始布局這一方向。相對于汽車面臨的道路安全挑戰(zhàn),農(nóng)業(yè)反而可能成為自動駕駛技術(shù)最先落地的領(lǐng)域。

  數(shù)據(jù)科學(xué)在農(nóng)業(yè)的應(yīng)用歷史,也能給今天的數(shù)據(jù)科學(xué)帶來啟示。可以看到,只有數(shù)據(jù)沒有方法,數(shù)據(jù)不能產(chǎn)生真正的價值。隨著信息革命的到來,數(shù)據(jù)收集難度大為降低。無論是物聯(lián)網(wǎng)的電子信號,還是社交網(wǎng)絡(luò)的親密留言,都可以輕松地采集、傳輸和存儲。但大數(shù)據(jù)也帶給人一種錯局,認(rèn)為數(shù)據(jù)科學(xué)可以依靠全方位的數(shù)據(jù)來“暴力破解”一切問題。但我們面臨著和費舍爾相似的情況,看似海量的數(shù)據(jù)其實遠遠不夠。

  無論是自然的生態(tài)系統(tǒng),還是人類構(gòu)成的社會系統(tǒng)都極為復(fù)雜,隨機性是不可回避的一部分。在復(fù)雜問題面前,大數(shù)據(jù)并不意味著足夠的數(shù)據(jù)。事實上,數(shù)據(jù)科學(xué)的最新研究,也越來越傾向于從小樣本中推斷和建模。泥土中產(chǎn)生的數(shù)據(jù)哲學(xué),依然充滿智慧。

喜歡您正在閱讀的內(nèi)容嗎?歡迎免費訂閱泰伯每周精選電郵。 立即訂閱

參與評論

【登錄后才能評論哦!點擊

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回復(fù){{item.replynum}}
    {{child.username}} 回復(fù) {{child.to_username}}:{{child.content}}

更多精選文章推薦