
華盛頓日報上周提到了谷歌在搜索中運用了越多越多的知識框——在搜索結(jié)果頂部出現(xiàn)的插入框,目的是在傳統(tǒng)超鏈接的無限頁面的頂部展示與人們興趣相關(guān)的仿真陳述(factoid ),以縮短搜索過程。用戶越來越多地使用移動端或語音訪問網(wǎng)頁,這些系統(tǒng)的目的就是,讓用戶盡可能快地得到諸如“一磅多少盎司”或“誰是愛沙尼亞總統(tǒng)”一類問題的答案。但是,之前的搜索引擎只是給用戶一大堆鏈接去遍歷,而知識框的目的就是,通過應(yīng)用自然語言的進展,讓機器真正理解用戶的問題,能夠提供用戶尋找的實際回復(fù)。
根據(jù)華盛頓日報,谷歌每月1000億搜索量中約有三分之會顯示仿真陳述,也就是說在我們與世界信息接入的過程中,這些仿真陳述的作用越來越大。交際連續(xù)體中bot的崛起,比如工作工具Slack,社交通信Facebook 的bot,這些都意味著,機器將解讀世界上的知識,而歷史性的關(guān)鍵詞搜索概念將會被逐步取代。
任何一個花點時間搜索網(wǎng)頁或者瀏覽社交媒體的人可能都會了然于心,網(wǎng)絡(luò)世界上虛假和誤導(dǎo)性的信息泛濫不絕,從經(jīng)典那個地球是平的的論調(diào),月球登陸的假消息,到危險的醫(yī)療錯誤信息,以及引起真實種族暴力的假流言,否認(rèn)大屠殺這樣陰險的狡辯。盡管這些事情很容易被大家關(guān)注,然而訪問抵抗謠言的網(wǎng)站如Snopes.com的流量如此之少,也就是說太多在線社區(qū)還是容易輕信謠言。
多數(shù)時候,可能對一個非專家用戶來說,并不清楚通??山邮艿拇鸢甘鞘裁?。比如,有人在網(wǎng)上搜索一種需要醫(yī)治的情境,但可能會找到有數(shù)十個看似權(quán)威的網(wǎng)站,提供著大量且相互矛盾的建議,其中有些網(wǎng)站甚至可能會推薦危及生命的家庭治療方式。
這些年來我親眼看到,即使是在神圣的學(xué)術(shù)殿堂,有些有博士學(xué)位的(有時兩個博士學(xué)位)的全職教授,在自己狹窄的專業(yè)領(lǐng)域有幾十年的經(jīng)驗,但卻多次地在研究其他領(lǐng)域的東西時發(fā)生錯誤,包括基本的操作,以及分辨事實和虛構(gòu)信息等。
華盛頓郵報在感嘆知識框的興起時,引用了維基百科基金會研究主管的話,說這個趨勢“破壞了人們辨別信息的能力,最終會影響人們發(fā)布多種意見的能力。而這是我認(rèn)為我們真正需要為社會去研究和處理的事情。”然而,這一理想的說法的假設(shè)是,人們本來擅長事實查證,擅長推理他們專業(yè)以外的有時復(fù)雜甚至是高度技術(shù)性的信息,以及擅長分析海量信息源中的大量矛盾信息。但是我常常發(fā)現(xiàn)的是,即使對學(xué)術(shù)界的人來說,將一個問題轉(zhuǎn)化成搜索結(jié)果,并理解哪些網(wǎng)站最有可能提供合理的答案都很困難。
正如華盛頓日報所說,谷歌與業(yè)界知名的Mayo Clinic合作,保證其醫(yī)療提問能夠與醫(yī)學(xué)界已有的最佳理解相一致。更有趣的是,谷歌將食物配料的搜索與美國農(nóng)業(yè)部提供的營養(yǎng)事實連接到一起(可以搜索下“cheddar cheese(切達芝士)”看看有什么結(jié)果)。想象下,如果去搜索最近的提供不健康食物菜單的餐館,結(jié)果不僅有如何去這些餐館,而且會有關(guān)于這些物品不健康的總結(jié)評論,以及經(jīng)常吃這些東西對健康會有什么影響。這會是已飽和的健康和健身技術(shù)領(lǐng)域下一個邏輯舉措嗎?
那么,一個人可能會說,這些知識面板的出現(xiàn)(相應(yīng)的總結(jié)性答案由語音搜索得出)有很大潛力廓清在線錯誤信息的迷霧。想象一下,正如逆行時提供交通警報一樣,谷歌會在有人搜索流行的謠言時自動展示來自Snopes的條目。
當(dāng)然,當(dāng)其他人為我們做決定時,可能會因為意見不同而出現(xiàn)分歧,特別是科技公司想要在全球范圍內(nèi)定義權(quán)威性概念時,谷歌上周提到這點。甚至包括醫(yī)療搜索也會出現(xiàn),比如有某宗教信仰的從業(yè)者不鼓勵人們使用現(xiàn)代藥,或者一些特別傾向于某些品牌藥品的人可能會非常反對西方醫(yī)療界的共識是指定情境下最佳的治療方式。
最初人們認(rèn)為“社交化搜索”有潛力將取代早期的傳統(tǒng)搜索引擎的通用性,根據(jù)你的社交關(guān)系定制搜索結(jié)果,但傳統(tǒng)搜索引擎則給世界上的每個搜索者都會提供同樣的一套結(jié)果。這個前提是說,比如某人搜索華盛頓“最好的”泰國餐廳,比起大眾形成的互聯(lián)網(wǎng)上的共識,或者這個城市著名美食評論家的觀點,他可能會更相信好朋友的推薦。當(dāng)今的搜索引擎越來越個性化,在大量歷史數(shù)據(jù)中使用了深度學(xué)習(xí)技術(shù),將每個搜索結(jié)果個性化,讓用戶被搜索引擎“了解”而受益,算法學(xué)習(xí)到用戶的喜好隨時間的變化,讓用戶在不同的時間看到不同的結(jié)果。
這就引起一個有趣的問題,我們是不是不會為每一個搜索爭取一個“正確”的答案,而是致力于給用戶提供可用信息的“通知摘要”?這種情況下,對于單個權(quán)威性答案的搜索,比如“今晚的地鐵是什么時候結(jié)束的”這樣的問題,可能會用傳統(tǒng)的回復(fù)方式。但當(dāng)一個問題沒有大眾普遍接受的答案時,或者在專業(yè)領(lǐng)域都存在分歧,或者更簡單的說,它本身就沒有絕對答案的(比如某市“最佳”餐廳),這時搜索引擎則會給用戶提供主要的一些觀點及其各自的來源,以供用戶選擇。其中至少要做到的是,給定信息的來源,并盡可能突出說明,這點應(yīng)成集成到信息回復(fù)中。因為每個搜索結(jié)果代表的網(wǎng)站已經(jīng)成為搜索顯示的標(biāo)準(zhǔn)化組成部分,這樣也可以鼓勵用戶認(rèn)真地思考他們使用的信息。
或者,鑒于現(xiàn)代搜索的個性化水平,那么未來的搜索引擎和智能代理有沒有可能學(xué)習(xí)用戶的興趣,然后自動地回復(fù)這樣的結(jié)果:比如說用戶更喜歡厚匹薩,希望花費少于40美元,30分鐘內(nèi)送到,搜索引擎和智能代理就可以直接使用這些信息決定“最佳”的披薩餐廳,這種方式類似于社交搜索服務(wù)利用用戶社交網(wǎng)絡(luò)的集體領(lǐng)域知識以學(xué)習(xí)最佳的仿真陳述(factoid)。這種情況下,系統(tǒng)可能會展示出每種它認(rèn)為與用戶有關(guān)的特點,并會使用這些特點過濾搜索結(jié)果,因此用戶意識到了這種假設(shè)的機制,就可以對其更改(比如說慶祝朋友生日時調(diào)整開銷花費,以更正式地準(zhǔn)備。)
最后要說的是,有一點是很明朗的,在過去的半個世紀(jì)中,簡單的關(guān)鍵詞搜索以及無限的可滾動結(jié)果頁面曾定義了計算機時代。但它將會被新的未來取而代之。機器將會越來越多地為我們過濾信息,對我們應(yīng)該了解什么樣的世界的信息,做出前所未有的更多的決定。這些智能系統(tǒng)有巨大的能量和潛力,很有可能改變我們消費世界上的信息的方式,以及與其交互的方式,但也會引發(fā)關(guān)于未來如何設(shè)計系統(tǒng)的諸多困惑。而且,計算機越來越多地管理我們的信息消費,我們那些尚未被數(shù)字化的社會歷史的財富,也將會迅速地被數(shù)字化,并被搬到自動化霸主麾下,讓人們使用。去迎接未來那個由計算機介導(dǎo)的信息世界吧。
{{item.content}}