2024年9月24日,北京 “人工智能之城” 北京經濟技術開發(fā)區(qū)(北京亦莊)打造全要素AI原生產業(yè)創(chuàng)新高地再加速——由北京亦莊智能城市研究院(簡稱“亦莊智能院”)建設并運營的北京規(guī)模最大公共算力平臺、人工智能數(shù)據訓練基地,與國內領先數(shù)據服務公司愷望數(shù)據聯(lián)手打造的國內首個“車路云”數(shù)據協(xié)同平臺正式發(fā)布并上線。
由北京市高級別自動駕駛示范區(qū)工作辦公室(簡稱“北京自駕辦”)指導,愷望數(shù)據聯(lián)合北京國際算力服務有限公司(簡稱"京算公司")舉辦的“數(shù)智加速度:AI大模型下的數(shù)據力量與應用革新”生態(tài)大會在北京亦莊舉行,近200位智能駕駛及人工智能專家和代表,共同探討數(shù)據在AI大模型背景下的戰(zhàn)略價值。
愷望數(shù)據在當天宣布將基于數(shù)據優(yōu)勢打造AI大模型應用,并發(fā)布三大場景的AI應用解決方案。
愷望數(shù)據聯(lián)手京算公司
國內首個“車路云”數(shù)據協(xié)同平臺正式上線
北京亦莊正在全面加速打造全域“人工智能之城”。當天,愷望數(shù)據與亦莊智能院旗下全資子公司京算公司、車網公司攜手,基于“人工智能數(shù)據訓練基地”打造了全國首個“車路云數(shù)據協(xié)同平臺”,并已正式上線運營。該平臺聚焦自動駕駛車端感知數(shù)據和車路云智能交通場景,為需方提供高效、安全的智能數(shù)據應用服務,不僅提供精準適配和精加工的數(shù)據,還提供模型訓練所需的GPU算力集群服務,首批項目成交簽約合作伙伴包括國汽智控、輝羲智能等生態(tài)企業(yè)。
“數(shù)據、算法和算力是構成人工智能技術的三大核心要素?!北本﹪H算力服務有限公司總經理助理馬光表示,從外部條件來看,目前制約企業(yè)大模型發(fā)展比較明顯的問題是算力和數(shù)據,因此建設公共算力平臺將解決企業(yè),尤其是創(chuàng)業(yè)型企業(yè)、小規(guī)模企業(yè)在發(fā)展中購買算力能力不足的問題。
《北京?亦莊全域人工智能之城建設方案》中提到,將在北京“全域創(chuàng)建數(shù)據要素市場化配置改革綜合試驗區(qū)”,著力打造國家級數(shù)據管理中心、數(shù)據資源中心和數(shù)據流通交易中心。
其中,按照數(shù)據基礎制度先行區(qū)重點建設“2中心2基地(數(shù)據訓練基地)”的功能布局,由京算公司運營的人工智能數(shù)據訓練基地是國內首個正式啟用的人工智能數(shù)據訓練基地,集中承載北京規(guī)模最大的智能算力基礎設施、人工智能數(shù)據標注庫和大模型數(shù)據訓練基地等功能,解決行業(yè)中存在的數(shù)據流通難、確權難、應用難及合規(guī)監(jiān)管難等痛點,推動高質量數(shù)據價值釋放。
馬光提到,人工智能數(shù)據訓練基地不僅是一個數(shù)據匯聚、清洗和標注的平臺,更是構建安全合規(guī)數(shù)據流通形態(tài)的核心載體及高質量數(shù)據安全流通的可信基礎設施,提供數(shù)據可信存儲、可信加工、可信交付全流程服務,以及提供基礎設施、應用平臺和對外門戶等基礎能力,匯聚生態(tài)伙伴數(shù)據標注、模型訓練、合規(guī)評測等工具能力,并通過引入沙盒監(jiān)管機制為數(shù)據流通提供了高效、安全的路徑。
圍繞“全國首個“車路云數(shù)據協(xié)同平臺”,京算公司、愷望數(shù)據、、國汽智控、輝羲智能等多方已簽訂相關戰(zhàn)略合作協(xié)議,明確未來將在各自需求與優(yōu)勢領域展開合作,圍繞“大模型+大數(shù)據+大算力”,支持建設北京人工智能數(shù)據訓練基地,有望將進一步筑牢“高質量數(shù)據集—智能算力底座—自主可控算法—示范性應用場景”全要素AI原生產業(yè)基礎底座,并最大程度提高數(shù)據利用效率及實現(xiàn)數(shù)據價值。
“車路云數(shù)據協(xié)同平臺通過構建一個安全、合規(guī)的數(shù)據流通體系,讓數(shù)據要素發(fā)揮最大的價值和效能?!瘪R光表示,人工智能數(shù)據訓練基地是創(chuàng)新數(shù)據流通新模式的探索與實踐,要建設以人工智能訓練場為載體,以安全合規(guī)為核心,以沙盒監(jiān)管為支撐,以交易應用為目的的新型數(shù)據流通形態(tài),“車路云數(shù)據協(xié)同平臺”是數(shù)據流通、交易模式創(chuàng)新的首個應用場景,有望在未來推廣至更多的人工智能領域,構建多元的智能數(shù)據生態(tài)格局。
“站在行業(yè)已有的數(shù)據基礎上,通過平臺存儲、監(jiān)管和再加工,實現(xiàn)行業(yè)數(shù)據共享、數(shù)據復用的實現(xiàn),行業(yè)效率解決企業(yè)的翻倍降本需求,可以助力企業(yè)實現(xiàn)‘成本少一半、速度快三倍’的數(shù)據應用優(yōu)勢。比如傳感器型號、位置、算法的趨同,我們有機會把相似的匹配上,匹配不上的通過微調、2次加工達到個性化結果?!庇谛癖硎荆S著該平臺的上線運營,未來智能交通領域的數(shù)據共享,使數(shù)據流通成本得到極大降低及數(shù)據的利用效率大幅提升,該“車路云數(shù)據協(xié)同平臺”是結合人工智能數(shù)據訓練基地理念,在智能交通領域探索的數(shù)據服務及新型數(shù)據流通形態(tài)的創(chuàng)新模式,最大程度提高了數(shù)據利用效率。
于旭表示,未來愷望數(shù)據仍將發(fā)揮在自動駕駛數(shù)據服務方面的行業(yè)經驗與優(yōu)勢,深度參與到國家重要的車路云及人工智能的創(chuàng)新與示范項目探索,共同推動高質量數(shù)據價值的釋放。
重新定義“大模型數(shù)據服務”
愷望數(shù)據基于數(shù)據優(yōu)勢進入AI應用
成立未滿3年的愷望數(shù)據已經是國內領先的自動駕駛數(shù)據服務商,然而隨著去年以來AI大模型浪潮進入千行百業(yè),算力算法需要更高效和更好的數(shù)據,愷望數(shù)據的“一站式數(shù)據產線”優(yōu)勢也迅速擴展到AI落地場景應用領域。在推出與亦莊智能院聯(lián)合打造的"車路云數(shù)據協(xié)同平臺"的同一天,愷望正式宣布大模型數(shù)據服務已成為公司的第二增長曲線,公司的數(shù)據服務優(yōu)勢經驗證已在“AI大模型應用場景”中有效解決“業(yè)務適配問題”,大大提升數(shù)據利用效率。
“AI大模型時代的數(shù)據服務價值,已經不是為大模型提供數(shù)據標注、數(shù)據訓練等這些傳統(tǒng)大模型數(shù)據服務,而是基于和發(fā)揮數(shù)據優(yōu)勢、做更適配業(yè)務場景的AI應用?!睈鹜麛?shù)據CEO于旭表示。
為精準解決不同場景的智能數(shù)據應用需求,愷望數(shù)據發(fā)布了全新的AI應用場景解決方案,該方案覆蓋劇本創(chuàng)作、客服輔助和文件處理三大AI應用場景,有效解決業(yè)務適配、降本增效等AI應用難題。
在劇本創(chuàng)作場景中,愷望數(shù)據通過定義內容產線的不同分工和角色,將AI內容生產能力“嵌入”內容產線的各個環(huán)節(jié),實現(xiàn)從內容選題、劇本撰寫到視覺包裝的全流程AI解決方案,幫助企業(yè)快速生成高互動性的AI社交內容。
在客服輔助場景,愷望數(shù)據結合智能座艙、智慧園區(qū)、電子商務、私域運營等場景的不同需求,為企業(yè)提供從場景梳理到模型搭建的全流程AI客服解決方案,大幅提升客服響應效率,降低運營成本。
在文件處理場景,針對大批量合同審批、流程制度管理等業(yè)務需求,愷望數(shù)據能夠提供基于AI大模型的審批輔助和修改意見生成等解決方案,幫助企業(yè)優(yōu)化管理流程,實現(xiàn)效率提升三倍以上。
“依托愷望的數(shù)據自動化產線,我們能為企業(yè)提供數(shù)據收集、處理、應用的全流程AI改造,深度嵌入智能數(shù)據應用的細分場景,為企業(yè)搭建智能化轉型的有效路徑?!睈鹜麛?shù)據AI應用場景解決方案負責人鄧穩(wěn)介紹。
● 關于愷望數(shù)據
愷望數(shù)據成立于2022年,專注于智能駕駛與人工智能領域的數(shù)據服務,致力于構建全新的AI數(shù)據自動化平臺,為行業(yè)提供一站式數(shù)據解決方案。在AI大模型時代,市場對高效率和高質量數(shù)據的需求日益迫切。愷望數(shù)據打造的「數(shù)據自動化產線」通過“自動化產線+規(guī)?;肆Α钡暮诵膬?yōu)勢,實現(xiàn)了AI數(shù)據生產的標準化、規(guī)?;妥詣踊D型,并推出“車路云數(shù)據協(xié)同平臺”及“AI應用場景解決方案”。
自2023年量產以來,該產線已為國內眾多領先車企、自動駕駛公司及AI大模型企業(yè)提供高效、穩(wěn)定、經濟的數(shù)據供應鏈,助力企業(yè)實現(xiàn)數(shù)據應用優(yōu)勢,推動人工智能技術的廣泛落地。
● 北京人工智能數(shù)據訓練基地
“監(jiān)管沙盒”保障大模型訓練
大模型的自我學習仰仗訓練。同日啟用的北京人工智能數(shù)據訓練基地里,已經有多款大模型正練就“最強大腦”。訓練中,大模型依靠基地“投喂”的語料,像學生“刷題”一樣不斷提升自己的能力,從而在未來上線后應付現(xiàn)實中的各種難題。
作為國內最早啟用的人工智能數(shù)據訓練基地,可以組織數(shù)據供給方、加工服務方、模型訓練方“進場”合作,推動高質量數(shù)據價值釋放,助力通用模型和行業(yè)垂類模型訓練精調。
成為“第一個”,不只依靠算力這種“硬件”,更需要打通數(shù)據確權、安全等方面的機制。
“訓練基地要干的,不只是訓練?!边\營訓練基地的北京國際算力服務有限公司總經理助理馬光介紹,使用數(shù)據時會面臨所有權歸誰、是否可信、如何保障安全、收益如何分配等各種問題,都需要建立機制來規(guī)范。為此,基地針對大模型訓練的數(shù)據合規(guī)和場景應用了“監(jiān)管沙盒”機制,為新技術創(chuàng)新迭代提供開放包容的政策保障,免除后顧之憂。
數(shù)據不像普通的商品,使用方一旦獲得會不會復制外泄?為此,基地里專門的存儲設備能讓數(shù)據“可用不可見”。從采集到存儲,再到初加工、精加工,最后到模型訓練,整個鏈條都是在訓練基地進行,跑不出去。“一旦發(fā)生糾紛,也有解決的兜底機制,邀請互聯(lián)網法院、知識產權局等來幫忙協(xié)調?!瘪R光說。
{{item.content}}