8月14日,字節(jié)跳動(dòng)Seed團(tuán)隊(duì)發(fā)布并開(kāi)源了全模態(tài)PyTorch原生訓(xùn)練框架——VeOmni。據(jù)悉,VeOmni采用以模型為中心的分布式訓(xùn)練方案,可將復(fù)雜的分布式并行邏輯與模型計(jì)算解耦,為全模態(tài)模型組合設(shè)置高效的并行訓(xùn)練方案。這一方式可大幅降低工程開(kāi)銷,提升訓(xùn)練效率和擴(kuò)展性,將數(shù)周的工程開(kāi)發(fā)時(shí)間縮短至幾天。
8月13日,據(jù)外媒報(bào)道,中國(guó)工信部等部門(mén)已要求阿里巴巴、字節(jié)跳動(dòng)等科技企業(yè)證明采購(gòu)英偉達(dá)H20 AI芯片的正當(dāng)性,并傾向于推動(dòng)國(guó)產(chǎn)替代方案。此前,英偉達(dá)雖承諾向美政府上交15%銷售額以換取H20對(duì)華出口許可,但仍有媒體質(zhì)疑該芯片存在“后門(mén)”安全隱患,且性能優(yōu)勢(shì)并不明顯。
7月31日,字節(jié)跳動(dòng)Seed團(tuán)隊(duì)發(fā)布實(shí)驗(yàn)性擴(kuò)散語(yǔ)言模型Seed Diffusion Preview。據(jù)介紹,其目標(biāo)是以結(jié)構(gòu)化的代碼生成為實(shí)驗(yàn)領(lǐng)域,系統(tǒng)性地驗(yàn)證離散擴(kuò)散技術(shù)路線作為下一代語(yǔ)言模型基礎(chǔ)框架的可行性。實(shí)驗(yàn)結(jié)果顯示,Seed Diffusion Preview代碼推理速度可達(dá)到2146 tokens/s,速度相比同等規(guī)模的自回歸模型提升5.4倍。
7月22日,字節(jié)跳動(dòng)Seed團(tuán)隊(duì)發(fā)布通用機(jī)器人模型GR-3。據(jù)介紹,與此前需要大量機(jī)器人軌跡訓(xùn)練的VLA模型不同,GR-3通過(guò)少量的人類數(shù)據(jù)即可實(shí)現(xiàn)高效微調(diào),從而快速且低成本地遷移至新任務(wù),以及認(rèn)識(shí)新物體。此外,GR-3能有效處理長(zhǎng)程任務(wù)并能進(jìn)行高靈巧度的操作。同時(shí),字節(jié)跳動(dòng)Seed團(tuán)隊(duì)還開(kāi)發(fā)了一款通用雙臂移動(dòng)機(jī)器人ByteMini,配套設(shè)計(jì)的ByteMini機(jī)器人搭載GR-3模型,可高效在真實(shí)環(huán)境中處理復(fù)雜任務(wù)。據(jù)該團(tuán)隊(duì)介紹,機(jī)器人操作大模型后續(xù)研究計(jì)劃包括擴(kuò)大模型規(guī)模和訓(xùn)練數(shù)據(jù)量、引入強(qiáng)化學(xué)習(xí)訓(xùn)練。
7月17日,字節(jié)跳動(dòng)豆包大模型視覺(jué)多模態(tài)生成方向負(fù)責(zé)人楊建朝在公司內(nèi)部宣布“暫時(shí)休息”,相關(guān)工作已完成交接。其工作由周暢(花名“時(shí)光”)接手,周暢所在架構(gòu)仍為“多模態(tài)交互與世界模型”部門(mén),向吳永輝匯報(bào)。此次人事變動(dòng)原因未明確,有知情人士稱是“家庭因素”,也有說(shuō)法稱其因長(zhǎng)期高強(qiáng)度工作身心俱疲。楊建朝是字節(jié)AI體系內(nèi)公認(rèn)的“技術(shù)大?!保鴰煆摹坝?jì)算機(jī)視覺(jué)之父”Thomas Huang,2018年加入字節(jié)跳動(dòng),2023年起帶領(lǐng)Seed視覺(jué)部門(mén)。接任者周暢本科畢業(yè)于復(fù)旦大學(xué),博士就讀于北京大學(xué),曾擔(dān)任阿里巴巴通義千問(wèn)大模型的技術(shù)負(fù)責(zé)人,主導(dǎo)開(kāi)發(fā)了M6多模態(tài)預(yù)訓(xùn)練模型,2024年7月從阿里離職后加入字節(jié)跳動(dòng)。
北京時(shí)間7月8日,有消息稱字節(jié)跳動(dòng)已同意將TikTok美國(guó)業(yè)務(wù)出售給由甲骨文牽頭的美國(guó)財(cái)團(tuán),自身保留少數(shù)股權(quán)。對(duì)此,字節(jié)跳動(dòng)方面表示,該信息不實(shí)。據(jù)了解,這項(xiàng)交易旨在滿足美國(guó)《保護(hù)美國(guó)人免受外國(guó)對(duì)手控制應(yīng)用程序法案》要求,解決美方對(duì)數(shù)據(jù)安全的顧慮。交易仍需中美兩國(guó)政府批準(zhǔn),目前美國(guó)政府設(shè)定的最終截止日期為9月17日。
字節(jié)開(kāi)發(fā)的機(jī)器人已累計(jì)量產(chǎn)超千臺(tái)。他們?cè)?023年完成了200臺(tái)量產(chǎn)目標(biāo),之后年量產(chǎn)數(shù)超100%增長(zhǎng)。該機(jī)器人研發(fā)團(tuán)隊(duì),也從2023年夏天的約50人左右,擴(kuò)充至目前的約150人。經(jīng)過(guò)幾年發(fā)展,目前字節(jié)機(jī)器人團(tuán)隊(duì)的遠(yuǎn)期目標(biāo)是挑戰(zhàn)具身智能。字節(jié)研發(fā)、生產(chǎn)物流機(jī)器人主要也是為了探索具身智能:進(jìn)入真實(shí)場(chǎng)景,獲得一些數(shù)據(jù),也獲得反饋和落地的手感。
近日,字節(jié)跳動(dòng)旗下Seed團(tuán)隊(duì)正大規(guī)模招募機(jī)器人相關(guān)方向的“一號(hào)位”,包括機(jī)器人產(chǎn)品負(fù)責(zé)人、機(jī)器人工程技術(shù)負(fù)責(zé)人以及具身智能大模型負(fù)責(zé)人。此次招募中對(duì)“產(chǎn)品、工程、大模型”三個(gè)負(fù)責(zé)人同步設(shè)崗,或說(shuō)明Seed不再滿足于技術(shù)演示或研究發(fā)布,而是想要一整套“能用、可落地、跑得動(dòng)”的智能系統(tǒng)。這可能預(yù)示著字節(jié)將在2025年推動(dòng)旗下首個(gè)機(jī)器人相關(guān)產(chǎn)品走向C端或產(chǎn)業(yè)端。根據(jù)報(bào)道,字節(jié)跳動(dòng)旗下Seed團(tuán)隊(duì)目前已在北京、上海、深圳、杭州等一線科技重鎮(zhèn)設(shè)有辦公點(diǎn)。截至2024年底,Seed團(tuán)隊(duì)的規(guī)模已突破200人,預(yù)計(jì)到2025年末,其正式員工人數(shù)將超過(guò)300人。
據(jù)悉,吳德周離開(kāi)字節(jié)跳動(dòng)后創(chuàng)立的智能眼鏡公司「致敬未知」,于近期推出其首款A(yù)I運(yùn)動(dòng)眼鏡BleeqUp Ranger。該產(chǎn)品專為騎行、徒步等戶外運(yùn)動(dòng)設(shè)計(jì),將于6月底在海外發(fā)售。與Meta計(jì)劃推出的AI運(yùn)動(dòng)眼鏡相比,BleeqUp Ranger在功能設(shè)計(jì)上更貼合運(yùn)動(dòng)場(chǎng)景需求,例如攝像頭置于中間、配備雙倍揚(yáng)聲器、自動(dòng)觸發(fā)錄像功能等。吳德周認(rèn)為,垂直場(chǎng)景的AI眼鏡是創(chuàng)業(yè)公司的機(jī)會(huì),未來(lái)智能眼鏡將成為個(gè)人全天候智慧助手,而打通手機(jī)權(quán)限將是關(guān)鍵。
近日,有消息稱字節(jié)人工智能實(shí)驗(yàn)室負(fù)責(zé)人李航已經(jīng)正式卸任,其在內(nèi)部系統(tǒng)的身份變?yōu)閯趧?wù)/顧問(wèn)。對(duì)此,字節(jié)相關(guān)負(fù)責(zé)人回應(yīng):“李航是退休返聘,管理范圍沒(méi)有變化?!?
近日,據(jù)新浪科技報(bào)道,多款由老鳳祥與字節(jié)旗下火山引擎合作的AI眼鏡,即將將于七月正式發(fā)布。這一消息被業(yè)界視為字節(jié)攜手老鳳祥入局AI眼鏡。6月12日,火山引擎相關(guān)負(fù)責(zé)人表示:火山引擎沒(méi)有與老鳳祥合作打造AI智能眼鏡的計(jì)劃。豆包大模型為公開(kāi)售賣產(chǎn)品,任何客戶都可以合規(guī)采購(gòu)。實(shí)際上,就在6月11日的國(guó)際養(yǎng)老、輔具及康復(fù)醫(yī)療博覽會(huì)以及火山引擎原動(dòng)力大會(huì)上,老鳳祥的AI眼鏡,已正式亮相。據(jù)介紹,該款眼鏡具備語(yǔ)音導(dǎo)航、實(shí)時(shí)翻譯、智能輔助閱讀、情感對(duì)話等功能,背后接入的豆包大模型。
據(jù)知情人士透露,多款由老鳳祥與字節(jié)旗下火山引擎合作的AI眼鏡即將于七月正式發(fā)布。作為老鳳祥首次跨界AI智能眼鏡,其后臺(tái)由豆包大模型提供技術(shù)支持。老鳳祥跨界AI眼鏡產(chǎn)品,將支持視覺(jué)理解、語(yǔ)音對(duì)話、語(yǔ)義識(shí)別、電話接聽(tīng)等功能,主要面向老年人群體。
5月9日,據(jù)“字節(jié)跳動(dòng)開(kāi)源”公號(hào)顯示,基于LangStack的全新Deep Research開(kāi)源項(xiàng)目——DeerFlow,正式在ByteDance的GitHub官方組織上開(kāi)源。在演示視頻中,字節(jié)跳動(dòng)技術(shù)團(tuán)隊(duì)演示了包括深度研究、MCP集成、報(bào)告AI增強(qiáng)編輯以及播客生成等功能。
近日有媒體稱,字節(jié)跳動(dòng)原高級(jí)副總裁、前教育業(yè)務(wù)負(fù)責(zé)人陳林已離職創(chuàng)業(yè),與科大訊飛前高管王卓共同創(chuàng)立“銀河智學(xué)”,注冊(cè)“小鹿愛(ài)學(xué)”商標(biāo)。消息稱,銀河智學(xué)預(yù)計(jì)將在8月推出面向?qū)W校的AI教育產(chǎn)品。對(duì)此,接近字節(jié)的知情人士表示,陳林離職為不實(shí)信息。公開(kāi)資料顯示,陳林2012年加入字節(jié),曾擔(dān)任多款核心產(chǎn)品的產(chǎn)品經(jīng)理,2018年底,陳林出任今日頭條CEO;兩年后又被任命為大力教育CEO。
4月28日,從多個(gè)獨(dú)立信源處獲悉,今年一季度,騰訊向字節(jié)跳動(dòng)購(gòu)買(mǎi)了價(jià)值約20億元的GPU(圖形處理器)算力資源,這批資源以英偉達(dá)H20卡和服務(wù)器為主,騰訊元寶目前的更新主要使用來(lái)自字節(jié)的卡。除了騰訊,一位知情人士稱,阿里也在今年一季度DeepSeek爆紅之后,向字節(jié)跳動(dòng)下了GPU訂單。多位接近字節(jié)跳動(dòng)人士稱,字節(jié)跳動(dòng)在去年囤積了大約10萬(wàn)個(gè)GPU模組。一位服務(wù)器廠商人士稱,據(jù)其估算,這批GPU資源總價(jià)值在1000億元左右。字節(jié)相關(guān)負(fù)責(zé)人回復(fù)稱,以上為不實(shí)信息。
4月27日,字節(jié)跳動(dòng)Seed正式啟動(dòng)2026屆Top Seed大模型頂尖人才校招計(jì)劃。據(jù)了解,此前3月Top Seed開(kāi)放了研究型實(shí)習(xí)生招聘,今日起正式啟動(dòng)2026屆校招,計(jì)劃招募約30位頂尖應(yīng)屆博士。本屆Top Seed研究課題包括大語(yǔ)言模型、機(jī)器學(xué)習(xí)算法和系統(tǒng)、多模態(tài)生成、多模態(tài)理解、語(yǔ)音等方向,基本覆蓋大模型研究各個(gè)領(lǐng)域。值得一提的是,本屆Top Seed強(qiáng)調(diào)不限專業(yè)背景,更關(guān)注研究潛力,希望尋找具有極強(qiáng)技術(shù)信仰與熱情、具備出色研究能力、富有好奇心和驅(qū)動(dòng)力的年輕研究者。
近期字節(jié)AI產(chǎn)品部門(mén)Flow旗下發(fā)生產(chǎn)品調(diào)整:社交陪伴類AI產(chǎn)品貓箱原負(fù)責(zé)人梁琛奇已離開(kāi)字節(jié)跳動(dòng);貓箱負(fù)責(zé)人由原星繪產(chǎn)品負(fù)責(zé)人西原(花名)接任;同時(shí),星繪團(tuán)隊(duì)計(jì)劃并入豆包,將由豆包App端負(fù)責(zé)人陸游(花名)一起管理。
4月23日,字節(jié)跳動(dòng)開(kāi)源了多模態(tài)AI Agent UI-TARS的最新1.5版本。與上一代相比,1.5版本在計(jì)算機(jī)使用、瀏覽器使用和手機(jī)使用等基準(zhǔn)測(cè)試中均表現(xiàn)非常出色。在計(jì)算機(jī)使用方面,OSworld測(cè)試得分為42.5,高于OpenAI CUA的36.4、Claude 3.7的28以及之前的最高水平38.1(200步);Windows Agent Arena(50步)得分為42.1,遠(yuǎn)超之前的29.8。瀏覽器使用方面,WebVoyager得分為84.8,接近OpenAI CUA和之前最高水平的87,Online-Mind2web得75.8,優(yōu)于OpenAI CUA的71、Claude 3.7的62.9和之前的71。手機(jī)使用方面,Android World得64.2,高于之前的59.5。
4月17日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)(Seed)發(fā)布并開(kāi)源UI-TARS-1.5。據(jù)介紹,這是一款基于視覺(jué)-語(yǔ)言模型構(gòu)建的開(kāi)源多模態(tài)智能體,能夠在虛擬世界中高效執(zhí)行各類任務(wù)。目前,UI-TARS-1.5已在7個(gè)典型的GUI圖形用戶界面評(píng)測(cè)基準(zhǔn)中取得SOTA表現(xiàn),并首次展現(xiàn)了其在游戲中的長(zhǎng)時(shí)推理能力和在開(kāi)放空間中的交互能力。
近日據(jù)媒體報(bào)道,字節(jié)整合AI探索團(tuán)隊(duì),Seed內(nèi)部組織架構(gòu)再生變動(dòng),字節(jié)AI Lab即將全部收歸Seed團(tuán)隊(duì)之下。記者就此信息向字節(jié)官方求證,截至發(fā)稿,官方暫未回應(yīng)。