2月26日消息,今天凌晨3點(diǎn),微軟在官網(wǎng)開(kāi)源了多模態(tài)AI Agent基礎(chǔ)模型——Magma。與傳統(tǒng)Agent相比,Magma具備跨數(shù)字、物理世界的多模態(tài)能力,能自動(dòng)處理圖像、視頻、文本等不同類型數(shù)據(jù),例如,用戶可以用Magma來(lái)自動(dòng)下電商訂單、查詢天氣;也可以自動(dòng)操作實(shí)體機(jī)器人,或者下真實(shí)象棋時(shí)獲得幫助。此外,Magma還能內(nèi)置了心理預(yù)測(cè)功能,增強(qiáng)了對(duì)未來(lái)視頻幀中時(shí)空動(dòng)態(tài)的理解能力,能夠準(zhǔn)確推測(cè)視頻中人物或物體的意圖和未來(lái)行為。(鈦媒體)