8月26日,阿里云正式發(fā)布全新多模態(tài)視頻生成模型通義萬相Wan2.2-S2V,并宣布開源。Wan2.2-S2V極大地簡化了視頻制作過程,僅需提供一張靜態(tài)圖片和一段音頻,模型便能生成面部表情自然、口型與音頻高度一致、肢體動(dòng)作流暢絲滑的電影級(jí)數(shù)字人視頻。支持分鐘級(jí)長視頻穩(wěn)定生成,不止嘴動(dòng),手勢、表情、姿態(tài)都能動(dòng)。而且模型在訓(xùn)練中充分挖掘跨域泛化能力,可自然驅(qū)動(dòng)卡通人物、動(dòng)物形象、二次元角色、藝術(shù)風(fēng)格化人像,不再局限于真人肖像。無論是萌寵說話,還是動(dòng)漫角色唱歌,Wan2.2-S2V都能精準(zhǔn)還原音畫同步效果。其提供480P與720P兩檔分辨率,兼顧效率與畫質(zhì),適用于短視頻、數(shù)字人、輕量影視等場景。(快科技)