原創(chuàng) 新智元 新智元
作者:網(wǎng)站小編 發(fā)布時間:2025年02月12日 23:25
新智元報道
編輯:Aeneas 桃子
【新智元導(dǎo)讀】太震撼了!AI視頻老牌選手Runway出手了,深夜發(fā)布的Gen-3在保真度、一致性和精細(xì)程度上再次重磅升級,畫面細(xì)節(jié)直接到達(dá)了電影級畫質(zhì),再次震驚全體網(wǎng)友。AI視頻已經(jīng)進入了神仙打架階段。Sora危了?
時隔多月,Runway終于出手了。新版Gen-3 Alpha,直接向Sora發(fā)起挑戰(zhàn)。
跟前代Gen-2相比,Gen-3 Alpha在細(xì)節(jié)、一致性和運動表現(xiàn)方面,又有了史詩級改進!
現(xiàn)在,網(wǎng)友們激動地轉(zhuǎn)發(fā)Gen-3 Alpha的各種演示,前幾天的風(fēng)頭大盛的Luma,光芒都被蓋過去了。
「Luma開始雪崩,Gen-3 Alpha將在未來幾天內(nèi)到來!Runway在保真度、一致性、動作和真實感人體方面取得了進步,模型擅長生成具有各種動作、手勢和情感的富有表現(xiàn)力的人類角色」
如今的AI視頻社區(qū),似乎又要迎來新王了。
Runway認(rèn)為,Gen-3 Alpha的誕生,意味著我們離通用世界模型和新一代AI視頻又近了一步。
Gen-3 Alpha:新基礎(chǔ)設(shè)施系列的首個模型
Gen-3 Alpha接受了視頻和圖像混合訓(xùn)練。
與2023年 11月推出的前身一樣,也支持文本到視頻、圖像到視頻和文本到圖像功能控制模式,如運動畫筆、高級相機控制和導(dǎo)演模式。
而在未來,Runway計劃提供更多工具,讓用戶實現(xiàn)對結(jié)構(gòu)、樣式和運動更好的控制。
根據(jù)Runway的說法,Gen-3 Alpha是基于大型多模態(tài)模型全新訓(xùn)練基礎(chǔ)設(shè)施訓(xùn)出的第一個模型。
不過,Runway并未透露研究者做了哪些具體改變。
這次上新也沒有技術(shù)論文發(fā)布,博客文章中只顯示了多個最長10秒的視頻示例。
網(wǎng)友盛贊:令人印象深刻,光線、顏色、皮膚紋理、清晰度,一切都令人驚嘆。
這就是即將撼動娛樂圈的AI!
Hugging Face創(chuàng)始人表示,泰褲辣,誰將會成為從開源視頻模型收獲百倍關(guān)注的幸運兒?
Pytorch之父高度贊揚道,這簡直就是Sora級別的模型。
人物更加真實,表現(xiàn)力更加細(xì)膩
從下面這些示例看出,新模型不僅對于不同動作、手勢、情感的人類角色把握得更為細(xì)膩,在場景中元素和過渡的時間控制上,也有了更大的進步。
人物生成上,肖像的面部細(xì)節(jié)更真實,而且在生成10秒長的時間里,完全能夠風(fēng)格保持一致性。
坐在車中的女子,在經(jīng)過霓虹燈的街道上,臉上的光影變化毫無違和感。
仰頭大笑的男子,戴上了假發(fā)和眼鏡。根本無法辨認(rèn)出,這是AI生成的。
穿著宇航服的男子穿梭在石頭建筑之間,好像在講述著這座古城的歷史。
一位老人在倉庫中的特寫鏡頭。
再來看日漫人物生成,也是非常地完美。
更懂物理世界
此外,Gen-3 Alpha經(jīng)過描述詳盡、時間連續(xù)的訓(xùn)練數(shù)據(jù),以此生成了富有想象力,以及畫面過度的效果。
而且,它還能精準(zhǔn)對場景中的元素進行關(guān)鍵幀動畫制作。
Gen-3 Alpha對物理世界理解,也更近一步,洪水涌入山莊,水流狀態(tài)與真實世界別無二致。
走廊中,閃光燈打在飛舞的銀色布料上。
不過這次,螞蟻的腿還是沒有對上。
一會兒多幾條,一會兒少幾條,堪稱薛定諤的螞蟻腿
Gen-3 Alpha在由遠(yuǎn)拉近的鏡頭生成中,能夠細(xì)致地呈現(xiàn)出想要的場景。
這個熱氣球同樣如此,與拍視頻中運鏡的效果是一樣的。
超夢幻的海底世界,一切仿佛置于夢境之中。
更值得一提的是,Gen-3 Alpha在視頻中生成字體變得更真實了。一面白墻上用黑色涂鴉,寫著Runway。
博物館中一幅畫的寬幅對稱照片,鏡頭拉近到畫作附近。
窗外看到一個巨大的奇怪生物在夜晚的破敗城市中行走,一盞路燈照亮了這個昏暗的地方。
一縷縷活生生的火焰,在熙熙攘攘的幻想集市中飛馳的特寫鏡頭。
此外,官方放出的炸裂演示還有:
還有一些網(wǎng)友,應(yīng)該拿到了內(nèi)測資格,開啟一大波試用。
為何Gen-3 Alpha此次升級,在畫質(zhì)美學(xué)上再次有了史詩級升級?
原因在于,在這次模型的訓(xùn)練中,凝聚了研究者、工程師和藝術(shù)家的共同努力。正是這種跨學(xué)科的團隊合作,讓Gen-3 Alpha可以詮釋各種風(fēng)格和電影概念。
追趕Sora
而且,除了標(biāo)準(zhǔn)版本外,Runway也正在和娛樂、媒體公司展開合作,開發(fā)Gen-3的定制版本。
這些定制模型,會為用戶提供更好的風(fēng)格控制、更一致的人物,還能滿足用戶的特定要求。
另外,Runway還宣布了新的安全功能,例如改進的審核系統(tǒng)和對C2PA標(biāo)準(zhǔn)的支持(所有主要商業(yè)圖像模型都使用該標(biāo)準(zhǔn))。
說起來,OpenAI的Sora已經(jīng)鴿了很久了。
24年2月,橫空出世的Sora,在一致性和圖像質(zhì)量方面標(biāo)志著全新的里程碑,直接刷新了全世界對AI視頻的認(rèn)識。
不過,到現(xiàn)在Sora仍然不是公開可用的,距離商業(yè)化的道路依舊很遙遠(yuǎn)。
而全世界的Sora平替,也如雨后春筍一般冒出。
多年以來,RunwayML一直是AI視頻領(lǐng)域的先驅(qū),憑借這次Gen-3 Alpha的發(fā)布,它似乎再次證明了自己的地位。
而且還有一個重磅消息:再過幾天,Gen-3 Alpha就會向付費訂閱者開放了。
參考資料:
https://x.com/runwayml/status/1802691475391566108