低端顯卡登上AI的大船!6GB顯存就能生成高質(zhì)量視頻
- 來(lái)源:快科技
- 作者:上方文Q
- 編輯:一只小編輯OVO
GitHub的Lvmin Zhang聯(lián)合斯坦福大學(xué)的Maneesh Agrawala,發(fā)布了一項(xiàng)突破性的新技術(shù)FramePack,通過(guò)在視頻擴(kuò)散模型中使用固定長(zhǎng)度的時(shí)域上下文,可以更高效地生成時(shí)間更長(zhǎng)、質(zhì)量更高的視頻。
根據(jù)實(shí)測(cè),基于FramePack構(gòu)建的130億參數(shù)模型,只需一塊6GB顯存的顯卡,就能生成60秒鐘的視頻。
FramePack是一種神經(jīng)網(wǎng)絡(luò)架構(gòu),使用多級(jí)優(yōu)化策略,完成本地AI視頻生成。
目前,它底層基于定制版的騰訊混元模型,不過(guò)現(xiàn)有的預(yù)訓(xùn)練模型,都可以通過(guò)FramePack進(jìn)行微調(diào)、適配。
典型的視頻擴(kuò)散模型在生成視頻時(shí),需要首先處理此前生成的帶有噪音的幀,然后預(yù)測(cè)下一個(gè)噪音更少的幀,而每生成一幀所需要輸入的幀數(shù)量,就是時(shí)域上下文長(zhǎng)度,會(huì)隨著視頻的體積而增加。
這就對(duì)顯存有著很高的要求,一般至少得有12GB,而如果顯存不夠多,生成的視頻就會(huì)很短,質(zhì)量很差,生成的時(shí)間也會(huì)很長(zhǎng)。
FramePack會(huì)根據(jù)輸入幀的重要性,對(duì)所有輸入幀進(jìn)行壓縮,改變?yōu)楣潭ǖ纳舷挛拈L(zhǎng)度,顯著降低對(duì)顯存的需求,而且計(jì)算消耗與圖片擴(kuò)散模型類(lèi)似。
同時(shí),每一幀畫(huà)面生成之后,都會(huì)實(shí)時(shí)顯示,方便即時(shí)預(yù)覽。
FramePack還可以緩解“漂移”(drifting)現(xiàn)象,也就是視頻長(zhǎng)度增加、質(zhì)量下降的問(wèn)題,從而在不顯著犧牲質(zhì)量的同時(shí),生成更長(zhǎng)的視頻。
FramePack數(shù)據(jù)格式支持FP16、BF16,顯卡硬件支持RTX 50、RTX 40、RTX 30系列顯卡,除了RTX 3050 4GB幾乎所有的近代顯卡都沒(méi)問(wèn)題。
在RTX 20系列和更老顯卡上尚未經(jīng)過(guò)驗(yàn)證,也沒(méi)有提及AMD、Intel處理器的需求。
操作系統(tǒng)支持Windows、Linux。
性能方面,RTX 4090經(jīng)過(guò)teacache優(yōu)化之后,每秒可以生成大約0.6幀。

- 阿里云首款A(yù)I原生開(kāi)發(fā)環(huán)境工具AI IDE今日上線
- 國(guó)產(chǎn)機(jī)器人操作系統(tǒng)鴻道發(fā)布:支持華為、龍芯、英偉達(dá)等
- 我國(guó)新一代人造太陽(yáng)創(chuàng)運(yùn)行新紀(jì)錄 達(dá)10的20次方量級(jí)
- 持續(xù)近10年 中國(guó)最長(zhǎng)的航天任務(wù)開(kāi)始了!天問(wèn)二號(hào)詳解
- 印度科技公司新型傳感器問(wèn)世 能見(jiàn)度極差環(huán)境探測(cè)200米
- 80PLUS認(rèn)證新增“Ruby”等級(jí):電源轉(zhuǎn)換效率要達(dá)到96.5%

-
傳奇歲月
-
原始傳奇
-
斗羅大陸(我唐三認(rèn)可0.1折)
-
太閣立志2
-
奇門(mén)(0.1折仙俠不用閃)
-
深淵契約
-
貓狩紀(jì)0.1折
-
靈劍仙師(斗破蒼穹)
玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門(mén)評(píng)論
全部評(píng)論