您的位置: 首頁 > 新聞 > 單機(jī)資訊 > 新聞詳情

文字變視頻!OpenAI發(fā)布新AI模型Sora

時間:2024-02-16 10:58:05
  • 來源:3DM編譯
  • 作者:skylark
  • 編輯:豆角

OpenAI去年憑借ChatGPT的流行而進(jìn)入主流,現(xiàn)在該公司正將其人工智能技術(shù)應(yīng)用到視頻行業(yè)。

OpenAI于周四推出了其新的生成式AI模型Sora。Sora的工作方式類似OpenAI的圖像生成AI工具DALL-E。用戶輸入所需場景,Sora將返回一個高清視頻片段。Sora還可以生成受靜態(tài)圖像啟發(fā)的視頻片段,或擴(kuò)展現(xiàn)有視頻或填充缺失幀。

文字變視頻!OpenAI發(fā)布新AI模型Sora

Sora是一個擴(kuò)散式人工智能模型,與ChatGPT一樣,它使用谷歌研究人員在2017年論文中提出的Transformer架構(gòu)。OpenAI在其聲明中寫道:“Sora為能夠理解和模擬現(xiàn)實(shí)世界的模型奠定了基礎(chǔ)?!?

Sora目前只能生成一分鐘或更短的視頻。作為微軟支持的OpenAI,其發(fā)展目標(biāo)之一是多模態(tài)——將文本、圖像和視頻生成結(jié)合起來,從而提供更廣闊的人工智能模型套件。

目前,Sora只提供給一小部分安全測試人員 (又稱“紅隊(duì)”) 使用,他們負(fù)責(zé)測試模型在錯誤信息和偏見等方面的漏洞。該公司表示,其配套的技術(shù)論文將在周四晚些時候發(fā)布。

OpenAI還表示,他們正在構(gòu)建一個可以識別由Sora生成的視頻的“檢測分類器”,并計(jì)劃在其輸出中包含某些元數(shù)據(jù),以幫助識別人工智能生成的內(nèi)容。這與Meta在今年大選期間用來識別人工智能生成圖像的元數(shù)據(jù)類型相同。

現(xiàn)在聊天機(jī)器人和圖像生成器已經(jīng)進(jìn)入消費(fèi)和商業(yè)世界,視頻可能是生成式AI的下一個前沿。

借助Sora,OpenAI正在尋求與Meta和谷歌等公司的視頻生成AI工具競爭,后者于 1月宣布了Lumiere。其他初創(chuàng)公司也提供了類似的人工智能工具,例如Stability AI,其產(chǎn)品名為Stable Video Diffusion。亞馬遜還發(fā)布了Create with Alexa,這是一個專門生成基于提示的短格式動畫兒童內(nèi)容的模型。

OpenAI官網(wǎng)發(fā)布的Sora生成視頻:

Tokyo in the snow

視頻文字Prompt: “Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.”

“美麗、白雪皚皚的東京城很繁華。鏡頭穿過熙熙攘攘的城市街道,跟隨幾個人享受美麗的雪天并在附近的攤位購物。美麗的櫻花花瓣隨著雪花在風(fēng)中飛舞?!?

Gold Rush:加州淘金熱

Ships in coffee

文字變視頻!OpenAI發(fā)布新AI模型Sora

Big Sur

0

玩家點(diǎn)評 0人參與,0條評論)

收藏
違法和不良信息舉報(bào)
分享:

熱門評論

全部評論

他們都在說 再看看
3DM自運(yùn)營游戲推薦 更多+