您的位置：首頁(yè) > 新聞 > 單機(jī)資訊 > 新聞詳情

文字變視頻！OpenAI發(fā)布新AI模型Sora

時(shí)間：2024-02-16 10:58:05

來(lái)源：3DM編譯
作者：skylark
編輯：豆角

OpenAI去年憑借ChatGPT的流行而進(jìn)入主流，現(xiàn)在該公司正將其人工智能技術(shù)應(yīng)用到視頻行業(yè)。

OpenAI于周四推出了其新的生成式AI模型Sora。Sora的工作方式類似OpenAI的圖像生成AI工具DALL-E。用戶輸入所需場(chǎng)景，Sora將返回一個(gè)高清視頻片段。Sora還可以生成受靜態(tài)圖像啟發(fā)的視頻片段，或擴(kuò)展現(xiàn)有視頻或填充缺失幀。

Sora是一個(gè)擴(kuò)散式人工智能模型，與ChatGPT一樣，它使用谷歌研究人員在2017年論文中提出的Transformer架構(gòu)。OpenAI在其聲明中寫(xiě)道：“Sora為能夠理解和模擬現(xiàn)實(shí)世界的模型奠定了基礎(chǔ)?！?

Sora目前只能生成一分鐘或更短的視頻。作為微軟支持的OpenAI，其發(fā)展目標(biāo)之一是多模態(tài)——將文本、圖像和視頻生成結(jié)合起來(lái)，從而提供更廣闊的人工智能模型套件。

目前，Sora只提供給一小部分安全測(cè)試人員 (又稱“紅隊(duì)”) 使用，他們負(fù)責(zé)測(cè)試模型在錯(cuò)誤信息和偏見(jiàn)等方面的漏洞。該公司表示，其配套的技術(shù)論文將在周四晚些時(shí)候發(fā)布。

OpenAI還表示，他們正在構(gòu)建一個(gè)可以識(shí)別由Sora生成的視頻的“檢測(cè)分類器”，并計(jì)劃在其輸出中包含某些元數(shù)據(jù)，以幫助識(shí)別人工智能生成的內(nèi)容。這與Meta在今年大選期間用來(lái)識(shí)別人工智能生成圖像的元數(shù)據(jù)類型相同。

現(xiàn)在聊天機(jī)器人和圖像生成器已經(jīng)進(jìn)入消費(fèi)和商業(yè)世界，視頻可能是生成式AI的下一個(gè)前沿。

借助Sora，OpenAI正在尋求與Meta和谷歌等公司的視頻生成AI工具競(jìng)爭(zhēng)，后者于 1月宣布了Lumiere。其他初創(chuàng)公司也提供了類似的人工智能工具，例如Stability AI，其產(chǎn)品名為Stable Video Diffusion。亞馬遜還發(fā)布了Create with Alexa，這是一個(gè)專門(mén)生成基于提示的短格式動(dòng)畫(huà)兒童內(nèi)容的模型。

OpenAI官網(wǎng)發(fā)布的Sora生成視頻：

Tokyo in the snow

視頻文字Prompt: “Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.”

“美麗、白雪皚皚的東京城很繁華。鏡頭穿過(guò)熙熙攘攘的城市街道，跟隨幾個(gè)人享受美麗的雪天并在附近的攤位購(gòu)物。美麗的櫻花花瓣隨著雪花在風(fēng)中飛舞?！?

Gold Rush：加州淘金熱

Ships in coffee

文字變視頻！OpenAI發(fā)布新AI模型Sora