OpenAI CTO:Sora計(jì)劃年底對外發(fā)布,或增加音頻和視頻編輯功能
激石Pepperstone(http://hysxdzy.com/)報(bào)道:
今年2月,OpenAI在官網(wǎng)發(fā)布了仍處測試階段的文生視頻大模型Sora,人們只需輸入一些文字提示,就能制作長達(dá)60秒的視頻,逼真的視覺效果更是讓許多動(dòng)畫、影視行業(yè)從業(yè)者感到“恐慌”。
當(dāng)?shù)貢r(shí)間3月13日周三,OpenAI的CTO Mira Murati接受媒體專訪,在訪談中,Murati表示,目前Sora正在開展紅隊(duì)測試(一種安全評估方法),僅面向少數(shù)人開放,計(jì)劃是在2024年晚些時(shí)侯可以正式與公眾見面。
Murati表示,目前利用Sora文生視頻的成本遠(yuǎn)高于使用圖像生成器Dall-E的成本。她表示,在Sora向公眾發(fā)布時(shí),他們將努力優(yōu)化算法,降低所需的算力,使更多人能夠享受到這項(xiàng)技術(shù)帶來的便利。
Murati透露,一段20秒時(shí)長、720P分辨率的無聲視頻,僅僅幾分鐘就能制作完成,計(jì)劃在未來為視頻增加語音功能,讓內(nèi)容更加完整?!拔覀冋谂⑦@項(xiàng)技術(shù)打造成人們可以編輯和創(chuàng)作的工具?!?/strong>
當(dāng)被問及Sora對視頻行業(yè)從業(yè)者可能帶來的影響時(shí),Murati強(qiáng)調(diào)OpenAI在發(fā)布這項(xiàng)技術(shù)時(shí)的謹(jǐn)慎態(tài)度。她表示,OpenAI已經(jīng)讓一些行業(yè)內(nèi)部人士提前進(jìn)入測試階段,以便更好地了解并應(yīng)對可能出現(xiàn)的挑戰(zhàn)。她說:“我們希望電影界人士和世界各地的創(chuàng)作者都能參與進(jìn)來,與我們共同探索如何進(jìn)一步推動(dòng)這些行業(yè)發(fā)展?!?/p>
如何識別AI生成視頻?
針對Sora的工作原理,Murati解釋稱,Sora通過大量視頻數(shù)據(jù)的學(xué)習(xí),學(xué)會(huì)識別和理解各種物體和動(dòng)作。當(dāng)用戶給它一個(gè)文本提示詞時(shí),它能夠迅速勾勒出整個(gè)場景,并逐幀填充細(xì)節(jié),從而生成出令人驚艷的視頻內(nèi)容。
那么OpenAI在訓(xùn)練Sora時(shí)使用了哪些數(shù)據(jù)?Murati回答稱:“我們使用了公開可用的數(shù)據(jù)和授權(quán)數(shù)據(jù)?!?/p>
當(dāng)被進(jìn)一步問及是否包括YouTube、Instagram和Facebook等平臺上的視頻時(shí),她表示并不清楚具體情況。Murati后來證實(shí),授權(quán)材料確實(shí)包括了來自一些攝影圖片網(wǎng)站的內(nèi)容。
在早期階段,人們?nèi)绾文軌蜃R別出視頻是由人工智能生成的而不是真實(shí)拍攝的呢?Murati提到了可能的解決方案:在視頻的底部添加水印。她表示,這些視頻最終將包含元數(shù)據(jù),用以標(biāo)明其來源,這有助于我們識別和追溯其生成方式。
除了技術(shù)問題,OpenAI還在致力于通過紅隊(duì)測試來確保Sora的安全性和可靠性。紅隊(duì)成員嘗試使用各種提示來挑戰(zhàn)Sora,以發(fā)現(xiàn)可能存在的漏洞、偏見和其他有害結(jié)果。Murati稱:“這就是為什么我們實(shí)際上還沒有將Sora面向公眾推出的原因,我們需要先弄清楚這些問題,然后才能廣泛的使用它們?!?/p>
Murati透露,Sora的提示詞政策可能會(huì)借鑒其圖像生成器Dall-E。比如,Sora將不允許生成公眾人物的圖像。
而關(guān)于可能涉及裸體的內(nèi)容,Murati表示,公司正在與藝術(shù)家們緊密合作,探討如何在不限制創(chuàng)造力的前提下,為這類內(nèi)容設(shè)置適當(dāng)?shù)摹白o(hù)欄和限制”。
人類將如何適應(yīng)這樣的變革?
對于好萊塢等視頻行業(yè)來說,文生視頻領(lǐng)域的繁榮既讓人擔(dān)心又讓人興奮,這取決于誰用,怎么用。
好萊塢超級制片人、導(dǎo)演、擁有美國最大制片廠之一泰勒·派瑞 (Tyler Perry)在目睹Sora的表現(xiàn)后,主動(dòng)放棄了8億美元的電影制片廠擴(kuò)建計(jì)劃。他意識到,這項(xiàng)技術(shù)有可能大幅度減少在布景和外景拍攝上的費(fèi)用,但同時(shí)也引發(fā)了人們對未來職業(yè)前景的擔(dān)憂。
當(dāng)被問及Sora對視頻制作工作可能帶來的影響時(shí),Murati再次強(qiáng)調(diào)了OpenAI在發(fā)布這項(xiàng)技術(shù)時(shí)的謹(jǐn)慎態(tài)度。她表示,OpenAI已經(jīng)讓一些行業(yè)內(nèi)部人士提前進(jìn)入測試階段,以便更好地了解并應(yīng)對可能出現(xiàn)的挑戰(zhàn)。她說:“我們希望電影界人士和世界各地的創(chuàng)作者都能參與進(jìn)來,與我們共同探索如何進(jìn)一步推動(dòng)這些行業(yè)發(fā)展?!?/p>
盡管OpenAI在推進(jìn)這項(xiàng)技術(shù)時(shí)表現(xiàn)得像瓷器店里的一頭公牛,那么它需要小心翼翼地避免破壞現(xiàn)有的秩序。但不可避免的是,隨著技術(shù)的不斷進(jìn)步和應(yīng)用,它終將開始“撞碎瓷盤”,進(jìn)而引發(fā)視頻制作行業(yè)的深刻變革。?????????
掃描二維碼推送至手機(jī)訪問。
版權(quán)聲明:本文由激石Pepperstone發(fā)布,如需轉(zhuǎn)載請注明出處。