May_Sora Special|OpenAl Sora Technology and Advantages(Up)
On February 15, 2024 OpenAI announced the launch of Sora, a new milestone in the development of video-generative AI technology that produces smooth and realistic videos up to one minute in length. According to the company's report, Sora uses Spacetime Patches and Diffusion Transformer as its core technology, utilizing the generative power of Diffusion and the self-attention mechanism of Transformers to generate video content by predicting clean blocks, and then processing the spatial and temporal patches with Transformers. Transformers process spatial and temporal blocks.
圖2、Sora 運作模式示意圖

資料來源 : OpenAI
Sora具備的技術特點詳述如下 :
- 原始尺寸上訓練和生成影片 : 一般影像生成工具的訓練方法通常會調整視覺資料的大小或寬高比以適應統一標準,Sora利用Diffusion Transformer混合架構而能在視覺資料的原始尺寸上進行訓練,使其能生成各種尺寸的影片。
- 統一視覺資料 : 為了有效處理輸入的多樣化視覺資料,Sora透過將原始影片壓縮到較低維度的潛在空間再分解為時空區塊以統一資料格式。區塊為Sora的基本單元,它遵循GPT4訓練模式處理一系列區塊並進行預測。
- 視訊壓縮網路 : Sora利用VAE編碼器建置影片壓縮網路以降低輸入資料的維度,透過潛在Diffusion訓練壓縮網路及解碼器,藉此高效率壓縮大量圖塊以便於管理海量資料。
- 潛在時空區塊 : 為了處理來自不同影片類型的潛在區塊數量,Sora借鏡Google的NaViT架構中Patch n’Pack的方法,允許從不同影片中提取多個區塊再包裹在單一序列中以達到可變解析度並保持一定寬高比。
Sora相較於其他AI生成影片工具的優勢包括 :
- 60秒超長視頻 : 如Runway、Pika、MoonVally、Domo AI、AnimateDiff、Stable Video等絕大部分AI生成影片工具僅能產生6秒以下作品,Sora直接將時長提升到10倍,大幅領先其他業者。
- 自由尺寸影片生成 : Sora能夠生成從橫屏到豎屏等各種尺寸的影片,可滿足不同平台和觀看體驗的需求,這比先前限定長寬比的影片生成工具提供更高的靈活度,使創作更加自由。
- 前後擴展視頻能力 : 不同於以往只能向前擴展的限制,Sora可以向前或向後擴展,甚至可創建無限連續循環的影片,大大豐富其敘事結構和創意表達。
- 多視頻無縫連接 : Sora可以將兩個完全不同影片融合成毫無違和感的新影像,例如無人機穿越變成蝴蝶飛行,這種獨特功能提供無限的創意發想空間。
- 真實物理世界模擬 : Sora展現出生成高度擬真物理世界影片的能力,不僅體現技術的進步,也為創作者提供更逼真的創意表現工具。
- 時間一致性與動作模擬 : Sora能夠在生成的視頻中保持時間一致性,即使在面對複雜的動作和場景變換時也能確保人物與物體之連貫性。此外,它還能模擬如留下咬痕之簡單動作的影響,進一步增強影片的真實感。
- 逼真的鏡頭運動 : Runway、Pika等生成工具需要使用額外的參數以實現鏡頭運動,Sora可以直接列理解文本中有關鏡頭運動之提示,能在影片中使用多種鏡頭運動。
- 連貫一致的影片內容 : Sora 生成的影片能隨時增加人物及場景元素,且仍可保持原有的狀態而不會扭曲變形,所以前後連貫性非常好。即使元素被遮擋或者短暫離開畫面依舊能在後續準確呈現物件的相關特徵。
由於Sora具備上述諸多優勢,預計將對影視製作帶來四項變革 :
- 提升創作效率: 傳統影視製作通常需要投入大量的人力和金錢,Sora的出現將大大提高影視內容的生成效率以降低製作成本,讓更多人參與視頻創作。
- 創意更為多樣: Sora的靈活性和創造力為影視創作帶來更多可能性,創作者可以藉此探索更加豐富多樣的創意表達方式,擴大視頻內容的創作領域。
- 滿足客制需求:依據用戶輸入的描述或草圖,Sora能夠生成符合其想要或要求的影視內容,為個人使用者、企業品牌等提供定制化的影片製作服務。
- 增進創業機會與新的商機: Sora為創業者提供新商機,可基於其技術開發相關的影片創作工具、平台或服務以滿足市場需求,發掘影視行業的新商業模式和商機。






