最近刷到一條超震撼的視頻:咖啡杯從桌角滑落,在空中轉了半圈居然自己彈回桌面,牛奶一滴沒灑。你猜怎么著?這居然是AI生成的,就是OpenAI那個叫Sora的工具做的。是不是覺得有點不可思議?現在這技術已經能做到這種程度了,連物理規律都能模擬得這么像回事兒。 簡單說,Sora的厲害之處在于它能把文字直接變成60秒的高清視頻。以前那些AI工具最多生成十幾秒,鏡頭還不能怎么動,現在Sora能一鏡到底拍完整段故事。小索奇研究了下,它核心用了兩種技術:擴散模型和Transformer架構。說白了就是先把視頻"攪成一團亂麻",再一點點梳理清楚,最后用類似搭樂高的方式,把包含時間和空間信息的小片段拼起來,是不是聽著就很巧妙? 這技術對做生意的朋友來說簡直是福音。以前拍一支產品廣告,從搭景到后期沒個幾萬塊下不來,現在輸入文字描述,比如"清晨陽光灑進面包店,剛出爐的牛角包冒著熱氣",幾分鐘就能生成可用的素材。有數據說,傳統動畫每分鐘成本能從200萬美元降到300美元左右,這差距也太夸張了。那些做電商的小老板,以后連模特都不用請了,直接讓AI生成產品展示視頻,多省事。 不過說到這兒可能有人會問,這玩意兒會不會讓視頻從業者失業啊?其實現在行業里已經出現新趨勢了。比如有些工作室開始用Sora做初稿,再人工優化細節,效率提了好幾倍。就像貴州的繡娘用它把苗繡技法翻譯成多語言教學視頻,技術反而成了文化傳播的助力。真正被淘汰的可能是那些只會套模板的人,有創意有想法的創作者反而能解放雙手。 但問題也不是沒有。前陣子有段明星"虛擬出鏡"的視頻在網上流傳,后來才發現是AI生成的,這就涉及到深度偽造的風險了。現在行業里在用數字水印和內容憑證技術解決這個問題,相當于給AI內容上了身份證。不過小索奇覺得,以后咱們看視頻可能真得帶點"批判性思維",不然很容易被真假難辨的內容忽悠。 現在Sora已經和好萊塢影業合作開發預告片了,官網說它還在優化物理模擬能力。你想想看,以后可能連電影特效都能大幅降本,說不定咱們普通人也能拍個像模像樣的短片過把導演癮。市場預測說這行到2030年能有5800億規模,增長速度嚇人得很。 最后考考大家:如果這技術完全普及了,你最想用它做什么?是重現童年回憶,還是給自家產品拍個酷炫廣告?反正我已經想好要生成一段"貓咪指揮交響樂團"的視頻了,想想就很有趣~ 歡迎在評論區聊聊你的想法呀!