硅谷競速:Meta版Sora震撼發布,OpenAI以AGI交互系統迎戰
硅谷競速:Meta版Sora震撼發布,OpenAI以AGI交互系統迎戰
北京時間10月4日,硅谷兩大巨頭Meta和OpenAI在AI領域再次展開激烈競爭,各自推出了令人矚目的新產品,為AI行業的發展注入了新的活力。
Meta在此次競賽中亮出了其全新的AI模型——Movie Gen。這款模型由視頻生成(Movie Gen Video)和音頻生成(Movie Gen Audio)兩個部分組成,能夠無縫生產出完整的多媒體內容,實現從圖像、視覺到聽覺的全方位覆蓋。Meta表示,Movie Gen是“迄今最先進的媒體基礎模型”。具體來看,Movie Gen Video是一個30B參數的Transformer模型,可以從單個文本提示生成16秒、每秒16幀的高清視頻。同時發布的Movie Gen Audio則能夠生成與視頻同步的高保真音頻,最長可達45秒。Meta的CEO馬克·扎克伯格在社交平臺為Movie Gen站臺,展示了其將靜態照片轉化為動態健身視頻的能力,場景幽默且充滿科幻感。
除了視頻和音頻生成,Movie Gen還具備強大的視頻編輯功能,可以執行添加、刪除或替換元素,背景替換、樣式更改等全局修改。這一功能使得Movie Gen成為一體化的AI媒體工具,極大地提升了視頻制作的效率和效果。Meta透露,該模型在1億個視頻和10億張圖像上進行了預訓練,而音頻生成模型則使用了約100萬小時的音頻數據。此外,Meta還開源了多個基準測試數據集,為后續研究者提供了權威的評測工具。
與此同時,OpenAI也推出了其最新的產品——交互界面canvas。這是一種使用ChatGPT寫作和編程的新方式,也是ChatGPT發布以來的重大視覺界面升級。用戶可以與ChatGPT一起協作完成寫作和編碼項目,整個過程可考、可視,不再局限于簡單的聊天。Canvas是一個內置于ChatGPT的文檔和代碼編輯器,用戶可以在一個界面內完成從構思到成文的全過程,實現與AI的無縫協作,從而大大提升工作效率。OpenAI的CEO薩姆·奧特曼表示,這暗示著ChatGPT不僅僅是一個聊天機器人,而是要打造AI時代的操作系統。
OpenAI在此次競賽中不僅展示了其強大的AI交互能力,還宣布完成了新一輪66億美元的融資,投后估值達到1570億美元(約合人民幣1.1萬億元)。本輪融資由風投巨頭Thrive Capital領投,微軟、軟銀集團、英偉達等巨頭紛紛跟投。這標志著OpenAI從“明星獨角獸”公司過渡到了不折不扣的人工智能巨頭。
在AI行業的這場競速中,Meta和OpenAI的激烈競爭無疑推動了技術的快速發展。隨著兩大巨頭不斷推出新產品和新技術,AI行業的創新活力得到了極大的激發。可以預見的是,在未來一段時間里,科技巨頭們將繼續推陳出新,既包括有革命性意義的新產品、新技術,也有不斷掀起小高潮的持續性上新。
對于AI行業的未來發展,業內人士持積極態度。他們認為,隨著技術的不斷進步和應用場景的不斷拓展,AI將在各個領域發揮越來越重要的作用。無論是傳統產業的智能化升級,還是新興業態的創新發展,都離不開AI的支撐。同時,隨著國際合作的不斷深化,中國AI企業有望在全球市場中發揮更加重要的作用。
總的來說,硅谷的這場AI競速不僅展示了巨頭們的強大實力,也為AI行業的未來發展注入了新的動力。我們有理由相信,在不久的將來,AI將改變我們的生活方式,推動全球經濟結構的變革,為人類社會的發展帶來更加美好的未來。
(圖片來源網絡)