主題: Sora讓視頻生成更富想象力 能幫助蘋果Vision Pro普及嗎?
2024-02-25 20:47:45          
功能: [發(fā)表文章] [回復(fù)] [快速回復(fù)] [進(jìn)入實(shí)時(shí)在線交流平臺(tái) #1
 
 
頭銜:金融島總管理員
昵稱:花臉
發(fā)帖數(shù):64958
回帖數(shù):2132
可用積分?jǐn)?shù):15902171
注冊(cè)日期:2011-01-06
最后登陸:2024-10-25
主題:Sora讓視頻生成更富想象力 能幫助蘋果Vision Pro普及嗎?

2024-02-25第一財(cái)經(jīng)
上周,美國科技股上演了一場“資本盛宴”。受Sora大模型發(fā)布的提振,英偉達(dá)引領(lǐng)AI公司股價(jià)飆升,該公司市值歷史上首次觸及2萬億美元大關(guān),并帶動(dòng)Meta、微軟等公司股價(jià)大漲。市場人士認(rèn)為,AI有望進(jìn)一步推動(dòng)英偉達(dá)漲勢,在加入“2萬億美元”俱樂部后,英偉達(dá)趕超蘋果市值將不再遙不可及。
在這一輪由AI大模型觸發(fā)的科技浪潮中,蘋果公司卻未能分得一杯羹。自上個(gè)月市值被微軟超越后,蘋果股價(jià)一路走低。該公司推出的重磅混合現(xiàn)實(shí)可穿戴產(chǎn)品Vision Pro的發(fā)布也未能提振蘋果股價(jià)表現(xiàn)。自Vision Pro正式開賣近一個(gè)月以來,蘋果股價(jià)累計(jì)跌幅超過6%,目前市值2.8萬億美元,比微軟落后近2000億美元。
Vision Pro發(fā)布之初,市場給予該設(shè)備較大的預(yù)期。蘋果CEO庫克將這款設(shè)備的發(fā)布宣告為“空間計(jì)算時(shí)代的到來”。他稱:“Vision Pro是有史以來最先進(jìn)的消費(fèi)電子設(shè)備,其革命性且神奇的用戶界面將重新定義我們聯(lián)系、創(chuàng)造和探索的方式?!?br />在Sora大模型發(fā)布后,很快有用戶將Sora生成的視頻轉(zhuǎn)化成蘋果Vision Pro可看的3D空間視頻。有科技博主表示:“Sora+Vision Pro意味著你可以描述一個(gè)世界,并且在這個(gè)世界中存在?!?br />從這一角度來看,Sora的問世給Vision Pro帶來了更多的內(nèi)容。但專家向第一財(cái)經(jīng)記者強(qiáng)調(diào),Sora創(chuàng)建的視頻仍是普通視頻,而不是基于空間計(jì)算的空間視頻,因此還不能直接為Vision Pro來創(chuàng)建視頻。
“理論上所有的視頻都可以轉(zhuǎn)化成空間視頻,Sora并不懂空間計(jì)算,它生成的視頻也是普通的視頻,所以與Vision Pro沒有直接的關(guān)聯(lián)?!蹦?D生成式AI初創(chuàng)公司技術(shù)負(fù)責(zé)人對(duì)第一財(cái)經(jīng)記者表示。
他表示,自己也使用蘋果的Vision Pro做了一些3D視頻,但這些視頻僅供展示,對(duì)于Vision Pro未來的應(yīng)用場景如何開發(fā),還沒有很成熟的想法。
他告訴第一財(cái)經(jīng)記者,3D視頻需要包括空間信息,比如每個(gè)像素點(diǎn)在空間中的位置信息,也被稱為“深度”(depth),普通視頻通過生成depth,可以轉(zhuǎn)化為Vision Pro可看的具有3D效果的空間視頻。
上述技術(shù)負(fù)責(zé)人認(rèn)為,短期內(nèi)Sora的視頻生成還不會(huì)涉及3D生成,因?yàn)?D和文本、圖片和視頻生成有本質(zhì)的區(qū)別,其難點(diǎn)并不在于獲取高度一致性的連續(xù)多角度圖像,而在于工業(yè)標(biāo)準(zhǔn)。“否則照片建模早就統(tǒng)治模型生產(chǎn)工作了?!彼硎?。
在工業(yè)領(lǐng)域,蘋果公司已經(jīng)在尋求與3D軟件企業(yè)合作。達(dá)索系統(tǒng)全球品牌執(zhí)行副總裁Philippe Laufer向第一財(cái)經(jīng)記者證實(shí),目前正在與蘋果公司合作,為Vision Pro開發(fā)全新的設(shè)計(jì)體驗(yàn)?!斑_(dá)索系統(tǒng)的商業(yè)客戶也是蘋果公司非常需要的?!盠aufer表示。
利亞德集團(tuán)副總裁、虛擬動(dòng)點(diǎn)CEO劉耀東對(duì)第一財(cái)經(jīng)記者表示,針對(duì)Sora大模型的一個(gè)爭議焦點(diǎn)就是它是否理解了物理世界,這就包括對(duì)空間感的理解,從目前發(fā)布的信息來看,Sora還不具備這個(gè)能力。“講白了,Sora目前有點(diǎn)像能夠生成會(huì)動(dòng)的拼圖世界,但還是二維的?!彼硎?。
北京智源人工智能研究院前理事長張宏江也對(duì)第一財(cái)經(jīng)記者表示,Sora大模型與空間計(jì)算是兩回事,并沒有涉及空間計(jì)算的概念。
浙江大學(xué)人工智能研究所所長吳飛從技術(shù)的角度介紹稱,Sora先將文本單詞和視覺子塊映射到同構(gòu)低維隱性空間,在這一低維隱性空間中引入擴(kuò)散模型,對(duì)視覺信息反復(fù)迭代,千錘百煉地挖掘文本單詞、空間子塊和時(shí)空子塊之間的關(guān)聯(lián)關(guān)系。
“這種方式好比先通過‘車同軌、書同文’,將文本、視覺等異構(gòu)信息投影到同構(gòu)空間,然后再通過‘先破壞(添加噪音)’、‘再重建(去除噪音)’的迭代手段,來洞悉視頻中各種不同單元在時(shí)間和空間中的關(guān)聯(lián)關(guān)系,從而甄別和學(xué)習(xí)紋理、運(yùn)動(dòng)、光照、遮擋、交互等復(fù)雜視覺物理規(guī)律?!眳秋w在一篇科普撰文中寫道。
但也有業(yè)內(nèi)人士認(rèn)為,Sora大模型與空間計(jì)算兩者的結(jié)合,未來可能開啟對(duì)物理世界更深入的模擬和理解的方法,加速實(shí)現(xiàn)所謂的“元宇宙”。
研究機(jī)構(gòu)Canalys分析師劉健森對(duì)第一財(cái)經(jīng)記者表示:“可以說生成式AI在類似于元宇宙的虛擬世界建設(shè)方面會(huì)有所幫助,因此Sora會(huì)在一定程度上助推Vision Pro的生態(tài)應(yīng)用,但Vision Pro最先的使用者肯定以行業(yè)開發(fā)者為主,向個(gè)人消費(fèi)者普及還需要一個(gè)過程?!?br />Canalys此前預(yù)測,Vision Pro上市后一年內(nèi)可能都會(huì)面臨缺貨,而五年后的產(chǎn)量可能會(huì)增加至1260萬臺(tái),約占iPhone當(dāng)前裝機(jī)量的1%;屆時(shí)Vision Pro用戶數(shù)量有望將達(dá)到2000萬,占MacBook裝機(jī)量的15%。
盡管近期有網(wǎng)上傳言稱Vision Pro首批用戶已有退貨的,但劉健森對(duì)第一財(cái)經(jīng),該機(jī)構(gòu)對(duì)Vision Pro的需求維持原來的預(yù)期。

【免責(zé)聲明】上海大牛網(wǎng)絡(luò)科技有限公司僅合法經(jīng)營金融島網(wǎng)絡(luò)平臺(tái),從未開展任何咨詢、委托理財(cái)業(yè)務(wù)。任何人的文章、言論僅代表其本人觀點(diǎn),與金融島無關(guān)。金融島對(duì)任何陳述、觀點(diǎn)、判斷保持中立,不對(duì)其準(zhǔn)確性、可靠性或完整性提供任何明確或暗示的保證。股市有風(fēng)險(xiǎn),請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)相應(yīng)責(zé)任。
 

結(jié)構(gòu)注釋

 
 提示:可按 Ctrl + 回車鍵(ENTER) 快速提交
當(dāng)前 1/1 頁: 1 上一頁 下一頁 [最后一頁]