主題: AI領(lǐng)域又傳出新消息!騰訊、清華大學(xué)、港科大有大動(dòng)作!
2024-03-16 11:09:58          
功能: [發(fā)表文章] [回復(fù)] [快速回復(fù)] [進(jìn)入實(shí)時(shí)在線交流平臺(tái) #1
 
 
頭銜:金融島總管理員
昵稱(chēng):花臉
發(fā)帖數(shù):64918
回帖數(shù):2132
可用積分?jǐn)?shù):15888056
注冊(cè)日期:2011-01-06
最后登陸:2024-10-25
主題:AI領(lǐng)域又傳出新消息!騰訊、清華大學(xué)、港科大有大動(dòng)作!

證券時(shí)報(bào)網(wǎng)
AI領(lǐng)域,又傳出新消息!

券商中國(guó)記者獲悉,3月15日,騰訊和清華大學(xué)、香港科技大學(xué)聯(lián)合推出全新圖生視頻大模型“Follow-Your-Click”,基于輸入模型的圖片,只需點(diǎn)擊對(duì)應(yīng)區(qū)域,加上少量提示詞,就可以讓圖片中原本靜態(tài)的區(qū)域動(dòng)起來(lái),一鍵轉(zhuǎn)換成視頻。

據(jù)了解,圖像到視頻生成的技術(shù)在電影內(nèi)容制作、增強(qiáng)現(xiàn)實(shí)、游戲制作以及廣告等多個(gè)行業(yè)的AIGC應(yīng)用上有著廣泛前景,是2024年最熱門(mén)的AI技術(shù)之一。有研究機(jī)構(gòu)指出,國(guó)內(nèi)外大廠AI視頻生成不斷突破,未來(lái)AI+趨勢(shì)勢(shì)不可擋。

那么,哪些領(lǐng)域?qū)⑹芤婺兀?br />
圖生視頻大模型

3月15日,騰訊和清華大學(xué)、香港科技大學(xué)聯(lián)合推出全新圖生視頻模型“Follow-Your-Click”,基于輸入模型的圖片,只需點(diǎn)擊對(duì)應(yīng)區(qū)域,加上少量提示詞,就可以讓圖片中原本靜態(tài)的區(qū)域動(dòng)起來(lái),一鍵轉(zhuǎn)換成視頻。

當(dāng)前的圖生視頻大模型中,一般的生成方法不僅需要用戶在提示詞中描述運(yùn)動(dòng)區(qū)域,還需要提供運(yùn)動(dòng)指令的詳細(xì)描述,過(guò)程較為復(fù)雜。另外,從生成的效果來(lái)看,現(xiàn)有圖像生成視頻技術(shù)在移動(dòng)圖像的指定部分上缺乏控制,生成的視頻往往需要移動(dòng)整個(gè)場(chǎng)景,而不是圖像上的某一個(gè)區(qū)域,精準(zhǔn)度和靈活性上有所欠缺。

為了解決這些問(wèn)題,騰訊混元大模型團(tuán)隊(duì)、清華和港科大的聯(lián)合項(xiàng)目組提出了更實(shí)用和可控的圖像到視頻生成模型Follow-Your-Click,帶來(lái)更加便捷的交互,也讓圖片“一鍵點(diǎn),萬(wàn)物動(dòng)”成為現(xiàn)實(shí)。

據(jù)了解,騰訊混元大模型團(tuán)隊(duì),正在持續(xù)研究和探索多模態(tài)技術(shù),擁有行業(yè)領(lǐng)先的視頻生成能力。此前,騰訊混元大模型作為技術(shù)合作伙伴,支持《人民日?qǐng)?bào)》打造原創(chuàng)視頻《江山如此多嬌》,生成中國(guó)大美河山的精美視頻片段,展示出了較強(qiáng)的內(nèi)容理解、邏輯推理和畫(huà)面生成能力。

騰訊混元大模型是騰訊自研的通用大語(yǔ)言模型,于去年9月7日首次公開(kāi)亮相,作為騰訊全鏈路自研的大模型,騰訊混元定位為“實(shí)用級(jí)”,主要聚焦業(yè)務(wù)場(chǎng)景和行業(yè)應(yīng)用。去年5月份,騰訊董事會(huì)主席兼首席執(zhí)行官馬化騰曾表示,大模型是百年不遇的、類(lèi)似工業(yè)革命一樣的機(jī)遇。對(duì)于工業(yè)革命來(lái)講,早一個(gè)月把電燈泡拿出來(lái)在長(zhǎng)的時(shí)間跨度上來(lái)看是不那么重要的。關(guān)鍵還是要把底層的算法、算力和數(shù)據(jù)扎扎實(shí)實(shí)做好,而且更關(guān)鍵的是場(chǎng)景落地。

截至2023年12月,作為實(shí)用級(jí)的通用大模型,騰訊內(nèi)部已有超過(guò)300項(xiàng)業(yè)務(wù)和應(yīng)用場(chǎng)景接入騰訊混元大模型內(nèi)測(cè),包括騰訊會(huì)議、騰訊文檔、企業(yè)微信、騰訊廣告和微信搜一搜等。

新技術(shù)涌現(xiàn),哪些領(lǐng)域最受益?

值得關(guān)注的是,近期,在AI視頻生成領(lǐng)域,國(guó)內(nèi)外都涌現(xiàn)出不少新技術(shù)。

2月15日,OpenAI在全球AI生成視頻領(lǐng)域扔出一枚爆炸性消息。當(dāng)日,該公司發(fā)布了一款名為Sora的“文本生成視頻”模型,并向部分研究人員和創(chuàng)作者開(kāi)放Sora的訪問(wèn)權(quán)限。Sora除了可以根據(jù)文字描述生成視頻外,還可以根據(jù)現(xiàn)有的圖片生成視頻,目前可生成的視頻長(zhǎng)度在1分鐘左右;而且,視頻可具有多個(gè)角色、特定類(lèi)型的運(yùn)動(dòng)、精確主題和背景細(xì)節(jié)等復(fù)雜場(chǎng)景。Sora視頻生成模型,在清晰度、連貫性、理解能力、一致性、時(shí)長(zhǎng)方面都產(chǎn)生較大突破。隨后,Sora引爆網(wǎng)絡(luò),資本市場(chǎng)上AI概念股也被連番炒作。

緊跟Sora,2月26日,谷歌Deep Mind團(tuán)隊(duì)發(fā)布了110億參數(shù)的AI基礎(chǔ)世界模型Genie。僅用一張圖片,便可生成一個(gè)交互式世界,生成的世界“動(dòng)作可控”,用戶可以其中逐幀行動(dòng)。谷歌表示,Genie開(kāi)啟了“圖/文生成交互世界”的時(shí)代,還將成為實(shí)現(xiàn)通用AI Agent的催化劑。

平安證券表示,OpenAI、谷歌相繼發(fā)布多模態(tài)大模型Sora、Genie,AGI浪潮或?qū)⒓铀俚絹?lái)。

長(zhǎng)江證券指出,Genie定義生成式AI全新范式,重塑生成式交互環(huán)境格局。1)Genie或使視頻游戲領(lǐng)域迎來(lái)變革:Genie通過(guò)單個(gè)圖片、照片、草圖提示即可轉(zhuǎn)換為用戶可玩的游戲,生成交互式、動(dòng)作可控的環(huán)境。生成的游戲可根據(jù)玩家的指令動(dòng)態(tài)地生成游戲的每個(gè)新幀,這種革新的交互方式為游戲玩家?guī)?lái)了新的體驗(yàn)感,未來(lái)有望一鍵生成可玩的游戲世界。2)機(jī)器人領(lǐng)域的應(yīng)用為培養(yǎng)通用智能體開(kāi)辟新途徑:Genie能夠掌握一組統(tǒng)一的動(dòng)作模式,通過(guò)學(xué)習(xí)真實(shí)的機(jī)器人手臂操縱各種家用物體的視頻,它領(lǐng)會(huì)了機(jī)器人手臂所做動(dòng)作以及如何控制它,并且學(xué)會(huì)的動(dòng)作可應(yīng)用于真實(shí)世界。由于方法通用,Genie可推廣于任何類(lèi)型領(lǐng)域從而讓未來(lái)的AI智能體在不斷擴(kuò)展的新世界中進(jìn)行訓(xùn)練。

2月28日,阿里巴巴智能計(jì)算研究所發(fā)布了一款全新的生成式AI模型EMO(Emote Portrait Alive)。EMO僅需一張人物肖像照片和音頻,就可以讓照片中的人物按照音頻內(nèi)容“張嘴”唱歌、說(shuō)話,且口型基本一致,面部表情和頭部姿態(tài)非常自然。EMO為多模態(tài)領(lǐng)域的視頻AI帶來(lái)新玩法:1)不同于文生視頻模型Sora,EMO主攻圖+音頻生成視頻的方向:輸入單張照片+任意語(yǔ)速的人聲音頻,EMO即可自動(dòng)生成具有豐富面部表情和頭部姿勢(shì)的聲音肖像視頻。2)表現(xiàn)優(yōu)于同類(lèi)產(chǎn)品PIKA:由于受限于產(chǎn)品架構(gòu),PIKA只能分段生成3秒的唇形同步視頻,且僅能實(shí)現(xiàn)唇部配合音頻發(fā)生運(yùn)動(dòng)的功能,而EMO可根據(jù)音頻時(shí)長(zhǎng),生成對(duì)應(yīng)時(shí)長(zhǎng)的視頻,并保持角色身份的一致性。相較之下,EMO更具靈活性,生成的視頻也更自然、更富有情感。

長(zhǎng)江證券表示,海外大廠在AI視頻生成領(lǐng)域掀起新浪潮,我國(guó)也在不斷加速追趕步伐。AI視頻賽道涌現(xiàn)新玩法,未來(lái)AI+趨勢(shì)勢(shì)不可擋,建議關(guān)注AI+IP/游戲/影視/電商/廣告商業(yè)化落地投資機(jī)會(huì)。國(guó)泰君安認(rèn)為,隨著AI視頻類(lèi)模型的成熟,影視制作的全流程均有望受益于AI模型迭代,影視產(chǎn)業(yè)望深度受益于AI發(fā)展。

平安證券指出,當(dāng)前,全球范圍內(nèi)大模型領(lǐng)域的競(jìng)爭(zhēng)依然白熱化,這將持續(xù)拔升大模型的整體能力水平。大模型需要大算力,大模型算法的迭代升級(jí)將為全球和中國(guó)AI算力市場(chǎng)的增長(zhǎng)提供強(qiáng)勁動(dòng)力。在美國(guó)對(duì)華半導(dǎo)體出口管制升級(jí)的背景下,我國(guó)國(guó)產(chǎn)AI芯片產(chǎn)業(yè)鏈將加快成熟,相關(guān)AI芯片和服務(wù)器廠商將深度受益。另外,在應(yīng)用端,我國(guó)國(guó)產(chǎn)大模型能力持續(xù)升級(jí),AIGC產(chǎn)業(yè)未來(lái)發(fā)展前景廣闊。海通證券則表示,隨著國(guó)內(nèi)外數(shù)字經(jīng)濟(jì)的蓬勃發(fā)展,AI、智算需求高速增長(zhǎng),相關(guān)化工新材料的需求也有望增加。

【免責(zé)聲明】上海大牛網(wǎng)絡(luò)科技有限公司僅合法經(jīng)營(yíng)金融島網(wǎng)絡(luò)平臺(tái),從未開(kāi)展任何咨詢(xún)、委托理財(cái)業(yè)務(wù)。任何人的文章、言論僅代表其本人觀點(diǎn),與金融島無(wú)關(guān)。金融島對(duì)任何陳述、觀點(diǎn)、判斷保持中立,不對(duì)其準(zhǔn)確性、可靠性或完整性提供任何明確或暗示的保證。股市有風(fēng)險(xiǎn),請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)相應(yīng)責(zé)任。
 

結(jié)構(gòu)注釋

 
 提示:可按 Ctrl + 回車(chē)鍵(ENTER) 快速提交
當(dāng)前 1/1 頁(yè): 1 上一頁(yè) 下一頁(yè) [最后一頁(yè)]