當前位置:首頁(yè) > 百科 > 正文內容

2024 WAIC|AI視頻迎來(lái)寒武紀爆發(fā),專(zhuān)家稱(chēng)行業(yè)將3年走完百年影史

賀州數碼印刷4個(gè)月前 (07-05)百科5
印刷廠(chǎng)直印●彩頁(yè)1000張只需要69元●名片5元每盒-更多報價(jià)?聯(lián)系電話(huà):138-1621-1622(微信同號)

藍鯨新聞7月6日訊(記者 湯詩(shī)韻)今年2月,OpenAI的首款文生視頻模型Sora橫空出世。樣片里大膽的一鏡到底和驚人的人物場(chǎng)景一致性轟動(dòng)了整個(gè)行業(yè),視頻生成隨之成為今年最熱的技術(shù)與賽道之一。在國內,AI視頻領(lǐng)域也將迎來(lái)寒武紀大爆發(fā)。

AI視頻生成大爆發(fā), 大量創(chuàng )作者跟風(fēng)整活

視頻生成技術(shù)及應用是今年世界人工智能大會(huì )(WAIC)最受業(yè)內外關(guān)注的話(huà)題之一。昨日舉行的論壇上,有嘉賓提及近日全網(wǎng)創(chuàng )作者運用AI視頻整活的風(fēng)潮。

你常??梢运⒌秸鐙至鳒I躺在床上生吞臘肉,劉華強和賣(mài)瓜攤販化干戈為擁抱,梗圖中的地鐵老人一口吞下手機。這些刻意搞怪的創(chuàng )作都是依靠各類(lèi)AI視頻生成模型實(shí)現的。

2024 WAIC|AI視頻迎來(lái)寒武紀爆發(fā),專(zhuān)家稱(chēng)行業(yè)將3年走完百年影史

剛剛過(guò)去的6月,一眾AI視頻生成模型密集涌現??焓挚伸`、Luma AI以及Runway的Gen-3 Alpha等爆款模型接連發(fā)布,引發(fā)現象級圍觀(guān)。

其中快手的AI視頻生成模型可靈被稱(chēng)作中國版Sora。該模型視頻生成時(shí)長(cháng)直接趕超Sora達到120秒,目前已開(kāi)放圖生視頻、視頻續寫(xiě)、鏡頭控制等功能。

2024 WAIC|AI視頻迎來(lái)寒武紀爆發(fā),專(zhuān)家稱(chēng)行業(yè)將3年走完百年影史

可靈生成的兔子看報紙/截圖

在內測用戶(hù)上傳的生成視頻中,可靈的表現令人驚喜,它能夠生成大幅度的合理運動(dòng),并模擬物理世界特性等。獵豹移動(dòng)董事長(cháng)兼CEO傅盛公開(kāi)測評稱(chēng),“我認為這個(gè)產(chǎn)品今天在我們能使用的范疇內,就是全世界第一,這也是國產(chǎn)人工智能領(lǐng)域的又一項重大突破”。

今年以前,文生視頻是多模態(tài)AIGC的圣杯,優(yōu)化迭代速度較慢。而僅僅過(guò)去一年,AI生成的吃面條類(lèi)視頻已從鬼畜素材級別變得流暢自然。

2024 WAIC|AI視頻迎來(lái)寒武紀爆發(fā),專(zhuān)家稱(chēng)行業(yè)將3年走完百年影史

視頻AI生成漸成熱門(mén)賽道。美圖公司集團高級副總裁陳劍毅在WAIC論壇上表示,讓照片動(dòng)起來(lái)的玩法,在不遠的將來(lái)大概半年到一年內肯定會(huì )成為所有社交平臺的標配能力,和現在所有平臺都有濾鏡、美顏能力是一樣的。

AI視頻發(fā)展到什么程度了?宣傳很好看,實(shí)際待考驗

現階段的視頻生成模型并不完美,常見(jiàn)缺陷大多表現在可控性差上。比如人物的形象及視覺(jué)風(fēng)格、角色場(chǎng)景在生成輸出時(shí)不能保持穩定一致。運動(dòng)軌跡、光影效果、口語(yǔ)自然度、音效可控性等都有待提升。

上海交通大學(xué)電子系教授倪冰冰在昨日的論壇中指出,我們現在生成類(lèi)算法包括視頻、圖像、三維的東西,會(huì )遇到很多結構性的問(wèn)題和細節性問(wèn)題。比如通常會(huì )多生長(cháng)出一樣東西或者少一樣東西,或者手穿模到人身體里,有時(shí)候衣服上的LOGO變得很模糊了。

其直言,AI文生視頻技術(shù)可以有效提高生產(chǎn)力,但若和成熟的影視制作工業(yè)相比,算是以卵擊石。

2024 WAIC|AI視頻迎來(lái)寒武紀爆發(fā),專(zhuān)家稱(chēng)行業(yè)將3年走完百年影史

一些大模型生成的體操表演視頻截圖

陳劍毅同樣預測道,當下的AI視頻生成技術(shù)還在早期階段,類(lèi)似電影行業(yè)1分鐘黑白電影的起點(diǎn)。該技術(shù)會(huì )經(jīng)歷快速演變,大概3—5年就能走完電影技術(shù)百年發(fā)展史。目前來(lái)看,文生視頻有望在網(wǎng)文小說(shuō)和教學(xué)內容領(lǐng)域率先落地。

井英科技CEO朱江透露,他們之前花三年時(shí)間自主研發(fā)了一個(gè)視頻生成模型,落地場(chǎng)景就是用AI生成短劇視頻。日前,井英科技的AI短劇應用Reel.AI此前已在海外市場(chǎng)發(fā)布,其中部分短劇的主角是AI生成和配音的白人演員。此前藍鯨新聞曾報道,海外短劇制作成本較國內翻倍,單劇或需要15萬(wàn)美元,AI生成或是控制成本的方式之一。

關(guān)于該項技術(shù)的應用,還有一個(gè)更現實(shí)的難題。AI生成內容的關(guān)鍵吸引力在于新奇,那么正如陳劍毅所說(shuō),“AI類(lèi)視頻很容易看膩,短期內不太存在新的平臺級產(chǎn)品的機會(huì )?!?/p>

因此AI生成視頻終究是一種工具,內容才是競爭的根本。

盛趣游戲技術(shù)中心AI負責人李鋒舉例稱(chēng),文生圖、文生視頻等技術(shù)可能會(huì )提升游戲立項和開(kāi)發(fā)的效率,比如有助于游戲概念表述,方便策劃、美術(shù)和程序之間交流理解。但另一方面,玩家口味多變,AI會(huì )生成哪些創(chuàng )意、如何及時(shí)修改創(chuàng )意才是開(kāi)發(fā)者更看重的部分。

大廠(chǎng)扎堆入局,但商業(yè)化問(wèn)題依舊難解

Sora引爆賽道后,國內互聯(lián)網(wǎng)大廠(chǎng)加速布局視頻生成領(lǐng)域。

今年2月,抖音原CEO張楠轉任剪映負責人,外界認為這場(chǎng)調任體現了字節跳動(dòng)在文生視頻大模型上的期望。3個(gè)月后,字節旗下AI創(chuàng )作工具即夢(mèng)(原名Dreamina)上線(xiàn)AI作圖和視頻生成功能。伴隨快手可靈上線(xiàn),抖快兩家已在A(yíng)I領(lǐng)域正面對壘。此外,阿*達摩院、吉印通、騰訊、美圖等大廠(chǎng)均已加入文生視頻混戰。

在今年的人工智能大會(huì )上,如何商業(yè)化是頻頻被討論的話(huà)題。業(yè)內認為AI視頻模型商業(yè)化至少需要解決兩個(gè)問(wèn)題,一是前文曾提及的技術(shù)層面,其二則是高昂的成本。

據垂媒量子位援引專(zhuān)家預估,OpenAI推出的Sora在訓練環(huán)節大約需要在4200-10500張NVIDIA H100上訓練1個(gè)月,并且當模型生成到推理環(huán)節以后,計算成本還將迅速超過(guò)訓練環(huán)節。因此其顯然不太可能依靠文生圖產(chǎn)品同等水平的會(huì )員費覆蓋成本。

倪冰冰教授認為:生成式人工智能目前階段性的成功是以算力與數據的過(guò)度消耗為代價(jià)的,因此未來(lái)我們需要有一些新的架構、新的計算方式或者新的底層技術(shù)來(lái)支撐更加優(yōu)質(zhì)高效的媒體新質(zhì)生產(chǎn)力。

關(guān)于未來(lái),可能沒(méi)人說(shuō)得準。井英科技CEO朱江表示,我們把這一代的AI生成式時(shí)代類(lèi)比成寒武紀生命大爆發(fā)的時(shí)候。在當時(shí),其實(shí)很難預測哪一個(gè)物種未來(lái)會(huì )生存下去。比如哪一類(lèi)生物突然進(jìn)化出了眼睛,可能取得了階段性?xún)?yōu)勢。

“但其中有兩點(diǎn)比較確定?!敝旖偨Y稱(chēng):第一,在新的生成式時(shí)代保持Tire1技術(shù)的水準和理解;第二,入局很重要,關(guān)鍵要關(guān)注機會(huì )在哪里、客戶(hù)需求是什么,想賺錢(qián)首先得留在牌桌上。

收藏0

發(fā)表評論

訪(fǎng)客

看不清,換一張

◎歡迎參與討論,請在這里發(fā)表您的看法和觀(guān)點(diǎn)。
亚洲午夜av天堂_亚洲产国久久无码_亚洲欧美制服丝袜精品久久_91精品成人国产在线不卡