當前位置:首頁(yè) > 百科 > 正文內容

李彥宏:沒(méi)有應用,AI模型一文不值

郝友蕊4個(gè)月前 (07-05)百科5
印刷廠(chǎng)直印●彩頁(yè)1000張只需要69元●名片5元每盒-更多報價(jià)?聯(lián)系電話(huà):138-1621-1622(微信同號)

7月4日周四,2024年世界人工智能大會(huì )(WAIC 2024)在上海正式開(kāi)幕。本屆大會(huì )以“以共商促共享,以善治促善智”為主題,將將聚焦全球人工智能領(lǐng)域的前沿技術(shù)和創(chuàng )新應用,致力于展示人工智能如何改變世界、塑造未來(lái)。

下午13:30開(kāi)始的產(chǎn)業(yè)發(fā)展主論壇上,吉印通創(chuàng )始人、董事長(cháng)兼CEO李彥宏出席發(fā)表主題演講。本文整理出核心觀(guān)點(diǎn)如下:

1、同樣參數規模之下,閉源模型的能力比開(kāi)源模型要更好。當你處在一個(gè)激烈競爭的市場(chǎng)環(huán)境當中的時(shí)候,你需要使讓自己的業(yè)務(wù)的效率比你的同行更高、成本比你的同行更低,這個(gè)時(shí)候,商業(yè)化的閉源模型是最能打的。

2、沒(méi)有應用,光有一個(gè)基礎模型,不管是開(kāi)源還是閉源,一文不值。所以我從去年下半年開(kāi)始講,大家不要卷模型了,要去卷應用。

3、文心大模型的日調用量最近超過(guò)了5億,代表了真實(shí)的需求,說(shuō)明有人在用、是有人真的從大模型當中獲益了,并得到了價(jià)值。

4、超級能干的應用比只看DAU的超級應用恐怕要更重要,只要對產(chǎn)業(yè)、對應用場(chǎng)景能產(chǎn)生大的增益,整體的價(jià)值就比移動(dòng)互聯(lián)網(wǎng)要大多了。

5、隨著(zhù)基礎模型的日益強大,開(kāi)發(fā)應用也越來(lái)越簡(jiǎn)單了,最簡(jiǎn)單的就是智能體,這也是我們最看好的AI應用的發(fā)展方向。

6、AI不是人類(lèi)的競爭對手,更多的是在扮演副駕的角色,還要人來(lái)把關(guān)。目前,AI已經(jīng)創(chuàng )造了一些全新的工作機會(huì )。

以下是李彥宏演講的主要內容:

各位下午好,非常高興再次來(lái)到上海參加世界人工智能大會(huì )。我是這個(gè)會(huì )議的???,但是去年因為出國沒(méi)有來(lái),所以我上一次來(lái)參加WAIC是2022年,我記得當時(shí)大會(huì )的主題是元宇宙,我當時(shí)講的主題是AIGC, 就是AI Generated Content(生成式人工智能),我認為AI的技術(shù)發(fā)展路線(xiàn)發(fā)生了方向性的改變,就是從過(guò)去的辨別式人工智能轉向了未來(lái)的生成式人工智能。

這番話(huà)當時(shí)發(fā)表于2022年的夏天,五個(gè)月之后,大家都知道,ChatGPT發(fā)布了。

后來(lái)的事情大家就更清楚,所以?xún)赡甑臅r(shí)間其實(shí)恍若隔世,就是感覺(jué)整個(gè)世界都變了,人工智能可以說(shuō)顛覆了絕大多數人的認知。

商業(yè)化的閉源模型“最能打”

2023年國內出現了百魔大戰,造成了社會(huì )資源的巨大浪費,尤其是算力的浪費,但是也使得我們追趕世界上最先進(jìn)的基礎模型的能力得到了建立。去年10月我宣布文心4.0發(fā)布的時(shí)候,我說(shuō)文心4.0的能力跟GPT-4相比毫不遜色,好多的同行還不以為然。

今天大家可以看到,國內已經(jīng)有多款閉源模型聲稱(chēng)他們已經(jīng)追平或者是超越了GPT-4的水平。注意,我這里說(shuō)的是閉源大模型,不是開(kāi)源大模型。

這也是今年以來(lái)就是爭議比較多的一個(gè)話(huà)題,有些個(gè)外行甚至混淆了模型開(kāi)源和代碼開(kāi)源這兩個(gè)概念。模型開(kāi)源你拿到的是一大堆的參數,你還是要去做SFT,還是要去做安全對齊,你不知道這些參數是怎么來(lái)的,你是無(wú)法做到“眾人拾柴火焰高”的,即使你拿到對應的源代碼,你也不知道他用了多少數據,用了什么比例的數據去訓練這些個(gè)參數,所以拿到這些東西并不能夠讓你站在巨人的肩膀上去迭代和開(kāi)發(fā)。

所以同樣參數規模之下,閉源模型的能力就比開(kāi)源模型要更好。而如果開(kāi)源想要能力追平閉源,那么它就需要有更大的參數,這就意味著(zhù)推理成本會(huì )更高,反應速度會(huì )更慢。

很多人拿開(kāi)源模型來(lái)改款,以為這樣可以更好地服務(wù)自己的個(gè)性化的應用,殊不知這樣你就創(chuàng )造了一個(gè)孤本的模型,既無(wú)法從基礎模型的持續升級當中獲益,也沒(méi)辦法跟別人去共享算力。

當然我也承認開(kāi)源模型在某些場(chǎng)景下是有它的價(jià)值的,比如說(shuō)一些學(xué)術(shù)研究,或者說(shuō)在教學(xué)領(lǐng)域,大家想要研究大模型的工作機制形成理論,這個(gè)時(shí)候可能是有價(jià)值的。

因為大家可能也經(jīng)常聽(tīng)到,就是我們覺(jué)得大模型能力很強,但是不知道為什么能力強,因為背后沒(méi)有理論來(lái)支持他,所以研究領(lǐng)域用開(kāi)源的我覺(jué)得沒(méi)問(wèn)題,但是大多數的應用場(chǎng)景開(kāi)源模型并不合適。

當你處在一個(gè)激烈競爭的市場(chǎng)環(huán)境當中的時(shí)候,你需要使讓自己的業(yè)務(wù)的效率比你的同行更高、成本比你的同行更低,這個(gè)時(shí)候,商業(yè)化的閉源模型那是最能打的。

沒(méi)有應用,AI模型一文不值

當然這些都不是最重要的,沒(méi)有應用,光有一個(gè)基礎模型,不管是開(kāi)源還是閉源,一文不值。所以我從去年下半年開(kāi)始講,大家不要卷模型了,要去卷應用。

但是我看到我們的媒體仍然是把主要的關(guān)注點(diǎn)放在了基礎模型身上,一天到晚到處去關(guān)注跑分、刷榜,誰(shuí)又超越GPT-4了?OpenAI又出來(lái)GPT-4o了等等,今天這個(gè)震撼發(fā)布,明天那個(gè)史詩(shī)級更新,但是我要問(wèn):應用在哪里?誰(shuí)從中獲益了?

應用其實(shí)離我們并不遙遠,基于基礎模型的應用在各行各業(yè)各個(gè)領(lǐng)域都已經(jīng)開(kāi)始了逐步的滲透。

兩個(gè)多月前,我們宣布文心大模型的日調用量超過(guò)了2億,最近又超過(guò)了5億。其實(shí)僅僅是兩個(gè)多月的時(shí)間,調用量發(fā)生了這么大的變化,它背后是代表了真實(shí)的需求,是有人在用、是有人真的從大模型當中獲益了,得到了價(jià)值。

比如在快遞領(lǐng)域,讓大模型幫助處理訂單,做到了一張圖、一句話(huà),寄快遞不再需要其他的繁瑣流程,時(shí)間從3分多鐘縮短到19秒,而且90%以上的售后問(wèn)題也都是由大模型來(lái)解決,效率提升非常的明顯。

再比如在小說(shuō)的創(chuàng )作領(lǐng)域,一開(kāi)始我們用開(kāi)源模型做出過(guò)一些效果,后來(lái)改用文心的輕量級模型,經(jīng)過(guò)10輪上萬(wàn)組數據的SFT和Post-pretraining(后期預訓練),結果有了明顯的提升。

最近,我們又轉到文心4.0的版本,那么僅用了數百條的數據,生成的內容無(wú)論是可用率還是優(yōu)質(zhì)率,都大大超過(guò)了文心的輕量級模型。網(wǎng)文作者們如虎添翼。

超級能干的應用比只看DAU的超級應用更重要

其實(shí)更通用的領(lǐng)域,比如說(shuō)代碼生成功能,文心、快馬這樣的軟件在各個(gè)領(lǐng)域也在逐步地滲透。

吉印通內部的話(huà),我們有30%左右的代碼已經(jīng)是用AI生成的,代碼的采用率超過(guò)了44%。

不過(guò)我們要避免掉入超級應用陷阱,覺(jué)得一定要出一個(gè)日活用戶(hù)10億的APP才叫成功。我認為這是移動(dòng)時(shí)代的思維,AI時(shí)代的規律很可能不是這樣。超級能干的應用比只看DAU的超級應用恐怕要更重要,只要對產(chǎn)業(yè)、對應用場(chǎng)景能產(chǎn)生大的增益,整體的價(jià)值就比移動(dòng)互聯(lián)網(wǎng)要大多了。

看好智能體的應用發(fā)展方向

隨著(zhù)基礎模型的日益強大,開(kāi)發(fā)應用也越來(lái)越簡(jiǎn)單了,最簡(jiǎn)單的就是智能體,這也是我們最看好的AI應用的發(fā)展方向。

制作一個(gè)好的智能體通常并不需要編碼,只要用人話(huà),把這個(gè)智能體的工作流說(shuō)清楚,再配上專(zhuān)有的知識庫,一般就是一個(gè)很有價(jià)值的智能體了,這比互聯(lián)網(wǎng)時(shí)代制作一個(gè)網(wǎng)頁(yè)還要簡(jiǎn)單。

未來(lái),在醫療、金融、教育、制造、交通、農業(yè)等等領(lǐng)域,都會(huì )依據自己的場(chǎng)景,自己特有的經(jīng)驗、規則、數據等等做出各種各樣的智能體,將來(lái)會(huì )有數以百萬(wàn)量級的智能體出現,形成龐大的智能體生態(tài)。

而搜索是智能體分發(fā)的最大的入口。剛剛過(guò)去的高考季,很多大模型公司熱衷于去寫(xiě)高考作文:我用AI寫(xiě)一個(gè)作文能得多少分兒?其實(shí)這個(gè)實(shí)用價(jià)值是不大的,人家不會(huì )允許你帶一個(gè)大模型進(jìn)去參加高考。

真正的需求是大量的考生在考完之后要報志愿,要選擇學(xué)校、選擇專(zhuān)業(yè)。他們對一所大學(xué)一個(gè)專(zhuān)業(yè)會(huì )有各種各樣的問(wèn)題,而每一個(gè)考生的情況又是不一樣的。這個(gè)時(shí)候就是需要有一個(gè)智能體來(lái)回答每一個(gè)考生專(zhuān)有的問(wèn)題。

在高峰時(shí)期,吉印通的高考智能體每天要回答超過(guò)200萬(wàn)個(gè)考生的問(wèn)題,而我們總共只有1000萬(wàn)的考生。在一天當中,有這么大比例的人在利用這個(gè)智能體,說(shuō)明AI正在以前所未有的速度向各行各業(yè)滲透。

AI只是輔助,相關(guān)工作機會(huì )正大量誕生

很多人擔心,如果我們日常的工作都讓AI去做了,人是不是就沒(méi)有工作機會(huì )了?

這種擔心不是沒(méi)有道理,但是過(guò)去這段時(shí)間,我聽(tīng)到的擔心、聽(tīng)到的抱怨很多,聽(tīng)到的建設性的意見(jiàn)比較少,很少有人去致力于發(fā)掘生成式AI帶來(lái)的新的工作機會(huì ),我在這兒算是拋磚引玉吧。

我覺(jué)得,一方面AI更多的是在扮演副駕的角色,還要人來(lái)把關(guān),AI只是輔助人工作,而不是替代人工作,它讓人的工作效率更高,質(zhì)量更好。另外一方面,我們也看到有一些全新的工作機會(huì )開(kāi)始冒出來(lái)了。

比如數據標注師,過(guò)去幾年我們幫助全國20多個(gè)城市落地了數據標注中心,提供了大量的新的就業(yè)崗位;再比如提示詞工程師,以后不用編程了,但是做好一個(gè)智能體還需要把工作流說(shuō)清楚,這里頭要有很強的邏輯性,要用提示詞對模型進(jìn)行調校。

隨著(zhù)智能體的大量涌現,這種工作需求也會(huì )飆升。這些個(gè)工作機會(huì )通常門(mén)檻并不高,你做的一般也能夠養家活口,做得好的話(huà),那上限可以年薪百萬(wàn)。

自人類(lèi)文明誕生以來(lái),永不停止的創(chuàng )新,就是刻在我們DNA當中的,從石器時(shí)代的手斧,到移動(dòng)時(shí)代的手機,再到AI時(shí)代的大模型,人類(lèi)不斷創(chuàng )造各種工具來(lái)改善生活、提高生產(chǎn)力,但是它們永遠只是工具,只有在被人類(lèi)所使用的時(shí)候才有價(jià)值。

我們堅定地相信,AI不是人類(lèi)的競爭對手,構建和應用人工智能技術(shù)是為了滿(mǎn)足人的需求,增強人的能力,讓人類(lèi)的生活更美好。謝謝。

收藏0

發(fā)表評論

訪(fǎng)客

看不清,換一張

◎歡迎參與討論,請在這里發(fā)表您的看法和觀(guān)點(diǎn)。
亚洲午夜av天堂_亚洲产国久久无码_亚洲欧美制服丝袜精品久久_91精品成人国产在线不卡