趨勢一:將會有更多多模態(tài)大模型
在最新公布的各種大模型中,幾乎都離不開多模態(tài),從GPT-4V(有視覺功能的 GPT-4),到AI視頻生成工具Pika 1.0,再到谷歌發(fā)布的大模型Gemini,等等。
為什么呢?在一些典型AI應用中,多模態(tài)大模型都表現(xiàn)出極強的可交互性,可幫助開發(fā)者與最終用戶精準理解輸入信息的上下文關聯(lián)和隱含信息。在行業(yè)實踐中,多模態(tài)大模型能通過對多維度信息的強力感知,持續(xù)強化推理能力,拓展服務邊界,提升應用場景中的全面性和可靠性。與語言/視覺大模型一樣,多模態(tài)大模型也是當前大模型訓練和開發(fā)的重要方向。
趨勢二:大模型在端側部署加速
隨著大模型小型化、場景化需求增加,推理將逐步從云端擴展向端側。如AI PC,繼英特爾推出首個AI PC處理器后,聯(lián)想集團、惠普、宏碁等廠商相繼發(fā)布多款AI PC新品。聯(lián)想表示,有超10款筆記本已經(jīng)可以本地運行AI大模型,還有一批新品將陸續(xù)上市。
如AI手機,2023年下半年開始,小米、OPPO、vivo等手機廠商紛紛入場,在新系統(tǒng)中增加大模型能力。到2024年1月,中國手機市場Top5中,除蘋果之外,已經(jīng)全數(shù)發(fā)布自有端側大模型產(chǎn)品。大模型在終端側的部署加速,無論是在PC、手機,還是其他終端產(chǎn)品上。
趨勢三:大模型不斷深入垂直行業(yè)領域
三六零集團創(chuàng)始人周鴻祎近日在某活動上表示,千億大模型是通才,但是在單項技能上,經(jīng)過專業(yè)訓練的垂直大模型只強不弱,面向企業(yè)級場景的百億參數(shù)大模型成本更低,性價比更高,更適用于企業(yè)級場景。
垂直領域的大模型更專注于解決具體行業(yè)問題,它更能滿足特定行業(yè)和領域的需求,具有更高的應用價值和商業(yè)潛力。根據(jù)機構調(diào)研,通用大模型趨于收斂,垂直行業(yè)應用成為大模型產(chǎn)業(yè)落地的關鍵賽道。大模型發(fā)展呈現(xiàn)出從技術到產(chǎn)品、再到商業(yè)化應用的發(fā)展路徑,并不斷深入垂直行業(yè)領域。
趨勢四:智能化應用將呈現(xiàn)爆發(fā)式增長
2024年被認為是人工智能的應用之年,智能化應用將呈現(xiàn)爆發(fā)式增長,產(chǎn)業(yè)化和商業(yè)化進程不斷加速。從ChatGPTS應用商店開始,到國內(nèi)智譜AI智能體商店、釘釘AI助理平臺,可以說是群雄逐鹿。根據(jù)IDC的預測,到2024年全球?qū)⒂楷F(xiàn)出超過5億個新應用,這相當于過去40年間出現(xiàn)的應用數(shù)總和。
就今年1月OpenAI宣布上線的GPT Store應用商店而言,它與蘋果App Store商店類似。GPT Store目前已有超過300萬個自定義版本的ChatGPT應用。對于開發(fā)者收入方面,OpenAI表示,在今年第一季度,其將推出GPT創(chuàng)建者收入計劃。這意味著以ChatGPT為代表的大模型在接下來商業(yè)化進程將會得到加速。
趨勢五:生成式人工智能模式將不斷擴展
過去一到兩年時間,生成式人工智能不斷突破,從文生圖,到文生音頻、視頻、代碼等。在文生視頻方面,雖然已經(jīng)取得重大進步,它已經(jīng)能夠在某些場景中進行使用,然而對于一些傳媒行業(yè)來說,現(xiàn)在的文生視頻還沒有辦法達到讓人滿意的程度,不過接下來會持續(xù)有突破。
同時,除了文本、代碼、圖像、視頻和音頻之外,生成式人工智能將擁抱更多身臨其境的模式,包括調(diào)動三維、嗅覺和味覺等其他感知,幫助科學界研究蛋白質(zhì)結構和材料。如,由谷歌Deepmind開發(fā)的GNoME模型已經(jīng)在材料科學領域取得了突破性進展,發(fā)現(xiàn)了新的晶體結構,它將為計算機帶來更好的電池。
趨勢六:AI Agent成為AI應用主體形式
AI Agent通常被視為一種融合感知、分析、決策和執(zhí)行能力的智能體,它可以具備相當顯著的主動性,成為人類的理想智能助手。例如,AI Agent可以根據(jù)個人在線互動和參與事務處置時的信息,了解和記憶個體的興趣、偏好、日常習慣,識別個體的意圖,主動提出建議,并協(xié)調(diào)多個應用程序去完成任務。
調(diào)研機構數(shù)據(jù)顯示,絕大多數(shù)企業(yè)認為AI Agent是AI發(fā)展的確定性方向,有50%的企業(yè)已經(jīng)在某項工作中進行AI Agent試點,另有34%的企業(yè)正在制定AI Agent的應用計劃。
趨勢七:具身智能機器人滲透率加速提升
在具身智能狀態(tài)下,機器人具備自主學習和計劃能力,遇到障礙和困難可以自主反應、快速解決。行業(yè)人士認為,人形機器人實際上是一個載體,當大模型和人形機器人相結合時,機器人可以幫助AI大模型感知物理世界,操作環(huán)境上下文;機器人利用多模態(tài)感知控制自己的身體,完成復雜的任務。
數(shù)據(jù)顯示,2023年至2025年期間,可以結合通用大模型,讓機器人能夠在工業(yè)和商業(yè)方面實現(xiàn)服務;到2025至2030年,機器人將更智能化,會涉及更多領域的場景應用,如知識陪伴和家庭陪護,機器人能夠?qū)崿F(xiàn)自主感知、認知和決策。
趨勢八:大模型讓數(shù)字人應用加速
大模型的出現(xiàn),給數(shù)字人產(chǎn)業(yè)帶來了根本性改變。傳統(tǒng)數(shù)字人技術主要依靠預設參數(shù)和有限的模型訓練,大模型技術則為其提供了近乎無限的訓練參數(shù)和自主生成能力,使數(shù)字人更為真實多樣。大模型在很大程度上解決了數(shù)字人的自然語言理解能力。
伴隨著技術的長足進步,數(shù)字人產(chǎn)品和服務作為鏈接軟硬件的入口級產(chǎn)品,正以更快的速度融入金融、物流、能源和建筑等領域,扮演主播、代言人、客服和智能助理等角色。也許在不久的將來,我們是身處陌生場所時,人類不再是第一求助對象,沒有語言障礙的數(shù)字人將會是我們更好的選擇。
趨勢九:智算中心成為關鍵基礎設施
算力是設備通過處理數(shù)據(jù),實現(xiàn)特定結果輸出的計算能力。算力可以分為通用算力、智能算力和超算算力。早前通用算力占整體算力的比重達到90%以上,近些年隨著人工智能技術的發(fā)展,智能算力規(guī)模迅速增長。2023年來大模型迅猛發(fā)展,更是讓智算中心成為建設的重點,各地方和企業(yè)都在積極建設智算中心來支持大模型的訓練和部署。
同時,隨著專有領域的計算需求提升,AI芯片追求更高的性能和更低的功耗,這將推動AI芯片的多樣性和生態(tài)豐富性不斷提升。
趨勢十:合成數(shù)據(jù)打破AI訓練數(shù)據(jù)瓶頸
數(shù)據(jù)瓶頸指的是可用于訓練AI的高質(zhì)量數(shù)據(jù)的有限性,合成數(shù)據(jù)有望打破這一瓶頸。合成數(shù)據(jù)是在模仿真實數(shù)據(jù)的基礎上,由機器學習模型利用數(shù)學和統(tǒng)計科學原理合成的數(shù)據(jù)。
有論文表示,模型的規(guī)模至少要達到620億參數(shù)量后,才可能訓練出“思維鏈”能力,即進行分步驟的邏輯推理。但人類產(chǎn)生的不重復、可供訓練的優(yōu)質(zhì)數(shù)據(jù)并沒有這么多。而使用ChatGPT等生成式人工智能以前所未有的數(shù)量產(chǎn)生高質(zhì)量合成數(shù)據(jù),未來的AI將由此獲得更高的性能。