當前位置:首頁 >  科技 >  互聯(lián)網(wǎng) >  正文

大模型應用瘋狂加速,洗牌卻在靜悄悄進行了

 2023-10-07 18:00  來源: A5專欄   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

在被譽為“科技企業(yè)營銷圣經”的《跨越鴻溝》一書中,杰弗里·摩爾寫道:“高科技產品面世過程中,最危險、最關鍵的一點,就是由少數(shù)有遠見者所主宰的早期市場,向實用主義者占支配地位的主流市場過渡。”此刻,狂飆突進已半年有余的國內生成式人工智能(AIGC)市場,正面臨著這個關鍵的過渡。

截至8月底,首批8家AI大模型企業(yè)通過備案。與上半年“甚囂塵上”的行業(yè)境況不同,具備實力且具備滿腔“產業(yè)抱負”的實力型玩家,總是姍姍來遲,但卻總是能夠一鳴驚人,為產業(yè)的大規(guī)模應用創(chuàng)造機會。目前來看,隨著未來不斷有新的企業(yè)通過備案,“大模型+”的應用拐點正在到來。

“大模型+”應用拐點加速到來

8月份剛剛過去,9月初百度就迫不及待地對外公布了文心一言大模型開源。與此同時,“姍姍來遲”的騰訊混元大模型,一亮相便“秀”起了“肌肉”,科大訊飛與華為合作發(fā)布“星火一體機”,進一步把大模型端側應用擺在了臺面上。一波接一波的行業(yè)浪潮席卷而來,正推動整個“大模型+”應用時代加速到來。

首先,大模型從C端應用逐漸轉向B端應用領域,以“實用”為導向的大模型日漸成為行業(yè)趨勢。自從去年12月ChatGPT,在短短一個月之內實現(xiàn)月活破億之后,圍繞整個C端市場的AI大模型玩家如百度等,就開始大規(guī)模地涌入該領域,一時之間C端大模型應用迎來了外界的一致關注。但進入下半年以后,市面上越來越多的“面向B端”的應用開始出現(xiàn),更加“實用”的行業(yè)大模型也在成群結隊地出現(xiàn),大大加速了生成式AI產業(yè)化的進程。比如,京東發(fā)布了言犀大模型、京醫(yī)千詢大模型,攜程發(fā)布了攜程問道大模型,網(wǎng)易有道發(fā)布了基于教育的子曰大模型,用友發(fā)布了用友GPT大模型等等。

相比通用大模型廠商而言,垂直大模型廠商在相關行業(yè)深耕已久,因而在尋找產業(yè)機會方面往往走得更加深入。以網(wǎng)易有道、京東兩家為例,網(wǎng)易有道在教育領域深耕已久,它在長期深耕行業(yè)的過程中,不僅積累了龐大的用戶和教育行業(yè)數(shù)據(jù),還積累了相對應的高質量數(shù)據(jù),這使其在做教育大模型過程中,擁有更多比較優(yōu)勢。無獨有偶,京東在零售、大健康領域廣有布局,這使其在構建產業(yè)大模型和京醫(yī)大模型方面,擁有堅實根基;而攜程則在文旅行業(yè)深耕已久,積累了廣泛的文旅產業(yè)鏈數(shù)據(jù)和資源。

顯然,相比通用大模型廠商而言,圍繞垂直領域的行業(yè)大模型,不僅可以依靠專業(yè)數(shù)據(jù)讓大模型更加“實用”,還可以在特定領域發(fā)揮獨特作用,幫助行業(yè)盡快完成數(shù)字化轉型。

其次,具備通用能力的大型云服務企業(yè),正在加速與各路行業(yè)大模型企業(yè)展開合作,新的大模型生產機制正在成型。目前業(yè)內包括百度、騰訊、阿里、華為等主要云廠商,都紛紛依托自身的技術優(yōu)勢、團隊優(yōu)勢和資金支持,在通用大模型領域實現(xiàn)搶跑。除此之外,各主要廠商還聯(lián)合行業(yè)頭部企業(yè),推出行業(yè)大模型解決方案。

比如,騰訊云聯(lián)合行業(yè)頭部企業(yè),已為文旅、政務、金融等10余個行業(yè),提供了50多個大模型行業(yè)解決方案。華為旗下盤古大模型,更是可以提供5個基礎大模型+N個行業(yè)大模型+X個場景模型的三層解耦架構,目前已經應用到了鐵路、礦山、能源、氣象、政務等諸多領域。阿里云更是對外開放了“通義千問”的全部能力,幫助企業(yè)結合自身的行業(yè)知識和應用場景,訓練自己的企業(yè)大模型;加上目前已經開源的文心一言,由大的云平臺提供包括云服務、算力、通用大模型工具支持等基礎設施,各行業(yè)頭部企業(yè)提供專業(yè)經驗和數(shù)據(jù)訓練的大模型生產機制已經基本成型。

志在必得的騰訊

對于大模型的發(fā)展,騰訊高層顯然很早之前就已經定下了調子,但其推出的時間卻在一眾巨頭中最晚。在上半年如火如荼的大模型混戰(zhàn)中,騰訊的大模型在業(yè)內一直是“只聞其聲、不見其名”的存在。但從9月其正式面世之后的外界反應來看,此前“默默無聞”的騰訊大模型,更多是在“厚積薄發(fā)”。

9月7日騰訊正式對外發(fā)布了騰訊混元大模型,據(jù)了解該模型擁有超千億參數(shù)規(guī)模,預訓練語料超過2萬億Tokens,并已接入騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔等50多個騰訊業(yè)務。而且在國家公布的首批大模型廠商中,騰訊混元大模型赫然在列。同時,騰訊混元大模型還宣布對外開放,千行百業(yè)的人都可以通過API調用混元,或者將其作為產業(yè)底座,為不同產業(yè)場景構建大模型應用,不難看出騰訊對大模型的“志在必得”。

首先,騰訊構建了“更強”的“探真”技術方法,這使其具備更強的信息可信度,極大增強了大模型自身的實用性?;谌W(wǎng)的數(shù)據(jù)檢索和生成,是大模型的核心能力之一。值得一提的是,無論是基于GPT-3.5還是國內其他大模型,源于錯誤信息帶來的錯誤答案,依然不可避免。但騰訊混元大模型卻基于自身的技術能力,保證正確答案的輸出。

與業(yè)界消除“幻覺”的通用做法不同,混元大模型并沒有為大模型增加搜索或者知識圖譜等外掛,而是從源頭上解決問題。具體來說,混元大模型從第一行代碼開始,就采用了預訓練階段優(yōu)化目標函數(shù)的“探真”技術方法。據(jù)業(yè)內專業(yè)人士介紹,該方法與常見的開源大模型相比,能有效降低幻覺30%到50%。

除了“探真”能力優(yōu)秀之外,騰訊混元的另一大超強能力在于其支持超長文本輸出。盡管目前多模態(tài)正在成為主流大模型演進方向,但在文本輸出方面,包括GPT-3.5和GPT-4在內的大模型,都很難支持1000字以上的文本輸出,但騰訊混元通過位置編碼優(yōu)化提高了超長文的處理效果和性能,已經具備輸出4000多字的完整答案的能力。

其次,騰訊構建了從軟到硬的全流程基礎設施,這讓騰訊具備了更強的“全局優(yōu)化”能力。從自研的星星海服務器,到新一代HCC高性能計算集群,再到自研的星脈高速網(wǎng)絡,騰訊已經為自己打造了一整套面向AIGC的高性能智算網(wǎng)絡。據(jù)騰訊內部負責人介紹,目前騰訊云已經可支持超過10萬張卡并行計算的大規(guī)模訓練集群,萬億參數(shù)大模型可以在四天之內完成。

目前,騰訊云已經建立起了圍繞大模型的全套能力,包括高性能算力集群、云原生數(shù)據(jù)湖倉和向量數(shù)據(jù)庫等數(shù)據(jù)處理引擎,以及模型安全、支持模型訓練和精調的工具鏈等,企業(yè)和開發(fā)者都可以根據(jù)自己的需求,靈活選擇產品,降低大模型的訓練成本。

不甘落后的科大訊飛

除了騰訊大模型之外,在大模型上已經先行一步的科大訊飛也是不甘落后,不僅積極參與通用大模型的建設,還持續(xù)發(fā)力行業(yè)大模型的建設。目前科大訊飛的大模型已經具備7大能力,分別為:文本生成、語言理解、知識問答、邏輯推理、數(shù)學和多模態(tài)能力,并且這種能力還在不斷提升。而基于大模型開發(fā)所需的巨大投入量,科大訊飛也做了多方面的準備。

一方面,科大訊飛積極展開與業(yè)內巨頭的合作,強化星火大模型的技術實力。早在今年8月中旬,科大訊飛就與華為共同發(fā)布星火一體機,讓所有企業(yè)都可以在國產自主創(chuàng)新平臺上私有化部署大模型。一來,星火一體機基于星火認知大模型,針對污語料和幻覺問題,形成了“立體化”的內容安全機制。二來,星火一體機基于昇騰AI硬件、昇思AI開源框架,提供業(yè)界領先的大模型訓練、推理能力,為大模型全流程創(chuàng)新提供堅實的自主創(chuàng)新算力底座。

具體來說,訊飛星火認知大模型基于訓練推理一體化設計,實現(xiàn)大模型稀疏化、低精度量化的技術突破,能高效適配昇騰AI,加速大模型的行業(yè)落地應用和迭代;與此同時,以昇騰AI為核心,軟硬件協(xié)同優(yōu)化,構建算力集中、協(xié)同優(yōu)化、供給穩(wěn)定、數(shù)據(jù)安全的大模型訓練集群,這些都可以強化星火大模型的自身實力。

另一方面,科大訊飛積極推動與自身業(yè)務場景的整合,加速大模型的場景落地。除了不斷強化自己核心能力之外,科大訊飛還結合自身的業(yè)務場景,推動大模型在辦公、政務、電力、教育、醫(yī)療、工業(yè)、司法、金融等行業(yè)的場景落地。星火一體機內已涵蓋辦公、代碼、運維、客服、營銷、采購等10多個場景包,支持對話開發(fā)、任務編排、插件執(zhí)行、知識接入、提示工程等5種定制優(yōu)化模式,并將持續(xù)拓展更多專業(yè)場景和模式優(yōu)化,為客戶快速定制企業(yè)專屬大模型。

總的來看,科大訊飛在大模型上,外部合作和內部場景落地相結合的方式,很好地保證了其大模型產業(yè)化的加速落地。

大模型大洗牌正在加速到來

在眾多頭部巨頭和行業(yè)巨頭的共同努力之下,“百模大戰(zhàn)”甚至“千模大戰(zhàn)”的局面正在加速形成。而在這種的形勢之下,圍繞大模型的“行業(yè)大洗牌”或將提前到來。

首先,產品能力的比拼已經初見分曉。據(jù)知名廠商IDC依據(jù)算法模型、通用能力、創(chuàng)新能力、平臺能力和安全可解釋等五方面的要求,評估出了目前市面上在大模型方面綜合評分最高的三家廠商,分別是百度、阿里巴巴、科大訊飛。不過由于這個數(shù)據(jù)排出的時間較早,未考慮到騰訊和華為的產品能力,所謂真實的綜合技術實力方面,排名靠前的依舊會是BATH這些行業(yè)巨頭。

但各家的能力并不相同,也各有側重。具體來說,百度的能力在于其具有“芯片—框架—模型—應用”四層技術棧完整布局的獨特優(yōu)勢:芯片層—昆侖芯、框架層—飛漿、模型層—文心大模型,以及各種AI的落地應用。阿里的能力也相近,其強大之處在于圍繞云搭建起了一整個的大模型基礎設施;華為的能力在于強大的基礎技術能力,以及廣泛的終端生態(tài)應用和B端應用能力。在BATH之外,其他大模型廠商依然排在第二梯隊、第三梯隊,產品層面的分化已經出現(xiàn)。

其次,是大模型生態(tài)服務能力的比拼已然拉開序幕。以阿里為例,阿里不僅推出了通義千問大模型,還推出了魔搭大模型社區(qū),還有眾多的生態(tài)合作伙伴;百度在這方面也不遑多讓,不僅有基于大模型的技術能力,還有廣泛的生態(tài)伙伴,推理能力和速度伴隨著大模型的版本更新,也在日新月異;作為同級別大廠,華為、騰訊等廠商自然也具備類似能力。不難預見,未來各路廠商圍繞預訓練、邏輯推理等相關方面的技術服務,將成為行業(yè)競爭的常態(tài)。

當然,無論是產品維度還是服務能力,最終都要落地到產業(yè)實踐上。從行業(yè)覆蓋來看,從文心大模型出發(fā),百度已經在能源、汽車、政務、交通、金融等重點領域布局11個行業(yè)大模型,將大模型融入到垂直領域,真正做到產業(yè)實踐和商業(yè)落地。阿里、騰訊、華為等也覆蓋電商零售、物流、社交、礦業(yè)等諸多行業(yè),產業(yè)化落地也在快速提升。

而隨著各大平臺的大模型,在產品、生態(tài)服務和產業(yè)實踐上的全面展開,大模型的大洗牌正在加速到來。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
大模型

相關文章

熱門排行

信息推薦