當前位置:首頁 >  科技 >  互聯(lián)網(wǎng) >  正文

怎么向大模型要生產力,訊飛星火的“三問三答”

 2024-04-01 13:30  來源: A5專欄   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

埃弗雷特·羅杰斯在《創(chuàng)新與擴散》中提出過一個著名觀點:一種創(chuàng)新在剛起步時接受程度比較低,使用人數(shù)較少,擴散過程也就相對遲緩,當使用者比例達到臨界值后,創(chuàng)新擴散過程就會快速地增加。

風頭正盛的大模型浪潮,再次印證了創(chuàng)新擴散理論的適用性:三年前還只有少數(shù)幾個科技大廠參與,價值被初步驗證的2023年,即上演了“百模大戰(zhàn)”的一幕,2024年大概率是大模型落地應用的元年,向千行萬業(yè)加速擴散。

由此產生的一個問題是:怎么將大模型的能力延伸到產業(yè)一線,最適合中國產業(yè)結構的路徑是什么?

半個多月前的華為中國合作伙伴大會2024上,科大訊飛副總裁劉江參與了“計算峰會”的討論,圍繞大模型落地應用的路線、場景和生態(tài),分享了訊飛星火在過去一年時間里的探索和答案。

01 大模型的能力從何而來?

盡管不同統(tǒng)計口徑下的數(shù)據(jù)有所差別,但可以肯定的是,目前國內的大模型數(shù)量已經有上百個,用“遍地都是”來形容大模型行業(yè),并不算夸張。問題在于,為什么大模型的數(shù)量越來越多,產業(yè)應用尚未渡過拐點?

大模型的行業(yè)競爭,從來都不是拼數(shù)量的游戲,經過一段時間的跟風、躁動后,還是要回到能力上。

2024年1月30日,訊飛星火正式升級到V3.5版本,在語言理解、文本生成、知識問答、邏輯推理、數(shù)學能力、代碼能力和多模態(tài)能力七個方面進行了全面升級,其中語言理解、數(shù)學能力超過GPT-4 Turbo,代碼達到GPT-4 Turbo的96%,多模態(tài)理解達到GPT-4V的91%。

同期發(fā)布的星火語音大模型,在中文、英語、法語、俄語等首批37個主流語種的語音識別效果超過OpenAI的Whisper V3,而在多語種語音合成方面,星火語音大模型的首批40個語種平均MOS分絕對提升了0.25,擬人度超過83%,均達到了國際領先水平。

訊飛星火認知大模型在“百模大戰(zhàn)”中脫穎而出的背后,離不開昇騰AI和科大訊飛在算力底座上的聯(lián)合突破。

時間回到2023年4月,訊飛星火V1.0發(fā)布前夕。有別于一些大模型廠商搶時間上線的做法,科大訊飛在同步思考一個長遠問題:為了避免被卡脖子,怎么將大模型的能力架構在一個自主創(chuàng)新的體系上?

接下來近一年的時間里,昇騰AI和科大訊飛針對大模型訓練進行了一系列技術攻關,包括大模型底層算子庫開發(fā)和優(yōu)化、大模型算法遷移、超大規(guī)模集群智能化運維軟件開發(fā)等等。

雙方聯(lián)合開發(fā)和優(yōu)化了50多個大模型算子,其中科大訊飛基于昇騰自主開發(fā)自定義的關鍵算子就超過10個,最終讓大模型的訓練性能提升了3倍以上,和國外同類產品不相上下。

6個月后的訊飛開發(fā)者節(jié)上,雙方向外界公布了一個新消息:首個支撐萬億參數(shù)大模型訓練的國產算力平臺“飛星一號”正式啟用,基于昇騰AI基礎軟硬件平臺和大容量交換機構建參數(shù)面無損ROCE組網(wǎng),配置高空間的全閃和混閃并行文件系統(tǒng),可以支撐萬億參數(shù)大模型高速訓練。

解決了大模型的算力底座后,聯(lián)合創(chuàng)新的勢能被進一步釋放,先后訓練出了訊飛星火V3.5、星火語音大模型、星火開源大模型以及12個行業(yè)大模型,為大模型的能力提升注入了源源不斷的動力。

02 大模型的能力怎么輸出?

大模型的能力不能停留在參數(shù)上,停留在評測報告中,想要解放生產力,前提是讓大模型的能力落到一個個業(yè)務場景中。由此產生的關鍵問題是:大模型的能力怎么輸出,怎么降低落地門檻?

經過一年多的摸索后,行業(yè)上下游逐漸形成了一種共識,即通過預訓練產生通用大模型,再在通用大模型的基礎上,使用特定的行業(yè)數(shù)據(jù)精調出行業(yè)大模型,然后基于通用大模型或行業(yè)大模型來開發(fā)應用。

訊飛星火遵循了大模型落地的行業(yè)共識。有所不同的是,訊飛星火還提供了一條條通往產業(yè)一線的路。

為了滿足不同規(guī)模不同場景的快速部署需求,訊飛星火在“飛星一號”的基礎上,進一步開放了底層算力構建和運維能力、大模型訓練平臺和工具鏈,以及數(shù)據(jù)清洗、數(shù)據(jù)訓練、應用開發(fā)等全套工具,讓企業(yè)可以構建自己的智算底座。

為了滿足企業(yè)專有大模型的推理應用需求,科大訊飛和華為在2023年8月發(fā)布了“星火一體機”,提供底層算力、AI框架、訓練算法、推理能力、應用成效等AI能力,讓每家企業(yè)或機構都能獲得“開箱即用”的大模型一體化解決方案。

為了加速企業(yè)大模型應用價值的落地,科大訊飛的答案是星火優(yōu)化套件,包含星火通用大模型、行業(yè)大模型優(yōu)化套件和場景應用優(yōu)化套件,并未局限在模型和算力層面,而是嘗試在配套服務和能力上打通大模型落地的“最后一公里”。

回到創(chuàng)新擴散理論的話題上,創(chuàng)新擴散的過程離不開千千萬萬的開發(fā)者,他們無疑是大模型走進千行萬業(yè)的“螞蟻雄兵”。特別是整個行業(yè)還處于“摸著石頭過河”的階段時,“獨角戲”注定不是可行的方式。

所以,訊飛星火在幫助企業(yè)和機構降門檻的同時,不斷向開發(fā)者拋出橄欖枝,不斷拉近開發(fā)者和大模型的距離。

比如訊飛星火在昇思社區(qū)等平臺上開源了13B大模型,并向開發(fā)者提供基礎模型、精調模型、微調工具、人格定制工具、高質量多語種語料等等,通過給開發(fā)者提供全生命周期的服務,讓他們把精力聚焦在想要解決的問題上,做最大的投入和努力,而非把時間花在不必要的事務中。

簡單做個總結的話,訊飛星火的路線并不復雜:一方面降低大模型的門檻,涵蓋訓練、推理、部署等環(huán)節(jié);另一方面為開發(fā)者賦能,讓他們參與到大模型落地應用的浪潮中。初衷則是借助合理的分工,跑通大模型價值釋放的產業(yè)鏈條,讓大模型不再是美好卻空洞的花瓶,而是實實在在的生產力。

03 大模型落地到哪些場景?

大模型的落地又不能一味求快。很多行業(yè)對大模型的態(tài)度仍是技術上的新鮮感,勢必要有一個價值持續(xù)驗證的過程,落地到哪些場景,帶來什么樣的價值,直接影響著外界對新生產力的認知。

就像瓦特在改良蒸汽機后,沒有預想中那樣迅速在全世界鋪開,而是經歷了近半個世紀的探索,直到在紡織領域“打敗”水能,才讓蒸汽機和產業(yè)革命掛鉤。每一次工業(yè)革命的出現(xiàn),與其說是技術課題,不如說是一個經濟課題。

同樣的問題也擺在大模型面前,成為新一輪工業(yè)革命“引擎”的前提,是產生肉眼可見的經濟效益。

科大訊飛在2023年7月打造了一支名為“星火軍團”的精銳隊伍,被定義為探索大模型價值落地的戰(zhàn)略業(yè)務組織。歷經9個月的穩(wěn)扎穩(wěn)打,星火大認知模型帶來的生產力變革正在被越來越多的行業(yè)認可。

在能源領域,國家能源集團與科大訊飛聯(lián)手開啟了能源行業(yè)數(shù)字化、智能化轉型的新篇章。

在智慧城市領域,湖北省利川市依托訊飛星火認知大模型和昇騰算力,構建了自主創(chuàng)新人工智能公共算力平臺,驅動利川數(shù)字產業(yè)、智慧文旅、康養(yǎng)產業(yè)、智慧農業(yè)等領域全面發(fā)展。

其中利川文旅大模型發(fā)布將在今年五一正式上線使用,將從旅游線路規(guī)劃、旅客需求收集、客流高峰控制等方面,為景區(qū)的精細化管理提供科學高效的輔助決策,推動文化和旅游深度融合、一體化發(fā)展。

在科研領域,中科院文獻情報中心與科大訊飛合作推出的星火科研助手,提供成果調研、論文研讀和學術寫作三大功能;三亞崖州灣科技城借助科研助手增強科研文獻檢索和分析能力,并通過科技文獻大模型為科研人員提供建議指導,提高了研究效率和質量。

在銀行領域,與某國有銀行強強聯(lián)合,實現(xiàn)訊飛星火在客服、展業(yè)、辦公、研發(fā)等場景的賦能,并正在重點打造銀行領域的代碼能力應用標桿。

在教育領域,謙萃智能利用iFlyCode智能編程助手為教師提供了高效的備課支持,簡化課程內容,使學生更易于理解和掌握。在團隊協(xié)作的項目中,iFlyCode顯著減少了所需的人力和時間資源。這些綜合效果共同促進了教育資源的優(yōu)化配置和學習效率的整體提升,得到了師生們的廣泛認可。

諸如此類的案例還有很多。需要說明的是,以上只是訊飛星火示范的標志性應用場景,目的是幫助企業(yè)探索大模型在B端的商業(yè)化之路,讓千行萬業(yè)看見大模型的價值所在。

在訊飛開放平臺上,生態(tài)開發(fā)者團隊609.5萬,其中大模型直接開發(fā)者的數(shù)量41萬,他們才是點燃大模型落地應用的星星之火,不斷將大模型的能力帶入到實際工作中,不斷拓寬大模型應用的邊界。

04 寫在最后

大模型的產業(yè)之路還很長,昇騰AI和訊飛星火的合作,無疑為外界提供了一種值得借鑒的范式:在算力等基礎設施上打破大模型訓練的瓶頸,為大模型的能力輸出開辟出一條條可行的路,然后由開發(fā)者們創(chuàng)造無數(shù)個解決問題的應用。

有理由相信,沿著這樣已經被證實的路徑走下去,持續(xù)做好應用落地,形成數(shù)據(jù)飛輪,同時在大模型層面進行可持續(xù)迭代和進化,終將會渡過大模型產業(yè)應用的“拐點”,帶來百倍、千倍的需求,營造出充滿生機的大模型產業(yè)生態(tài)。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關文章

熱門排行

信息推薦