1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

不止于大模型 英特爾CPU引領(lǐng)智算新高度

 2024-04-01 15:51  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

在算力新時代,從通用計算到智算,CPU可以做更多,價值也更加凸顯。

作為一種基于人工智能(AI)技術(shù)的計算方式,其含義既包含了AI,還包含了對高性能算力的要求。

擁抱大模型不容易

ChatGPT的橫空出世拉開了AI大模型的新時代,而近期的文生視頻模型SORA又讓業(yè)界為之激動不已。據(jù)了解,Sora所需token(文本處理最小單位)數(shù)量相較于文本及圖片模型的推理呈數(shù)量級增長。經(jīng)中信證券簡單估算,對于一個60幀的視頻(約6至8秒),Sora要生成至少約120萬個token,這是相當大的計算量。

科技爆炸的背后需要算力膨脹來匹配,大型AI模型的興起帶來了對智能計算能力的積極需求,于是,我們看到業(yè)界在算力基礎(chǔ)設(shè)施方面進行積極布局,芯片需求得到極大釋放,但是現(xiàn)實卻有點不盡如人意。

網(wǎng)上信息顯示,以O(shè)penAI在GPT-3模型為例,該模型擁有1750億個參數(shù),需要龐大算力,訓練成本高達1650萬美元。使用GPT-3開發(fā)的ChatGPT在推論方面的成本更高,每月燒掉4千萬美元 。這不僅大大增加了企業(yè)成本,對地球資源、環(huán)境可持續(xù)發(fā)展性也可能產(chǎn)生影響。

被廣泛應(yīng)用于人工智能的訓練、推理、科學計算等領(lǐng)域的GPU似乎成為頂流,并且愈發(fā)呈現(xiàn)出“一卡難求”的趨勢。但是對于實際的企業(yè)AI落地應(yīng)用而言,真的無法低成本擁抱大模型了嗎?業(yè)務(wù)場景的需求對AI算力要求幾何?如何挖掘現(xiàn)有算力潛能?

俗話說,“自古華山一條道”,但是對于算力芯片卻不是,特別是對于大語言模型(以下簡稱:LLM)推理,CPU在某些場景下其實更適合。

為什么選擇CPU?

相比GPU,CPU此前在LLM的熱度表現(xiàn)并不算高,業(yè)界往往認為CPU在AI時代已經(jīng)“過時”。

但事實并非如此。

大模型通常都分為訓練和推理兩個階段,在訓練環(huán)節(jié)需要處理海量數(shù)據(jù),因此對算力性能要求較高;但推理階段不僅幾乎貫穿業(yè)務(wù)全流程,對算力的要求也沒有那么高,隨著CPU性能的提升,在部分場景下用CPU來完成AI推理工作對企業(yè)來說是更加適合的選擇。

一方面,CPU資源更容易獲取,也不需要導(dǎo)入異構(gòu)硬件平臺,額外進行相關(guān)人才的儲備,更容易實現(xiàn)廣泛部署;另外,充分利用現(xiàn)有IT設(shè)施有助于TCO(總體擁有成本)優(yōu)化,以用更低的成本實現(xiàn)更優(yōu)的性能表現(xiàn)。

其次,通過分布式的解決方案,能夠有效解決CPU計算速度的問題。CPU甚至可以支持幾百GB的內(nèi)存,能夠輕松應(yīng)付甚至70B的LLM ,而且CPU的特性是通用和靈活,以及在軟件兼容性方面的多年積累,在承載和部署人工智能應(yīng)用工作負載方面更具優(yōu)勢。

這就是CPU的破局,選擇CPU進行LLM探索逐漸成為企業(yè)的新選擇。

近年來,隨著大模型的迅速發(fā)展,光學字符識別(OCR)技術(shù)已成為LLM的重要入口。亞信科技就在自家OCR-AIRPA方案中采用了CPU作為硬件平臺,實現(xiàn)了從FP32到INT8/BF16的量化,從而在可接受的精度損失下,增加吞吐量并加速推理。將人工成本降至原來的1/5到1/9,效率還提升了約5-10倍。

深耕醫(yī)療行業(yè)多年,已幫助多家三甲醫(yī)院推進信息化和數(shù)字化建設(shè)的衛(wèi)寧健康就選擇與英特爾合作,通過軟硬適配、優(yōu)化模型算法等手段,成功在CPU(第五代至強® 可擴展處理器)上提升了面向醫(yī)療垂直領(lǐng)域的大模型WiNGPT的性能,讓基于它的AI應(yīng)用的交付、部署和應(yīng)用更為高效便捷,能在任何一家已使用衛(wèi)寧WiNEX系統(tǒng)的醫(yī)院迅速上崗。

第五代至強® 可擴展處理器每個內(nèi)核均具備AI加速功能,無需添加獨立加速器,即可處理要求嚴苛的端到端AI工作負載。英特爾® 高級矩陣擴展(英特爾® AMX)為矩陣運算的加速提供了強大支持,可支持BFloat16和INT8兩種數(shù)據(jù)類型,完全有能力處理要求嚴苛的AI工作負載。

相比同樣內(nèi)置AMX的第四代至強® 可擴展處理器,得益于自身在微架構(gòu)和整體性能上的提升,五代® 至強的推理性能提升高達42%。

目前,LLM更多是云端部署,但是由于涉及隱私安全,本地部署LLM的需求也越發(fā)強烈。針對會議摘要、文章總結(jié)等離線場景,百億參數(shù)的LLM就可以完全勝任,CPU的性能就可以運行,成本優(yōu)勢更加明顯,還能降低部署成本。

更強通用計算,兼顧AI加速

當然,AI不是只有大模型, 英特爾® 至強® 可擴展處理器除了持續(xù)在CPU加速AI這條路上深耕,也一直在持續(xù)挖掘CPU在通用計算領(lǐng)域的價值。

與前一代產(chǎn)品相比,第五代英特爾® 至強® 可擴展處理器有高達1.84倍的平均性能提升,可在進行通用計算時將整體性能提升高達21%,并在一系列客戶工作負載中將每瓦性能提升高達36%。

例如制造領(lǐng)域在高度精細且較為耗時的瑕疵檢測環(huán)節(jié),部分企業(yè)就復(fù)用了既有的CPU平臺,構(gòu)建了橫跨“云-邊-端”的AI 缺陷檢測方案。為了達到更好的應(yīng)用效果,在使用計算機視覺方案之外,還可以融入深度學習和機器學習的技術(shù),構(gòu)建三者混合模式的方案。

星環(huán)科技則基于第五代至強® 可擴展處理器推出了Transwarp Hippo 分布式向量數(shù)據(jù)庫解決方案,實現(xiàn)了約2倍的代際性能提升,可有效滿足大模型時代海量、高維向量的存儲和計算需求。

數(shù)據(jù)作為AI三駕馬車之一,其重要性自然不言而喻。除了可用作向量數(shù)據(jù)庫這一種,對于處理數(shù)據(jù)時候可能涉及的邏輯運算、內(nèi)存操作,第五代英特爾® 至強® 可擴展處理器也可以提供充足的支持。它可以將壓縮/解壓縮和數(shù)據(jù)傳輸?shù)荣Y源密集型任務(wù)從CPU內(nèi)核卸載至內(nèi)置的英特爾® 數(shù)據(jù)分析引擎,釋放數(shù)據(jù)分析和數(shù)據(jù)庫運行的時鐘周期,以提高每秒事物處理量,用戶可以在每臺服務(wù)器上擴展容量或運行更多應(yīng)用。

結(jié)合第五代英特爾® 至強® 可擴展處理器更快的內(nèi)存和更大的三級緩存,英特爾® 存內(nèi)分析加速器(英特爾® IAA)和英特爾® 數(shù)據(jù)流加速器(英特爾® DSA)能夠在提高查詢吞吐量的同時,進行數(shù)據(jù)復(fù)制和轉(zhuǎn)換操作,從而實現(xiàn)內(nèi)存數(shù)據(jù)庫、大數(shù)據(jù)分析和數(shù)據(jù)倉庫的性能提升。

AI對隱私計算的需求也在增加,英特爾® 可信域擴展(英特爾® TDX)提供虛擬機(VM)層面的隔離和保密性,從而增強隱私性和對數(shù)據(jù)的管理。在基于英特爾® TDX的機密虛擬機中,客戶機操作系統(tǒng)和虛擬機應(yīng)用被隔離開來,而不會被云端主機、虛擬機管理程序和平臺的其他虛擬機訪問。

此外,英特爾還在軟件創(chuàng)新方面持續(xù)發(fā)力,以確?,F(xiàn)有的人工智能框架和應(yīng)用能夠充分發(fā)揮硬件潛力,從而加速行業(yè)的發(fā)展。

英特爾提供了完善的人工智能軟件生態(tài)方案和工具鏈,不僅持續(xù)為主流開源框架PyTorch、TensorFlow等貢獻力量,還提供了多種針對英特爾平臺的優(yōu)化插件,如IPEX(Intel® Extension for PyTorch)、ITEX(Intel® Extension for TensorFlow)等,以及xFT(xFasterTransformer)、OpenVINO™ 工具套件等多種優(yōu)化工具。這些技術(shù)可極大地提升AI性能,包括LLM、文字生成圖片Stable Diffusion等,未來的熱門方向——文字生成視頻,同樣能夠從中受益。

IPEX配合PyTorch,支持PyTorch框架下90%的主流模型,其中深度優(yōu)化模型有50個以上??蛻糁灰ㄟ^簡單幾步即可完成BF16混合精度轉(zhuǎn)換,模型即可在保持精度的同時在CPU上高效部署。

結(jié)語

多年來,英特爾一直不遺余力地進行軟硬件創(chuàng)新,為了迎合人工智能時代對算力的渴求,不斷推陳出新,提供更加強大、更加先進的CPU處理器和其他硬件方案。

CPU運行LLM并不是“癡人說夢”,因為CPU在進化一直在進行,得益于硬件級創(chuàng)新和借助軟件充分挖掘硬件性能,英特爾為AI時代的算力基礎(chǔ)設(shè)施提供了新的選擇機會。

我想客戶和市場也是樂見其成的,畢竟這是一個雙贏的結(jié)果。市場不希望單一的選擇,而是多樣化的選擇。這就像x86的發(fā)展一樣,開放帶來產(chǎn)業(yè)的繁榮。

在生成式AI和LLM狂奔的同時,CPU也在與時俱進,讓自己適配客戶需求和選擇。依托軟硬件和生態(tài)協(xié)同,CPU正在迎來新的高光時刻,推動人工智能行業(yè)邁向新的高度,展現(xiàn)出無限的潛力與可能性。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)文章

  • “創(chuàng)造市場”與“算法進化”,中美AI競速的岔路口

    “人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場,占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經(jīng)無法直接進行排位先后、優(yōu)

    標簽:
    ai智能
  • 智能體進化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實現(xiàn)了流程全自動化AIAgent構(gòu)建到執(zhí)行全自動化,持續(xù)進化RPAAgent再次降低智能體應(yīng)用門檻實在智能重磅發(fā)布實

  • 崔大寶:大模型降溫背后的難點、卡點、節(jié)點

    崔大寶|節(jié)點財經(jīng)創(chuàng)始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關(guān)聯(lián)的概念炒不動了,英偉達股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔憂;消費市場,BATH們的推新活動少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內(nèi)大模型

    標簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來越多的傳統(tǒng)企業(yè)和機構(gòu)開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

    標簽:
    數(shù)字人
  • 來到IPO關(guān)口,地平線離“三分天下”還有多遠?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供

  • 機器人大會引領(lǐng)產(chǎn)業(yè)動向,卓翼飛思繪制無人系統(tǒng)教科研新藍圖

    8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當下機器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計數(shù)據(jù),今年現(xiàn)場逛展觀眾高達25萬人次,比去年增加25%。機器人行業(yè)有多火?看看2024世界機器人大會火爆程度便可知

  • 卓翼智能:超大載重高烈度環(huán)境特種智能系留無人平臺的應(yīng)用與未來

    瞄準場景需求,打造國內(nèi)領(lǐng)先的自主可控、高質(zhì)量超大載重高烈度環(huán)境特種智能系留無人平臺。卓翼智能亮相HICOOL峰會以科技實力榮摘創(chuàng)業(yè)大賽一等獎這個比賽5年培育出16家“獨角獸”HICOOL2024全球創(chuàng)業(yè)者峰會暨創(chuàng)業(yè)大賽已于8月25日在北京圓滿落下帷幕,大賽共吸引了124個國家和地區(qū)的7406個創(chuàng)業(yè)項

  • 60萬獎金召喚AI創(chuàng)新者,2024無錫國際人工智能創(chuàng)新應(yīng)用大賽火熱進行中!

    人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量。無錫市作為中國的科技創(chuàng)新中心之一,正通過構(gòu)建人工智能"算力+算法+數(shù)據(jù)"三要素齊備的產(chǎn)業(yè)生態(tài),為產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用提供強大支撐,通過“AI+”行動推動人工智能與多個產(chǎn)業(yè)交叉融合,實現(xiàn)技術(shù)落地和產(chǎn)業(yè)化,加速形成新質(zhì)生產(chǎn)力,打造具有國際競爭力的產(chǎn)業(yè)創(chuàng)新智造

  • “云+AI”驅(qū)動操作系統(tǒng)創(chuàng)新升級,龍蜥堅持可持續(xù)發(fā)展路線

    近日,2024龍蜥操作系統(tǒng)大會(OpenAnolisConference)在北京圓滿召開,此次大會由中國計算機學會開源發(fā)展委員會、中關(guān)村科學城委員會、海淀區(qū)委網(wǎng)信辦、中國開源軟件推進聯(lián)盟指導(dǎo),龍蜥社區(qū)主辦,阿里云、浪潮信息、Intel、中興通訊、Arm、中科方德等24家理事單位共同承辦,主題為“進化