當(dāng)前位置:首頁(yè) >  科技 >  IT業(yè)界 >  正文

金山云推出業(yè)內(nèi)首款采用英偉達(dá)Tesla P4 GPU云服務(wù)器實(shí)例

 2017-09-11 10:23  來(lái)源: 互聯(lián)網(wǎng)   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

近日,金山云正式推出GPU云服務(wù)器實(shí)例P3I實(shí)例,目前已在金山云官網(wǎng)上線。P3I實(shí)例是業(yè)內(nèi)首款采用英偉達(dá)高性能計(jì)算卡Tesla P4的云服務(wù)器產(chǎn)品,單實(shí)例負(fù)載能力是傳統(tǒng)CPU的30倍以上,具有訪存性能高、聯(lián)網(wǎng)增強(qiáng)、配備新一代網(wǎng)卡三大特點(diǎn),性價(jià)比更高,為包括語(yǔ)音識(shí)別、語(yǔ)義識(shí)別、語(yǔ)音合成、人臉識(shí)別、圖像識(shí)別、場(chǎng)景識(shí)別、廣告推薦、智能游戲和無(wú)人駕駛等在內(nèi)的多種人工智能應(yīng)用場(chǎng)景提供基礎(chǔ)設(shè)施支撐,滿足企業(yè)級(jí)客戶對(duì)于計(jì)算的高標(biāo)準(zhǔn)需求。

P3I實(shí)例的推出,將加速人工智能技術(shù)應(yīng)用的普及,通過(guò)優(yōu)質(zhì)的產(chǎn)品和體驗(yàn),讓人工智能的潛力得以全面釋放。

率先采用Tesla P4計(jì)算卡,提供澎湃動(dòng)力

當(dāng)下,人工智能可謂熱度空前,上至科技巨擘,下至創(chuàng)業(yè)新秀,紛紛將人工智能技術(shù)當(dāng)作開(kāi)掘市場(chǎng)金礦的利器,例如智能音箱、智能電視、刷臉支付、無(wú)人超市、智能推薦、無(wú)人駕駛等等,大量的商業(yè)應(yīng)用場(chǎng)景被一一建構(gòu),這對(duì)計(jì)算量、數(shù)據(jù)量、深度學(xué)習(xí)等能力提出了更高的要求。如何為人工智能提供充沛動(dòng)力,加速相關(guān)應(yīng)用的開(kāi)發(fā),降低計(jì)算成本壓力,成為擺在很多企業(yè)面前的現(xiàn)實(shí)問(wèn)題。

在金山云看來(lái),作為深度學(xué)習(xí)的重要支撐,近年來(lái)GPU在很大程度上提高了服務(wù)器的運(yùn)算能力,大幅度提升訓(xùn)練速度,由此產(chǎn)生的云端計(jì)算集群,已成為人工智能的重要引擎。此次推出的P3I實(shí)例,是業(yè)內(nèi)首款采用英偉達(dá)高性能計(jì)算卡Tesla P4的云服務(wù)器實(shí)例產(chǎn)品,將為人工智能的應(yīng)用提供澎湃動(dòng)力。

Tesla P4專為處理深度學(xué)習(xí)工作負(fù)載,可提升服務(wù)器的工作效率,在任意超大規(guī)模神經(jīng)網(wǎng)絡(luò)上的推理延遲,較CPU降低15倍以上,推理吞吐效率較CPU提高60倍以上,相比英偉達(dá)上一代計(jì)算卡M4有更低的延遲和更大的吞吐。因此,P3I實(shí)例有著更好的性價(jià)比和效率,單實(shí)例負(fù)載能力是配備傳統(tǒng)CPU服務(wù)器的30倍以上,適用于深度神經(jīng)網(wǎng)絡(luò)模型的推理預(yù)測(cè)等場(chǎng)景。

P3I實(shí)例提供兩種配置,第一種配置一顆Tesla P4 GPU搭載8GB DDR5顯存、14核vCPU、120GB內(nèi)存和500GB SSD硬盤(pán),計(jì)算能力5.5TFlops;第二種配置兩顆Tesla P4 GPU搭載16GB DDR顯存、28核vCPU、240GB內(nèi)存和1000GB SSD硬盤(pán),計(jì)算能力11TFlops??蛻粼谑褂迷摦a(chǎn)品建設(shè)深度學(xué)習(xí)平臺(tái)時(shí),可根據(jù)業(yè)務(wù)負(fù)載選擇不同配置,從而滿足客戶的定制化需要。

三大特點(diǎn)配合Tesla P4,助人工智能多點(diǎn)開(kāi)花

為更好地發(fā)揮Tesla P4的作用,P3I實(shí)例具有三大特點(diǎn)。首先,P3I實(shí)例提高了Tesla P4的訪存性能,進(jìn)行了延時(shí)優(yōu)化,性能提升22%,接近物理機(jī)水平。通過(guò)優(yōu)化云服務(wù)器Hypervisor層性能,降低Tesla P4訪問(wèn)內(nèi)存開(kāi)銷,優(yōu)化了GPU DMA訪存性能,加快HOST內(nèi)存到數(shù)據(jù)交換速率,將充分發(fā)揮Tesla P4的運(yùn)算能力。

第二,全線支持聯(lián)網(wǎng)增強(qiáng)。P3I實(shí)例的聯(lián)網(wǎng)增強(qiáng)大幅提高實(shí)例發(fā)包速率,能夠降低60%以上的網(wǎng)絡(luò)延遲。在刷臉認(rèn)證、刷臉支付、刷臉門禁、語(yǔ)音識(shí)別等應(yīng)用場(chǎng)景中,客戶對(duì)時(shí)間延遲的敏感度最高,聯(lián)網(wǎng)增強(qiáng)可大幅降低預(yù)測(cè)請(qǐng)求到預(yù)測(cè)系統(tǒng)(運(yùn)行于P3I實(shí)例上)的時(shí)間延遲,加上Tesla P4低延遲的特點(diǎn),P3I實(shí)例能為客戶帶來(lái)更優(yōu)質(zhì)的體驗(yàn)。

第三,P3I實(shí)例配備新一代智能網(wǎng)絡(luò)適配器,帶寬得到進(jìn)一步提升。在人工智能的推理預(yù)測(cè)應(yīng)用中,客戶除了對(duì)時(shí)間延遲敏感,對(duì)于系統(tǒng)吞吐也有較高要求,P3I實(shí)例配備的新一代網(wǎng)絡(luò)適配器,可幫助客戶提升網(wǎng)絡(luò)吞吐一倍以上,能夠更好適配Tesla P4的吞吐能力。

人工智能需要找到應(yīng)用場(chǎng)景,發(fā)展才有意義。P3I實(shí)例的推出,將幫助人工智能應(yīng)用在各個(gè)行業(yè)不斷落地,讓客戶更好發(fā)揮自身的優(yōu)勢(shì)和資源。目前,P3I實(shí)例已開(kāi)放購(gòu)買(),已有多家知名人工智能廠商的數(shù)十個(gè)應(yīng)用正在適配。在人工智能產(chǎn)業(yè)從技術(shù)變革行進(jìn)到應(yīng)用落地的重要階段時(shí),P3I實(shí)例將成為金山云推動(dòng)產(chǎn)業(yè)發(fā)展進(jìn)步的新引擎。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
英偉達(dá)暴跌

相關(guān)文章

熱門排行

信息推薦