1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 人工智能
  4. 正文

大語(yǔ)言模型數(shù)據(jù)泄露堪憂,超自動(dòng)化Agent成解決之道

 2023-11-13 16:19  來(lái)源:A5專欄  我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

 

大語(yǔ)言模型數(shù)據(jù)泄露堪憂,超自動(dòng)化Agent成解決之道

數(shù)據(jù)泄露成LLM應(yīng)用最大障礙,看實(shí)在智能如何用AI Agent破解謎題

從實(shí)在RPA Agent智能體安全機(jī)制,看AI Agent如何破解LLM應(yīng)用安全謎題

文/王吉偉

阻礙廣大企業(yè)應(yīng)用大語(yǔ)言模型(LLM,Large Langeuage Models)的諸多因素中,無(wú)疑數(shù)據(jù)安全是最重要的。

3月份ChatGPT發(fā)生了用戶隱私數(shù)據(jù)泄露事件,OpenAI聲明由于開(kāi)源代碼庫(kù)中存在一個(gè)漏洞,使得部分用戶能夠看到另一個(gè)用戶的聊天標(biāo)題記錄,并把ChatGPT短暫下線緊急修補(bǔ)了此漏洞。

此事件,讓大家認(rèn)識(shí)到大模型并不是“大安全”。

更要命的,是用戶使用LLM時(shí)會(huì)不經(jīng)意輸入敏感數(shù)據(jù)。僅在三月份,三星內(nèi)部就發(fā)生了三起誤用及濫用ChatGPT案例,其中兩起關(guān)于三星半導(dǎo)體設(shè)備,一起關(guān)于三星內(nèi)部會(huì)議內(nèi)容。

以致有網(wǎng)友調(diào)侃,三星再多幾次敏感數(shù)據(jù)泄露,ChatGPT就能教大家制造先進(jìn)芯片了。

在三星等多家企業(yè)出現(xiàn)事故后,很多企業(yè)都意識(shí)到了LLM使用可能造成的數(shù)據(jù)泄露問(wèn)題。就在5月份,蘋果公司也限制員工使用ChatGPT和其他外部AI工具。當(dāng)然,蘋果公司也在開(kāi)發(fā)自己的LLM產(chǎn)品。

不只是蘋果公司,摩根大通、美國(guó)電信運(yùn)營(yíng)商Verizon等公司都已經(jīng)宣布禁止使用ChatGPT等應(yīng)用,亞馬遜也希望工程師們使用內(nèi)部AI工具。

就在11月10日,投資了OpenAI并為廣大企業(yè)提供OpenAI云服務(wù)的微軟,因?yàn)閾?dān)心公司機(jī)密數(shù)據(jù)泄露,竟然也開(kāi)始禁止員工使用ChatGPT,建議員工使用自家的Bing Chat工具。

出于數(shù)據(jù)安全憂慮,美國(guó)銀行、花旗集團(tuán)、德意志銀行、高盛集團(tuán)等多家金融機(jī)構(gòu)已經(jīng)禁止員工使用ChatGPT聊天機(jī)器人處理工作任務(wù),日本的軟銀、富士通、瑞穗金融集團(tuán)、三菱日聯(lián)銀行、三井住友銀行等企業(yè),同樣限制了ChatGPT和類似聊天機(jī)器人的商業(yè)用途。

現(xiàn)在,這些企業(yè)有的與OpenAI合作進(jìn)行了私有化部署,有的已經(jīng)研發(fā)了自有大語(yǔ)言模型。

數(shù)據(jù)泄露對(duì)企業(yè)的危害

多家機(jī)構(gòu)如此重視,人為數(shù)據(jù)泄露到底能為企業(yè)造成多大傷害?

數(shù)據(jù)安全公司Cyberhaven曾在一個(gè)報(bào)告中,調(diào)查了不同行業(yè)客戶160萬(wàn)員工的ChatGPT使用情況。

報(bào)告數(shù)據(jù)顯示,自ChatGPT推出以來(lái)至3月21日,8.2%的員工曾在工作場(chǎng)所使用過(guò)ChatGPT, 6.5%的員工曾將公司數(shù)據(jù)粘貼其中;僅3月14日一天,每10萬(wàn)名員工就平均給ChatGPT發(fā)送了5267次企業(yè)數(shù)據(jù)。尤其是敏感數(shù)據(jù),占到員工粘貼到ChatGPT的數(shù)據(jù)的11%。

這意味著,ChatGPT的使用率越高,敏感數(shù)據(jù)泄露的也就越多。

試想如果不加限制地使用LLM,隨著更多敏感數(shù)據(jù)被傳輸LLM服務(wù)器,并被用作模型訓(xùn)練數(shù)據(jù)集,也就意味著競(jìng)爭(zhēng)對(duì)手通過(guò)隨意的聊天對(duì)話就能獲悉了你的核心數(shù)據(jù)。如果競(jìng)對(duì)用這些數(shù)據(jù)建模對(duì)你進(jìn)行降維打擊,會(huì)對(duì)企業(yè)會(huì)造成多大損失?

數(shù)據(jù)泄露會(huì)造成嚴(yán)重的企業(yè)的信任度降低,讓業(yè)務(wù)連續(xù)性受到影響,并可能會(huì)帶來(lái)一定的法律責(zé)任。

看到這里,你就應(yīng)該明白為何大型企業(yè)都在構(gòu)建自有大語(yǔ)言模型了。

當(dāng)然,凡事皆有利弊。雖然對(duì)話式交互的生成式AI會(huì)造成敏感數(shù)據(jù)泄露,但AI和自動(dòng)化的使用,整體上正在降低數(shù)據(jù)泄露的成本。

IBM的《2023年數(shù)據(jù)泄露成本》全球調(diào)查數(shù)據(jù)顯示,廣泛使用人工智能(AI)和自動(dòng)化的組織受益,平均節(jié)省了近1萬(wàn)美元的數(shù)據(jù)泄露成本,并將數(shù)據(jù)泄露識(shí)別和遏制速度加快了8 天。

也就是說(shuō),只要恰當(dāng)使用LLM,注意安全防控,它會(huì)對(duì)企業(yè)的增效降本起到明顯的作用。

LLM泄露數(shù)據(jù)的幾個(gè)原因

想要實(shí)現(xiàn)LLM的安全使用,需要分析數(shù)據(jù)泄露的相關(guān)因素。

從已經(jīng)發(fā)生的實(shí)踐案例來(lái)看,造成ChatGPT等LLM數(shù)據(jù)泄露的主要原因,大概有以下幾點(diǎn):

1、用戶隱私泄露:在使用ChatGPT進(jìn)行客戶服務(wù)時(shí),企業(yè)通常需要獲取用戶的個(gè)人信息,如姓名、地址、電話等。這些信息一旦被未經(jīng)授權(quán)的第三方獲取,便可能導(dǎo)致用戶隱私泄露。

2、內(nèi)部安全風(fēng)險(xiǎn):ChatGPT作為一款人工智能語(yǔ)言模型,其生成和處理的敏感信息可能包括企業(yè)內(nèi)部的商業(yè)機(jī)密、計(jì)劃、策略等。如果這些信息被惡意利用,可能會(huì)對(duì)企業(yè)造成嚴(yán)重?fù)p失。

3、系統(tǒng)漏洞:盡管ChatGPT具有強(qiáng)大的技術(shù)實(shí)力,但其系統(tǒng)仍可能存在漏洞。如果黑客利用這些漏洞入侵企業(yè)服務(wù)器,便可能導(dǎo)致數(shù)據(jù)泄露。

理論上,只要我們針對(duì)性的解決這幾個(gè)問(wèn)題,LLM的安全使用也就不在話下。

現(xiàn)在,很多引入LLM的企業(yè)基本都建立了風(fēng)控機(jī)制,按照LLM使用流程的先后順序,這些機(jī)制包括加強(qiáng)安全培訓(xùn)、定期審查系統(tǒng)、加密處理敏感信息、使用可靠的人工智能服務(wù)提供商、建立應(yīng)急預(yù)案等。

在這些安全措施中,大家會(huì)發(fā)現(xiàn)“使用可靠的人工智能服務(wù)提供商”這一點(diǎn)最為重要,畢竟引入一個(gè)具備高度安全機(jī)制的LLM會(huì)事半功倍。其他幾點(diǎn)也能起到一定的作用,但多是為了防患于未然以及事后補(bǔ)救,并且其中的很多人為因素難以避免。

與此同時(shí),隨著技術(shù)的不斷發(fā)展,LLM的應(yīng)用也進(jìn)入到了AI Agent階段。

AI Agent有效避免LLM數(shù)據(jù)泄露

AI Agent是由AI驅(qū)動(dòng)的程序,當(dāng)給定目標(biāo)時(shí),能夠自己創(chuàng)建任務(wù)、完成任務(wù)、創(chuàng)建新任務(wù)、重新確定任務(wù)列表的優(yōu)先級(jí)、完成新的頂級(jí)任務(wù),并循環(huán)直到達(dá)到目標(biāo)。

使用AI Agent,只需輸入一句話或者更簡(jiǎn)單的指令,就能通過(guò)理解與分析獲悉用戶的意圖,進(jìn)而規(guī)劃并執(zhí)行一系列任務(wù),最終輸出詳盡而具體的答案。

AI Agent不僅讓輸入更加簡(jiǎn)單,也在一定程度上提高了安全系數(shù),有效避免了數(shù)據(jù)泄露的可能,還能最大限度發(fā)揮LLM的能力。

AI Agent正在快速影響更多領(lǐng)域,超自動(dòng)化領(lǐng)域也是如此。目前廠商們都在積極引入或自研大模型,并基于這些大模型打造Agent,以從安全、易用性等各方面提升超自動(dòng)化的應(yīng)用效率。

當(dāng)然,超自動(dòng)化Agent在數(shù)據(jù)安全方面遠(yuǎn)不是減少提示詞輸入那么簡(jiǎn)單。

超自動(dòng)化Agent破解LLM安全謎題

超自動(dòng)化領(lǐng)域如何通過(guò)AI Agent提升安全系數(shù)呢?

這里王吉偉頻道以實(shí)在智能業(yè)界首發(fā)的實(shí)在RPA Agent智能體為例,介紹超自動(dòng)化Agents如何保障用戶數(shù)據(jù)安全。

實(shí)在RPA Agent智能體是基于實(shí)在智能自研垂直領(lǐng)域大模型TARS構(gòu)建的RPA\超自動(dòng)化智能體,是一種能夠自主拆解任務(wù)、感知當(dāng)前環(huán)境、執(zhí)行并且反饋、記憶歷史經(jīng)驗(yàn)的RPA全新模式。

為了讓用戶更安全的使用AI智能體,實(shí)在RPA Agent智能體在TARS大語(yǔ)言模型和RPA工具包都設(shè)置的多重安全機(jī)制。

TARS大語(yǔ)言模型的安全機(jī)制側(cè)重于敏感數(shù)據(jù)、內(nèi)部政策和提示檢查。在預(yù)訓(xùn)練或SFT階段通過(guò)數(shù)據(jù)處理和文本分類算法刪除敏感數(shù)據(jù),在大模型的輸出結(jié)果之上疊加一個(gè)輔助安全模型,RLHF(人類反饋強(qiáng)化學(xué)習(xí))階段使用內(nèi)部策略,檢查用戶查詢并添加安全提示等。

這樣就能保證用戶輸入內(nèi)容的多層過(guò)濾,防止敏感數(shù)據(jù)的外露。

TARS大型語(yǔ)言模型上基于充分細(xì)致的語(yǔ)料收集和清洗、數(shù)據(jù)處理及標(biāo)注,超千億Tokens的預(yù)訓(xùn)練語(yǔ)料和超百萬(wàn)條指令微調(diào)數(shù)據(jù),實(shí)在智能獨(dú)立完整復(fù)現(xiàn)大模型構(gòu)建的預(yù)訓(xùn)練、指令微調(diào)和RLHF三階段,使大模型具備完整能力。

同時(shí)實(shí)在智能自主研發(fā)用于中文不當(dāng)言論判別和生成終止的Detoxify系統(tǒng),也提升了TARS的安全性和無(wú)害性,讓大模型“既懂事,又懂法”。

在RPA工具包上,TARS-RPA-Agent安全機(jī)制側(cè)重于機(jī)器人授權(quán)繼承和指揮官分配或分發(fā)授權(quán):

首先,RPA機(jī)器人的授權(quán)均繼承自創(chuàng)建機(jī)器人的用戶,同時(shí)其權(quán)限范圍也和所在賬號(hào)的權(quán)限是一致的,不會(huì)獲取超出其權(quán)限范圍的信息;

其次,RPA指揮官可以分配和控制TARS-RPA-Agent的授權(quán);

第三,在開(kāi)發(fā)過(guò)程中,實(shí)在智能設(shè)計(jì)了一個(gè)易于處理敏感數(shù)據(jù)的模塊,使得敏感數(shù)據(jù)更易于通過(guò)配置、刪除、導(dǎo)入等方式進(jìn)行設(shè)置。

除了LLM和RPA,TARS-RPA-Agent還包含其他輔助模塊,其中的安全機(jī)制側(cè)重于內(nèi)部知識(shí)庫(kù)認(rèn)證、內(nèi)部文檔訪問(wèn)以及用戶確認(rèn)。

有了面向LLM、RPA和輔助模塊的多重安全機(jī)制,在十幾層防護(hù)墻的共同作用下,想要泄露隱私數(shù)據(jù)都很難,徹底杜絕了前文所講的人為泄露數(shù)據(jù)的情況。再加上應(yīng)對(duì)系統(tǒng)漏洞的相關(guān)安全機(jī)制,足以把LLM應(yīng)用安全打造得固若金湯。

當(dāng)然,這還是直接使用TARS大模型或者調(diào)用API的情況。如果你是現(xiàn)金流充沛的企業(yè),采用本地部署大語(yǔ)言模型的方式,安全情況會(huì)更上一層樓。

需要說(shuō)明的是,這種整體安全解決方案非常適用于一些大型企業(yè)的LLM應(yīng)用安全過(guò)濾。

出于安全考慮,企業(yè)都希望在應(yīng)用LLM時(shí)過(guò)濾內(nèi)部敏感信息。

目前市面上的數(shù)據(jù)安全管理軟件,功能豐富但應(yīng)用復(fù)雜且價(jià)格不菲。為了LLM數(shù)據(jù)過(guò)濾這種單一應(yīng)用場(chǎng)景而斥巨資購(gòu)買全數(shù)據(jù)監(jiān)控軟件,顯然過(guò)于浪費(fèi),并不是LLM數(shù)據(jù)過(guò)濾的最優(yōu)選。

事實(shí)上,這類需求更適合LLM技術(shù)供應(yīng)商基于大語(yǔ)言模型技術(shù)路徑去做。只需在其LLM產(chǎn)品體系中添加隱私數(shù)據(jù)過(guò)濾功能,為企業(yè)用戶開(kāi)放不斷更新或增刪敏感數(shù)據(jù)庫(kù)內(nèi)容的權(quán)限。

這種模式,不僅能為本身大語(yǔ)言模型提供過(guò)濾安全功能,還能用于企業(yè)所使用的OpenAI、文心一言等第三方大語(yǔ)言模型,能夠在最大限度保護(hù)員工創(chuàng)造力的同時(shí)做好公司敏感數(shù)據(jù)的防護(hù)。

這樣,企業(yè)就能實(shí)現(xiàn)花一份錢去保障更多LLM的安全。

如果你的企業(yè)正在為L(zhǎng)LM的應(yīng)用安全及預(yù)算而發(fā)愁,不妨試試實(shí)在智能的這種安全解決方案,或許會(huì)讓你眼前一亮。

全文完

【王吉偉頻道,關(guān)注AIGC與IoT,專注數(shù)字化轉(zhuǎn)型、業(yè)務(wù)流程自動(dòng)化與RPA,歡迎關(guān)注與交流?!?/p>

 

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
大模型

相關(guān)文章

  • “創(chuàng)造市場(chǎng)”與“算法進(jìn)化”,中美AI競(jìng)速的岔路口

    “人工智能的商業(yè)模式,是要?jiǎng)?chuàng)造一個(gè)市場(chǎng),而非一個(gè)算法”。這是世界AI泰斗MichaelI.Jordan的觀點(diǎn)。而當(dāng)前的全球AI市場(chǎng),占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個(gè)方向,或許已經(jīng)無(wú)法直接進(jìn)行排位先后、優(yōu)

    標(biāo)簽:
    ai智能
  • 智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實(shí)在智能最新發(fā)布的實(shí)在Agent7.0,看RPAAgent的迭代升級(jí)抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實(shí)現(xiàn)了流程全自動(dòng)化AIAgent構(gòu)建到執(zhí)行全自動(dòng)化,持續(xù)進(jìn)化RPAAgent再次降低智能體應(yīng)用門檻實(shí)在智能重磅發(fā)布實(shí)

  • 崔大寶:大模型降溫背后的難點(diǎn)、卡點(diǎn)、節(jié)點(diǎn)

    崔大寶|節(jié)點(diǎn)財(cái)經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢(shì):資本市場(chǎng),與之關(guān)聯(lián)的概念炒不動(dòng)了,英偉達(dá)股價(jià)動(dòng)輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費(fèi)市場(chǎng),BATH們的推新活動(dòng)少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場(chǎng)酣仗:自5月15日字節(jié)跳動(dòng)宣布“以厘計(jì)費(fèi)”,打響國(guó)內(nèi)大模型

    標(biāo)簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對(duì)論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒(méi)錄你,錄了個(gè)數(shù)字人。圖片來(lái)源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來(lái)越多的傳統(tǒng)企業(yè)和機(jī)構(gòu)開(kāi)始用上了“數(shù)字員工”。甚至很多中國(guó)人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡(jiǎn)單翻看一下全國(guó)各地事業(yè)單位的“錄

    標(biāo)簽:
    數(shù)字人
  • 來(lái)到IPO關(guān)口,地平線離“三分天下”還有多遠(yuǎn)?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過(guò)中國(guó)證監(jiān)會(huì)IPO備案,擬發(fā)行不超過(guò)11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計(jì)籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級(jí)輔助駕駛(ADAS)和高階自動(dòng)駕駛(AD)解決方案供

  • 機(jī)器人大會(huì)引領(lǐng)產(chǎn)業(yè)動(dòng)向,卓翼飛思繪制無(wú)人系統(tǒng)教科研新藍(lán)圖

    8月21日,萬(wàn)眾矚目的2024世界機(jī)器人大會(huì)暨博覽會(huì)在北京亦創(chuàng)國(guó)際會(huì)展中心盛大開(kāi)幕。這場(chǎng)為期5天,集“展覽”“論壇”“賽事”于一體的機(jī)器人盛會(huì),反映了當(dāng)下機(jī)器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計(jì)數(shù)據(jù),今年現(xiàn)場(chǎng)逛展觀眾高達(dá)25萬(wàn)人次,比去年增加25%。機(jī)器人行業(yè)有多火?看看2024世界機(jī)器人大會(huì)火爆程度便可知

  • 卓翼智能:超大載重高烈度環(huán)境特種智能系留無(wú)人平臺(tái)的應(yīng)用與未來(lái)

    瞄準(zhǔn)場(chǎng)景需求,打造國(guó)內(nèi)領(lǐng)先的自主可控、高質(zhì)量超大載重高烈度環(huán)境特種智能系留無(wú)人平臺(tái)。卓翼智能亮相HICOOL峰會(huì)以科技實(shí)力榮摘?jiǎng)?chuàng)業(yè)大賽一等獎(jiǎng)這個(gè)比賽5年培育出16家“獨(dú)角獸”HICOOL2024全球創(chuàng)業(yè)者峰會(huì)暨創(chuàng)業(yè)大賽已于8月25日在北京圓滿落下帷幕,大賽共吸引了124個(gè)國(guó)家和地區(qū)的7406個(gè)創(chuàng)業(yè)項(xiàng)

  • 60萬(wàn)獎(jiǎng)金召喚AI創(chuàng)新者,2024無(wú)錫國(guó)際人工智能創(chuàng)新應(yīng)用大賽火熱進(jìn)行中!

    人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量。無(wú)錫市作為中國(guó)的科技創(chuàng)新中心之一,正通過(guò)構(gòu)建人工智能"算力+算法+數(shù)據(jù)"三要素齊備的產(chǎn)業(yè)生態(tài),為產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用提供強(qiáng)大支撐,通過(guò)“AI+”行動(dòng)推動(dòng)人工智能與多個(gè)產(chǎn)業(yè)交叉融合,實(shí)現(xiàn)技術(shù)落地和產(chǎn)業(yè)化,加速形成新質(zhì)生產(chǎn)力,打造具有國(guó)際競(jìng)爭(zhēng)力的產(chǎn)業(yè)創(chuàng)新智造

  • “云+AI”驅(qū)動(dòng)操作系統(tǒng)創(chuàng)新升級(jí),龍蜥堅(jiān)持可持續(xù)發(fā)展路線

    近日,2024龍蜥操作系統(tǒng)大會(huì)(OpenAnolisConference)在北京圓滿召開(kāi),此次大會(huì)由中國(guó)計(jì)算機(jī)學(xué)會(huì)開(kāi)源發(fā)展委員會(huì)、中關(guān)村科學(xué)城委員會(huì)、海淀區(qū)委網(wǎng)信辦、中國(guó)開(kāi)源軟件推進(jìn)聯(lián)盟指導(dǎo),龍蜥社區(qū)主辦,阿里云、浪潮信息、Intel、中興通訊、Arm、中科方德等24家理事單位共同承辦,主題為“進(jìn)化