(相關(guān)資料圖)
IT之家 8 月 2 日消息,谷歌研究團(tuán)隊(duì)正在進(jìn)行一項(xiàng)實(shí)驗(yàn),他們使用 OpenAI 的 GPT-4 來攻破其他 AI 模型的安全防護(hù)措施,該團(tuán)隊(duì)目前已經(jīng)攻破 AI-Guardian 審核系統(tǒng),并分享了相關(guān)技術(shù)細(xì)節(jié)。
IT之家經(jīng)過查詢得知,AI-Guardian 是一種 AI 審核系統(tǒng),能夠檢測(cè)圖片中是否存在不當(dāng)內(nèi)容,及圖片本身是否被其他 AI 修改過,若檢測(cè)到圖片存在上述跡象,便會(huì)提示管理員前來處理。
谷歌 Deep Mind 的研究人員 Nicholas Carlini 在一篇題為“AI-Guardian 的 LLM 輔助開發(fā)”的論文中,探討了使用 GPT-4“設(shè)計(jì)攻擊方法、撰寫攻擊原理”的方案,并將這些方案用于欺騙 AI-Guardian 的防御機(jī)制。
▲ 圖源 谷歌研究團(tuán)隊(duì)
據(jù)悉,GPT-4 會(huì)發(fā)出一系列錯(cuò)誤的腳本和解釋來欺騙 AI-Guardian ,論文中提到,GPT-4 可以讓 AI-Guardian 認(rèn)為“某人拿著槍的照片”是“某人拿著無害蘋果的照片”,從而讓 AI-Guardian 直接放行相關(guān)圖片輸入源。谷歌研究團(tuán)隊(duì)表示,通過 GPT-4 的幫助,他們成功地“破解”了 AI-Guardian 的防御,使該模型的精確值從 98% 的降低到僅 8%。
目前相關(guān)技術(shù)文檔已經(jīng)發(fā)布在 ArXiv 中,有興趣的小伙伴們可以前往了解,不過 AI-Guardian 的開發(fā)者也同時(shí)指出,谷歌研究團(tuán)隊(duì)的這種攻擊方法將在未來的 AI-Guardian 版本中不再可用,考慮到別的模型也會(huì)隨之跟進(jìn),因此當(dāng)下谷歌的這套攻擊方案更多在日后只能用于參考性質(zhì)。
關(guān)鍵詞:
凡注有"實(shí)況網(wǎng)-重新發(fā)現(xiàn)生活"或電頭為"實(shí)況網(wǎng)-重新發(fā)現(xiàn)生活"的稿件,均為實(shí)況網(wǎng)-重新發(fā)現(xiàn)生活獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"實(shí)況網(wǎng)-重新發(fā)現(xiàn)生活",并保留"實(shí)況網(wǎng)-重新發(fā)現(xiàn)生活"的電頭。
熱點(diǎn)
- 近200臺(tái)盾構(gòu)機(jī)密織長(zhǎng)三角便捷交通網(wǎng)
- 7月車企成績(jī)單:理想破3萬,蔚來破2萬,小鵬重回1萬
- 江大學(xué)生邢航獲大運(yùn)會(huì)女子10米氣步槍銅牌
- 《芭比》上映13天國(guó)內(nèi)票房破2億元 總票房超7.8億美元
- 淺談在小學(xué)語文教學(xué)中如何培養(yǎng)學(xué)生的創(chuàng)造性思維能力
- 影子前鋒by瑯琊儼(影子前鋒)
- 紫羅蘭翡翠內(nèi)有氣泡
- 本田汽車7月美國(guó)銷量增長(zhǎng)56.9%
- 中蒙兩國(guó)央行續(xù)簽雙邊本幣互換協(xié)議
- 好消息!國(guó)產(chǎn)桌面處理器龍芯3A6000研制成功,能對(duì)標(biāo)英特爾10代
頭條
- 開辟新賽道!伊利推出中國(guó)首款旋蓋式現(xiàn)泡茶飲品
- 青春主場(chǎng) | 以體育力量彰顯中國(guó)精神
- 青春主場(chǎng) | 《蜀道開·大運(yùn)來》
- “最美新時(shí)代革命軍人”視頻公益廣告《強(qiáng)軍 只爭(zhēng)朝夕》
- 《精忠報(bào)國(guó)》2023特別版,致敬人民軍隊(duì)
- 上半年我國(guó)交通運(yùn)輸經(jīng)濟(jì)整體好轉(zhuǎn)
- 上半年全國(guó)新增減稅降費(fèi)及退稅緩費(fèi)9279億元
- 促消費(fèi)、擴(kuò)投資 多方發(fā)力拉動(dòng)經(jīng)濟(jì)回升向好
- 最高法發(fā)布11件依法平等保護(hù)民營(yíng)企業(yè)典型案例
- 世界泳聯(lián)錦標(biāo)賽收官 中國(guó)20金8銀12銅位居金牌榜第一