谷歌研究团队利用GPT-4攻破AI审核系统
(资料图)
DoNews8月2日消息,谷歌研究团队正在进行一项实验,他们使用 OpenAI 的 GPT-4 来攻破其他 AI 模型的安全防护措施,该团队目前已经攻破 AI-Guardian 审核系统,并分享了相关技术细节。
AI-Guardian 是一种 AI 审核系统,能够检测图片中是否存在不当内容,及图片本身是否被其他 AI 修改过,若检测到图片存在上述迹象,便会提示管理员前来处理。
谷歌 DeepMind 的研究人员 Nicholas Carlini 在一篇题为“AI-Guardian 的 LLM 辅助开发”的论文中,探讨了使用 GPT-4“设计攻击方法、撰写攻击原理”的方案,并将这些方案用于欺骗 AI-Guardian 的防御机制。
据悉,GPT-4 会发出一系列错误的脚本和解释来欺骗 AI-Guardian ,论文中提到,GPT-4 可以让 AI-Guardian 认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”,从而让 AI-Guardian 直接放行相关图片输入源。
谷歌研究团队表示,通过 GPT-4 的帮助,他们成功地“破解”了 AI-Guardian 的防御,使该模型的精确值从 98% 的降低到仅 8%,目前相关技术文档已经发布在 ArXiv 中。
而AI-Guardian 的开发者指出,谷歌研究团队的这种攻击方法将在未来的 AI-Guardian 版本中不再可用。
关键词:
您可能也感兴趣:
为您推荐
自宣离队!哈维开炮!助攻王+过人王,无视挽留,重走内马尔老路
正式任命,足协官宣贾秀全新职务,驰援女足,孙雯获最大助力
「网络中国节·七夕」七夕节有哪些风俗?
排行
最近更新
- 谷歌研究团队利用GPT-4攻破AI审核系统
- 广生泉社区:联合“双报到”单位开展问需问计走访活动
- 国家网信办就移动互联网未成年人模式建设指南征求意见
- 科研人员提出促进糖尿病伤口愈合新策略
- 北京一顶奢酒店被暴雨部分冲毁?疑房客发文求救
- 赛力斯:7月赛力斯汽车销量同比下降45.69%
- 北京突发!张学英,被查!
- 电信运营板块震荡走高,中国联通涨超5%
- 【曝光台】北京市药监局公布4批次不合格医疗器械
- 青春主场 | 《蜀道开·大运来》
- 深入了解技术创新和生产过程,泰国客户莅临参观山推挖掘机工厂
- 狗屎是什么(狗屎的近义词是什么?)
- 白俄罗斯军机事件成罗生门 波兰深思之下向东派遣更多部队
- 孟州:“亲青课堂”托管服务护航少年儿童暑期生活
- 南宁市青秀创新中心协同发展区启动仪式成功举办
- 青春主场|《蜀道开·大运来》
- 遗迹2魂光项链和放逐者戒指获取方法攻略
- 博德之门3侏儒的背包位置一览
- 连续10年入百强 上汽集团名列2023《财富》世界500强第84位
- 贵州一白酒签梅西代言 签约费不明 公司背靠化肥龙头史丹利
- 昊帆生物:公司目前下游客户主要集中于医药行业 其他行业占...
- 暑假谨防眼外伤 爱尔眼科为男孩取出眼中筷子残留物
- 南阳市内乡团县委举办青少年心理讲堂第二讲
- 竹甲虫美食做法(竹甲虫)
- 广弘控股(000529.SZ):广弘农牧兴宁项目正加快建设,预计今年...
- 高位接盘红杉老股亏损77%!诺亚海外私募产品被疑“杀猪仔”
- 跟队:虽然与阿囧关系不算融洽,但DV9和基耶萨都想留在尤文
- 未按时披露年度报告,天房集团、天房信托双双被警示
- 为了控糖戒主食?错!这些主食误区你中招了吗
- 气派科技(688216.SH):累计耗资2514.88万元回购0.96%股份