谷歌研究团队利用GPT-4攻破AI审核系统
(资料图片)
DoNews8月2日消息,谷歌研究团队正在进行一项实验,他们使用 OpenAI 的 GPT-4 来攻破其他 AI 模型的安全防护措施,该团队目前已经攻破 AI-Guardian 审核系统,并分享了相关技术细节。
AI-Guardian 是一种 AI 审核系统,能够检测图片中是否存在不当内容,及图片本身是否被其他 AI 修改过,若检测到图片存在上述迹象,便会提示管理员前来处理。
谷歌 DeepMind 的研究人员 Nicholas Carlini 在一篇题为“AI-Guardian 的 LLM 辅助开发”的论文中,探讨了使用 GPT-4“设计攻击方法、撰写攻击原理”的方案,并将这些方案用于欺骗 AI-Guardian 的防御机制。
据悉,GPT-4 会发出一系列错误的脚本和解释来欺骗 AI-Guardian ,论文中提到,GPT-4 可以让 AI-Guardian 认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”,从而让 AI-Guardian 直接放行相关图片输入源。
谷歌研究团队表示,通过 GPT-4 的帮助,他们成功地“破解”了 AI-Guardian 的防御,使该模型的精确值从 98% 的降低到仅 8%,目前相关技术文档已经发布在 ArXiv 中。
而AI-Guardian 的开发者指出,谷歌研究团队的这种攻击方法将在未来的 AI-Guardian 版本中不再可用。
关键词:
责任编辑:宋璟
-
谷歌研究团队利用GPT-4攻破AI审核系统
-
透视券商中期业绩预告:国泰君安为何“顺境”下滑?
-
深圳10家企业上榜,比亚迪进步最大!2023《财富》世界500强揭晓
-
东方国信董秘回复:公司严格遵守证监会、交易所的相关规定及国家法律法规
-
国家网信办:将全面升级“青少年模式”为“未成年人模式”
-
2023 年财富世界 500 强排行榜揭晓,中国 142 家公司上榜
-
睿思飞深挖中国跨境电商市场机遇
-
多地探索!外卖骑手受聘为“食品安全监督员”
-
首批7单混合型科创票据大起底:股债联动如何为科创企业融资再添利器?
-
从安阳殷墟到郑州商城 准大学生溯源殷商文明
-
读创公司问答|中国铝业:目前并不直接从事稀土生产与销售;国芯科技:小鹏汽车是公司客户
-
甘肃首届大中小学思政课教学“大比武” 推进教师队伍建设
-
券商股低开高走 财达证券涨超9%
-
农业农村部强化技术指导保障秋粮生产
-
养老、就业、个税……这些新规8月“上线”
-
狐大医 | 孩子消瘦=营养不良?遗传、心理、饮食等或是幕后“黑手”
-
暑运过半中国铁路发送旅客逾4亿人次
-
欧冠黑马?加拉塔萨雷连签二弟、扎哈,总身价2.23亿欧创土超纪录
-
特斯拉Model(3轮胎怎么拆卸和安装的?)
-
消防员证书有哪些等级_消防员证书有什么用
-
魔王之契约怎么用(魔王之契约礼包)
-
点赞!望城这项工作荣获应急部表扬
-
甘字少一横怎么读 甘字少一横是什么字廿怎么读
-
不动产证是什么意思(不动产证是什么)
-
山西大同市第三届“工匠杯”职工职业技能竞赛举行
-
孚能科技:控股股东或将变更为广州工控集团
-
能重用张琳艳,为什么不给国少国青队长机会?不用,叫她回来干嘛
-
河北降级发布暴雨蓝色预警 降水范围缩小局地雨量仍较大
-
明天8月2日开始运势最好的生肖
-
开发三昧在线观看_开发三昧
-
【成都大运会】吃着烧烤唱着歌 成都大运会外籍运动员感受成都夜生活
-
国内棉价创年内新高!纱企跟涨乏力期待“金九银十”
-
管理体系认证费用(管理体系认证是什么)
-
银行也拼了!存款、理财“拼团购”重现 合规风险能否避免?
-
未来中国,哪些赛道蕴藏新机遇?