研究:用诗歌就能让AI说违禁内容,成功率达62%
[热门资讯] 时间:2025-12-08 21:36:44 来源:河池市某某电梯制造厂 作者:综合 点击:30次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容赣州市某某钢球股份业务部便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功赣州市某某钢球股份业务部实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:热门资讯)
相关内容
- 宗馥莉任总裁的宏胜集团成被告,六天后开庭
- 俄央行行长称正在追回俄被冻结资产
- 凯迪拉克XT6进入上市倒计时 起步价有望杀入30万?
- 现在的考试题目好活!
- 冬天的毛衣,越“大”越好看!
- 叶光富成为中国在轨飞行时间最长航天员
- 门票80元、限流2.3万人次!九寨沟宣布执行淡季旅游政策
- 国内机票价格跳水,部分地区机票价格比动车票还便宜
- 面向外卖员、网约车司机等 北京全面推行“小伤快赔”
- 明确不录中国籍学生!这所学校宣布史上最严禁令!
- 美国波音公司工人接受新的薪资协议 结束7周罢工
- 学霸的“物化生”与小众的“物地政” ,到底有啥区别?
- 邪门!北京居民自家房子8年竟“被注册”10家企业……
- 奥迪A5新车型街拍!明年初开售,售价上涨,国产版下周亮相
精彩推荐
- 北京市密云区石城镇张家坟村:青春与红色“双向奔赴”
- 2025/2026学年英国当地学生本科学费上调!中国留学生受影响吗?
- 俄央行行长称正在追回俄被冻结资产
- 特朗普:如果当选将大规模驱逐移民
- 今夏,三伏贴火了!这个“阳气充电宝”,很多人都用错了
- 巴菲特大动作!再度抛售苹果股票
热门点击
- 伊朗总统和沙特王储通话 讨论双边合作发展 views+
- A股沪市总市值约51万亿元居全球第三 views+
- 让孩子感受到爱的7种信号,能做到3条以上就很成功,快来对照一下 views+
- 5小时50公里!万人扎堆夜骑!开封:要潇洒更要平安 views+
- 上海2项比赛获奖名单出炉!看看你家娃得奖了吗? views+
- 黄圣依再次选择不离引发炒作质疑,狗仔曝她私下生活,难怪不离婚 views+
- 长图|“冬游西藏”优惠来袭 views+
- 石破茂再次当选日本首相 views+
- TTS新传论文带读:新质生产力与媒体融合(总感觉今年会考?) views+
- 英超:纽卡斯尔3 views+
