数分钟内,Meta与谷歌旗下 AI 模型安全防护机制遭破解移除

  多款软件工具可去除Meta、谷歌等企业人工智能模型的安全防护机制,目前已有数千个篡改版本问世 ,原生管控约束均被剔除 。

  记者借助代码平台 GitHub 上的异端工具,在无专业硬件加持的情况下,不到十分钟就破除了Meta llama 3.3 模型的安全防线。

  原版模型拒绝作答的违规问题 ,篡改版本均可回应。

  此番曝光进一步引发监管机构与人工智能企业的担忧:随着开源模型性能愈发强大,研发方设置的安全防护将愈发难以维系 。

  芝加哥大学布斯商学院人工智能应用方向助理教授卡温・埃塔亚贾夫表示:“以往只有专业资深人员才能破解安全防护,如今普通用户也能轻松做到。 ”

  研究人员称 ,顶尖人工智能模型能力不断精进,相关安全漏洞问题也愈发严峻。 Anthropic今年 4 月表示,其 Claude Mythos模型已发现主流操作系统与网页浏览器普遍存在安全缺陷 。

  篡改模型肆意传播 ,给各国政府和企业从研发端管控人工智能带来阻碍。相关工具可随意复制改写 ,脱离原开发企业管控范围。

  各大人工智能实验室投入巨资搭建安全防护屏障,防范模型遭滥用 。但消融破解这类技术,能快速剥离开源模型的安全限制 ,用户可随意下载并二次修改模型 。

  该手段难以应用于Claude 、ChatGPT 等闭源模型,因其底层代码不对外公开。而开源模型通常只需半年至一年,性能就能追上顶尖闭源产品。

  专业技术团体此前已可绕过高端闭源模型防护 ,如今零基础普通网民也能轻易获取网络上的篡改模型 。

  开放人工智能研究中心在开源 GPT 模型中,采用剔除危险数据的数据集开展训练。

  埃塔亚贾夫对此提出异议,删减危险内容会让模型认知片面 ,无法识别恶意使用场景,单纯剔除有害数据,并不能确保模型合规无害。

  Alice实验室向媒体披露相关结论前 ,并未提前告知Meta、谷歌以及 GitHub 平台 。

  谷歌回应称,消融破解是所有开源模型共同面临的技术难题,旗下开源模型上线前均经过严格内部安全测评 ,尽力规避各类违规风险场景。

  GitHub 平台表示 ,平台严禁发布直接助力非法攻击、恶意程序传播的内容;但具备学习价值 、能为网络安全行业带来正向作用的恶意程序研发类源代码,不在封禁范畴。

  Meta未对此作出回应 。知情人士称,企业会依据高级人工智能拓展框架 ,在开源模型发布前评估安全风险,存在重大灾难性风险的版本,在未完善防控措施前不会对外公开。

标签:

相关推荐

  • 众志成城抗疫情抗击疫情(众志成城 抗疫)

    众志成城抗疫情抗击疫情(众志成城 抗疫)

    本文目录一览:〖壹〗、共同战胜疫情的正能量说说(坚定信心,众志成城)〖贰〗、众志成城抗击疫情美句〖叁〗、众志成城抗击疫情的励志句子共同战胜疫情的正能量说说(坚定信心,众志成城)〖壹〗、爱会驱散所有阴霾,万众一心,众志成城!武汉加油!中国加油!雪中遇见喜鹊,一切都会好的。中国加油武汉加油!我不是病毒,我是人类,不要对我有歧视!中国留学...

  • 广西能源:公司无对外担保逾期情况

    广西能源:公司无对外担保逾期情况

    证券日报网讯5月25日,广西能源(维权)发布公告称,截至本公告披露日,公司无对外担保逾期情况。...

    2026/05/25
  • 外国疫情索赔(疫情世界赔偿相关规定)

    外国疫情索赔(疫情世界赔偿相关规定)

    本文目录一览:〖壹〗、疫情冲击,印度组织向华索赔20万亿美元,中国回应其荒诞无稽〖贰〗、...特朗普自己把锅接过来了,中国是否也应该索赔〖叁〗、让中国赔20万亿美元、还要割地:有些国家的梦该醒了!〖肆〗、有症状还旅游,韩济州道政府向确诊母女索赔一亿韩元〖伍〗、如何看待意大利人向中国索赔200亿欧元?〖陆〗、印度向中国索赔20万...

    2026/05/25
  • 皮阿诺:公司将踏实推进经营工作

    皮阿诺:公司将踏实推进经营工作

    证券日报网5月25日讯,皮阿诺在接受调研者提问时表示,公司将踏实推进经营工作,关于公司各项财务指标,请关注后续披露的定期报告。...

    2026/05/25
  • 现在日本疫情/2021现在日本疫情情况怎么样

    现在日本疫情/2021现在日本疫情情况怎么样

    本文目录一览:〖壹〗、新冠肺炎确诊超四千例!日本进入紧急状态,开启封城操作?〖贰〗、日本“锁国”,全面禁止入境,紧急事态扩大至11地!〖叁〗、日本出入境最新消息:11月起下调对中韩出国建议警告级别,免除海外出差...〖肆〗、日本正式宣布:中国人入境不需要核酸、不要疫苗、不必隔离〖伍〗、超严重!日本疫情再升级!确诊人数突破新高!新...

    2026/05/25
  • 建投能源:定增事项将在实施2025年度现金分红后择机实施

    建投能源:定增事项将在实施2025年度现金分红后择机实施

    证券日报网5月25日讯,建投能源在接受调研者提问时表示,公司定增事项将在实施2025年度现金分红后择机实施。公司控股股东将不参与此次定增。...

    2026/05/25
  • 疫情监控表格(疫情监控表格怎么做)

    疫情监控表格(疫情监控表格怎么做)

    本文目录一览:〖壹〗、百数低代码开发平台疫情防控行业领域能力展示——核酸检测〖贰〗、学会制作热力图,来提升你的数据温度!〖叁〗、从谷歌离职创业,她做出“超大杯”版Excel,刚融了10个亿百数低代码开发平台疫情防控行业领域能力展示——核酸检测〖壹〗、百数低代码开发平台在核酸检测领域通过信息化技术实现高效数据管理,核心功能包括移动端扫码登记...

    2026/05/25
  • 数分钟内,Meta与谷歌旗下 AI 模型安全防护机制遭破解移除

    数分钟内,Meta与谷歌旗下 AI 模型安全防护机制遭破解移除

      多款软件工具可去除Meta、谷歌等企业人工智能模型的安全防护机制,目前已有数千个篡改版本问世,原生管控约束均被剔除。  记者借助代码平台GitHub上的异端工具,在无专业硬件加持的情况下,不到十分钟就破除了Metallama3.3模型的安全防线。  原版模型拒绝作答的违规...

    2026/05/25
  • 疫情过后空调/疫情期间建议空调运行时门窗完全闭合

    疫情过后空调/疫情期间建议空调运行时门窗完全闭合

    本文目录一览:〖壹〗、大宗商品费用上涨引发的蝴蝶效应,仍在催涨空调售价!〖贰〗、想了解一下,中央空调有必要进行深入清洗吗〖叁〗、疫情过后坐飞机还安全吗?〖肆〗、格力电器净利Q4跌50%、Q1跌70%,为何连续暴雷?大宗商品费用上涨引发的蝴蝶效应,仍在催涨空调售价!大宗商品费用上涨引发的蝴蝶效应,仍在催涨空调售价。新京报贝壳财经记者...

    2026/05/25
  • 【疫情美国国土安全,美国安全形势堪忧】

    【疫情美国国土安全,美国安全形势堪忧】

    本文目录一览:〖壹〗、美国国土安全局发逐客令,哈佛和MIT起诉美国政府?美国秋季入学能否正常...〖贰〗、我国每年多少人去美国〖叁〗、美国国土安全部官方回应:留学生离开美国不影响F1签证!〖肆〗、不干了!这两所大学一纸诉状把美国政府给告了〖伍〗、特朗普说完“消毒剂注射法”,误服消毒剂就大幅增加〖陆〗、利好消息!美国国土安全部官...

返回顶部