首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
威廉姆格特
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 2
沸点 0
赞
2
返回
|
搜索文章
赞
文章( 2 )
沸点( 0 )
大模型越狱行为背后的安全逻辑
你可能好奇,为什么一个被设计得安全可靠的AI聊天机器人,有时候会突然"失控",说出一些它本不应该说的话?这极大可能是大模型“越狱”了。 什么是大模型越狱? 直白来说,大模型越狱是通过特定的提问技巧或方
Claude Sonnet 4.5 安全测评:超级智能==超级安全?
短的结论:Claude再次刷新安全榜首 越强的模型能解开越复杂的字谜或者逻辑陷阱,而谜语下隐藏伪装的越狱攻击Prompt,让模型变成"帮凶"。
个人成就
文章被点赞
2
文章被阅读
75
掘力值
24
关注了
0
关注者
0
收藏集
0
关注标签
3
加入于
2025-11-10