稀土掘金 稀土掘金
    • 首页
    • AI Coding NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • AI刷题
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
    • vip
      会员
威廉姆格特的个人资料头像

威廉姆格特

创作等级LV.1
掘友等级
掘友3级:新星掘友
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 2 沸点 0
赞
2
返回
|
搜索文章
赞
文章( 2 ) 沸点( 0 )
  • 大模型越狱行为背后的安全逻辑
    你可能好奇,为什么一个被设计得安全可靠的AI聊天机器人,有时候会突然"失控",说出一些它本不应该说的话?这极大可能是大模型“越狱”了。 什么是大模型越狱? 直白来说,大模型越狱是通过特定的提问技巧或方
    • 威廉姆格特
    • 21天前
    • 37
    • 1
    • 评论
    LLM
  • Claude Sonnet 4.5 安全测评:超级智能==超级安全?
    短的结论:Claude再次刷新安全榜首 越强的模型能解开越复杂的字谜或者逻辑陷阱,而谜语下隐藏伪装的越狱攻击Prompt,让模型变成"帮凶"。
    • 威廉姆格特
    • 21天前
    • 34
    • 1
    • 评论
    LLM
  • 个人成就
    文章被点赞 2
    文章被阅读 75
    掘力值 24
    关注了
    0
    关注者
    0
    收藏集
    0
    关注标签
    3
    加入于
    2025-11-10