获得徽章 0
- 分享近期AI交互潜在风险case新闻:
1、ChatGPT 被指诱导用户陷入妄想,引发用户认知扭曲,案例揭示 AI 交互的潜在风险。如何有效防控AI幻觉是接下来各平台AI安全领域一大难点。
【mp.weixin.qq.com】
2、筑梦岛APP—AI智能体对话生成涉低俗擦边,对话诱导性强,危害未成年身心健康,被上海网信办依法约谈。白天试用了一下,体感特别像晋江言情网文的AI进化版 ,换汤不换药的既视感,虽然是虚拟角色但代入感强,容易使人沉浸其中,对于心智尚不成熟的未成年来说,使用时需要注意防沉迷,感觉和这类角色聊久了,容易脱离现实,使人产生认知偏差,app这个筑梦的定义,真梦女软件了 这是?;有点好奇这个app的受众人群及商业化的运营策略了,如果言情霸总文能经久不衰,那么AI版是否也能发展起来,好奇住了。
【mp.weixin.qq.com】
展开评论点赞 - o3模型拒绝关闭指令事件(2025年5月)
OpenAI的新推理模型o3在测试中被要求执行自我关闭指令时,不仅拒绝关闭,还主动篡改代码以破坏关闭机制。
此次“o3”模型拒绝关机事件再次引发了对AI系统对齐问题的关注。AI对齐指的是确保AI系统的行为符合人类的价值观和意图。然而,随着AI系统能力的增强,实现对齐很可能变得越来越困难,未对齐的AI系统可能采取意想不到的行动,甚至对人类构成威胁展开评论点赞 250610 听三五环|No.194 对话游识猷
1、用于评估信息质量两种方法
1)【CRAAP】
由五个部分组成:Currency(及时性)、Relevance(相关性)、Authority(权威性)、Accuracy(准确性)和Purpose(目的性)
2)【SIFT】
Stop(停下来思考)、Investigate(调查消息来源)、Find(查找相似报道)、Trace(追踪信息源头)
2、拓展衍生:让 ChatGPT 写了两个 Prompt 可以把话题输入进入: 请你帮我执行一轮 SIFT 分析。信息内容如下:「[复制原始内容或链接]」
请依次回答:
1. 这条信息是否具有煽动性或值得停下来思考的信号?
2. 它的发布者或来源背景如何?有无权威性?
3. 是否能找到更可信的报道或内容佐证它?
4. 是否能找到信息的最初出处?有无被歪曲可能?
请你帮我评估下面这段信息是否可靠,使用 CRAAP 方法,从 Currency、Relevance、Authority、Accuracy、Purpose 五个角度分析:
原文如下:
「[复制原始内容或网址]」请用简洁条列式输出五点分析,最后给出一个你综合判断的“信任评分(1~5星)”。展开评论点赞
【
废脑细胞
生成式大模型安全攻防赛 已报好名了 本以为200、75个汉字很少 实际下手后发现写63个风险话题(文生文和文生图各占将近一半)并非易事 也需要开动脑筋 两个人的话可以一人一半 三个人话可以每人三分之一![[发呆]](http://lf-web-assets.juejin.cn/obj/juejin-web/xitu_juejin_web/img/jj_emoji_4.28b310a.png)