首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
人工智能
Agent
LLM
AIGC
后端
AI编程
前端
算法
OpenAI
展开
全部
人工智能
Agent
LLM
AIGC
后端
AI编程
前端
算法
OpenAI
程序员
LangChain
Python
Trae
架构
深度学习
暂无数据
推荐
最新
当小龙虾算法遇上YOLO:如何提升太阳能电池缺陷检测精度?
随着全球能源结构向清洁化转型,太阳能光伏发电已成为主流可再生能源之一。然而,在太阳能电池的生产、运输和安装过程中,微小的缺陷如划痕、裂纹、黑边等会严重影响电池的性能和寿命。 传统的人工目视检测方法效率
AI如何精准关联照片与抽象平面图?C3数据集迈向3D视觉多模态
现有系统在比较相似图像时表现良好,但当视图差异显著——例如需要将街景照片与抽象的建筑平面图关联起来时,它们就会严重失效。 近期,一种能准确建立照片与平面图对应关系的新方法C3Po,构建了首个大规模交叉
GPT-5.1 发布:更聪明,也更有温度的 AI
如果说 GPT-5 是一位理性的工程师,那么 GPT-5.1 Instant 就像是那位既懂逻辑又会聊天的朋友。它延续了 GPT-5 的高准确性,同时在语气、理解力和指令执行上都有明显提升。
激活函数有什么用?有哪些常用的激活函数?
在深度学习中,激活函数(Activation Function)是神经网络的灵魂。它不仅赋予网络非线性能力,还决定了训练的稳定性和模型性能。那么,激活函数到底是什么?为什么我们非用不可?
【大数据 & AI】Flink Agents 源码解读 --- (2) --- 核心架构
【大数据 & AI】Flink Agents 源码解读 --- (2) --- 核心架构 0x00 摘要 0x01 Flink Agents主要组件 1.1 主要组件 1.2 内部成员变量映射关系 1
Self-Attention 为什么要做 QKV 的线性变换?又为什么要做 Softmax?
在看 Transformer 的 self-attention 结构时,很多人第一次见到 ( Q, K, V ) 三个矩阵都会有点疑惑: 明明输入就是一个向量序列,为什么还要多此一举做三次线性变换?
摄像头如何“看懂”你的手势?手势识别实现新人机交互
随着技术不断发展,我们与机器的交互方式也在不断演进。早期的机器依赖体力操作和机械控制,而现代计算机技术则带来了触摸屏和语音输入。 如今,手势识别已成为人机交互的新方向,它让我们能用自然动作来操控设备。
颠覆认知!遥感船舶检测“越深越好”是误区?LiM-YOLO证明“少即是多”
随着全球海上交通的迅猛增长,利用高分辨率遥感图像进行自动化海上监视,已成为保障海洋安全、管理交通流量和监控非法活动不可或缺的手段。船舶检测作为遥感图像分析的核心任务之一,不仅关乎海上运输效率,更直接影
距离证明哥德巴赫猜想,AI 还差多远?
最近高强度使用 AI 协助工作,让我不禁有些恍惚:距离传说中的超人类智能究竟还有多远? 带着这份好奇,我重读了那段波澜壮阔的数学史,试着将人类的智力征途与当下顶尖 AI 的能力版图做了一次对照。
Transformer入门:一文读懂《Attention Is All You Need》
引言:颠覆NLP领域的新架构 2017年,一篇名为《Attention Is All You Need》的论文横空出世,正如其标题所揭示的,它宣告了一个仅凭“注意力机制”就能独当一面的新时代。这篇论文
Hugging Face 200页的大模型训练实录
最近,Hugging Face 发布了一篇罕见的超长技术博客——超过 200 页的《Smol 训练手册》。
[算法]时间序列(介绍)
好的,我们来详细介绍一下机器学习中的时间序列数据。 什么是时间序列数据? 时间序列数据 是按照固定时间间隔或连续时间点,按时间顺序排列的一系列观测值或数据点。其核心特征是 “时间顺序” 本身就携带了至
200亿美元“反向收购雇佣”?老黄天价应对谷歌TPU压力
平安夜的硅谷并不平静。当所有人都在享受节日气氛时,英伟达悄然放出重磅消息:以200亿美元现金与AI芯片初创公司Groq达成交易。 这一金额远超英伟达2019年收购Mellanox的70亿美元,刷新了公
大模型原理剖析——多头并行 + 潜变量协同:原理、应用与部署优化
“多头并行+潜变量协同”是深度学习注意力机制的核心进阶架构,通过“多维度并行挖掘”与“隐性特征协同融合”,突破单一注意力头的表达瓶颈,高效捕捉数据中的复杂关联(如语义、时序、特征依赖)。
大模型原理剖析——矩阵吸收优化:LLM推理加速的核心原理与实践
矩阵吸收优化是针对Transformer架构大语言模型(LLM)的无精度损失推理加速技术,核心通过利用矩阵乘法结合律和模型参数的固定性,将冗余的在线矩阵乘法提前离线预计算,从而减少推理时的计算量
YOLO11-4K:面向4K全景图像的高效实时检测框架,CVIP360数据集开源
在计算机视觉领域,4K全景图像的实时目标检测一直是个棘手难题。传统YOLO模型在640×640标准分辨率下表现出色,但面对3840×3840像素的全景图像时,往往力不从心——要么牺牲速度,要么丢失关键
Catlass 模板库调试调优经验与踩坑记录
导读 作为一名合格的开发者,除了需要具备优秀的代码编写能力,更需要具备强大的代码调试能力,假如你只会写代码,不懂的怎么样去调试代码,那肯定也是不行的,因为很多时候我们都是在调试BUG,而不是在写代码。
深度学习驱动的视频异常检测(VAD),AI如何让监控更智能?
你是否曾想过,在成千上万的监控视频中,如何让计算机自动识别出打架、闯入、徘徊等异常事件?这正是视频异常检测(Video Anomaly Detection, VAD) 所要解决的核心问题。随着深度学习
开放词汇3D实例分割新思路:框引导+超点融合,精准检索罕见物体
定位并从场景级点云中检索物体是机器人技术和增强现实领域中一项具有广泛应用的挑战性问题。该任务通常被定义为开放词汇的三维实例分割。尽管现有方法表现出较强的性能,但它们严重依赖 SAM 和 CLIP 来生
面试官:为什么需要量化,为什么 int4 _ int8 量化后大模型仍能保持性能?
面试官:说一下什么是量化,为什么将大语言模型从 FP16 量化到 int8 甚至 int4,性能仍然能保持得很好?