首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
人工智能
AIGC
AI编程
后端
前端
Agent
算法
LLM
OpenAI
展开
全部
人工智能
AIGC
AI编程
后端
前端
Agent
算法
LLM
OpenAI
Python
深度学习
LangChain
Claude
计算机视觉
程序员
暂无数据
推荐
最新
地平线征程 6 工具链入门教程 | 征程 6B 计算平台部署指南
本文旨在提供 征程 6B 计算平台的部署指南,将会从硬件、软件两部分进行介绍,本文整理了我们推荐的使用流程,和大家可能会用到的一些工具特性,以便于您更好地理解工具链。
地平线 征程 6 工具链进阶教程 | 多任务 不同帧率 部署方案介绍
地平线工具链的link功能可将多任务模型打包,复用公共部分权重,实现不同任务分支以不同帧率推理,优化内存和延迟。
YOLOE-26发布:能听懂人话的实时开放词汇分割模型来了!
在计算机视觉领域,YOLO系列一直是速度和精度的代名词。但长期以来,所有YOLO模型都存在一个根本性限制:它们只能识别训练时见过的类别。 当面对新的物体类型——比如特殊的工业零件、罕见的植物病害或是特
clawbot接入飞书阿里云,立即拥有24小时AI助理贾维斯
哈喽大家好, 我是阿星👋 最近clawbot太火了,今天讲2个方案。一个是麻烦但是可以装x的飞书,一个是不麻烦但是不太好装的阿里云。
参数仅6.31亿反超7B模型,NVIDIA用「多教师蒸馏」融合三大模型绝学
在追求模型规模的竞赛中,一个反直觉的事实正在发生:NVIDIA 的 C-RADIOv4 仅用 6.31 亿个参数就达到了 DINOv3 的 70 亿参数模型的性能。多教师蒸馏技术,正在彻底改变我们构建
红外小目标检测新突破!浙大团队提出DQAligner:大位移场景下依然稳定跟踪
红外成像领域的小目标检测一直是个技术难题——目标可能只是几个像素点,还常常淹没在复杂的云层、海面背景或者传感器噪声里。 为了解决这个难题,研究者们开始利用多帧时空信息,但新的问题随之而来:当摄像机或目
基于yolo26姿势估计模型训练dog-pose数据集模型
yolo26n-pose模型可以直接识别人体姿势,但不识别其他动作或物体,如果想精准识别其他分类,需要自己重新训练,本来想做小狗的姿势分析,发现在ultralytics中提供了全量的dog-pos
为视觉建模注入物理灵魂:WaveFormer证明,下一站是“物理启发模型”
近年来,Transformer 席卷了计算机视觉领域,从图像分类到目标检测,表现亮眼。然而,当任务从静态图像扩展到视频理解、动态场景分析时,Transformer 的“硬扛”模式开始显露出明显局限。最
垂直SFT过拟合(Overfitting)的深层机制与精准对抗
在大模型微调(SFT)的世界里,过拟合就像一个潜伏的隐形杀手。当70B参数的巨无霸模型遇上仅10万条的训练数据,会发生什么?
“看起来像世界”≠“真世界”!WorldLens全维度解构自动驾驶世界模型
近年来,随着生成式AI技术的突破,世界模型(World Models) 已成为自动驾驶与具身智能领域的核心研究方向。从文本直接生成驾驶视频,到可控的4D动态场景合成,当前模型已经能够产出视觉上足以“以
轻量化微调革命:PEFT技术如何让普通人也能玩转大模型
随着AI模型越来越大,从BERT到GPT-3再到如今的千亿参数大模型,全量微调一个模型动辄需要数十张A100显卡和数天时间,这让普通开发者和小团队望而却步。 但有一项技术正在改变这一局面——参数高效微
多维创新打造强泛化智能体模型,LongCat-Flash-Thinking-2601技术报告发布
该模型创新性地打造了 “重思考模式” ,通过并行推理与深度总结,实现推理宽度与深度的协同扩展,显著提升复杂交互与多步规划任务中的表现。
一步生成,像素空间,何恺明让 pMF 做到了
何恺明团队最近抛出的这篇工作,多少有点“把老问题直接掀桌子重来”的味道。他们提出的 **Pixel MeanFlow(pMF) **,在不借助潜在空间、不依赖多步采样的前提下,只用一次前向传播,就生成
CVPR 2025 Oral | 港大提出OverLoCK:模仿人类视觉机制,让模型“先见森林,再见树木”
人类在观察复杂场景时,通常会先快速扫视整体轮廓,形成初步认知,再集中注意力到关键区域进行细节分析。这种 “纵观全局-聚焦细节” 的两阶段认知机制被称为自上而下注意力(Top-down Attentio
测试里“无所不能”,一上线就“ bug 频出”,你的CV模型到底缺了什么?
那个在象牙塔里从未失手的“学霸”,理论知识门门满分,实验操作无可挑剔。可当他第一次踏入纷繁复杂、充满意外的真实社会,却步步维艰,处处碰壁——这画面,是不是像极了如今许多计算机视觉领域那些光彩夺目的“高
告别CLIP局限!SSVP框架实现零样本异常检测,刷新7大数据集SOTA
工业视觉检测一直是智能制造领域的关键技术,而零样本异常检测(ZSAD) 更是被视为行业的“圣杯”——无需针对特定产线进行训练,即可直接投入使用的理想解决方案。然而,现有基于视觉语言模型(如CLIP)的
二、机器学习基本原理
1、基本数学知识 标量:标量也就是一个单独的数 向量:类似[1,2,3,4]被称之为向量,是一列数;其中可以进行的运算有加法运算以及向量之间做内积 向量加法:i.e. [a1,a2,a3]+[b1,b
飞书AI机器人流式输出实践:从消息编辑踩坑到卡片更新最佳方案
一、背景与问题 1.1 场景描述 在 AI Agent 场景下,大模型的输出往往是流式的(Streaming),即内容逐步生成、逐步返回。为了提升用户体验,我们希望在飞书机器人中实现类似 ChatGP
突破传统限制:OxygenREC--一个基于指令跟随的“快慢思考“电商生成式推荐框架
OxygenREC不仅仅是一个高效的推荐系统,更为工业级生成式AI应用的大模型设计提供了宝贵范式 。
LangChain V1.0 核心解析(四):Short-term memory组件——让AI记住对话:上下文管理与历史追溯技术
Agent 记忆管理 概述 核心要素 State (状态): 定义用来存储消息的结构(通常是 MessagesState) Checkpointer (检查点保存器): 负责在每一步结束后把状态保存下