首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
人工智能
AI编程
LLM
后端
AIGC
MCP
前端
算法
程序员
展开
全部
人工智能
AI编程
LLM
后端
AIGC
MCP
前端
算法
程序员
OpenAI
Python
Trae
深度学习
Cursor
机器学习
暂无数据
推荐
最新
YOLOv13都来了,目标检测还卷得动吗?别急,还有这些新方向!
【导读】 2025年已过半,AI领域依旧风起云涌。就在大家还在研究多模态和大模型融合时,YOLOv13 的发布再次把目标检测领域推上热搜,但目标检测,这个曾经被视为CV领域“基础中的基础”,如今也在被
VASP 教程:VASP 机器学习力场微调
机器学习力场(Machine-Learned Force Fields, MLFFs)作为一种新兴的计算方法,已在第一性原理分子动力学(Ab Initio Molecular Dynamics, AI
AI 基础知识从 0.5 到 0.6—— 深度学习全能架构 Transformer
seq2seq -> RNN -> LSTM -> Transformer -> GPT,我不信看完还不懂 Transformer
RTMPose:重新定义多人姿态估计的“实时”标准!
【导读】 实时多人姿态估计一直是计算机视觉领域的“性能炼金术”:要在精度、速度、部署成本之间找到最优解,并不容易。而由上海人工智能实验室提出的 RTMPose 正式打破这一平衡难题:它在移动端能跑出
当AR遇上深度学习:实时超声肾脏分割与测量技术全解析
【导读】 本研究旨在解决超声(US) 用于肾脏体积测量时面临的操作复杂(学习曲线陡)和需要频繁在患者与屏幕间切换视线(效率低、易疲劳)的难题。 为此,我们提出了一套整合方案:利用深度学习实现肾脏的实时
用 YOLOv8 + DeepSORT 实现目标检测、追踪与速度估算
【导读】 目标检测与追踪技术是计算机视觉领域最热门的应用之一,广泛应用于自动驾驶、交通监控、安全防护等场景。今天我们将带你一步步实现一个完整的项目,使用YOLOv8 + DeepSORT实现目标检测、
从0开始手撸神经网络
本篇文章是该系列的第四篇,也是最后一篇。在了解了什么是神经网络并且知道了神经网络的底层原理之后,我们可以通过实际动手来更加深入的理解神经网络,同时提升自己的编码能力。
一文搞懂什么是反向传播
本篇文章是该系列的第三篇,我们一起来学习一下神经网络学习背后的核心算法——反向传播算法,即使现在很多人都在做深度学习,但是80%的人都说不清网络的参数到底是怎么更新的。
PyTorch进阶:从自定义损失函数到生产部署全栈指南
本文深入讲解PyTorch高级开发技巧,涵盖自定义层/损失函数实现、模型保存加载策略以及TensorBoard可视化监控,提供工业级最佳实践和完整代码示例。
YOLOv13重磅发布!体验超图建模带来的检测性能飞跃
【导读】 YOLO 系列从 v1 一路进化到 v13,始终在追求更快、更准、更轻的目标检测模型。而刚刚发布的 YOLOv13,不仅性能全系领先,还带来了“超图”这个硬核概念 —— 帮助模型在复杂场景中
航拍图像中的“生命线”:基于YOLOv5的7类应急目标检测实践
【导读】 本文提出了一种利用YOLOv5模型进行航拍图像目标检测的稳健方法。我们专注于识别关键目标,包括救护车、车祸现场、警车、拖车、消防车、侧翻车辆及着火车辆。通过采用定制数据集,完整阐述了从数据收
深度神经网络为什么这样判断?一文读懂 Grad-CAM 可视化原理与应用(含实操平台推荐)
【导读】 为什么 AI 模型会做出这样的判断?这是每一个使用深度神经网络的人都曾疑惑过的问题。尽管 CNN(卷积神经网络)在图像识别中表现卓越,但“黑盒”特性让人难以信服它的每一个预测结果,特别是在医
推进自动驾驶车辆智能:基于深度学习和多模态LLM的交通标志识别与鲁棒车道检测
【导读】 为提升自动驾驶车辆在复杂环境下的感知可靠性,本文提出融合深度学习与多模态大语言模型(MLLM)的综合方案。研究评估了ResNet-50、YOLOv8、RT-DETR在交通标志识别上的优异表现
Google 端侧 AI 框架 LiteRT 初探
学习和了解 Google 官方提供的 LiteRT 在 Android 的部署,以经典的手写数字识别模型为例,逐步了解 LiteRT 的使用方法
从 0 到 1:基于 Qwen3 Embedding 的 RAG 智能问答系统搭建指南
RAGFlow 是一个基于深度文档理解的开源 RAG(检索增强生成)引擎。 与 LLM 集成后,它能够提供真实的问答功能,并以来自各种复杂格式数据的可靠引用为支撑。 教程链接:https://go.o
DeepMind发布AlphaGenome,1秒内完成所有模态和细胞类型的变异效应预测
谷歌 DeepMind 的 Alpha 系列再添新成员——AlphaGenome, 其能够更全面、准确地预测人类 DNA 序列中单个变异或突变,如何影响一系列调控基因的生物过程。 AlphaGenom
基于 MODNet 和 Face Parsing 实现高质量人像分割与换发色
本文分享了一个完整的发色替换技术方案,基于 MODNet 实现鲁棒的人像前景分割,再借助 Face Parsing 技术精准定位头发区域,最终通过 HSV 空间的色调替换与融合算法实现效果。
YOLOv12技术突破全解析:最新改进与前沿论文速览
【导读】 本文汇总了多篇围绕YOLOv12这一实时目标检测前沿模型的最新研究论文。内容涵盖其核心架构创新(如高效注意力机制、轻量化设计),在特定场景(水下探测、果园绿色水果识别、无人机追踪)中相比前代
在线教程丨北大施柏鑫团队联合贝式计算提出视频实例重绘方法 VIRES,多项性能指标达 SOTA
视频也能 P 了? 众所周知,视频编辑难度极高,若想要调整或替换主体,变换场景、色彩或是移除一个物体,往往意味着无数帧的手动标注、遮罩绘制和精细调色。 即使是经验丰富的后期团队,也很难在复杂场景中保持
阿里重磅开源 LHM:开源3D数字人神器
阿里巴巴通义实验室开源的LHM(Large Animatable Human Reconstruction Model) 是当前3D建模领域的突破性工具,能够从单张图像快速生成高质量可动画化