人工智能 - 掘金

下一代 Lakehouse 智能未来新引擎 | Apache Hudi Meetup亚洲站活动回顾

近日，由京东主办的Apache Hudi Meetup亚洲站在京东集团总部顺利举行，来自Onehouse、京东、快手和华为的四位技术专家齐聚一堂，不仅带来了Apache Hudi 1.1版本前瞻，也分

NeurIPS 2025 | TANDEM：基于双层优化的数据配比学习方法

本文入选顶会NeurIPS 2025 大型语言模型的能力很大程度上取决于各个领域的训练数据。优化特定领域数据的混合比例可以建模为双层优化问题。本文将该双层优化问题简化为单层惩罚形式，并使用一组孪生模型

如何让SAM3在医学图像上比专用模型还强？一个轻量Adapter如何让它“秒变”专家？

Meta 实验室开源的 Segment Anything Model 3（SAM3）被誉为视觉分割领域的“终极形态”，它以“一个模型，搞定一切视觉识别任务”为口号，确实在自然图像的零样本分割能力上达到

CoovallyAIHub
5
点赞

如何让SAM3在医学图像上比专用模型还强？一个轻量Adapter如何让它“秒变”专家？

MAR-YOLOv9：革新农业检测，YOLOv9的“低调”逆袭

在YOLO系列的演进长河中，YOLOv8以其出色的平衡性赢得了广泛关注，YOLOv10和v11也紧随其后带来新的优化。然而，YOLOv9——这个介于v8与v10之间的版本，却似乎略显低调，未能获得同等

CoovallyAIHub
7
点赞

MAR-YOLOv9：革新农业检测，YOLOv9的“低调”逆袭

数组中的排序问题

各位大哥哥大姐姐小妹妹小弟弟行行好，给我的作品点个赞吧，你们的赞是我写下去的动力，大家都点一点吧，求求你们了

uuuuuuu
16
1

如何让机器看懂视觉世界？从图像匹配理解环境开始

当你观察同一物体的两张图片时，比如一幅画和一张汽车照片，很容易注意到它们的共同之处。然而，对于机器来说，这并不那么直接。要进行此类比较，机器依赖于计算机视觉——人工智能的一个分支，帮助机器解读和理解

CoovallyAIHub
14
点赞

如何让机器看懂视觉世界？从图像匹配理解环境开始

2025年值得关注的5款数据标注工具

搭建特定应用场景的数据集，或是训练并持续优化计算机视觉模型的过程中，图像标注始终是支撑项目成功的核心环节。选择一款合适的图像标注工具，其意义远不止于提升工程效率——它能够帮助标注团队从繁琐重复的手动操

CoovallyAIHub
32
点赞

2025年值得关注的5款数据标注工具

货拉拉RAG优化实践：从原始数据到高质量知识库

RAG知识库经过初始构建后，一般存在质量不高的问题，本文通过尝试emmbeding聚类和大模型方式，对初始构建的知识库完成清洗并落地。

货拉拉RAG优化实践：从原始数据到高质量知识库

昇腾 RAG SDK 从入门到实战：技术解析与部署实操

RAG技术是一种检索增强生成方法，通过结合外部知识库提升大模型的准确性和时效性。它允许AI在回答问题时先检索相关信息，再生成回答，类似于给AI配备了一个“随身文件夹”和“快速搜索引擎”。

在人间负债
27
点赞

昇腾 RAG SDK 从入门到实战：技术解析与部署实操

深度学习算法以及优化器复习

本文主要复习总结深度学习基础算法中从最基本的神经元，到 RNN，CNN，LSTM 等算法，以及其中用到的梯度下降，反向传播，优化器等等内容

矮人三等
45
点赞

AI 项目如何避免“烂尾”？怎么选择才能让AI项目长期奔跑？

AI技术的爆发，无疑给全球的研发机构与企业注入了一剂强力助推剂。进入2025年，大模型的迭代速率已快到令人应接不暇，从千亿参数的通用大模型到针对特定场景优化的轻量化模型，层出不穷。然而，与技术狂热相

CoovallyAIHub
80
点赞

AI 项目如何避免“烂尾”？怎么选择才能让AI项目长期奔跑？

面试官：BatchNorm、LayerNorm、GroupNorm、InstanceNorm 有什么本质区别？

面试官：你能讲讲 BatchNorm、LayerNorm、GroupNorm、 InstanceNorm 有什么本质区别吗？很多同学肯定对这三个方法都很熟悉，但是一时间竟然不知道该怎么组织语言回答

coting
33
1

面试官：BatchNorm、LayerNorm、GroupNorm、InstanceNorm 有什么本质区别？

海量数据集的AI自动化预测打标 -- 放电时序特征

放电时序特征ML Backend技术解析概述:捕捉等离子体的"生命周期" 在等离子体放电实验中,从击穿、稳定运行到破裂结束,整个过程就像一场精心编排的"表演"——每个关键时刻都承载着重要的物理信息。

语落心生
43
点赞

海量数据集的AI自动化预测打标 -- 矿业音频分类

两个月前公司有个AI标注的训练数据需求调研，正巧清华某个团队有此需求，于是进行合作。一共开源了三个模型的初版。记录下自己的实现声音样本多标签预测 - 矿山矿业场景: https://github.c

语落心生
92
点赞

海量数据集AI自动化打标 - 温度周期检测

温度特征多标签预测: https://github.com/STARTORUS/tok-label/pull/2 概述:让AI识别温度变化的"指纹" 想象一下,在一个等离子体实验装置中,温度从几百电子

语落心生
41
点赞

海量数据集的AI自动化预测打标 -- 振动特征多标签分类

振动特征多标签预测: https://github.com/STARTORUS/tok-label/pull/5 概述:设备健康的"智能医生" 在工业4.0时代,**预测性维护(PHM - Progn

语落心生
48
点赞

1024层网络让强化学习性能飙升50倍，NeurIPS 2025最佳论文揭示深度scaling的力量

在自然语言处理和计算机视觉领域，模型规模的扩大已经催生了无数突破，但强化学习（RL）领域的类似进展却一直难以实现。大多数RL研究仍在使用2-5层的浅层网络架构，而如今的LLaMA和Stable Dif

CoovallyAIHub
33
点赞

1024层网络让强化学习性能飙升50倍，NeurIPS 2025最佳论文揭示深度scaling的力量

NeurIPS 2025时间检验奖：10年之后再谈Faster R-CNN

近日，深度学习目标检测领域《Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks》荣获NeurIP

CoovallyAIHub
27
点赞

NeurIPS 2025时间检验奖：10年之后再谈Faster R-CNN

从计数到预测：深入浅出词向量 (Word Vectors) —— Stanford CS224n 作业实战记录

从计数到预测：深入浅出词向量 (Word Vectors) —— Stanford CS224n 作业实战记录标签：NLP, CS224n, Word Embeddings, Python, 深度学

星辞树
20
点赞

[机器学习]xgboost的2种使用方式

xgboost是集成学习算法, 那么为什么没有像随机森林那样, 集成在sklearn.ensemble模块中呢? 这是一个非常好的问题！XGBoost 确实是集成学习算法，但并没有直接集成在 scik

import_random
27
点赞