首页
首页
BOT
沸点
课程
直播
活动
AI刷题
NEW
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Y11_推特同名
掘友等级
同名推特:https://x.com/seclink 同名Github:https://github.com/XiaomingX
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
488
文章 455
沸点 33
赞
488
返回
|
搜索文章
最新
热门
高性能的智能去重算法实现:布谷鸟过滤器算法
布谷鸟过滤器就像一个聪明的、可擦除的“黑名单”。它能告诉你某个东西“可能”在不在这个名单上,而且还很省地方。 核心概念 指纹:每个事物(比如一个网址)都用一个指纹来代表,这个指纹是通过一种特殊的“指纹
如果连这些都不懂别说你是搞算法的:人形机器人-强化学习
摘要 人形机器人控制作为机器人学中最具挑战性的领域之一,其发展高度依赖于强化学习技术的突破。本文系统梳理了当前人形机器人领域应用的五大类强化学习算法体系,包括基于值函数的方法、策略梯度方法、基于模型的
BM25算法:简单易懂的信息检索评分模型
BM25算法:简单易懂的信息检索评分模型 BM25是一种广泛应用于信息检索的算法,用于计算查询与文档之间的相关性。它是TF-IDF的改进版本,主要解决了TF-IDF中高词频带来的问题,并考虑了文档长度
Deep Research vs o3?深度解析OpenAI两大AI模型的区别与应用场景
一、核心定位差异 技术解析 Deep Research像专业研究员,擅长处理需要「查资料→分析→验证→写报告」的完整研究流程。普通o3模型更像知识丰富的助手,适合快速问答。 实际案例 股票投资分析场景
算法入门基础:进化学习和强化学习的区别
进化策略(ES)是一种模仿生物进化过程的算法,用于寻找问题的最佳解决方案。它不依赖复杂的环境互动,而是通过不断筛选和变异候选方案来找到最优解。可以把它想象成一个“自然选择”的过程,优胜劣汰,最终留下最
2025年02月:一些有趣的强化学习研究挑战
Q学习与Atari游戏RAM版本 Q学习算法在像素输入的Atari游戏上取得了显著成功。由于Atari游戏的RAM非常有限,因此将RAM状态作为输入,尝试训练Q学习模型也很有趣。尽管如此,使用RAM状
多智能体编程入门:Multi-Agent Actor-Critic (MAAC)算法基础原理
Multi-Agent Actor-Critic(MAAC)是一种强化学习算法,旨在帮助多个智能体在合作与竞争的环境中做出决策。它结合了Actor-Critic架构,通过集中训练和分散执行的方式,使得
大模型图像检索入门:CLIP模型算法基础原理
CLIP模型简介 CLIP(对比语言-图像预训练)是OpenAI开发的一种深度学习模型,旨在理解图像和文本之间的关系。它的主要特点是能够在没有特定标签的情况下进行图像分类和检索,这种能力被称为零样本学
快递(外卖)派送算法基础入门:旅行商问题(TSP)
旅行商问题(TSP)是什么? 旅行商问题(TSP)就像一个快递员送信的问题:快递员要跑多个地点送货,如何规划路线,才能跑完所有地点并且路程最短?每个地点只能去一次,最后还要回到起点。 目标: 找到最短
强化学习基础入门知识:DeepMind的IMPALA架构简介
Importance Weighted Actor-Learner Architectures(IMPALA) 是一种由DeepMind提出的深度强化学习架构,旨在高效处理复杂任务。IMPALA的核心
下一页
个人成就
优秀创作者
文章被点赞
834
文章被阅读
85,035
掘力值
6,396
关注了
167
关注者
700
收藏集
2
关注标签
41
加入于
2018-02-01