首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Y11的学习乐园
程序员小jobleap
创建于2021-10-18
订阅专栏
学习如何学习
等 62 人订阅
共999篇文章
创建于2021-10-18
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
重新理解Log4Shell (CVE-2021-44228)漏洞原理
Log4Shell,又名CVE-2021-44228,是Apache Log4j 2日志库中的一个严重漏洞,它允许攻击者远程执行代码,完全控制你的服务器。 形象地说,如果你的服务器是一个家,Log4j
高性能的智能去重算法实现:布谷鸟过滤器算法
布谷鸟过滤器就像一个聪明的、可擦除的“黑名单”。它能告诉你某个东西“可能”在不在这个名单上,而且还很省地方。 核心概念 指纹:每个事物(比如一个网址)都用一个指纹来代表,这个指纹是通过一种特殊的“指纹
如果连这些都不懂别说你是搞算法的:人形机器人-强化学习
摘要 人形机器人控制作为机器人学中最具挑战性的领域之一,其发展高度依赖于强化学习技术的突破。本文系统梳理了当前人形机器人领域应用的五大类强化学习算法体系,包括基于值函数的方法、策略梯度方法、基于模型的
BM25算法:简单易懂的信息检索评分模型
BM25算法:简单易懂的信息检索评分模型 BM25是一种广泛应用于信息检索的算法,用于计算查询与文档之间的相关性。它是TF-IDF的改进版本,主要解决了TF-IDF中高词频带来的问题,并考虑了文档长度
Deep Research vs o3?深度解析OpenAI两大AI模型的区别与应用场景
一、核心定位差异 技术解析 Deep Research像专业研究员,擅长处理需要「查资料→分析→验证→写报告」的完整研究流程。普通o3模型更像知识丰富的助手,适合快速问答。 实际案例 股票投资分析场景
算法入门基础:进化学习和强化学习的区别
进化策略(ES)是一种模仿生物进化过程的算法,用于寻找问题的最佳解决方案。它不依赖复杂的环境互动,而是通过不断筛选和变异候选方案来找到最优解。可以把它想象成一个“自然选择”的过程,优胜劣汰,最终留下最
2025年02月:一些有趣的强化学习研究挑战
Q学习与Atari游戏RAM版本 Q学习算法在像素输入的Atari游戏上取得了显著成功。由于Atari游戏的RAM非常有限,因此将RAM状态作为输入,尝试训练Q学习模型也很有趣。尽管如此,使用RAM状
多智能体编程入门:Multi-Agent Actor-Critic (MAAC)算法基础原理
Multi-Agent Actor-Critic(MAAC)是一种强化学习算法,旨在帮助多个智能体在合作与竞争的环境中做出决策。它结合了Actor-Critic架构,通过集中训练和分散执行的方式,使得
大模型图像检索入门:CLIP模型算法基础原理
CLIP模型简介 CLIP(对比语言-图像预训练)是OpenAI开发的一种深度学习模型,旨在理解图像和文本之间的关系。它的主要特点是能够在没有特定标签的情况下进行图像分类和检索,这种能力被称为零样本学
快递(外卖)派送算法基础入门:旅行商问题(TSP)
旅行商问题(TSP)是什么? 旅行商问题(TSP)就像一个快递员送信的问题:快递员要跑多个地点送货,如何规划路线,才能跑完所有地点并且路程最短?每个地点只能去一次,最后还要回到起点。 目标: 找到最短
强化学习基础入门知识:DeepMind的IMPALA架构简介
Importance Weighted Actor-Learner Architectures(IMPALA) 是一种由DeepMind提出的深度强化学习架构,旨在高效处理复杂任务。IMPALA的核心
Vue.js nation 2025大会上尤雨溪又发布了啥能力?
在最近的Vue.js Nation大会上,尤雨溪和其他演讲者分享了一系列新的功能和能力。以下是一些重要的更新,以及它们的实际应用和示例代码。 1. Vite 5的集成 概述:Vite 5是一个现代化的
嵌入式设备安全:ROP(Return-Oriented Programming)实现远程代码执行(RCE)
本文讲述了如何通过ROP技术利用一个嵌入式设备中的漏洞实现远程代码执行(RCE)。我们以XiongMai的uc-httpd轻量级Web服务器为例,详细解析了漏洞利用过程,并提供了实际的代码示例。以下内
使用 uv 管理 Python + FastAPI 项目依赖项
安装 Uv uv 是一个快速的 Python 包管理器,可以用来管理项目依赖。安装方式有多种: 使用脚本 (推荐): 在终端运行以下命令: 这个命令会自动下载并安装 uv。 使用 pip: 如果你的环
轻松理解推理模型:AI 界的“诸葛亮”和“工匠”
OpenAI 提供了两种 AI 模型:推理模型(比如 o1 和 o3-mini)和 GPT 模型(比如 GPT-4o)。你可以把它们想象成: 推理模型: 像是团队里的“诸葛亮”,擅长出谋划策,分析复杂
Gemini开发者API定价:用于对比国内大模型报价
Gemini开发者API定价 Gemini API的“免费层”通过API服务提供,适用于测试目的,速率限制较低。在所有可用国家,Google AI Studio的使用完全免费。Gemini API的“
大模型运营必备:DeepSpeed基础知识简介
DeepSpeed简介 DeepSpeed是微软开发的一个开源深度学习优化库,旨在提升大规模模型的训练和推理效率。它通过多种技术手段,帮助研究人员和开发者在分布式环境中更高效地训练拥有数十亿到万亿参数
Hugging Face Transformers 组件简介
Hugging Face Transformers 组件简介 Hugging Face Transformers 是一个开源库,专注于自然语言处理(NLP),使得研究人员和开发者能够轻松使用和训练各种
GRPO算法:让大模型更听话的秘诀
GRPO算法:让大模型更听话的秘诀 GRPO (Group Relative Policy Optimization),可以理解为“组团打怪升级”策略优化算法,专门用来训练大规模语言模型(LLM),让
Terraform:像写代码一样管理你的云资源
Terraform:像写代码一样管理你的云资源 Terraform 是一个帮你用代码来管理云服务器、数据库等资源的工具,就像盖房子用的设计图纸一样,图纸改了,房子也会跟着变。这种方法叫做 基础设施即代
下一页