首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
大厂搜推广算法实践
生锈的键盘
创建于2025-04-02
订阅专栏
大厂搜推广算法实践
等 1 人订阅
共20篇文章
创建于2025-04-02
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
多分类的交叉熵损失
1. 求导 1.1 定义基本公式 首先,定义 Softmax 函数 $p_{i}$ 和 交叉熵损失 $L$。对于输入向量 $\mathbf{z}$: $$ p_{i}=\frac{\exp (z_{
强化学习基础:贝尔曼方程
如果没有贝尔曼方程,强化学习可能只是一堆乱撞的随机尝试,而无法成为一种科学的优化方法。它的核心价值在于将远大的目光转化为了当下的计算 1.1 动作选择 假如我们有一个迷宫 x 1 -1 很明显,如果往
贝尔曼方程:从绝望到降维打击的动态规划核心
平庸解法的绝望场景 想象一个场景:你是一名自动驾驶算法工程师,负责让车辆在复杂城市道路中找到“最优行驶路线”——不仅要最短距离,还要避开拥堵、红灯,最小化行驶时间和能耗。假设你负责的区域有100个路口
推荐算法实践:交叉特征的深度理解
1.困惑之源 半年前第一次做推荐算法,无意中碰到了一个问题,我使用LR模型对用户和商品进行联合打分,其中使用了所谓的交叉特征,这个问题思考了大半年终于有了一些思路。 问题是这样的,我统计了不同用户在不
矩阵运算维度设计与Attention机制的底层逻辑
1. 矩阵运算维度设计 深度学习框架选择 $xW^T$并非随意之举,而是基于以下核心原则的精心设计: 1.1. 内存访问效率优先 现代硬件(CPU/GPU)的性能瓶颈主要在于内存访问速度,而非计算速度
推荐算法实践:电商特征选取
推荐系统的特征工程是模型效果的核心,通常按用户、物品、上下文、交互行为、统计类、内容与语义、场景与业务、交叉与组合八大维度划分。下面按类别完整列举,并说明为什么有效。 一、用户侧特征(User Fea
推荐算法实践:电商数据集划分
1. 坚守时间顺序:划分策略的基石 在电商场景下,坚决不能使用未来数据预测过去。因此,所有划分都必须基于时间戳。 全局固定时间点划分 这是最常用且稳妥的方法,旨在模拟模型在线上“当前”预测“未来”的真
样本不均衡处理的底层逻辑解析
在机器学习的实际应用中,正负样本极度不均衡是常态: 欺诈检测中99%的交易正常 广告点击率预估中千分之一的点击概率 医疗诊断中罕见病占比极低 面对这种“少数淹没于多数”的困境,直接训练模型往往收效甚微
强化学习基础:拒绝采样
拒绝采样 拒绝采样(Rejection Sampling) 是一种通过从一个容易采样的分布(建议分布)中抽取样本,并按一定比例随机拒绝,从而获得目标分布(通常是难以直接采样的复杂分布)样本的方法。 核
Windows搭建agent环境
1. 下载模型 国内使用modelscope镜像 安装依赖 2. 下载模型 3. 测试用例,使用openai
Windows安装python
1. 安装python环境 pacman也可以安装python,但是三方库总是安装不成功,所以就不折腾了,感兴趣的可以自己试试 直接通过应用商店安装的python,不知道为啥安装uv之后无法使用uv,
Windows编译llama.cpp
1. 安装msys2 我们一般都是在linux上开发程序,linux有很多的命令,例如ls,grep,echo等等,这些程序在windows都是没有的,msys2你可以认为就是一个小型的linux命令
推荐算法实践:ItemCF计算相似度与召回率
1. 数据加载与预处理 train_user_x_items.json:存储用户与物品的交互记录,格式为{user_id: [(item_id, rating, timestamp), ...]}。
推荐算法实践:ItemCF原理
ItemCF 核心假设:如果用户历史上喜欢了某个物品,则在未来大概率会喜欢与该物品相似的物品。 计算相似度:通过分析用户的行为记录(如购买、点击等),计算物品之间的相似度 相似分计算 1. 余弦相似度
推荐算法实践:UserCF计算召回率
1. 加载数据 从test_user_items.json加载测试集数据,其中包含每个用户在测试集上交互的物品。 从train_user_items.json加载训练集数据,其中包含每个用户在训练集上
推荐算法实践:UserCF计算用户相似度
读取文件中的用户-物品交互数据,构建了两个字典:user_x_items和item_x_N。 user_x_items:键为用户ID,值为该用户交互过的物品ID集合。 item_x_N:键为物品ID,
推荐算法实践:UserCF原理
userCF UserCF(基于用户的协同过滤)的核心思想是 “物以类聚,人以群分” 。它通过分析用户之间的相似性,为用户推荐其他相似用户喜欢的物品。具体来说,UserCF的核心思想可以概括为以下几个
推荐算法实践:ml-1m划分数据集
划分逻辑非常的简单 按照用户分组 对每个用户交互的item按照时间戳排序 排好序的item按照比例划分训练集和测试集
推荐算法实践:划分训练集和测试集
推荐数据集特点 推荐系统数据集通常具有以下特点: • 稀疏性 推荐系统的数据通常是高度稀疏的,因为用户与项目(如电影、书籍或商品)之间的交互通常只占所有可能交互的一小部分。例如,在MovieLens数
推荐算法实践:movielens数据集
MovieLens 数据集介绍 MovieLens 数据集是由明尼苏达大学的GroupLens研究小组维护的一个广泛使用的电影评分数据集,主要用于推荐系统的研究。该数据集包含用户对电影的评分、标签以及