大厂搜推广算法实践

大厂搜推广算法实践

大厂搜推广算法实践

大厂搜推广算法实践

等 1 人订阅共20篇文章创建于2025-04-02

多分类的交叉熵损失

1. 求导 1.1 定义基本公式首先，定义 Softmax 函数 $p_{i}$ 和交叉熵损失 $L$。对于输入向量 $\mathbf{z}$： $$ p_{i}=\frac{\exp (z_{

4天前
9
点赞
评论

强化学习基础：贝尔曼方程

如果没有贝尔曼方程，强化学习可能只是一堆乱撞的随机尝试，而无法成为一种科学的优化方法。它的核心价值在于将远大的目光转化为了当下的计算 1.1 动作选择假如我们有一个迷宫 x 1 -1 很明显，如果往

4天前
61
1
评论

贝尔曼方程：从绝望到降维打击的动态规划核心

平庸解法的绝望场景想象一个场景：你是一名自动驾驶算法工程师，负责让车辆在复杂城市道路中找到“最优行驶路线”——不仅要最短距离，还要避开拥堵、红灯，最小化行驶时间和能耗。假设你负责的区域有100个路口

5天前
15
点赞
评论

推荐算法实践：交叉特征的深度理解

1.困惑之源半年前第一次做推荐算法，无意中碰到了一个问题，我使用LR模型对用户和商品进行联合打分，其中使用了所谓的交叉特征，这个问题思考了大半年终于有了一些思路。问题是这样的，我统计了不同用户在不

6天前
19
点赞
评论

矩阵运算维度设计与Attention机制的底层逻辑

1. 矩阵运算维度设计深度学习框架选择 $xW^T$并非随意之举，而是基于以下核心原则的精心设计： 1.1. 内存访问效率优先现代硬件（CPU/GPU）的性能瓶颈主要在于内存访问速度，而非计算速度

8天前
16
点赞
评论

推荐算法实践：电商特征选取

推荐系统的特征工程是模型效果的核心，通常按用户、物品、上下文、交互行为、统计类、内容与语义、场景与业务、交叉与组合八大维度划分。下面按类别完整列举，并说明为什么有效。一、用户侧特征（User Fea

9天前
17
点赞
评论

推荐算法实践：电商数据集划分

1. 坚守时间顺序：划分策略的基石在电商场景下，坚决不能使用未来数据预测过去。因此，所有划分都必须基于时间戳。全局固定时间点划分这是最常用且稳妥的方法，旨在模拟模型在线上“当前”预测“未来”的真

9天前
17
点赞
评论

样本不均衡处理的底层逻辑解析

在机器学习的实际应用中，正负样本极度不均衡是常态：欺诈检测中99%的交易正常广告点击率预估中千分之一的点击概率医疗诊断中罕见病占比极低面对这种“少数淹没于多数”的困境，直接训练模型往往收效甚微

10天前
15
点赞
评论

强化学习基础：拒绝采样

拒绝采样拒绝采样（Rejection Sampling）是一种通过从一个容易采样的分布（建议分布）中抽取样本，并按一定比例随机拒绝，从而获得目标分布（通常是难以直接采样的复杂分布）样本的方法。核

20天前
37
点赞
评论

Windows搭建agent环境

1. 下载模型国内使用modelscope镜像安装依赖 2. 下载模型 3. 测试用例，使用openai

1月前
46
点赞
评论

Windows安装python

1. 安装python环境 pacman也可以安装python，但是三方库总是安装不成功，所以就不折腾了，感兴趣的可以自己试试直接通过应用商店安装的python，不知道为啥安装uv之后无法使用uv，

1月前
44
点赞
评论

Windows编译llama.cpp

1. 安装msys2 我们一般都是在linux上开发程序，linux有很多的命令，例如ls，grep，echo等等，这些程序在windows都是没有的，msys2你可以认为就是一个小型的linux命令

1月前
71
点赞
评论

推荐算法实践：ItemCF计算相似度与召回率

1. 数据加载与预处理 train_user_x_items.json：存储用户与物品的交互记录，格式为{user_id: [(item_id, rating, timestamp), ...]}。

10月前
105
点赞
评论

推荐算法实践：ItemCF原理

ItemCF 核心假设：如果用户历史上喜欢了某个物品，则在未来大概率会喜欢与该物品相似的物品。计算相似度：通过分析用户的行为记录（如购买、点击等），计算物品之间的相似度相似分计算 1. 余弦相似度

10月前
154
点赞
评论

推荐算法实践：UserCF计算召回率

1. 加载数据从test_user_items.json加载测试集数据，其中包含每个用户在测试集上交互的物品。从train_user_items.json加载训练集数据，其中包含每个用户在训练集上

10月前
78
点赞
评论

推荐算法实践：UserCF计算用户相似度

读取文件中的用户-物品交互数据，构建了两个字典：user_x_items和item_x_N。 user_x_items：键为用户ID，值为该用户交互过的物品ID集合。 item_x_N：键为物品ID，

10月前
75
点赞
评论

推荐算法实践：UserCF原理

userCF UserCF（基于用户的协同过滤）的核心思想是 “物以类聚，人以群分” 。它通过分析用户之间的相似性，为用户推荐其他相似用户喜欢的物品。具体来说，UserCF的核心思想可以概括为以下几个

10月前
141
点赞
评论

推荐算法实践：ml-1m划分数据集

划分逻辑非常的简单按照用户分组对每个用户交互的item按照时间戳排序排好序的item按照比例划分训练集和测试集

10月前
84
点赞
评论

推荐算法实践：划分训练集和测试集

推荐数据集特点推荐系统数据集通常具有以下特点： • 稀疏性推荐系统的数据通常是高度稀疏的，因为用户与项目（如电影、书籍或商品）之间的交互通常只占所有可能交互的一小部分。例如，在MovieLens数

10月前
263
点赞
评论

推荐算法实践：movielens数据集

MovieLens 数据集介绍 MovieLens 数据集是由明尼苏达大学的GroupLens研究小组维护的一个广泛使用的电影评分数据集，主要用于推荐系统的研究。该数据集包含用户对电影的评分、标签以及

10月前
1.1k
1
评论