前端埋点指标体系与核心概念:从 PV/UV 到归因分析的完整指南

3 阅读1分钟

前端埋点指标体系与核心概念:从 PV/UV 到归因分析的完整指南

做埋点的人,天天跟各种指标打交道。但很多人把指标丢出去就完了——用了什么口径、怎么算的、数据之间的钩稽关系一概不知。结果就是不同团队对同一个指标的理解完全不一样,会议变成"我说的日活和你说的日活不是一个日活"。

本文帮你把埋点涉及的指标体系和核心概念彻底理清楚。

一、基础流量指标

这是最基础也是最容易打架的指标。先统一口径。

PV(Page View,页面浏览量)

定义:用户访问页面的次数,每次页面加载/刷新/路由切换算一次。

常见口径差异

口径计次规则典型值差异
严格PV每次 page_view 事件计 1基准值
去重PV同一用户同页面 30 分钟内多次访问只计 1比严格PV低 15-30%
有效PV页面停留超过 3 秒才算又少了 10-20%

建议:统一用严格PV作为标准,其他口径在指标名上标注(如 有效PV)。

UV(Unique Visitor,独立访客)

定义:统计周期内访问产品的独立用户数。

口径差异的常见来源

  • 登录态 vs 设备 ID:登录用户用 user_id,未登录用户用 device_id。如果登录前后的 ID 没有 mapping,同一个用户会被统计成 2 个 UV
  • 跨端问题:用户在 App 和 Web 上各访问一次,如果没用统一 ID,就变成了 2 个 UV
  • 统计周期:日 UV、周 UV、月 UV 的计算逻辑不同——周 UV 不是日 UV 的平均值

DAU / WAU / MAU(日/周/月活跃用户)

定义:在统计日内触发过任意"活跃事件"的用户数。

卡"活跃事件":这个需要业务定义。通常包括:

  • 打开 App / 访问网站
  • 点击任意页面
  • 触发至少一个核心事件

避坑:如果用"打开 App"作为活跃事件,后台保活的用户也会被计为活跃——需要加一个"前台可见 + 用户有交互"的判断。

访问时长

定义:用户单次会话(Session)的持续时间。

计算方式:最后一个事件的时间戳 - 第一个事件的时间戳

常见问题

  • 用户后台挂起不关页面 → 时长虚高
  • 用户快速打开关闭 → 时长虚低

解决:加一个"最大会话间隔"(如 30 分钟),超过则强制结束上一个会话。

二、用户参与度指标

浏览量(浏览量指标体系)

指标定义计算方式
PV总页面浏览数对 page_view 事件计数
UV独立访客数对 page_view 事件的 user_id 去重
人均PV平均每人看多少页PV ÷ UV
跳出率仅访问一页就离开的比例访问 1 页的用户数 ÷ 总用户数 × 100%

交互深度指标

页面停留时长:用户在一个页面上停留的时间。 滚动深度:用户滚动到页面的百分比位置(25%、50%、75%、100%)。 点击热力:页面上每个元素的点击次数/点击率。

这些指标组合起来可以判断页面质量:

  • 停留时间短 + 滚动深度浅 + 跳出率高 = 页面内容或体验有问题
  • 停留时间长 + 滚动深度深 + 点击率高 = 页面内容有价值

三、转化与漏斗指标

漏斗分析(Funnel Analysis)

定义:用户从起点到终点的每一步转化率。

经典电商漏斗

进入首页 → 100%
   ↓
浏览商品 → 60%
   ↓
加入购物车 → 20%
   ↓
填写地址 → 12%
   ↓
支付成功 → 8%

三个关键判断

  1. 哪一步流失最多 → 那一步是优化重点
  2. 每一步的转化率是否有行业基准 → 没有的话先跑 3 个月数据
  3. 漏斗时间窗口多长 → 用户 1 小时内完成 != 3 天内完成

转化率(Conversion Rate / CVR)

定义:完成目标事件的用户数 ÷ 进入漏斗起始事件的用户数。

注意区分

  • 页面级 CVR:看到某个页面后转化的比例
  • 用户级 CVR:某个用户最终转化的比例
  • 会话级 CVR:一次访问中完成转化的比例

归因分析(Attribution Analysis)

定义:当用户路径涉及多个触点时,决定哪个触点应该获得"转化功劳"。

常见归因模型

模型规则适用场景
末次点击归因100% 功劳归最后一个触点搜索广告投放
首次点击归因100% 功劳归第一个触点品牌曝光评估
线性归因每个触点均分功劳长决策链路产品
时间衰减归因越接近转化权重越高促销活动
U 型归因(位置归因)首次和末次各 40%,中间均分 20%复杂的营销组合

选模型的原则:没有绝对正确的归因模型。归因的本质是回答一个业务问题。先问清楚"你做归因分析是想优化哪个环节",再选模型。

四、留存与回访指标

留存率(Retention Rate)

定义:新增用户中,在一段时间后仍然在使用产品的比例。

经典留存指标

  • 次日留存:新增用户第二天再次使用的比例
  • 7日留存:新增用户第七天再次使用的比例
  • 30日留存:新增用户第三十天再次使用的比例

计算方式

第 N 天留存率 = 第 0 天新增用户中,在第 N 天活跃的人数 ÷ 第 0 天新增用户总数 × 100%

注意:留存算的是"第 N 天有回访",而不是"连续 N 天都回访"。

回访率 vs 留存率

这两个经常被混淆:

  • 回访率:所有用户在特定时间段内再次访问的比例(分母包括老用户)
  • 留存率:特定时间段内新增用户在后续某个时间点再次访问的比例(分母只有新用户)

一句话区分:回访是"老用户回来了没",留存在问"新用户留下了没"。

五、事件分析核心概念

事件(Event)与属性(Properties)

埋点的最小数据单元就是事件。一个事件包含:

事件结构:
{
  "event": "click_buy_now",       // 事件名
  "user_id": "u_123456",          // 用户标识
  "device_id": "d_abc789",        // 设备标识
  "session_id": "s_xxx",          // 会话标识
  "timestamp": 1715760000000,     // 时间戳
  "properties": {                 // 事件属性
    "product_id": "p_001",
    "price": 99.9,
    "source": "homepage_recommend"
  },
  "page": {                       // 页面上下文
    "url": "/product/001",
    "title": "商品详情",
    "referrer": "/home"
  }
}

事件命名的规范

规范示例理由
统一小写 + 下划线click_buy_now避免大小写歧义
动词_名词view_product, add_cart读起来自然
不用缩写不用 clk_btn 而用 click_button没人记得住缩写
分事件不分属性click_buy_now 而不是 click_button + button_type=buy_now筛选方便

Session(会话)

定义:用户连续操作的时间段。

业界常见的 Session 切分规则

  • 超时切分:30 分钟无操作自动结束会话
  • 跨天切分:超过凌晨 0 点自动结束
  • 来源切分:从站外来源进入时开启新会话

维度与指标

维度(Dimension):数据的分类属性,如渠道、设备、地域、页面。

指标(Metric):可量化的数值,如 PV、UV、转化率。

维度驱动分析:当你发现某个指标异常时,按维度拆解是第一步定位方法。

日活跃用户下降 10%
  ├── 按渠道拆:自然量正常 → 广告渠道下降 30%
  │     └── 按广告平台拆:巨量下降 40%,广点通正常
  │           └── 原因是某广告计划预算提前消耗完
  ├── 按版本拆:iOS 下降 5%,Android 下降 15%
  └── 按地域拆:一线城市正常 → 二三线城市下降较多

六、数据质量指标

这是一个常常被忽略但极其重要的指标体系。

埋点覆盖率

定义:实际触发的埋点事件数 ÷ 期望触发的埋点事件数 × 100%

目标:核心埋点覆盖率 100%

数据准确率

定义:埋点上报的数据属性值正确的比例。

校验方式:抽样比对前端上报数据与实际操作。

丢包率

定义:前端上报但后端未收到的数据比例。

目标:丢包率 < 1%。超出就需要排查网络/服务问题。

实时性指标

  • P50 延迟:50% 的数据在多长时间内到达
  • P99 延迟:99% 的数据在多长时间内到达

看 P99 更有效——P50 即使只有 1 秒,P99 可能是 30 秒。

七、北极星指标与 OSM 模型

北极星指标(North Star Metric)

定义:能反映产品为用户创造核心价值的唯一关键指标。

各产品的北极星指标

产品北极星指标为什么
Spotify总收听时长收听时间越长,用户越满意
Airbnb预订间夜数核心就是帮用户订到房
抖音日均使用时长内容消费型产品的命脉
知乎回答数内容是社区的基石

OSM 模型(Object-Strategy-Measure)

一个很实用的指标拆解工具:

  • O(业务目标):要达成的业务目的
  • S(业务策略):达成目标的手段
  • M(度量指标):评估策略是否有效的数据

例子:提升下单转化率

O(目标):下单转化率从 8% 提升到 12%
  │
  ├─ S1(策略):优化结算页加载速度
  │  └─ M(指标):结算页加载耗时 ≤ 1.5s,结算页跳出率降低 5%
  │
  ├─ S2(策略):增加支付方式(微信/支付宝/银行卡)
  │  └─ M(指标):支付方式选择率、各支付方式转化率对比
  │
  └─ S3(策略):首单优惠引导
     └─ M(指标):优惠弹窗展示率、点击率、首单转化率

结语

指标是工具,不是目的。

最糟糕的场景不是"没有数据",而是数据太多、口径混乱、谁也说不清这些数字到底意味着什么

建议团队内部先做好三件事:

  1. 定义指标字典:每个指标的名称、口径、计算方式、数据来源写清楚
  2. 统一事件规范:事件命名、属性名、时间戳格式标准化
  3. 建立数据对账机制:核心指标每天对账,发现差异立即排查

做好这三件事,你的数据质量就能超过 80% 的团队。