首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
前端
程序员
后端
云原生
面试
算法
人工智能
数据库
Python
展开
全部
前端
程序员
后端
云原生
面试
算法
人工智能
数据库
Python
大数据
LLM
Linux
AIGC
产品
JavaScript
暂无数据
推荐
最新
B站模型训练存储加速实践
随着模型训练技术进入规模化应用阶段,提升训练效率与降低算力成本已成为全球AI竞赛的关键突破口。本文将系统性解析B站在大规模模型训练场景中构建的存储体系升级方案与工程实践经验。
大部分公司都是草台班子,甚至更水
我第一份实习是在一家咨询公司,我以为我们能够给我们的客户提供极具商业价值的战略指导,但其实开始干活了之后,发现我们就是PPT和调研报告的搬运工。后来我去了一家互联网大厂,我以为我的身边全都是逻辑超强的
B站大数据平台元数据血缘建设与应用
随着公司业务的不断扩展,进入大数据平台的业务数据日益增多,数据之间的产出与使用关系变得愈发复杂,元数据血缘的建设是理清这些复杂数据关系的最佳途径。
埋点采集之曝光
本篇作为神策埋点 SDK 曝光系列的开篇,主要大概介绍下神策曝光的功能以及支持的场景,使用曝光可以解决哪些问题
公开免费!Apache Doris & SelectDB 培训与认证课程正式上线
随着 Apache Doris 用户群体日益壮大,许多用户反馈在学习和掌握 Doris 的过程中缺乏系统性的指导。无论是初次接触 Doris 的新手,还是希望在特定场景下深度应用的用户,都渴望一套从
大数据dolphinscheduler的优化实践
DolphinScheduler(海豚调度器)是一款开源的分布式调度系统,旨在解决大数据场景下复杂的任务调度和流程编排问题。
因果推断之中介效应
在AB实验和非AB实验因果推断中,我们得到的结论往往是单一的变量X对变量Y的影响,而我们往往想知道X是通过何种路径对Y造成影响的。此时就需要通过中介效应分析来得出因果关系之中的变量影响路径。
Linux 基金会报告解读:开源 AI 重塑经济格局,有人失业,有人涨薪!
译自 | Linux Foundation Research 随着生成式 AI 技术飞速发展,开源模式正在成为推动经济转型的重要驱动力。Linux Foundation Research 发布的
AB实验分流方式:发现最优分组概述
当前在货拉拉进行的诸多 AB实验中,部分实验中实验单元少,简单随机分流会导致实验与对照的实验前偏差大。本文档调研了业界先进的实验前偏差应对技术,在最优随机分组的基础上,进一步提出了离线分流。
实验偏差校正:方差缩减技术
这次实验又不显著? 样本量太少指标波动剧烈? 通常增加样本量是对以上问题最简单直接的解法。但若因客观条件限制导致无法增加样本量呢? 本文介绍的方差缩减技术也许能帮到你。
AB实验统计学基础:假设检验和最小样本量
在进行AB实验时,我们常遇到这样的问题: 实验样本量是否足够? 如果不够还需要多少样本? 两个组的差异能否证明干预是有效的?
因果推断技术实践简述
货拉拉数据科学团队在订单分发、产品功能迭代等各项业务的支持上,都会遇到实验科的挑战。因此了解行业最新进展和动向,指导数据科学组更快、更好地解决各类业务挑战,是大势所趋。
DolphinScheduler+Sqoop 入门避坑:一文搞定数据同步常见异常
1. 在DolphinScheduler中假如遇到创建租户时,报错,错误日志显示权限不足: 可以使用下面的语句去开启权限: ``` hdfs dfs -chmod 777 / ``` 2.
BestBuy爬虫的逻辑解析
BestBuy爬虫的核心竞争力,在于精准绕过反爬机制与合规采集数据的平衡。结合自动化工具与人工审查,让爬虫成为业务增长的助推器而非法律风险源。
双边市场实验分流全面解析
本文旨在明确适用于公司当前普遍业务场景的实验方式以及对应的理论说明。这将有助于我们在双边市场环境中有效地设计实验,评估收益,推动业务策略的持续优化。
AB实验假设检验方法:Delta Method
在货拉拉的 AB实验场景中,分流单元和分析单元往往不一定相同。当两者不一致时,常用的方法会出现犯第一类错误概率过高的问题。
倾向性得分匹配(PSM)
当无法进行AB实验或者AB实验不够有效 (如存在不依从现象) 时,正确评估因果效应就需要排除混淆变量的干扰,而排除混淆变量干扰最常用的方法之一就是倾向性得分匹配。
Apache Doris 2.0.11 版本正式发布
Apache Doris 2.0.11 版本已于 2024 年 6 月 5 日正式与大家见面,该版本提交了 123 个改进项以及问题修复,进一步提升了系统的性能及稳定性,欢迎大家下载体验。
从 ClickHouse、Druid、Kylin 到 Doris:网易云音乐 PB 级实时分析平台降本增效
网易云音乐基于 Apache Doris 替换了早期架构中 Kylin、Druid、Clickhouse、Elasticsearch、HBase 等引擎,统一了实时分析架构。
货运时间片实验的叠加效应分析
当前时间片实验日益增多,且时间片实验之间如果不加限制会存在互相千扰。因此在货拉拉实验场景大量使用固定顺序轮播的时间片嵌套的方法,将这一干扰降低至可控。