首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
前端
程序员
后端
面试
算法
人工智能
云原生
数据库
Python
展开
全部
前端
程序员
后端
面试
算法
人工智能
云原生
数据库
Python
LLM
AIGC
音视频开发
测试
大数据
架构
暂无数据
推荐
最新
大部分公司都是草台班子,甚至更水
我第一份实习是在一家咨询公司,我以为我们能够给我们的客户提供极具商业价值的战略指导,但其实开始干活了之后,发现我们就是PPT和调研报告的搬运工。后来我去了一家互联网大厂,我以为我的身边全都是逻辑超强的
2-5 倍性能提升,30% 成本降低,阿里云 SelectDB 存算分离架构助力波司登集团实现降本增效
采用阿里云数据库 SelectDB 版升级数仓,基于阿里云 SelectDB 云原生存算分离架构,实现了资源隔离与弹性扩缩容,并取得了查询性能提升 2-5 倍、总体成本降低 30% 以上。
B站模型训练存储加速实践
随着模型训练技术进入规模化应用阶段,提升训练效率与降低算力成本已成为全球AI竞赛的关键突破口。本文将系统性解析B站在大规模模型训练场景中构建的存储体系升级方案与工程实践经验。
B站大数据平台元数据血缘建设与应用
随着公司业务的不断扩展,进入大数据平台的业务数据日益增多,数据之间的产出与使用关系变得愈发复杂,元数据血缘的建设是理清这些复杂数据关系的最佳途径。
埋点采集之曝光
本篇作为神策埋点 SDK 曝光系列的开篇,主要大概介绍下神策曝光的功能以及支持的场景,使用曝光可以解决哪些问题
公开免费!Apache Doris & SelectDB 培训与认证课程正式上线
随着 Apache Doris 用户群体日益壮大,许多用户反馈在学习和掌握 Doris 的过程中缺乏系统性的指导。无论是初次接触 Doris 的新手,还是希望在特定场景下深度应用的用户,都渴望一套从
大数据dolphinscheduler的优化实践
DolphinScheduler(海豚调度器)是一款开源的分布式调度系统,旨在解决大数据场景下复杂的任务调度和流程编排问题。
因果推断之中介效应
在AB实验和非AB实验因果推断中,我们得到的结论往往是单一的变量X对变量Y的影响,而我们往往想知道X是通过何种路径对Y造成影响的。此时就需要通过中介效应分析来得出因果关系之中的变量影响路径。
AB实验分流方式:发现最优分组概述
当前在货拉拉进行的诸多 AB实验中,部分实验中实验单元少,简单随机分流会导致实验与对照的实验前偏差大。本文档调研了业界先进的实验前偏差应对技术,在最优随机分组的基础上,进一步提出了离线分流。
实验偏差校正:方差缩减技术
这次实验又不显著? 样本量太少指标波动剧烈? 通常增加样本量是对以上问题最简单直接的解法。但若因客观条件限制导致无法增加样本量呢? 本文介绍的方差缩减技术也许能帮到你。
AB实验统计学基础:假设检验和最小样本量
在进行AB实验时,我们常遇到这样的问题: 实验样本量是否足够? 如果不够还需要多少样本? 两个组的差异能否证明干预是有效的?
因果推断技术实践简述
货拉拉数据科学团队在订单分发、产品功能迭代等各项业务的支持上,都会遇到实验科的挑战。因此了解行业最新进展和动向,指导数据科学组更快、更好地解决各类业务挑战,是大势所趋。
AB实验假设检验方法:Delta Method
在货拉拉的 AB实验场景中,分流单元和分析单元往往不一定相同。当两者不一致时,常用的方法会出现犯第一类错误概率过高的问题。
双边市场实验分流全面解析
本文旨在明确适用于公司当前普遍业务场景的实验方式以及对应的理论说明。这将有助于我们在双边市场环境中有效地设计实验,评估收益,推动业务策略的持续优化。
倾向性得分匹配(PSM)
当无法进行AB实验或者AB实验不够有效 (如存在不依从现象) 时,正确评估因果效应就需要排除混淆变量的干扰,而排除混淆变量干扰最常用的方法之一就是倾向性得分匹配。
Apache Doris 2.0.11 版本正式发布
Apache Doris 2.0.11 版本已于 2024 年 6 月 5 日正式与大家见面,该版本提交了 123 个改进项以及问题修复,进一步提升了系统的性能及稳定性,欢迎大家下载体验。
货运时间片实验的叠加效应分析
当前时间片实验日益增多,且时间片实验之间如果不加限制会存在互相千扰。因此在货拉拉实验场景大量使用固定顺序轮播的时间片嵌套的方法,将这一干扰降低至可控。
AB实验统计学基础:同质性保障解决方案
随着货拉拉的产品成熟度不断提升,存在大量针对细分场景的策略。由于业务对于 AB实验结果的可靠度要求不断提升,简单的随机分流已无法满足业务需要。因此,货拉拉数据科学团队提出了体系化的解决方案。
用一杯星巴克的钱,训练自己私有化的ChatGPT
![file](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/90a6ea603ff144a8948ef89493faaa2c~tplv-k3u
SQL大宝剑-已燃尽所有SQL的理解
作者:京东物流 向往 一、背景 从事数据开发将近四年,过程中有大量任务交接或阅读同事代码的场景。在这些场景中发现有些SQL读起来赏心悦目,可以一目了然地了解业务逻辑,一些复杂的业务需求实现方法也可以做