首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
云原生
前端
程序员
后端
人工智能
GitHub
算法
面试
云计算
展开
全部
云原生
前端
程序员
后端
人工智能
GitHub
算法
面试
云计算
数据库
Linux
JavaScript
大数据
架构
容器
暂无数据
推荐
最新
大部分公司都是草台班子,甚至更水
我第一份实习是在一家咨询公司,我以为我们能够给我们的客户提供极具商业价值的战略指导,但其实开始干活了之后,发现我们就是PPT和调研报告的搬运工。后来我去了一家互联网大厂,我以为我的身边全都是逻辑超强的
一文吃透 SeaTunnel 线程共享机制与任务执行模型设计优化
Apache SeaTunnel Zeta 引擎是社区独立设计的大数据集成和同步专用引擎,本文聚焦于 Zeta 引擎中 TaskExecutionService 和任务调度模型的优化设计,涵盖 T
SQL Server CDC 机制全解:如何用 SeaTunnel 构建高效实时数据同步方案
在构建 AI-Ready 企业级数据集成方案中,SQL Server 的 CDC(Change Data Capture)机制为 Apache SeaTunnel 提供了稳定的变更数据捕获能力,适
大数据dolphinscheduler的优化实践
DolphinScheduler(海豚调度器)是一款开源的分布式调度系统,旨在解决大数据场景下复杂的任务调度和流程编排问题。
【生产实践】Dolphinscheduler集群部署后Web控制台不能登录的问题解决了!
## 问题描述 Dolphinscheduler按生产手册使用一键脚本集群部署后,控制台登录页面可以打开,但使用默认账户怎么都登录不进去,尝试在数据库中清理登录用户字段,发现数据库中并没有相关用户字
从 ClickHouse、Druid、Kylin 到 Doris:网易云音乐 PB 级实时分析平台降本增效
网易云音乐基于 Apache Doris 替换了早期架构中 Kylin、Druid、Clickhouse、Elasticsearch、HBase 等引擎,统一了实时分析架构。
因果推断之中介效应
在AB实验和非AB实验因果推断中,我们得到的结论往往是单一的变量X对变量Y的影响,而我们往往想知道X是通过何种路径对Y造成影响的。此时就需要通过中介效应分析来得出因果关系之中的变量影响路径。
AB实验分流方式:发现最优分组概述
当前在货拉拉进行的诸多 AB实验中,部分实验中实验单元少,简单随机分流会导致实验与对照的实验前偏差大。本文档调研了业界先进的实验前偏差应对技术,在最优随机分组的基础上,进一步提出了离线分流。
实验偏差校正:方差缩减技术
这次实验又不显著? 样本量太少指标波动剧烈? 通常增加样本量是对以上问题最简单直接的解法。但若因客观条件限制导致无法增加样本量呢? 本文介绍的方差缩减技术也许能帮到你。
AB实验统计学基础:假设检验和最小样本量
在进行AB实验时,我们常遇到这样的问题: 实验样本量是否足够? 如果不够还需要多少样本? 两个组的差异能否证明干预是有效的?
因果推断技术实践简述
货拉拉数据科学团队在订单分发、产品功能迭代等各项业务的支持上,都会遇到实验科的挑战。因此了解行业最新进展和动向,指导数据科学组更快、更好地解决各类业务挑战,是大势所趋。
实战分享:DolphinScheduler 中 Shell 任务环境变量最佳配置方式
在使用 Apache DolphinScheduler 编排任务的过程中,Shell 类型任务是最常见的任务类型之一。然而,很多用户在实际使用中都会遇到一个看似简单却常常引发问题的问题——环境变量
SQL大宝剑-已燃尽所有SQL的理解
作者:京东物流 向往 一、背景 从事数据开发将近四年,过程中有大量任务交接或阅读同事代码的场景。在这些场景中发现有些SQL读起来赏心悦目,可以一目了然地了解业务逻辑,一些复杂的业务需求实现方法也可以做
双边市场实验分流全面解析
本文旨在明确适用于公司当前普遍业务场景的实验方式以及对应的理论说明。这将有助于我们在双边市场环境中有效地设计实验,评估收益,推动业务策略的持续优化。
Apache Doris 2.0.11 版本正式发布
Apache Doris 2.0.11 版本已于 2024 年 6 月 5 日正式与大家见面,该版本提交了 123 个改进项以及问题修复,进一步提升了系统的性能及稳定性,欢迎大家下载体验。
AB实验假设检验方法:Delta Method
在货拉拉的 AB实验场景中,分流单元和分析单元往往不一定相同。当两者不一致时,常用的方法会出现犯第一类错误概率过高的问题。
倾向性得分匹配(PSM)
当无法进行AB实验或者AB实验不够有效 (如存在不依从现象) 时,正确评估因果效应就需要排除混淆变量的干扰,而排除混淆变量干扰最常用的方法之一就是倾向性得分匹配。
Apache DolphinScheduler存储系统详解| AI生成技术文档系列
#### **存储系统概述** Apache DolphinScheduler 的存储系统提供**统一接口**,支持跨多种存储后端(如本地文件系统、云存储)进行文件存取。其核心功能是管理工作流
4月报 | SeaTunnel支持TDengine的多表Sink功能
各位热爱 Apache SeaTunnel 的小伙伴们,今年 4 月份月报更新啦!这里将记录 SeaTunnel 社区每月的重要更新,欢迎关注! 在本月的众多更新中,最令人关注的一项新特性是——
一招解决SeaTunnel Excel中无法将数字类型转换成字符串类型的问题 | 附源码打包
针对SeaTunnel处理Excel数字类型强转为字符串时导致的类型异常,本文将详解如何通过修改源码,实现数字类型到数据库字符串字段的兼容推送,并通过Maven打包部署修复后的代码。 ## 需求