首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
全部
后端
Java
面试
架构
Python
数据库
大数据
Spring Boot
前端
展开
全部
后端
Java
面试
架构
Python
数据库
大数据
Spring Boot
前端
Go
MySQL
.NET
Elasticsearch
Node.js
C#
暂无数据
推荐
最新
大数据-219 Grafana 11.3.0 安装与启动实战:YUM 装 RPM、systemd 管理、登录与常见坑位排查
2026 年仍在使用 CentOS/RHEL 系(含兼容发行版)的运维/开发,给出 Grafana 11.3.0(grafana-enterprise-11.3.0-1.x86_64.rpm)
Galaxy比数平台功能介绍及实现原理|得物技术
一、背景 得物经过10年发展,计算任务已超10万+,数据已经超200+PB,为了降低成本,计算引擎和存储资源需要从云平台迁移到得物自建平台,计算引擎从云平台Spark迁移到自建Apache Spark
Flink源码阅读:Kafka Connector
本文我们来梳理 Kafka Connector 相关的源码。 自定义 Source 和 Sink 在介绍 Kafka Connector 之前,我们先来看一下在 Flink 中是如何支持自定义 Sou
大数据-217 Prometheus 2.53.2 安装与配置实战:Scrape Targets、Exporter、告警链路与常见故障速查
Prometheus 2.53.2(2025/2026 仍常见在存量环境)**给出一套可复用的落地流程:在监控机下载并解压二进制,编写 prometheus.yml 完成 scrape_interva
大数据-216 KMeans 选 n_clusters:轮廓系数(Silhouette)实战 + init/n_init/random_state 版本坑(sc
KMeans 选 n_clusters 方法:在候选簇数(如 2/4/6/8)上计算 silhouette_score 与 silhouette_samples,结合轮廓系数分布图与聚类散点图判断最优
大数据-215 sklearn KMeans 关键属性与评估:cluster_centers_、inertia_、轮廓系数选 K 实战
scikit-learn(sklearn)KMeans(2026)解释三个最常用对象:cluster_centers_(聚类中心)、inertia_(簇内平方和/Within-Cluster Sum
大数据-214 K-Means 聚类实战:自写算法验证 + sklearn KMeans 参数/labels_/fit_predict 速通
K-Means 聚类给出一套“可验证、可复现、可排错”的工程化流程:先用二维 testSet 数据集做算法验证(pd.read_table 读取、追加虚拟标签列、plt.scatter 可视化、绘制质
Flink源码阅读:Mailbox线程模型
本文我们来梳理 Flink 的线程模型——Mailbox。在以前的线程模型中,Flink 通过 checkpointLock 来隔离保证不同线程在修改内部状态时的正确性。
大数据-213 Python 手写 K-Means 聚类实战(鸢尾花 Iris 数据集):从距离函数到迭代收敛与坑点
Python K-Means 聚类实现:基于 NumPy 广播计算欧式距离平方和(distEclud),在特征范围内均匀采样初始化质心(randCent),并使用 Pandas 统一容器 result
大数据-212 K-Means 聚类实战指南:从无监督概念到 Inertia、K 值选择与避坑
聚类算法 K-Means,梳理监督学习与无监督学习的差异(是否需要标签 Y),并给出聚类在客户细分、RFM 分析、图像/语音/视频压缩、异常检测等工程场景的落地路径。重点解释 K-Means 的关键概
大数据-218 Prometheus Node Exporter 1.8.2 + Pushgateway 1.10.0:下载、启动、接入与避坑
常见的 Prometheus 监控落地场景:在 Rocky Linux(兼容 CentOS/RHEL)上安装 node_exporter-1.8.2 暴露主机指标,并接入 Prometheus
Flink源码阅读:JobManager的HA机制
JobManager 在 Flink 集群中发挥着重要的作用,包括任务调度和资源管理等工作。如果 JobManager 宕机,那么整个集群的任务都将失败。为了解决 JobManager 的单点问题,F
大数据-209 深度理解逻辑回归(Logistic Regression)与梯度下降优化算法
逻辑回归(Logistic Regression, LR)是机器学习中重要的分类算法,广泛应用于二元分类任务,如情感分析、疾病预测、垃圾邮件检测等场景。尽管其名字中有“回归”二字,实则是一种分类方法。
大数据-211 逻辑回归的 Scikit-Learn 实现:max_iter、分类方式与多元回归的优化方法
Scikit-Learn 中使用逻辑回归时,max_iter 控制最大迭代次数,影响模型的收敛速度和精度。如果训练未收敛,可能会收到警告提示需要增大 max_iter。不过,过高的迭代次数可能导致过拟
大数据-208 岭回归与Lasso回归:区别、应用与选择指南
岭回归(Ridge Regression)和Lasso回归(Lasso)是两种常用的线性回归正则化方法,用于解决机器学习中的过拟合和多重共线性问题。岭回归通过L2正则化项压缩回归系数,但不将其归零,适
大数据-210 如何在Scikit-Learn中实现逻辑回归及正则化详解(L1与L2)
但随着C的逐渐变大,正则化的强度越来越小,模型在训练集和测试集上表现呈现了上升趋势,直到C=0.8左右,训练集上的表现依然走高,但模型在未知数据集上的表现就开始下跌,这时候就是出现了过拟合。正则化参数
Paimon Action Jar 实现机制分析
Paimon Action Jar 实现机制分析 目录 1. 概述 2. 整体架构设计 3. SPI 服务发现机制 4. Action 执行流程 5. ExpireSnapshotsAction 详细
Flink源码阅读:Netty通信
前文中我们了解了 Flink 的数据交互过程,上游的 Task 将数据写入到 ResultSubpartition 的 buffers 队列中。下游的 Task 通过 LocalInputChanne
大数据-207 如何应对多重共线性:使用线性回归中的最小二乘法时常见问题与解决方案
TL;DR 在使用最小二乘法求解线性回归时,多重共线性会影响模型稳定性,导致系数估计不可靠。解决方法包括使用正则化技术(如岭回归、Lasso回归)。通过引入正则化项,可以有效避免矩阵不可逆问题,稳定
Flink源码阅读:Task数据交互
经过前面的学习,Flink 的几个核心概念相关的源码实现我们已经了解了。本文我们来梳理 Task 的数据交互相关的源码。 数据输出 话不多说,我们直接进入正题。首先来看 Task 的数据输出,在进入流