稀土掘金 稀土掘金
    • 首页
    • AI Coding
    • 数据标注 NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
关注
综合
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
排行榜
综合
后端
排行榜
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
  • 全部
  • 后端
  • Java
  • 面试
  • 架构
  • Python
  • 数据库
  • 大数据
  • Spring Boot
  • 前端
  • 展开
  • 全部
  • 后端
  • Java
  • 面试
  • 架构
  • Python
  • 数据库
  • 大数据
  • Spring Boot
  • 前端
  • Go
  • MySQL
  • .NET
  • Elasticsearch
  • Node.js
  • C#
  • 暂无数据
    • 推荐
    • 最新
  • 大数据-219 Grafana 11.3.0 安装与启动实战:YUM 装 RPM、systemd 管理、登录与常见坑位排查
    2026 年仍在使用 CentOS/RHEL 系(含兼容发行版)的运维/开发,给出 Grafana 11.3.0(grafana-enterprise-11.3.0-1.x86_64.rpm)
    • 武子康
    • 5
    • 点赞
    后端 大数据 Grafana
    大数据-219 Grafana 11.3.0 安装与启动实战:YUM 装 RPM、systemd 管理、登录与常见坑位排查
  • Galaxy比数平台功能介绍及实现原理|得物技术
    一、背景 得物经过10年发展,计算任务已超10万+,数据已经超200+PB,为了降低成本,计算引擎和存储资源需要从云平台迁移到得物自建平台,计算引擎从云平台Spark迁移到自建Apache Spark
    • 得物技术
    • 182
    • 3
    大数据
    Galaxy比数平台功能介绍及实现原理|得物技术
  • Flink源码阅读:Kafka Connector
    本文我们来梳理 Kafka Connector 相关的源码。 自定义 Source 和 Sink 在介绍 Kafka Connector 之前,我们先来看一下在 Flink 中是如何支持自定义 Sou
    • 面向Google编程
    • 31
    • 点赞
    Flink 大数据
    Flink源码阅读:Kafka Connector
  • 大数据-217 Prometheus 2.53.2 安装与配置实战:Scrape Targets、Exporter、告警链路与常见故障速查
    Prometheus 2.53.2(2025/2026 仍常见在存量环境)**给出一套可复用的落地流程:在监控机下载并解压二进制,编写 prometheus.yml 完成 scrape_interva
    • 武子康
    • 31
    • 点赞
    后端 大数据 机器学习
    大数据-217 Prometheus 2.53.2 安装与配置实战:Scrape Targets、Exporter、告警链路与常见故障速查
  • 大数据-216 KMeans 选 n_clusters:轮廓系数(Silhouette)实战 + init/n_init/random_state 版本坑(sc
    KMeans 选 n_clusters 方法:在候选簇数(如 2/4/6/8)上计算 silhouette_score 与 silhouette_samples,结合轮廓系数分布图与聚类散点图判断最优
    • 武子康
    • 21
    • 点赞
    后端 大数据 机器学习
    大数据-216 KMeans 选 n_clusters:轮廓系数(Silhouette)实战 + init/n_init/random_state 版本坑(sc
  • 大数据-215 sklearn KMeans 关键属性与评估:cluster_centers_、inertia_、轮廓系数选 K 实战
    scikit-learn(sklearn)KMeans(2026)解释三个最常用对象:cluster_centers_(聚类中心)、inertia_(簇内平方和/Within-Cluster Sum
    • 武子康
    • 45
    • 点赞
    后端 大数据 机器学习
    大数据-215 sklearn KMeans 关键属性与评估:cluster_centers_、inertia_、轮廓系数选 K 实战
  • 大数据-214 K-Means 聚类实战:自写算法验证 + sklearn KMeans 参数/labels_/fit_predict 速通
    K-Means 聚类给出一套“可验证、可复现、可排错”的工程化流程:先用二维 testSet 数据集做算法验证(pd.read_table 读取、追加虚拟标签列、plt.scatter 可视化、绘制质
    • 武子康
    • 33
    • 1
    后端 大数据 机器学习
    大数据-214 K-Means 聚类实战:自写算法验证 + sklearn KMeans 参数/labels_/fit_predict 速通
  • Flink源码阅读:Mailbox线程模型
    本文我们来梳理 Flink 的线程模型——Mailbox。在以前的线程模型中,Flink 通过 checkpointLock 来隔离保证不同线程在修改内部状态时的正确性。
    • 面向Google编程
    • 34
    • 点赞
    Flink 大数据
    Flink源码阅读:Mailbox线程模型
  • 大数据-213 Python 手写 K-Means 聚类实战(鸢尾花 Iris 数据集):从距离函数到迭代收敛与坑点
    Python K-Means 聚类实现:基于 NumPy 广播计算欧式距离平方和(distEclud),在特征范围内均匀采样初始化质心(randCent),并使用 Pandas 统一容器 result
    • 武子康
    • 43
    • 1
    后端 大数据 机器学习
    大数据-213 Python 手写 K-Means 聚类实战(鸢尾花 Iris 数据集):从距离函数到迭代收敛与坑点
  • 大数据-212 K-Means 聚类实战指南:从无监督概念到 Inertia、K 值选择与避坑
    聚类算法 K-Means,梳理监督学习与无监督学习的差异(是否需要标签 Y),并给出聚类在客户细分、RFM 分析、图像/语音/视频压缩、异常检测等工程场景的落地路径。重点解释 K-Means 的关键概
    • 武子康
    • 36
    • 1
    后端 大数据 机器学习
    大数据-212 K-Means 聚类实战指南:从无监督概念到 Inertia、K 值选择与避坑
  • 大数据-218 Prometheus Node Exporter 1.8.2 + Pushgateway 1.10.0:下载、启动、接入与避坑
    常见的 Prometheus 监控落地场景:在 Rocky Linux(兼容 CentOS/RHEL)上安装 node_exporter-1.8.2 暴露主机指标,并接入 Prometheus
    • 武子康
    • 23
    • 点赞
    后端 大数据 架构
    大数据-218 Prometheus Node Exporter 1.8.2 + Pushgateway 1.10.0:下载、启动、接入与避坑
  • Flink源码阅读:JobManager的HA机制
    JobManager 在 Flink 集群中发挥着重要的作用,包括任务调度和资源管理等工作。如果 JobManager 宕机,那么整个集群的任务都将失败。为了解决 JobManager 的单点问题,F
    • 面向Google编程
    • 39
    • 点赞
    Flink 大数据
    Flink源码阅读:JobManager的HA机制
  • 大数据-209 深度理解逻辑回归(Logistic Regression)与梯度下降优化算法
    逻辑回归(Logistic Regression, LR)是机器学习中重要的分类算法,广泛应用于二元分类任务,如情感分析、疾病预测、垃圾邮件检测等场景。尽管其名字中有“回归”二字,实则是一种分类方法。
    • 武子康
    • 69
    • 1
    后端 大数据 机器学习
    大数据-209 深度理解逻辑回归(Logistic Regression)与梯度下降优化算法
  • 大数据-211 逻辑回归的 Scikit-Learn 实现:max_iter、分类方式与多元回归的优化方法
    Scikit-Learn 中使用逻辑回归时,max_iter 控制最大迭代次数,影响模型的收敛速度和精度。如果训练未收敛,可能会收到警告提示需要增大 max_iter。不过,过高的迭代次数可能导致过拟
    • 武子康
    • 16
    • 1
    后端 大数据 机器学习
    大数据-211 逻辑回归的 Scikit-Learn 实现:max_iter、分类方式与多元回归的优化方法
  • 大数据-208 岭回归与Lasso回归:区别、应用与选择指南
    岭回归(Ridge Regression)和Lasso回归(Lasso)是两种常用的线性回归正则化方法,用于解决机器学习中的过拟合和多重共线性问题。岭回归通过L2正则化项压缩回归系数,但不将其归零,适
    • 武子康
    • 82
    • 1
    后端 大数据 机器学习
    大数据-208 岭回归与Lasso回归:区别、应用与选择指南
  • 大数据-210 如何在Scikit-Learn中实现逻辑回归及正则化详解(L1与L2)
    但随着C的逐渐变大,正则化的强度越来越小,模型在训练集和测试集上表现呈现了上升趋势,直到C=0.8左右,训练集上的表现依然走高,但模型在未知数据集上的表现就开始下跌,这时候就是出现了过拟合。正则化参数
    • 武子康
    • 21
    • 1
    后端 大数据 机器学习
    大数据-210 如何在Scikit-Learn中实现逻辑回归及正则化详解(L1与L2)
  • Paimon Action Jar 实现机制分析
    Paimon Action Jar 实现机制分析 目录 1. 概述 2. 整体架构设计 3. SPI 服务发现机制 4. Action 执行流程 5. ExpireSnapshotsAction 详细
    • A黑桃
    • 28
    • 点赞
    后端 大数据
  • Flink源码阅读:Netty通信
    前文中我们了解了 Flink 的数据交互过程,上游的 Task 将数据写入到 ResultSubpartition 的 buffers 队列中。下游的 Task 通过 LocalInputChanne
    • 面向Google编程
    • 28
    • 点赞
    Flink 大数据
    Flink源码阅读:Netty通信
  • 大数据-207 如何应对多重共线性:使用线性回归中的最小二乘法时常见问题与解决方案
    TL;DR 在使用最小二乘法求解线性回归时,多重共线性会影响模型稳定性,导致系数估计不可靠。解决方法包括使用正则化技术(如岭回归、Lasso回归)。通过引入正则化项,可以有效避免矩阵不可逆问题,稳定
    • 武子康
    • 68
    • 1
    后端 大数据 机器学习
    大数据-207 如何应对多重共线性:使用线性回归中的最小二乘法时常见问题与解决方案
  • Flink源码阅读:Task数据交互
    经过前面的学习,Flink 的几个核心概念相关的源码实现我们已经了解了。本文我们来梳理 Task 的数据交互相关的源码。 数据输出 话不多说,我们直接进入正题。首先来看 Task 的数据输出,在进入流
    • 面向Google编程
    • 57
    • 点赞
    Flink 大数据
    Flink源码阅读:Task数据交互
  • 下午好!
    点亮在社区的每一天

    推荐话题 换一换

    #挑战每日一条沸点#
    #挑战每日一条沸点#

    22.5m

    #2025 AI/Vibe Coding 对我的影响#
    #2025 AI/Vibe Coding 对我的影响#

    263k

    #每日快讯#

    9.8m

    #每日精选文章#

    3.2m

    #日新计划#

    10.6m

    #每天一个知识点#

    47.2m

    #我的 2026新年 flag#
    #我的 2026新年 flag#

    352k

    #工作中做得最正确的一件事#
    #工作中做得最正确的一件事#

    407k

    #掘金一周#

    1.4m

    #新人报道#

    38.5m

    查看更多
    • 用户协议
    • 营业执照
    • 隐私政策
    • 关于我们
    • 使用指南
    • 友情链接
    • 更多后端文章
    • 举报邮箱: feedback@xitu.io
    • 座机电话: 010-83434395
    • 京ICP备:18012699号-3
    • 京ICP证:京B2-20191272
    • police 京公网安备11010802026719号
    • ©2026 稀土掘金