首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
Y11的学习乐园
程序员小jobleap
创建于2021-10-18
订阅专栏
学习如何学习
等 70 人订阅
共1097篇文章
创建于2021-10-18
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Apache APISIX 简介与实践
Apache APISIX 是一个动态、实时、高性能的开源 API 网关,由 Apache 软件基金会维护。它提供了负载均衡、动态上游、灰度发布、服务熔断、身份认证、可观测性等丰富的流量管理功能126
Apache Beam:统一的大数据处理模型
Apache Beam 是一个开源的统一编程模型,用于定义和执行数据处理流水线(Data Processing Pipelines)。它允许开发者使用一套统一的 API 编写数据处理逻辑,然后在不同执
RocketMQ:解密阿里巴巴都在用的高性能消息队列
Apache RocketMQ是一个强大的分布式消息队列,它就像一个可靠的信使,负责在不同的系统或应用之间传递信息。想象一下,你有一个电商网站,用户下单后,需要通知库存系统减库存,通知物流系统发货,通
Apache SkyWalking:分布式系统的可观测性平台
Apache SkyWalking 是一个开源的可观测性平台,专为分布式系统、微服务和云原生架构设计。它提供了一套全面的工具,用于收集、分析、聚合和可视化服务和应用程序的性能数据。以下是 SkyWal
Apache Superset:现代化数据分析与可视化平台
Apache Superset 是一个开源的商业智能 Web 应用程序,专注于数据探索、分析和可视化。它为用户提供了一个直观的界面来浏览和理解数据,支持多种数据源和可视化选项。 主要功能和用途 1.
Kafka和PySpark:基础知识与应用场景
Kafka简介 Kafka是一种流行的分布式消息队列中间件,主要用于处理实时数据流和异步消息传递。它提供了高吞吐量、低延迟、可靠性和可扩展性,适用于多种业务场景。 适合使用Kafka的业务 实时数据处
使用 Apache Dubbo-Python 构建高性能 RPC 服务
Apache Dubbo-Python 是一个高性能的 RPC 框架,提供了服务发现、负载均衡等功能,帮助开发者构建微服务架构。下面是一个使用 Dubbo-Python 的具体教程。 1. 安装 Du
gRPC入门指南:基础概念与Python实践
什么是gRPC? gRPC是一款由Google开发的高性能、开源的远程过程调用(RPC)框架。它基于HTTP/2协议和Protocol Buffers数据序列化协议,支持跨语言通信,特别适用于微服务架
StoreKit 2:苹果应用内购买的新时代
StoreKit 2 是苹果公司于 2021 年推出的一个全新的框架,旨在简化 iOS 应用中的应用内购买和订阅功能。它利用 Swift 的最新特性,提供了更简洁、更安全的交易处理方式。以下是 Sto
NVIDIA Holoscan SDK:实时AI传感器处理平台
NVIDIA Holoscan SDK是一种强大的AI计算平台,专为实时处理流数据而设计。它提供了可扩展、软件定义的基础设施,支持在边缘或云端运行,适用于多种行业,如医疗设备、边缘高性能计算和工业检测
Python版Dataflow实战指南:从零构建大数据处理流水线
一、核心概念解析 Pipeline(管道) 相当于数据处理任务的蓝图,定义从数据输入到输出的完整流程。示例结构: PCollection(数据集) 代表分布式数据集合,可跨节点并行处理。典型特征: 不
Python版OR-Tools优化工具入门指南
优化问题就像在众多可能性中寻找最优解的数学寻宝游戏。我们通过一个货运公司的案例来理解:假设公司要用卡车配送包裹,每辆车有不同的路线选择,目标是用最低成本完成配送。这里需要权衡路线距离、载重量等复杂因素
Hazelcast入门:分布式内存数据网格的强大工具
什么是Hazelcast Hazelcast 是一个开源的、分布式的、高度可扩展的内存数据网格(In-Memory Data Grid)和计算平台。它为基于JVM环境的应用程序提供分布式集群和缓存服务
在 Ubuntu 24.04 上使用 FastAPI 部署和查询 Meilisearch
什么是 Meilisearch? Meilisearch 是一个开源的、快速且相关的搜索引擎。它使用 Rust 编写,提供了以下特点: 闪电般的速度: Meilisearch 可以在 50 毫秒内返回
轻量级隐私友好网站分析工具:Plausible Analytics
Plausible Analytics 是一个开源、轻量级且注重隐私保护的网站分析工具。它不使用 cookies,符合 GDPR、CCPA 等国际隐私法规,是 Google Analytics 的理想
使用 dag-factory 简化 Apache Airflow DAG 创建
什么是 dag-factory? dag-factory 是一个 Python 库,用于动态生成 Apache Airflow DAG。它允许你使用 YAML 文件定义 DAG,而不是编写 Pytho
MCP和Function Calling:基础知识与实践
在人工智能领域,MCP(Managed Context Protocol)和Function Calling是两个重要的概念,它们在AI应用中发挥着不同的作用。下面我们将以简单易懂的方式介绍它们的基础
Flink CDC:实时数据变更抓取与处理
什么是Flink CDC Flink CDC(Change Data Capture,即数据变更抓取)是一个开源的数据库变更日志捕获和处理框架。它可以实时地从各种数据库(如MySQL、PostgreS
当待处理的日志到了TB级别,这些工具你不得不学起来...
当日志达到TB级别时,选择合适的工具和组件对于数据分析和数据清洗至关重要。以下是基于Python、Golang和Java的推荐工具和组件: Python Pandas:用于数据分析和清洗的基础库,提供
使用airflow的10个具体实用案例
1. 定时SQL作业调度 通过PythonOperator每天凌晨执行MaxCompute SQL清洗任务,自动处理TB级日志数据 2. 跨服务触发机制 MaxCompute作业完成后通过EventB
下一页