首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Y11的学习乐园
程序员小jobleap
创建于2021-10-18
订阅专栏
学习如何学习
等 62 人订阅
共999篇文章
创建于2021-10-18
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
阿里云 MaxCompute SQLML:轻松实现机器学习
MaxCompute SQLML 是阿里云 MaxCompute 提供的一种使用 SQL 语言进行机器学习的工具。它依赖于阿里云的人工智能平台 PAI,允许用户直接在 MaxCompute 上创建、训
布隆过滤器:快速判断数据存在性的神奇工具
布隆过滤器是一种空间效率高、查询速度快的数据结构,主要用于解决海量数据的存在性问题。它通过使用一个固定大小的二进制向量和多个散列函数来判断一个元素是否在集合中。下面我们将详细介绍布隆过滤器的基本原理、
使用 MaxFrame 提升大规模数据处理效率
在处理大规模数据时,选择合适的工具至关重要。PyODPS 是一个用于与 MaxCompute 交互的 Python 库,而 MaxFrame 则是一种分布式计算框架,能够显著提高数据处理效率。下面我们
阿里云DataFrame入门:PyODPS和MaxFrame的使用指南
阿里云提供了两种主要的DataFrame接口:PyODPS和MaxFrame,用于数据处理和分析。下面我们将以简单易懂的方式介绍它们的基本用法和常用API。 PyODPS DataFrame PyOD
云服务对比:腾讯云、阿里云和火山引擎的独特优势
在中国的云服务市场中,腾讯云、阿里云和火山引擎各有其独特的优势和价格策略。下面我们将分别介绍这些云服务的主要特点和优势。 腾讯云的优势 价格优势 腾讯云在某些服务器配置上比阿里云更便宜,尤其适合初创企
了解Scikit-learn:Python机器学习的强大工具
Scikit-learn(sklearn)是一个基于Python的开源机器学习库,提供了广泛的基础能力和SDK,帮助开发者轻松构建和部署机器学习模型。下面我们将介绍sklearn的主要功能和一些常用的
XGBoost入门:强大的机器学习库
XGBoost是一款基于梯度提升算法的开源机器学习库,专门用于高效处理大规模数据集。它通过组合多个弱分类器来提高模型的准确性和稳定性。以下是XGBoost的基础能力和SDK使用示例。 基础能力 1.
阿里云Object Table:非结构化数据处理的强大工具
阿里云的Object Table是MaxCompute推出的一个功能,主要用于处理和访问数据湖存储中的非结构化数据及其元信息。以下是它的使用场景和基础能力: 使用场景 非结构化数据处理 Object
简单理解 MaxFrame 中的用户定义函数(UDF)和资源库导入
什么是 MaxFrame? MaxFrame 是阿里云提供的一种分布式计算框架,支持 Python 编程接口,并可以直接使用 MaxCompute 的计算资源和数据接口。它帮助开发者高效处理大数据和复
uvloop让你的异步代码速度提升400%,实战讲解与代码示例
uvloop是Python中一个强大的异步IO库,它可以作为标准asyncio事件循环的替代品,大幅提升异步代码性能。本文将以简洁易懂的方式介绍uvloop的基础知识及应用案例。 uvloop是什么?
asyncio.to_thread详解:轻松处理阻塞操作的完美方案
asyncio.to_thread是Python异步编程中的一个强大工具,它能让你在不阻塞事件循环的情况下执行同步操作。下面我们用简单易懂的方式来解释它的作用和用法。 什么是asyncio.to_th
DataWorks邮件外发完全指南:从零开始实现数据自动推送(2025最新实践)
数据分析团队经常需要将分析结果自动发送给业务人员,而邮件是最通用的方式之一。本文将详细介绍如何利用DataWorks实现邮件自动推送功能,内容简明扼要,配有实用代码示例。 基础概念 DataWorks
消息队列三剑客:RocketMQ、Kafka、RabbitMQ全方位对比与实战指南
消息队列基础概念 消息队列是一种异步通信的中间件技术,核心作用是解耦系统、削峰填谷和异步处理。下面详细介绍三大主流消息队列系统的基础知识。 RocketMQ核心概念 基本术语 主题(Topic) :消
一文读懂copy与deepcopy的区别与实战应用
什么是Python中的拷贝? 在Python中,变量赋值实际上是创建了对象的引用,而非复制对象本身。当我们需要复制对象时,有两种方式:浅拷贝(shallow copy)和深拷贝(deep copy)
ClickHouse与PostgreSQL:数据库的选择与应用场景
ClickHouse的应用场景 ClickHouse是一种列式数据库管理系统,主要用于大规模数据分析和实时查询,特别适用于OLAP(联机分析处理)场景。它常用于以下应用场景: 实时交互式报表:构建实时
实时计算Flink版:解锁数据处理新世界
实时计算Flink版是基于Apache Flink的企业级实时大数据处理系统,广泛应用于多个领域。下面我们将通过简单易懂的方式介绍其基础知识和应用场景,并提供示例代码帮助您更好地理解。 1. 实时数据
Hologres实时数仓引擎:简化数据处理与分析
Hologres是一款由阿里巴巴自主研发的一站式实时数仓引擎,旨在解决企业在数据处理和分析方面的多个痛点。下面我们将通过简单的表达方式介绍Hologres的主要功能和优势,并提供相关案例和示例代码。
阿里云MaxFrame分布式计算框架:十倍性能提升的Python大数据利器
【图解】阿里云MaxFrame分布式计算框架:十倍性能提升的Python大数据利器 MaxFrame是什么? MaxFrame是阿里云自研的分布式计算框架,它支持Python编程接口,能够直接使用Ma
MaxCompute Python UDF开发指南:从入门到精通
MaxCompute UDF基础概念 UDF(User-Defined Function)即用户自定义函数,当MaxCompute内建函数无法满足业务需求时,可以自行编写代码创建自定义函数。MaxCo
双Token机制:安全与便利的完美结合
双Token机制是一种用于用户认证和授权的安全方案,主要包括两个关键组件:Access Token和Refresh Token。这种机制旨在提高系统的安全性和用户体验。 双Token机制的组件 1.
下一页