首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
编程点滴
databook
创建于2023-06-25
订阅专栏
记录平时编程中的体会和踩坑记录
等 44 人订阅
共104篇文章
创建于2023-06-25
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
数据分析师的“水晶球”:时间序列分析
很多刚入行的小伙伴问我:“我想预测下个月公司的销售额,或者预测一下明天的股价,该学什么?” 我的回答通常只有六个字:时间序列分析。 如果在数据分析的世界里有一种魔法能让你“预知未来”,那一定就是它。
拒绝“凭感觉”:用回归分析看透数据背后的秘密
在数据分析的江湖里,有一个绝对的核心技能,叫做回归分析(Regression Analysis)。 无论你是刚入行的新手,还是想要进阶的老手,掌握它,你就拥有了预测未来的“水晶球”。 很多初学者一听到
掌握相关性分析:读懂数据间的“悄悄话”
在数据分析的江湖里,我们经常会听到老板或业务方抛出这样的问题: “现在的年轻人越晚睡,买护肤品是不是越疯狂?” “我们APP的各种优惠券,真的能提升用户的留存率吗?” “天气越热,这只股票是不是跌得越
数据点的“社交距离”:衡量它们之间的相似与差异
在数据分析的世界里, “距离” 不仅仅是地图上两点之间的路程。 距离 ,本质上是衡量两个事物 “相似度” 的尺子。 距离越近 = 相似度越高 距离越远 = 差异越大 如果你想做用户画像聚类、想做商品推
搞懂“元数据”:给数据办一张“身份证”
你是否经历过这样的场景: 同事发给你一个 Excel 表格,文件名叫 data_final_v2.xlsx。 你满怀期待地打开,结果发现: 表头是 cryptic 的英文缩写(如 c_amt, usr
数据会说谎?三大推断方法帮你“审问”数据真相
很多刚入行甚至想入行数据分析的朋友,往往会陷入一个误区:以为数据分析就是不停地做报表、画饼图。 其实,数据分析的核心魅力在于 “推断”——即见微知著。 在现实生活中,我们很难获取“全量数据”(比如你不
用样本猜总体的秘密武器,4大抽样分布总结
数据分析时,我们经常需要从样本数据推断总体特征。 而抽样分布就是连接样本与总体的重要桥梁,如果你不理解它,就无法理解为什么我们可以通过调查几千人来预测全国的选举结果,也无法理解A/B测试背后的逻辑。
告别盲人摸象,数据分析的抽样方法总结
当你踏入数据分析的大门时,可能会被海量的数据淹没,感到无从下手。 想象一下,你想了解一座巨大森林里所有树木的平均高度,难道要一棵一棵地去测量吗?这显然不现实。 这时,“抽样” 这个强大的工具就该登场了
深入浅出理解你的“数据”
对于想要学习数据分析的同学,如果你问我:"数据分析的第一步是什么?" 我的回答是:"理解数据本身。" 数据是我们所有分析工作的起点,本文主要探讨如何辨别我们面对的是什么样的数据,包括它的分类方法和描述
数据分析师的基本功总结
你是否对数据分析这个行业充满好奇,但又不知从何下手? 别担心,这篇文章将用最通俗易懂的语言,系统地介绍数据分析师需要具备哪些“基本功”, 并且结合实际生活中的例子和Python代码,为你铺平通往数据分
AI辅助编程下的软件分层设计:让生成的代码井然有序
在人工智能(AI)辅助编程日益普及的今天,我们编码的方式正在经历一场前所未有的变革。 AI 工具如 QWenCoder,TreaCN等,能够帮助我们快速生成代码,极大地提升了开发效率。 然而,这也带来
让YOLO飞起来:从CPU到GPU的配置指南
最近在配置YOLO(You Only Look Once)进行物体检测和图像分割任务时,发现默认安装的情况下,YOLO使用的是CPU进行计算。 这对于需要处理大量图像或实时检测的任务来说,效率明显不足
VS Code 中把「自己部署的 Coder 模型」变成 AI 编程助手
公司内部部署了一个QWen-Coder的7B小模型,这个模型虽然不大,但是验证后发现效果还不错。 所以,希望能够在VS Code中使用这个模型来辅助编写代码,这样就可以避免使用其他付费模型。 1. 安
Just:告别 Makefile 的现代命令行任务运行器
本文推荐的一个轻量级命令行工具--Just,它提供了一种简单高效的方式来管理项目任务,类似于传统的 Make 工具,但具有更简洁的语法和更现代化的功能。 我目前在一些小项目中开始使用它来管理一些日常的
解锁UV工具新玩法:让Python脚本运行更高效的实用技巧
作为Python开发者,你是否经常被依赖安装的漫长等待、虚拟环境的繁琐管理,或是脚本分享时“环境不一致”的问题困扰? 近年来,一款名为UV的工具悄然兴起,它不仅以极速安装依赖著称,更通过一系列创新设计
Python3.14 即将带来的变化
1. 发布时间表 5月初:发布首个Beta版本 后续:依次发布3个Beta版本和2个候选版本 10月:发布最终正式版本 2. 新功能特性 2.1. PEP 765:禁止finally块中使用控制流语句
模型的泛化性能度量:方法、比较与实现
在机器学习领域,模型的泛化性能度量是评估模型在未知数据上表现的关键环节。 通过合理的性能度量,不仅能了解模型的优劣,还能为模型的优化和选择提供科学依据。 本文将深入探讨泛化性能度量的重要性、各种度量方
掌握机器学习数据集划分
在机器学习的流程中,数据集的合理划分是模型训练与评估的关键前提。 恰当的划分方式不仅能有效利用数据资源,还能确保模型评估结果的可靠性,为模型的泛化能力提供有力保障。 本文将深入介绍3种常见的数据集划分
『Python底层原理』--GIL对多线程的影响
在 Python 多线程编程中,全局解释器锁(Global Interpreter Lock,简称 GIL)是一个绕不开的话题。 GIL是CPython解释器的一个机制,它限制了同一时刻只有一个线程可
『Python底层原理』--异步机制(async/await)
在现代编程中,并发是提高程序效率的关键技术之一,它允许程序同时执行多个任务,充分利用系统资源。 本文将深入探讨 Python 中的async/await机制,从并发编程基础讲起,逐步剖析其工作原理和实
下一页