首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
威威不想说话57036
掘友等级
前端工程師
|
Fiiser
嗨,我是維元,一個擅長網站開發與資料科學的雙棲工程師,熟悉的語言是 Python 跟 JavaScript。擁有多次國內大型技術會議講者經驗,持續在不同的平台發表對 #資料科學、 #網頁開發 或 #軟體職涯 相關的分享。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
34
文章 34
沸点 0
赞
34
返回
|
搜索文章
最新
热门
让 Python 爬虫也能读得懂「滑动验证码」
动态网页与静态网页最大的不同是资料是在什么时间点取得的,动态网页是在浏览器已经取得 HTML 后,才透过 JavaScript 在需要时动态地取得资料。因此,爬虫程式也必须要考虑动态取得资料这件事情,
现代数据团队与分工
在刚入行的时候曾经写过一篇文章「数据专案团队组成」,当时把数据团队根据技能分成数据科学家、数据分析师和数据工程师三种角色。不过在工作几年之后,发现实务上的数据分工其实更细而且更复杂,也隐含了更多的可能
在 mac 上建立 Python 的 Kafka 与 Spark 环境
「Producer-Consumer」问题是资工系很常用来解释讯息交换的一种范例,用生产者跟消费者间的关系来描述讯息的传递。生产者负责产生资料并放在有限或是无限的缓冲区让等待消费者来处理。串流资料(Streaming Data)本质上就是一端不断的丢出资料,另一端需要持续地进行…
标签编码、独热编码大不同 - Python 实现
如果讲水果这个无序栏位中的频果、香蕉、西瓜,Label 成0, 1, 2 会隐含着「香蕉跟苹果」比「西瓜跟苹果」还要相似的意义,但这样是错误的。 如果是年龄这个有序栏位的老年、中年、少年,Label 成 0, 1, 2 就很恰当,到如果硬转成 One-Hot 反而将这个差距关系…
K-means 怎么选 K ?
1. 手肘法(elbow method) 其概念是基于 SSE(sum of the squared errors,误差平方和)作为指标,去计算每一个群中的每一个点,到群中心的距离。算法如下: 其中总共有 K 个群, Ci 代表其中一个群,mi 表示该群的中心点。 根据 K 与…
PredictionIO:开源的推荐系统
PredictionIO 是一个用Scala编写的开源机器学习服务器应用,可以帮助你方便地使用RESTFul API搭建推荐引擎。 PredictionIO的核心使用的是一个可伸缩的机器学习库,基于Spark一个完整的端到端Pipeline,让使用者可以非常简单的从零开始搭建一…
Create React App 2.0 华丽登场
Create React App 是由官方所维护的开发工具,主要提供了专属于 React 开发环境的前置工作。简单来说,就是不需要安装或设定像 Webpack、Babel 这类的构建工具,而是由 CRA 替你预设且隐藏的。最主要的好处即是让开发者可以专注在程式开发,节省了繁杂的…
关于 Machine Learning 与 Statistical Modeling 的那些事
一般来说,这两个项目所研究的目标相近,不同的是使用的背景不同。机器学习是资工领域发展的议题;统计模型是统计学所探讨的领域。这是一张有趣的图来说明资料科学中之间错综复杂的交织关系: 首先,不管是机器学习或是统计模型都有一个共同的目标 - Learning from Data. 这…
淺淺地談 GraphQL
GraphQL is a new API standard that provides a more efficient, powerful and flexible alternative to REST. It was developed and open-sourced …
Python 爬虫的工具链
资料爬虫是资料分析的入门砖,Python 更是资料爬虫的热门工具。因为热门,所以也会有许许多多相关的配套工具出现。但对于新手来说,该如何寻找到适合的工具其实是很麻烦的。这一篇文章会介绍一下几个比较主流的相关工具,与他们适合的使用时机。 Requests 或是 urllib 这两…
下一页
个人成就
文章被点赞
63
文章被阅读
34,349
掘力值
635
关注了
16
关注者
6
收藏集
1
关注标签
6
加入于
2018-09-21