首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
Atal
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
96
文章 96
沸点 0
赞
96
返回
|
搜索文章
赞
文章( 96 )
沸点( 0 )
[译] 正则表达式要跑 5 天,所以我做了个工具,只跑 15 分钟。
当开发人员使用文本时,他们通常需要先清理它。有时是替换关键词,就像用“JavaScript”替换“Javascript”一样。其它时候,我们只想知道文档中是否提到了“JavaScript”。 像这样的数据清理是大多数处理文本的数据科学项目的标准任务。 数据科学始于数据清理。 最…
闲谈为什么慎用 Date
Date 的 api 设计到底是有多糟糕
走进科学之揭开神秘的"零拷贝"
"零拷贝"这三个字,想必大家多多少少都有听过吧,这个技术在各种开源组件中都使用了,比如kafka,rocketmq,netty,nginx等等开源框架都在其中引用了这项技术。所以今天想和大家分享一下有关于零拷贝的一些知识。 在介绍零拷贝之前我想说下在计算机系统中数据传输的方式。…
逼格高又实用的 Linux 高级命令,开发运维都要懂
在运维的坑里摸爬滚打好几年了,我还记得我刚开始的时候,我只会使用一些简单的命令,写脚本的时候,也是要多简单有多简单,所以有时候写出来的脚本又长又臭。 像一些高级点的命令,比如说 Xargs 命令、管道命令、自动应答命令等,如果当初我要是知道,那我也可能写出简洁高效的脚本。 不管…
有轻功:用3行代码让Python数据处理脚本获得4倍提速
Python是一门非常适合处理数据和自动化完成重复性工作的编程语言,我们在用数据训练机器学习模型之前,通常都需要对数据进行预处理,而Python就非常适合完成这项工作,比如需要重新调整几十万张图像的尺寸,用Python没问题!你几乎总是能找到一款可以轻松完成数据处理工作的Pyt…
深入学习Redis(1):Redis内存模型
前言Redis是目前最火爆的内存数据库之一,通过在内存中读写数据,大大提高了读写速度,可以说Redis是实现网站高并发不可或缺的一部分。我们使用Redis时,会接触Redis的5种对象类型(字符串、哈
一步步理解python的异步IO
看到越来越多的大佬都在使用python的异步IO,协程等概念来实现高效的IO处理过程,可是我对这些概念还不太懂,就学习了一下。 因为是初学者,在理解上有很多不到位的地方,如果有错误,还希望能够有人积极帮我斧正。
基于主动学习算法减少人工标注量,提升文本标注效率的方案探究
传统人工标注数据的过程往往是繁琐和低效率的。本文提供了很好的思路和方案实践,以及如何构建中文文本标注工具(附工具、代码、论文等资源),构建了如何基于主动学习算法减少人工标注,提升标注效率,模型训练准确率、召回率等探究和实践。
一个正则表达式引发的血案,让线上CPU100%异常!
前几天线上一个项目监控信息突然报告异常,上到机器上后查看相关资源的使用情况,发现 CPU 利用率将近 100%。通过 Java 自带的线程 Dump 工具,我们导出了出问题的堆栈信息。 我们可以看到所有的堆栈都指向了一个名为 validateUrl 的方法,这样的报错信息在堆栈…
微博应对日访问量百亿级的缓存架构设计
微博日活跃用户1.6亿+,每日访问量达百亿级,面对庞大用户群的海量访问,良好的架构且不断改进的缓存体系具有非常重要的支撑作用。本文将由新浪微博技术专家陈波老师,跟大家详细讲解那些庞大的数据都是如何呈现的。
下一页
关注了
4
关注者
0
收藏集
10
关注标签
14
加入于
2017-09-06