首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
back
订阅
leekuhle
更多收藏集
微信扫码分享
微信
新浪微博
QQ
15篇文章 · 0订阅
再有人问你分布式事务,把这篇扔给他
不知道你是否遇到过这样的情况,去小卖铺买东西,付了钱,但是店主因为处理了一些其他事,居然忘记你付了钱,又叫你重新付。又或者在网上购物明明已经扣款,但是却告诉我没有发生交易。这一系列情况都是因为没有事务导致的。这说明了事务在生活中的一些重要性。有了事务,你去小卖铺买东西,那就是一…
面试前抢救一下--朴素贝叶斯分类器
朴素贝叶斯分类器,实际上也是对人们常识做的一个算法的完善。其以一种更为精准的量化来判断分类,使用的方法是后验概率。本文从与决策树的比较出发,介绍先验概率和后验概率的关系,再详细介绍一下朴素贝叶斯算法的流程。 朴素贝叶斯算法比较简单,所以此文多是留以面试前复习之用。理清各个问题之…
AI考拉技术分享--布隆过滤器实战
今天是中国传统佳节“猿宵节”,是程序猿通宵赶代码的佳节。 在金融业务系统里面,判断用户是否是黑名单,这种场景应该很常见。 的时间复杂度,但毕竟是磁盘操作,跟内存操作不是一个数量级的。 O(n),非常慢,二是占用大量内存。 O(logn)或者理论O(1),但是带来的是空间上的灾难…
为什么阿里巴巴禁止工程师直接使用日志系统(Log4j、Logback)中的 API
作为Java程序员,我想很多人都知道日志对于一个程序的重要性,尤其是Web应用。很多时候,日志可能是我们了解应用程序如何执行的唯一方式。 所以,日志在Java Web应用中至关重要,但是,很多人却以为日志输出只是一件简单的事情,所以会经常忽略和日志相关的问题。在接下来的几篇文章…
达观文本指纹算法和系统简述
1. 文本指纹介绍 互联网网页存在大量的重复内容网页,无论对于搜索引擎的网页去重和过滤、新闻小说等内容网站的内容反盗版和追踪,还是社交媒体等文本去重和聚类,都需要对网页或者文本进行去重和过滤。 最简单的文本相似性计算方法可以利用空间向量模型,计算分词后的文本的特征向量的相似性,…
MySQL事务隔离
一致性(Consistency):事务开始前和结束后,数据库的完整性约束没有被破坏。 隔离性(Isolation):并发的事务是相互隔离的。 持久性(Durability):事务完成后,该事务所对数据库所做的更改持久的保存在数据库之中,并不会被回滚。 脏读:读取了未提交的数据。…
[译] Python 的时间序列分析:简介
时间序列是日常生活中其中一种最常见的数据类型。金融市场的价格、天气、家庭耗能、甚至体重都是可以定期收集数据的例子。几乎每个数据科学家都会在日常工作中碰到时间序列,而学习如何为时间序列建模是数据科学中重要的技能。用以分析和预测周期数据的加和模型便是一种简单但强大的模型。背后直观的…
单机每秒最多可处理10亿条数据!eBay开源数据处理框架Accelerator
AI 前线导读:近日,eBay 宣布正式开源 Accelerator,一款久经考验的数据处理框架,提供快速的数据访问,并行执行以及自动组织源码、输入数据和结果。它可以用于日常数据分析,也可以用在包含数十万大型数据文件的实时推荐系统上。 Accelerator 可运行在笔记本电脑…
Spark Streaming VS Flink
本文从编程模型、任务调度、时间机制、Kafka 动态分区的感知、容错及处理语义、背压等几个方面对比 Spark Streaming 与 Flink,希望对有实时处理需求业务的企业端用户在框架选型有所启发。本文篇幅较长,建议先收藏~ Executor:负责执行 task,反馈执行…
深入理解分布式事务
分布式事务就是指事务的参与者、支持事务的服务器、资源服务器以及事务管理器分别位于不同的分布式系统的不同节点之上。以上是百度百科的解释,简单的说,就是一次大的操作由不同的小操作组成,这些小的操作分布在不同的服务器上,且属于不同的应用,分布式事务需要保证这些小操作要么全部成功,要么…