首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
SophieMay
掘友等级
搜索工程师
|
互联网
living in the moment
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
41
文章 39
沸点 2
赞
41
返回
|
搜索文章
赞
文章( 39 )
沸点( 2 )
被面试官问懵B了,十亿级数据ES搜索怎么优化?
这个问题是肯定要问的,说白了,就是看你有没有实际干过 es,因为啥?其实 es 性能并没有你想象中那么好的。很多时候数据量大了,特别是有几亿条数据的时候,可能你会懵逼的发现,跑个搜索怎么一下 5~10s,坑爹了。第一次搜索的时候,是5~10s,后面反而就快了,可能就几百毫秒。 …
用Elasticsearch构建电商搜索平台
一个中等的电商平台,每天都要产生百万条原始数据,上亿条用户行为数据。一般来说,电商数据一般有3种主要类型的数据系统: 关系型数据库 ,大多数互联网公司会选用mysql作为关数据库的主选,用于存储商品,用户信息等数据。 关系型数据库对于事务性非常高的OLTP操作(比如订单,结算等…
ES慢查询优化方案 profile API
Profile API Profile API 用于定位查询过程中的异常耗时问题的。可以通过在 query 部分上方提供 “profile: true” 来启用Profile API。
美团搜索中NER技术的探索与实
1. 背景 命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。NER是信息提取、问答系统、句法分析、机器翻译、面向Semantic Web的元数据标注等应用…
深入 Elastic Search: ES 性能优化总结
ssd 好处不用说了,但是可能不是我们能决定的,这个知道就行。 ElasticSearch 是一个非常非常吃内存的搜索引擎,搜索过程中的 sort(排序)、agg(聚合),分词过程中的 fieldadd、倒排索引等等,一直在消耗着内存,一定要有足够的 JVM HEAP 在维持这…
[Search] 爱彼迎在搜索中应用深度学习的经验
这周分享一篇文章:Applying Deep Learning To Airbnb Search,内容如论文标题所示,介绍了爱彼迎如何在自己的搜索工程中应用深度学习。 这篇论文有趣的地方在于,并不是提出一个新颖的算法或模型,而是介绍了爱彼迎在应用深度学习的过程中,发现了哪些有趣…
18张图,揭开阿里巴巴开发手册强制使用SLF4J作为门面担当的秘密
之前已经详细、全面地介绍了 Log4j,相信小伙伴们已经完全掌握了。那我在读嵩山版的阿里巴巴开发手册(没有的小伙伴,记着找我要)的时候,就发现了一条「强制」性质的日志规约: PS:顺带给小伙伴们普及一点小知识,阿里巴巴开发手册上出现的 Jakarta 其实是 Apache 软件…
简述RPC原理实现
架构的改变,往往是因为业务规模的扩张。 随着业务规模的扩张,为了满足业务对技术的要求,技术架构需要从单体应用架构升级到分布式服务架构,来降低公司的技术成本,更好的适应业务的发展。 分布式服务架构的诸多优势,这里就不一一列举了,今天围绕的话题是服务框架,为了推行服务化,必然需要一…
一篇搞懂TCP、HTTP、Socket、Socket连接池
前言:作为一名开发人员我们经常会听到HTTP协议、TCP/IP协议、UDP协议、Socket、Socket长连接、Socket连接池等字眼,然而它们之间的关系、区别及原理并不是所有人都能理解清楚,这篇文章就从网络协议基础开始到Socket连接池,一步一步解释他们之间的关系。 首…
聊一聊session和cookie
HTTP是一种无状态协议。关于这个无状态之前我也不太理解,因为HTTP底层是TCP,既然是TCP,就是长连接,这个过程是保持连接状态的,又为什么说http是无状态的呢?先来搞清楚这两个概念: 无连接的维度是连接,无状态的维度是请求;http是基于tcp的,而从http1.1开始…
下一页
个人成就
文章被点赞
70
文章被阅读
63,477
掘力值
1,229
关注了
13
关注者
29
收藏集
14
关注标签
15
加入于
2018-09-29