首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
2226327533
更多收藏集
微信扫码分享
微信
新浪微博
QQ
10篇文章 · 0订阅
Elasticsearch:图片相似度搜索的 5 个技术组成部分
作者:Radovan Ondas,Bernhard Suhm 在本系列博文的第一部分中,我们介绍了图像相似度搜索,并回顾了一种可以降低复杂性并便于实施的高级架构。 此博客解释了实现图像相似性搜索应用程
Flink 从0-1实现 电商实时数仓 - 分层介绍 & 新建计算项目
分层介绍 需求分析及实现思路 在之前介绍实时数仓概念时讨论过,建设实时数仓的目的,主要是增加数据计算的复用性。每次新增加统计需求时,不至于从原始数据进行计算,而是从半成品继续加工而成。
关于构建与优化数据仓库架构与模型设计
大家好,我是云祁! 最近一直忙于项目交付,所以原创文章更新频率也慢了好多,大家见谅。 今晚有时间,和大家分享一篇关于基于阿里云 MaxCompute 构建离线数仓的文章。 我自己是做Dataphin数
有道精品课实时数据中台建设实践
本期文章中,有道精品课技术团队将和大家分享有道精品课数据中台的架构演进过程以及 Doris 作为一个 MPP 分析型数据库是如何为不断增长的业务体量提供有效支撑并进行数据赋能的。 本文以我们在实时数仓选型的经验为切入点,进一步着重分享使用 Doris 过程中遇到的问题,以及我们…
数仓建模分层理论
简单点儿,直接ODS+DM就可以了,将所有数据同步过来,然后直接开发些应用层的报表,这是最简单的了;当DM层的内容多了以后,想要重用,就会再拆分一个公共层出来,变成3层架构,这个过程有点类似代码重构,就是在实践中不断的进行抽象、总结。 数仓的建模或者分层,其实都是为了更好的去组…
开源 | HMGNN:异构小图神经网络及其在拉新裂变风控场景的应用
爱奇艺风控团队负责公司全业务风险防控,面向业务提供通用与定制相结合的一站式解决方案,为业务赋能,加强业务核心竞争力。风控中台提供涵盖账户安全、会员安全、内容生态保护、拉新裂变反作弊、营销活动、金融支付等各个互联网风险场景的专属解决方案,已接入 30 + 业务线,300 + 业务…
前端搞报表|数据分析提效全链路解决方案
闲鱼 2014 年成立,到现在的话已经实现了从 0 ~ 千万级 DAU 的跃迁,随着业务的快速发展,业务决策方法紧跟升级。从最原始的经验驱动到更加科学合理的数据驱动。而要做到数据驱动,需要去做大量的数据分析以及大量的数据报表开发。在整个数据分析链路上,存在一些研发痛点: 完成一…
目录:我的大数据学习笔记
可以通过长按二维码关注我的公众号,不过会先在掘金更新后同步过去。 PC端的这个右侧的目录找东西确实好找点,我每次写也非常注意看这块排版工不工整🤣,用这里去直接跳到对应的内容真的还算方便,所以就想着做个目录,以后如果写了新的,也会在这篇写上标题。 按照不同技术框架的划分形式。已…
超级好用的 Java 数据可视化库:Tablesaw
Tablesaw是一款 Java 的数据可视化库。它主要包括两部分:一部分是数据解析库,另一部分是数据可视化库。数据解析库主要是加载数据,对数据进行操作(转化,过滤,汇总等)。数据可视化库就是将目标数据转化为可视化的图表。 aggregate:maven 的项目父级项目,主要定…
北大开源中文分词器被打脸现场...
有做过搜索的朋友知道,分词的好坏直接影响我们最终的搜索结果。在分词的领域,英文分词要简单很多,因为英文语句中都是通过一个个空格来划分的,而我们的中文博大精深,同样的词在不同的语境中所代表的含义千差万别,有时候必须联系上下文才能知道它准确的表达意思,因此中文分词一直是分词领域的一…