首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
黄小虎
掘友等级
数据开发工程师
make long short~
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
9
文章 9
沸点 0
赞
9
返回
|
搜索文章
赞
文章( 9 )
沸点( 0 )
图数据库学习
0x00. 前言 图的定义:图是由一组顶点和一组能够将两个顶点相连的边组成的:无向图、有向图、加权图、加权有向图。对于有向图而言,我们分别定义入度和出度,顶点的入度表示有多少条边指向这个节点,顶点的出度表示有多少条边以这个节点为起点指向其他节点。 资源描述框架RDF(Resou…
mapreduce源码分析
是一个分布式计算框架,支持少量代码实现海量数据并发处理程序。多个服务器同时进行计算,极大的提高了计算效率。 MapReduce无法在毫秒或者秒级时间内返回结果。 后一个应用程序的输入为前一个的输出,MapReduce的输入输出都会写入到磁盘,会造成大量的磁盘IO,会导致性能底下…
Mapreduce 详解之如何写mr
Mapreduce是一个分布式计算框架,支持少量代码实现海量数据并发处理程序。多个服务器同时进行计算,极大的提高了计算效率。 readFields方法反序列化了输入数据。(reduce读取时进行反序列化,从字节数组转换为int类型 继承 org.apache.hadoop.ma…
批量图数据bulkload实践
大量数据导入hugegraph库时,官方导入工具loader实际使用效率低,不适合亿级数据的导入。且loader通过原生接口进行数据导入,影响生产集群的稳定性,同时数据的持续写入会因为 flush,compaction 等机制占用较多的系统资源。 因此考虑使用bulkload直…
火焰图分析性能瓶颈java
1. 火焰图: 火焰图用于分析热点代码占用大量cpu,从而导致服务性能下降的情况。如下图,自底向上为调用关系。上层宽度越宽标示当前函数cpu耗时越久,我们关注最宽的函数调用。 2. 两款常用火焰图生成工具 这款工具开箱即用,本人在生产环境中也经常使用。 -d表示采样时间(s),…
基于图数据库huge的数据迁移实践
hugegraph经过一次大的版本升级(v0.9-0.11),其底层存储结构发生变化,新旧版本存储不兼容,社区提供了数据导出组件tools,将数据从hbase中导出为原始数据,在导入到新版图中。但并不适用于大数据量业务,主要考虑有以下两点: tools为单机,实测导入速度并不足…
使用spark 进行图数据按类型/全量导出实践
一、 背景 业务方需要经常按label类型导出数据进行分析,此前一直是将全部数据(千亿点边)导出再进行label的,效率很低。选择使用spark(scala+java)来进行数据的批量导出。 二、核心
浅谈业内常见图数据库以及适用的业务场景
前言目前市面上存在多款开源图数据库,以及各家厂商也进行了自研图数据库(大多闭源),以符合自己的定制化要求,如何选择呢?hugegraph,janusgraph,nebula,bytegraph,腾讯图
huge-hbase 0.9.2.8写数据源码分析/huge-Hbase 0.11新版变化
#####1. 插入点数据 2. 写处理通用数据整形 1. 插入Hbase 点表 2. column 最后一位。进行操作 与 byte. 3. 插入hbase 边表 1. rowkey \x841:tom\x8C\x10\x01\x00\x00\x841:jin 4. 索引表(…
个人成就
文章被点赞
27
文章被阅读
11,916
掘力值
355
关注了
12
关注者
5
收藏集
0
关注标签
4
加入于
2020-07-13