首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
黄小虎
掘友等级
数据开发工程师
make long short~
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
9
文章 9
沸点 0
赞
9
返回
|
搜索文章
赞
文章( 9 )
沸点( 0 )
图数据库学习
0x00. 前言 图的定义:图是由一组顶点和一组能够将两个顶点相连的边组成的:无向图、有向图、加权图、加权有向图。对于有向图而言,我们分别定义入度和出度,顶点的入度表示有多少条边指向这个节点,顶点的出度表示有多少条边以这个节点为起点指向其他节点。 资源描述框架RDF(Resou…
mapreduce源码分析
是一个分布式计算框架,支持少量代码实现海量数据并发处理程序。多个服务器同时进行计算,极大的提高了计算效率。 MapReduce无法在毫秒或者秒级时间内返回结果。 后一个应用程序的输入为前一个的输出,MapReduce的输入输出都会写入到磁盘,会造成大量的磁盘IO,会导致性能底下…
Mapreduce 详解之如何写mr
Mapreduce是一个分布式计算框架,支持少量代码实现海量数据并发处理程序。多个服务器同时进行计算,极大的提高了计算效率。 readFields方法反序列化了输入数据。(reduce读取时进行反序列化,从字节数组转换为int类型 继承 org.apache.hadoop.ma…
批量图数据bulkload实践
大量数据导入hugegraph库时,官方导入工具loader实际使用效率低,不适合亿级数据的导入。且loader通过原生接口进行数据导入,影响生产集群的稳定性,同时数据的持续写入会因为 flush,compaction 等机制占用较多的系统资源。 因此考虑使用bulkload直…
火焰图分析性能瓶颈java
1. 火焰图: 火焰图用于分析热点代码占用大量cpu,从而导致服务性能下降的情况。如下图,自底向上为调用关系。上层宽度越宽标示当前函数cpu耗时越久,我们关注最宽的函数调用。 2. 两款常用火焰图生成工具 这款工具开箱即用,本人在生产环境中也经常使用。 -d表示采样时间(s),…
基于图数据库huge的数据迁移实践
hugegraph经过一次大的版本升级(v0.9-0.11),其底层存储结构发生变化,新旧版本存储不兼容,社区提供了数据导出组件tools,将数据从hbase中导出为原始数据,在导入到新版图中。但并不适用于大数据量业务,主要考虑有以下两点: tools为单机,实测导入速度并不足…
使用spark 进行图数据按类型/全量导出实践
一、 背景 业务方需要经常按label类型导出数据进行分析,此前一直是将全部数据(千亿点边)导出再进行label的,效率很低。选择使用spark(scala+java)来进行数据的批量导出。 二、核心
浅谈业内常见图数据库以及适用的业务场景
前言目前市面上存在多款开源图数据库,以及各家厂商也进行了自研图数据库(大多闭源),以符合自己的定制化要求,如何选择呢?hugegraph,janusgraph,nebula,bytegraph,腾讯图
huge-hbase 0.9.2.8写数据源码分析/huge-Hbase 0.11新版变化
#####1. 插入点数据 2. 写处理通用数据整形 1. 插入Hbase 点表 2. column 最后一位。进行操作 与 byte. 3. 插入hbase 边表 1. rowkey \x841:tom\x8C\x10\x01\x00\x00\x841:jin 4. 索引表(…
个人成就
文章被点赞
27
文章被阅读
11,091
掘力值
354
关注了
12
关注者
5
收藏集
0
关注标签
4
加入于
2020-07-13