开源 SPL 强化 MongoDB 计算

168 阅读2分钟

“我报名参加金石计划1期挑战——瓜分10万奖池,这是我的第三篇文章,点击查看活动详情

前言:MongoDB是NoSQL数据库的典型代表,支持文档结构的存储方式数据存储和使用更为便捷,数据存取效率也很高,但计算能力较弱,实际使用中涉及MongoDB的计算尤其是复杂计算会很麻烦,这就需要具备强计算能力的数据处理引擎与其配合。

开源集算器SPL是一款专业结构化数据计算引擎,拥有丰富的计算类库和完备、不依赖数据库的计算能力。SPL提供了独立的过程计算语法,尤其擅长复杂计算,可以增强MongoDB的计算能力,完成分组汇总、关联计算、子查询等通通不在话下。

常规查询

MongoDB不容易搞定的连接JOIN运算,用SPL很容易搞定:

AB
1=mongo_open("mongodb://127.0.0.1:27017/raqdb")/连接MongDB
2=mongo_shell(A1,"c1.find()").fetch()/获取数据
3=mongo_shell(A1,"c2.find()").fetch()
4=A2.join(user1:user2,A3:user1:user2,output)/关联计算
5>A1.close()/关闭连接

\

单表多次参与运算,复用计算结果:

AB
1=mongo_open("mongodb://127.0.0.1:27017/raqdb")
2=mongo_shell(A1,“course.find(,{_id:0})”).fetch()/获取数据
3=A2.group(Sno).((avg   = ~.avg(Grade), ~.select(Grade>avg))).conj()/计算成绩大于平均值
4>A1.close()

\

IN计算:

AB
1=mongo_open("mongodb://localhost:27017/test")
2=mongo_shell(A1,"orders.find(,{_id:0})")/获取数据
3=mongo_shell(A1,"employee.find({STATE:'California'},{_id:0})").fetch()/过滤employee数据
4=A3.(EID).sort()/取出EID并排序
5=A2.select(A4.pos@b(SELLERID)).fetch()/二分法查找
6>A1.close()

\

外键对象化,外键指针不仅方便,效率也高:

AB
1=mongo_open("mongodb://localhost:27017/local")
2=mongo_shell(A1,"Progress.find({},   {_id:0})").fetch()/获取Progress数据
3=A2.groups(courseid;   count(userId):popularityCount)/按课程分组计数
4=mongo_shell(A1,"Course.find(,{title:1})").fetch()/获取Course数据
5=A3.switch(courseid,A4:_id)/外键连接
6=A5.new(popularityCount,courseid.title)/创建结果集
7=A1.close()

\

APPLY算法的简单实现:

AB
1=mongo_open("mongodb://127.0.0.1:27017/raqdb")
2=mongo_shell(A1,"users.find()").fetch()/获取users数据
3=mongo_shell(A1,"workouts.find()").fetch()/获取workouts数据
4=A2.conj(A3.select(A2.workouts.pos(_id)).derive(A2.name))/查询_id 值workouts 序列的记录
5>A1.close()