阿里云大数据acp学习(六)

94 阅读2分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

67Q、ADS explain、创建普通表的updatetype/Batch

表的读取顺序,数据读取操作的类型,哪些索引可以使用,哪些索引实际使用了,表之间的引用,每张表有多少行被优化器查询等信息。

68.worker轮询odps的实例执行状态

69Q.ADS特有multivalue类型、ecu是什么

70.explain成功执行之后,第一行为逻辑计划,第二行为物理计划

71Q、bigint、double、rlike是怎么开始匹配的?

72Q、分区表未指定分区列怎么办?

73.为了不join打平表是一种错误的选择

74.dateide里面的表隐藏了,owner和项目管理都可以控制

75Q.修改表字段到底用什么语句?

76Q、group by中使用substr

77Q、大数据计算服务(MaxCompute,原 ODPS )的 MapReduce 的输入可以为空,也可以为视图

78.资源(Resource)是大数据计算服务(MaxCompute 原 ODPS)有特有的概念。如果想使用自定义函数(UDF)或 MapReduce 功能需要依赖资源来完成

79Q.使用大数据计算服务(MaxCompute,原 ODPS )的 Tunnel SDK 上传下载数据时,任务会被提交至 Tunnel 服务器(tunnel endpoint),由其进行响应和处理。

80.原表删除了,视图不删除h

81Q、 MaxCompute 中 , 通 常 使 用 SQL DMLUPDAT是啥

DML是Data Manipulation Language的缩写

82.odps的运算结果可以输出到多张表中去!同一列不能同时为分区列和普通列,而且分区字段必须建表的时候就制定!

83.任务如果只是时间上的相干性,那么不需要做任务的上下游

84.取空表的数值做overwrite不会对被插入的表产生影响

85Q.用户自定义函数的分类

标量函数(返回一个值)、内嵌表值函数(返回表)和多语句表值函数(返回表)

用户自定义标量值函数(User Defined Scalar Function)通常也称之为UDF。其输入与输出是一对一的关系,即读入一行数据,写出一条输出值。

自定义表值函数,是用来解决一次函数调用输出多行数据场景的,也是唯一能返回多个字段的自定义函数

自定义聚合函数,其输入与输出是多对一的关系, 即将多条输入记录聚合成一条输出值。可以与 SQL中的Group By语句联用。具体语法请参考 聚合函数 。