阿里云大数据acp学习(八)

86 阅读2分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

103Q.这是啥 regexp.substr

            B regexp extract

                C substr 和 inst

regexp--->正则表达式

extract--->从日期、时间返回单独的部分,比如年、月、日、小时、分钟等等。

SELECT EXTRACT(YEAR FROM OrderDate) AS OrderYear,

EXTRACT(MONTH FROM OrderDate) AS OrderMonth,

EXTRACT(DAY FROM OrderDate) AS OrderDay

FROM Orders

WHERE OrderId=1

INSTR(C1,C2,I,J)----> 在一个字符串中搜索指定的字符,返回发现指定的字符的位置;

C1    被搜索的字符串

C2    希望搜索的字符串

I     搜索的开始位置,默认为1

J     出现的位置,默认为1

SQL> select instr("abcde",'b');

结果是2,即在字符串“abcde”里面,字符串“b”出现在第2个位置。如果没有找到,则返回0;不可能返回负数

104.分区不能指定lifecycle只能在表的粒度进行

105.datastudio中不能上传table,但是jar、file、archive都可以上传

106.阿里云lifecycle的单位是天,不能设置浮点数

107.mapreduce作业提交目前只支持阻塞和非阻塞方式

108Q、这是怎么勾吧题目?

[多选题]513/613、些常见的机器学习算法(比如聚类算法 K-means 等) 中,会用到"距离"。已

知平面直角坐标系中两点的坐标分别为(2,1),(5,5) 以下关于两点间距离的说法中正确的有__。

A 两点的夹角余弦为 0.5

B 两点间的切比雪夫距离为 3

C 两点间的欧式距离为 5

D 两点间的曼哈顿距离为 7

切比雪夫--->二个点之间的距离定义是其各坐标数值差绝对值的最大值。

欧氏距离--》简单的距离

曼哈顿距离---》出租车几何或曼哈顿距离(Manhattan Distance)是由十九世纪的赫尔曼·闵可夫斯基所创词汇 ,是种使用在几何度量空间的几何学用语,用以标明两个点在标准坐标系上的绝对轴距总和。相当于走了一个方形街区的距离