阿里云大数据acp易错题(一)

54 阅读2分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。 1.频繁二项集

老是在很多数据集里面一起出现的东西,比如说是啤酒和纸尿裤

  • 为了进行购物篮分析,一家超市对某天深夜来店消费的6位顾客的消费数据进行了统计,下面每个集合都包含了一位顾客购买的物品:{方便面,矿泉水,火腿肠};{方便面,可乐};{方便面,矿泉水,火腿肠};{矿泉水;火腿肠;薯片};{方便面;可乐;火腿肠};{方便面;可乐;薯片}。在上述6个购物篮中支持度大于或等于50%的频繁二项集共有____A____个。

A. 3 B. 1 C. 2 D. 4

2.Image.png

Image.png 4. Image.png 5. Image.png

  • 7.单选 9.数据工场DataWorks中工作流任务支持一次性调度和周期调度两种类型,对于周期性调度可以设置不同时间粒度的调度周期,最小的调度周期为( A)。

A. 5分钟

B. 1分钟

C. 10分钟

D. 30分钟

  • 8.10.数据工场DataWorks中数据同步任务可支持不同时间粒度的周期性的数据同步,目前不支持周期粒度为( C)的同步。

A. 小时

B. 天

C. 实时

D. 月

  • 9.15.DataX是阿里集团发起的开源项目,是一种离线数据同步的工具,支持多种异构数据源之间的高效数据同步。DataX任务配置文件使用(B )文件格式。

A. java

B. json

C. bson

D. xml

  • 10.16.在数据工场DataWorks中,当从云数据库RDS(MySQL)抽取数据时,可对大表配置切分键进行数据分片,提高数据同步效率。以下关于切分键说法正确的是( A)。

A. 使用表的整数类型主键作为切分键效果明显

B. 配置切分键对数据同步的性能影响不大

C. 配置切分键容易出现数据热点

D. 切分键同时可以配置多个

D. 仪表盘