第五章 数据处理和可视化表达 练习 1、从互联网产生大数据的角度来看,大数据具有的特征是( ) A。“4V”特征:大量、多样、低价值密度、高速 B。样本渐趋于总体,精确让位于模糊,相关性重于因果 C。分布式存储,分布式并行计算 D、没有特征 2、海军军官通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点,这体现了大数据分析理念中的( ) A。在数据基础上倾向于全体数据,而不是抽样数据 B。在分析方法上,更注重相关分析,而不是因果分析 C。在分析效果上,更追究效率,而不是绝对精确 D。在数据规模上强调相对数据,而不是绝对数据 3、网络数据采集法主要通过网络爬虫或网站公开API的方式获取网络爬虫,从网页的( )开始获取? A。HTML B。WWW C。URL D。XML 4、下列可以用于分析数据趋势的是( ) A。饼图 B。折线图 C。动态热力图 D。词云图 5、数据分析的方法不包括( ) A。线性分析 B。关联分析 C。聚类分析 D。数据分类 6、下列关于大数据的特征,说法正确的是( ) A。数据价值密度高 B。数据类型少 C。
数据基本无变化 D。数据体量巨大 7、数据特征探索的主要任务是对数据进行预处理,以下不属于该过程的是( ) A。数据清洗 B。异常数据处理 C。数据缺失处理 D。数据分类处理 8、大数据时代已经在悄悄地改变我们的日常生活,也是人们日常生活更为便捷,如移动支付、网络约车出行、网络购物、网络预约挂号等,以下不属于大数据分析的是( ) A。特征探索 B。关联分析 C。聚类与分类 D。建模分析 9、电子警察采用拍照的方式来约束车辆的行为,其拍照的过程属于( ) A。数据分析 B。数据采集 C。数据分类D。数据可视化表达 10、某超市曾经研究销售数据数据新闻可视化试题,发现买商品a的人购买商品b的概率很大数据新闻可视化试题,这种属于数据的( ) A。聚类分析 B。关联分析 C。分类分析 D。回归分析 11、数据采集的基本方法包括( )、网络数据采集法和其他数据采集法 A。数据库采集法 B。访问记录采集法 C。数据目录采集法 D。系统日志采集 12、下列关于聚类分析的说法,错误的是( ) A。可以从数据点集合中随机选择k个点作为初始的聚集中心 B。对其他的每个数据点,以此判断其与K个中心点的距离,距离最近的表明它属于这项聚力聚类 C。
聚类分析,必须先设定分类的标准,否则无法准确分类 D。重新计算新的聚簇集合的平均值既中心点 13、K-平均算法属于( )分析方法 A。聚类 B。关联 C。分类 D。回归 14、
来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!
版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。