CDALevel数据分析认证考试模拟题库(第十五期)
嗨喽,各位同学又到了公布CDA数据分析师认证考试Level Ⅲ的模拟试题时间了,今天给大家带来的是模拟试题(一)中的76-80题。(多选题)
不过,在出题前,要公布上一期Level Ⅲ 中71-75题的答案,大家一起来看!
71、AC
72、ABCD
73、ABD
74、ABD
75、ABCD
76、文本表示方法通过某种形式将文本字符串表示成计算机所能处理的数值向量。下面关于文本表示说法正确的是:
A.常用的文字表达方式有:离散时表示和分散式表示
B.TF-IDF模型是分布式表示方式
C.GLOVE模型得到的词向量不能解决多义词的问题
D.ELMO模型训练的词向量可以解决多义词的问题
77、N-Gram模型是一种语言模型(Language Model,LM),语言模型是一个基于概率的判别模型,它的输入是一句话(单词的顺序序列),输出是这句话的概率,即这些单词的联合概率(joint probability)。关于N-Gram的说法正确的是?
A.N-Gram的优点是不需要进行中文分词
B.当N够大时,所有正确的分词均会出现于N-Gram中
C.噪声少,可以与许多资源结合。
D.N-Gram的缺点是大多数词没有语法及其语义上意义
78.文本是由特定的人进行编撰的,文本的语义结构不可避免地会反映出什么?
A.人的特定立场
B.人的特定观点
C.人的特定价值
D.人的特定利益
79.机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。对于数据降维的描述正确的是
A.降维会让模型表现更差
B.降低维度肯定会损失一些信息
C.降维能提高训练速度
D.降维能用于数据可视化
80、特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,以下哪些方法是特征选择中的常用方法?
A.嵌入式方法
B.融合法
C.包裹式
D.过滤法
认真答题哦,我们将在下一期公布正确答案,敬请期待。
报名方式
登录CDA认证考试官网注册报名报名费用
Level Ⅰ:1200 RMB
Level Ⅱ:1700 RMB
Level Ⅲ:2000 RMB考试时间
Level Ⅰ:随报随考。
Level Ⅱ:随报随考。
Level Ⅲ:一年四届(3、6、9、12月的最后一个周六),每届考前一个月截止该届报名。考试地点
Level Ⅰ+Ⅱ:中国内地30+省市,70+城市,250+考场。考生可选择就近考场预约考试。
Level Ⅲ:中国内地30所城市,北京/上海/天津/重庆/成都/深圳/广州/济南/南京/杭州/苏州/福州/太原/武汉/长沙/西安/贵阳/郑州/南宁/昆明/乌鲁木齐/沈阳/哈尔滨/合肥/石家庄/呼和浩特/南昌/长春/大连/兰州。