1 分析人员为决策者提供业务分析报告作为决策依据使用,不同场景下分析报告的软件载体也要有所区别,在会议上使用的业务分析报告载体是
A word B Excel C Power BI D PPT
解析:D 会议上应使用PPT作为分析载体
2 在数据分析人员撰写分析报告时避不开进行适度主观推测判断,但是推测判断也要有充分依据,以下适合用于业务推测依据的信息来源是
A 朋友提供 B 网站留言 C 新闻联播 D 社会舆论
解析:B 作为推测判断信息来源的渠道应权威,信息应准确无误
3 数据分析人员使用业务分析报告汇报分析成果,业务分析报告中的文字描述不应
A 对已有数据信息的重复描述 B 进行有合理依据的适当推测
C 根据数据表现,给出建议 D 对数据结论进行归纳总结性描述
解析:A 文字不应重复描述图表可直接的传递内容
4 数据分析人员使用业务分析报告汇报分析成果,下列属于业务分析报告作用的是
A 评估一段时期内业务的好坏情况 B 发现合作机会
C 检验业务的真实性 D 以上都是
解析:D 业务分析报告用于评估业务行为好坏情况、发现市场商业机会及合作机会、检验业务结果的真实性、发现问题及提出对问题的解决方案,所以ABC都正确,所以选D
5 某家电企业想要对第三季度的电视机、电饭锅、电风扇的销售额进行比较,可以使用下列哪个图表?
A 簇状柱形图 B 拆线图
C 达成率图 D 树状图
解析:A 不同对象间的比较应使用簇状柱形图
6 数据分析人员使用业务分析报告汇报分析成果,不同种类的分析报告着重点不同,以下不属于渠道合作报告的重点的是()
A 总结合作硕果 B多从内部找原因
C 适当提出加深合作的需求 D 展现前景,树立信心
解析:B 渠道合作报告应聚焦于合作情况,所以B是错误的
7 数据分析人员使用业务分析报告汇报分析成果,以下不属于业务分析报告调整完善阶段的是
A 确定主题 B 发现问题
C KPI指标分类分析 D 规划机构、提纲、主要内容
解析:A 主题应在设计阶段确定
8 数据分析人员使用业务分析报告汇报分析成果,对于业务分析报告的注意事项,以下不正确的是
A 条理清晰 B 论点明确
C 图、表、文字可以不相关 D 有论必有数,有数必好懂
解析:C 分析报告中应做到图表文字相结合
9 以下选项中能够划归于图形决策树中属序列类图表的是
A漏斗图 B桑吉图 C箱型图 D饼图
解析:A 漏斗图描述状态阶段的顺序递进关系,属于序列类图表
10 描述某电视厂商不同产品销售额与总销售额间的占比关系时使用了饼图,其中饼图的数据标签使用恰当的是
A 销售额百分比 B 销售额值 C 销量值 D 记录行数值
解析:A 饼图强调占比,应使用百分比形式展现
11、某电脑厂商有A、B、C三类品牌产品,描述ABC三类品牌产品的不同性能差异应使用
A 散点图 B 气泡图 C 雷达图 D 条形图
C 解析:雷达图突出对象间差异程度
12、用可视化图表展示波士顿矩阵中各类产品特征时应使用以下哪种基础图表
A 桑吉图 B 箱型图 C 散点图 D 柱形图
C 用散点图生成波士顿矩阵效果
13、在业务描述性分析中使用的可视化图表中可以快速确认数据的分布以及数据分中位数、四分位数的图表的是
气泡图 散点图 箱型图 折线图
C 解析:箱型图可以展现一组数据的统计分布情况
14、某服装企业想要显示从2010年至2020年的销量变化情况,下列哪种图表比较合适
气泡图 箱型图 散点图 折线图
解析:此题显示随时间而变化的趋势,使用折线图最合适
15、业务描述性分析中可视化图表可分为业务类图表及统计类图表两大类,关于统计类图表坐标轴特征描述正确的是
可以使用客户类别作为坐标轴 可以使用价格档位作为坐标轴 可以使用年份作为坐标轴 可以使用产品ID作为坐标轴
B 解析:统计类图表如直方图、箱型图、散点图等,体现数值的分布特征,不能使用业务维度坐标轴
16、业务图形决策树将业务描述性分析中使用的图表分为了四个不同类别,包含在业务图形决策树中的图表类别是
仪表类 描述类 预测类 统计类
解析:B是正确描述,四类图表分别是构成类、对比类、序列类及描述类
17、在业务描述性分析中针对不同分析对象可以使用不同业务模型进行分析,以下选项中不适合做客户行为分析的模型是
5W2H 漏斗模型 RFH 波士顿矩形
解析:波士顿矩阵适用于对商品结构的描述而不是客户行为分析
18、指标用来描述业务行为结果的好坏程度,但是对于指标值的观测应在一定条件下进行,以下选项中不属于观测指标值好坏程度的前提条件的是
相同时间内 相同条件下 相同维度下 相同观测者
解析:指标值可以由不同观测者观测
19、树状体系图用来描述指标间的逻辑构成关系,以下选项中不属于树状体系图中拆解上层指标依据的是
A 父子级构成关系 B 逻辑计算关系 C 数据连接关系 D 业务联系关系
解析:C 数据连接关系是数据表合并时使用的逻辑,与树状体系图无关
20、电商收入由黄金公式的三个指标构成,某电商企业急需解决现金流不足问题,不考虑融资的情况下,应针对黄金公式中哪个指标进行突破
A 流量 B 转化率 C 访问次数 D 访问量
解析:B 电商收入黄金公式:销售额=流量转化率客单价,流量需要投入大量成本,企业资金出现问题时,应优先解决黄金公式中另两项指标
21 卡方检验是用途非常广的一种假设检验方法,卡方检验中,将任意两行互换,卡方值( )
解析:卡方检验的结果与分类变量的顺序无关,将任意两行进行互换,卡方值不变。
22、在研究数据中,有一个变量“饮料类型”有4 个水平“果汁”、“碳酸饮料”、“能量饮料”和“其他”,由于该变量的少量数据缺失,
那么缺失值用哪种填充方式会比较好
解析:这是分类数据,只能用“众数”。
23. 在进行缺失值填补时,若数据呈明显的偏态分布,则可考虑采用下列哪种方法?( )
解析:中位数不受具体数据分布的影响
24. 教育水平作为定序型变量,若要描述其离散程度,可选用以下哪种方法( )
A 平均差 B方差 C 标准差 四分位差 另外三种都只能用于描述数值型数据。
25. 以下哪个函数用来返回当前的日期及时间
解析:NOW函数用来返回当前的日期及时间信息。
26. 以下哪个 SQL 函数可以完成对数字的四舍五入
A. FLOOR B. CEILING C. ROUND D. TRUNCATE
正确答案:C
2.以下聚合函数中,使⽤正确的是
A. COUNT() B. MIN() C.MAX() D. SUM()
正确答案:A
3.求两个判断条件的交集结果时使用的运算符是
A. 加号(+) B. 等号(=) C. 且(AND) D. 或(OR)
正确答案:C
4.子查询可以出现在以下哪个子句中
A. GROUP BY B. ORDER BY C. HAVINg D. LIMIT
正确答案:C
5.子查询使用的运算符ALL, 表示的意思是
A. 满足所有条件 B. 满足任意一个条件
C. 一个都不满足 D. 满足一个条件
正确答案:A
相关知识记录:
–漏斗图是一个简单的散点图,反映研究在一定样本量或精确性下单个研究的干预效应估计值。漏斗图最常见的是在横轴为各研究效应估计值,纵轴为研究样本量。
–卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。 检验两个变量之间有没有关系
1.统计图中的散点图主要用来( A )。
A.观察变量之间的相关关系 B.主要用来表示总体各部分所占的比例
C.主要用来表示次数分布 D.主要用来反映分类数据的频数分布
2.抽样误差是指( D )
A.在调查过程中由于观察、测量等差错所引起的误差
B.人为原因所造成的误差
C.在调查中违反随机原则出现的系统误差
D.随机抽样而产生的代表性误差
3.检查异常值常用的统计图形:( B )
A、条形图 B、箱体图 C、帕累托图 D、线图
4.线性回归里的残差分析不可能用于诊断( D )
A、残差独立性 B、变量分布
C、异常值侦察 D、最大迭代次数
残差值说明: y=x+1 x=3 4 5时 残差分别为0.5 0 -0.5
效应编码是使用1、0和-1来编码,来反映某个变量的不同属性
拿成绩的优良中差为例,用效应编码优可以表示为:[1,0,0,0],良可以表示为:[0,1,0,0],中可以表示为:[0,0,1,0],差可以表示为:[-1,-1,-1,-1]。
6.因子分析的主要作用:( A )
A、对变量进行降维
B、对变量进行判别
C、对变量进行聚类
D、以上都不对
因子分析是指研究从变量群中提取共性因子的统计技术。
7.关于K-means 聚类过程正确的是:( A )
A、使用的是迭代的方法
B、均适用于对变量和个案的聚类
C、对变量进行聚类
D、以上都不对
8.东北人养了一只鸡和一头猪。一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。"鸡听了撒丫子就跑。猪说:"你跑什么?"鸡叫道:“有本事主人买粉条的时候你小子别跑!"
以上对话体现了数据分析方法中的( A )
A. 关联 B. 聚类 C. 分类 D. 自然语言处理
9.已知甲班学生“统计学”的平均成绩为86分,标准差是12.8分,乙班学生“统计学”的平均成绩是90分,标准差是10.3分,下列表述正确的是( A )
A. 乙班平均成绩的代表性高于甲班
B. 甲班平均成绩的代表性高于乙班
C. 甲、乙两班平均成绩的代表性相同
D. 甲、乙两班平均成绩的代表性无法比较
不同总体平均数代表性的大小,用标准差来衡量
10.根据样本资料估计得出人均消费支出Y对人均收入X的回归模型,表明人均收入每增加1%,人均消费支出将增加( B )
A. 0.2% B. 0.75% C. 2% D. 7.5%
- 取值范围在[0,1],反映回归曲线的拟合优度,当趋近于0,则回归曲线拟合优度( B )
A.越好 B. 越差 C. 适中 D. 以上都不对
14.分析购买不同产品的频次时,使用以下哪个任务? ( D )
A、列表数据 B、汇总表 C、汇总统计量 D、单因子频数
单因子频数任务将从您的数据中生成频数表。您也可使用该任务执行二项式和卡方检验。
15.当你用跑步时间(RunTime)、年龄(Age)、跑步时脉搏(Run_Pulse)以及最高脉搏(Maximum_Pulse)作为预测变量来对耗氧量(Oxygen_Consumption )进行回归时,年龄(Age)的参数估计是-2.78. 这意味着什么?( B )
A、年龄每增加一岁,耗氧量就增大2.78.
B、年龄每增加一岁,耗氧量就降低2.78.
C、年龄每增加2.78岁,耗氧量就翻倍。
D、年龄每减少2.78岁,耗氧量就翻倍。
ROC曲线一般指接受者操作特征曲线。 接受者操作特性曲线是指在特定刺激条件下,以被试在不同判断标准下所得的虚报概率P(y/N)为横坐标,以击中概率P(y/SN)为纵坐标,画得的各点的连线。
独立是指互不影响,互斥是指不能同时发生
事件A,B独立,则P(A ∩ B)=P(A)P(B); 而事件A,B互斥,则P(A∪B)=P(A)+P(B)
23.假设检验中显著性水平 阿尔法 是 ( B )
A.推断时犯取伪错误的概率 B.推断时犯取伪弃真的概率
C.正确推断的概率 D.推断时视情况而定
22.抽样推断中,可计算和控制的误差是 ( D )
A.登记误差 B.系统性误差(偏差)
C.抽样实际误差 D.抽样平均误差
25.当0.8<|r|<1时,两个相关变量 ( C )
A.低度相关 B.中度相关
C.高度相关 D.不相关
48.相关有以下几种(ABC)。
A.正相关 B.负相关 C.零相关 D.常相关
49.相关系数的取值可以是(ABC)。
A. 0 B.-1 C. 1 D. 2
RFM模型是衡量客户价值和客户创造利益能力的重要工具和手段。在众多的客户关系管理(CRM)的分析模式中,RFM模型是被广泛提到的。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱3项指标来描述该客户的价值状况。
最近一次消费 (Recency) 消费频率 (Frequency) 消费金额 (Monetary)
53.统计数据按来源分类,可以分为(BD)
A.类别数据 B.二手数据 C.序列数据 D.一手数据 E.数值数据