基本信息
文件名称:2025年数据科学与大数据技术专业考试题及答案.docx
文件大小:33.53 KB
总页数:17 页
更新时间:2025-09-27
总字数:约6.79千字
文档摘要

2025年数据科学与大数据技术专业考试题及答案

一、单项选择题(每题2分,共20分)

1.以下关于数据湖(DataLake)与数据仓库(DataWarehouse)的描述中,错误的是()。

A.数据湖存储原始数据(RawData),数据仓库存储经过清洗、结构化的数据

B.数据湖支持多类型数据(结构化、半结构化、非结构化),数据仓库以结构化数据为主

C.数据湖的典型应用场景是实时分析,数据仓库更适合历史报表

D.数据湖通常使用对象存储(如S3、HDFS),数据仓库多使用关系型数据库

2.在特征工程中,对“用户年龄”字段(取值范围1-120)进行分箱处理时,