基本信息
文件名称:数据采集与处理 课件 任务3 认知数据筛选.pptx
文件大小:630.02 KB
总页数:7 页
更新时间:2025-04-04
总字数:约小于1千字
文档摘要

项目三数据预处理认知

任务3认知数据筛选

一、数据筛选概述数据筛选:也叫数据挖掘、数据加工,是一种把海量数据进行多维度的探索和挖掘,以达到选出有用的信息的过程。特点:具有全面性、客观性、高效性,是信息决策技术中的一类应用工具。其主要目的是从海量的数据中提取重要的信息,一般采用统计学和人工智能相结合的模式,经过数据筛选处理,生成有用的信息、数据。

二、常用数据筛选工具在Excel中,我们可以使用筛选功能、高级筛选、数据透视表来筛选数据。筛选功能可以帮助我们更加精确的筛选数据,提高数据分析的准确性。数据透视表可以帮助我们更加准确的了解数据的分布情况和趋势,从而更好的进行数据分析与决策。(一)excel软件

二、常用数据筛选工具SQL是一种常用的数据库查询语言,它可以帮助我们从数据库中筛选出需要的数据。首先需要连接到数据库,然后使用SELECT语句进行查询。SELECT语句可以根据条件筛选数据,比如按照某一列的数值大小、文本内容、日期等进行筛选。SQL查询可以帮助我们从大量的数据中快速地找到需要的信息,提高数据分析的效率。(二)SQL查询

二、常用数据筛选工具Python是一种常用的编程语言,它可以帮助我们对数据进行筛选和分析。首先需要导入需要的库,比如pandas库,然后读取数据文件。在Python中,我们可以使用条件语句和逻辑运算符进行数据筛选,比如按照某一列的数值大小、文本内容、日期等进行筛选。Python筛选可以帮助我们更加灵活地对数据进行处理,提高数据分析的灵活性和准确性。(三)Python软件筛选

三、数据筛选实例打开时间筛选表的素材文件,将在2026年1月1日之前的日期字体设置为紫色,加粗,添加删除线,背景填充为黄色。将在2026年1月1日之后的日期字体设置为黄色,加粗,背景填充为红色。