第六章数据可视化大数据概论及应用实践IntroductiontoBigDataandApplicationPractice
第6章数据可视化在大数据时代,种类繁多、数据复杂、类型多样的信息源产生大量的数据,庞大的数量已经大大超出了人类的处理能力,人类大脑已经无法从堆积如山的数据中快速发现核心问题,那么如何将大数据的出来信息更加直观的呈现出来,以帮助人们理解数据,同时找出包含在海量数据中的规律或信息就显得尤为重要了。要解决这个问题,就需要数据可视化,根据数据的特性,通过丰富的视觉效果,以直观、生动、易理解的方式呈现出来,给与人们深刻与意想不到的洞察力,可以有效提升数据分析的效率和效果。数据可视化是大数据分析的最后环节,也是非常关键的一环。本章首先介绍可视化的概念,然后分类介绍可视化工具,最后给出几个典型的可视化案例。
目录CONTENTS概述6.1数据可视化主要技术 6.2可视化工具6.3拓展实训6.4本章小结6.5习题6.6
概述PART01海量繁琐复杂的数据对人们来说是枯燥无趣的,相对而言,人们对图形、大小、颜色等有更加直观的感知。利用数据可视化平台,讲这些枯燥乏味的数据转变成丰富生动的视觉效果,不仅有助于简化人们的分析过程,还在很大程度上提高了分析数据的效率,发现数据中隐含的价值,从而实现简洁高效地传达信息。
6.1.1数据可视化的概念数据可视化是关于数据视觉表现形式的研究,是将大型数据集中的数据以图形、图像形式表示,利用计算机图形学和图像处理技术以及利用数据分析和开发工具,进行交互处理的理论、方法和技术,能够发现未知的信息。数据可视化的基本思想是使人们不再局限于通过关系数据表来观察和分析数据信息,而是将数据库中每一个数据项以单个图元素来表示,用大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,能够更加明了地从不同的维度发现数据之间潜在的联系,从而对数据进行更深入的观察和分析。虽然数据可视化在数据分析领域并非是最具技术挑战性的部分,但是在整个数据分析流程过程中最重要的一个环节。
6.1.2数据可视化的原则数据可视化是让数据的信息变得更有意义,更好地展示数据的价值,它可以优美地将大数据中的繁杂信息简化成既生动有趣又富有意义的可视化图形,让人们可以轻松地了解数据背景,得到所需信息。因此,数据可视化的原则通常有以下几点:1.理解数据源及数据数据源即为数据的来源,是复杂多样的。数据可视化关键的第一步是确保了解需要进行可视化的数据,它可以是各种数据类型,但是数据源必须可靠、实用、完整、真是切具备更新能力。在数据可视化工作之前,首先做好一些前期准备基础工作,比如对数据有全局的宏观理解,了解被采集的数据可以展现出什么样的价值,只有这样才能针对性地进行下一步工作,创造出既有价值又人性化的数据可视化展示。
6.1.2数据可视化的原则2.明确数据可视化的目的好的数据可视化不仅要在形式上美观,还要能够帮助人们去解读之前无法触及的内容,并使这些内容赋有意义和指导性。因此在进行数据可视化操作之前,除去了解数据源及数据之外,还必须要明确数据可视化的目的。要呈现的是什么样的展示结果,是针对一个活动的分析还是针对一个发展阶段的分析,是研究用户还是研究销量等。3.注重数据的比较从海量数据中想要了解数据所反映的问题,就必须要进行比较。数据比较是相对,不仅在于量的呈现,更能够直观的看到问题所在。一般同比或者环比使用得较多。4.建立数据指标在数据可视化的过程中,建立正确的数据指标才会有对比性,才知道对比的标准在哪里,也才能更好地知道问题所在。数据指标的设置要结合具体的业务背景,科学地进行处理,不是凭空设置。用户可根据现有的数据指标进行深层次的自我思考,而不是仅仅给用户呈现一个数据形式及结果。
6.1.2数据可视化的原则5.简单法则数据可视化的是将数据信息以一种生动有趣的简单直观的方式呈现给用户,而不是用户接受冗余的信息。其关键就在于采用用户第一的理念,专注简单的设计方法,将复杂或者零散的信息变的切实可行,易于理解。6.数据可视化的艺术性数据可视化的艺术性是指呈现出来的图形图像应当具有艺术性,符合审美规则以吸引读者的注意力。数据展示的形式从总体的局部,要有一个逻辑清晰的思路,才能有针对性的解决办法。在保证基础数据被展示的同时,还要增加图形的可读性和生动性。只有让数据表格或者数据图形呈现的方式更加多样化,才能更好的激发人们的兴趣,提升体验感,发挥更大的价值。
6.1.3可视化的发展历程在很早之前,人们就引入可视化技术辅助分析问题。早在1854年的时候,伦敦发生霍乱,10天的时间里