第十一章大数据应用大数据概论及应用实践IntroductiontoBigDataandApplicationPractice
随着信息技术飞速发展,互联网各种信息资源交错、信息数据泛滥,数据体量呈爆发性增长,每年所产生的数据体量是前一年的1.5倍。著名的国际咨询公司麦肯锡全球研究所早在2011年就发布了一份关于大数据是下一个创新生产力的报告,指出大数据已经渗入到了社会的各个行业领域,深刻推动了各行业的发展变革。第十一章大数据应用大数据的战略意义不是海量的数据,而是对数据信息进行加工处理,以探寻海量数据蕴含的内在规律。大数据被广泛应用于的各个领域,为用户提供辅助决策、发掘潜在价值。不同行业与大数据相结合的程度,与行业信息化水平、行业与消费者的距离、行业的数据拥有程度有着密切的关系。本章通过具体案例,介绍大数据在互联网、城市交通、现代物流、生物医学、金融、安防等领域的应用,并通过具体案例分析,深刻理解大数据在当今社会发展中的作用,并能够使用大数据思维分析和解决问题。
目录CONTENTS大数据在物流行业的应用11.3大数据在城市交通领域的应用11.2大数据在互联网领域的应用11.1大数据在生物医学领域的应用11.4大数据在金融领域的应用11.5大数据在安防领域的应用11.6本章小结11.7习题11.8
PART01随着互联网的飞速发展,人们逐渐从信息匮乏走入了信息过载的时代。为了让用户从海量信息中高效的获取所需信息,推荐系统应运而生。大数据在互联网领域的应用
11.1.1推荐系统概述推荐系统是自动联系用户和信息的工具,它通过研究用户的兴趣爱好,以进行个性化推荐。以Google和百度为代表的搜索引擎通过关键词搜索信息,用户在搜索信息时,需要提供能够准确描述其需求的关键词。与搜索引擎不同的是,推荐系统不需要用户提供明确的需求,而是通过分析用户的行为对用户的兴趣进行建模,从而主动为用户推荐符合其兴趣和需求的信息。随着推荐技术的不断发展,推荐引擎已经在电子商务网站(京东、淘宝)和一些社交娱乐平台(今日头条、豆瓣、抖音、优酷等)都取得很大的成功。
11.1.2推荐机制大部分推荐引擎的工作原理是基于物品或者用户的相似集进行推荐,推荐机制可以分为基于人口统计学的推荐、基于内容的推荐、基于系统过滤的推荐等。1.基于人口统计学的推荐基于人口统计学的推荐机制可根据用户的基本信息发现用户的相关程度,然后将相似用户喜爱的其他物品推荐给当前用户。2.基于内容的推荐基于内容的推荐是在推荐引擎出现之初应用最为广泛的推荐机制,它的核心思想是根据推荐物品或内容的元数据,发现物品或内容的相关性,然后基于用户以往的喜好记录,推荐给用户相似的物品。
11.1.2推荐机制3.基于协同过滤的推荐数据挖掘有一个关于尿布和啤酒的经典案例。尿布和啤酒看似毫不相关的两种商品,当超市将其放到相邻货架销售的时候,两者销量都会大大提高。很多时候看似不相关的商品,却存在某种隐含关系,获取这种关系将会对提高销售额起到推动作用,然而有时这种关系很难通过经验分析得到,需要借助数据挖掘算法——协同过滤算法来实现。基于协同过滤的推荐包括基于用户的协同过滤推荐、基于项目的协同过滤推荐等。(1)基于用户的协同过滤推荐(2)基于项目的协同过滤推荐
11.1.3推荐系统的应用推荐系统在电子商务、社交网络、在线音乐和在线视频等各类网站和应用中都具有重要意义。下面通过Amazon和豆瓣两个案例,简要分析推荐系统的具体应用。1.推荐系统在亚马逊电商平台的应用亚马逊作为推荐系统的鼻祖,已经将推荐的思想深刻融入到应用中亚马逊推荐的核心是,通过数据挖掘算法将用户与其他用户的消费偏好进行对比,来预测用户可能感兴趣的商品。亚马逊采用分区混合机制,将不同的推荐结果分为不同的区显示给用户。2.推荐系统在豆瓣社交平台中的应用豆瓣是国内知名社交平台,它以读书、电影、音乐和同城活动为核心,形成一个多元化的网络社交平台,下面介绍豆瓣的推荐原理。
PART02大数据在城市交通领域的应用 大数据技术推动城市综合交通系统规划设计与运行管理向智能化、精准化方向发展。现代城市每天产生海量庞杂、异质多元、时空关联的交通数据,蕴含着丰富的价值信息。
11.2.1智慧交通大数据概述 智慧交通是在智能交通发展基础上,引入物联网、云计算、大数据等新一代信息技术,实现交通信息的汇集,进行数据精准挖掘与剖析,提供实时交通数据信息参考。其涉及数据模型建立、数据挖掘等数据处理技术,关注交通数据的实时更新,以实现交通网络布局的合理规划。大数据技术在智慧交通建设中占据核心地位,是智慧交通创新发展的基石。智慧交通大数据包括四个层次,即数据层、功能层、平台层和服务层。
11.2.1智慧交通