数据挖掘第六章第二篇方法篇
1.了解数据挖掘的内涵、任务和基本流程2.理解机器学习的内涵和数据建模流程3.理解数据挖掘的算法4.了解数据挖掘工具及应用学习目标知识结构图
引导案例沃尔玛:通过改善搜索引擎提高15%的销售额创建于1962年的沃尔玛超市是全球最大的连锁超市,它在27个国家拥有超过一万个门店,员工总数220余万,每周接待2亿人次的顾客。这样一个雄踞全球零售业榜首的庞然大物,也有自己难以言明的烦恼。2015年年初,分析师预言阿里巴巴将很快取代沃尔玛,成为全球最大的零售企业。来自中国的威胁固然不可轻视,但美国亚马逊网站则让沃尔玛产生更大的危机感。电商网站能够给消费者提供价格低廉、种类丰富的产品,沃尔玛企业所创办的沃尔玛网站固然也有不错的收益,但随着线上零售占据越来越多的零售市场份额,沃尔玛在沃尔玛网站上投入了越来越多的精力。沃尔玛一直秉承“帮顾客省每一分钱”的宗旨,并在进货渠道、分销方式,以及营销费用、行政开支等各方面节省资金。物美价廉一直是沃尔玛的一大优势,但不幸的是,亚马逊平台在这一方面并不逊色于沃尔玛。因此,为了反超亚马逊平台,沃尔玛势必要在用户体验方面做出突破。零售业的用户体验法则大多都是关于货品摆放规则的,将牛奶和面包摆在一起,将口香糖摆到收银台附近等都是经典的货物摆放规则,合理的摆放方式能够替顾客节省搜寻货物的时间,提高顾客的用户体验。这种规则同样适用于电子商务网站,如果在顾客搜索产品时,能迅速将顾客想要的商品展示出来,用户体验想必会大大提高。沃尔玛希望通过改善搜索引擎提高15%的销售额,这意味着搜索引擎必须有质的飞跃才能达成这一高远的目标。沃尔玛采用的北极星搜索引擎主要模仿了Kosmix的语义搜索技术和语义分析技术,前者从用户在社交平台上发出的推特及和其他用户之间的互动行为中挖掘用户的购物倾向,后者则度量产品之间的相关度和相似度,包括产品、人物、事件之间的关联。以上两种技术使北极星搜索引擎能够为顾客提供更精准的产品链接,此外北极星在确定产品排名时还引入了顾客的搜索记录。这种解析关键词和挖掘同义词的搜索方法可以给顾客提供更合理的产品,从而提升用户体验。
第一节数据挖掘概述第二节机器学习基础第三节数据挖掘算法目录第四节数据挖掘工具
第一节数据挖掘概述第六章第二篇方法篇
一、数据挖掘的解读数据挖掘是伴随大数据时代崛起的一门新兴学科。数据挖掘和统计学有着共同的目标:发现数据中的结构。数据挖掘利用了如下领域的思想:来自统计学的抽样、估计和假设检验;(2)人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。IT行业内普遍接受的数据挖掘的定义是:数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中的、人们不知道的、但又是潜在有用的信息和知识的过程。
二、数据挖掘的任务数据挖掘的两个目标是预测和描述。前者指用一些变量或数据库的若干已知字段预测其他感兴趣的变量的未知值;后者指找到描述数据的可理解模式。根据发现知识的不同,我们可以将数据挖掘任务归纳为以下几类。(1)特征规则(2)区分规则(3)分类(4)关联性(5)聚类(6)预测(7)变化和偏差分析
三、数据挖掘的基本流程数据挖掘的基本流程大致分为三个阶段:第一,准备阶段首先数据中筛选需分析的数据;其次对数据进行处理,最后是数据交。第二,挖掘阶段数据挖掘之前必须提前制订规划,确定数据挖掘、数据分类等工作的主要方式,同时明确所使用的算法等。第三,数据分析阶段数据分析就是根据用户的需求,将所挖掘出的数据进行解析和表达,获取具有利用价值的数据。
(1)集群化管理人力资源(2)分析员工能力(3)人力资源合理配置(4)分析跳槽概率(5)应用于绩效考核(6)设计员工薪酬一是,实时性数据。二是,动态性数据。三是,整合性数据。四、人力资源数据挖掘内容与方法人力资源管理中后,其主要挖掘内容可以分为三类:人力资源数据挖掘技术应用方法:
第二节机器学习基础第六章第二篇方法篇
一、数据挖掘与机器学习机器学习,引用卡内基梅隆大学机器学习研究领域的著名教授TomMitchell的经典定义:如果一个程序在使用既有的经验E(Experience)来执行某类任务T(Task)的过程中被认为是“具备学习能力的”,那么它一定要展现出:利用现有的经验E,不断改善其完成既定任务T的性能(Performance)的特质。
二、数据建模1.什么是数据建模2.数据模型的分类3.数据模型的构建全流程(1)数据模型,就是在数据层面建立起来的一种逻辑关系的算法集合,该算法集合可以运算未来的同源数据,并产生可预期的结果。(2)数据建模是数据分析