Loading
0

SPSS统计分析与数据挖掘师资研修班(通知及在线报名)

qlik桌面版免费试用

欢迎参加为期四天的IBM SPSS统计分析与数据挖掘师资研修班

什么是SPSS?

       SPSS是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生于1968年研究开发成功,在调查统计行业,市场研究,医学统计,政府和企业的数据分析应用中久享盛名。2009年7月,由IBM公司全资收购。如今IBM SPSS已出至版本24.0,全球产品用户达28万家,遍布于通讯,医疗,银行,证券,保险,制造,商业,市场研究,科研教育等多个领域和行业,是目前世界上应用最广泛的专业数据预测统计分析软件。

谁适合来参加此次研修班?

> 从事数据分析相关工作,希望提升数据挖掘实战能力的企业数据分析人员。

> 从事咨询、科研等与数据挖掘应用领域相关工作的专业人士。

> 从事数据挖掘和统计分析等相关领域教学的高校教师。

> 有志于从事商业数据挖掘分析工作的学生。

> 有志于学习数据挖掘技术和软件的社会各界人士。

参加前要做哪些准备?

1> 参加者须自带笔记本电脑

2> 提前完成 IBM认知学堂(原大数据大学) www.bigdatauniversity.com.cn 以及大数据大学虚拟实验室 https://datascientistworkbench.cn 的注册。

3> 提前完成好大学在线www.cnmooc.org 的注册。

4> 通过 https://www.ibm.com/analytics/us/en/technology/spss/spss-trials.html 完成 SPSS Statistics 与 SPSS Modeler 30天免费试用版的下载与安装。

重要报名信息

指导单位:教育部高等学校计算机类专业教育指导委员会

教育部高等学校软件工程专业教学指导委员会

教育部高等学校大学计算机课程教学指导委员会

上海交通大学慕课研究院

承办单位:云南大学

技术支持:IBM认知学堂(原大数据大学)、IBM大学合作部

主办单位:中国高校计算机教育MOOC联盟(上海培训中心)

会议时间:2017年8月15日至18日

道时间:8月14日,14:00-21:00报到

会议地点:云南大学东陆校区云大宾馆三楼会议室

 

嘉宾介绍

蒋建伟

上海交通大学慕课推进办公室副主任,中国高校计算机教育MOOC联盟企业合作工作委员会主任。主持“好大学在线”慕课平台建设和运行,致力于探索基于慕课的混合式教学模式改革。

赵卫东

复旦大学计算机科学技术学院副教授,主要负责本科生和各类研究生电子商务、大数据核心技术和商务智能等课程的教学,2011年纽约大学访问学者。商务智能被评为上海市精品课程,获得2013年高等教育上海市教学成果奖二等奖。出版著作专著《智能化的流程管理》以及教材《商务智能(第四版)》和《商务智能 数据分析的管理视角(第三版)》等10多部。获得上海市2015年上海市科技进步二等奖。

周恩昌

IBM大中华区大学合作部教育合作项目总监,负责IBM与中国合作伙伴高校在数字化教育平台、大数据分析以及商学院高管教育培训等项目上的全方位合作,在高等教育合作领域有近15年的经验。

王俊波

IBM中国开发中心(中国西部)总经理。自2007年起加入SPSS开发团队,历年成功交付占领市场的得力产品。自2016年起领导SPSS全球软件开发队伍,培养和建立了一支独特强有力的技术队伍,SPSS产品2016在同类产品的全球市场占有率为12%。王俊波先生拥有东北大学硕士以及德克萨斯大学阿灵顿商学院EMBA学位,目前兼任西安交通大学软件学院业务分析系执行系主任。

陆续

IBM中国开发实验室SPSS软件开发资深工程师。拥有十余年数据挖掘/建模的经验,主要负责数据建模、统计分析算法的开发和研究。领域包括零售商销售预测与定价优化、用户行为分析、用户体验分析等。西安交通大学大数据分析系外聘讲师。

会议议程

spss线下培训

内容详解

第1天上午:数据挖掘概述。目前数据分析(机器学习、大数据分析等)绝大部分的书籍还基本停留在基本理论和方法的介绍,实验部分的内容比较简单或者缺失。有关实际项目中数据分析过程思路的分析以及难点解析基本没有,这对工程性人才的创新能力和动手培养非常不利。本次培训立足实际应用,突出实际数据分析项目中的思路,突出数据分析中的难点。

涉及到的主题:

数据分析过程以及关键问题

数据质量问题

选择合适的预处理方法

数据分析方法的选择

数据分析结果的评价

数据分析团队的组建

数据分析人才培养的难题

第1天下午:常用的数据分析算法简介。结合案例和实际操作,介绍SPSS Modeler支持的分类、聚类、关联、回归等几大类数据挖掘方法的典型算法,如下表:

涉及到的主题:

数据挖掘常用算法

数据挖掘算法选择方法

数据挖掘算法的效果评估

第2天上午: SPSS Statistics应用初步

涉及到的主题:

读取不同类型的数据,根据数据定义变量,编辑数据,应用compute功能进行数据计算

筛选数据,创建数据子集,合并文件;对数据进行转化;应用交叉表方法和中值方法总结变量间的关系

数据图表展示,输出管理器对输出内容进行控制,T检验和方差分析

第2天下午:SPSS Statistics 数据分析

涉及到的主题:

应用SPSS Statistics对数据进行线性回归分析、主成分分析,因子分析,对应分析

SPSS Statistics可编程性介绍

SPSS Statistics与Python/R集成

第3天上午:银行客户数据分析。以客户信用记录、消费历史记录数据为基础,分析决定用户信用等级的主要因素是什么?并给与解释。信用额度和信用评分有何关系?给出欺诈的判断模型。分析客户人口属性对银行信贷和信用评分有无影响。分析逾期还款的客户有什么特征?根据消费历史分析各类客户的特征。

涉及到的主题:

实际数据分析项目需求的把握

数据分析或挖掘的难点

多种数据挖掘算法的实际应用

实验操作

第3天下午:大众点评网的用户偏好分析。在大众点评网抓取多家火锅店的店名、位置、点评条数、人均消费额、口味评分(均分)、环境评分(均分)、服务评分(均分)、点评的均分、有无团购、有无送外卖 、有无订座等数据(还可以采集标签等数据),对火锅店进行分类、找出每类火锅店的特征,并分析点评均分与其他变量之间的关系。为新开设火锅店选址提供指导;为用户推荐火锅店。

涉及到的主题:

用户评论等网商数据的抓取

多种数据挖掘算法的实际应用

实验操作

第4天上午:商务酒店客户情感分析。通过抓取对典型电商客户的评论,分析客户对于某个商品多个维度的态度和情感倾向,以及客户注重商品属性所在,商品的卖点、不足以及同类商品竞争力对比。

涉及到的主题:

数据可视化

小组讨论:数据分析思路的设计

第4天下午:数据分析实战训练。对于给定的香水销售数据集,按照用户需要解决的问题,设计数据分析过程,并验证数据分析结果的合理性。

涉及到的主题:

预处理:删除有空值的记录,价格、评价等数据的离散化,使用场所字段分成多列等

评价数间接反映了销量,使用决策树分析影响销量的重要因素有哪些

香水的适用场所有什么关联

对香水进行聚类,分析每类香水的特点

分析香水价格与评论数的关系

请为香水销售商给出营销的建议

会务须知:

会务费:2600元/人

> 该费用含场地费、讲课费、资料费等,委托北京时代亮点科技有限公司收取费用并开具会务费发票。

> 参会人员交通与食宿费用自理。

> 由于假期交通紧张,飞机火车购票都需要实名制,请各位老师注意安排好会议往返交通。

> 推荐住宿地点:①云大宾馆(昆明市五华区一二一大街天君殿巷);②如家快捷酒(云南师大店,昆明市五华区一二一大街298号);③汉庭酒店(一二一大街店,昆明市五华区一二一大街298号)。假期酒店房源较紧张,建议提早预订。

会务联系人:

蒲斌,18469115494,937140839@qq.com

可填写下面表格信息直接在线报名,或者以Email形式发送回执至会务联系人邮箱。

报名成功以收到会务组回复的电子邮件为准,如未收到,请及时与会务联系人联系。