欢迎参加为期四天的IBM SPSS统计分析与数据挖掘师资研修班!
谁适合来参加此次研修班?
> 从事数据分析相关工作,希望提升数据挖掘实战能力的企业数据分析人员。
> 从事咨询、科研等与数据挖掘应用领域相关工作的专业人士。
> 从事数据挖掘和统计分析等相关领域教学的高校教师。
> 有志于从事商业数据挖掘分析工作的学生。
> 有志于学习数据挖掘技术和软件的社会各界人士。
参加前要做哪些准备?
1> 参加者须自带笔记本电脑
2> 提前完成 IBM认知学堂(原大数据大学) www.bigdatauniversity.com.cn 以及大数据大学虚拟实验室 https://datascientistworkbench.cn 的注册。
3> 提前完成好大学在线www.cnmooc.org 的注册。
4> 通过 https://www.ibm.com/analytics/us/en/technology/spss/spss-trials.html 完成 SPSS Statistics 与 SPSS Modeler 30天免费试用版的下载与安装。
教育部高等学校软件工程专业教学指导委员会
教育部高等学校大学计算机课程教学指导委员会
上海交通大学慕课研究院
承办单位:云南大学
技术支持:IBM认知学堂(原大数据大学)、IBM大学合作部
主办单位:中国高校计算机教育MOOC联盟(上海培训中心)
报道时间:8月14日,14:00-21:00报到
嘉宾介绍
上海交通大学慕课推进办公室副主任,中国高校计算机教育MOOC联盟企业合作工作委员会主任。主持“好大学在线”慕课平台建设和运行,致力于探索基于慕课的混合式教学模式改革。
复旦大学计算机科学技术学院副教授,主要负责本科生和各类研究生电子商务、大数据核心技术和商务智能等课程的教学,2011年纽约大学访问学者。商务智能被评为上海市精品课程,获得2013年高等教育上海市教学成果奖二等奖。出版著作专著《智能化的流程管理》以及教材《商务智能(第四版)》和《商务智能 数据分析的管理视角(第三版)》等10多部。获得上海市2015年上海市科技进步二等奖。
IBM大中华区大学合作部教育合作项目总监,负责IBM与中国合作伙伴高校在数字化教育平台、大数据分析以及商学院高管教育培训等项目上的全方位合作,在高等教育合作领域有近15年的经验。
IBM中国开发中心(中国西部)总经理。自2007年起加入SPSS开发团队,历年成功交付占领市场的得力产品。自2016年起领导SPSS全球软件开发队伍,培养和建立了一支独特强有力的技术队伍,SPSS产品2016在同类产品的全球市场占有率为12%。王俊波先生拥有东北大学硕士以及德克萨斯大学阿灵顿商学院EMBA学位,目前兼任西安交通大学软件学院业务分析系执行系主任。
IBM中国开发实验室SPSS软件开发资深工程师。拥有十余年数据挖掘/建模的经验,主要负责数据建模、统计分析算法的开发和研究。领域包括零售商销售预测与定价优化、用户行为分析、用户体验分析等。西安交通大学大数据分析系外聘讲师。
会议议程
内容详解
第1天上午:数据挖掘概述。目前数据分析(机器学习、大数据分析等)绝大部分的书籍还基本停留在基本理论和方法的介绍,实验部分的内容比较简单或者缺失。有关实际项目中数据分析过程思路的分析以及难点解析基本没有,这对工程性人才的创新能力和动手培养非常不利。本次培训立足实际应用,突出实际数据分析项目中的思路,突出数据分析中的难点。
涉及到的主题:
> 数据分析过程以及关键问题
> 数据质量问题
> 选择合适的预处理方法
> 数据分析方法的选择
> 数据分析结果的评价
> 数据分析团队的组建
> 数据分析人才培养的难题
第1天下午:常用的数据分析算法简介。结合案例和实际操作,介绍SPSS Modeler支持的分类、聚类、关联、回归等几大类数据挖掘方法的典型算法,如下表:
涉及到的主题:
> 数据挖掘常用算法
> 数据挖掘算法选择方法
> 数据挖掘算法的效果评估
第2天上午: SPSS Statistics应用初步
涉及到的主题:
> 读取不同类型的数据,根据数据定义变量,编辑数据,应用compute功能进行数据计算
> 筛选数据,创建数据子集,合并文件;对数据进行转化;应用交叉表方法和中值方法总结变量间的关系
> 数据图表展示,输出管理器对输出内容进行控制,T检验和方差分析
第2天下午:SPSS Statistics 数据分析
涉及到的主题:
> 应用SPSS Statistics对数据进行线性回归分析、主成分分析,因子分析,对应分析
> SPSS Statistics可编程性介绍
> SPSS Statistics与Python/R集成
第3天上午:银行客户数据分析。以客户信用记录、消费历史记录数据为基础,分析决定用户信用等级的主要因素是什么?并给与解释。信用额度和信用评分有何关系?给出欺诈的判断模型。分析客户人口属性对银行信贷和信用评分有无影响。分析逾期还款的客户有什么特征?根据消费历史分析各类客户的特征。
涉及到的主题:
> 实际数据分析项目需求的把握
> 数据分析或挖掘的难点
> 多种数据挖掘算法的实际应用
> 实验操作
第3天下午:大众点评网的用户偏好分析。在大众点评网抓取多家火锅店的店名、位置、点评条数、人均消费额、口味评分(均分)、环境评分(均分)、服务评分(均分)、点评的均分、有无团购、有无送外卖 、有无订座等数据(还可以采集标签等数据),对火锅店进行分类、找出每类火锅店的特征,并分析点评均分与其他变量之间的关系。为新开设火锅店选址提供指导;为用户推荐火锅店。
涉及到的主题:
> 用户评论等网商数据的抓取
> 多种数据挖掘算法的实际应用
> 实验操作
第4天上午:商务酒店客户情感分析。通过抓取对典型电商客户的评论,分析客户对于某个商品多个维度的态度和情感倾向,以及客户注重商品属性所在,商品的卖点、不足以及同类商品竞争力对比。
涉及到的主题:
> 数据可视化
> 小组讨论:数据分析思路的设计
第4天下午:数据分析实战训练。对于给定的香水销售数据集,按照用户需要解决的问题,设计数据分析过程,并验证数据分析结果的合理性。
涉及到的主题:
> 预处理:删除有空值的记录,价格、评价等数据的离散化,使用场所字段分成多列等
> 评价数间接反映了销量,使用决策树分析影响销量的重要因素有哪些
> 香水的适用场所有什么关联
> 对香水进行聚类,分析每类香水的特点
> 分析香水价格与评论数的关系
> 请为香水销售商给出营销的建议
会务须知:
会务费:2600元/人
> 该费用含场地费、讲课费、资料费等,委托北京时代亮点科技有限公司收取费用并开具会务费发票。
> 参会人员交通与食宿费用自理。
> 由于假期交通紧张,飞机火车购票都需要实名制,请各位老师注意安排好会议往返交通。
> 推荐住宿地点:①云大宾馆(昆明市五华区一二一大街天君殿巷);②如家快捷酒(云南师大店,昆明市五华区一二一大街298号);③汉庭酒店(一二一大街店,昆明市五华区一二一大街298号)。假期酒店房源较紧张,建议提早预订。
会务联系人:
蒲斌,18469115494,937140839@qq.com
可填写下面表格信息直接在线报名,或者以Email形式发送回执至会务联系人邮箱。
报名成功以收到会务组回复的电子邮件为准,如未收到,请及时与会务联系人联系。
发表评论