线性模型
- Statistics Premium包含广义线性混合模型 (GLMM),用于分层数据。
- 该软件具有通用线性模型 (GLM) 和混合模型程序。
- 它包含广义线性模型 (GENLIN),包括广泛使用的统计模型,例如针对正态分布响应的线性回归、针对二元数据的逻辑模型,以及针对计数数据的对数线性模型。GENLIN 还通过其非常通用的模型公式提供众多实用的统计模型。
- 广义估计方程 (GEE) 程序扩展了广义线性模型的能力,使它们能使用关联的纵向数据和聚类数据。
非线性模型
- 多项式逻辑回归 (MLR) 可预测具有两个以上类别的分类结果。
- 二元逻辑回归可将数据分为两个组。
- 非线性回归 (NLR) 和受限非线性回归 (CNLR) 可估算非线性模型的参数。
- 概率分析使用响应比例的分对数(Logit)转换或概率单位变换来计算模拟值。
模拟功能
- 蒙特卡罗模拟方法可以帮助您在现有数据不充分的情况下,根据现有的数据和/或已知的参数创建模拟数据集。
- 可对非数值型变量(如“男”和“女”)进行模拟,无需将其记录为数值变量。
- 现有的预测模型和数据可用作模拟的起点,包括从Automatic Linear Modeling (ALM)和IBM SPSS Modeler导出的模型。
- 生成输入数据时,会自动确定并使用分类输入之间的关联。
- 使用一组不同的随机值,反复计算结果,生成可能结果值的分布,使用户能够选择最优值。
- SPSS Statistics可被用于分析模拟结果,以直观的形式呈现结果以及为决策者推荐的行动。
Geospatial Analytics
- Statistics Premium中的地理空间分析技术可帮助揭示地理空间数据中隐藏的关系和趋势。
- 空间-时间预测 (STP) 技术可使线性模型适应2D和3D空间内位置随时间推移进行的度量,支持用户预测这些领域的长期变化趋势。
- 使用广义空间关联规则 (GSAR) 发现空间和非空间属性之间的关联,此规则使用历史数据(例如,事件发生位置、事件类型和事件发生时间)来描述发生的事件,例如犯罪或疾病爆发。
定制表
- 包含推论性统计信息时,针对人口统计组、客户群、时间段或其他分类变量比较平均值或比例。
- 该软件可创建汇总统计信息(从针对分类变量的简单计数到离差测定),并按照使用的任何汇总统计信息对类别进行排序。
- 它包括三种主要的测试:独立性卡方测试、列平均值比较(t 测试)和列比例比较(z 测试)。
- 交互式的表构建器提供拖放功能来创建数据透视表。
- 它排除了特定类别,能显示缺少值的单元格,并将小计添加到表中。
- 表可实时预览并在创建时进行修改。表可导出至Microsoft Word、Excel、PowerPoint或HTML,以便在报表中使用。
数据准备
- Statistics Premium可识别可疑或无效的案例、变量和数据值。
- 该软件允许您查看缺失数据的模式并汇总变量分布。
- Optimal Binning为那些为名义属性设计的算法找到最佳可能结果。
- 自动数据准备 (Automated Data Preparation,ADP) 工具通过一个高效的步骤即可检测和纠正质量错误,找到缺少值的原因。
- 建议和可视化帮助您确定要使用的数据。
数据有效性和缺失值检查
- Statistics Premium可使用六种诊断报表从多个角度检查数据,然后估算汇总统计信息并确定缺少值的原因。
- 该软件可快速诊断因缺少数据而带来的严重问题。
- 它使您能够用估算值替换缺失的值。
- 它显示每种缺失值的类型以及每个个例的所有极值的快照。
- 通过将缺失值替换为估算值以包含所有组(甚至包括响应力较低的组)来消除隐含的偏差。
分类数据和数字数据
- 该软件可通过感知图、双重图和三重图来发现底层的关系。
- 它使用类似于传统回归、主成份组件和典范相关的程序来预测结果并显示关系 - 帮助您处理并理解名义数据(例如,薪资)和顺序数据(例如,教育程度)。
- Statistics Premium使您能够以可视化方式解释数据集,并在大型的分数、计数、等级、排名或相似性表中了解行与列之间的关系。
- 该软件可处理数字数据中的非标准残留数据或者预测变量(例如,客户或产品属性)与结果变量(例如,购买/不购买)之间的非线性关系。
- 提供了多种适用于数字数据和归类数据的方法,包括Ridge Regression、Lasso、Elastic Net、变量选择和模型选择。
决策树
- Statistics Premium以可视化方式确定模型的流动方式,因此您可发现特定的子组和关系。
- 该软件直接在IBM SPSS Statistics中创建分类树,因此,您可以使用结果直接在数据内对案例进行分段和分组。
- 它包括四种确立的树形增长算法:
- CHAID - 快速、统计型的多向树算法,用于快速有效地探索数据,并针对所期望的结果构建分段和概要信息。
- 穷举式 CHAID - CHAID 的一种变体,用于检查每个预测项所有可能的分支。
- 分类和回归树 (C&RT) - 完整的二叉树算法,可对数据进行分区,并生成准确的同构子集。
- QUEST - 一种统计算法,可快速有效地选择不包含偏差的变量,并构建准确的二叉树。
- 选择或分类/预测规则使用IBM SPSS Statistics语法、SQL语句或简单文本(通过语法)生成。
预测
- Statistics Premium确保组织决策者可以理解和使用您提供的信息。
- 它会自动确定最适合的ARIMA或指数平滑模型来分析您的历史数据。
- 时间因果关系建模 (TCM) 技术可帮助揭示大量时间序列中隐藏的因果关系,并确定每一个目标序列的最佳预测变量。
- 一次可对数以百计不同的时间序列进行建模,而不是每次只能对一个变量建模。
- 模型集中保存至一个文件,以便在数据发生变化时可更新预测,而无需重新设置参数或者重新估算模型。
- 可编写脚本以自动使用新数据来更新模型。
结构方程式建模
- Statistics Premium测试假设情况,并确认观测变量与潜变量之间的关系 - 获得比回归分析更深入的洞察。
- 它使您能够构建更能切实反映复杂关系的模型,因为无论是观测变量(例如,来自调查的非实验性数据)还是潜变量(例如,满意度和忠诚度),都可用于预测任何其他数值变量。
- 该软件的可视框架用于比较、确认并完善模型。
- 多变量分析包含并扩展了标准方法 - 包括回归、因子分析、相关分析以及方差分析。
- 该产品包含三种数据归因方法:回归、随机回归和贝叶斯算法 (Bayesian)。
引导程序
- Statistics Premium通过对原始样本的替换项进行重新采样,对某个估算项的采样分布进行估算。
- 它会估算填充参数(例如平均值、中值、比例、比值比、相关系数、回归系数等)的标准误差和置信度区间。
- 该软件使您可以创建数以千计的数据集备用版本,以便进行更准确的分析。
高级采样评估和测试
- Statistics Premium提供处理复杂样本设计(例如,分层、分群或多阶段采样)所需的专业规划工具和统计信息。
- 由于它将样本设计整合到了调查分析中,因此可帮助您获得更理想的结果。
- 用户可使用分析和预测算法(包括预测事件的时间),在复杂的样本设计中更准确地处理数字和分类结果。
- 向导简化了计划创建、数据分析和结果说明过程。
直销和产品决策制定工具
- Statistics Premium通过为相似或截然不同的客户或联系人创建集群,对这些人进行细分。
- 该软件利用一些共有特征对客户或联系人建档,以提高市场营销产品和活动的针对性。
- 它可设计倾向性分数,以确定购买可能性最高的人群。
- 测试包性能与控制包性能不相上下。
- 对营销活动的响应通过邮政编码来标识。
- 将营销活动响应数据与Salesforce.com集成,以跟踪商机线索和销售成果报告。
高端图表
- Statistics Premium拥有数十个内置的可视化模版,帮助您就分析结果进行沟通。
- 通过“拖放”方式创建图表,无需编程技能。
- 可以定制样式表和图形模板,以便在整个企业范围内设置新的图形标准,或与您的品牌匹配。
- 图形可部署在使用IBM SPSS Collaboration and Deployment Services、IBM SPSS Statistics和IBM SPSS Modeler的运营系统中。
- 该软件支持各种数据源,包括以定界符分隔的IBM SPSS Statistics数据文件以及常见的数据库源(例如,DB2、SQL Server、Oracle 和 Sybase)。
IBM SPSS Statistics 三大版本比较:
关键特性 | IBM SPSS Statistics Standard Edition | IBM SPSS Statistics Professional Edition | IBM SPSS Statistics Premium Edition |
---|---|---|---|
核心的分析及图形功能从始至终贯穿标准分析项目 | |||
能够与 R、Python 和其他环境无缝式集成,从而更轻松、更有效地扩展了统计功能及可编程性 | |||
高级统计程序(包括 GLM、GLMM、HLM、GENLIN 和 GEE)能够更准确地识别和分析复杂的关系 | |||
非线性回归(包括 MLR、二元逻辑回归、NLR、CNLR 和概率分析)能够改善预测的准确性 | |||
定制的表,可基于数字和分类数据进行分析和报告 | |||
缺失值分析(含寻找原因)能够解决“脏数据”问题,实现更全面的分析和更有效的决策制定 | |||
高级数据准备能够识别那些可能导致结果出现偏差的不规则数据及其他数据 | |||
决策树能够更好地识别组、发现各个组之间的关系,并预测未来事件。 | |||
预测能够快速方便地预测趋势并构建专家时间序列预测 | |||
结构化等式建模能够测试假设并确认观察到的变量和潜在的变量之间的关系 | |||
启动时的引导程序能够测试预测模型的稳定性及可靠性 | |||
高级的采样评估和测试程序 | |||
高端图表能够帮助分析和报表。 | |||
直销和产品决策制定程序能够识别最佳客户和吸引这些客户的产品属性 | |||
添加 Statistics Server 至该程序包能够显著地提升性能、改善生产力,并实现强大的自动化功能 |
发表评论