线性模型
- SPSS Statistics Professional包含广义线性混合模型 (GLMM),用于分层数据。
- 该软件具有通用线性模型 (GLM) 和混合模型程序。
- 它包含广义线性模型 (GENLIN),包括广泛使用的统计模型,例如针对正态分布响应的线性回归、针对二元数据的逻辑模型,以及针对计数数据的对数线性模型。GENLIN 还通过其非常通用的模型公式提供众多实用的统计模型。
- 广义估计方程 (GEE) 程序扩展了广义线性模型的能力,使它们能使用关联的纵向数据和聚类数据。
非线性模型
- 多项式逻辑回归 (MLR) 可预测具有两个以上类别的分类结果。
- 二元逻辑回归可将数据分为两个组。
- 非线性回归 (NLR) 和受限非线性回归 (CNLR) 可估算非线性模型的参数。
- 概率分析使用响应比例的分对数(Logit)转换或概率单位变换来计算模拟值。
模拟功能
- 蒙特卡罗模拟方法可以帮助您在现有数据不充分的情况下,根据现有的数据或已知的参数创建模拟数据集。
- 可对非数值型变量(如“男”和“女”)进行模拟,无需将其记录为数值变量。
- 现有的预测模型和数据可用作模拟的起点,包括从Automatic Linear Modeling (ALM) 和IBM SPSS Modeler导出的模型。
- 生成输入数据时,会自动确定并使用分类输入之间的关联。
- 使用一组不同的随机值,反复计算结果,生成可能结果值的分布,使用户能够选择最优值。
- SPSS Statistics可被用于分析模拟结果,以直观的形式呈现结果以及为决策者推荐的行动。
Geospatial Analytics
- Statistics Premium中的地理空间分析技术可帮助揭示地理空间数据中隐藏的关系和趋势。
- 空间-时间预测 (STP) 技术可使线性模型适应 2D 和 3D 空间内位置随时间推移进行的度量,支持用户预测这些领域的长期变化趋势。
- 使用广义空间关联规则 (GSAR) 发现空间和非空间属性之间的关联,此规则使用历史数据(例如,事件发生位置、事件类型和事件发生时间)来描述发生的事件,例如犯罪或疾病爆发。
定制表
- 包含推论性统计信息时,针对人口统计组、客户群、时间段或其他分类变量比较平均值或比例。
- 该软件可创建汇总统计信息(从针对分类变量的简单计数到离差测定),并按照使用的任何汇总统计信息对类别进行排序。
- 它包括三种主要的测试:独立性卡方测试、列平均值比较(t 测试)和列比例比较(z 测试)。
- 交互式的表构建器提供拖放功能来创建数据透视表。
- 它排除了特定类别,能够显示缺少值的单元格,并可将小计添加到表中。
- 表可实时预览并在创建时进行修改。表可导出至Microsoft Word、Excel、PowerPoint或HTML,以便在报表中使用。
数据准备
- SPSS Statistics Professional可识别可疑或无效的案例、变量和数据值。
- 该软件允许您查看缺失数据的模式并汇总变量分布。
- Optimal Binning为那些为名义属性设计的算法找到最佳可能结果。
- 自动数据准备 (Automated Data Preparation,ADP) 工具通过一个高效的步骤即可检测和纠正质量错误,找到缺少值的原因。
- 建议和可视化帮助您确定要使用的数据。
数据有效性和缺失值检查
- SPSS Statistics Professional可使用六种诊断报表从多种个角度检查数据,然后估算汇总统计信息并确定缺少值的原因。
- 它可诊断因缺少数据而导致的严重问题。
- 该软件能够用估算值替换缺失值。
- 它显示每种缺失值类型以及每个个例所有极值的快照。
- 通过将缺失值替换为估算值以包含所有组(甚至包括响应力较低的组)来消除隐含的偏差。
决策树
- SPSS Statistics Professional以可视化方式确定模型的流动方式,因此您可发现特定的子组和关系。
- 该软件直接在IBM SPSS Statistics中创建分类树,因此,您可以使用结果直接在数据内对案例进行分段和分组。
- 它包括四种确立的树形增长算法:
- CHAID - 快速、统计型的多向树算法,用于快速有效地探索数据,并针对所期望的结果构建分段和概要信息。
- 穷举式 CHAID - CHAID 的一种变体,用于检查每个预测项所有可能的分支。
- 分类和回归树 (C&RT) - 完整的二叉树算法,对数据进行分区,并生成准确的同构子集。
- QUEST - 一种统计算法,可快速有效地选择不包含偏差的变量,并构建准确的二叉树。
- 选择或分类/预测规则使用IBM SPSS Statistics语法、SQL语句或简单文本(通过语法)生成。
预测
- SPSS Statistics Professional支持您以组织决策者可理解和使用的方式来提供信息。
- 它会自动确定最适合的ARIMA或指数平滑模型来分析您的历史数据。
- 时间因果关系建模 (TCM) 技术可帮助揭示大量时间序列中隐藏的因果关系,并确定每一个目标序列的最佳预测变量。
- 一次可对数以百计不同的时间序列进行建模,而不是每次只能对一个变量建模。
- 模型集中保存至一个文件,以便在数据发生变化时可更新预测,而无需重新设置参数或者重新估算模型。
- 可编写脚本以自动使用新数据来更新模型。
IBM SPSS Statistics 三大版本比较:
关键特性 | IBM SPSS Statistics Standard Edition | IBM SPSS Statistics Professional Edition | IBM SPSS Statistics Premium Edition |
---|---|---|---|
核心的分析及图形功能从始至终贯穿标准分析项目 | |||
能够与 R、Python 和其他环境无缝式集成,从而更轻松、更有效地扩展了统计功能及可编程性 | |||
高级统计程序(包括 GLM、GLMM、HLM、GENLIN 和 GEE)能够更准确地识别和分析复杂的关系 | |||
非线性回归(包括 MLR、二元逻辑回归、NLR、CNLR 和概率分析)能够改善预测的准确性 | |||
定制的表,可基于数字和分类数据进行分析和报告 | |||
缺失值分析(含寻找原因)能够解决“脏数据”问题,实现更全面的分析和更有效的决策制定 | |||
高级数据准备能够识别那些可能导致结果出现偏差的不规则数据及其他数据 | |||
决策树能够更好地识别组、发现各个组之间的关系,并预测未来事件。 | |||
预测能够快速方便地预测趋势并构建专家时间序列预测 | |||
结构化等式建模能够测试假设并确认观察到的变量和潜在的变量之间的关系 | |||
启动时的引导程序能够测试预测模型的稳定性及可靠性 | |||
高级的采样评估和测试程序 | |||
高端图表能够帮助分析和报表。 | |||
直销和产品决策制定程序能够识别最佳客户和吸引这些客户的产品属性 | |||
添加 Statistics Server 至该程序包能够显著地提升性能、改善生产力,并实现强大的自动化功能 |
发表评论