分析预测

本文通过一个实际的商业场景,引入了 IBM SPSS Modeler 关联规则模型,首先给出了关联规则的相关概念,接着带领您一步一步的创建了数据流,并且介绍了模型的建立和设置,并且对结果进行了分析。您可以将本模型应用到其他的场景中,如网络日志分析、银行潜在客户分析、电子商务的捆绑销售等。

预测分析如何助力商业应用获取巨大价值?

最近在网上到处了解和爬一些R的资料,看着看着就入迷了,这就是个大宝库了,以前怎么没发现,看来还是太狭隘了。直到前几天我看到这个Awesome R文档,我就静不下来了,对比了目前自己的工作和以后的方向,非常适合我。所以毫不犹豫的把这个文档汉化了,所以大家一起享受吧。

全球最火的R工具包一网打尽,超过300+工具,立马收藏!

如果你以为,SPSS只是一个表格界面、添加数据然后进行算法的分析软件。那你基本已经忽略了它其他的才华。Spss的功能不仅限于分析计算,它还有商业智能、预测分析、财务绩效与战略管理的能力。不但能提供对当前绩效的清晰、即时、可靠的洞察,更提供了预测未来成果。

你以为的SPSS只是简单的数据分析软件吗?

在使用IBM SPSS Modeler过程中,有一些小技巧可能容易被大家忽略,而它们却是可以帮助我们更加高效、方便地实现我们需要的功能,今天给大家介绍参数及全局变量的使用。

IBM SPSS Modeler使用技巧 ----参数及全局变量的使用

在之前的文章《Bagging 或Boosting让你的模型更加优化》中,我们介绍了可以通过Bagging或Boosting技术,使得模型更加稳定和准确率更高,那么今天要介绍的随机森林算法,本身的算法逻辑已经使用了Bagging技术,来构建多棵树,最终实现构建“森林”的目的。

IBM SPSS Modeler随机森林算法介绍

继前几期分享的了Streams V4.2若干新特性之后,本期继续分享V4.2的新特性:版本管理和使用标签控制资源。

IBM Streams V4.2 新特性之版本管理和使用标签控制资源

IT架构实现云化已经是企业IT战略的大势所趋。无论是采用私有云技术还是公有云技术,都要求软件具备云环境的适应能力。作为企业最重要的数据资产,依赖于底层的数据管理软件进行有效的管理。为实现从海量数据中得到实用的知识和信息,如何高效组织数据的存储和查找的技术一直在演进。从早期的层次型数据库到关系型数据库,从SQL数据库到NoSQL数据库再到处理非结构化数据的Hadoop、图数据库等平台,一直在发展变化,现在可以说是百花齐放,百家争鸣。

IBM 全新大数据分析平台,助力数据云化

在上一期的文章《用数据讲述您的故事——Cognos Analytics V11 R4 发布》中我们介绍了Cognos Analytics V11 R4在仪表板中增加的新功能。这一期,我们将继续为大家介绍一个新增的数据可视化方式——Storytelling。您可能已经在我们提供的云端版本上看到了这个新的模块

用数据讲述您的故事——Cognos Analytics V11 R4 的Storytelling

一般而言,为了确定从样本 (sample) 统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。

SPSS干货分享:区分T检验与F检验

IBM SPSS Modeler的分析功能和易用性将与数据库的功能和性能相结合,同时还兼备数据库供应商提供的数据库自有算法。模型在数据库创建,然后可以借助IBM SPSS Modeler界面以正常方式浏览模型并为之评分。

IBM SPSS Modeler数据库内建模

网络分析工具可以帮助你收集、预估和分析网站的访问记录,对于网站优化、市场研究来说,是个非常实用的工具。每一个网站开发者和所有者,想知道他的网站的完整的状态和访问信息,目前互联网中有很多分析工具。

非常实用的10款网站数据实时分析工具

从分析的目的来看,数据分析一般是对历史数据进行统计学上的一些分析,数据挖掘更侧重于机器对未来的预测,一般应用于分类、聚类、推荐、关联规则等。

怎么区别数据挖掘与数据分析?

在电商平台上我们经常能看到“猜你喜欢”的商品推荐、而且推荐的商品符合度确实非常高,那电商平台是怎么知道顾客喜欢什么呢,这类算法又是怎样实现的呢?让我们来一探究竟。

电商“猜你喜欢”,你知道算法是怎样的吗?快来get新技能吧!

很多学习数据分析的同学也都有这样一种困惑“为什么学了那么多工具,还是不会数据分析?”,原因无外乎两个,一是只学到了碎片的知识,没有建立知识之间的连接,无法形式自己的知识体系,二是缺乏实践,导致无法形成“知行合一”的工作技能。

如何系统学习数据分析?

上期的文章《大数据环境下的多维分析技术-动态立方体(Dynamic Cubes)的性能调优(一)》让大家了解到,在大数据环境下,IBM Cognos的Dynamic Cubes可以实现TB级的多维分析功能,文章探讨了影响Dynamic Cubes性能的因素,还介绍了Dynamic Cubes性能调优的一些手段;文章《大数据环境下的多维分析技术-动态立方体(Dynamic Cubes)的性能调优(二)》则告诉我们如何通过Dynamic Query Analyzer工具来对动态立方体的查询性能进行评估并得到优化建议。本期文章我们来看看动态立方体如何进行内存内部聚合的性能调优。

大数据环境下的多维分析技术——动态立方体(Dynamic Cubes)的性能调优(三)

我们所处的信息时代以急速增长的数据信息收集、储存和转换成电子格式为特征。大量的商业数据以杂乱无章的文本形式储存。

不可不知 | 有关文本挖掘的14个概念

想体验数据分析却没有环境怎么办?数据科学家集成工作台(Data Scientist Workbench)无疑是您最便利的,而且是免费的平台。

在Jupyter Notebooks里进行大数据分析,So easy!

C&R Tree全称是Classification and Regression Tree,即分类及回归树,它是由美国斯坦福大学和加州大学伯克利分校的Breiman等人于1984年提出的,从名称中不难理解,它包含了分类树和回归树,分类树用于目标变量是分类型的,回归树用于目标变量是连续型的。

IBM SPSS Modeler算法系列------C&R Tree算法介绍

Cognos Analysis Studio是Cognos用于数据多维分析和探查的基于Web的工具。我们可以在交互式的环境中通过拖放的方式浏览、分析以及比较维度数据,以查找业务问题的答案。

报表中的多维数据分析,并没有你想象的那么难!

在大数据环境下,IBM Cognos的Dynamic Cubes可以实现TB级的多维分析功能,文章探讨了影响Dynamic Cubes性能的因素,还介绍了Dynamic Cubes性能调优的一些手段。其中提到了可以通过下文简称DQA工具来对动态立方体的查询性能进行评估并得到优化建议。那这个DQA工具到底是个什么东西,本期文章为大家一一解密。

解密 | 大数据环境下的多维分析技术