什么是英特尔® DAAL?
英特尔®数据分析加速库(Intel® DAAL)是英特尔®架构优化的构件库,涵盖了所有数据分析阶段:从数据源获取数据、预处理、转换、数据挖掘、建模、验证和决策。有助于提升机器学习和大数据分析能力,并帮助数据工程师缩短开发高性能应用的时间。为了在一系列英特尔®处理器上实现最佳性能,英特尔® DAAL使用英特尔®数学内核库和英特尔®集成性能基元的优化算法。
英特尔® DAAL支持端到端分析的概念,当一些数据分析阶段在边缘设备上执行时(接近数据生成和最终消费的地方)。具体来说,英特尔® DAAL应用编程接口(API)与特定的跨设备通信技术无关,因此可以在不同的端到端分析框架中使用。
英特尔® DAAL是加速数据分析应用的常用构件库,它支持各种使用场景,包括在基于IA的移动设备或传感器上进行分析,在高性能集群上运行大规模分布式大数据分析。它支持各种使用场景,从在基于IA的移动设备或传感器上进行分析,到在高性能集群上运行大规模分布式大数据分析。
该库的目标客户是那些关心数据分析软件的性能和电源效率以及整体生产力的软件开发人员。他们不需要花费数天或数月的时间,通过实现和优化常用的数据分析算法构件。
英特尔® DAAL对许多数据分析应用开发人员非常友好。它的API支持C++和Java*语言,允许软件开发人员将DAAL与他们的C++和Java应用程序和平台无缝集成,即使在托管代码环境中也能获得出色的本地代码性能。
与其他针对机器学习和数据挖掘领域的库不同,英特尔® DAAL优化了整个工作流程,从SQL*和无SQL数据源的数据采集到数据转换再到数据分析、训练和预测。
这个库能解决什么问题?
英特尔® DAAL可用于知识发现和数据挖掘、预测分析、机器学习、统计分析、人工智能、模式识别、神经计算以及许多其他涉及大量数据和需要更快地完成分析和决策的问题。
这个库可以用于哪些应用领域?
现在每个应用都会产生大量的数据,包括文本、图像、视频、音频、传感器数据、客户行为、财务数据等。 无论是预测客户的购物行为,基于此推送广告,还是将用户极有可能购买的产品推送到用户访问的在线门户,或是在药物研发领域分析患者数据以找到更好的药物,或是通过分析各种传感器输入的数据来降低功耗,或是在银行预测消费者偿还贷款的概率,每一个需要生成、准备、分析大量数据的领域都可以使用英特尔® DAAL。
有哪些算法可用?
英特尔® 数据分析加速库 (Intel® DAAL) 的算法组件由实现数据分析(数据挖掘)和数据建模(训练和预测)算法的类组成。英特尔® DAAL中提供了用于数据分析各个阶段的各种算法。
数据挖掘和分析算法:
- 计算相关距离和余弦距离
- PCA(相关性,SVD)
- 矩阵分解(SVD、QR、Cholesky)
- 计算统计矩
- 计算方差-协方差和相关矩阵。
- 计算数量级
- 单变量和多变量离群值检测。
- 关联规则挖掘
- 线性和RBF核函数
有监督和无监督的机器学习算法:
- 线性回归
- 贝叶斯
- AdaBoost、LogitBoost和BrownBoost分类器。
- AVM分类器
- K-Means聚类
- 高斯混合模型(GMM)的期望值最大化(EM)
- 支持分类器的验证指标,包括混淆矩阵、准确率、精确度、召回率和Fscore。
批量/流媒体/分布式处理
英特尔® DAAL算法支持以下计算模式。
- 批量处理
- 在线处理
- 分布式处理
你可以在初始化算法时选择计算模式。
- 批处理:所有英特尔® DAAL算法至少支持批处理计算模式。在批处理模式下,只使用特定算法类的计算方法。
- 在线处理 : 某些英特尔® DAAL 算法能够以块的形式处理数据集。在在线处理模式下,使用特定算法类的compute()和finalizeCompute()方法。这种计算模式假设数据以块i=1,2,3,......nblocks的形式到达。每次有新的输入时,就调用compute()方法。当最后一个数据块到达时,调用finalizeCompute()方法来产生最终结果。如果输入数据以异步模式到达,可以使用给定数据源的getStatus()方法来检查是否有新的数据块可以加载。
- 分布式处理:某些英特尔® DAAL算法可以处理分布在多个设备上的数据集。在分布式处理模式下,使用特定算法类的compute()和finalizeCompute()方法。这种计算模式假设数据集在计算节点上被分割成nblocks块。
关于慧都大数据分析平台
慧都大数据分析平台「GetInsight®」升级发布,将基于企业管理驾驶舱产品质量分析及预测、设备分析及预测等大数据模型的构建,助力企业由传统运营模式向数字化、智能化的新模式转型升级,抓住数据经济的发展势头,提供管理效能,精准布局未来。了解更多,请联系在线客服。
慧都大数据专业团队为企业提供商业智能大数据平台搭建,免费业务咨询,定制开发等完整服务,快速、轻松、低成本将任何Hadoop集群从试用阶段转移到生产阶段。
欢迎拨打慧都热线023-68661681或咨询慧都在线客服,我们有专业的大数据团队,为您提供免费大数据相关业务咨询!
发表评论