通过针对全球AI专家的AI挑战,发出了针对CORD-19数据集采取行动的号召。最理想的结果是一组文本和数据挖掘工具,就可以帮助回答高度优先的科学问题。纳贝尔·阿西夫是Qlik的首席解决方案架构师,在倾听了对挑战的陈述后,他意识到,现在的我们还没有完全依赖AI。因此,他尝试使用Qlik解决此问题。
他的目标是使研究人员能够基于Qlik的本机搜索和探索功能查找与COVID-19相关的文章,然后在所选的上下文中应用机器学习(ML)技术。您将在本文的结尾看到解决方案。
关联引擎和ML技术结合
在过去的两年中,纳贝尔一直在从事一个开源项目(https://github.com/nabeel-oz/qlik-py-tools),该项目为Qlik提供了数据科学和ML功能。Qlik Sense中自由形式探索体验能够使用高级分析技术,这是领很多数据分析师着迷的一点。
对于纳贝尔而言,他往往会使用两种ML功能:命名实体识别和群集。第一种技术用于使用预先训练的深度学习模型从每篇文章的标题和摘要中提取生物医学实体。这成为Qlik Sense应用程序中搜索和探索的一个丰富的新维度。虽然这是在重新加载过程中完成的,但是聚类算法实时用于交互式分析。当用户通过选择进行细化时,一种算法会根据标题和摘要中出现的实体的相似性将研究文章分组为类。
简而言之,该解决方案将Qlik的关联引擎与ML技术相结合,从而增强了人类的智慧和能力。
关键部分
挑战的关键部分是要跟上最新研究的步伐。使用Qlik,设置增量负载是标准做法,并且该解决方案使过程相对简单。
适用于非结构化数据
尽管此应用是为CORD-19数据集构建的,但该技术通常可以应用于文本数据。这证明了Qlik如何帮助提供有关大量非结构化数据的情报,这些数据通常在当今大多数组织的分析解决方案中都没有提供。
“在与COVID-19的斗争中,数据的价值不可低估。将非结构化数据和研究信息引入解决方案,并将其与WHO,CDC,Johns Hopkins等人的数据集相结合的能力将加快社会利用知识和资源来阻止流行病,后期还能够帮助以快速,健康,快速的方式恢复。Qlik.org执行总监Julie Kae表示。 “ Qlik.org已经提供了许多资产,可在www.qlik.org/covid19上找到,并且还提供了这种独特的公共访问解决方案。”
示例
请参阅下面的内容观看该解决方案的简短演示。
该项目正在GitHub上维护,该应用程序是公开可用的,可以通过单击此处进行访问。
关于Qlik
Qlik 一直重视数据的作用。Qlik提供端到端、实时数据集成和分析解决方案,帮助组织访问所有数据并将其转换为价值。帮助公司以数据为导向,更深入地了解客户行为,重新设计业务流程,发现新的收入来源,并平衡风险和回报。
LEAD WITH DATA
发表评论