Loading
0

数据质量改善后对区块链有大影响?

数据质量和区块链之间有什么联系? DQMatters首席信息质量教育家,《数据质量的一致性维度》的发行商Dan Myers试图通过使用通用定义来统一数据管理社区,他在企业数据世界大会的演讲中题为“改善的数据质量对区块链的影响”中解决了该问题。

区块链应显着提高数据质量。他指出,这完全与所有权有关—无论是金钱,房地产还是其他任何东西—都涉及所有权的转移以及如何记录该数据。需要通过标识所有者,标识其拥有的对象以及所有者与对象之间的映射来建立所有权。

区块链具有以下优势,例如能够提供完整的交易审计记录并验证与数据质量确认维度中定义的数据质量改进相符的实体:完整性,准确性,一致性,有效性,及时性,货币,完整性,可访问性,沿袭和表示形式。

迈尔斯借鉴了有关区块链如何改善与汽车相关交易的理论示例。经过重新设想的业务流程的多个步骤将与数据质量维度相辅相成:纸质书名可以数字方式分发,在这种情况下,区块链将现实世界连接到具有可打印和数字书名的数字世界;数据质量的改善体现在所有权的表示和对区块链的验证。或使用区块链进行的私家车销售可在提供实体和销售授权的验证的同时,保护住家和邮寄地址的隐私,从而提高数据质量,以提高销售价格的准确性和进行业务交易的各方的完整性。

区块链背景-数据质量维度

区块链在分类账的对等系统中运行,是存储的网络节点,并使用由算法组成的软件单元,这些算法与加密和安全技术一起协商有序和连接的数据块的信息内容。 “从架构的角度来看,您将所有这些汇总为一个逻辑解决方案,以实现并保持其完整性,”迈尔斯说。

例如,由于区块链与密码学有关,因此存在用于管理身份的公共密钥和用于授权的私钥,这对于数据质量非常重要。独特个人之间的交易采取通过个人公钥识别个人的形式,并使用与他们的私钥有关的签名来记录每个交易的同意和批准。他说:“您进行交易,并通过加盖交易信封的钥匙将其封闭或达成协议。” “这里的真正关键是独特的个人识别。”

由于它与客户端-服务器和分布式分类帐架构有关,因此,整个区块链的副本存储在每个节点的分布式上下文中。每个参与者维护,计算新条目并将其添加到自己的分类帐中,并与所有其他条目同步。他说:“使用分布式共识来确保所有节点得出相同的结论。”

由于涉及完整性(一个不变的数据结构),他使用书来比喻,书的页面是连续的。他说:“如果您一直在阅读并阅读涉及另一件事的内容,则需要这本书的完整性及其顺序,因此您必须阅读该页面。”但是,如果删除了页面,则读者会知道完整性已受到损害。

由于它与数据结构中的完整性和交易哈希值有关,因此创世块会创建包含第一条数据的第一块的哈希或数字签名。第二个事务创建第二个数据和来自先前事务的哈希的散列,从而连接两者。因此,每个数据块都是通过每个散列来唯一标识的,因此很难重复。使用这些唯一的密钥,可以链接或加入其他“链下”数据结构,从而确保链中交易与其他位置存储的其他数据之间的参照完整性。

一致性和完整性是最适用于区块链的数据质量的前两个维度。他说:“分布式数据的等效性或冗余性是代表相同概念的其他数据源的相似性的度量,”他说,即一致性。回到汽车的例子中,买方知道卖方已经出售了汽车,但其他人则要等到分布式分类帐被汇总并且需要确保尽可能多的人之间的一致以确保交易的一致性时,卖方才出售汽车。数据质量的一致性维度中定义的完整性对于区块链用途具有鲁棒性,因为它可以衡量数据集的结构或关系质量。

自己难以确保数据的质量?建议寻找合适的大数据团队进行专业的数据分析!

关于慧都大数据分析平台

慧都大数据分析平台「GetInsight®」升级发布,将基于企业管理驾驶舱产品质量分析及预测设备分析及预测等大数据模型的构建,助力企业由传统运营模式向数字化、智能化的新模式转型升级,抓住数据经济的发展势头,提供管理效能,精准布局未来。了解更多,请联系在线客服

慧都大数据专业团队为企业提供商业智能大数据平台搭建,免费业务咨询,定制开发等完整服务,快速、轻松、低成本将任何Hadoop集群从试用阶段转移到生产阶段。

欢迎拨打慧都热线023-68661681或咨询慧都在线客服,我们有专业的大数据团队,为您提供免费大数据相关业务咨询!