940百科知识

首页  文章资讯  科学技术

文章资讯

Gartner:使用知识图解决数据集成问题

2022-11-09 09:19:04科学技术490

根据2021年Gartner AI in Organizations调查,AI采用的前六大障碍中的三个与数据复杂性、质量和可访问性有关。知识图——链接网络中实体的图形表示——有可能解决许多对人工智能的使用构成重大障碍的数据集成挑战。

为了在企业级别成功构建知识图谱,数据和分析(D&A)领导者必须采用敏捷方法。以下是在整个组织中释放AI力量的三个关键步骤。

Gartner:使用知识图解决数据集成问题

1.首先关注目标用例中的知识图谱

与任何数据科学、分析或AI计划一样,在开始项目之前找到正确的用例。

通常,知识图谱计划始于价值主张。您的组织将能够连接存在于孤岛中的企业级数据,为构建应用程序提供一个平台,这些应用程序可以利用图表中存在的固有链接和上下文。但是,请注意,最常见的挑战将是不愿意或缺乏商业支持来投资它们,因为收益仍不清楚。

知识图谱最流行的三个应用是语义搜索和问答。知识发现;和推荐引擎。

语义搜索通常以熟悉的信息框的形式出现,谷歌在搜索信息时将其显示为图形的输出。从各个角度来看,使用知识图增强组织的搜索能力提供了执行复杂查询的能力,这些查询使用图中定义的关系引用多个文档或来源中的知识。

同时,知识发现是知识图谱的应用,用于发现以前未知或隐藏的信息。例如,通过在图形结构和操作语义中对实体和关系进行建模,它可以发现对患者的潜在治疗方法、对制造商来说更具成本效益的新材料,以及实施逃税的欺诈性公司。

最后,推荐引擎现在是许多在线商店、个人助理和数字平台的熟悉组件。它们在很大程度上已经商品化,以至于许多电子商务平台的洞察引擎和分析工具都包含了某种形式的它。

虽然在这些域和子域中使用图本身就带来了好处,但当它们可以跨域连接以形成企业知识图时,图的真正威力才得以实现。然后可以将其用于数据结构和数字孪生等应用程序,其中业务流程和决策在虚拟环境中复制。

2.通过敏捷实践缩短实现价值的时间

许多组织试图首先定义企业范围的模式、本体或分类,但这是一个错误。这样的努力代价高昂、耗时,充满分歧,而且在许多情况下,在任何价值得以展示或交付之前就停止了。知识图谱不断发展,因此,敏捷实践在开发知识图谱时特别有用。

构建知识图谱的最佳实践相结合将产生更快、更有影响力的结果:使用现有标准、模式和本体作为起点;提取需要建模的关键术语列表;并从业务词汇表和数据字典中添加手工制作的规则、实体属性和关系。

通过考虑最小可行图(MVG)和最小可行本体(MVO),可以将最小可行产品的概念转移到知识图开发中。这意味着只定义与图中的实例数据相对应的定义能力所需的概念和关系(本体)。

以这种模块化方式组成本体,同时利用敏捷实践,提供了一种灵活和动态的方式来实现企业标准化。开发此MVO后,将针对正在交付的用例和任何现有图表对其进行测试。然后可以针对MVO填充实例数据,以创建一个MVG,当需要和定义更多概念时,该MVG可以迭代扩展。使用这种方法,可以从小处着手,但在交付价值的同时迅速扩大规模。

3.在多个通道中支持最小可行图方法

一旦开发了MVO,通过基于本体填充实例数据图来测试和使用它。知识图谱开发项目应确保遵守“交互式”和“增量”的敏捷实践。

随着采用机器学习技术的数据目录解决方案的引入,对存储库中保存的数据(包括结构化和非结构化数据)进行分析变得更加容易。这些解决方案可以自动化发现、清点、分析、标记和创建分布式和孤立数据资产之间的语义关系的过程。

知识图谱开发必须是业务部门和IT之间的协作过程。领域专家将对构成本体的实体和关系发表见解。数据科学家将研究如何利用可用数据实现本体,而IT将需要确保构建知识图谱的平台是健壮且可扩展的。软件工程师将利用知识图谱来满足数据密集型应用程序的数据需求。