永利国际

前沿技术 | 公安知识图谱技术提升智能应用能力

点击数: 127  发布时间: 2022-05-24 12:56:21

传统搜索多以模糊匹配,计算相似度等进行简单查询为主,更不能应用于复杂的关系搜索。知识图谱可以很好的用于存储以及展示事物之间的关联关系,我们尝试基于知识图谱之上融入深度学习完成语义搜索应用,不仅克服了传统搜索的不足又让搜索变得智能化。


背景

概述

语义搜索是基于知识图谱的智能搜索,知识图谱能够融合海量数据,具有语义理解、计算挖掘、辅助决策的能力,能够承载复杂的业务知识以及知识之间逻辑关联,能很好的多维度深层次分析情报信息,挖掘有效情报为上层辅助决策带来有价值的参考信息,在串并案、关系分析、群体挖掘、重要度分析等知识应用均取得较好的成效,而语义搜索能够提升并赋能民警查询分析过程。


搜索整体框架

语义搜索采用全文检索与图库联合方式用于查询,包含语义找人、找案、找警情三大功能模块。全文检索的倒排索引和分词技术可快速定位实体但对复杂关系查询性能较差,图库可支持复杂关系查询但对模糊查询效率较低,两者结合能够优势互补从而提高查询的性能。整体工作流是先将搜索文本进行人、案、警情多分类意图识别,下一步进行槽位填充识别搜索文本中的实体序列,最后将实体序列转化为全文检索和图库可识别的查询语言,完成相应的搜索应用,输出用户想要的结果。



图1 搜索查询流程


搜索功能实现


1、图谱简介

公安知识图谱依据业务、效率、分析、冗余等原则存储了人、案件、警情的关联关系信息,用可视化技术描述知识资源及其载体,并能挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。


图2 图谱构建流程



查人业务场景

结合公安知识图谱的业务需求给人设定了姓名、姓氏、身高、性别、婚姻状况等多类可查询属性,比如可以搜索查询“未婚身高180赵姓男子”。同时设定人人之间有同火车、同飞机、同旅馆等多类关系并且相应的关系我们设定了出发站、到达站等不同属性可用于关系的查询,比如可以搜索查询“乘坐高铁从杭州东到上海南站与张三同火车的人”。



查案事件业务场景

案件也设定了常见的案发时间、案发地点等属性与人案关系嫌疑人等多类关系可用于查询,比如可以搜索查询“去年在杭州市嫌疑人张三犯的案件”。警情同样设定常见报警时间、警情发生地等多类的属性与人警情关系报警人、嫌疑人等多类关系可用于查询,比如可以搜索查询“去年在杭州市张三报的涉诈警情”。


2、语义计算

语义搜索包含语义找人、语义找案、语义找警情等多类意图,以及上述图谱构建时可供查询的实体与边属性是我们模型的槽位信息。我们主要使用预训练语言模型BERT来完成SLU中槽填充和意图识别的联合训练,并取得了比传统基于注意力的RNN模型、基于门控机制的模型更好的效果。另一方面,预训练的BERT模型使用来自Transformer的双向Encoder网络层架构既保证了特征提取能力也防止了模型过拟合,可以解决目前SLU的模型中存在的泛化能力较差的问题。


图3 模型架构图


3、语义转化

语义转化功能主要包含语义找人、找案件、找警情模块是将用户查询的文本经过意图识别和槽位填充算法预测的结果转化为es或图库查询语句的过程。


语义找人模块

特征找人为例,语义理解模块识别搜索文本查询意图为特征找人,文本的实体序列有身份证号码、姓名等人员特征;将其先进行实体标准化,权衡es与图库的查询性能,然后转化为相应的es查询语句。


语义找案模块

关系找案为例,语义理解模块识别搜索文本查询意图为关系找案件,文本的实体序列如含人员特征;使用es查询确定特征的实体,复杂实体关系则用图库查询,两者配合完成整个查询的功能。语义找警情则与语义找案件原理一致。


图4 搜索结果展示


总结与展望


公安知识图谱的语义搜索应用是AI警务的大胆尝试,将深度学习融入警务行业通过智能搜索完成不同事物之间的关联分析,对民警办案有很大的实践意义和应用价值。


相关智能产品推荐:


3分钟带你了解中奥可视化建模平台




产品经理微talk | 可视化建模平台可以帮你解决什么问题?