当前位置: X-MOL 学术Comput. Intell. Neurosci. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Weighted-Attribute Triplet Hashing for Large-Scale Similar Judicial Case Matching
Computational Intelligence and Neuroscience ( IF 3.120 ) Pub Date : 2021-04-16 , DOI: 10.1155/2021/6650962
Jiamin Li 1 , Xingbo Liu 1 , Xiushan Nie 2 , Lele Ma 1 , Peng Li 3 , Kai Zhang 3 , Yilong Yin 1
Affiliation  

Similar judicial case matching aims to enable an accurate selection of a judicial document that is most similar to the target document from multiple candidates. The core of similar judicial case matching is to calculate the similarity between two fact case documents. Owing to similar judicial case matching techniques, legal professionals can promptly find and judge similar cases in a candidate set. These techniques can also benefit the development of judicial systems. However, the document of judicial cases not only is long in length but also has a certain degree of structural complexity. Meanwhile, a variety of judicial cases are also increasing rapidly; thus, it is difficult to find the document most similar to the target document in a large corpus. In this study, we present a novel similar judicial case matching model, which obtains the weight of judicial feature attributes based on hash learning and realizes fast similar matching by using a binary code. The proposed model extracts the judicial feature attributes vector using the bidirectional encoder representations from transformers (BERT) model and subsequently obtains the weighted judicial feature attributes through learning the hash function. We further impose triplet constraints to ensure that the similarity of judicial case data is well preserved when projected into the Hamming space. Comprehensive experimental results on public datasets show that the proposed method is superior in the task of similar judicial case matching and is suitable for large-scale similar judicial case matching.

中文翻译:

大规模相似司法案例匹配的加权属性三元组哈希

相似的司法案例匹配旨在从多个候选人中准确选择与目标文档最相似的司法文档。相似的司法案例匹配的核心是计算两个事实案例文档之间的相似度。由于采用了类似的司法案件匹配技术,法律专业人士可以迅速找到并判断候选人集中的类似案件。这些技术也可以促进司法系统的发展。但是,司法案件的文件不仅篇幅冗长,而且在结构上也有一定程度的复杂性。同时,各种司法案件也在迅速增加。因此,很难在大型语料库中找到与目标文档最相似的文档。在这项研究中,我们提出了一种新颖的类似司法案例匹配模型,该算法基于哈希学习获得司法特征属性的权重,并使用二进制代码实现快速的相似匹配。所提出的模型使用来自变压器(BERT)模型的双向编码器表示提取司法特征属性矢量,然后通过学习哈希函数获得加权的司法特征属性。我们进一步施加三重约束,以确保将司法案件数据投影到汉明空间时能很好地保留其相似性。在公共数据集上的综合实验结果表明,该方法在类似的司法案例匹配任务中具有优越性,适用于大规模的类似的司法案例匹配。所提出的模型使用来自变压器(BERT)模型的双向编码器表示提取司法特征属性矢量,然后通过学习哈希函数获得加权的司法特征属性。我们进一步施加三重约束,以确保将司法案件数据投影到汉明空间时能很好地保留其相似性。在公共数据集上的综合实验结果表明,该方法在类似的司法案例匹配任务中具有优越性,适用于大规模的类似的司法案例匹配。所提出的模型使用来自变压器(BERT)模型的双向编码器表示提取司法特征属性矢量,然后通过学习哈希函数获得加权的司法特征属性。我们进一步施加三重约束,以确保将司法案件数据投影到汉明空间时能很好地保留其相似性。在公共数据集上的综合实验结果表明,该方法在类似的司法案例匹配任务中具有优越性,适用于大规模的类似的司法案例匹配。我们进一步施加三重约束,以确保将司法案件数据投影到汉明空间时能很好地保留其相似性。在公共数据集上的综合实验结果表明,该方法在类似的司法案例匹配任务中具有优越性,适用于大规模的类似的司法案例匹配。我们进一步施加三重约束,以确保将司法案件数据投影到汉明空间时能很好地保留其相似性。在公共数据集上的综合实验结果表明,该方法在类似的司法案例匹配任务中具有优越性,适用于大规模的类似的司法案例匹配。
更新日期:2021-04-16
down
wechat
bug