当前位置: X-MOL 学术IEEE Trans. Med. Imaging › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Embryo Grading With Unreliable Labels Due to Chromosome Abnormalities by Regularized PU Learning With Ranking
IEEE Transactions on Medical Imaging ( IF 10.6 ) Pub Date : 2021-11-13 , DOI: 10.1109/tmi.2021.3126169
Masashi Nagaya 1 , Norimichi Ukita 1
Affiliation  

We propose a method for human embryo grading with its images. This grading has been achieved by positive-negative classification (i.e., live birth or non-live birth). However, negative (non-live birth) labels collected in clinical practice are unreliable because the visual features of negative images are equal to those of positive (live birth) images if these non-live birth embryos have chromosome abnormalities. For alleviating an adverse effect of these unreliable labels, our method employs Positive-Unlabeled (PU) learning so that live birth and non-live birth are labeled as positive and unlabeled, respectively, where unlabeled samples contain both positive and negative samples. In our method, this PU learning on a deep CNN is improved by a learning-to-rank scheme. While the original learning-to-rank scheme is designed for positive-negative learning, it is extended to PU learning. Furthermore, overfitting in this PU learning is alleviated by regularization with mutual information. Experimental results with 643 time-lapse image sequences demonstrate the effectiveness of our framework in terms of the recognition accuracy and the interpretability. In quantitative comparison, the full version of our proposed method outperforms positive-negative classification in recall and F-measure by a wide margin (0.22 vs. 0.69 in recall and 0.27 vs. 0.42 in F-measure). In qualitative evaluation, visual attentions estimated by our method are interpretable in comparison with morphological assessments in clinical practice.

中文翻译:

通过正则化 PU 学习与排名的胚胎分级与由于染色体异常导致的不可靠标签

我们提出了一种利用其图像对人类胚胎进行分级的方法。这种分级是通过正负分类(即活产或非活产)来实现的。然而,在临床实践中收集的阴性(非活产)标签是不可靠的,因为如果这些非活产胚胎存在染色体异常,则阴性图像的视觉特征与阳性(活产)图像的视觉特征相同。为了减轻这些不可靠标签的不利影响,我们的方法采用了阳性未标记 (PU) 学习,以便将活产和非活产分别标记为阳性和未标记,其中未标记的样本包含正样本和负样本。在我们的方法中,深度 CNN 上的这种 PU 学习通过学习排序方案得到改进。虽然最初的 learning-to-rank 方案是为正负学习而设计的,但它被扩展到 PU 学习。此外,通过互信息正则化缓解了这种 PU 学习中的过度拟合。643 个延时图像序列的实验结果证明了我们的框架在识别准确性和可解释性方面的有效性。在定量比较中,我们提出的方法的完整版本在召回和 F-measure 中大大优于正负分类(召回率为 0.22 对 0.69,F-measure 为 0.27 对 0.42)。在定性评估中,与临床实践中的形态学评估相比,我们的方法估计的视觉注意力是可解释的。这种 PU 学习中的过度拟合通过互信息的正则化得到缓解。643 个延时图像序列的实验结果证明了我们的框架在识别准确性和可解释性方面的有效性。在定量比较中,我们提出的方法的完整版本在召回和 F-measure 中大大优于正负分类(召回率为 0.22 对 0.69,F-measure 为 0.27 对 0.42)。在定性评估中,与临床实践中的形态学评估相比,我们的方法估计的视觉注意力是可解释的。这种 PU 学习中的过度拟合通过互信息的正则化得到缓解。643 个延时图像序列的实验结果证明了我们的框架在识别准确性和可解释性方面的有效性。在定量比较中,我们提出的方法的完整版本在召回和 F-measure 中大大优于正负分类(召回率为 0.22 对 0.69,F-measure 为 0.27 对 0.42)。在定性评估中,与临床实践中的形态学评估相比,我们的方法估计的视觉注意力是可解释的。我们提出的方法的完整版本在召回和 F-measure 中大大优于正负分类(召回率为 0.22 vs. 0.69,F-measure 为 0.27 vs. 0.42)。在定性评估中,与临床实践中的形态学评估相比,我们的方法估计的视觉注意力是可解释的。我们提出的方法的完整版本在召回和 F-measure 中大大优于正负分类(召回率为 0.22 vs. 0.69,F-measure 为 0.27 vs. 0.42)。在定性评估中,与临床实践中的形态学评估相比,我们的方法估计的视觉注意力是可解释的。
更新日期:2021-11-13
down
wechat
bug