当前位置: X-MOL 学术bioRxiv. Immunol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Discovery of 10,828 new putative human immunoglobulin heavy chain IGHV variants
bioRxiv - Immunology Pub Date : 2021-01-17 , DOI: 10.1101/2021.01.15.426262
Fabio R Martins , Lucas Alves de Melo Pontes , Tiago Antônio de Oliveira Mendes , Liza F. Felicori

The correct identification of immunoglobulin alleles in genome sequences is a challenge. Nevertheless, it can assist in the study of several human diseases associated with the antibody repertoire and in the development of new therapies using antibody engineering techniques. The advent of next-generation sequencing of human genomes and antibody repertoires enabled the development of several tools for the mapping and identification of new immunoglobulin (Ig) alleles. Some of these tools use 1,000 Genomes (G1K) data for new Ig alleles discovery. However, genome data from G1K present low coverage and variant call problems. Here, a computational screen of immunoglobulin alleles was carried out in the Genome Aggregation Database (gnomAD), the largest high-quality catalogue of variation from 125,748 exomes and 15,708 human genomes. A total of 10,909 putative IGHV alleles were identified, in which 10,828 of them are new and 2,024 appear at least in 6 different alleles from genomes/exomes. The IGHV2-70 was the IGHV gene segment with the largest number of variants described. The majority of the variants were found in the framework 3 and most of them are missense. Interestingly, a large number of variants were found to be population exclusive. A database integrated with a web platform was created (YGL-DB) to store and make accessible the likely new variants found. This available data can help the scientific community to validate new IGHV variants as well as it can shed light on the importance of variants in disease development and immunization protocols.

中文翻译:

发现10828种新型推定的人免疫球蛋白重链IGHV变异体

在基因组序列中正确鉴定免疫球蛋白等位基因是一个挑战。然而,它可以帮助研究与抗体库有关的几种人类疾病,并有助于使用抗体工程技术开发新疗法。下一代人类基因组测序和抗体库的问世使得开发出多种工具可以绘制和鉴定新的免疫球蛋白(Ig)等位基因。其中一些工具使用1,000个基因组(G1K)数据来发现新的Ig等位基因。但是,来自G1K的基因组数据存在覆盖率低和变异调用的问题。在此,对基因组聚集数据库(gnomAD)进行了免疫球蛋白等位基因的计算筛选,这是来自125,748个外显子组和15,708个人类基因组的最大的高质量变异目录。总共十个 鉴定出909个推定的IGHV等位基因,其中10,828个是新基因,而2,024个至少出现在来自基因组/外显子组的6个不同等位基因中。IGHV2-70是IGHV基因片段,其中所述变体数量最多。在框架3中发现了大多数变体,其中大多数是错义的。有趣的是,发现许多变体是人口排斥的。创建了与Web平台集成的数据库(YGL-DB),以存储和访问可能发现的新变体。这些可用的数据可以帮助科学界验证新的IGHV变体,并且可以阐明变体在疾病发展和免疫方案中的重要性。IGHV2-70是IGHV基因片段,其中所述变体数量最多。在框架3中发现了大多数变体,其中大多数是错义的。有趣的是,发现许多变体是人口排斥的。创建了与Web平台集成的数据库(YGL-DB),以存储和访问可能发现的新变体。这些可用的数据可以帮助科学界验证新的IGHV变体,并且可以阐明变体在疾病发展和免疫方案中的重要性。IGHV2-70是IGHV基因片段,其中所述变体数量最多。在框架3中发现了大多数变体,其中大多数是错义的。有趣的是,发现许多变体是人口排斥的。创建了与Web平台集成的数据库(YGL-DB),以存储和访问可能发现的新变体。这些可用的数据可以帮助科学界验证新的IGHV变体,并且可以阐明变体在疾病发展和免疫方案中的重要性。创建了与Web平台集成的数据库(YGL-DB),以存储和访问可能发现的新变体。这些可用的数据可以帮助科学界验证新的IGHV变体,并且可以阐明变体在疾病发展和免疫方案中的重要性。创建了与Web平台集成的数据库(YGL-DB),以存储和访问可能发现的新变体。这些可用的数据可以帮助科学界验证新的IGHV变体,并且可以阐明变体在疾病发展和免疫方案中的重要性。
更新日期:2021-01-18
down
wechat
bug