生物工程学报  2016, Vol. 32 Issue (5): 693-701

服务

文章信息

麦秀英, 李萍, 徐柳
Xiuying Mai, Ping Li, Liu Xu
胰岛素样生长因子受体Ⅰ序列结构的生物信息学分析
Bioinformatics analysis of sequence and structure of insulin-like growth factor-I receptor
生物工程学报, 2016, 32(5): 693-701
Chin J Biotech, 2016, 32(5): 693-701
10.13345/j.cjb.150377

文章历史

Received: August 25, 2015
Accepted: October 19, 2015
胰岛素样生长因子受体Ⅰ序列结构的生物信息学分析
麦秀英, 李萍, 徐柳     
西南交通大学 生命科学与工程学院,四川 成都 610031
摘要: 胰岛素样生长因子受体Ⅰ的 3'UTR长度大于7 kb,结构复杂,有多种miRNAs的结合位点,参与信号通路中MAPK及PI3K/AKT的调节和多种肿瘤的形成和发展,通过生物信息学分析知道其结构特点,为后续研究提供思路。分析表明儿童神经胶质瘤中IGF1R的3'UTR与miRNAs结合位点突变率最高。分析IGF1R序列3'UTR的结构,miRNAs结合位点,氨基酸序列的理化性质,亲疏水性,糖基化和磷酸化位点,二级结构和三级结构建模。IGF1R三级结构与配体IGF1的三级结构模拟分子对接,得到2种蛋白相互作用的氨基酸位置及名称。因此,通过对IGF1R 3'UTR突变,降低与miRNAs的结合,IGF1R表达上调,同时改变与IGF1的氨基酸结合位点,降低2种蛋白的相互作用,从而抑制IGF1R的作用。
关键词: 胰岛素样生长因子受体I     序列分析     三维建模     分子对接    
Bioinformatics analysis of sequence and structure of insulin-like growth factor-I receptor
Xiuying Mai, Ping Li, Liu Xu     
School of Life Science and Engineering, Southwest Jiaotong University, Chengdu 610031, Sichuan, China
Abstract: The length of IGF1R 3’UTR is greater than 7 kb. The structure of IGF1R 3’UTR is complex, with multiple binding sites of miRNAs. IGF1R is involved in the regulation of MAPK and PI3K/AKT signaling pathways and the formation and development of tumors. Bioinformatics analysis can reveal the structure features of IGF1R, which provides ideas for further research. The analysis shows that the binding sites between IGF1R and miRNAs have the highest mutation rate in Neuroblastoma. We analyzed the structure of 3'UTR, miRNAs binding sites, physical and chemical properties, hydrophilic-hydrophobic property, glycosylation and phosphorylation sites, secondary structure and tertiary structure modeling of IGF1R. The locations and names of amino acids interacting in IGF1R and IGF1 were obtained by molecular docking. Therefore, if IGF1R 3'UTR is mutated, the capacity of IGF1R combined with miRNAs will reduce and the IGF1R expression will be up-regulated, and the function of miRNAs will be repressed. We can change the sites of IGF1R to combine with IGF1 to repress the function of IGF1R and IGF1. Then the function of IGF1R will be repressed.
Key words: insulin-like growth factor-I receptor (IGF1R)     sequence analysis     3D-struture modeling     molecular docking    

胰岛素样生长因子受体Ⅰ (Insulin-like growth factor-I receptor,IGF1R) 是酪氨酸蛋白激酶类受体家族的主要成员之一,存在于多种细胞表面,它调控的Raf-MEK-ERK和AKT-mTOR-S6K信号通路对于肿瘤细胞的增殖、分化和转移过程起着重要的作用[1]。大量流行病学和临床病理学实验结果表明,IGF1R在结肠癌、乳腺癌、肺癌、前列腺癌、恶性黑色素瘤、小细胞肺癌和胶质瘤等多种实体肿瘤细胞中均存在过量的表达,其表达量和肿瘤发生的几率之间高度相关,因此,IGF1R已经成为具有良好开发前景的肿瘤治疗基因靶点,开发高效特异性的IGF1R抑制剂和抗IGF1R的抗体对多种肿瘤的治疗具有重要的临床意义和应用前景[2]

研究发现,人IGF1R基因3'UTR端长 7 082 bp,比一般的基因3'UTR端长很多,存在多个miRNAs结合位点,因此它的表达水平受到多种miRNAs的调控,IGF1R基因表达量异常与IGF1R基因3'UTR端miRNAs结合位点多容易发生突变的特点密切相关。如儿童神经胶质瘤是一种常见的儿童脑瘤,临床中该病占儿童肿瘤的15%,存活率低于40%。在儿童神经胶质瘤患者中,IGF1R的3'UTR突变频率高,IGF1R的表达上调,这一现象预示IGR1R基因3'UTR端与miRNAs结合位点的突变导致IGF1R表达量上调与儿童神经胶质瘤的形成发展存在密切关系,因此认为该基因可以作为治疗儿童神经胶质瘤的一个靶基因。

本文参考美国费城儿童医院Andrei Thomas-Tikhonenko教授提供的数据,对儿童神经胶质瘤96个原癌基因的3'UTR突变进行统计分析,同时对IGF1R的蛋白序列、结构特征与配体的分子对接、3'UTR 与miRNAs结合位点预测等进行详细分析,为开发利用小分子抑制剂和反义RNA抑制肿瘤细胞中IGF1R表达,从而达到有效控制肿瘤生长的研究提供理论依据。

1 材料与方法

NCBI网站上检索人胰岛素样生长因子Ⅰ型受体 (IGF1R) 的核苷酸序列NM_000875 和氨基酸序列NP_000866。

儿童神经胶质瘤中96个原癌基因3'UTR 突变体数据由美国费城儿童医院Andrei Thomas-Tikhonenko教授提供。

儿童神经胶质瘤中96个基因3'UTR突变频率数据进行统计分析。使用TargetScan[3]对其miRNAs结合位点预测,通过ProtParam[4]和ProtScale[4]软件预测IGFIR氨基酸序列的理化性质和亲疏水性,NetNGlyc[5]和Netphos[6]分别分析序列中的糖基化和磷酸化位点。软件SOPMA[7]和Swiss-Model[8]用来预测IGF1R的二级结构和三级结构,对所得三级结构进行合理性分析。AutoDock[9]对IGF1R受体蛋白与IGF1胰岛素生长因子蛋白进行体外模拟偶联。

2 结果与分析

美国费城儿童医院通过对188例儿童神经胶质瘤患者肿瘤细胞中的96个原癌基因3'UTR进行了测序分析,发现6 851个3'UTR突变体,其中3 423个突变体突变位置在与miRNA结合位点。在3 423个突变体中,有459个3'UTR突变体突变位置发生与miRNA结合的种子序列50个碱基以内,这459个突变体分别来自于26个基因,突变的频率最高的是IGF1R基因 (图 1),表明IGF1R基因3'UTR端的突变与儿童神经胶质瘤的形成和发展密切相关。

图1 儿童神经胶质瘤中26个基因3'UTR与miRNAs结合位点突变频率分析 Figure1 Mutation rate analysis of the sites that 26 genes 3'UTR combine with miRNAs in children with gliomas.

利用UCSC查找人类IGF1R序列的3'UTR端,并与人类IGF2R序列的3' UTR进行比较。图 2为3'UTR端结构图。

图2 人类IGF1R (A) 和IGF2R (B) 的3' UTR 结构比较 Figure2 The structure comparison of IGF1R (A) and IGF2R (B) in human.

从结构图中可以看出,IGF1R的3'UTR的结构明显比IGF2R的3'UTR结构复杂,表明IGF1R的3' UTR序列可能存在一些重要的功能,IGF1R的3'UTR (7 082 bp) 端比IGF2R (1 467 bp) 的序列长很多。对IGF1R 3'UTR区的miRNA结合位点预测,发现miRNA结合位点非常多,表 1仅列出与IGF1R的3'UTR结合的miRNA部分预测结果。

表1 人IGF1R的3'UTR与miRNAs结合位点预测 Table1 The prediction of IGF1R 3'UTR and miRNAs binding sites of people
microRNA Position Seed microRNA Position Seed
hsa-miR-939 965 8:0:0 hsa-miR-1207-5p 1 475 8:0:1
hsa-miR-1207-5p 863 8:1:0 hsa-miR-663 969 8:1:0
hsa-miR-1207-5p 148 8:1:1 hsa-miR-671-5p 1 002 8:0:1
hsa-miR-423-5p 301 8:1:1 hsa-miR-877 333 8:1:0
hsa-miR-1207-5p 322 8:1:1 hsa-miR-1275 967 8:0:1
hsa-miR-608 975 8:1:1 hsa-miR-486-3p 119 8:1:1
hsa-miR-1207-5p 842 8:0:0 hsa-miR-483-5p 332 8:1:1
hsa-miR-432 1 348 8:0:0 hsa-miR-518a-3p 383 8:1:0
hsa-miR-941 47 8:1:0 hsa-miR-296-3p 870 8:1:0
hsa-miR-765 332 8:0:1 hsa-miR-296-3p 1 472 8:1:0
hsa-miR-185 806 8:1:0 hsa-miR-486-3p 128 8:1:0
hsa-miR-1268 970 8:1:0 hsa-miR-920 964 8:0:0
hsa-miR-296-3p 957 8:1:1 hsa-miR-612 129 8:1:1
hsa-miR-1268 976 8:1:1 hsa-miR-1207-5p 303 8:0:1

全序列预测显示IGF1R的3' UTR的miRNA位点非常多,说明了IGF1R的表达受到多种miRNA的调控。如果IGF1R的3' UTR发生突变影响IGF1R与miRNA结合,会导致IGF1R表达上调,细胞增殖加快。

用在线工具ProParam对IGFIR氨基酸序列的理化性质进行预测分析,得到结果见表 2。分子量为154 793,等电点为3.58,含量较高的氨基酸Glu(E) 8.3%,Leu(K) 8.5% Ser(S) 7.1%,Val(V) 6.4%,该蛋白不稳定指数为48.02,为不稳定蛋白。用ProtScale对IGF1R的氨基酸序列进行亲疏水性分析,结果 (图 3) 表明亲水性氨基酸占74.31%,疏水性氨基酸占25.69%,故IGF1R蛋白为亲水性蛋白质。

表2 IGF1R核苷酸序列理化性质分析 Table2 The analysis of IGF1R physical and chemical properties
Gene: IGF1R Sources: human
Number of amino acids 1 367
Molecular weight (D) 154 793
Isoelectric point 5.58
The most abundant amino acid (%) Glu(E) 8.3 Leu(K) 8.5 Ser(S) 7.1 Val(V) 6.4
Negative charged residues (Asp+Glu) 175
Positively charged residues (Arg+Lys) 149
Total atoms 21 503
Instability index 48.02
Fatty index 77.64
Average of hydropathicity -0.401
Half life period 30 h
图3 IGF1R亲疏水性分析 Figure3 The analysis of IGF1R hydrophilic-hydrophobic property.

分别用在线工具NetNGlyc和Netphos对IGF1R蛋白序列进行糖基化位点和磷酸化位点进行分析,分析结果见图 4图 5。糖基化位点分析图中,红色线代表阈值,超过这条红色线的绿色线越高即代表此位点糖基化的可能性更高,由图 4可看出有14处位点可能被糖基化,糖基化位点相对较少,糖基化对蛋白的稳定性有一定的影响,糖基化位点较少进一步证明该蛋白为不稳定蛋白。

图4 IGF1R的糖基化位点分析 Figure4 The analysis of IGF1R glycosylation sites.
图5 IGF1R的磷酸化位点分析 Figure5 The analysis of IGF1R phosphorylation sites.

磷酸化位点分析图 5中,红色线同样代表阈值,与糖基化位点分析图中有相同的作用,绿色线代表丝氨酸,蓝色线代表苏氨酸,粉色线则代表酪氨酸,从图中可以看出丝氨酸磷酸化位点最多,其次是酪氨酸,最后是苏氨酸,磷酸化位点相比与糖基化位点多很多。IGF1R是酪氨酸激酶家族的重要成员,磷酸化作用是其发挥生物学功能的重要生物化学反应,表明IGF1R在细胞增殖调控通路中起着重要的作用。

蛋白质的二级结构主要是通过2个氨基酸之间的氢键来形成有规则的卷曲与折叠。常见的二级结构形成的构件有α-螺旋 (α-helix)、β-转角 (β-turn)、β-折叠 (β-sheet)、延伸链 (extended chain)、无规卷曲 (random coil) 和各种基序 (motif) 等[10]

使用在线工具SOPMA (https://npsa-prabi. ibcp.fr/cgi-bin/secpred_sopma.pl) 对IGF1R蛋白二级结构进行预测,预测结果如图 6所示。

图6 IGF1R蛋白二级结构预测分析 Figure6 The analysis and prediction of IGF1R secondary structure.

分析结果显示:在IGF1R蛋白二级结构中,无规卷曲 (random coil) 占据比例最高,约为41.7%,α-螺旋 (α-helix) 其次,占比约为26.55%,β-折叠 (β-sheet) 和延伸链 (extended chain) 分别占23.34%和8.41%。

运用SWISS-MODEL中的Automated mode (自动模型) 对IGF1R氨基酸序列建模,得到其三级结构如图 7 (左) 所示,IGF1R三维结构模型与模板序列相似度为61%,序列的覆盖率为0.28,这符合建模要求。用AutoDock编辑通过SWISS-MODEL预测得到的三维结构空间填充模型如图 7 (右) 所示。运用Ramachandran Plot[11]对模型进行评估,结果见图 8,其中83.85%的氨基酸位于完全允许区,11.34%的氨基酸位于额外允许区,3.44%的氨基酸位于大致允许区,

图7 Swiss-Model模拟IGF1R三级结构 (左) IGF1R空间填充模型 (右) Figure7 The simulated 3D-structure (Left) and space- filling model of IGF1R (Right) from Swiss-Model.
图8 IGF1R三级结构可靠性分析 Figure8 The reliability analysis of IGF1R 3D-structure.

IGF1R作为受体分子为胰岛素样生长因子1 (IGF1) 的高亲和配体,其可加强细胞存活率而抑制凋亡,它们形成的复合体常参与生理学和病理学上的多个过程[12],因此可以通过分子对接来研究IGF1R和IGF1两种蛋白间的相互作用。

NCBI找到人IGF1 NP-001104754.1的蛋白序列,通过Blast序列比对,在PDB数据库中找到与目的蛋白IGF1相似度最大0.97,且序列覆盖率最高0.36的已知三维结构的序列作为模板对IGF1进行三维建模 (图 9)。

图9 Swiss-Model模拟IGF1三级结构 (左) IGF1空间填充模型 (右) Figure9 The simulated 3D-structure (Left) and space-filling model of IGF1 (Right) from Swiss-Model.

将所得IGF1R和IGF1的蛋白三维结构通过AutoDock模拟分子对接,如图 10所示。两种蛋白的氨基酸相互穿插,图 11显示IGF1与IGF1R相互作用的氨基酸位点,包括ARG1095,ARG1092,GLU1099,ARG1177,TRP1203,THR1207,ALA1209,GLU1210,GLN1211,PRO1212,TYR1213,GLN1214,GLY1215,LEU1216,VAL1221,PHE1224,LEU1231,ASP1232。IGF1通过以上氨基酸与其受体IGF1R结合在一起相互作用,激活信号通路PI3K及MAPK,调控细胞的增殖,分化和凋亡[13]。因此,通过分子对接模拟了解其结合氨基酸位点,为进一步通过定点突变等方法干扰IGF1R与IGF1的结合而阻断其在信号通路的作用提供参考。

图10 IGF1R/IGF1相互作用位点 Figure10 The interaction sites of IGF1R and IGF1.
图11 IGF1R/IGF1相互作用氨基酸位点 Figure11 The amino acid sites of interaction between IGF1R and IGF1.
3 讨论

IGF1R家族是重要的酪氨酸激酶受体家族成员之一,目前认为它在肿瘤细胞中的超表达与肿瘤的形成和肿瘤对药物抗性的获得密切相关[14-15]。研究表明,超过50%的乳腺癌会表达活化形式的IGF1R,且IGF1R的表达与乳腺癌的亚型和治疗获得耐药性有关[16],同时2型糖尿病乳腺癌患者的IGF1R表达量明显高于只有乳腺癌的患者[17];在非小细胞肺癌中,IGF1R的表达对癌患者的无病生存期是一个不利因素,IGF1R的表达与患者的吸烟状态和肿瘤大小有关[18]

胶质瘤是常见的原发性脑瘤,占大脑恶性肿瘤的80%。儿童神经胶质瘤存活率低于40%,是威胁儿童健康的一大恶性肿瘤。IGFIR的3′UTR相对其他基因要长很多,分析显示其3′UTR区有多种miRNAs的结合位点,众所周知,miRNA在肿瘤的发生发展中起着重要的作用。根据美国费城儿童医院的研究数据,在96个原癌基因中,IGF1R的3′UTR与多种miRNA结合位点的突变频率最高,进一步证明IGF1R基因高表达是儿童神经胶质瘤形成的一个重要原因,因此可以寻找高效的GF1R小分子抑制剂和开发反义RNA 来抑制IGF1R基因的表达来治疗该类疾病。

IGF1R能激活MAPK和PI3K/AKT信号通路,而AKT (蛋白激酶B) 对细胞增殖、凋亡和细胞周期都起调控作用[19]。作为IGF1R配体的IGF1,可促进肝癌细胞的生长、增殖及侵袭[20]。IGF1可促进其受体IGF1R的磷酸化,并与之结合激活MAPK及PI3K/ATK信号通路,诸多研究表明这两条信号通路与癌症的发生发展相关。而IGF1/IGF1R的结合可激活这两条通路,通过体外模拟两种蛋白的结合,可知道其氨基酸结合位点,为进一步通过实验对结合位点的氨基酸进行定点突变或敲低其表达,达到降低或阻断MAPK及PI3K/AKT信号通路提供参考数据。

对IGF1R的各种生物学性质分析,是为更好的在试验中的操作提供理论基础。本文的大多结果是来源于软件预测,故结果的可信度有待实验进一步验证。

参考文献
[1] Zhou Q, Zhang JX, Cui QY, et al. GSK1904529A, an insulin-like growth factor-1 receptor inhibitor, inhibits glioma tumor growth, induces apoptosis and inhibits migration. Mol Med Rep, 2015, 12 (3) : 3381–3385 .DOI:10.3892/mmr.2015.3869. (in Chinese).
[2] Huang H, Chen Q, Ku X, et al. A series of α-heterocyclic carboxaldehyde thiosemicarbazones inhibit topoisomerase IIα catalytic activity. J Med Chem, 2010, 53 (8) : 3048–3064 (in Chinese).
[3] Agarwal V, Bell GW, Nam JW, et al. Predicting effective microRNA target sites in mammalian mRNAs. eLife, 2015 : e05005 (in Chinese).
[4] Madhusudhan MS, Marti-Renom MA, Eswar N, et al. Comparative protein structure modeling//Walker JM, ed. The Proteomics Protocols Handbook. Totowa, New Jersey: Humana Press, 2005: 831–860.
[5] Gupta R, Jung E, Brunak S. Predicition of N-glycosylation Sites in Human Proteins. New Jersey: Wiley, 2005 : 163–192 (in Chinese).
[6] Blom N, Gammeltoft S, Brunak S. Sequence and structure-based prediction of eukaryotic protein phosphorylation sites. J Mol Biol, 1999, 294 (5) : 1351–1362 (in Chinese).
[7] Geourjon C, Deléage G. SOPMA: significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments. Comput Appl Biosci, 1995, 11 (6) : 681–684 (in Chinese).
[8] Schwede T, Kopp J, Guex N, et al. SWISS-MODEL: an automated protein homology-modeling server. Nucleic Acids Res, 2003, 31 (13) : 3381–3385 (in Chinese).
[9] Trott O, Olson AJ. AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading. J Comput Chem, 2010, 31 (2) : 455–461 (in Chinese).
[10] Liu BY, Nie SH, Du QY, et al. The effects of insulin-like growth factor 1 on glucose metabolism. Chin J Diab, 1999, 7 (4) : 195–197 (in Chinese).
刘宝英, 聂尚海, 杜清友, 等. 重组人胰岛素样生长因子1 的促糖代谢作用研究. 中国糖尿病杂志,1999,7 (4) :195–197.
[11] Gopalakrishnan K, Sowmiya G, Sheik SS, et al. Ramachandran plot on the web (2. Prot Pept Lett, 2007, 14 (7) : 669–671 (in Chinese).
[12] Romaniuk D, Kimsa MW, Strzalka-Mrozik B, et al. Gene expression of IGF1, IGF1R, and IGFBP3 in epiretinal membranes of patients with proliferative diabetic retinopathy: preliminary study. Med Inflamm, 2013 (in Chinese).
[13] Suman S, Kallakury BVS, Fornace Jr AJ, et al. Protracted upregulation of leptin and IGF1 is associated with activation of PI3K/Akt and JAK2 pathway in mouse intestine after ionizing radiation exposure. Int J Biol Sci, 2015, 11 (3) : 274–283 (in Chinese).
[14] Osborne CK, Bolan G, Monaco ME, et al. Hormone responsive human breast cancer in long-term tissue culture: effect of insulin. Proc Nat Acad Sci USA, 1976, 73 (12) : 4536–4540 (in Chinese).
[15] Pollak M. The insulin and insulin-like growth factor receptor family in neoplasia: an update. Nat Rev Cancer, 2012, 12 (3) : 159–169 (in Chinese).
[16] Farabaugh SM, Boone DN, Lee AV. Role of IGF1R in breast cancer subtypes, stemness, and lineage differentiation. Front Endocrinol, 2015 : 59 (in Chinese).
[17] Xin C, Jing D, Jie T, et al. The expression difference of insulin-like growth factor 1 receptor in breast cancers with or without diabetes. J Cancer Res Ther, 2015, 11 (2) : 295–299 (in Chinese).
[18] Zhao S, Qiu ZX, He JL, et al. Insulin-like growth factor receptor 1 (IGF1R) expression and survival in non-small cell lung cancer patients: a meta-analysis. Int J Clin Exp Pathol, 2014, 7 (10) : 6694–6704 (in Chinese).
[19] Liao YD, Zhou C, Zhao JP, et al. Expression and significance of IGF1, IGF1R and AKT, the components of IGF signaling pathway, in primary adenocarcinoma of the lung. J Pract Oncol, 2006, 21 (1) : 15–19 (in Chinese).
廖永德, 周晟, 赵金平, 等. IGF 信号通路关键蛋白IGF1、IGF1R 和AKT 在原发性肺腺癌中的表达及意义. 实用肿瘤杂志,2006,21 (1) :15–19.
[20] E CY. The effects and mechanisms of IGF-1and inhibitor PPP on the growth and invasion of HCC[D]. Changchun: Jilin University, 2013 (in Chinese).
鄂长勇. 类胰岛素生长因子IGF-1 及其受体抑制剂PPP 对肝细胞肝癌生长和侵袭作用的影响及其机制研究[D]. 长春: 吉林大学, 2013.