Simulation and comparison of the tertiary structure of
spike protein belong SARS-CoV-2, Bat-SL-CoVZC21,
PCoV_GX-P4L, and identification the hotspot
amino acids in the trimeric structure of protein
Azadeh Lohrasbi-Nejad1*
Department of Agricultural Biotechnology, Shahid Bahonar University of Kerman, Kerman, Iran
Abstract
Aim and Background: Covid-19 disease with acute respiratory symptoms appeared in 2019. The disease was associated with fever, cough, and severe respiratory distress. The causative agent of the disease belonged to the beta-coronavirus family and was named SARS-CoV-2. The outbreak of Covid-19 and the creating of a global epidemic led to many attempts to understand the structure and function of the virus. The spike protein is a relatively heavy glycosylated protein consisting of three identical subunits that appear as a homo-trimmer on the virus's surface. After binding to the surface cell receptor (angiotensin-converting enzyme), the protein conformational changes and eventually causes the virus to enter the host cell. This process is necessary for viruses to enter human cells and infect them. Therefore, investigating the structural details of the spike protein through molecular dynamics simulation can play an influential role in understanding how the subunits connect and identifying the hotspot amino acids.
Materials and Methods: First, the tertiary structure of spike proteins related to SARS-CoV-2, bat-SL-CoVZC21 (Bat Coronavirus), and PCoV_GX-P4L (Pangolin coronavirus) was constructed through modeling homology. After evaluation and validation, these structures were simulated using NAMD software. The structural properties of spike proteins were evaluated in the level of 3D structure, measurement of the interface area between monomers, thermodynamic parameters, trimmer structures' stability, and hotspot amino acids' identification in making connections between subunits.
Results: Evaluation of the trimeric structure of spike protein showed that this protein in SARS-CoV-2 has the highest ΔGdiss value (113.2 kcal/mol), which indicates the stability of the oligomeric protein structure among other spike proteins. The lowest ΔGdiss (100.6 kcal/mol) was obtained for the spike protein of PCoV_GX-P4L. The interface area between the subunits was almost the same in all spike proteins. Y369, D405, Y707 in subunit A, Y369, D574, Y707, Y837, D985 in subunit B, and Y707 in subunit C were identified as red hotspot amino acids for SARS-CoV-2 spike protein.
Conclusion: The study of the structure of virus surface proteins at the atomic scale, and the recognition of hotspot residues that play an essential role in establishing monomeric connections, has created a window to further recognition and function of the virus. Thus, it can provide new information about neutralizing the virus.
Keywords: SARS-CoV-2, spike protein, three-dimensional structure, simulation, hotspot residues, Iau Science.
Corresponding author:
Department of Agricultural Biotechnology, Shahid Bahonar University of Kerman, Kerman, Iran
Email: a.lohrasbi@uk.ac.ir
|
شبیهسازی و مقایسه ساختار سوم پروتئین اسپایک
SARS-CoV-2، Bat-SL-CoVZC21، PCoV_GX-P4L
و شناسایی اسیدهای آمینه هاتاسپات در ایجاد ساختار تریمر پروتئین
آزاده لهراسبی نژاد
گروه بیوتکنولوژی کشاورزی، دانشگاه شهید باهنر کرمان، کرمان، ایران
چکیده
سابقه و هدف: بیماری کووید-19 با علائم حاد تنفسی در سال 2019 ظاهر شد. این بیماری با تب، سرفه و عوارض شدید تنفسی همراه بود. عامل بیماری متعلقبه خانواده بتا کرونا ویروس بوده و تحت عنوان SARS-CoV-2 نامگذاری شد. شیوع کووید-19 و ایجاد حالت اپیدمیک جهانی موجب شد تلاشهای بسیاری برای شناخت ساختار و عملکرد این ویروس انجام شود. پروتئین اسپایک، یک پروتئین گلیکوزیله بهنسبت سنگین است که از سه زیر واحد یکسان ساخته شده است و بهصورت یک هومو تریمر در سطح ویروس ظاهر می شود. این پروتئین پس از اتصال به گیرنده سطح سلول میزبان (آنزیم مبدل آنژیوتانسین-2) دچار تغییر ساختاری میشود و در نهایت موجب ورود ویروس درون سلول میزبان میشود. این روند برای ورود ویروسها به درون سلولهای انسانی و آلوده کردن آن-ها لازم است. بنابراین بررسی جزئیات ساختاری پروتئین اسپایک از طریق شبیهسازی دینامیک مولکولی میتواند نقش مؤثری در شناخت نحوه اتصال زیرواحدهای سازنده و شناسایی اسیدهای آمینه حیاتی در ایجاد اتصالات داشته باشد.
مواد و روشها: ابتدا ساختار سوم پروتئینهای اسپایک مربوط به SARS-CoV-2 (کرونا ویروس انسانی)، bat-SL-CoVZC21 (کرونا ویروس خفاش) و PCoV_GX-P4L (کرونا ویروس پانگولین) از طریق همولوژی مدلینگ ساخته شد. این ساختارها پس از ارزیابی و اعتبار سنجی، به کمک نرمافزار NAMD شبیهسازی شدند. ویژگی ساختاری پروتئینهای اسپایک از نظر شکل فضایی، اندازهگیری مساحت سطح رابط بین مونومرها، پارامترهای ترمودینامیکی، تعیین پایداری ساختارهای تریمر و شناسایی اسیدهای آمینه مهم در ایجاد اتصالات بین زیرواحدها ارزیابی شدند.
یافتهها: ارزیابی زیر واحدهای سازنده پروتئین تریمر اسپایک نشان دادند پروتئینهای اسپایک در SARS-CoV-2دارای بیشترین مقدار ΔGdiss (kcal/mol 2/113) است که بیانگر پایدار بودن ساختار پروتئین تریمر در بین سایر پروتئین های اسپایک است. کمترین میزان ΔGdiss (kcal/mol 6/100) برای پروتئین اسپایک PCoV_GX-P4L بهدست آمد. مساحت سطح رابط بین زیر واحدها در تمام پروتئینهای اسپایک کمابیش یکسان بود. اسیدهای آمینه Y369, D405, Y707 در زیر واحد A و Y369 ،D574,Y707,Y837,D985 در زیر واحد B و Y707 در زیر واحد C بهعنوان اسیدهای آمینه هات اسپات قرمز برای پروتئین اسپایک SARS-CoV-2 شناخته شدند.
نتیجهگیری: بررسی ساختار پروتئینهای سطح ویروس در مقیاس اتمی و شناخت رزیدوهای هات اسپات که نقش مهمی در ایجاد اتصالات بین مونومری بازی میکنند، موجب درک بهتر عملکرد ویروس شده و امکان خنثی سازی این ویروس را فراهم میکند.
واژگان کلیدی: سارس-کووید-2، پروتئین اسپایک، ساختار سهبعدی، شبیهسازی، اسیدهای آمینه هات اسپات، Iau seince
مقدمه
ـــــــــــــــــــــــــــــــــــــــ
نویسنده مسئول:
گروه بیوتکنولوژی کشاورزی، دانشگاه شهید باهنر کرمان
پست الکترونیکی: a.lohrasbi@uk.ac.ir
تاریخ دریافت: 08/10/1400
تاریخ پذیرش: 01/12/1400
|
بیماری کووید-19 اولین مرتبه در سال 2020 در شهر ووهان در استان هوبی چین همراه با تب، بیماری شدید تنفسی و ذاتالریه ظاهر شد (2،1). بررسیهای انجام شده مشخص کرد که پاتوژن جدید (SARS-CoV-2) عضو جدیدی از جنس بتا کرونا ویروس ها است که ارتباط نزدیکی با چندین نوع کرونا ویروس متعلق به خفاش و همچنین SARS-CoV دارد (4،3). مطالعههای صورت گرفته نشان داد که SARS-CoV-2 در مقایسه باSARS-CoV ، با سرعت بیشتری از انسان به انسان منتقل میشود. بنابراین با سرعت بیشتری در بین کشورهای مختلف گسترش پیدا کرد که موجب بروز نگرانی از سوی سازمان بهداشت جهانی شد (6،5،1).
کرونا ویروسها دارای پروتئینهای مختلفی هستند مانند پروتئینهای ساختاری اسپایک (S) ، پروتئینهای غشایی(M) ، پروتئینهای پوششی (E)، پروتئینهای نوکلئوکپسید (N) و پروتئین هماگلوتینین استراز (HE) در برخی از بتا کرونا ویروسها (7). پروتئینهایS ، M و E همه در پوشش ویروسی تعبیه شدهاند. اما پروتئین N با RNA ویروسی تعامل دارد و در هسته ذره ویروسی قرار دارد و نوکلئوکپسید را تشکیل میدهد (7). پروتئین M یکی از مهمترین پروتئینها در ساختار ویریون است. این پروتئین از لحاظ کمی بهنسبت سایر پروتئینهای ویروسی دارای مقادیر بالاتری است، برخلاف پروتئین E که در مقادیر کمی در ویریون یافت میشود (8). این تفاوت در فراوانی پروتئینها بهاحتمال به این دلیل است که پروتئین M نقش مهمی در ایجاد شکل ظاهری ویروس بر عهده دارد و همراه با پروتئین E در اجتماع قسمتهای مختلف و شکلگیری پوششهای ویروسی بسیار حیاتی هستند. پروتئین E علاوهبر عملکردهای دیگر، در آزادسازی ذرات ویروسی از سلولهای میزبان نیز فعالیت میکند (9).
پروتئین N به RNA ویروسی متصل میشود و برای بستهبندی RNA ویروسی بهصورت ذرات ویروسی در طول مرحله مونتاژ ضروری هستند (10،11). پروتئینهای HE در برخی از بتا کرونا ویروسها دیده میشوند. این پروتئین یک هماگلوتینین شبیه هماگلوتینین ویروس آنفلوانزا است که دارای فعالیت استیل استراز است و اسید سیالیک را بر روی گلیکوپروتئینهای سطح سلول میزبان متصل میکند (12). این پروتئین بهاحتمال بیماریزایی و ورود کرونا ویروسها به درون سلولهای میزبان را تقویت میکند.
پروتئین اسپایک یک پروتئین گلیکوزیله است که سنبلههای هموتریمریک را روی سطح ذرات ویروسی تشکیل میدهد و واسطه ورود ویروس به داخل سلولهای میزبان است (13). تریمرهای اسپایک دارای گلیکانهای N-linked بسیاری هستند که برای ایجاد فولد مناسب پروتئین ضروری هستند. علاوهبر این، این گلیکانها برای دسترسی به پروتئازهای سلولی و خنثیسازی عملکرد آنتیبادیها برای ویروسها ضروری هستند (17-14).
پروتئین اسپایک دارای دو دمین عملکردی است. دمین S1 مسئول اتصال به گیرنده سلول میزبان است و دمین S2 مسئول همجوشی غشاهای ویروس و سلول میزبان است. در بسیاری از کرونا ویروسها در مرز بین دو دمین S1 و S2 یک شکاف ایجاد میشود. اما این دو دمین در ساختار پیش همجوش همچنان بهصورت غیر کووالان متصلبه یکدیگر باقی میمانند (23-18،14،13). دمین S1 شامل ناحیه متصل شونده به گیرنده میزبان (RBD) است و به ثبات و پایدارسازی حالت پیشفیوژن زیرواحد S2 لنگر شده با غشا کمک میکند (28-24،20،14). در نتیجه، ورود کرونا ویروس به سلولهای میزبان نیازمند یک فرآیند پیچیده است که ابتدا بایستی ویروس به گیرنده موجود در سطح سلول میزبان متصل شود و سپس پردازش پروتئولیتیکی توسط آنزیمهای میزبان بر روی آن انجام شود و در نهایت همجوشی غشاهای سلولی ویروس و سلول میزبان ایجاد میشود. کرونا ویروسهای مختلف از توالیهای متفاوت در دمین S1استفاده میکنند تا بستهبه گونههای ویروسی، انواع مختلف گیرندههای اتصالی و ورودی در سلول میزبان را شناسایی کنند. SARS-CoV-2 بهطور مستقیم به آنزیم تبدیل کننده آنژیوتانسین-2 (ACE2) برای ورود به سلولهای هدف متصل میشود.
بررسی و مقایسه توالی پروتئین اسپایک در دو ویروس SARS-CoV-2 و SARS-CoV نشان داد که پروتئین اسپایک متعلقبه SARS-CoV-2 حاوی 4 اسید آمینه اضافی (PRRA) در مرز بین دمینهای S1 و S2است. با افزوده شدن این اسیدهای آمینه یک جایگاه برش توسط آنزیم فورین در SARS-CoV-2 ایجاد شده است که تنها در این ویروس دیده میشود. علیرغم شباهت بسیار زیاد توالی پروتئین اسپایک SARS-CoV-2 با BatCoV-RaTG13 جایگاه برش توسط آنزیم فورین در اسپایک BatCoV-RaTG13 دیده نشد (29). با توجهبه توزیع بهطور تقریبی زیاد پروتئینازهایی مانند فورین وجود یک محل برش پلی بازیک در گلیکوپروتئین اسپایک که بهراحتی توسط آنزیم فورین برش میخورد میتواند موجب افزایش قابلیت سرایت SARS-CoV-2 از فرد به فرد دیگر در مقایسه با SARS-CoV باشد.
مطالعههایی که در سال 2021 برای شناسایی نواحی دارای نوترکیبی همولوگ درون ژنوم SARS-CoV-2 صورت گرفت، منجر به شناسایی والدهای احتمالی SARS-CoV-2 شد (30). بر اساس این مطالعه کرونا ویروسهای bat-SL-CoVZC21 متعلقبه خفاش و PCoV_GX-P4L متعلقبه پانگولین بهعنوان والدهای احتمالی SARS-CoV-2 در نظر گرفته شدند (30). با توجهبه نقش پروتئین اسپایک در اتصال ویروس به گیرندههای سلولی و نفوذ به درون سلولهای میزبان، در این مطالعه پروتئین اسپایک در SARS-CoV-2 و کرونا ویروسهایی که بهعنوان والد احتمالی این ویروس در نظر گرفته شده بودند بررسی شد. ابتدا ساختار سه بعدی پروتئین شبیهسازی شد و سپس اسیدهای آمینه مهم در ایجاد اتصالات بین مونومرها مورد ارزیابی قرار گرفتند.
مواد و روشها
مدل سازی ساختار سوم پروتئین اسپایک
بر اساس مطالعه قبلی دو رخداد نوترکیبی در موقعیتهای ابتدایی و انتهایی ژنوم SARS-CoV-2 (ناحیه ابتدایی ژن ab1 و قسمت انتهایی ژنهای S، E، M و ناحیه ابتدایی ژن N) مشخص شده بود. در این رخداد نوترکیبی کرونا ویروس bat-SL-CoVZC21 (با کد دسترسی MG772934) بهعنوان والد SARS-CoV-2 شناخته شده بود(30). علاوهبر این، نتیجه تجزیه و تحلیل توالی ژنوم SARS-CoV-2 و Pangolin-CoVs وقوع یک رویداد نوترکیبی در ژن اسپایک موقعیت 901-352 در توالی نوکلئوتیدی SARS-CoV-2 را مشخص کرده بود. والد مشخص شده برای این رخداد کروناویروس PCoV_GX-P4L با شماره دسترسی MT040333 تعیین شد (30). بنابراین ساختار پروتئین اسپایک در کرونا ویروس انسان (SARS-CoV-2)، کرونا ویروس خفاش (bat-SL-CoVZXC21) و کرونا ویروس پانگولین (PCoV_GX-P4L) مورد مقایسه و ارزیابی قرار گرفتند.
توالی آمینو اسیدی مربوط به پروتئینهای اسپایک در این کرونا ویروسها با کد دسترسی QIA20044، AJA91196 و QIA48614 از پایگاه اطلاعاتی NCBI (https://www.ncbi.nlm.nih.gov) دریافت شد. با توجهبه اینکه بعضی از قسمتهای ساختار سوم اسپایک در کرونا ویروس انسانی و تمام ساختار سوم مربوط به پروتئین اسپایک کرونا ویروس bat-SL-CoVZXC21 و PCoV_GX-P4L هنوز مشخص نشده بود از هومولوژی مدلینگ بهمنظور پیشبینی ساختار سوم استفاده شد. ابتدا به کمک سرور SWISS-MODEL به آدرس https://swissmodel.expasy.org الگو مناسب برای این پروتئینها انتخاب شد. مدل سازی انجام شد و پارامترهای مربوط به کیفیت ساختاری مدلها چک شدند. اعتبارسنجی مدلها به کمک اندازهگیری پارامتر پروچک (https://saves.mbi.ucla.edu)، انجام شد و در نهایت مختصات اتمی مربوط به ساختار سوم مدلهای تأیید شده برای شبیهسازی استفاده شد.
شبیهسازی دینامیک مولکولی
شبیهسازی ساختار اتمی برای هر سه پروتئینی توسط نرمافزار NAMD انجام شد (31). فایل ساختاری پروتئین (psf) بر اساس پارامترهای میدان نیرو CHARM27 ساخته شد. با توجهبه حضور پروتئین در سطح غشاء پلاسمایی و در یک محیط هیدروفیل، پروتئینهای مورد نظر در یک جعبه از مولکولهای آب در نظر گرفته شدند. برای خنثی شدن بار الکتریکی، مولکولهای NaCl با غلظت mM 15/0 به سیستم ساخته شده اضافه شدند. در نهایت شبیهسازی برای سیستم طراحی شده انجام شد. شبیه سازی دینامیک مولکولی بهوسیله نرم افزار NAMD انجام شد (31). میدانهای نیروCHARM27 برای توصیف مولکولهای پروتئینها، یونها و مدلTIP3 برای توصیف مولکولهای آب استفاده شد. شبیهسازی تحت فشار 1 بار و دمای 310 درجه کلوین در آنسامبل دما و فشار ثابت (NPT) انجام شد. الکترواستاتیک دورهای سیستم کامل با روش Particle Mesh Ewald (PME) اعمال شد. کنترل دما بهوسیله دینامیک لنجوین با ضریب میرایی 1 ps-1 انجام شد. کنترل فشار بر پایه باروستات پیستون لنجوین نوز-هوور در حالتیکه Langevin piston decay برابر 50 فمتو ثانیه و Langevin piston period معادل 200 فمتو ثانیه بود انجام شد (32). Cut off و pairlistdist بهترتیب معادل 10 و 5/13 آنگستروم در نظر گرفته شدند. شبیهسازی تحت شرایط مرزی دورهای در مدت زمان 2 نانو ثانیه انجام شد. در نهایت برای نمایش ساختارهای سوم بهدست آمده از برنامه VMD (https://www.ks.uiuc.edu) و PYMOL (https://pymol.org) استفاده شد.
شناسایی آمینو اسیدهای مؤثر در ایجاد اتصالات بین مونومرهای تشکیل دهنده پروتئین اسپایک
اطلاعات مربوط به سطح در دسترس حلال هر پروتئین و اندازهگیری سطح رابط بین واحدهای سازنده هر پروتئین تریمر به کمک سرور PDBePISA (https://www.ebi.ac.uk) انجام شد. مساحت سطح رابط با توجهبه فرمول زیر محاسبه شد:
Interface area (Å2)=SASAmonomer A+SASAmonomerB-SASAdimeraAB2
در این رابطه SASA بهعنوان سطح در دسترس حلال در نظر گرفته شده است. پارامترهای ΔGint و ΔGdiss مربوط به هر ساختار پروتئینی محاسبه و با توجهبه اعداد بهدست آمده پایداری ساختاری پروتئینها تخمین زده شد. علاوهبر این اسیدهای آمینهای که موجب برهمکنش بین زیر واحدها در هر ساختار پروتئینی میشوند با توجهبه اندازهگیری مقدار انرژی آزاد انحلال (ΔG) پس از تشکیل رابط شناسایی شدند.
برای شناسایی رزیدوهای هات اسپات بین هر کدام از دایمرها (AB ،AC، CB) در ساختار تریمر اسپایک از وب سرور DrugScorePPI (https://cpclab.uni-duesseldorf.de) استفاده شد. در این نرمافزار ابتدا تمام اسیدهای آمینه موجود در ناحیه رابط در ساختار دایمرها بررسی شده و مشخص میشود کدام اسیدهای آمینه در برهمکنشهای پروتئین-پروتئین نقش حیاتی دارد. این رزیدوها به کمک فرمول زیر از طریق اندازهگیری تفاوت بین تغییرات انرژی آزاد اتصالات در حالت موتانت و طبیعی پیشبینی میشوند.
ΔΔG = ΔGMUTcomplex-ΔGWTcomplex
یافتهها
شبیهسازی دینامیک مولکولی پروتئین اسپایک
در مدلسازی ساختار سوم پروتئین اسپایک توسط سرور SWISS-MODEL پروتئین اسپایک با کد 7CN8 PDB= بهعنوان الگو برای تمام پروتئینهای اسپایک SARS-CoV-2، bat-SL-CoVZXC21 و PCoV_GX-P1E در نظر گرفته شد.
درصد شباهت بین الگو و توالی-های پروتئین اسپایک در SARS-CoV-2 (کرونا ویروس انسان )، bat-SL-CoVZXC21 (کرونا ویروس خفاش) و PCoV_GX-P1E (کرونا ویروس پانگولین) بهترتیب 60/91%، 16/79% و 26/99% تعیین شد.
پارامتر QMEAN Z-score در مدلهای ساخته شده برای SARS-CoV-2، bat-SL-CoVZXC21 و PCoV_GX-P1E بهترتیب معادل 22/2 -، 39/2 - و 14/2- بهدست آمد (شکل 1). QMEAN Z-score درجه طبیعی بودن مدل ساخته شده را با توجهبه ویژگیهای ساختاری مدل تخمین میزند. بر اساس نتایج Benkert و همکارانش QMEAN Z-score مدلها هرچقدر به صفر نزدیکتر باشد مدل ساخته شده از کیفیت مطلوبتری برخوردار است و با ساختارهای سوم که از طریق روشهای آزمایشگاهی مشخص شدهاند، شباهت بیشتری دارد (33). امتیاز 4 - یا کمتر از آن نشان دهنده کیفیت پایین مدل ساخته شده است. بنابراین مدلهای ساخته شده پروتئین اسپایک برای هر سه کرونا ویروس از کیفیت ساختاری مطلوب برخوردار هستند.
تستهای اعتبارسنجی توسط اندازهگیری عددی پارامترهای پروچک انجام شد. نتایج بهدست آمده نشان داد 15/94%، 30/93% و 31/95% از اسیدهای آمینه مربوط به پروتئینهای اسپایک در مدلهای ساخته شده برای SARS-CoV-2، bat-SL-CoVZXC21 و PCoV_GX-P1E در ناحیه مورد قبول نمودار راماچاندران قرار گرفتهاند. در نهایت فایل مربوط به مختصات اتمی مدلهای ساخته شده بهمنظور شبیهسازی استفاده شد. پس از انجام مراحل شبیهسازی ساختارهای سوم بهدست آمده برای آنالیز خصوصیات ساختاری مورد استفاده قرار گرفتند.
شکل 1: پارامتر QMEAN Z-score مدل های ساخته شده برای پروتئین های اسپایک موجود در SARS-CoV-2، bat-SL-CoVZXC21 و PCoV_GX-P1E
بررسی ویژگیهای ساختاری واحدهای سازنده پروتئین اسپایک
پس از شبیهسازی ساختار سوم پروتئینهای اسپایک، نوع برهمکنشها و اسیدهای آمینه مهم که در ایجاد برهمکنشها بین زیر واحدهای این پروتئینهای تریمر نقش دارند، بررسی شدند. نتایج بهدست آمده در جدول 1 ارائه شده اند. بر اساس نتایج بهدست آمده مساحت منطقه رابط بین مونومرها در پروتئین اسپایک تمام ویروس ها تقریبا در یک محدوده قرار می گیرد.
اتصالات بین زیر واحدها از طریق محاسبه پارامتر ΔG توسط سرور PDBePISA انجام شد. این نتایج در جدول 1 ارائه شدهاند. پارامتر ΔG بر اساس تفاوت انرژی توتال حلال هنگامیکه مونومرها مجزا در نظر گرفته میشود نسبتبه زمانی که مونومر ها با هم بر همکنش دارند محاسبه میشود.
جدول 1 : ویژگیهای مونومرهای سازنده ساختار پروتئین اسپایک
GenBank accession number
|
زیر واحد1
|
زیر واحد2
|
Interface area Ų
|
*ΔG
kcal/mol
|
name
|
αNres
|
βSurface area Ų
|
name
|
αNres
|
βSurface
area Å
|
#QIA20044
|
A
|
241
|
56276
|
B
|
236
|
56268
|
8555
|
1/24-
|
A
|
236
|
56276
|
C
|
236
|
55919
|
8576
|
4/35-
|
B
|
239
|
56268
|
C
|
227
|
55919
|
8723
|
6/34-
|
#AVP78042
|
A
|
229
|
56259
|
B
|
232
|
56397
|
8287
|
4/25-
|
A
|
230
|
56259
|
C
|
225
|
56538
|
8507
|
5/34-
|
B
|
225
|
56397
|
C
|
228
|
56538
|
8314
|
9/24-
|
#QIA48614
|
A
|
232
|
55890
|
B
|
228
|
56079
|
8506
|
7/26-
|
A
|
229
|
55890
|
C
|
235
|
55611
|
8559
|
2/21-
|
B
|
240
|
56079
|
C
|
235
|
55611
|
8777
|
0/26-
|
QIA20044# (پروتئین اسپایک SARS-CoV-2)، AVP78042# (پروتئین اسپایک bat-SL-CoVZC21)، QIA48614# (پروتئین اسپایک PCoV_GX-P1E)
αNres : تعداد باقی مانده های رابط بین دو مونومر است
βSurface area : کل سطح قابل دسترس با حلال است
*ΔG: انرژی آزاد انحلال پس از تشکیل رابط
مقدار منفی این پارامتر نشان دهنده یک سطح رابط آبگریز بین مونومرها و یا تمایل زیرواحدها برای اتصال را نشان میدهد. مقایسه مقادیر عددی ΔG هنگام تشکیل دایمرهای متفاوت در SARS-CoV-2 نشان میدهد که کمترین مقدار ΔG، kcal/mol 4/35-، وقتی دیده میشود که بر همکنشها بین مونومرهای A و C ایجاد شوند. بنابراین تمایل این دو زیر واحد برای ایجاد اتصال با یکدیگر بیشتر از سایر زیر واحدها است.
مقدار ΔG برای دایمرهای تشکیل شده در پروتئین اسپایک bat-SL-CoVZXC21 برای دو زیر واحد A و C kcal/mol 5/34- بهدست آمد که بیانگر تمایل زیاد این دو مونومر برای ایجاد ساختارهای دایمر است. در حالیکه بیشترین تمایل برای تشکیل ساختارهای دایمر در پروتئین اسپایک PCoV_GX-P1E برای زیرواحدهای A وB دیده شد ( ΔG معادل kcal/mol 7/26-). محاسبه پایداری ترمودینامیکی پروتئینهای اسپایک به کمک اندازهگیری پارامترهای ΔGint و ΔGdiss انجام شد. ΔGint بر اساس تفاوت انرژی توتال حلال برای ساختارهای جدا شده و اسمبل شده محاسبه میشود و ΔGdiss انرژی آزاد جداسازی واحدهای اسمبل شده را مشخص میکند. مقادیر بزرگتر از صفر برای ΔGdiss نشان میدهد که برای جدا شدن زیر واحدهای یک ساختار الیگومر حضور یک نیروی محرک الزامی است بنابراین ساختار اسمبل شده از نظر ترمودینامیک پایدار است. با توجهبه نتایج بهدست آمده (جدول 2)، پروتئین اسپایک در SARS-CoV-2 بالاترین مقدار عددی ΔGdiss kcal/mol) 2/113) در بین سایر ویروسها را دارد. بنابراین، میتوان نتیجه گرفت که پروتئین اسپایک در SARS-CoV-2 دارای پایدارترین ساختار الیگومر است.
مقادیر پارامترهای ΔGint و ΔGdiss برای bat-SL-CoVZXC21 معادل kcal/mol 2/96- و kcal/mol 4/102 بهدست آمد. کمترین مقدار ΔGdiss برایPCoV_GX-P1E (kcal/mol 6/100) بهدست آمد که نشان میدهد پروتئین اسپایک در این کرونا ویروس پایداری دمایی پایینی دارد. مقدار ΔGint برای این پروتئین 4/83- kcal/mol بهدست آمد.
جدول 2. پایداری ترمودینامیکی پروتئینهای اسپایک
ΔGdiss ‡ (kcal/mol)
|
†ΔGint (kcal/mol)
|
|
113/2
|
8/106-
|
*QIA20044
|
102/4
|
2/96-
|
*AVP78042
|
100/6
|
4/83-
|
*QIA48614
|
QIA20044* (پروتئین اسپایک SARS-CoV-2)، AVP78042* (پروتئین اسپایک bat-SL-CoVZC21)، QIA48614* (پروتئین اسپایک PCoV_GX-P1E)
†ΔGint: تفاوت انرژی توتال حلال برای ساختارهای جدا شده و اسمبل شده
ΔGdiss‡: انرژی آزاد جداسازی واحدهای اسمبل شده
شناسایی اسیدهای آمینه حیاتی در ایجاد اتصالات بین زیر واحدهای پروتئین اسپایک
بهمنظور پیدا کردن اسیدهای آمینه حیاتی در اتصال بین زیرواحدها، از سرور DrugScorePPI استفاده شد. آمینو اسیدهای هات اسپات بر اساس مقدار 1 ≥ ΔΔG مشخص شدند. برای مونومر A، B و C در SARS-CoV-2 بهترتیب 62 و 60 و 59 هات اسپات مشخص شد این رزیدوها در شکلهای 2A-C نشان داده شدهاند. اسیدهای آمینهای که ΔΔG≥3 داشتند بهعنوان اسیدهای آمینه هات اسپات قرمز در نظر گرفته شدند که نقش مهمی در ایجاد ارتباط بین مونومرها دارند. رزیدوهای هات اسپات در bat-SL-CoVZXC21 و PCoV_GX-P1E در شکلهای 3 و 4 نشان داده شدهاند.
ساختار سوم پروتئینهای اسپایک موجود در SARS-CoV-2، bat-SL-CoVZXC21 و PCoV_GX-P1E پس از شبیهسازی دینامیک مولکولی تعیین شد (شکل 5). موقعیت رزیدوهای هات اسپات قرمز در هر مونومر تشکیل دهنده اسپایک در این سه کرونا ویروس نشان داده شده است.
بحث
شناسایی میزبانهای اصلی و میزبانهای واسطه SARS-CoV-2 امروزه مورد توجه بسیار قرار گرفته است. شناسایی این میزبانها روند تکامل SARS-CoV-2 و بیماریزایی انسانها را نشان میدهد. مطالعههای متعددی در این زمینه انجام شده است. بر اساس مطالعههای نوترکیبی همولوگ در سال 2021 توسط Lohrasbi-Nejad، bat-SL-CoVZXC21 بهعنوان والد ابتدایی و PCoV_GX-P1E بهعنوان والد میانی در نظر گرفته شدند، این کرونا ویروسها بهترتیب در Rhinolophus Sinicus و Manis javanica شناسایی شده بودند (30). علاوهبر این، مطالعهها، Lu و همکارانش بیان کردند که SARS-CoV-2 با دو سویه کرونا ویروس مشتق شده از خفاش، Bat-SL-CoVZC45 و Bat-SL-CoVZC21 ارتباط نزدیکی دارد و پیشنهاد کردند که SARS-CoV-2 ممکن است از این خفاشها منشاء گرفته باشد (30). مطالعههای انجام شده توسط Zhang و همکارانش نیز نشان دادند که کرونا ویروسهای پانگولین ارتباط نزدیکی با SARS-CoV-2 دارند (34).
با توجهبه شناسایی والدهای احتمالی و نقش مهمی که پروتئین اسپایک در اتصال و ورود سلول میزبان دارد و بازیگر اصلی در همجوشی غشاهای سلولی است، در این مطالعه به بررسی و مقایسه ساختار این پروتئین در سه نوع کرونا ویروس SARS-CoV-2، bat-SL-CoVZXC21 و PCoV_GX-P1E پرداخته شد.
شکل 2. اسیدهای آمینه هات اسپات در منطقه رابط بین مونومرها در SASRS-CoV-2 (A) زیر واحد A ، (B) زیر واحد B و (C) زیر واحد C. اسیدهای آمینه حاوی ΔΔG≥3 به عنوان هات اسپات قرمز شناخته میشوند
شکل 3. اسیدهای آمینه هات اسپات در منطقه رابط بین مونومرها در bat-SL-CoVZXC21 (A) زیر واحد A ، (B) زیر واحد B و (C) زیر واحد C. اسیدهای آمینه حاوی ΔΔG≥3 بهعنوان هات اسپات قرمز شناخته میشوند.
در اولین قدم برای مدل سازی ساختارهای پروتئینی، الگوی مناسب (7CN8 PDB=) شناسایی و انتخاب شد. این نتایج همراستا با مطالعات انجام شده توسط Garushyants و همکارانش بود. آنها برای مدلسازی ساختار سوم پروتئین اسپایک SARS-CoV-2 از اطلاعات ساختاری پروتئین با کد 7CN8 استفاده کردند و در نهایت نشان دادند ورود اسیدهای آمینه جدید در ساختار گلیکو پروتئینی اسپایک بر خواص آنتیژنی آن تأثیر دارد و ممکن است موجب فرار ویروس از سیستم ایمنی شود (35). بهتازگی مشخص شده است که اسپایک SARS-CoV-2 از طریق RBD به یک اسید چرب آزاد با نام لینولئیک اسید (LA) متصل میشود که به تثبیت اسپایک در ساختار فشرده و بسته کمک میکند (36). مطالعه جدید توسط Zhang و همکارانش نشان داد که در هر دو پروتئین اسپایک متعلق به SARS-CoV-2 و PCoV_GX، LA در یک پاکت آبگریز قرار دارد که بهطور عمده توسط بقایای فنیل آلانین شکل گرفته است. یک آرژنین (PCoV_GX: R406 و SARS-CoV-2: R408) و یک گلوتامین (PCoV_GX: Q407 و SARS-CoV-2: Q409) لنگر را برای تعامل با کربوکسیل سرگروه LA فراهم میکند (34).
شکل 4. اسیدهای آمینه هات اسپات در منطقه رابط بین مونومرها در PCoV_GX-P1E (A) زیر واحد A ، (B) زیر واحد B و (C) زیر واحد C. اسیدهای آمینه حاوی ΔΔG≥3 به عنوان هات اسپات قرمز شناخته میشوند.
در مطالعه حاضر، مشخص شد که R408 در مونومرهای B و C مربوط به SARS-CoV-2 (شکل 2) و R406 در مونومرهای A و B مربوط به PCoV_GX-P1E (شکل 4) بهعنوان اسیدهای آمینه هات اسپات شناخته شدهاند. مطالعههای Zhang و همکارانش نشان دادند که Y449،N501 ، Y447، Y505، T499 و Y503 در SARS-CoV-2 نقش مهمی در اتصال اسپایک به گیرنده سلولی ACE2 دارند (34). در مطالعه حاضر، Y505 و Y503 بهعنوان اسیدهای آمینه در گیر در ایجاد اتصالات بین زیر واحدهای A، B و C در SARS-CoV-2 و زیر واحدهای B و C در PCoV_GX-P1E شناخته شدند ( شکلهای 2 و 4).
با توجهبه اهمیت پروتئین اسپایک، مطالعههای مقایسهای روی اسپایکهای موجود در کرونا ویروسهای مختلف، میتواند نقش مؤثری در شناخت تکامل ویروسی و انتقال بین گونهای داشته باشد. مطالعه ساختار پروتئینها مدتها است که برای درک عملکرد زیستی پروتئینها و توسعه داروها در مقابل ویروسهای نوظهور مفید بوده است. بررسی ساختاری پروتئین اسپایک اطلاعات لازم در زمینه انتقال ویروس به میزبانهای جدید و روشهای خنثی کردن ویروس را فراهم میکند (37،38). امروزه پیشرفتهای جدید درزمینه میکروسکوپ الکترونی روبشی (cryo - EM) امکان بازیابی کنفورماسیونی پروتئینهای تریمریک اسپایک را فراهم کرد (39). تلاشهای حاصل نه تنها درک ما از عملکرد زیستی SARS-CoV-2 را بهبود بخشیده، بلکه راههای جدیدی برای درمان این ویروس نیز ارائه میکند. بیشترین مطالعههایی که تا امروز بر روی ساختار پروتئین اسپایک SARS-CoV-2 انجام شده است بر روی ناحیه RBD بوده است که موجب اتصال اسپایک به گیرنده آن در سطح سلولهای هدف میشود. درحالیکه در این مطالعه برهمکنش بین زنجیرههای اسپایک برای تشکیل یک پروتئین تریمر بررسی شده است و اسیدهای آمینه حیاتی برای ایجاد اتصالات مشخص شدهاند.
نتیجهگیری
بیماری همهگیر کووید-19 در سال 2019 در ووهان چین شایع شد. شیوع این بیماری و ایجاد حالت اپیدمیک جهانی موجب شد تلاشهای بسیاری برای شناخت ساختار و عملکرد این ویروس انجام شود. با توجهبه اهمیت پروتئین اسپایک در بروز بیماری کووید-19، محققان درصدد بررسی ساختار این پروتئین برآمدهاند. اولین نقشه در مقیاس اتمی از پروتئین ویروس برای تولید واکسن علیه آن تهیه شده است. تاکنون مشخص شده است که قسمتی از این پروتئین (RBD) مسئول اتصال ویروس به گیرندههای سلولهای انسانی است و موجب جوش خوردن سایر قسمتهای ویروس به غشاء سلولهای میزبان میشود. این روند برای ورود ویروسها به درون سلولهای انسانی و آلوده کردن آنها لازم است. مطالعه ساختار پروتئین میتواند به درک عملکردهای زیستی و توسعه داروها در مقابل ویروسها
کمک کند. تلاشهای زیادی برای شناسایی ساختار و عملکرد پروتئینهای اسپایک کرونا ویروسها صورت گرفته است. اما در این مطالعهها تنها قسمتهایی از کل ساختار پروتئین اسپایک در SARS-CoV-2 مشخص شده است. در حالیکه در مطالعه حاضر از طریق شبیهسازی دینامیک مولکولی کل ساختار سوم اسپایک در SARS-CoV-2 شبیهسازی شد. علاوهبر این، شبیهسازی برای پروتئین اسپایک مربوط به bat-SL-CoVZXC21 و PCoV_GX-P1E که بهعنوان والد احتمالی و والد ذخیرهای در نظر گرفته شدند، انجام شد. اسیدهای آمینه مهم در اتصال هر یک از زیرواحدها برای تشکیل ساختار تریمر اسپایک مشخص شدند. اسیدهای آمینه Y369, D405, Y707 در زیر واحد A و Y369, D574,Y707,Y837,D985 در زیر واحد B و Y707 در زیر واحد C بهعنوان هات اسپات قرمز در SARS-CoV-2 شناخته شدند که برای اتصال زیر واحدها به یکدیگر نقش حیاتی ایفا میکنند. اندازهگیری میزان GΔ نشان داد که مونومرهای A و C تمایل بیشتری برای اتصال به یکدیگر دارند. پروتئینهای اسپایک از نظر سطح رابط و میزان ΔGdiss ارزیابی و با یکدیگر مقایسه شدند. مقادیر بزرگتر از صفر برای ΔGdiss نشان داد که پروتئین اسپایک در SARS-CoV-2 دارای پایداری ترمودینامیک بالایی است.
سپاسگزاری
این مطالعه با حمایت معاونت پژوهشی و حمایت مالی پژوهشکده تحقیقات و فناوری تولیدات گیاهی، دانشگاه شهید باهنر کرمان، کرمان، ایران، با شماره گرنت [41/900] انجام شده است.
شکل 5. ساختارهای سه بعدی پروتئین اسپایک متعلقبه SARS-CoV-2، bat-SL-CoVZXC21، PCoV_GX-P1E است. (A ، B) ساختار سه بعدی پروتئین، دمین متصل شونده به گیرنده (RBD) نشان داده شده است. (C ، D ، E) زیر واحدهای A ، B و C که ساختار یک پروتئین را بههمراه هات اسپات قرمز آن را نشان می دهد. شبیهسازی دینامیک مولکولی برای هر یک از ساختارهای پروتئینی توسط نرمافزار NAMD انجام شد.
منابع
1. Chan JFW, Yuan S, Kok K-H, To KK-H, Chu H, Yang J, et al. A familial cluster of pneumonia associated with the 2019 novel coronavirus indicating person-to-person transmission: a study of a family cluster. Lancet. 2020;395:514-23.
2. Huang C, Wang Y, Li X, Ren L, Zhao J, Hu Y, et al. Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China. Lancet. 2020a;395:497-506.
3. Lu R, Zhao X, Li J, Niu P, Yang B, Wu H, et al. Genomic characterisation and epidemiology of 2019 novel coronavirus: Implications for virus origins and receptor binding. Lancet. 2020;395:565–74.
4. Wu F, Zhao S, Yu B, Chen Y-M, Wang W, Song Z-G, et al. A new coronavirus associated with human respiratory disease in China. Nature. 2020;579:265–9.
5. Chen N, Zhou M, Dong X, Qu J, Gong F, Han Y, et al. Epidemiological and clinical characteristics of 99 cases of 2019 novel coronavirus pneumonia in Wuhan China: a descriptive study. Lancet. 2020;395:507-13.
6. Li Q, Guan X, Wu P, Wang X, Zhou L, Tong Y, et al. Early Transmission Dynamics in Wuhan China of Novel Coronavirus-Infected Pneumonia. N Engl J Med. 2020;382:1199-207.
7. Fehr AR, Perlman S. Coronaviruses: An overview of their replication and pathogenesis. Methods Mol Biol. 2015;1282:1-23.
8. Nal B, Chan C, Kien F, Siu L, Tse J, Chu K, et al. Differential maturation and subcellular localization of severe acute respiratory syndrome coronavirus surface proteins S, M and E. J Gen Virol. 2005;86:1423–34.
9. Siu YL, Teoh KT, Lo J, Chan CM, Kien F, Escriou N, et al. The M, E, and N structural proteins of the severe acute respiratory syndrome coronavirus are required for efficient assembly, tracking, and release of virus-like particles. J Virol. 2008;82:11318–30.
10. Chang CK, Sue SC, Yu TH, Hsieh CM, Tsai CK, Chiang YC, et al. Modular organization of SARS coronavirus nucleocapsid protein. J Biomed Sci. 2006;13:59-72.
11. Hurst KR, Koetzner CA, Masters PS. Identification of in vivo-interacting domains of the murine coronavirus nucleocapsid protein. J Virol. 2009;83: 7221-34.
12. Klausegger A, Strobl B, Regl G, Kaser A, Luytjes W, Vlasak R. Identification of a coronavirus hemagglutinin-esterase with a substrate specificity different from those of influenza C virus and bovine coronavirus. J Virol. 1999;73:3737–43.
13. Bosch BJ, van der Zee R, de Haan CA, Rottier PJ. The coronavirus spike protein is a class I virus fusion protein: structural and functional characterization of the fusion core complex. J Virol. 2003;77:8801–11.
14. Walls AC, Tortorici MA, Bosch BJ, Frenz B, Rottier PJM, DiMaio F, et al. Cryo-electron microscopy structure of a coronavirus spike glycoprotein trimer. Nature. 2016;531:114–7.
15. Walls AC, Xiong X, Park YJ, Rey FLA, Corti D, Veesler D, et al. Unexpected Receptor Functional Mimicry Elucidates Activation of Coronavirus Fusion. Cell. 2019;176:1026-39.
16. Xiong X, Tortorici MA, Snijder J, Yoshioka C, Walls AC, Li W, et al. Glycan shield and fusion activation of a deltacoronavirus spike glycoprotein fine-tuned for enteric infections. J Virol. 2018;92:e01628-17.
17. Yang Y, Liu C, Du L, Jiang S, Shi Z, Baric RS, et al. Two Mutations Were Critical for Bat-to-Human Transmission of Middle East Respiratory Syndrome Coronavirus. J Virol. 2015b;89:9119–23.
18. Belouzard S, Chu VC, Whittaker GR. Activation of the SARS coronavirus spike protein via sequential proteolytic cleavage at two distinct sites. Proc Natl Acad Sci USA. 2009;106:5871–6.
19. Burkard C, Verheije MH, Wicht O, van Kasteren SI, van Kuppeveld FJ, Haagmans BL, et al. Coronavirus cell entry occurs through the endo-/lysosomal pathway in a proteolysis-dependent manner. PLoS Pathog. 2014;10:e1004502.
20. Kirchdoerfer RN, Cottrell CA, Wang N, Pallesen J, Yassine HM, Turner HL, et al. Pre-fusion structure of a human coronavirus spike protein. Nature. 2016; 118:531-21.
21. Millet JK, Whittaker GR. Host cell entry of Middle East respiratory syndrome coronavirus after two-step, furin-mediated activation of the spike protein. Proc Natl Acad Sci USA. 2014;111:15214–9.
22. Millet JK, Whittaker GR. Host cell proteases: Critical determinants of coronavirus tropism and pathogenesis. Virus Res 2015;202:120-34.
23. Park JE, Li K, Barlan A, Fehr AR, Perlman S, McCray PBJ, et al. Proteolytic processing of Middle East respiratory syndrome coronavirus spikes expands virus tropism. Proc Natl Acad Sci USA. 2016;113:12262–7.
24. Gui M, Song W, Zhou H, Xu J, Chen S, Xiang Y, et al. Cryo-electron microscopy structures of the SARS-CoV spike glycoprotein reveal a prerequisite conformational state for receptor binding. Cell Res 2017;27:119-29.
25. Pallesen J, Wang S, Corbett KS, Wrapp D, Kirchdoerfe RN. Immunogenicity and structures of a rationally designed prefusion MERSCoV spike antigen. Proc Natl Acad Sci USA. 2017;114:E7348-E57.
26. Song W, Gui M, Wang X, Xiang Y. Cryo-EM structure of the SARS coronavirus spike glycoprotein in complex with its host cell receptor ACE2. PLoS Pathog 2018;14:e1007236.
27. Walls AC, Tortorici MA, Snijder J, Xiong X, Bosch B-J, Rey FA, et al. Tectonic conformational changes of a coronavirus spike glycoprotein promote membrane fusion. PNAS. 2017;114:11157-62.
28. Yuan Y, Cao D, Zhang Y, Ma J, Qi J, Wang Q, et al. Cryo-EM structures of MERS-CoV and SARS-CoV spike glycoproteins reveal the dynamic receptor binding domains. Nat Commun. 2017;8:1509.
29. Zhou P, Yang XL, Wang XG, Hu B, Zhang L, Zhang W, et al. A pneumonia outbreak associated with a new coronavirus of probable bat origin. Nature. 2020;579:270–3.
30. Lohrasbi-Nejad A. Detection of homologous recombination events in SARS-CoV-2. Biotechnol Lett. 2021;Unpublished.
31. Phillips JC, Rosemary B, Wei W, James G, Emad T, Elizabeth V, et al. Scalable molecular dynamics with NAMD. J Comput Chem. 2010;26:1781-802.
32. Darden T, York D, Pedersen L. Particle mesh Ewald: An N·log(N) method for Ewald sums in large systems. J Chem Phys. 1993;98:10089-92.
33. Benkert P, Biasini M, Schwede T. Toward the estimation of the absolute quality of individual protein structure models. Bioinformatics. 2011;27:343-50.
34. Zhang S, Qiao S, Yu J, Zeng J, Shan S, Tian L, et al. Bat and pangolin coronavirus spike glycoprotein structures provide insights into SARS-CoV-2 evolution. Nat Commun. 2021;12:1607.
35. Garushyants SK, Rogozin IB, Koonin EV. Insertions in SARS-CoV-2 genome caused by template switch and duplications give rise to new variants of potential concern. bioRxiv. 2021;23:441209.
36. Toelzer C, Gupta K, Yadav SKN, Borucu U, Davidson AD, Williamson MK, et al. Free fatty acid binding pocket in the locked structure of SARS-CoV-2 spike protein. Science. 2020;370:725-30.
37. Li F. Receptor recognition and cross-species infections of SARS coronavirus. Antivir Res. 2013;100:246-54.
38. Lu G, Wang Q, Gao GF. Bat-to-human: spike features determining 'host jump' of coronaviruses SARS-CoV MERS-CoV and beyond. Trends Microbiol. 2015;23:468-78.
39. Henderson R, Edwards RJ, Mansouri K, Janowska K, Stalls V, Gobeil SMC, et al. Controlling the SARS-CoV-2 spike glycoprotein conformation. Nat Struct Mol Biol. 2020;27:925-33.