**آنالیز فیلوژنتیک (Phylogenetics)** شاخهای از بیوانفورماتیک و زیستشناسی تکاملی است که به **بررسی روابط تکاملی** بین موجودات زنده، ژنها یا پروتئینها میپردازد. هدف اصلی، ساخت **درخت فیلوژنتیک** (شجرهنامه تکاملی) است که نشان میدهد اجزای مورد مطالعه چگونه از یک نیای مشترک تکامل یافتهاند.
---
🔴 مراحل انجام آنالیز فیلوژنتیک**
1. **انتخاب توالیها**
- جمعآوری توالیهای **همولوگ** (مثلاً ژن 16S rRNA برای باکتریها یا ژن Cytochrome c در جانوران).
- استفاده از پایگاههایی مثل **GenBank**, **UniProt**, یا **Ensembl**.
2. **همترازی توالیها (Alignment)**
- ابزارها: **Clustal Omega**, **MAFFT**, **MUSCLE**.
- هدف: ایجاد یک ماتریس همترازی برای شناسایی **نواحی حفاظتشده** و **نواحی متغیر**.
3. **انتخاب مدل تکاملی**
- تعیین مدلی که بهترین توصیفکنندهٔ تکامل توالیها باشد (مثلاً `Jukes-Cantor`، `Kimura 2-parameter`، یا `GTR`).
- ابزار: **ModelTest-NG** یا **jModelTest**.
4. **ساخت درخت فیلوژنتیک**
- روشهای رایج:
- **فاصلهای (Distance-based)**: مثل **Neighbor-Joining (NJ)** (سریع و ساده).
- **حداکثر صرفهجویی (Maximum Parsimony)**: کمینهسازی تعداد جهشها.
- **حداکثر درستنمایی (Maximum Likelihood - ML)**: محاسبه احتمال تکامل توالیها تحت یک مدل.
- **استنتاج بیزی (Bayesian Inference)**: استفاده از توزیعهای احتمالی (ابزار: **MrBayes**).
5. **اعتبارسنجی درخت**
- **مقدار Bootstrap**: درصد تکرارهایی که گرههای درخت در آن ظاهر میشوند (مثلاً ≥70% قابل اعتماد است).
- **Probability Posterior** در روش بیزی (مثلاً ≥0.95).
6. **تجسم و تفسیر درخت**
- ابزارهای ترسیم: **FigTree**, **iTOL**, **MEGA**.
- شناسایی **خوشههای تکاملی (Clades)**، **نیای مشترک** و **نرخ واگرایی**.
---
🔴 کاربردهای کلیدی در زیستشناسی**
- **ردیابی منشأ بیماریها**: مثلاً تحلیل تکامل ویروس SARS-CoV-2 در پاندمی کووید-۱۹.
- **شناسایی گونههای جدید**: مقایسه توالیهای DNA برای تعیین موقعیت گونههای ناشناخته.
- **تحلیل روابط میزبان-پاتوژن**: مثلاً بررسی همتکاملی (co-evolution) بین میزبان و انگل.
- **مهندسی پروتئین**: شناسایی پروتئینهای همولوگ با عملکرد بهبودیافته برای بیوتکنولوژی.
---
🔴 مثال عملی**
فرض کنید توالی یک **ژن ناشناخته** از یک باکتری را دارید و میخواهید بدانید:
- آیا این ژن به یک خانوادهٔ آنزیمی شناخته شده تعلق دارد؟
- نزدیکترین خویشاوند تکاملی آن چیست؟
مرحله | اقدام | ابزار |
---|---|---|
۱. جستجوی همولوگها | BLAST علیه پایگاههای داده | NCBI BLAST |
۲. همترازی | همترازی توالیهای همولوگ | Clustal Omega |
۳. ساخت درخت | اجرای آنالیز ML با مدل بهینه | MEGA یا RAxML |
۴. اعتبارسنجی | محاسبه Bootstrap (1000 تکرار) | درون نرمافزار MEGA |
۵. تفسیر | شناسایی clade حاوی ژنهای آنزیمی | FigTree |
✅ نتیجه: اگر ژن شما در یک clade با **آنزیمهای تجزیهکنندهٔ نفت** قرار گیرد، احتمالاً در پاکسازی آلودگیهای نفتی نقش دارد!
---
🔴 چالشهای رایج**
- **توالیهای ناهمگن**: اگر توالیها طول متفاوت یا ناهمگونی داشته باشند، همترازی اشتباه میشود.
- **انتخاب مدل نادرست**: منجر به درخت نادرست میگردد.
- **Long Branch Attraction**: خطای رایج در روشهای پارسیمونی که باعث نزدیکنمایی غیرواقعی توالیهای با جهشهای سریع میشود.
---
🔴 منابع یادگیری**
- **کتاب**:
- *"Phylogenetic Trees Made Easy"* (Barry G. Hall).
- **دورههای آنلاین**:
- [Coursera: Bioinformatics Specialization (UCSD)](https://www.coursera.org/specializations/bioinformatics)
- [EMBL-EBI: Phylogenetics](https://www.ebi.ac.uk/training/online/courses/).
- **نرمافزارهای آموزشی**:
- **MEGA** (رایگان و کاربرپسند).
🔴 مقایسه MEGA با ابزارهای NCBI در فیلوژنتیک
ویژگی | NCBI | MEGA |
---|---|---|
نوع ابزار | تحت وب (آنلاین) | نرمافزار دسکتاپ (آفلاین) |
تحلیلهای پیشرفته | محدود (مثلاً فقط NJ ساده) | ✅ جامع (ML, Bayesian, پارامترهای آماری) |
انتخاب مدل تکاملی | ❌ عدم پشتیبانی | ✅ پشتیبانی کامل (AIC/BIC) |
اعتبارسنجی درخت | ❌ Bootstrap ساده (غیرقابل تنظیم) | ✅ Bootstrap با تکرارهای دلخواه (۱۰۰۰+ بار) |
دادههای حجیم | ❌ محدودیت حجم/تعداد توالی | ✅ پردازش بهتر (تا ۵۰۰ توالی) |
آنالیزهای تکمیلی | ❌ فقط نمایش درخت | ✅ زمان واگرایی، فشار انتخابی، آنالیز شبکه |
تفسیر و ویرایش | ❌ غیرقابل ویرایش | ✅ ویرایش کامل درخت + افزودن آنوتهها |
نیاز به اینترنت | ✅ ضروری | ❌ اجرای آفلاین |