E-value و Bit Score:
آموزش تفاوت بینE-value
(احتمال تصادفی بودن همترازی) وBit Score
(کیفیت همترازی).- مثال:
E-value < 0.001
معمولاً معنادار است.
- مثال:
- Identity و Coverage:
- درصد تشابه توالی (
Identity
) و پوشش توالی (Coverage
) را بررسی کنید. - مثال: اگر
Coverage < 50%
باشد، حتی باIdentity
بالا، نتیجه ممکن است ناقص باشد.
- درصد تشابه توالی (
۱. Bit Score: کیفیت ذاتی همترازی
مفهوم:
- Bit Score نشاندهنده کیفیت خود همترازی است، فارغ از اندازه پایگاه داده.
- هرچه بالاتر باشد، همترازی دو توالی بهتر است.
محاسبه:
- بر اساس طول همترازی، تعداد تطابقها و تفاوتها (با استفاده از ماتریس امتیازدهی مثل BLOSUM62).
- فرمول ساده:
مثال عملی:
- همترازی با
Bit Score = 50
→ خوب همترازی با
Bit Score = 10
→ ضعیف۲. E-value: احتمال تصادفی بودن همترازی
مفهوم:
- E-value میپرسد: "اگر همین جستجو را در یک پایگاه داده تصادفی انجام دهیم، چند همترازی با این کیفیت یا بهتر بهصورت شانسی رخ میدهد؟"
- هرچه کوچکتر باشد، همترازی معنادارتر است.
- E-value = تعداد همترازیهای تصادفی مورد انتظار
= m × n × e^(-λ × S) مثال عملی:
E-value = 1e-30
→ بسیار معنادار (۱ همترازی تصادفی در هر ۱۰^۳۰ جستجو!)E-value = 10
→ غیرمعنادار (احتمالاً تصادفی).۳. تفاوتهای کلیدی در یک نگاه
معیار Bit Score E-value نوع اطلاعات کیفیت ذاتی همترازی احتمال آماری تصادفی بودن وابستگی مستقل از حجم پایگاه داده وابسته به حجم پایگاه داده مقدار مطلوب هرچه بالاتر بهتر هرچه پایینتر بهتر حساسیت به ماتریس امتیازدهی حساس است به حجم دیتابیس حساس است
فرض کنید دو نتیجه BLAST داریم:
- نتیجه الف:
Bit Score = 250
,E-value = 0.001
- نتیجه ب:
Bit Score = 40
,E-value = 1e-20
تحلیل:
- نتیجه الف:
- Bit Score بالا → همترازی با کیفیت خوب.
- E-value ضعیفتر → ممکن است در دیتابیسهای بزرگتر معنادار نباشد.
- نتیجه ب:
- Bit Score پایین → همترازی کوتاه یا پراشتباه.
- E-value عالی → احتمال تصادفی بودن تقریباً صفر است!
نتیجهگیری:
✅ نتیجه ب قابل اعتمادتر است! چون E-value بسیار قویتر است.
❌ نتیجه الف ممکن است در دیتابیسهای بزرگ (مثل nr) اعتبار کمتری داشته باشد.
۵. خطای رایج: تکیهی صرف به E-value
- اگر حجم دیتابیس ۱۰ برابر شود، E-value نیز ۱۰ برابر میشود!
- مثال:
- همترازی با
E-value = 0.001
در دیتابیس کوچک → خوب به نظر میرسد. - همین همترازی در دیتابیس بزرگتر میشود
E-value = 0.01
→ ممکن است غیرمعنادار شود!
- همترازی با
- راه حل: همیشه Bit Score را هم چک کنید چون به حجم دیتابیس وابسته نیست.
۶. قانون طلایی تفسیر BLAST
۱. اول E-value را ببینید:
E-value < 0.001
→ معمولاً معنادار است.E-value > 10
→ معمولاً تصادفی است.
۲. سپس Bit Score را بررسی کنید:- اگر
Bit Score > 50
→ همترازی قابل اعتماد است. - اگر
Bit Score < 40
→ حتی با E-value خوب، ممکن است همترازی کوتاه باشد.
۳. Coverage و Identity را فراموش نکنید!