رایان زیست آریا

رایان زیست آریا یک **تیم پویا و نوآور** متشکل از دانشجویان و فارغ‌التحصیلان رشته‌های بیولوژی، ژنتیک، بیوانفورماتیک و علوم کامپیوتر است

تفسیر نتایج BLAST

رایان زیست آریا
10:29 1404/3/13
34
0 0

  • E-value و Bit Score:

  • آموزش تفاوت بین E-value (احتمال تصادفی بودن همترازی) و Bit Score (کیفیت همترازی).
    • مثال: E-value < 0.001 معمولاً معنادار است.
  • Identity و Coverage:
    • درصد تشابه توالی (Identity) و پوشش توالی (Coverage) را بررسی کنید.
    • مثال: اگر Coverage < 50% باشد، حتی با Identity بالا، نتیجه ممکن است ناقص باشد.

 

۱. Bit Score: کیفیت ذاتی همترازی

مفهوم:

  • Bit Score نشان‌دهنده کیفیت خود همترازی است، فارغ از اندازه پایگاه داده.
  • هرچه بالاتر باشد، همترازی دو توالی بهتر است.

محاسبه:

  • بر اساس طول همترازی، تعداد تطابق‌ها و تفاوت‌ها (با استفاده از ماتریس امتیازدهی مثل BLOSUM62).
  • فرمول ساده:
  • مثال عملی:

  • همترازی با Bit Score = 50 → خوب
  • همترازی با Bit Score = 10 → ضعیف

    ۲. E-value: احتمال تصادفی بودن همترازی

  • مفهوم:

  • E-value می‌پرسد: "اگر همین جستجو را در یک پایگاه داده تصادفی انجام دهیم، چند همترازی با این کیفیت یا بهتر به‌صورت شانسی رخ می‌دهد؟"
  • هرچه کوچک‌تر باشد، همترازی معنادارتر است.
  • E-value = تعداد همترازی‌های تصادفی مورد انتظار  
            = m × n × e^(-λ × S)  
  • مثال عملی:

  • E-value = 1e-30 → بسیار معنادار (۱ همترازی تصادفی در هر ۱۰^۳۰ جستجو!)
  • E-value = 10 → غیرمعنادار (احتمالاً تصادفی).
  • ۳. تفاوت‌های کلیدی در یک نگاه

  • معیارBit ScoreE-value
    نوع اطلاعاتکیفیت ذاتی همترازیاحتمال آماری تصادفی بودن
    وابستگیمستقل از حجم پایگاه دادهوابسته به حجم پایگاه داده
    مقدار مطلوبهرچه بالاتر بهترهرچه پایین‌تر بهتر
    حساسیتبه ماتریس امتیازدهی حساس استبه حجم دیتابیس حساس است

 

فرض کنید دو نتیجه BLAST داریم:

  • نتیجه الف: Bit Score = 250, E-value = 0.001
  • نتیجه ب: Bit Score = 40, E-value = 1e-20
  •  

تحلیل:

  • نتیجه الف:
    • Bit Score بالا → همترازی با کیفیت خوب.
    • E-value ضعیف‌تر → ممکن است در دیتابیس‌های بزرگ‌تر معنادار نباشد.
  • نتیجه ب:
    • Bit Score پایین → همترازی کوتاه یا پراشتباه.
    • E-value عالی → احتمال تصادفی بودن تقریباً صفر است!

نتیجه‌گیری:

نتیجه ب قابل اعتمادتر است! چون E-value بسیار قوی‌تر است.
نتیجه الف ممکن است در دیتابیس‌های بزرگ (مثل nr) اعتبار کمتری داشته باشد.

۵. خطای رایج: تکیه‌ی صرف به E-value

  • اگر حجم دیتابیس ۱۰ برابر شود، E-value نیز ۱۰ برابر می‌شود!
  • مثال:
    • همترازی با E-value = 0.001 در دیتابیس کوچک → خوب به نظر می‌رسد.
    • همین همترازی در دیتابیس بزرگ‌تر می‌شود E-value = 0.01 → ممکن است غیرمعنادار شود!
  • راه حل: همیشه Bit Score را هم چک کنید چون به حجم دیتابیس وابسته نیست.

 

۶. قانون طلایی تفسیر BLAST

۱. اول E-value را ببینید:

  • E-value < 0.001 → معمولاً معنادار است.
  • E-value > 10 → معمولاً تصادفی است.
    ۲. سپس Bit Score را بررسی کنید:
  • اگر Bit Score > 50 → همترازی قابل اعتماد است.
  • اگر Bit Score < 40 → حتی با E-value خوب، ممکن است همترازی کوتاه باشد.
    ۳. Coverage و Identity را فراموش نکنید!
  •  

 

 

 

 

برچسب‌ها :

#bioinformatics   

#Blast analysis   

#تفسیر نتایج blast   

#identity   

#coverage   

آخرین مطالب

پربازدیدترین مطالب

محبوب‌ترین مطالب

جنجالی‌ترین مطالب

ابزار جستجو در وبلاگ بلاگیکس