مقایسه الگوریتمهای برپایه یادگیری ماشین بر دقت تخمین دادههای گمشده حاصل از آزمایشهای ریزآرایه
(ندگان)پدیدآور
مشیری, مریمقادری زفره ای, مصطفیقانع گلمحمدی, فرزاننوع مدرک
Textمقاله پژوهشی
زبان مدرک
فارسیچکیده
وجود دادههای گمشده در دادههای ریزآرایه، سبب کاهش دقت رسم شبکههای تنظیمی ژن، ایجاد اشتباه در خوشه بندی و تقسیمبندی تخصصی ژنها و سایر تحلیلها میشود. بنابراین تخمین داده-های گمشده مرحله مهمی در پیش پردازش دادههای ریزآرایه، محسوب میشود. عملکرد الگوریتم-های تخمین در مجموعه دادههای مختلف و با درصدهای متفاوت گمشدگی، متغیر است. همواره انتخاب مناسبترین الگوریتم به منظور دستیابی به بیشترین دقت در محاسبات دادههای گمشده از اهمیت خاصی برخوردار است. در این مطالعه از سه مجموعه داده آزمایشهای ریزآرایه استفاده شد. پس از مشخص کردن ابعاد ماتریس بیانی و نرمال کردن دادهها، درصدهای مختلفی از گمشدگی، بر مجموعه دادههای مورد مطالعه اعمال شد. سپس نتایج حاصل با استفاده از 11 الگوریتم بر پایه یادگیری ماشین، به منظور بررسی میزان دقت هر یک از الگوریتمها در تعیین میزان درصد گمشدگی، مورد مقایسه قرار گرفت. بر اساس نتایج، دقت الگوریتمهای مختلف به مجموعه داده به کار رفته، درصد گمشدگی و توزیع گمشدگی دادهها وابسته است. همچنین تعداد نمونههای آزمایشی موجود در مجموعه دادهها نیز می تواند بر دقت الگوریتمهای تخمین دادههای گمشده موثر باشد. نتایج بیانگر کاهش دقت تمامی الگوریتمها با افزایش درصد دادههای گمشده بود، اما الگوریتمهای Least Square Adaptive و Local least square دقت بیشتری در مقابل افزایش درصد گمشدگی دادهها نسبت به سایر الگوریتمها نشان دادند.
کلید واژگان
الگوریتمهای بر پایه یادگیری ماشینتخمین دادههای گمشده
ریزآرایه
بیوانفورماتیک
شماره نشریه
4تاریخ نشر
2016-02-201394-12-01
ناشر
انجمن زیست شناسی ایرانIranina Biology Society
سازمان پدید آورنده
دانش آموخته کارشناسی ارشد اصلاح نژاد دام، گروه علوم دامی، دانشکده کشاورزی، دانشگاه فردوسی مشهد، ایراناستادیار گروه علوم دامی، دانشکده کشاورزی، دانشگاه یاسوج، ایران
دانش آموخته کارشناسی ارشد بیوتکنولوژی کشاورزی، گروه زیستشناسی سیستمها، پژوهشکده بیوتکنولوژی کشاورزی ایران، کرج، ایران
شاپا
2383-27382383-2746




