مقایسهی دو رهیافت برای برخورد با متغیرهای کمکی گمشده در رگرسیون لوژستیک
(ندگان)پدیدآور
گلچی, شیرینمهندسی, سانازنوع مدرک
Textپژوهشي
زبان مدرک
فارسیچکیده
در طول 2۵ سال گذشته پیشرفتهای روششناسانهای در زمینهی تیمار دادههای گمشده صورت گرفته است. بیشتر مطالعههای انتشاریافته روی دادههای گمشده در متغیرهای وابسته تحت شرایط گوناگون تمرکز داشتهاند. مطالعهی حاضر در پی آن است که این خلأ را با مقایسهی دو رهیافت برای برخورد با دادههای گمشده در متغیرهای کمکی رستهای در رگرسیون لوژستیک پر کند: روش امید ریاضی- ماکسیممسازی (EM) وزنها و جانهی چندگانه (MI). دادههای نمونه بهصورت تصادفی از جامعهای با مشخصههای معلوم انتخاب شدهاند. دادههای گمشدهی مربوط به متغیرهای کمکی تحت دو حالت شبیهسازی شدهاند: گمشدهی کاملاً تصادفی و گمشدهی تصادفی با نرخهای گمشدگی متفاوت. یک مدل رگرسیونی لوژستیک با استفاده از یکی از دو رهیافت EM یا MI بر هر نمونه برازش داده شده است. عملکرد این دو رهیافت با چهار معیار مورد مقایسه قرار گرفته است. اریبی، کارایی، پوشش و نرخ عدم پذیرش. نتیجهها بهطور کلی MI را بر EM ترجیح میدادند. مسائل عملی از جمله اجرا، گنجاندن متغیرهای کمکی پیوسته و اثر متقابل بین متغیرهای کمکی مورد بحث قرار گرفتهاند.
کلید واژگان
رگرسیون لوژستیکدادههای گمشده
متغیرهای کمکی رستهای گمشده
روش وزنها
جانهی چندگانه
الگوریتم EM
عمومى
شماره نشریه
1تاریخ نشر
2010-09-011389-06-10
ناشر
مرکز آمار ایرانشاپا
2008-521410




