اعمال مدلهای رگرسیون بر زیرمجموعههای با همبستگی بالا برای بهبود جایگذاری مقادیر جاافتاده عددی
(ندگان)پدیدآور
سفیدیان, امیرمسعوددانشپور, نگیننوع مدرک
Textزبان مدرک
فارسیچکیده
حضور مقادیر جاافتاده در دادههای دنیای واقعی مشکلی بسیار رایج و غیرقابلاجتناب است. بنابراین لازم است تا پیش از عملیات اکتشاف دانش، این مقادیر جاافتاده بهطور دقیق پُر شوند. در این مقاله، سه رویکرد جدید برای تخمین مقادیر جاافتاده عددی پیشنهاد میشود. در تمامی روشهای پیشنهادی، مدلهای رگرسیون بر زیرمجموعههایی با همبستگی بالا اعمال میشوند. در انتخاب زیرمجموعههای مطلوب سعی میشود تا همبستگی بین صفت جاافتاده و دیگر صفات حداکثر شود. انتخاب این زیرمجموعهها با استفاده از رویکردهایی مبتنی بر انتخاب روبهجلو انجام میشود. از معیار ضریب همبستگی برای اندازهگیری میزان ارتباط بین صفات استفادهشده است. همچنین در روشهای پیشنهادی، ترتیب صفات جاافتاده برای انجام عمل جایگذاری اولویتدهی میشوند. عملکرد رویکردهای پیشنهادشده بر روی پنج مجموعهداده از دنیای واقعی با مقادیر مختلف جاافتادگی ارزیابیشده است. عملکرد رویکردهای ارائهشده با پنج رویکرد جایگذاری با مقدار میانگین، جایگذاری با استفاده از نزدیکترین همسایگان، روش جایگذاری با خوشهبندی c-means فازی، روش جایگذاری با درخت تصمیم و روشی مبتنی بر رگرسیون به نام «الگوریتم جایگذاری با رگرسیون افزایشیِ صفات» (IARI) مقایسه شده است. از دو معیار شناختهشدهی ریشه میانگین مربعات خطا و ضریب تعیین برای مقایسه عملکرد رویکردهای پیشنهادی با دیگر روشهای جایگذاری استفادهشده است. نتایج آزمایشها نشان میدهد که رویکردهای ارائهشده، حتی زمانی که درصد جاافتادگی بالا است، بهتر از دیگر روشهای مقایسه شده عمل میکنند.
کلید واژگان
جایگذاری مقادیر جاافتادههمبستگی
رگرسیون
شماره نشریه
3تاریخ نشر
2018-11-221397-09-01
ناشر
رئیس دانشکده مهندسی برق و کامپیوترFaculty of Electrical & Computer Engineering
سازمان پدید آورنده
دانشکده مهندسی کامپیوتر - دانشگاه تربیت دبیر شهید رجایی - تهراندانشکده مهندسی کامپیوتر - دانشگاه تربیت دبیر شهید رجایی - تهران
شاپا
2008-77992538-3051




