استفاده از الگوريتم هاي دسته بندي و خوشه بندی براي پيش بيني تعداد قرص مصرفي: مورد کاوی بيماري ديابت
(ندگان)پدیدآور
مريم عاشوريوجيهه ناجي مقدمسميه عليزادهمهسا صفي
نوع مدرک
Textزبان مدرک
فارسیچکیده
مقدمه : امروزه با شيوع بيماري ديابت پيشبيني تعداد قرص مصرفي Glibenclamid و Metformin روزانه براي بيماران به پزشکان در جهت تشخيص تعداد قرص مصرفي بيمار و همچنين مهار عوارض شديد و خطرناک مصرف بيش از حد دارو کمک مينمايد، زيرا ميزان نياز بيماران ديابتي به دارو داراي اهميت بسيار ميباشد. از اينرو در پژوهش حاضر بهمنظور پيشبيني تعداد قرص مصرفي روزانهی بيماران ديابتي، از تکنیکهای دادهکاوی استفاده شد. در پایان الگوریتمی که نتیجهی بهتری در فرآیند ارزیابی بدست میدهد، با توجه به مجموعه دادههای تحت بررسی، انتخاب میشود. روش بررسي: مطالعهی حاضر به روش توصیفی- مقطعی صورت گرفت. نمونهگیری به روش سرشماری بود و تمامی بیماران (2783 بیمار) را در فاصلهی زمانی فروردین 87 تا خرداد 91 در برگرفت. جامعهی پژوهش متشکل از دادههاي مرکز تحقيقات ديابت يزد وابسته به دانشگاه علوم پزشکي شهيد صدوقي يزد بود و محتوای رکوردها مورد تایید مسؤولین مرکز دیابت قرار گرفت. در مرحلهی پیش پردازش دادهها، با نظر افراد خبره در مراکز تحقیقاتی رکوردهايي که مقادیر برخی فیلدهای آنها خالی بود، حذف شد و تعداد بیماران تحت بررسی به 740 مورد رسید. این یافتهها با مراجعهی مستقیم پژوهشگر به مرکز تحقيقات ديابت يزد حاصل شده و روایی روش جمعآوری اطلاعات توسط استاد راهنما و متخصصین امر مورد تایید قرار گرفت. با سنجش صحت مجموعه دادههای آزمون، میزان پایایی دو الگوریتم مورد استفاده نیز مقایسه شد. در این مطالعه جهت تحلیل دادهها و اجرای الگوریتمهای دادهکاوی از نرمافزار Clementine 12.0 استفاده شد. دو الگوريتم متفاوت از الگوريتمهاي استنتاج قانون به نامهاي C5.0 و CHAID روي دادهها اعمال گرديد و سپس صحت مدلهاي توليد شده بدست آمد. در نهايت برای تاييد صحت مدلهاي توليد شده از خوشهبندي استفاده گرديد. يافتهها: مقادیر بهدست آمده برای صحت مدلهای ایجاد شده از اجراي الگوريتمهاي C5.0 و CHAID روي مجموعه دادههای تحت بررسی 52/45 و 38/28 درصد بود. صحت بالای مدل C5.0 عملکرد بهتر این الگوریتم برای پیشبینی تعداد قرص مصرفی را نشان داد. از طرفی پایین بودن مقدار صحت این مدل نشاندهندهی این بود که برخی مقادیر بهطور صحیح در جای خود دستهبندی نشدهاند. بنابراین مقايسهي مقادير واقعي و مقادير پيشبيني شده براي تعداد قرص مصرفي در توليد مدل میتواند بیانگر علل کاهش صحت هر مدل باشد. علت کاهش صحت مدل به مقادير پيشبيني شدهاي وابسته بود که در مقايسه با مقادير واقعي صحت و ضريب اطمينان پاييني دارند. خوشهبندی نتايج بدست آمده از اجرای الگوریتم C5.0 تعداد قرص مصرفی 3، 5، 6 و 7 با صحت مقدار پیشبینی شدهی به ترتیب 83/46، 36/36، 71/55 و 15 درصد را در یک خوشه قرار داد، زیرا نمونه دادههايي که داراي صحت پاييني در پيشبيني تعداد قرص مصرفي بود و يا تعداد نمونه دادهي کمي داشت، در يک خوشه قرار گرفتند. همچنين خوشهبندی نتايج اجرای الگوریتم CHAID نیز تعداد قرص مصرفی 5 با صحت مقدار پیشبینی شدهی 93/20 را در یک خوشه قرار داد. نتيجهگيري: این مقاله حاصل پروژهی تحقیقاتی گروه دادهکاوی دانشگاه خواجه نصیر بود که در نهایت در قالب فعالیت گروهی تکمیل و بهصورت پژوهش حاضر درآمد. در مراكز تحقیقات دیابت وجود رويكرد سازماندهي شده جهت پیشبینی تعداد قرص مصرفی بیمار بهمنظور کمک به پزشک براي افزايش صحت تشخيص و جلوگيري ازعوارض جانبی ناشی از تشخيص نادرست در تعداد قرص خوراکي ضروري است. با توجه به لزوم استفاده از فنآوریهای رایانهای، اينترنت و نرمافزارهاي تحلیلی و بهمنظور مهار اثرات خطرناک بیماری، بهتر است اقدامات لازم جهت ابداع رويکردهای پیشنهادی با مشاورهي متخصصان مربوط انجام شود. واژههای کليدي: ديابت؛ درخت تصميم؛ دستهبندي؛ خوشهبندي؛ شاخص Dunn
کلید واژگان
ديابتدرخت تصميم
دستهبندي
خوشهبندي
شاخص Dunn
شماره نشریه
5تاریخ نشر
2013-10-071392-07-15
ناشر
دانشگاه علوم پزشکی اصفهانسازمان پدید آورنده
دانشجوي کارشناسي ارشد، مهندسي فنآوري اطلاعات تجارت الکترونيک، دانشگاه صنعتي خواجه نصيرالدين طوسي، تهران، ايراندانشجوي کارشناسي ارشد، مهندسي فنآوري اطلاعات تجارت الکترونيک، دانشگاه صنعتي خواجه نصيرالدين طوسي، تهران، ايران
استاديار، مهندسي صنايع، دانشگاه صنعتي خواجه نصيرالدين طوسي، تهران، ايران
دانشجوي کارشناسي ارشد، مهندسي صنايع، دانشگاه صنعتي خواجه نصيرالدين طوسي، تهران، ايران
شاپا
1735-78531735-9813



