| dc.contributor.author | غفوری, تارا | fa_IR |
| dc.contributor.author | معنویزاده, نگین | fa_IR |
| dc.date.accessioned | 1401-09-20T19:43:22Z | fa_IR |
| dc.date.accessioned | 2022-12-11T19:43:23Z | |
| dc.date.available | 1401-09-20T19:43:22Z | fa_IR |
| dc.date.available | 2022-12-11T19:43:23Z | |
| dc.date.issued | 2022-10-01 | en_US |
| dc.date.issued | 1401-07-09 | fa_IR |
| dc.identifier.citation | غفوری, تارا, معنویزاده, نگین. (1401). مدلسازی و طراحی الگوریتم تشخیص و غربالگری بیماری مبتنی بر دستهبندی
ماشین بردار پشتیبان خطی با قابلیت انتخاب ویژگی ترکیبی. مجله دانشکده پزشکی، دانشگاه علوم پزشکی تهران, 80(7), 546-562. | fa_IR |
| dc.identifier.issn | 1683-1764 | |
| dc.identifier.issn | 1735-7322 | |
| dc.identifier.uri | http://tumj.tums.ac.ir/article-1-11963-other.html | |
| dc.identifier.uri | https://iranjournals.nlai.ir/handle/123456789/932455 | |
| dc.description.abstract | زمینه و هدف: در مطالعه حاضر، یک رویکرد انتخاب ویژگی ترکیبی از روشهای فیلتر و بستهبندی، با هدف تشخیص وضعیت بیماری و بقای بیمار، برای تعدادی از مجموعه دادگان علوم زیستی با تعداد متفاوت نمونه، ویژگی و کلاس پیادهسازی میشود؛ بنابراین، این راهبرد از مزایای هر دو روش، شامل سرعت عملکرد، تعمیمپذیری و دقت بالا بهره میبرد.
روش بررسی: الگوریتمهای انتخاب ویژگی در چارچوب بازشناسی آماری الگو در نرمافزار Matlab R2021a طی فروردین و اردیبهشت 1401 مدلسازی شدهاند. ابتدا ویژگیها بر پایه اطلاعات متقابل بهنجار شده رتبهبندی میشوند و یک زیرمجموعه ویژگی بهینه با بالاترین دقت دستهبند انتخاب میشود. پس از خوشهبندی مجموعه داده بهروش Mini Batch K-means و استخراج ویژگیهای رتبهبندیشده، الگوریتمهای شمول و خروج ویژگی به مجموعه دادگان اعمال میشوند.
یافتهها: رویکردهای انتخاب ویژگی پیشنهادی برای مجموعه دادگان زیستشناسی مولکولی، ویروس هپاتیت C و باکتری E.coli، امتیاز صحت و فراخوانی بالای 98% را نتیجه میدهند، که به معنای حضور تعداد بسیار کم موارد مثبت کاذب و منفی کاذب در دستهبندی با ماشین بردار پشتیبان خطی است. برای مجموعه داده ویروس هپاتیت C، با انتخاب 9 ویژگی مرتبط از 13 ویژگی موجود با روش خروج ویژگی، دقت دستهبندی 92/98% و امتیاز F1 02/%99 بهدست میآید. رویکرد شمول ویژگی نیز با یک اختلاف جزیی، دقت 78/98% را نتیجه میدهد.
نتیجهگیری: نتایج حاصل نشاندهنده توانمندی رویکردهای انتخاب ویژگی بهکار رفته برای مجموعه دادگان علوم زیستی با ابعاد بالای ویژگی همچون مجموعه داده بیان پروتیین میباشد. قابلیت تعمیمپذیری به سایر دستهبندها و تعیین خودکار تعداد ویژگیهای بهینه در طول فرآیند انتخاب ویژگی، این رویکردها را در بسیاری از کاربردهای دادهکاوی برای علوم زیستی انعطافپذیر میسازد.
| fa_IR |
| dc.format.extent | 1602 | |
| dc.format.mimetype | application/pdf | |
| dc.language | فارسی | |
| dc.language.iso | fa_IR | |
| dc.publisher | دانشگاه علوم پزشکی تهران | fa_IR |
| dc.relation.ispartof | مجله دانشکده پزشکی، دانشگاه علوم پزشکی تهران | fa_IR |
| dc.relation.ispartof | Tehran University Medical Journal | en_US |
| dc.subject | انتخاب ویژگی ترکیبی | fa_IR |
| dc.subject | پایگاه داده زیستی | fa_IR |
| dc.subject | دستهبند ماشین بردار پشتیبان خطی | fa_IR |
| dc.subject | خوشهبندی k- میانگین مینیبَچ | fa_IR |
| dc.subject | اطلاعات متقابل بهنجارشده. | fa_IR |
| dc.subject | غدد درون ریز و متابولیسم | fa_IR |
| dc.title | مدلسازی و طراحی الگوریتم تشخیص و غربالگری بیماری مبتنی بر دستهبندی
ماشین بردار پشتیبان خطی با قابلیت انتخاب ویژگی ترکیبی | fa_IR |
| dc.type | Text | en_US |
| dc.type | مقاله اصیل | fa_IR |
| dc.contributor.department | گروه مهندسی برق و الکترونیک، آزمایشگاه ادوات نانوساختار الکترونیکی، دانشکده مهندسی برق، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران. | fa_IR |
| dc.contributor.department | گروه مهندسی برق و الکترونیک، آزمایشگاه ادوات نانوساختار الکترونیکی، دانشکده مهندسی برق، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران. | fa_IR |
| dc.citation.volume | 80 | |
| dc.citation.issue | 7 | |
| dc.citation.spage | 546 | |
| dc.citation.epage | 562 | |