دادهکاوی و استقرار دادگان اصطلاحنامه چندزبانه فرهنگی ایران (اصفا) در چهارچوب کریسپ
(ندگان)پدیدآور
اکبری داریان, سعیدهنوع مدرک
Textمقاله پژوهشی
زبان مدرک
فارسیچکیده
هدف: نظام ساده سازماندهی دانش (اسکاس) یک مدل دادهای رایج برای بهاشتراکگذاری و پیونددهی نظامهای سازماندهی دانش از طریق وب است. اسکاس، مسیر مهاجرت استاندارد و کمهزینه را برای انتقال نظامهای سازمان دانش موجود به وب معنایی ارائه میدهد. پیوستن اصفا به جریان وب معنایی نیازمند تبدیل و استقرار دادگان اصفا براساس اسکاس در قالب گراف آر.دی.اف. است. به این منظور باید رکوردهای مبتنی بر مارک ایران مهندسی مجدد شوند. هدف پژوهش حاضر، مهندسی مجدد دادگان اصفا با دادهکاوی آنها در چهارچوب کریسپ و استقرار آنها بر روی پلتفرم اسکاسموس است.روش: این پژوهش از نوع توسعهای – کاربردی است و از روششناسی کریسپ-دی.ام.، از نوع بدون نظارت و خوشهبندی سلسلهمراتبی برای دادهکاوی استفاده شده است. در مرحله اول درک کسب و کار، هدف اصلی تبدیل دادگان اصفا به مدل دادهای اسکاس در قالب گراف آر.دی. اف. تعیین شد. در مرحله درک داده، دادههای میراثی اصفا شامل 11006 رکورد ذخیره شده در قالب مارک ایران و شامل 18 حوزه، آموزش و پرورش، ادبیات، ارتباطات، اقتصاد، تاریخ، تصوف و عرفان، جامعهشناسی، جغرافیا، حقوق، روانشناسی، زبانشناسی، دین، علوم سیاسی، فلسفه، فناوری و علوم تجربی، کتابداری و اطلاعرسانی، مدیریت و فرهنگ و هنر است. در مرحله سوم-آمادهسازی داده- دادههای مفقود و پرت شناسایی و ویرایش شد. برای انتخاب ویژگیها در لایه پیشپردازش مهندسی داده، عناصر ضروری برای تبدیل به اسکاس شناسایی و جدول انطباق آنها با فیلدهای مارک ایران تدوین گردید. در مرحله مدلسازی، مقادیر ویژگی هدف با تکنیک خوشهبندی سلسلهمراتبی و با استفاده از ماکروکد در اکسل تولید شد. ارزیابی مدل با تکنیک بررسی بصری و روش نمونهگیری تصادفی مورد تایید قرار گرفت. در مرحله ششم تبدیل دادههای مارک ایران به اسکاس در قالب گراف آر.دی.اف. با استفاده از ابزار اسکاسپلی انجام و دادهها به بستر پلتفرم ووکبنچ انتقال یافت. با استفاده از قالب تورتل، دادگان اصفا در پلتفرم اسکاسموس مستقر شد.یافتهها: یافته اصلی پژوهش، استقرار و توسعه دادگان اسکاس اصفا در پلتفرم منبع باز اسکاسموس به نشانی skosmos.nlai.ir است. مجموع رکوردها پس از ایجاد رکوردهای مربوط به حوزه و مجموعه برای خوشهبندی به 11880 رکورد افزایش یافت. در مرحله آمادهسازی داده یکی از یافتههای مهم، تدوین جدول انطباق بین عناصر هسته اسکاس و فیلدهای مارک ایران بود.
نتیجهگیری: در این پژوهش با بهرهگیری از علم داده، روش نوآورانهای برای دادهکاوی دادگان اصطلاحنامهای بهکار رفت. روششناسیهای بهکار رفته در ادبیات این پژوهش تنها در دو مرحله آمادهسازی و استقرار و توسعه از شش مرحله بهکار رفته در این پژوهش جا گرفتند.
کلید واژگان
دادهکاویاسکاس
مارک ایران
گراف آر.دی.اف. مهندسی مجدد
اسکاسموس
اصطلاحنامه اصفا
شماره نشریه
1تاریخ نشر
2023-03-211402-01-01
ناشر
سازمان اسناد و کتابخانه ملی جمهوری اسلامی ایرانNational Library and Archives of Islamic Republic of Iran
سازمان پدید آورنده
استادیار سازمان اسناد و کتابخانه ملی ایرانشاپا
2252-05032383-322X




