مروری بر دشواریهای زبان فارسی در محیط دیجیتال و تاثیرات آنها بر اثر بخشی پردازش خودکار متن و بازیابی اطلاعات
(ندگان)پدیدآور
ستوده, هاجرهنرجویان, زهرهنوع مدرک
Textمقاله پژوهشی
زبان مدرک
فارسیچکیده
هدفهای پژوهش: زبان فارسی، به سبب ویژگیهای خاصّ آن و در عین حال نهادینه نشدن سبک نگارش استاندارد، در رویارویی با محیطهای الکترونیکی، با دشواریهایی روبهروست که تأثیری بسزا بر اثربخشی بازیابی اطلاعات میگذارد. پژوهش حاضر میکوشد تا با بررسی متون و پیشینههای موجود، چالشهای نگارش فارسی، تأثیر آنها بر اثربخشی بازیابی اطلاعات، و پیشنهادهای ارائه شده در جهت رفع این دشواریها را مورد بحث و بررسی قرار دهد.اهمیت پژوهش: با تحلیل و مرور جامع متونی که دربارة چالشهای نگارش فارسی در محیطهای دیجیتال نگارش یافته است، میتوان دانشی را که تاکنون در این باره گرد آمده است به تصویر کشید و کاستیها و پیشرفتهای به دست آمده در این زمینه را آشکار ساخت.روش پژوهش: روش پژوهش حاضر، متنپژوهی با رویکرد تحلیل محتواست که از روشهای پژوهش کیفی به شمار میآید. «پاراگراف»، «جمله» و «کلمه» به عنوان واحد تحلیل انتخاب شد، زیرا ممکن بود هر دشواری یا راهکار تنها در یک کلمه یا عبارت مورد اشاره قرار گرفته یا در جمله یا پاراگراف شرح داده شده باشد.یافتهها: آثار مورد بررسی، بیش از ٤٠ دشواری نگارشی را در رابطه با جستجو و بازیابی اطلاعات فارسی ذکر کردهاند. این گونهگونی نگارشی به نایکدستی و تطور بسیار در نگارش فارسی میانجامد که میتواند اثربخشی بازیابی را بویژه از منظر کاهش دقت یا ریزش کاذب و نیز کاهش جامعیت بازیابی، متأثر سازد. در نتیجه، ضروری است در طراحی الگوریتمهای سامانههای جستجو و بازیابی فارسی، بههنجارسازی تنوعات و چنددستیهای نگارشی و دستوری مد نظر قرار گیرد. تدوین استاندارد نگارش فارسی، استفاده از سیاهههای از پیش تعیین شده، تجهیز پایگاه اطلاعاتی به اصطلاحنامه و فرهنگهای املایی، و تدوین دستنامه یا راهنمای جستجو، از جمله راهکارهای ارائه شده است. این راهکارها با وجود جامع نبودن، کم و بیش اثربخش به نظر میرسند.نتیجهگیری: از آنجا که راهکارهای انسانی، نیازمند مشارکت فعّالانه و آموزش نویسندگان متون (تایپیستها و کاربران) است و از روندی بلندمدت و هزینهبر برخوردار است، حرکت به سوی راهکارهای خودکارسازی پردازش متن و نمایهسازی، ضروری است.
کلید واژگان
زبان فارسیبازیابی اطلاعات
نگارش
املا
شماره نشریه
460تاریخ نشر
2012-12-211391-10-01
ناشر
سازمان کتابخانهها، موزهها و مرکز اسناد آستان قدس رضویCentral Library of Astan Quds Razavi
سازمان پدید آورنده
دانشیار گروه علم اطلاعات ودانش شناسیدانشگاه شیرازدانشجوی دوره کارشناسی ارشد
شاپا
1680-96372676-5977




