• ثبت نام
    • ورود به سامانه
    مشاهده مورد 
    •   صفحهٔ اصلی
    • نشریات فارسی
    • پژوهش های زبان شناسی
    • دوره 10, شماره 2
    • مشاهده مورد
    •   صفحهٔ اصلی
    • نشریات فارسی
    • پژوهش های زبان شناسی
    • دوره 10, شماره 2
    • مشاهده مورد
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    استخراج خودکار جملات هم‌تراز انگلیسی-فارسی از متون مقایسه‌ای با بهره‌برداری از اطلاعات نحوی

    (ندگان)پدیدآور
    متولیان, رضوانمنجمی, امیرحسنقدس اللهی, ابراهیم
    Thumbnail
    دریافت مدرک مشاهده
    FullText
    اندازه فایل: 
    1.126 مگابایت
    نوع فايل (MIME): 
    PDF
    نوع مدرک
    Text
    مقاله علمی
    زبان مدرک
    فارسی
    نمایش کامل رکورد
    چکیده
    پیکره‌های موازی همواره از غنی‌ترین منابع در مباحث پردازش زبان طبیعی محسوب می‌شوند.  این نوع پیکره‌ها شامل متون ترجمه‌شدۀ دو یا چند زبان هستند که در سطوح مختلف کلمه، عبارت و یا جمله هم‌ترازشده‌اند. علیرغم کاربرد فراوان این نوع پیکره‌ها در مطالعات مختلف از جمله پژوهش­های زبانی، ترجمة ماشینی آماری و سامانه‌های خودکار بازیابی اطلاعات میان زبانی، متأسفانه همواره پژوهشگران با کمبود پیکره‌های موازی مواجه بوده‌اند. در این راستا، در پژوهش حاضر سعی شده است به‌منظور تولید پیکره موازی با بهره‌گیری از اطلاعات نحوی، روشی خودکار برای استخراج جملات هم‌ترازانگلیسی/فارسی از متون مقایسه‌ای ارائه شود. در این روش، با ساخت بردار ویژگی با بهره‌گیری از اطلاعات نحوی جملات، یک مدل هم‌ترازی آموزش داده می‌شود. دقت مدل هم‌ترازی،در بهترین حالت، به شکل عملیاتی روی داده‌های آزمون (208 عدد جفت جمله) 77% و روی داده‌های آموزشی (830 عدد جفت جمله) 7/97 % محاسبه شد. از آنجایی که حجم داده‌های طلایی بسیار کوچک بود روش n-fold cross validation در مورد تمام الگوریتم‌های آموزش مورد استفاده قرار گرفت. به‌منظور افزایش دقت، از یک الگوریتم جست‌وجوی شباهت لغوی جملات نیز استفاده شد که دقت را روی داده‌های آزمون از 77% به 18/85% افزایش داد. پژوهش حاضر، با به‌کارگیری مدل هم‌ترازی به‌دست‌آمده، به تولید ابزار هم‌ترازی دانشگاه اصفهان منجر شد، که می‌تواند به‌منظور خودکفایی در تولید پیکره‌های موازی مورداستفاده محققین حوزه پردازش زبان فارسی قرار گیرد.
    کلید واژگان
    استخراج خودکار
    جملات همتراز
    زبانشناسی پیکره‌ای
    پیکره مقایسه‌ای
    پیکره موازی

    شماره نشریه
    2
    تاریخ نشر
    2018-09-23
    1397-07-01
    ناشر
    دانشگاه اصفهان
    University of Isfahan
    سازمان پدید آورنده
    استادیار گروه زبانشناسی دانشگاه اصفهان
    دانشیار گروه کامپیوتر دانشگاه اصفهان
    کارشناسی ارشد زبانشناسی رایانشی دانشگاه اصفهان

    شاپا
    2008-6261
    2322-3413
    URI
    https://dx.doi.org/10.22108/jrl.2018.109525.1173
    http://jrl.ui.ac.ir/article_23141.html
    https://iranjournals.nlai.ir/handle/123456789/201062

    مرور

    همه جای سامانهپایگاه‌ها و مجموعه‌ها بر اساس تاریخ انتشارپدیدآورانعناوینموضوع‌‌هااین مجموعه بر اساس تاریخ انتشارپدیدآورانعناوینموضوع‌‌ها

    حساب من

    ورود به سامانهثبت نام

    آمار

    مشاهده آمار استفاده

    تازه ترین ها

    تازه ترین مدارک
    © کليه حقوق اين سامانه برای سازمان اسناد و کتابخانه ملی ایران محفوظ است
    تماس با ما | ارسال بازخورد
    قدرت یافته توسطسیناوب