• ورود به سامانه
      مشاهده مورد 
      •   صفحهٔ اصلی
      • نشریات فارسی
      • پژوهش های زبان شناسی
      • دوره 10, شماره 2
      • مشاهده مورد
      •   صفحهٔ اصلی
      • نشریات فارسی
      • پژوهش های زبان شناسی
      • دوره 10, شماره 2
      • مشاهده مورد
      JavaScript is disabled for your browser. Some features of this site may not work without it.

      استخراج خودکار جملات هم‌تراز انگلیسی-فارسی از متون مقایسه‌ای با بهره‌برداری از اطلاعات نحوی

      (ندگان)پدیدآور
      متولیان, رضوانمنجمی, امیرحسنقدس اللهی, ابراهیم
      Thumbnail
      دریافت مدرک مشاهده
      FullText
      اندازه فایل: 
      1.126 مگابایت
      نوع فايل (MIME): 
      PDF
      نوع مدرک
      Text
      مقاله علمی
      زبان مدرک
      فارسی
      نمایش کامل رکورد
      چکیده
      پیکره‌های موازی همواره از غنی‌ترین منابع در مباحث پردازش زبان طبیعی محسوب می‌شوند.  این نوع پیکره‌ها شامل متون ترجمه‌شدۀ دو یا چند زبان هستند که در سطوح مختلف کلمه، عبارت و یا جمله هم‌ترازشده‌اند. علیرغم کاربرد فراوان این نوع پیکره‌ها در مطالعات مختلف از جمله پژوهش­های زبانی، ترجمة ماشینی آماری و سامانه‌های خودکار بازیابی اطلاعات میان زبانی، متأسفانه همواره پژوهشگران با کمبود پیکره‌های موازی مواجه بوده‌اند. در این راستا، در پژوهش حاضر سعی شده است به‌منظور تولید پیکره موازی با بهره‌گیری از اطلاعات نحوی، روشی خودکار برای استخراج جملات هم‌ترازانگلیسی/فارسی از متون مقایسه‌ای ارائه شود. در این روش، با ساخت بردار ویژگی با بهره‌گیری از اطلاعات نحوی جملات، یک مدل هم‌ترازی آموزش داده می‌شود. دقت مدل هم‌ترازی،در بهترین حالت، به شکل عملیاتی روی داده‌های آزمون (208 عدد جفت جمله) 77% و روی داده‌های آموزشی (830 عدد جفت جمله) 7/97 % محاسبه شد. از آنجایی که حجم داده‌های طلایی بسیار کوچک بود روش n-fold cross validation در مورد تمام الگوریتم‌های آموزش مورد استفاده قرار گرفت. به‌منظور افزایش دقت، از یک الگوریتم جست‌وجوی شباهت لغوی جملات نیز استفاده شد که دقت را روی داده‌های آزمون از 77% به 18/85% افزایش داد. پژوهش حاضر، با به‌کارگیری مدل هم‌ترازی به‌دست‌آمده، به تولید ابزار هم‌ترازی دانشگاه اصفهان منجر شد، که می‌تواند به‌منظور خودکفایی در تولید پیکره‌های موازی مورداستفاده محققین حوزه پردازش زبان فارسی قرار گیرد.
      کلید واژگان
      استخراج خودکار
      جملات همتراز
      زبانشناسی پیکره‌ای
      پیکره مقایسه‌ای
      پیکره موازی

      شماره نشریه
      2
      تاریخ نشر
      2018-09-23
      1397-07-01
      ناشر
      دانشگاه اصفهان
      University of Isfahan
      سازمان پدید آورنده
      استادیار گروه زبانشناسی دانشگاه اصفهان
      دانشیار گروه کامپیوتر دانشگاه اصفهان
      کارشناسی ارشد زبانشناسی رایانشی دانشگاه اصفهان

      شاپا
      2008-6261
      2322-3413
      URI
      https://dx.doi.org/10.22108/jrl.2018.109525.1173
      http://jrl.ui.ac.ir/article_23141.html
      https://iranjournals.nlai.ir/handle/123456789/201062

      مرور

      همه جای سامانهپایگاه‌ها و مجموعه‌ها بر اساس تاریخ انتشارپدیدآورانعناوینموضوع‌‌هااین مجموعه بر اساس تاریخ انتشارپدیدآورانعناوینموضوع‌‌ها

      حساب من

      ورود به سامانهثبت نام

      تازه ترین ها

      تازه ترین مدارک
      © کليه حقوق اين سامانه برای سازمان اسناد و کتابخانه ملی ایران محفوظ است
      تماس با ما | ارسال بازخورد
      قدرت یافته توسطسیناوب