قیمتگذاری پویای کلاسهای مشتریان در سیستمهای حملونقل ریلی با استفاده از الگوریتم شبکۀ عمیق Q
(ندگان)پدیدآور
نیکنامی, امیدآخوندزاده نوقایی, الهام
نوع مدرک
Textمقاله علمی پژوهشی
زبان مدرک
فارسیچکیده
هدف: در این پژوهش به بررسی مسئلۀ قیمتگذاری پویا در سیستمهای حملونقل ریلی با استفاده از تکنیکهای پیشرفته یادگیری تقویتی عمیق پرداخته شده است. هدف اصلی این پژوهش، بهینهسازی درآمد شرکتهای حملونقل ریلی، از طریق ایجاد سیاست فروش بلیت است که بتواند قیمت بلیت را با در نظر گرفتن کلاسهای خدماتی بهصورت پویا تنظیم کند. این رویکرد به شرکتهای حملونقل ریلی این امکان را میدهد تا با تنظیم دقیقتر قیمتها، بر اساس تقاضای مسافران، درآمد بیشتری کسب کنند و سودآوری خود را بهبود بخشند.
روش: در این پژوهش، بهمنظور حل مسئله قیمتگذاری پویا، از الگوریتم شبکۀ عمیق Q، یکی از الگوریتمهای پُرکاربرد یادگیری تقویتی عمیق، بهره گرفته شده است. این الگوریتم یک الگوریتم پیشگامانه است که شبکههای عصبی عمیق را با یادگیری Q ترکیب میکند. در الگوریتم شبکۀ عمیق Q، شبکههای عصبی عمیق وظیفۀ تقریب مقادیر Q را بهجای جدول پُرهزینۀ Q برعهده دارند. یک شبکۀ عصبی عمیق میتواند حالت فعلی و یک عمل ممکن را مشاهده کند و بهصورت مستقیم مقدار Q را تقریب بزند. توانایی الگوریتم شبکۀ عمیق Q در یادگیری سیاستهای بهینه در محیطهای پیچیده، این الگوریتم را به یک الگوریتم پُرکاربرد تبدیل کرده است. با توجه به این نکته که مدلهای یادگیری تقویتی، اغلب برای تحلیل بیش از حد پیچیده بهکار میروند، تحلیل استراتژیهای قیمتگذاری متفاوت، فقط با آزمایشهای عددی و شبیهسازی بهدست میآیند.
یافتهها: نتایج شبیهسازیها نشان میدهد که الگوریتم شبکۀ عمیق Q، بهطور موفقیتآمیزی به یک سیاست قیمتگذاری پایدار همگرا تبدیل شده است. در این مطالعه، شاخصهای عملکردی مختلفی مانند درآمد کل، ظرفیت باقیمانده، میانگین قیمتهای ارائهشده به مشتریان و تعداد بلیتهای فروختهشده در هر کلاس خدماتی بررسی شد. الگوریتم در مراحل اولیه با نرخ یادگیری بالا بهبود و بهتدریج به پایداری و ثبات دست یافت. میانگین درآمد کل، پس از ۵۰۰۰ تکرار، به مقدار ۲۲۵ هزار همگرا میشود. این مقدار نشاندهندۀ آن است که این شرکت بهطور متوسط، از هر قطار ۲۲۵ هزار واحد پولی درآمد کسب میکند. میانگین ظرفیت باقیمانده نیز پس از حدود ۳۰۰۰ تکرار، به مقدار صفر نزدیک میشود. همگرایی نمودار میانگین ظرفیت باقیمانده به صفر، نشاندهندۀ این است که عامل یادگیری تقویتی، بهطور مؤثری یاد گرفته است که برای حداکثرسازی درآمد کل، میبایست تمامی بلیتهای موجود را به فروش برساند. شاخص میانگین قیمتهای پیشنهادی به مشتریان، پس از حدود ۷۵۰۰ تکرار به یک حالت پایدار میرسد، به این معنا که الگوریتم به یک سیاست قیمتگذاری بهینه دست پیدا کرده است. در این وضعیت، میانگین قیمتها در محدوده ۶۸۰ تا ۷۰۰ واحد پولی باقی میماند و نوسانهای چشمگیری مشاهده نمیشود. به عبارت دیگر، مدل یادگیری تقویتی بر اساس شاخص میانگین قیمتهای پیشنهادی همگرا شده است. در نهایت، پس از حدود ۵۰۰۰ تکرار، میانگین تعداد بلیت فروخته شده برای تمامی کلاسهای خدماتی، به یک سطح تقریباً ثابت و پایدار میرسد. میانگین تعداد بلیت فروخته شده برای کلاس اکونومی، حدود ۱۷۵ تا ۱۸۰ بلیت، کلاس بیزینس حدود ۱۳۰ تا ۱۳۵ بلیت، کلاس ویژه حدود ۶۰ تا ۶۵ بلیت و کلاس هتل حدود ۲۳ تا ۲۵ بلیت بهدست آمد.
نتیجهگیری: نتایج این پژوهش نشان میدهد که پس از حدود ۷۵۰۰ تکرار، الگوریتم شبکۀ عمیق Q به یک سیاست بهینه و پایدار رسیده است و تغییرات چشمگیری در عملکرد مشاهده نمیشود. همچنین میتوان نتیجه گرفت که استفاده از الگوریتم شبکۀ عمیق Q در قیمتگذاری پویا، میتواند به بهبود چشمگیری در مدیریت درآمد سیستمهای حملونقل ریلی منجر شود. این الگوریتم با قابلیت یادگیری و سازگاری با شرایط متغیر، قادر است که سیاستهای قیمتگذاری مؤثری را با هدف حداکثرسازی درآمد بهکار گیرد و همچنین، تعداد بهینۀ بلیتهای فروختهشده در هر کلاس خدماتی را تعیین کند. این دستاوردها میتوانند به شرکتهای حملونقل ریلی در بهبود راهبردهای قیمتگذاری و افزایش بهرهوری اقتصادی کمک شایانی کنند.
کلید واژگان
قیمتگذاری پویایادگیری تقویتی عمیق
حملونقل ریلی
موضوع های مربوط به مدیریت صنعتی
شماره نشریه
4تاریخ نشر
2024-11-211403-09-01
ناشر
دانشکده مدیریت دانشگاه تهرانUniversity of Tehran
سازمان پدید آورنده
دانشجوی کارشناسی ارشد، گروه مهندسی صنایع، دانشکده مهندسی صنایع و سیستمها، دانشگاه تربیت مدرس، تهران، ایران.استادیار، گروه فناوری اطلاعات، دانشکده مهندسی صنایع و سیستمها، دانشگاه تربیت مدرس، تهران، ایران.
شاپا
2008-58852423-5369



