بسم اللّه الرحمن الرحیم
مقدمه
دانستن دمای هوای در یک ماه آینده، آنقدر دم دستی و روزانه شده است که ما فراموش می کنیم که چه پروسه های علمی در پس زمینه این موضوع روزمره در حال اجرا هستند.
مسئله ای که قرار است در این مقاله به بررسی آن بپردازیم یکی از شاخه ها و به عبارتی موضوعات پیش بینی سری زمانی تحت عنوان "پیش بینی تقاضای تاکسی توسط مشتریان" می باشد .
پروسه پیش بینی آینده از روی اطلاعات گذشته ، این مسئله و مسایل دیگری همانند پیش بینی مصرف انرژی و … ، ساختار مشابهی دارند و در همه این موارد ما با مسئله پیش بینی سریهای زمانی یا Time Series Prediction مواجهیم.
یک سری زمانی، دنباله ای از داده ها می باشد که به ترتیب زمانی اندازه گیری می شوند. در یک نمایش ریاضی، ما سیگنالی به صورت زیر داریم.
x(t) , t = 0, 1, 2, ….
که در آن t زمان را نشان می دهد و x یک متغیر بر حسب t می باشد. هدف به دست آوردن یک مدل برای سری زمانی x می باشد.
انواع سری زمانی
سری پیوسته : سریهای که مشاهدات به طور پیوسته در زمان ایجاد میشوند(حتی اگر مقادیر گسستهای اختیار کنند) . مثل مصرف برق یک آپارتمان به صورت لحظه ای .
سری گسسته: سری که مشاهدات در زمانهای معین و معمولاً در فاصلههای مساوی رخ میدهند. مثل مصرف برق یک آپارتمان در بازه های مثلا یک ساعته
پیش بینی سریهای زمانی
مسئله پیش بینی سریهای زمانی (Time Series Prediction) یکی از موضوعات مهم حوزه های مختلف علوم اقتصادی، مالی، مدیریتی و مهندسی در دهه های اخیر بوده است. هدف در پیش بینی سری زمانی، جمع آوری دقیق داده ها و مطالعه دقیق تر آنها برای یافتن یک مدل مناسب جهت توصیف ساختار درونی سری زمانی می باشد. در نهایت مدل به دست آمده پس از ارزیابی، برای به دست آوردن مقادیر آینده یک پارامتر (پیش بینی) مورد استفاده قرار می گیرد.
به عبارت دیگر:
پیش بینی سری زمانی،
“پیش بینی آینده”، بر مبنای “درک گذشته” است.
پیشبینی سریهای زمانی میتواند تنها به پیشبینی گام بعدی محدود شود یا یک پیشبینی طولانی مدّت باشد. معمولاً پژوهشگران این مسائل را از یکدیگر
تفکیک میکنند. علّت امر آن است که مسائلی نظیر تجمیع خطا ، دامنه تغییر پارامتر و ... پیشبینی طولانی مدّت را بسیار سختتر از پیشبینی کوتاه مدّت میکنند.
همان طور که عنوان شد موضوع این پروژه پیش بینی تقاضای تاکسی توسط مشتریان است. هدف از این مبحث در اصل به وجود آمدن یک سیستم حمل و نقل هوشمند و کار آمد برای اعزام تاکسی برای مسافران ، صرفه جویی در زمان مسیر یابی تاکسی ها ، صرفه جویی در مصرف سوخت و در نهایت جلب بیشتر رضایت مشتری است .
در این مسئله با چهار متغیر مواجه هستیم که عبارتند از
1- فاصله و هزینه این فاصله از ایستگاه برای هر تاکسی
2- تعداد تاکسی های منتظر در هر ایستگاه تاکسی
3- تعداد مسافران منتظر در هر ایستگاه
4- میزان در آمد مورد انتظار بر حسب زمان صرف شده
اگر این سیستم هوشمند نباشد معمولا راه حلی که برای جلب رضایت مشتری وجود دارد زیاد کردن تعداد تاکسی های خالی در داخل شهر می باشد که به شدت هزینه های مربوط به شرکت را از نظر در آمد ، میزان مصرف زمان و افراد ، میزان مصرف سوخت و ... افزایش می دهد . و اگر بخواهیم شرکت تاکسی رانی در این بین از نظر پارامتر های گفته شده ضرر کمتری کند بالاجبار تعداد تاکسی ها باید کاهش پیدا کند که در این صورت احتمال انتظار بیشتر مسافر برای تاکسی و همچنین اطمینان نداشتن برای گرفتن تاکسی برای مسافر بیشتر می شود.
هدف کلی از این طرح توزیع هوشمندانه وسایل نقلیه در سطح شهر برای سوار کردن مسافر در کمترین زمان به گونه ای که مسیر طی شده و زمان برای مسافر و تاکسی بیشترین سود را داشته باشد . همچنین پیدا کردن بهترین جایگاه تاکسی پس از پیاده کردن مسافر ( از نظر میزان مسافران منتظر یا تاکسی های منتظر و تعداد سرویس هایی که در هر ایستگاه به وجود می آید ) برای رفتن به آنجا است . که این طرح به تاکسی برای اتخاذ بهترین تصمیم برای پیدا کردن مسافر کمک خواهد کرد .
از ملزومات این سیستم هوشمند داشتن یک شبکه گسترده و کارآمد برای شرکت و همچنین مسافران می باشد . چرا که این سیستم از داده های GPS استفاده می کند و داده های GPS به صورت پیوسته ( جریان داده ) و زنده ارسال می شوند .
برای این کار به تقسیم بندی مناطق مختلف شهر به خوشه های مختلف بر حسب تاریخچه ( به لحاظ مسافر ) هم نیاز مند می باشیم .
با توجه به تعریف انواع سری های زمانی ، در این طرح از هر دو نوع سری زمانی استفاده می شود. چرا که داده ها هم به صورت لحظه ای مورد استفاده قرار می گیرد و همچنین می توان با تقسیم بندی به بازه های با زمان مشخص داده ها را به صورت گسسته مورد مطالعه قرار داد. پیش بینی زمان نیز به دوشکل و برای دو کاربرد انجام خواهد گرفت چرا که پیش بینی هم باید برای زمان لحظه ای t انجام گیرد . همچنین پیش بینی وجود مسافر در یک ایستگاه تاکسی در بازه زمانی کوتاه P باید انجام گیرد یعنی بازه زمانی (t , t+P) که همانطور که عرض شد رسیدن به این پیش بینی مستلزم آگاهی از گذشته و تحلیل داده های آن هاست .
منابع:
Predicting Taxi–Passenger Demand UsingStreaming Data, [Luis Moreira-Matias, João Gama, Michel Ferreira, João Mendes-Moreira, and Luis Damas]
http://faradars.org/courses/mvpnn9011a-time-series-prediction-using-nn