فوتبال یک بازی چندعامله است که شاید در ظاهر ساده به نظر برسد ولی در عمل از پیچیدگی‌های زیادی برخوردار است. یادگیری مهارت‌های بازی فوتبال برای عامل‌های هوشمند مانند روبات‌ها از جمله زمینه‌های پرطرفدار در حوزه هوش مصنوعی است.

در این پروژه انتظار می‌رود یکی از مهارتهای فوتبال مانند شوت به دروازه، دریبل، توپ‌ربایی، یارگیری و ... با استفاده از روش‌های یادگیری ماشین به عامل آموخته شود.

برای این منظور می‌توانید از محیط شبیه‌سازی فوتبال دوبعدی که مناسب برای اینگونه پژوهش‌ها می‌باشد استفاده کنید. برای انجام این پروژه ترجیحا باید با محیط شبیه‌سازی فوتبال دوبعدی آشنا باشید. البته در صورت عدم آشنایی مشکلی پیش نخواهد آمد و فقط باید کمی وقت بیشتری بگذارید.

این شبیه‌سازی از دو تیم متشکل از 11 برنامه کامپیوتری خودمختار (عامل ) که هر یک در یک زمین فوتبال مجازی دوبعدی به بازی فوتبال می‌پردازند، تشکیل شده است. این زمین مجازی توسط یک سرور ساخته می‌شود. این سرور همه چیز را درباره بازی می‌داند مثل محل کنونی توپ و همه بازیکنان، فیزیک بازی و غیره. بازی بیشتر متکی بر ارتباط بین سرور و هر عامل می‌باشد. از یک طرف هر عامل با استفاده از حسگرهای مجازی خود (بینایی، شنوایی و فیزیکی) ورودی دارای خطا دریافت می‌کند و از طرف دیگر می‌تواند یک دستور پایه‌ای (مثل ضربه به توپ ، حرکت کردن یا چرخیدن ) انجام دهد تا بر محیط تأثیر بگذارد.

۱. مقدمه

هدف نهایی :
"در سال 2051 تیمی متشکل از 11 ربات فوتبالیست داشته باشیم که با تیم قهرمان جهان بازی کرده و آن تیم را شکست دهد!"

این هدف جذاب باعث شده هر ساله تعداد زیادی از دانش آموزان ، دانشجویان ، پژوهشگران و .. قدم به دنیای روبو کاپ (RoboCup) بگذارند. این دنیای جذاب همزمان با اینکه محیط بسیار جالبی برای تحقیق و پژوهش است باعث رشد علاقه و توجه عموم مردم به این حوزه از دانش شده و زمینه خوبی را برای طراحی و پیاده سازی الگوریتم های هوش مصنوعی و ابتکاری افراد علاقه مند فراهم کرده است.

یکی از مهمترین زمینه های روبوکاپ ، شبیه سازی دوبعدی فوتبال می باشد.

شبیه سازی دو بعدی فوتبال از آن جهت حائز اهمیت است که همان طور که اشاره شد زمینه مناسبی را برای اجرای الگوریتم های هوش مصنوعی ، شبیه سازی شبکه های عصبی و منطق فازی و ... فراهم می آورد.

در این پروژه قصد داریم عملکرد بازیکنان را در این محیط در یک زمینه خاص مثل دریبلینگ یا پاس دادن با استفاده از الگوریتم های هوش مصنوعی مانند کلونی مورچگان و ژنتیک و یا یادگیری تقویتی بهبود ببخشیم.

۲. کارهای مرتبط

در این پروژه و یا در اکثر پروژه های روبوکاپ قرار بر این نیست که یک شبیه ساز از گام اول تا به آخر قدم به قدم طراحی شود ، زیرا عملا کار بی فایده ای خواهد بود چون این شبیه ساز ها از اولین دوره روبوکاپ در دهه نود تا به حال در حال طراحی و بهبود یافتن بوده و عملا یک شبیه ساز تازه اختلاف وبهبود چندانی نسبت به ورژن های قدیمی تر نخواهد داشت. در واقع این کار مثل اختراع دوباره چرخ میماند!
بلکه به جای آن از شبیه ساز هایی که در دسترس هستند استفاده میکنیم. برای استفاده از شبیه ساز ها باید از یکی از توزیع های سیستم عامل های لینوکس استفاده کنیم.
شبیه ساز مورد استفاده در اینجا ، شبیه ساز The RoboCup Soccer Server Maintenance Group میباشد.

شبیه ساز دارای قسمت های زیر میباشد :
1 – Server که دارای قوانین بازی و همچنین موقعیت توپ ، دروازه ، خط ها و ... می باشد و به درخواست های client ها مانند پرسش از محل توپ ، محل بازیکنان و .. پاسخ میدهد . sever در هر لحظه در حال update شدن میباشد ولی ما نباید در کار سرور دخالت کنیم بلکه باید با استفاده از قوانین و امکاناتی که در اختیار ما میگذارد بازی را هدایت کنیم.

2 – Monitor که در واقع به عنوان واسط گرافیکی عمل میکند تا ببینیم کد ما به چه شکلی در حال اجرا می باشد.

...

بدین ترتیب محیطی برای بازی دو تیم مقابل هم فراهم شده ولی هنوز تیمی یا client را تعریف نکرده ایم. مانند Server اینجا نیز از ابتدا شروع به طراحی و پیاده سازی تیم مورد نظر نمیکنیم بلکه از base client های موجود استفاده میکنیم. یکی از معرو فترین این client ها UvA Trilearn 2001 دانشگاه آمستردام میباشد. ما تغییرات و الگوریتم های مورد نظرمان را سعی می کنیم بر روی base که این تیم برایمان فراهم کرده پیاده کنیم. Client به Server از طریق پروتکل UDP/IP متصل میشود در نتیجه هر زبانی که این پروتکل را ساپورت کند میتواند مورد استفاده قرار بگیرد. در اینجا برای client از زبان ++C و برای Server از زبان C و ++C استفاده شده است.
پس از اینکه شبیه ساز را نصب کردیم و توانستیم با استفاده از client ها یک بازی را اجرا کنیم نوبت به پیاده سازی تغییرات و الگوریتم های مورد نظرمان میرسد.
الگوریتم های پیشنهادی در اینجا میتواند استفاده از الگوریتم حریصانه برای پاس دادن، استفاده از یادگیری تقویتی برای دریبلینگ و ... باشد.

۳. مراجع

  • R. S. Sutton and A. G. Barto, Reinforcement Learning: An Introduction. Cambridge, United States of America: MIT Press, 1998.

  • P. Stone, (2006) "Half Field Offense in RoboCup Soccer: A Multi-agent Reinforcement Learning Case Study" in .RoboCup 2006, Bremen, Germany
    [link]

  • محمد غضنفری، "بهبود عملکرد عامل شبیه‌سازی فوتبال دوبعدی با استفاده از یادگیری تقویتی "، پایان‌نامه کارشناسی، دانشگاه علم و صنعت ایران، ۱۳۹2. [لینک]

  • Mao Cheny , Ehsan Foroughi, Fredrik Heintz, ZhanXiang Huangy, Spiros Kapetanakis, Kostas Kostiadis, Johan Kummeneje, Itsuki Noda, Oliver Obst, Pat Riley,Timo Steffens, Yi Wangy and Xiang Yiny , “Users Manual RoboCup Soccer Server for Soccer Server Version 7.07 and later”, The RoboCup Federation , 2001

  • Remco de Boer and Jelle Kok , “The Incremental Development of a Sunthetic Multi-Agent System : The UvA Trilearn 2001 Robotic Soccer Simulation Team” , University of Amsterdam , 2002

۴. کارهای آینده

۵. پیوندهای مفید

محمد غضنفری

به طور کلی متن شما خیلی ساختار علمی و یکپارچه ای ندارد. در خیلی از قسمت ها از جملات هیجانی و غیر مرتبط با متن استفاده شده است. بهتر در مراحل بعدی ویرایش متن کمی منظم تر و ساختیافته تر کار کنید.

اشکال اصلی که بنده در کار شما می بینم این است که یا هنوز درک درستی از پروژه ای که باید انجام بدهید ندارید و یا هنوز به سراغ قسمت اصلی پروژه نرفته اید (حداقل از متنی که نوشته اید و مطالبی که به آن پرداخته اید اینطور بر می آید). منظورم این است که شما بیشتر به بحث در مورد خود شبیه سازی فوتبال و سرور و مانیتور و بیس مورد نظرتان پرداخته اید در صورتی که هدف پروژه درس هوش مصنوعی شما اصلا این نیست و ما از شما می خواهیم یکی از مهارت های فوتبالی را با استفاده از روش های هوش مصنوعی هوشمند کنید. من انتظار داشتم در تمامی قسمت های متن تان (مقدمه، کارهای مرتبط و مراجه) بیشتر به این سمت متمایل باشید تا خود شبیه سازی دوبعدی فوتبال.

مورد بعدی انتخاب بیس Uva برای کارتان است. به نظر بنده بیس agent2d برای انجام کارهای هوش مصنوعی ساختار بهتری دارد و پلتفرم های مناسب تری را فراهم آورده است. البته از نظر من انتخاب بیس کاملا بر عهده و سلیقه شماست ولی ممکن است کارتان برای پیاده سازی کمی سخت شود.

مورد آخر اینکه شما هنوز نه مهارتی را برای پیاده سازی انتخاب کرده اید و نه روش خاصی را برای هوشمند سازی آن مهارت. انتظار می رفت در این فاز این موارد را مشخص می کردید که طبیعتا به فاز بعد موکول می گردد و کار فاز بعدتان را کمی سنگین تر می کند.

در نهایت باید از شما تشکر کنم و یک خسته نباشید به شما بگویم به خاطر زحمتی که کشیدید. موارد بالا صرفا به این دلیل مطرح شد که در فازهای آینده کار منظم تر و قوی تری را از شما شاهد باشیم و در نهایت کمکی کرده باشیم برای انجام هرچه بهتر پروژه تان.

موفق باشید