عنوان فارسی مقاله:ادغام شبکه مولد تخاصمی برای تصمیم گیری در یادگیری تقویتی برای عوامل ربات صنعتی
چکیده
بسیاری از سیستمهای رباتیکی که محمولههای خاصی را حمل میکنند در صنایع تولیدی برای کارهای انتخاب و مکان به کار میروند. اگر وزن کم یا زیاد معرفی شود، سیستم دچار ناکارآمدی می شود. اگر بار متفاوتی معرفی شود (به دلیل تغییر بار یا تغییر در پارامترهای سیستم ربات)، ربات باید با وزن/پارامترهای جدید مجدداً آموزش داده شود و شبکه جدید باید آموزش داده شود. پارامترهایی مانند وزن ربات، طول اندام یا محموله جدید ممکن است برای یک عامل بسته به شرایط متفاوت باشد. تغییرات پارامتر برای عامل در دستیابی به همان هدفی که انتظار می رود با پارامترهای اصلی به آن دست یابد، مشکل ایجاد می کند. از این رو، آموزش مجدد عامل با پارامترهای جدید برای رسیدن به هدف خود الزامی می شود. این تحقیق چارچوب جدیدی را برای انطباق شرایط مختلف بر روی یک عامل ربات در یک محیط شبیهسازی شده بدون هیچ گونه آموزش مجدد پیشنهاد میکند. با استفاده از ویژگیهای شبکه مولد تخاصمی (GAN)، عامل میتواند تنها یک بار با یادگیری تقویتی تمرین کند و با تغییر بردار نویز مولد در شبکه GAN، عامل میتواند متناسب با شرایط جدید وفق دهد و عملکرد مشابهی را نشان دهد. آنها با ویژگی های فیزیکی جدید با استفاده از یادگیری تقویتی آموزش داده شدند. یک محیط CartPole ساده برای آزمایش در نظر گرفته شده است، و نشان داده شده است که با رویکرد پیشنهادی، عامل برای تکرارهای بیشتر پایدار می ماند. این رویکرد را می توان در آینده به دنیای واقعی نیز تعمیم داد.
- لینک دانلود فایل بلافاصله بعد از پرداخت وجه به نمایش در خواهد آمد.
- همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
- ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
- در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.