آموزش رفتارهای پیچیده به ربات‌ها تنها به وسیله نمایش رفتار

محققان سیستمی را طراحی کرده اند که به روبات ها امکان می‌دهد به طور مستقل کارهای پیچیده را با تماشای تعداد بسیار کمی از نمونه های آن کار حتی نمونه‌های ناقص بیاموزند.

به گزارش نووانا، تصور کنید؛ روبات ها بتوانند با تماشای حرکات انسانی یاد بگیرند : شما می توانید به یک ربات خانگی نشان دهید که چگونه کارهای روزمره را انجام دهد یا میز شام را بچیند. در محل کار می‌توانید به روبات ها مانند کارمندان جدید آموزش داده و به آنها نشان دهید که چگونه بسیاری از وظایف را انجام دهند. در جاده ، اتومبیل خودرو می‌تواند با تماشای شما در حال رانندگی یاد بگیرد که چگونه در جاده ایمن رانندگی کند.

برای پیشرفت در این چشم انداز ، محققان USC سیستمی را طراحی كرده اند كه به روبات ها اجازه می‌دهد تا به طور مستقل كارهای پیچیده را از تعداد بسیار كمی از نمایش‌ها، حتی نمایش‌ها و نمونه‌های ناقص بیاموزند. مقاله مذکور با عنوان یادگیری از نمایش رفتار با استفاده از منطق زمانی سیگنال ، در کنفرانس یادگیری ربات (CoRL 18)مورخ نوامبر ارائه شد.

سیستم محققان با ارزیابی کیفیت هر نمایش رفتاری کار می‌کند، بنابراین از خطاهایی که می‌بیند درست مانند موفقیت‌ها می آموزد. در حالی که روشهای پیشرفته فعلی حداقل به 100 نمایش برای تثبیت کردن یک کار خاص نیازمندند، این روش جدید به روبات‌ها این امکان را می‌دهد که تنها از تعداد معدودی از نمایش ها درس بگیرند. همچنین به روبات ها این امکان را می‌دهد تا بصری تر بیاموزند، همانطور که انسان‌ها با مشاهده یکدیگر در حال انجام کاری حتی اگر آن کار به صورت ناقص یا نه چندان کامل رخ دهد، آن کار را امتحان می‌کنند و برای کسب دانش از یکدیگر الزاما به یک نمایش کامل از وظایف نیاز ندارند.

آنیرود پورنیک، نویسنده اصلی مقاله و دانشجوی دکتری علوم کامپیوتر در دانشکده مهندسی USC Viterbi، اینطور می‌گوید که : ” بسیاری از سیستم های یادگیری ماشین و یادگیری تقویتی به مقدار زیادی داده و صدها نمایش رفتار نیاز دارند و شما برای بارها و بارها نشان دادن یک کار به یک انسان نیاز دارید ، که چنین چیزی عملی نیست.”

“همچنین، او خاطر نشان کرد که:” چالش اساسی در این کار این است که اکثر مردم دانش برنامه نویسی ندارند تا صریحاً آنچه را که باید ربات انجام دهد، بیان کنند و یک انسان نمی تواند همه چیزهایی را که یک ربات باید بداند نشان دهد. پس اگر ربات با چیزی روبرو شود که قبلاً ندیده است ، چه می‌شود؟”

یادگیری از نمایش رفتار

مقوله ” یادگیری از نمایش رفتار” همچنان در حال کسب محبوبیت بیشتری در زمینه رسیدن به روش های موثر در کنترل حرکات ربات است اما کماکان با چند مسئله مواجه است که یکی در نقص در انجام رفتار و دیگری نگرانی های ایمنی به وجود آمده درباره امکان یادگیری اقدامات ناامن یا نامطلوب توسط ربات ها است. همچنین ، برخی از نمایش ها نسبت به سایر آنها شاخص های بهتری از رفتار مطلوب ارائه می‌کنند و کیفیت نمایش ها اغلب به تخصص کاربر ارائه دهنده نمایش ها بستگی دارد.

محققان برای رسیدگی به این مسائل ، از “منطق زمانی سیگنال” یا STL برای ارزیابی کیفیت نمایش ها و مرتب سازی خودکار آنها استفاده کردند. به عبارت دیگر ، حتی اگر برخی از قسمت های نمایش بر اساس الزامات منطقی معنایی نداشته باشند ، با استفاده از این روش ، ربات همچنان می تواند از قسمت های ناقص یاد بگیرد. به نوعی ، سیستم خودش در مورد صحت یا موفقیت یک نمایش نتیجه گیری می‌کند.

استفانوس نیکولاییدیس، نویسنده همکار و استادیار علوم کامپیوتر دانشگاه USC Viterbi، گفت : “ربات ها از انواع نمایش فتار؛ چه عملی چه در قالب فیلم یا شبیه سازی، یاد می‌گیرند. اگر رفتار ارائه شده به آنها ناامن باشد در شرایط استاندارد دو کار انجام می¬دهند، یا کاملا آن را نادیده می‌گیرد یا در بدترین حالت رفتار اشتباه را خواهد آموخت”

“اما در مقابل ، این سیستم به روشی کاملاً هوشمندانه ، از برخی استدلال های عقل سلیم در قالب منطق استفاده می¬کند تا بفهمد کدام قسمت از نمایش خوب است و کدام قسمت نه، و در اصل ، این دقیقاً همان کاری است که بشر نیز انجام می‌دهد.”

به عنوان مثال، یک نمایش رفتار رانندگی را در نظر بگیرید که در آن کسی علامت توقف را رد می‌کند، این حالت در مقایسه با نمایش یک راننده خوب ، رتبه پایین تری در سیستم خواهد داشت. اما ، اگر در این نمایش ها راننده کاری هوشمندانه انجام دهد؛ به عنوان مثال برای جلوگیری از تصادف ترمز خود را بکشد، ربات از این عمل هوشمندانه هم درس می‌گیرد.

این سیستم با استفاده از شبیه ساز بازی به سبک Minecraft آزمایش شد، اما محققان گفتند که این سیستم همچنین می¬تواند از شبیه سازهای رانندگی و در نهایت حتی فیلم ها نیز یاد بگیرد. در مرحله بعدی ، محققان امیدوارند که آن را روی ربات های واقعی آزمایش کنند و با استفاده از روش خود ترجیحات انسانی و سازگار شدن با آنها را به خوبی به ربات ها بیاموزند تا از ربات ها هم تیمی های خوبی برای کمک به مردم بسازند.

مترجم: زهرا دبستانی – حوزه فناوری و نوآوری
منبع : www.sciencedaily.com