محققان سیستمی را طراحی کرده اند که به روبات ها امکان میدهد به طور مستقل کارهای پیچیده را با تماشای تعداد بسیار کمی از نمونه های آن کار حتی نمونههای ناقص بیاموزند.
به گزارش نووانا، تصور کنید؛ روبات ها بتوانند با تماشای حرکات انسانی یاد بگیرند : شما می توانید به یک ربات خانگی نشان دهید که چگونه کارهای روزمره را انجام دهد یا میز شام را بچیند. در محل کار میتوانید به روبات ها مانند کارمندان جدید آموزش داده و به آنها نشان دهید که چگونه بسیاری از وظایف را انجام دهند. در جاده ، اتومبیل خودرو میتواند با تماشای شما در حال رانندگی یاد بگیرد که چگونه در جاده ایمن رانندگی کند.
برای پیشرفت در این چشم انداز ، محققان USC سیستمی را طراحی كرده اند كه به روبات ها اجازه میدهد تا به طور مستقل كارهای پیچیده را از تعداد بسیار كمی از نمایشها، حتی نمایشها و نمونههای ناقص بیاموزند. مقاله مذکور با عنوان یادگیری از نمایش رفتار با استفاده از منطق زمانی سیگنال ، در کنفرانس یادگیری ربات (CoRL 18)مورخ نوامبر ارائه شد.
سیستم محققان با ارزیابی کیفیت هر نمایش رفتاری کار میکند، بنابراین از خطاهایی که میبیند درست مانند موفقیتها می آموزد. در حالی که روشهای پیشرفته فعلی حداقل به 100 نمایش برای تثبیت کردن یک کار خاص نیازمندند، این روش جدید به روباتها این امکان را میدهد که تنها از تعداد معدودی از نمایش ها درس بگیرند. همچنین به روبات ها این امکان را میدهد تا بصری تر بیاموزند، همانطور که انسانها با مشاهده یکدیگر در حال انجام کاری حتی اگر آن کار به صورت ناقص یا نه چندان کامل رخ دهد، آن کار را امتحان میکنند و برای کسب دانش از یکدیگر الزاما به یک نمایش کامل از وظایف نیاز ندارند.
آنیرود پورنیک، نویسنده اصلی مقاله و دانشجوی دکتری علوم کامپیوتر در دانشکده مهندسی USC Viterbi، اینطور میگوید که : ” بسیاری از سیستم های یادگیری ماشین و یادگیری تقویتی به مقدار زیادی داده و صدها نمایش رفتار نیاز دارند و شما برای بارها و بارها نشان دادن یک کار به یک انسان نیاز دارید ، که چنین چیزی عملی نیست.”
“همچنین، او خاطر نشان کرد که:” چالش اساسی در این کار این است که اکثر مردم دانش برنامه نویسی ندارند تا صریحاً آنچه را که باید ربات انجام دهد، بیان کنند و یک انسان نمی تواند همه چیزهایی را که یک ربات باید بداند نشان دهد. پس اگر ربات با چیزی روبرو شود که قبلاً ندیده است ، چه میشود؟”
یادگیری از نمایش رفتار
مقوله ” یادگیری از نمایش رفتار” همچنان در حال کسب محبوبیت بیشتری در زمینه رسیدن به روش های موثر در کنترل حرکات ربات است اما کماکان با چند مسئله مواجه است که یکی در نقص در انجام رفتار و دیگری نگرانی های ایمنی به وجود آمده درباره امکان یادگیری اقدامات ناامن یا نامطلوب توسط ربات ها است. همچنین ، برخی از نمایش ها نسبت به سایر آنها شاخص های بهتری از رفتار مطلوب ارائه میکنند و کیفیت نمایش ها اغلب به تخصص کاربر ارائه دهنده نمایش ها بستگی دارد.
محققان برای رسیدگی به این مسائل ، از “منطق زمانی سیگنال” یا STL برای ارزیابی کیفیت نمایش ها و مرتب سازی خودکار آنها استفاده کردند. به عبارت دیگر ، حتی اگر برخی از قسمت های نمایش بر اساس الزامات منطقی معنایی نداشته باشند ، با استفاده از این روش ، ربات همچنان می تواند از قسمت های ناقص یاد بگیرد. به نوعی ، سیستم خودش در مورد صحت یا موفقیت یک نمایش نتیجه گیری میکند.
استفانوس نیکولاییدیس، نویسنده همکار و استادیار علوم کامپیوتر دانشگاه USC Viterbi، گفت : “ربات ها از انواع نمایش فتار؛ چه عملی چه در قالب فیلم یا شبیه سازی، یاد میگیرند. اگر رفتار ارائه شده به آنها ناامن باشد در شرایط استاندارد دو کار انجام می¬دهند، یا کاملا آن را نادیده میگیرد یا در بدترین حالت رفتار اشتباه را خواهد آموخت”
“اما در مقابل ، این سیستم به روشی کاملاً هوشمندانه ، از برخی استدلال های عقل سلیم در قالب منطق استفاده می¬کند تا بفهمد کدام قسمت از نمایش خوب است و کدام قسمت نه، و در اصل ، این دقیقاً همان کاری است که بشر نیز انجام میدهد.”
به عنوان مثال، یک نمایش رفتار رانندگی را در نظر بگیرید که در آن کسی علامت توقف را رد میکند، این حالت در مقایسه با نمایش یک راننده خوب ، رتبه پایین تری در سیستم خواهد داشت. اما ، اگر در این نمایش ها راننده کاری هوشمندانه انجام دهد؛ به عنوان مثال برای جلوگیری از تصادف ترمز خود را بکشد، ربات از این عمل هوشمندانه هم درس میگیرد.
این سیستم با استفاده از شبیه ساز بازی به سبک Minecraft آزمایش شد، اما محققان گفتند که این سیستم همچنین می¬تواند از شبیه سازهای رانندگی و در نهایت حتی فیلم ها نیز یاد بگیرد. در مرحله بعدی ، محققان امیدوارند که آن را روی ربات های واقعی آزمایش کنند و با استفاده از روش خود ترجیحات انسانی و سازگار شدن با آنها را به خوبی به ربات ها بیاموزند تا از ربات ها هم تیمی های خوبی برای کمک به مردم بسازند.
مترجم: زهرا دبستانی – حوزه فناوری و نوآوری
منبع : www.sciencedaily.com