Google учи роботите да се учат взаимно

Докато ние, хората можем да споделяме своите познания и умения, чрез реч и демонстрация, роботите разполагат с възможността мигновено да споделят всичките си знания и умения, които са научили с други роботи предавайки информацията по мрежата. Това е така наречената „cloud robotics”, която използва облаци с информация от които изследователите на Google се стремят да се възползват помагайки на роботи по-бързо да придобият умения.

Човешкият мозък има милиарди неврони, които по между си образуват неизмерим брой връзки. Когато ние мислим и научим, невроните взаимодействат един с друг и някои връзки, които съответстват на определено поведение, ще бъдат заздравени с течение на времето, така че тези връзки е по-възможно да бъдат избрани пак в бъдеще, учейки ни и оформяйки нашите действия.

Изкуствената невронна мрежа следва същата структура, но в по-малък мащаб. На роботите може да бъде дадена задача и инструкции да използват метода проба/ грешка, за да определят най-добрият начин да успеят. В началото, поведението им може да изглежда напълно случайно за външен наблюдател, но изпробвайки различни неща, с течение на времето те ще научат кои действия ги приближават до техните цели и ще се фокусира върху тях, които непрекъснато усъвършенстват своите способности.

Въпреки че, е ефективен този процес отнема време и тук на помощ идва роботиката използваща облак. Вместо всеки робот да минава през експериментална фаза поотделно, техните колективни познания могат ефективно да бъдат споделени, позволявайки един робот да научи друг как да извършва прости задачи, като отварянето на врата или преместването на обект. Периодично, роботите качват това, което са научили на сървър, и когато изтеглите последната версия, означава, че всеки от тях има по-подробна картина, отколкото би имал през индивидуалния си опит.

Използвайки това базиращо се на облак обучение, екипът на Google Research провежда три различни вида експерименти, учейки роботите по различни начини, за да намерят най-ефективния и точен начин да изградят един общ модел от умения.

Първо, няколко роботи в обща невронна мрежа били натоварени с задачата да отворят врата само чрез метода проба/грешка. Видеото по-долу показва, как отначало те опипват на сляпо проучвайки и опитвайки да разберат кои действия ги доближават до целта им.

След няколко часа експериментиране, роботите заедно разбрат как се отваря вратата, достигат дръжката, завъртат и издърпат. Те разбират, че тези действия водят до успех, без да е необходимо изграждането на пълен модел, защо това работи.

При втория експеримент, изследователите изпробвали прогнозния модел. На роботите бил даден поднос, пълен с предмети от бита, с които да играят и тъй като те ги бутнали и разпръснали наоколо, развили основно разбиране за причинно-следствения модел. Отново, споделяйки своите открития и групата може да използва непрекъснато подобряващ се причинно-следствен модел, за да предвиди кои действия, до какви резултати ще доведат.

С помощта на компютърен интерфейс, показващ зоната на изпитанията, учените ще могат да кажат на роботите, където да преместят обект, като кликнат върху него и след това кликнат на желаното на място. Желания ефект е, роботът да може да се възползва от своите споделени минали преживявания, за да намерите най-добрите действия за постигане на дадена цел.

Накрая, екипът използва човек да учи друга партида от роботи на това как да отварят врата. Робот бива физически преместван от човек през стъпките до целта, като след това повтаря тази верига от действия създавайки модел на поведение за отваряне на врата, от който роботите могат да черпят.

След това, на роботите е било зададено с помощта на метода проба/грешка, да подобрят този модел. Тъй като всеки робот отчита леки отклонения в това как да се изпълни задачата, стават все по-добри в работата, до там, че колективния опит им позволява да се отчитат леки отклонения на вратата и позицията на дръжката, което им използва използването на тип дръжка, който всъщност нито един от роботите не е използвал преди.

Какъв е смисълът на всичко това? За невронните мрежи, колкото повече данни толкова по-добре, за това използването от роботи учещи едновременно и един друг може да доведе до по-добри резултати много по-бързо, отколкото само един робот работещ сам. Ускоряване на този процес може да създаде роботи справящи се с много по-сложни задачи, много по-скоро.