29 сакавiка 2024, Пятніца, 8:31
Падтрымайце
сайт
Сім сім,
Хартыя 97!
Рубрыкі

У ЗША навучылі робатаў «свядома» карыстацца інструментамі

9
У ЗША навучылі робатаў «свядома» карыстацца інструментамі

Амерыканскія навукоўцы стварылі адмысловы алгарытм.

Распрацоўнікі з ЗША стварылі спецыялізаваны алгарытм для робатаў, які даў магчымасць апошнім выкарыстоўваць дадатковыя прылады для выканання пастаўленай задачы. А яна адносна простая – пэўным чынам перамясціць прадмет з пункта А ў пункт Б, паведамляе habr.com.

Алгарытм складаецца з дзвюх частак. Першая дазваляе робату перамяшчаць прадметы выпадковым чынам, выконваючы свайго кшталту эксперыменты. Другая частка дае магчымасць ацаніць наступствы таго ці іншага дзеяння пры дапамозе нейрасеткі. Як высветлілася, робаты, працуючы паводле алгарытму, эфектыўна выкарысталі дапаможныя прылады без навучання.

Чалавек выкарыстоўвае мноства дадатковых інструментаў кожны дзень. Жывёлы таксама на гэта здольныя – папугаі, крумкачы, малпы і некаторыя іншыя жывыя істоты ўмеюць выкарыстоўваць палкі, камяні, калючкі для дасягнення жаданых задачаў (напрыклад, выманне лічынкі жука з-пад кары).

Для нас выкарыстанне нажа для наразання хлеба цалкам відавочнае. Але для робата, якому неабходна тлумачыць кожнае дзеянне ў выглядзе машыннай мовы – зусім не.

Навукоўцы з Каліфарнійскага ўніверсітэта ў Берклі распрацавалі спосаб, які дазваляе навучыць робатаў выкарыстоўваць дапаможныя прылады і прымаць пастановы для іх ужывання ў той ці іншай сітуацыі. Алгарытм «візуалізуе» задачу, дэманструючы робату, у які бок трэба рухаць прыкладу. А ўжо робат (гэта звычайны рабатызаваны маніпулятар) бярэ інструмент і рухае прадмет. Усе рухі адсочваюцца на камеры.

У аснове алгарытму – нейрасетка. Спецыялізаваная праграма пралічвае розныя паслядоўнасці дзеянняў для робата, якія «скормліваюць» нейрасетцы. Тая генеруе відэа, якое паказвае, што будзе адбывацца ў выніку выканання таго ці іншага дзеяння.

Маніпулятару даецца каманда на выкананне дзеяння. Калі рэальны вынік супадае з планаваным, выкананне задання залічваецца. У ходзе працы розныя варыянты відэа параўноўваюцца з выявай, якая прапанаваная карыстальнікам і адлюстроўвае канчатковы вынік выканання задачы. Пасля таго як знойдзеная аптымальная паслядоўнасць дзеянняў, робат прыступае да выканання задачы.

У гэтым праекце сумешчаныя такія падыходы машыннага навучання, як навучанне без дэманстрацыі і імітацыйнае навучанне. У першым выпадку робат выбірае варыянты дзеянняў выпадковым чынам. У выніку генеруецца значная выбарка звестак, якая дапамагае дасягаць аптымальнага выніку. У другім распрацоўнікі наглядна паказвалі робату, як трэба выкарыстоўваць інструмент у тым ці іншым выпадку. Менавіта ў гэтай сітуацыі і запісваецца на камеру эталонная ідэя, з якой робат параўноўвае наступствы сваіх дзеянняў.

У некаторых выпадках робат «разумее», што лепш за ўсё выканаць задачу можна без дапаможных элементаў – і робіць гэта. Інструменты ж выкарыстоўваюцца без навучання, нават у тым выпадку, калі робату не паказвалі іх раней.

Напісаць каментар 9

Таксама сачыце за акаўнтамі Charter97.org у сацыяльных сетках