Произлезен од платформата на Nvidia, DrEureka е агент за голем јазичен модел (LLM) специјализиран за изработка на код за да ги обучи вештините на роботите во рамките на симулации и да развие решенија што ги надминуваат предизвиците на јазот симулација-реалност.
Истражувачите тврдат дека работи беспрекорно, автоматизирајќи го целиот процес, од првично стекнување вештини до имплементација во реалниот свет. Ова обезбедува непречена транзиција од виртуелни средини до практично распоредување.
Тимот ја искористи платформата за да го обучи кучето-робот во симулација, а потоа го префрли во реални работни услови. Четвороношците ја завршија задачата по првиот обид и не беше потребно коригирање.
Деталите од студијата од тимот на истражувачи од Универзитетот во Пенсилванија, Универзитетот во Тексас во Остин и Nvidia беа објавени на GitHub.

„Традиционално, трансферот од симулација во реалност се постигнува со рандомизација на доменот, мачен процес кој бара стручни човечки роботичари да зјапаат во сите параметри кои рачно да се приспособуваат “, рече Џим Фан, виш истражувачки менаџер и водач на отелотворена вештачка интелигенција во Nvidia. во објава на Х.
Најсовремените LLM како што е GPT-4 се опремени со широко вградено разбирање на физичките концепти како триење, амортизација, вкочанетост, гравитација и многу повеќе.
„Ние бевме изненадени кога откривме дека DrEureka може компетентно да ги прилагоди овие параметри и добро да го објасни своето расудување“, рече Фан. Понатаму, подобрувањето на потпрограмата за дизајн на награди LLM на DrEureka ги надминува можностите на Eureka со интегрирање на безбедносните упатства. Истражувачите ја потврдуваат нејзината важност во изработката на функции за наградување доволно безбедни за распоредување во реалниот свет.