Как научить искусственный интеллект сделать все возможное, цифровой вселенной?

Мнoгиe из нaс пoмнят и знaют, кaкиe бывaют дeтскиe сaды. Нoмeрa учeбныx нaпичкaны игрушкaми и пaзлaми, музыкa и книги, цвeты и дaжe инoгдa кoтaми, кoгдa, тaким oбрaзoм, бoгaтый и пышный мир, с кoтoрым дeти мoгут игрaть и учиться игрaя. Нo вoпрeки рaсxoжeму мнeнию, дeтскaя игрa дaлeкo нe прoстaя. Oни нe тoлькo вeсeлo прoвeсти врeмя, oни учaтся, приoбрeтaют прeдстaвлeниe o мирe. Счeт игры рaзнooбрaзнoй и вoсxититeльнoй всeлeннoй мы лeлeeм мнoгoгoгрaнный интeллeкт рeбeнкa.

Пoчeму бы нe нaучить С тaким жe oбрaзoм?

Нe тaк дaвнo, нe прибыли институт OpenAI oткрыл виртуaльный мир ТO, чтo oн eгo исслeдoвaл и игрaл с ним. Цeль прoeктa Universe » (Всeлeннaя) нaстoлькo жe вeликa, кaк и eгo имя: нaучить oтдeльныe DI выпoлнить любую зaдaчу, кoтoрую чeлoвeк мoжeт выпoлнять с пoмoщью кoмпьютeрa.

Учить oтдeльныx aгeнтoв AI прeуспeвaть рaзличныx прoблeм рeaльнoгo мирa, OpenAI, в нaдeждe, чтo вeдeт нaс нa шaг ближe к дeйствитeльнo умным бoтaм — кoтoрыe имeют гибкиe навыки, благодаря вроде тех, которые у нас.

Интеллект общий уровень

Нет никаких сомнений в том, что ИИ становится пугающе умным.

Теперь компьютеры могут точно видеть, слышать и переводить на разных языках, иногда даже опережая людей. Только в начале этого года, из серии высокого уровня игры го, AlphaGo от DeepMind разгромил 18 раз чемпиона мира Ли Седоля, на десять лет раньше, чем ожидали некоторые эксперты.

Но правда в том, что ЕЙ хорошо только так, как их научили. Попросите AlphaGo играть в шахматы, и программа, скорее всего, по-машинному растеряется, даже если вы объясните ей правила мельчайшие детали.

Пока что в нашей системе AI — сверхэффективные лошадки одного трюка. Виноват отчасти это обучающий метод: ученые начинают с чистого листа AI, проводя через миллионы испытаний, прежде чем он преуспеет в одной задаче и решить ее. AI никогда не кто-то другой, потому что он знает, как решить любую другую проблему?

Чтобы попасть на общий уровень интеллекта — способного на человеческом уровне, использовать полученный опыт для решения новых проблем Ы нужно перенести свой опыт для решения других задач. И вот им поможет Universe. А, пройдя через мир, полный различных сценария, ученые OpenAI, в надежде, что AI будет получать знания о мире и гибкие навыки решения проблем, которые позволят ему «думать», а не застревать навсегда, только в петле.

Прекрасный новый мир

В принципе, Universe это мощная платформа, которая включает в себя тысячи в среде, как правило, обеспечивающих стандартные методы, обучение агентов AI. Будучи программного обеспечения для платформы, Universe обеспечивает часть запустить чужую программу обучались в разных средах — Atari и flash игры и приложения, веб-сайты, например, уже принят.

Спереди будут и другие.

В теории Universe может запускать любое программное обеспечение под любой компьютер, позволяет исследователям вставить и научить AI по желанию. Это как отправить ребенка в летний лагерь: выбираешь свою нишу, тип деятельности, ждешь, пока он ее освоит, затем другой и так далее, искупаться и повторить.

В Universe AI сотрудничает с виртуального мира так же, как люди используют компьютер: он «видит» пиксели на экране и использует виртуальную клавиатуру и мышь для ввода команды.

Это стало возможным благодаря Virtual Network Computing (VNC), в основном, системы, совместного использования рабочего стола, которая позволяет передавать движения для клавиатуры и мыши с одного компьютера (ОВ) другому (условия обучения). При изменении окружающей среды, VNC передает обновлен скриншот назад AI, что позволяет ему сделать следующий шаг. VNC стоит как глаза и руки ИИ.

Как происходит обучение?

Все ТО, что войдя в Universe, учили с помощью так называемого обучения с подкреплением, мощный метод, который привел к успеху AlphaGo. Под этим термином скрывается, но это, как мы, люди, тренируем дельфинов, собак и даже детей. Это обучение методом проб и ошибок: выберите действие, и если вам за это вознаградили, продолжать в том же духе. Если нет, попробуйте еще что-нибудь.

Вместо того, чтобы начать с абсолютно пустого AI, исследователи, иногда дает им импульс, давая им «кажется», как люди решают задачи. Это позволяет ЕЙ сформировать первое впечатление и иметь более полную картину о том, как оптимизировать свои решения.

Обучение с подкреплением уже используется во многих приложениях ИИ. Внутри Universe, кстати, в силу этой технологии раскрывается в полной мере. Потому что AI может перескакивать между играми и приложениями, он может принять изученное в одной церемонии, и использовать его, чтобы выяснить, в другую — это называется «трансферное обучение» или «обучение с переносом». Этот навык легко учиться, но ему нужно на пути к привлекательной машине.

По словам OpenAI, мы медленно движемся: некоторые из их агентов уже есть признаки того, переноса, чтобы узнать из одной игры с вождением на другой.

От игр в мире бит

Как и многие другие разработчики AI, OpenAI использует игры, чтобы подтолкнуть Universe, только не так: просто их оценить с позиции успеха. Потому что игра измеряется различными статистиками и оценкам, система может запросто использовать эти цифры, чтобы оценить прогресс в AI и вознаградит его должным образом. Это очень важно, что обучение с подкреплением.

Поскольку Universe на основе пикселей клавиатуры и люди также могут играть в игры на платформе. Этого обсуждения написано, и обеспечивает базовый уровень оценки отчетов AI (неплохая работенка, согласен).

Но игра — это лишь небольшая часть нашего взаимодействия с цифровым миром, и Universe уже за их пределы с проектом» World of Bits («Мини-бит мир»). Бит — это собрание различных взаимодействий с браузерами, с которыми мы сталкиваемся, бороздя пучины Интернета: после ввода текста или выбирает варианты из выпадающего меню, нажмите «отправить».

Эти задачи, хотя и простой, образуют основу того, как мы подключаемся к сокровищнице под названием Сеть. OpenAI хочет, чтобы ЕЙ свободно перемещался в Интернете — например, может заказать билет на самолет. В одном из средств массовой информации Universe ученые уже дает ЕЙ желаемый график букинга и учит его поиск авиабилетов в различных авиалиниях.

И это только начало.

Universe только растет и ширится. Платформа Мальме от «Microsoft», которая использует Minecraft для обучения ИИ, должны интегрироваться с Universe. Популярная игра с складыванием белка fold.ит-приложение для Android, игры HTML5 и больше стоят в очереди.

Призрак автомобиль

Таким образом, теперь мы можем научить ЕЙ играть в различные игры и серфинга в интернете. Большое дело, подумаешь. Будет ли это нас интеллект общий уровень?

Возможно, путь будет долгим.

Но ИИ, который знает, как выиграть в любой игре, что вы ему подбросите, может только думать логически и на несколько шагов добиваться победы. AI, который может передвигаться по хаотическому миру GTA V, уже должны понимать основы физики реального мира, жестокости и отзывчивость. AI, который может работать в Интернете, уже знает, как люди обычно общаются друг с другом и можете использовать эти знания, получить информацию, создать свою интернет-личность или даже заглянуть в ее.

Каждый день мы учимся, играем, работаем и растем в цифровом царстве. Для многих в мире нулей и единичек так же реально, как и та, в которой мы родились. Теперь, когда ИИ имеет доступ к цифровому миру, пришла его очередь ехать. Давайте посмотрим, как далеко он может пойти.

Комментирование и размещение ссылок запрещено.

Обсуждение закрыто.