Программа AI AlphaGo Zero за несколько часов самообучения стала лучшей в игре в шахматы, Го и японские шахматы | Последние новости сегодня в мире науке и техники
Программе искусственного интеллекта AlphaGo Zero, разработанной подразделением DeepMind компании Google, потребовалось всего четыре часа времени игры самой с собой для того, чтобы достичь уровня игры, превосходящего уровень игры в шахматы любого человека или другой компьютерной программы. В матче из 100 игр программа AlphaGo Zero одержала победу со счетом 28:0 над программой Stockfish, которая уже достаточно давно является мировым чемпионом по шахматам среди компьютерных программ, сообщает dailytechinfo.org.
Процесс обучения программы AlphaGo Zero всегда начинается с нуля, в программу вводятся только базовые правила самой игры. После этого, программа начинает играть сама с собой, делая с начала самые случайные ходы. Через непродолжительное время программа начинает накапливать опыт и уровень ее игры заметно повышается. За 24 часа такого самообучения программа AlphaGo Zero приобрела "сверхчеловеческий" уровень игры в шахматы, Го и Сеги (японские шахматы), одержав каждый раз убедительную победу над другой программой, имеющей звание чемпиона мира среди компьютерных программ в данном виде.
Такая скорость и эффективность процесса самообучения стали результатом длительного подбора параметров работы и настроек искусственной нейронной сети, которая лежит в основе системы искусственного интеллекта. Подбор же некоторых других параметров возложен на саму программу и она выполняет эту задачу, используя метод оптимизации Байса. Единственным "искусственным" моментом в процессе самообучения является "шум" в виде набора случайных данных, который является тем, что толкает программу сделать первый ход и запустить процесс самообучения.
Как уже упоминалось выше, перед началом процесса самообучения в программу вводятся все правила и базовые принципы игры. Интересным является то, что эти правила и допустимые действия кодируются в виде плоских (двухмерных) и трехмерных векторов.
Универсальность нового метода самообучения подтверждается тем, что при обучении программы AlphaGo Zero игре в шахматы, Го и Сеги использовался один и тот же набор стартовых параметров, настроек алгоритмов и архитектура нейронной сети. Каждый отдельный экземпляр программы AlphaGo Zero обучался какому-либо одному виду игры, и обычно процесс обучения укладывался в 700 тысяч ходов, сделанных программой. В данном процессе были задействованы мощности 5000 специализированных процессоров TPU первого поколения и 64 TPU-процессоров второго поколения.
Программа AlphaGo Zero выиграла в шахматы у программы Stockfish после 4 часов самообучения, в течении которых она сделала 300 тысяч ходов. В Сеги программа AlphaGo Zero одержала победу над программой Elmo после 2 часов и 110 тысяч сделанных ходов. А в Го программа AlphaGo Zero одержала победу над программой AlphaGo Lee после восьми часов и 165 тысяч ходов самообучения.
Корпорация Google по ошибке запустила рекламную кампанию за $10 млн на открытой бирже, где можно покупать и продавать для нее место через аукцион в режиме онлайн. Проблема возникла из-за стажера, ...
В рамках конференции Snapdragon Tech Summit 2018 состоялся анонс коммерческих мобильных сетей пятого поколения. Сотрудники компании Qualcomm рассказали о преимуществах сети нового поколения, сообщает ...
Google составила рейтинг популярных среди украинцев видео на YouTube. В нынешнем году лидером стала первая серия сериала Школа. Его показывали на 1 + 1. У него почти 6,8 млн просмотров. Кроме ...
Google представила подборку популярных видео YouTube 2018 в мире. Готовя рейтинг, аналитики учитывали количество просмотров, общее время сеанса, количество пересылок, комментариев и предпочтений. ...
Японские инженеры посадили за руль автомобиля работа. Робот похож на человека. Имеет пары ног и рук. Их приводят в движение электромоторы, пишет 24 канал. Техника выполняет стандартные схемы ...
6 декабря 1945-го американский инженер Перси Спенсер запатентовал свое изобретение - СВЧ-излучатель для подогрева пищи. Спенсер работал в военно-промышленной компании Raytheon. Занимался ...
Ступень ракеты-носителя Falcon 9 упала в Атлантический океан. Ракета запустили на Международную космическую станцию с базы военно-воздушных сил Соединенных Штатов на мысе Канаверал. Ее первая ...
В Европе произошел масштабный сбой в работе Facebook и Instagram Пользователи жалуются, что соцсеть выбрасывает их из личных аккаунтов, и они не могут войти в них снова, передает Downdetector. ...
Стокгольмский стартап Furhat Robotics создал робота для обучения сотрудников. Разработка поможет научиться общаться с недовольными клиентами и сообщать им неприятные новости, сообщили на официальном ...
Компания Google составила рейтинг лучших мобильных приложений нынешнего года. В рейтинг категории Most Casual Games попала игра украинской разработки Orbia: Tap and Relax. Ее создали в киевской ...
Компания Google составила рейтинг лучших мобильных приложений нынешнего года. В рейтинг категории Most Casual Games попала игра украинской разработки Orbia: Tap and Relax. Ее создали в киевской ...
Американская компания Microsoft разрабатывает новый браузер на основе платформы от Google Chromium. Кодовое название новинки - Anaheim. Она заменит стандартный браузер Edge, пишет УНИАН. На основе ...
Военная программа под названием Integrated Visual Augmentation System (IVAS) преследует цель разработки шлема, который даст солдатам США преимущества в бою.
Представители ASUS в Украине сделали официальный анонс о игровой смартфон серии Republic of Gamers Phone. Он возглавлял рейтинг самых мощных мобильных устройств сентября 2018, передает Pocket-lint. ...
Американская компания SpaceX побила рекорды по количеству запусков за год и количеством доставленных на орбиту спутников за один раз. Ракета Falcon 9 была запущена 3 декабря с военной базы Ванденберг ...
Быстрее всех заряжается смартфон Oppo R17 Pro. Ему хватает полчаса, чтобы получить 92% заряда. Большинство устройств за 30 мин. заряжают телефон на 50-60%, пишет Новое время. При зарядке Oppo ...
Быстрее всех заряжается смартфон Oppo R17 Pro. Ему хватает полчаса, чтобы получить 92% заряда. Большинство устройств за 30 мин. заряжают телефон на 50-60%, пишет Новое время. При зарядке Oppo ...
Японская автомобильная компания Toyota представила доработанного человекоподобного робота T-HR3. Отныне роботом можно управлять не только через прямое проводное подключение, но и дистанционно - через ...
В Южной Корее запустили коммерческую сеть 5G. Сеть пятого поколения тестировали на прототипе Galaxy S10, пишет Новое время. Видеосвязь из Банданга в Сеул сделал генеральный директор оператора SK ...
3 декабря 1992-го отправили первое в мире SMS. Технологию коротких мобильных сообщений разработал британский инженер Нейл Папуорт. Программист компании Sema Group тестировал новую технологию для ...
Ведомство по патентам и товарным знакам США утвердил ряд патентов Sony на необычные технологии для смартфонов будущего. Первый касается складываемого корпуса, который, скорее всего, станет трендом ...