Искусственный интеллект суперкомпьютера Baidu побил рекорд Google по качеству распознавания изображений

IT новости на Учитель программирования Ру
Китайская компания Baidu, во введении которой находится одноименная китайская национальная поисковая система, создала суперкомпьютер, оснащенный системой искусственного интеллекта, которая сумела, произведя анализ и распознавание одного миллиона изображений, ошибиться только в 4.58 процентах случаев. И такая эффективность распознавания изображений превышает эффективность программного обеспечения, разработанного Microsoft, Google и другими компаниями.

Суперкомпьютер Minwa имеет 72 мощных центральных процессоров и 144 графических процессоров, которые были ориентированы на обработку графической информации. Вычислительная мощность суперкомпьютера Minwa такова, что не будь он узкоспециализированной системой, ориентированной только на технологии глубинного изучения, он попал бы в первые три сотни списка из самых мощных современных суперкомпьютеров.

Для проверки способностей системы искусственного интеллекта Minwa он был “выпущен на просторы” ImageNet, базы данных, насчитывающей более миллиона изображений. Изначальной задачей, которая была поставлена перед суперкомпьютером, была сортировка изображений по более чем тысяче разных категорий. Для решения такой задачи требовалось, чтобы суперкомпьютер смог самостоятельно идентифицировать несоответствия в подобных изображениях, к примеру, в снимках собак разных пород.

Для выполнения этой задачи в недрах суперкомпьютера была создана нейронная сеть, способная не только выполнить распознавание объектов на изображениях с высокой разрешающей способностью, но и самообучаться, что позволило системе выявлять характерные особенности каждого из отдельных объектов. Некоторые из “скармливаемых” суперкомпьютеру данных были намеренно искажены, снимки были вставлены в причудливые рамки, на них были нанесены “водяные знаки”, некоторые изображения были криво подрезаны, искажены или имели “неправильную” цветовую гамму. Все это делалось для того, чтобы система искусственного интеллекта смогла изучить лишь главные характерные свойства каждого из объектов, не обращая внимания на второстепенные детали.

Такой процесс обучения привел к тому, что система искусственного интеллекта может распознать изображение, представленное в любой форме, даже когда оно распечатано при помощи ASCII-символов, повернуто на некоторый угол и сфотографировано снова. При этом, суперкомпьютер не смог справиться с задачей в 4.58 процентах случаев, что побило рекорд, установленный в свое время компанией Google, который составлял 4.8 процента.

Технология глубинного изучения является одной из базовых функций систем искусственного интеллекта. Такие технологии, которые эффективно используются для задач распознавания речи, лиц и изображений, требуют достаточно больших вычислительных мощностей. В недрах суперкомпьютера Minwa эти технологии были реализованы при помощи нейронной сети, насчитывающей сотни миллиардов связей, что делает эту сеть самой большой нейронной сетью, созданной людьми на настоящий момент времени.

В самом ближайшем времени компания Baidu планирует использовать еще более мощный, нежели Minwa, суперкомпьютер, который произведет изучение и распознавание 14 тысяч часов аудиозаписей. Обученная на всем этом нейронная сеть будет использована для разработки новых технологий распознавания речи на китайском и английском языках, которые впоследствии будут использоваться в различных сервисах компании.

Источник


Поделиться ссылочкой: