В рамках закончившейся на днях международной конференции по твердотельным полупроводникам (International Solid State Circuits Conference, ISSCC) разработчики из Массачусетского технологического института (Massachusetts Institute of Technology, MIT) представили 168-ядерный чип Eyeriss, обеспечивающий возможность локального запуска алгоритмов искусственного интеллекта (artificial intelligence, AI) непосредственно в смартфонах и других мобильных и встраиваемых устройствах.
С помощью нового 168-ядерного чипа Eyeriss мобильные и встраиваемые устройства получают возможность собирать, обрабатывать и анализировать различные данные, а также принимать решения о дальнейших действиях по результатам накопленного "опыта". Фактически, речь идёт о придании мобильной и IoT электронике возможности так называемого "глубокого машинного обучения" (Deep-Learning).
В современных реалиях, информация, собираемая подобными устройствами, системами и сенсорами, предварительно загружается на мощные облачные сервера, и только после обработки результат возвращается обратно в устройство. Для стабильного функционирования соответствующих функций необходимо не просто стабильное подключение к Интернету, но также желательно быстрое, с малыми задержками и обязательно с надёжно защищённым каналом.
Новый 168-ядерный чип Eyeriss, разработанный в MIT при содействии и частичном финансировании Агентства передовых оборонных исследовательских проектов при МО США (Defense Advanced Research Projects Agency, DARPA), использует в своей работе алгоритмы сложных нейронных сетей, и потому его производительность в отдельных приложениях в десятки раз может превышать возможности мобильного графического процессора с 200 ядрами.
Локальное исполнение вычислений не требует подключения к Интернету и внешним серверам, а также значительно сокращает расход энергии. Помимо этого, работа алгоритмов нейронной сети позволяет принимать некоторые решения по итогам локальной обработки исходных данных, и в Интернет отправляются только финальные результаты, что ведёт к сокращению бесполезного трафика.
Структура нейронных сетей представляет собой многослойный массив с огромным количеством вычислительных узлов, принимающих данные на одном уровне и передающих их на следующий, так что результат вычислений появляется после обработки данных на множестве уровней. По аналогии с человеческим мозгом, нейронные сети также способны "учиться" на собственном "опыте".
Основной задачей, поставленной перед создателями чипа Eyeriss, было достижение максимальной производительности при снижении частоты обращений вычислительных ядер для обмена данными с банками памяти, что в итоге давало бы экономию энергии и времени. В отличие от графического ускорителя, ядра которого обращаются к единому банку памяти, каждое ядро чипа Eyeriss обладает собственным банком памяти.
Специальный модуль процессора Eyeriss сжимает данные перед их отправкой на каждое ядро. Помимо этого, каждое вычислительное ядро Eyeriss имеет возможность прямого обращения к любому другому ядру, а за упорядочивание этих межъядерных коммуникации отвечает специальный встроенный контроллер.
В настоящее время технологии "машинного обучения" широко используются во многих приложениях, включая распознавание объектов, лиц и речи, при этом чаще всего для обработки исходных данных используются внешние системы с мощными многоядерными графическими ускорителями. В случае переноса технологий "интеллектуального самообучения" внутрь мобильных устройств, многие современные технологии смогут функционировать даже при отсутствии сетей Wi-Fi.
Работа над технологиями искусственного интеллекта и машинного обучения сегодня является приоритетной для таких известных компаний как IBM, Google, Microsoft, Qualcomm и Apple, а Nvidia даже включила глубокое машинное обучение и нейронные сети в свой стратегический план.