Представлен первый набор данных с открытым исходным кодом для приложений машинного обучения при проектировании быстрых микросхем

Автоматизация электронного проектирования (EDA) или автоматизированное проектирование (CAD) — это категория программных инструментов для проектирования электронных систем, таких как интегральные схемы (ИС). С помощью инструментов EDA разработчики могут завершить процесс проектирования сверхбольших интегральных микросхем (СБИС) с миллиардами транзисторов. Инструменты EDA необходимы для современного проектирования СБИС из-за большого масштаба и высокой сложности электронных систем.

В последнее время, с бумом алгоритмов искусственного интеллекта (ИИ), сообщество EDA активно изучает методы ИИ для ИС для разработки усовершенствованных микросхем. Во многих исследованиях изучались методы, основанные на машинном обучении (ML), для задач межэтапного прогнозирования в процессе проектирования для достижения более быстрой конвергенции дизайна. Например, в 2021 году Google опубликовала в журнале Nature статью под названием «Методология размещения графов для быстрого проектирования микросхем», в которой используется обучение с подкреплением (RL) для размещения макросов в конструкции микросхемы.

Основная идея состоит в том, чтобы рассматривать расположение чипов как доску для го, а каждый макрос — как камень. Таким образом, агент RL можно предварительно обучить 10 000 внутренних образцов дизайна и научиться размещать по одному макросу за раз. Путем точной настройки агента для каждого проекта в течение примерно 6 часов он может превзойти производительность обычных инструментов EDA на чипах Google TPU и добиться лучшей производительности, мощности и площади (PPA).

Видно, что «ИИ для EDA» активно исследуется в сообществе автоматизации проектирования. Хотя для построения моделей машинного обучения обычно требуется большой объем данных, в большинстве исследований можно генерировать только небольшие внутренние наборы данных для проверки из-за отсутствия больших общедоступных наборов данных и сложности создания данных. С этой целью крайне необходим набор данных с открытым исходным кодом, посвященный задачам машинного обучения в EDA.

Чтобы решить эту проблему, исследовательская группа из Пекинского университета выпустила первый набор данных с открытым исходным кодом под названием CircuitNet, посвященный ИИ для приложений ИС в СБИС САПР. Набор данных состоит из более чем 10 000 образцов и 54 синтезированных списков цепей из шести проектов RISC-V с открытым исходным кодом, обеспечивает целостную поддержку задач межэтапного прогнозирования и поддерживает такие задачи, как прогнозирование перегрузки маршрутизации, прогнозирование нарушений правил проектирования (DRC) и IR. предсказание падения. Основные характеристики CircuitNet можно резюмировать следующим образом:

Крупномасштабный: набор данных состоит из более чем 10 000 образцов, извлеченных из универсальных запусков коммерческих инструментов EDA с коммерческими PDK (в настоящее время используется 28-нм технологический узел, и скоро будет поддерживаться 14-нм технология).
Разнообразие: различные настройки логического синтеза и физического проектирования вводятся для отражения различных ситуаций в процессе проектирования.
Множественные задачи: набор данных поддерживает три задачи прогнозирования, т. е. прогнозирование перегрузки, прогнозирование нарушения DRC и прогнозирование сброса IR. Набор данных включает функции, широко применяемые в современных методах, и подтвержден экспериментально.
Простые в использовании форматы: функции предварительно обрабатываются и преобразуются в массивы Numpy с удалением ограниченной информации. Пользователи могут легко загружать данные с помощью скриптов Python.

Чтобы оценить эффективность CircuitNet, авторы проверяют набор данных с помощью экспериментов по трем задачам прогнозирования: перегрузка, нарушения DRC и падение IR. Каждый эксперимент берет метод из недавних исследований и оценивает его результат в CircuitNet с теми же метриками оценки, что и исходные исследования. В целом результаты согласуются с оригинальными публикациями, что демонстрирует эффективность CircuitNet. Подробное руководство по экспериментальной установке доступно на GitHub. В будущем авторы планируют включить больше выборок данных с крупномасштабными проектами в передовые технологические узлы, чтобы улучшить масштаб и разнообразие набора данных.

Исследование было опубликовано в журнале Science China Information Sciences.