Архитектура процессора эльбрус: стоит ли все это своих денег?

Сколько стоит разработка моноблока

В соответствии с отчетными данными ИНЭУМ (копия документа имеется в распоряжении CNews), как минимум к середине 2018 г. одним из запланированных институтом к инвестиционных проектов с горизонтом реализации в 2,5-4 года было создание высокопроизводительного моноблока на «Эльбрус-8С». Заложенная на проект сумма была выставлена на уровне 126,3 млн руб.

Чем отличается производительность СХД на базе процессоров «Эльбрус» и Intel
техника

О том, что эта разработка является для ИНЭУМ действительно инвестиционной (за свой счет), а не заказной, косвенно свидетельствует тот факт, что каких либо госконтрактов по этой тематике институт, по данным сайта госзакупок и базы «Контур.фокус», не заключал.

Подробности проекта

Для экспериментов по портированию игр на микроархитектуру «‎Эльбрус» и тестового сравнения использовалась рабочая станция «Эльбрус 801-РС» на базе серийно выпускаемого с 2016 г. восьмиядерного процессора «Эльбрус-8С» четвертого поколения с тактовой частотой 1,3 ГГц. В тестах использовалась система с видеокартой AMD Radeon R9 380 и 32 ГБ оперативной памяти DDR3 под управлением ОС «‎Эльбрус Линукс 6.0 rc3», с Vulkan и компилятором LCC 1.25.09.

Для сравнения была выбрана аппаратная платформа, схожая по годам разработки и производительности, на базе процессора Intel Core i5-3570 с тактовой частотой 3,4 ГГц, видеокарты Nvidia GeForce GTX 960, 16 ГБ оперативной памяти DDR3, под управлением ОС Windows 8.1.

Скриншот: игра Enlisted на системе «Эльбрус 801-РС»

Игра War Thunder запускалась в оконном режиме с разрешением 1908×1040, настройками графики Maximum и настройкой «Tire/tracks marks» в «None». Игры Enlisted и CRSED запускались в оконном режиме с разрешением 1908×1040, настройками графики по умолчанию и отключенной Global Illumination.

На ИБ-отрасль неизбежно окажет влияние развитие роботизации
Безопасность

При тестировании War Thunder в режиме тестового выезда на танке (сразу после загрузки, без движения техники) система на «Эльбрус-8С» показала примерно 82 FPS, система на Intel Core i5-3570 — порядка 70 FPS.

Игра War Thunder, запущенная на «Эльбрус 801-РС»

В игре Enlisted с одним игроком и тремя ботами «Эльбрус» показал порядка 30 FPS, Intel Core — 75 FPS, в бенчмарке CRSED было достигнуто 43,6 FPS и 90,5 FPS, а в игровом режиме CRSED с одним игроком и пятью ботами — 35 FPS и 95 FPS, соответственно. В неожиданно низком результате для ПК в первом и четвертом случае, по мнению разработчиков, скорее всего виновен драйвер Vulkan для Windows.

Результаты тестов

Результаты тестов сведены в две таблицы.

Эльбрус 8С (СХД Аэродиск Восток 2-Э12)

Intel Xeon E5-2603 v4 (СХД Аэродиск Engine N2)

Результаты получились крайне интересные. В обоих случаях мы хорошо утилизировали процессорные мощности СХД (70-90% утилизации), и при таком раскладе явно бросаются в глаза плюсы и минусы обоих процессоров.

В обеих таблицах зеленым цветом выделены тесты, где процессоры «чувствуют себя уверенно» и показывают хорошие результаты, ну а оранжевым цветом выделены ситуации, которые процессоры «не любят».

Если говорить о случайной нагрузке небольшими блоками, то:

  • с точки зрения случайного чтения Intel, безусловно, впереди Эльбруса, разница в 2 раза;
  • с точки зрения случайной записи однозначно ничья, оба процессора показали примерно равные и достойные результаты.

В последовательной нагрузке небольшими блоками картина другая:

А вот в последовательной нагрузке большими блоками картина прямо противоположная:

Есть ещё одна интересная особенность Эльбруса, на которую читатель может обратить внимание, посмотрев на таблицу. Если взглянуть на разницу показателей чтения и записи у Intel, то во всех тестах чтение опережает запись в среднем примерно на 50%+

Это норма, к которой все (в том числе и мы) привыкли. Если посмотреть на Эльбрус, то показатели записи значительно ближе к показателям чтения, чтение опережает запись, как правило, на 10 – 30%, не более.

О чем это говорит? О том, что Эльбрус «очень любит» запись, а это, в свою очередь, говорит о том, что этот процессор будет очень полезен в задачах, где запись явно преобладает над чтением (кто сказал закон Яровой?), что также является несомненным преимуществом архитектуры e2k, и это преимущество нужно развивать.

Процессор «Эльбрус-8С»! 28 нанометров. Россия вперёд!

Хотя нет, до него уже была ранее выпушена предыдущая 1 версия российского компьютера Эльбрус 4.4.

Давайте посмотрим из чего он сделан и какие характеристики Эльбрус-401. Компьютер собран в корпусе MiniTower и стоит совсем не дешево, хотя цена Эльбрус-401 в дальнейшем должна снизится. Пк работает на операционной системе «Эльбрус» основанный на ядре Linux с возможностью установки и других операционных систем поддерживающих запуск на платформе Intel x86, х86-64.

Вот некоторые характеристики компьютера АРМ Эльбрус-401: работа на таковой частоте 800 МГц, жесткий диск объемом 1 Тб и mSATA на 128 Гб, 24 Гб оперативной памяти с возможностью расширения до 96 ГБ, видеокарта AMD Radeon серии 6000,

Эльбрус-401 это лишь одна из первых российских компьютеров, к сожалению пока ПК совсем не дешевый. В дальнейшем в процессе массового производства цена на компьютеры Эльбрус должна снизится. Так же в дальнейшем в России будут выпускаться не только компьютеры, но и ноутбуки, планшеты и мощные смартфоны.

Хотелось бы узнать ваше мнение, смогут ли российские технологи конкурировать с зарубежными производителями и когда по вашему мнению это должно случиться. Оставьте свой отзыв о будущем компьютерной техники в России.

Светлое будущее

Как мы писали выше, массовое производство Эльбруса 8С по факту стартовало буквально недавно – в начале 2019 года и к декабрю уже было выпущено около 4000 процессоров. Для сравнения, процессоров предыдущего поколения Эльбрус 4С за весь период их производства было выпущено всего 5000, так что прогресс налицо.

Понятное дело, что это капля в море, даже для российского рынка, но дорогу осилит идущий.
На 2020 год запланирован выпуск нескольких десятков тысяч процессоров Эльбрус 8С, а это уже серьезная цифра. Кроме того, в течение 2020 года процессор Эльбрус-8СВ должен быть доведён командой МЦСТ до серийного производства.

Такие производственные планы — это заявка на очень значимую долю всего отечественного рынка серверных процессоров.

В итоге уже здесь и сейчас мы имеем хороший и современный российский процессор с понятной и на наш взгляд верной стратегией развития, на базе которого есть максимально защищенная и сертифицированная система хранения данных российского производства (а в будущем и система виртуализации на Эльбрус-16С). Система российская настолько, насколько сейчас это физически возможно в современных условиях.

Мы часто наблюдаем в новостях очередные эпические провалы компаний, которые гордо называют себя российскими производителями, а по факту занимаются переклеиванием этикеток, не добавляя к продукции зарубежного производителя никакой собственной ценности, кроме своей наценки. Такие компании, к сожалению, бросают тень на всех реальных российских разработчиков и производителей.

Этой статьей мы хотим наглядно показать, что в нашей стране были, есть и будут компании, которые реально и качественно делают современные сложные ИТ-системы и активно развиваются, а импортозамещение в ИТ – это не профанация, а реальность, в которой мы все живём. Эту реальность можно не любить, можно критиковать, а можно работать и делать её лучше.

Развал СССР в свое время помешал коллективу создателей Эльбруса стать заметным игроком в мире процессоров и вынудил коллектив искать финансирование своих разработок за рубежом. Оно было найдено, работа была выполнена, а интеллектуальная собственность сохранена, за что хочется сказать этим людям огромное спасибо!

На этом пока все, пишите, пожалуйста ваши комментарии, вопросы и, конечно, критику. Мы всегда рады.

Также от лица всей компании Аэродиск хочу поздравить всё российское ИТ-сообщество с наступающим Новым годом и Рождеством, пожелать 100% аптайма – и чтобы бэкапы в новом году никому не пригодились))).

Используемые материалы

Статья с общим описанием технологий, архитектур и персоналий:https://www.ixbt.com/cpu/e2k-spec.html

Краткая история компьютеров под именем «Эльбрус»:https://topwar.ru/34409-istoriya-kompyuterov-elbrus.html

Общая статья об архитектуре e2k:https://ru.wikipedia.org/wiki/%D0%AD%D0%BB%D1%8C%D0%B1%D1%80%D1%83%D1%81_2000

Статья именно о 4-м поколении (Эльбрус-8С) и 5-м поколении (Эльбрус-8СВ, 2020 год):https://ru.wikipedia.org/wiki/%D0%AD%D0%BB%D1%8C%D0%B1%D1%80%D1%83%D1%81-8%D0%A1

Спецификации следующего 6-го поколения процессоров (Эльбрус-16СВ, 2021 год):https://ru.wikipedia.org/wiki/%D0%AD%D0%BB%D1%8C%D0%B1%D1%80%D1%83%D1%81-16%D0%A1

Официальное описание архитектуры Эльбрус:http://www.elbrus.ru/elbrus_arch

Планы разработчиков аппаратно-программной платформы «Эльбрус» по созданию суперкомпьютера экзафлопсной производительности:http://www.mcst.ru/files/5a9eb2/a10cd8/501810/000003/kim_a._k._perekatov_v._i._feldman_v._m._na_puti_k_rossiyskoy_ekzasisteme_plany_razrabotchikov.pdf

Российские технологии «Эльбрус» для персональных компьютеров, серверов и суперкомпьютеров:http://www.mcst.ru/files/5472ef/770cd8/50ea05/000001/rossiyskietehnologiielbrus-it-edu9-201410l.pdf

Старая статья Бориса Бабаяна, но до сих пор актуальная:http://www.mcst.ru/e2k_arch.shtml

Старая статья Михаила Кузьминского:https://www.osp.ru/os/1999/05-06/179819

Презентация МЦСТ, общая информация:https://yadi.sk/i/HDj7d31jTDlDgA

Информация об ОС Альт для платформы Эльбрус:https://altlinux.org/эльбрус

Характеристики

Номенклатура
Серия микросхемы 1891ВМ12Я
Модельный ряд 1891ВМ12АЯ: частота до 1350 МГц, потребление 110 Вт1891ВМ12АЯ: частота до 1500 МГц, потребление 90 Вт1891ВМ12АЯ: частота 1200–1350 МГц, потребление 90–110 Вт
Технические характеристики
Архитектура Эльбрус, версия 5
Масштабируемость 8 ядер в процессоре4 процессора в модуле (8 Гбайт/с попарные связи)
Тактовая частота 1891ВМ12АЯ: до 1350 МГц1891ВМ12БЯ: до 1500 МГц1891ВМ12ВЯ: 1200–1350 МГц
Пиковая производительность 50 операций в такт в каждом ядре (8 цел., 24 веществ.)1891ВМ12АЯ: 512 GFLOPS FP32, 256 GFLOPS FP641891ВМ12БЯ: 570 GFLOPS FP32, 285 GFLOPS FP641891ВМ12ВЯ: 450–512 GFLOPS FP32, 275–256 GFLOPS FP64
Кэш-память L1: 64 Кбайт данные + 128 Кбайт команды в каждом ядреL2: 512 Кбайт в каждом ядре, 4 Мбайт суммарноL3: 16 Мбайт в процессоре
Оперативная память 4 канала DDR4-2400 registered ECC, до 68,3 Гбайт/с128 Гбайт на процессор1 Тбайт адресное пространство машины
Периферия 1 канал ввода-вывода, до 8 Гбайт/с в каждую сторонусовместимый контроллер — КПИ-2
Технологические параметры
Топология 3,5 млрд. транзисторов28 нм техпроцесс, 350 мм² площадь кристалла
Корпус 59,5×43,0×4,6 мм, 32,0 г2028 контактов FCBGA
Электропитание 0,6 В, 1,0 В, 1,06 В, 1,2 В, 1,8 В1891ВМ12АЯ: 110 Вт макс. динам., 80–90 Вт типов. рассеив.1891ВМ12БЯ: 90 Вт макс. динам., 80 Вт типов. рассеив.1891ВМ12ВЯ: 90–110 Вт макс. динам., 70–90 Вт типов. рассеив.
Условия эксплуатации 1891ВМ12АЯ: −45…+100 °C1891ВМ12БЯ: −45…+ 60 °C1891ВМ12ВЯ: −45…+100 °C(верхняя граница — температура крышки корпуса)
Доступность серийное производство с 2020 года

Полностью отечественный ПК

Концерн «Автоматика», входящий в состав госкорпорации «Ростех», разработал вычислительный комплекс «Эльбрус 801-К». Это компьютер на основе российского процессора «Эльбрус-8С», и, как сообщили CNews представители «Ростеха», он может применяться в качестве промышленного сервера или рабочей станции либо размещаться на транспортных средствах, где необходима быстрая обработка больших объемов данных.

Компьютер был создан для эксплуатации в труднодоступных для техобслуживания местах. Помимо этого, он может применяться для работы в составе мобильных центров обработки данных (ЦОД) или в качестве бортовой цифровой вычислительной машины. Сотрудники «Ростеха» рассказали CNews, что «Эльбрус 801-К» также может использоваться везде, где требуются защищенные промышленные компьютеры либо вычислительные серверы, например, в железнодорожной сферах, а также в области добывающей промышленности и на промышленных предприятиях, Компьютер может устанавливаться непосредственно в цехах, в сложных условиях эксплуатации.

«Эльбрус 801-К»

«Промышленный компьютер на базе процессора Эльбрус-8С позволяет создавать экономичные вычислительные узлы. Новинка Концерна “Автоматика” обеспечивает выполнение любых современных задач в самых сложных условиях и будет незаменима в энергетической и транспортной отраслях, а также в силовых ведомствах», – отметил генеральный директор Концерна «Автоматика» Владимир Кабанов.

Характеристики

Номенклатура
Серия микросхемы 1891ВМ028
Модельный ряд 1891ВМ02А8 — с тактовой частотой до 1300 МГц1891ВМ02Б8 — с тактовой частотой до 1000 МГц
Технические характеристики
Архитектура Эльбрус, версия 4
Масштабируемость 8 ядер в процессоре4 процессора в модуле (8 Гбайт/с попарные связи)
Тактовая частота 1300 МГц (1891ВМ02А8)1000 МГц (1891ВМ02Б8)
Пиковая производительность 25 операций в такт в каждом ядре (8 цел., 12 веществ.)250 GFLOPS одинарной точности, 125 GFLOPS двойной точности
Кэш-память L1: 64 Кбайт данные + 128 Кбайт команды в каждом ядреL2: 512 Кбайт в каждом ядре, 4 Мбайт суммарноL3: 16 Мбайт в процессоре
Оперативная память 4 канала DDR3-1600 registered ECC, до 51,2 Гбайт/с64 Гбайт на процессор1 Тбайт адресное пространство машины
Периферия 1 канал ввода-вывода, до 8 Гбайт/с в каждую сторонусовместимый контроллер — КПИ-2
Технологические параметры
Топология 2,73 млрд. транзисторов28 нм техпроцесс, 322 мм² площадь кристалла
Корпус 59,5×43,0×4,6 мм, 32,0 г2028 контактов FCBGA
Электропитание 0,9 В, 1,0 В, 1,15 В, 1,5 В, 1,8 В80 Вт (1891ВМ02А8)60 Вт (1891ВМ02Б8)
Условия эксплуатации −45…+100 °C
Доступность серийный выпуск с 2016 года

Методика тестирования

Для генерации нагрузки мы использовали популярную и проверенную временем программу Flexible IO (FIO).

Обе СХД сконфигурированы согласно нашим же рекомендациям по настройке, исходя из требований к высокой производительности на блочном доступе, поэтому используем дисковые пулы DDP (Dynamic Disk Pool). Чтобы не искажать результаты тестирования, на обеих СХД отключаем компрессию, дедупликацию и RAM-кэш.

Созданы 8 D-LUN-ов в RAID-10 по 500 ГБ, каждый, суммарный полезный объём составляет 4 ТБ (т.е. примерно 70% от возможной полезной емкости данной конфигурации).

Выполняться будут основные и популярные сценарии использования СХД, в частности:

первые два теста эмулируют работу транзакционной СУБД. В этой группе тестов нам интересны IOPS-ы и задержка.

1) Случайное чтение маленькими блоками 4k
a. Размер блока = 4k
b. Чтение/запись = 100%/0%
c. Количество работ = 8
d. Глубина очереди = 32
e. Характер нагрузки = Full Random

2) Случайная запись маленькими блоками 4k
a. Размер блока = 4k
b. Чтение/запись = 0%/100%
c. Количество работ = 8
d. Глубина очереди = 32
e. Характер нагрузки = Full Random

вторые два теста эмулируют работу аналитической части СУБД. В этой группе тестов нам также интересны IOPS-ы и задержка.

3) Последовательное чтение маленькими блоками 4k
a. Размер блока = 4k
b. Чтение/запись = 100%/0%
c. Количество работ = 8
d. Глубина очереди = 32
e. Характер нагрузки = Sequential

4) Последовательная запись маленькими блоками 4k
a. Размер блока = 4k
b. Чтение/запись = 0%/100%
c. Количество работ = 8
d. Глубина очереди = 32
e. Характер нагрузки = Sequential

третья группа тестов эмулирует работу потокового чтения (пример – онлайн трансляции, восстановление резервных копий) и потоковой записи (пример – видеонаблюдение, запись резервных копий). В этой группе тестов нам уже интересны не IOPS-ы, а MB/s и также задержка.

5) Последовательное чтение большими блоками 128k
a. Размер блока = 128k
b. Чтение/запись = 0%/100%
c. Количество работ = 8
d. Глубина очереди = 32
e. Характер нагрузки = Sequential

6) Последовательная запись большими блоками 128k
a. Размер блока = 128k
b. Чтение/запись = 0%/100%
c. Количество работ = 8
d. Глубина очереди = 32
e. Характер нагрузки = Sequential

Каждый тест будет длиться один час без учета времени прогрева массива в 7 минут.

Значение проекта

Согласно экспертному мнению разработчиков из Gaijin Entertainment, российский процессор «Эльбрус-8С» уже «можно считать подходящим для запуска современных игр», тем более, что 30-40 FPS, хотя и не рекорд по нынешним меркам, но вполне достаточно чтобы поиграть против ботов, а более 60 FPS в War Thunder можно считать успешным результатом. На следующем этапе в Gaijin Entertainment намерены ознакомиться с возможностями процессора «Эльбрус-8СВ» пятого поколения.

Мощные видеоигры работают на российском процессоре «‎Эльбрус-8С»

Как пояснил CNews Константин Трушкин, при запуске тех же игр и подобных приложений на процессорах «Эльбрус-8СВ» никаких сложностей или проблем не ожидается. Разница лишь в том, что в отличие от четвертого поколения, процессоры «Эльбрус-8СВ» пятого поколения поддерживают ряд новых технологий и функций, которые не смогут проявить себя на старом ПО. Дальнейшая оптимизация программных инструментов под возможности новых процессоров обеспечит соответствующий рост производительности.

Итоги эксперимента в МЦСТ оценили как очень важные для дальнейшего развития экосистемы «Эльбрус». В компании надеются на дальнейшее сотрудничество с Gaijin Entertainment и готовы оказывать коллегам помощь при работе с новыми поколениями процессоров «Эльбрус».

На вопрос CNews о перспективах поддержки процессорами производства МЦСТ мощного графического ПО Константин Трушкин рассказал, что сегодня большая часть таких «тяжелых» приложений, например, в области САПР, как правило, обеспечены поддержкой платформы Windows, однако по мере появления версий под Linux их портирование под «Эльбрусы» не займет много времени и ресурсов, тем более что 512-битная ширина команд VLIW-процессоров «Эльбрус» подтвердила высокую эффективность в работе со сложными графическими задачами.

Так, еще в 2016 г. CNews сообщил об адаптации компанией «Тесис» при участии МЦСТ первой системы для инженерных расчетов Flowvision. По словам Константина Трушкина, современные процессоры «Эльбрус» готовы к работе с подобными комплексными нагрузками и могут обеспечить достаточно высокую производительность. В настоящее время МЦСТ сотрудничает с рядом российских компаний, в том числе, по вопросам переноса приложений класса САПР на платформу «Эльбрус».

Константин Трушкин также рассказал CNews о том, что разработчики МЦСТ проводят исследования в области применения процессоров «Эльбрус» в связке с графическими картами для ускорения научных и прикладных вычислений, в том числе, для задач машинного обучения.

В частности, в настоящее время уже проведена полноценная адаптация экосистемы «Эльбрус» для API OpenCL, и системы с графические картами AMD показывают высокий уровень производительности. С видеокартами Nvidia, по словам Константина Трушкина, ситуация пока сложнее — ввиду закрытости их кода, но в МЦСТ работают над этим вопросом.

Выводы и ближайшее будущее

Сравнительные тесты процессоров среднего уровня Эльбрус и Intel для задач хранения данных показали примерно равные и одинаково достойные результаты, при этом каждый процессор показал свои интересные особенности.

Intel сильно превзошел Эльбрус в случайном чтении небольшими блоками, а также в последовательном чтении и записи небольшими блоками.

При случайной записи небольшими блоками оба процессора показывают равные результаты.

По показателям задержки Эльбрус выглядит значительно лучше Intel-а в потоковой нагрузке, т.е. в последовательном чтении и записи большими блоками.

Кроме того, Эльбрус в отличии от Intel, одинаково хорошо справляется как с нагрузками чтения, так и с нагрузками записи, в то время как у Intel чтение всегда значительно лучше записи.
Исходя из полученных результатов можно сделать вывод о применимости систем хранения данных Аэродиск Восток на процессоре Эльбрус 8С в следующих задачах:

  • информационные системы с преобладанием операций записи;
  • файловый доступ;
  • онлайн-трансляции;
  • видеонаблюдение;
  • резервное копирование;
  • медиа-контент.

Коллективу МЦСТ есть ещё над чем работать, но результат их работы виден уже сейчас, что, конечно, не может не радовать.

Данные тесты проводились на ядре Linux для e2k версии 4.19, на текущий момент в бета-тестах (в МЦСТ, в Базальт СПО, а также у нас, в Аэродиске) находится ядро Linux 5.4-e2k, в котором, кроме всего прочего, серьезно переработан планировщик и много оптимизаций под скоростные твердотельные накопители. Также специально для ядер ветки 5.х.х АО «МЦСТ» выпускает новый компилятор LCC версии 1.25. По предварительным результатам, на том же процессоре Эльбрус 8С, собранное новым компилятором новое же ядро, окружение ядра, системные утилиты и библиотеки и, собственно, ПО Аэродиск ВОСТОК позволит получить ещё более значительный прирост производительности. И это без замены оборудования — на том же процессоре и с теми же частотами.

Мы ожидаем выхода версии Аэродиск ВОСТОК на базе ядра 5.4 ближе к концу года, и как только работа над новой версией будет завершена, мы обновим результаты тестирования и также опубликуем их здесь.

Если теперь вернуться к началу статьи и ответить на вопрос, кто же прав: пессимисты, которые говорят, что Эльбрус «никакой» и никогда не догонит ведущих производителей процессоров, или все-таки оптимисты, которые говорят, что «уже почти догнали и скоро перегоним»? Если исходить не из стереотипов и религиозных предубеждений, а из реальных тестов, то, однозначно, правы оптимисты.

Эльбрус уже сейчас показывает хорошие результаты, если сравнивать его с процессорами x86-64 среднего уровня. До верхних в линейке моделей серверных процессоров Intel или AMD 8-ке Эльбруса, конечно, далеко, но она туда и не целилась, для этого будут выпущены процессоры 16С и 32С. Вот тогда и поговорим.

Мы понимаем, что после этой статьи вопросов про Эльбрус станет ещё больше, поэтому мы решили организовать ещё один онлайн-вебинар «ОколоИТ», чтобы в прямом эфире на эти вопросы дать ответы.

→ Регистрация на вебинар

Рейтинг
( Пока оценок нет )
Понравилась статья? Поделиться с друзьями:
Техноарена
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: