Добавить в календарь 13.03.2026 12:00 13.03.2026 14:00 Europe/Moscow Производительность и экономика при инференсе LLM

13 марта 2026 г. в 12.00 (мск) пройдет вебинар «Производительность и экономика при инференсе LLM».

На вебинаре спикеры из Spectr и Selectel разберут, из чего складывается экономика инференса и какие решения при проектировании снижают бюджет на порядок.

Вебинар будет полезен для CTO, архитекторов, руководителей продуктов и разработчиков, которые строят LLM-решения и хотят понимать экономику их эксплуатации.

В программе: 

  • как устроен инференс LLM и какие способы оптимизации производительности существуют;
  • из чего складывается стоимость эксплуатации LLM в продакшене;
  • как выбор LLM-модели и конфигурации GPU меняет стоимость инфраструктуры на порядок;
  • бенчмарки на реальном оборудовании: сравнение GPU в разных конфигурациях под нагрузкой;
  • свой сервер и API: расчёт с ценами российских провайдеров, что выгодней.

Участие бесплатное, необходима предварительная регистрация

Онлайн,

Производительность и экономика при инференсе LLM

Производительность и экономика при инференсе LLM

Дата проведения: 13.03.2026. Начало в 12:00

Место проведения: Онлайн

Организатор: Selectel (Селектел), Spectr
Будь в курсе всех мероприятий по теме ИТ-инфраструктура
  • Анонс
  • Программа
  • Участники
  • Спикеры

13 марта 2026 г. в 12.00 (мск) пройдет вебинар «Производительность и экономика при инференсе LLM».

На вебинаре спикеры из Spectr и Selectel разберут, из чего складывается экономика инференса и какие решения при проектировании снижают бюджет на порядок.

Вебинар будет полезен для CTO, архитекторов, руководителей продуктов и разработчиков, которые строят LLM-решения и хотят понимать экономику их эксплуатации.

В программе: 

  • как устроен инференс LLM и какие способы оптимизации производительности существуют;
  • из чего складывается стоимость эксплуатации LLM в продакшене;
  • как выбор LLM-модели и конфигурации GPU меняет стоимость инфраструктуры на порядок;
  • бенчмарки на реальном оборудовании: сравнение GPU в разных конфигурациях под нагрузкой;
  • свой сервер и API: расчёт с ценами российских провайдеров, что выгодней.

Участие бесплатное, необходима предварительная регистрация