4 июня 2026 г. в Москве (+онлайн) пройдет конференция infra.conf 2026.
Инженерные истории со смыслом. Всё про создание и эксплуатацию высоконагруженных систем и инфраструктуры.
Ключевые темы этого года:
- ML-инфраструктура
- Базы данных и стораджи
- Инструменты для разработчиков и платформы разработки, повышающие эффективность инженеров
- Observability
- SRE и эксплуатация
- Управление трафиком, Service Mesh, L7
Программу конференции готовят ключевые инженеры, разработчики и руководители разных команд Яндекса, большинство из них — с опытом в индустрии более 15 лет.
Москва, +онлайнinfra.conf 2026
- Анонс
- Программа
- Участники
- Спикеры
4 июня 2026 г. в Москве (+онлайн) пройдет конференция infra.conf 2026.
Инженерные истории со смыслом. Всё про создание и эксплуатацию высоконагруженных систем и инфраструктуры.
Ключевые темы этого года:
- ML-инфраструктура
- Базы данных и стораджи
- Инструменты для разработчиков и платформы разработки, повышающие эффективность инженеров
- Observability
- SRE и эксплуатация
- Управление трафиком, Service Mesh, L7
Программу конференции готовят ключевые инженеры, разработчики и руководители разных команд Яндекса, большинство из них — с опытом в индустрии более 15 лет.
ML-инфраструктура
- Эффективность обучения и инференса моделей
- Эффективность LLM. Новые архитектуры, фреймворки, RL, параллелизм, инференс и т.д.
- ML-платформы и тулинг для ML-команд
- Агентская инфраструктура
- Системы и подходы к менеджменту GPU-кластеров
- Инфраструктура подготовки данных
Базы данных и стораджи
- Архитектура больших стораджей: хранение данных, адаптация для обучения моделей
- Масштабирование: шардирование и автошардирование, инструменты шардирования реляционных СУБД, мультирегиональное развёртывание
- Надёжность хранения: распределённые транзакции, восстановление и самовосстановление, резервное копирование
- Оптимизация под железо: утилизация дисков, CPU и сети в СУБД, GPU для обработки запросов
- Индексы: «деревья», индексы, векторный поиск, полнотекстовый поиск в СУБД
- Выполнение SQL: движки, реализация операторов SQL, оптимизаторы запросов, адаптивная оптимизация
- Тестирование надёжности и производительности: катастрофоустойчивость, бенчмарки
- DBA и autotune: оптимизация, использование инструментов автонастройки, LLM-ассистенты для DBA
- СУБД для аналитики: колоночное хранение и выполнение, массивно-параллельное выполнение запросов
- Data Lake: ETL/ELT, Data Catalog, Data Lineage
- Потоковая обработка данных: очереди, системы стриминга
Инструменты для разработчиков и платформы разработки, повышающие эффективность инженеров
Практики управления разработкой:
- Локальная разработка — контейнеризация (Docker, Podman), мини‑кластеры (Kind, Minikube), локальные базы данных
- CI/CD — конвейеры, параллелизация тестов, артефакторные хранилища, деплой в Kubernetes отладка и профилирование — распределённая трассировка, анализ памяти/CPU, логирование в микросервисах
- Code collaboration — Git-флоу, review-инструменты, хуки pre-commit, генерация документации
- Платформенные решения (Internal Developer Platform, IDP) — самообслуживание, стандартизация конфигураций, абстракции над инфраструктурой
Observability
Комплексный подход к пониманию состояния системы через логи, метрики, трейсы и события:
- Сбор и агрегация данных — OpenTelemetry, Prometheus, ELK, OpenSearch, векторные агрегаторы (Vector, Fluent Bit)
- Корреляция сигналов — связывание логов, метрик и трейсов для диагностики инцидентов
- Алерты и SLO/SLI — пороги, шумоподавление, инцидент‑менеджмент, постмортемы
- Распределённая трассировка — контекст запросов, анализ задержек, выявление узких мест
- Observability для Kubernetes — мониторинг подов, узлов, сетевых политик, storage‑классов
SRE и эксплуатация
Принципы и практики обеспечения надёжности и доступности, автоматизация, управление инцидентами:
- SLO/SLA/SLI — определение метрик, бюджеты ошибок, компромисс между новизной и стабильностью
- Планирование ёмкости — нагрузка, пики, автоскейлинг, резервирование ресурсов
- Инциденты и восстановление — playbooks, war rooms, постмортем‑анализ, Blameless Culture
- Автоматизация рутины, самовосстановление систем, Chaos Engineering
Управление трафиком, Service Mesh, L7
Разработка мобильной Почты и персональных сервисов, Яндекс