
Митап "Исполнение запросов: Trino и Spark" состоится 10 апреля 2025 года в 17:00 (мск).
На предстоящем митапе участники разберутся, как движок Trino исполняет запросы на развернутом в Яндекс Облаке кластере. Для контекста будет кратко рассмотрено, как аналогичные процессы реализует другой популярный движок — Apache Spark.
Углубившись в детали выполнения запросов (stage, task, driver), участники на примере типовых запросов к данным бенчмарка TPC-DS изучат работу планировщика Trino. Будет проведено сравнение с аналогичными вычислениями в Apache Spark, а также анализ факторов, благодаря которым Trino демонстрирует более высокую производительность.
Программа митапа включает следующие блоки:
-
Краткий обзор
— История появления Trino
— Архитектура решений
— Обзор рабочего кластера (Trino и Spark)
— Обзор интерфейсов взаимодействия с движками -
Процесс исполнения
— Принципы выполнения запросов в Trino
— Методика анализа исполнения в Trino
— Принципы выполнения запросов в Spark
— Подход к анализу исполнения в Spark -
Сравнение на реальных запросах
— Краткий обзор бенчмарка TPC-DS
— Подготовка и структура данных
— Сравнительный анализ производительности Trino и Spark -
Заключение и выводы
Мероприятие организует «Школа больших данных».
Онлайн,Исполнение запросов: Trino и Spark

Дата проведения: 10.04.2025. Начало в 17:00
Место проведения: Онлайн
- Анонс
- Программа
- Участники
- Спикеры
Митап "Исполнение запросов: Trino и Spark" состоится 10 апреля 2025 года в 17:00 (мск).
На предстоящем митапе участники разберутся, как движок Trino исполняет запросы на развернутом в Яндекс Облаке кластере. Для контекста будет кратко рассмотрено, как аналогичные процессы реализует другой популярный движок — Apache Spark.
Углубившись в детали выполнения запросов (stage, task, driver), участники на примере типовых запросов к данным бенчмарка TPC-DS изучат работу планировщика Trino. Будет проведено сравнение с аналогичными вычислениями в Apache Spark, а также анализ факторов, благодаря которым Trino демонстрирует более высокую производительность.
Программа митапа включает следующие блоки:
-
Краткий обзор
— История появления Trino
— Архитектура решений
— Обзор рабочего кластера (Trino и Spark)
— Обзор интерфейсов взаимодействия с движками -
Процесс исполнения
— Принципы выполнения запросов в Trino
— Методика анализа исполнения в Trino
— Принципы выполнения запросов в Spark
— Подход к анализу исполнения в Spark -
Сравнение на реальных запросах
— Краткий обзор бенчмарка TPC-DS
— Подготовка и структура данных
— Сравнительный анализ производительности Trino и Spark -
Заключение и выводы
Мероприятие организует «Школа больших данных».