Исполнение запросов: Trino и Spark

Trino-01.png

Дата проведения: 10.04.2025. Начало в 17:00

Место проведения: Онлайн

Организатор: Школа больших данных
Будь в курсе всех мероприятий по теме Big Data
  • Анонс
  • Программа
  • Участники
  • Спикеры

Митап "Исполнение запросов: Trino и Spark" состоится 10 апреля 2025 года в 17:00 (мск).

На предстоящем митапе участники разберутся, как движок Trino исполняет запросы на развернутом в Яндекс Облаке кластере. Для контекста будет кратко рассмотрено, как аналогичные процессы реализует другой популярный движок — Apache Spark.

Углубившись в детали выполнения запросов (stage, task, driver), участники на примере типовых запросов к данным бенчмарка TPC-DS изучат работу планировщика Trino. Будет проведено сравнение с аналогичными вычислениями в Apache Spark, а также анализ факторов, благодаря которым Trino демонстрирует более высокую производительность.

Программа митапа включает следующие блоки:

  1. Краткий обзор
    — История появления Trino
    — Архитектура решений
    — Обзор рабочего кластера (Trino и Spark)
    — Обзор интерфейсов взаимодействия с движками

  2. Процесс исполнения
    — Принципы выполнения запросов в Trino
    — Методика анализа исполнения в Trino
    — Принципы выполнения запросов в Spark
    — Подход к анализу исполнения в Spark

  3. Сравнение на реальных запросах
    — Краткий обзор бенчмарка TPC-DS
    — Подготовка и структура данных
    — Сравнительный анализ производительности Trino и Spark

  4. Заключение и выводы

Мероприятие организует «Школа больших данных».