Курс "SPARK2: Анализ данных с Apache Spark" состоится с 11 по 13 декабря 2019 года в Москве.
3-дневный практический курс для разработчиков Apache Spark и специалистов Data Scientists, использующих Spark SQL, потоковую обработку Spark Streaming, построение графов Spark GraphX
Аудитория: Специалисты, аналитики данных и разработчики, желающие получить опыт настройки и использования компонентов Apache Spark (Spark SQL, Spark Streaming, Spark GraphX)
Предварительный уровень подготовки:
- Опыт работы в Unix/SQL
- Начальный опыт программирования (Python/Java)
- Знание языка программирования Scala
Продолжительность: 3 дня, 24 академических часа.
3-дневный интенсивный практический тренинг по использованию платформы распределенной обработки больших данных Apache Spark при работе с большими массивами неструктурированных данных и потоковой обработкой.
На курсе вы научитесь:
- Использовать Spark Streaming для создания приложений потоковой обработки данных
- понимать разницу использования различных форматов хранения данных и использования RDD , dataframes и datasets
- обращаться к данным с использование SQL или Hive QL
- настраивать и использовать компонент GraphX
Соотношение теории к практике 40/60
Москва, ул.Илимская 5/2SPARK2: Анализ данных с Apache Spark
Дата проведения: 11.12.2019. Начало в 09:30
Место проведения: Москва , ул.Илимская 5/2
Стоимость: 54000 р.
- Анонс
- Программа
- Участники
- Спикеры
Курс "SPARK2: Анализ данных с Apache Spark" состоится с 11 по 13 декабря 2019 года в Москве.
3-дневный практический курс для разработчиков Apache Spark и специалистов Data Scientists, использующих Spark SQL, потоковую обработку Spark Streaming, построение графов Spark GraphX
Аудитория: Специалисты, аналитики данных и разработчики, желающие получить опыт настройки и использования компонентов Apache Spark (Spark SQL, Spark Streaming, Spark GraphX)
Предварительный уровень подготовки:
- Опыт работы в Unix/SQL
- Начальный опыт программирования (Python/Java)
- Знание языка программирования Scala
Продолжительность: 3 дня, 24 академических часа.
3-дневный интенсивный практический тренинг по использованию платформы распределенной обработки больших данных Apache Spark при работе с большими массивами неструктурированных данных и потоковой обработкой.
На курсе вы научитесь:
- Использовать Spark Streaming для создания приложений потоковой обработки данных
- понимать разницу использования различных форматов хранения данных и использования RDD , dataframes и datasets
- обращаться к данным с использование SQL или Hive QL
- настраивать и использовать компонент GraphX
Соотношение теории к практике 40/60