Добавить в календарь 30.03.2020 10:00 01.04.2019 18:00 Europe/Moscow INTR: Основы Hadoop

3-дневный курс по основам Hadoop состоится с 30 марта по 1 апреля 2020 года:

  1. базjвые установка и настройка кластера Hadoop в облаке
  2. основные операции с файловой системой HDFS
  3. запуск задач и управление ресурсами MapReduce и YARN
  4. взаимодействие с компонентами экосистемы Hadoop: Spark, Hive, sqoop, Flume.

Курс «Основы Hadoop» представляет сокращенную версию курса «Администрирование кластера Hadoop»  и проводится параллельно с данным курсом в 3 дня, согласно утвержденной программе, на платформе Cloudera, HortonWorks или ArenaData Hadoop  по выбору.

Для кого предназначен курс Основы Hadoop

Аудитория: Системные администраторы, системные архитекторы, разработчики Hadoop, желающие получить теоретические знания и практические навыки по установке, настройке и использованию кластера Hadoop с использованием дистрибутивов Cloudera и HortonWorks.

Предварительный необходимый уровень подготовки:

  1. Начальный опыт работы в Unix
  2. Опыт работы с текстовым редактором vi, nano

Продолжительность: 3 дня, 24 академических часа.

Курс Основы Hadoop содержит базовые сведения по установке и настройке кластера Hadoop, выполнению основных операций в файловой системе HDFS, запуска задач MapReduce, основам управления ресурсами Hadoop с помощью планировщика задач YARN и знакомит слушателей с концепциями использования Hadoop и компонент экосистемы Hadoop (MapReduce, Apache Hive, Apache Pig, Apache Flume, Apache Sqoop и Apache Spark) для организации хранения больших данных и процессинга.

Курс построен на сквозных практических примерах с тренировочными наборами данных, для запуска batch и потоковых (streaming)  задач в Hadoop кластере. Индивидуальные кластера Hadoop для каждого слушателя в облачной инфраструктуре Amazon Web Services, что позволяет закрепить все концепции и понятия на практических заданиях с использованием выбранного слушателем дистрибутива (Cloudera Distributed Hadoop, HortonWorks HDP или ArenaDataHadoop) и  познакомиться с выбранным программным обеспечением по управлению кластером  Cloudera Manager или Apache Ambari на выбор.

Соотношение теории к практике 50/50

Москва, ул.Илимская 5/2

INTR: Основы Hadoop

Дата проведения: 30.03.2020 - 01.04.2019. Начало 30.03.2020 в 10:00

Место проведения: Москва , ул.Илимская 5/2

Стоимость: 54000 р.

Организатор: Школа больших данных
Будь в курсе всех мероприятий по теме Big Data
  • Анонс
  • Программа
  • Участники
  • Спикеры

3-дневный курс по основам Hadoop состоится с 30 марта по 1 апреля 2020 года:

  1. базjвые установка и настройка кластера Hadoop в облаке
  2. основные операции с файловой системой HDFS
  3. запуск задач и управление ресурсами MapReduce и YARN
  4. взаимодействие с компонентами экосистемы Hadoop: Spark, Hive, sqoop, Flume.

Курс «Основы Hadoop» представляет сокращенную версию курса «Администрирование кластера Hadoop»  и проводится параллельно с данным курсом в 3 дня, согласно утвержденной программе, на платформе Cloudera, HortonWorks или ArenaData Hadoop  по выбору.

Для кого предназначен курс Основы Hadoop

Аудитория: Системные администраторы, системные архитекторы, разработчики Hadoop, желающие получить теоретические знания и практические навыки по установке, настройке и использованию кластера Hadoop с использованием дистрибутивов Cloudera и HortonWorks.

Предварительный необходимый уровень подготовки:

  1. Начальный опыт работы в Unix
  2. Опыт работы с текстовым редактором vi, nano

Продолжительность: 3 дня, 24 академических часа.

Курс Основы Hadoop содержит базовые сведения по установке и настройке кластера Hadoop, выполнению основных операций в файловой системе HDFS, запуска задач MapReduce, основам управления ресурсами Hadoop с помощью планировщика задач YARN и знакомит слушателей с концепциями использования Hadoop и компонент экосистемы Hadoop (MapReduce, Apache Hive, Apache Pig, Apache Flume, Apache Sqoop и Apache Spark) для организации хранения больших данных и процессинга.

Курс построен на сквозных практических примерах с тренировочными наборами данных, для запуска batch и потоковых (streaming)  задач в Hadoop кластере. Индивидуальные кластера Hadoop для каждого слушателя в облачной инфраструктуре Amazon Web Services, что позволяет закрепить все концепции и понятия на практических заданиях с использованием выбранного слушателем дистрибутива (Cloudera Distributed Hadoop, HortonWorks HDP или ArenaDataHadoop) и  познакомиться с выбранным программным обеспечением по управлению кластером  Cloudera Manager или Apache Ambari на выбор.

Соотношение теории к практике 50/50