В рамках этого курса вы получите все необходимые навыки эффективного хранения и обработки больших данных.
Экспоненциальный рост данных в современном мире заставляет применять все более сложные инструменты для работы с ними.
Спрос на специалистов в области Big Data (более точно Data Engineers) на международном рынке более чем в 5 раз превышает спрос на специалистов анализа данных (Data Scientist).
Что вы узнаете?
- Получите хорошее понимание экосистемы Hadoop
- Разберетесь в деталях каким образом работает MapReduce и каким образом можно оптимизировать распределенные вычисления
- Узнаете про тонкости хранения данных для оптимизации вычислений в высокоуровневых инструментах типа Hive
- Узнаете что такое Resilient Distributed Dataset (RDD), а также познакомитесь с более высокоуровневым API (Spark SQL, Spark Dataframe).
Чему вы научитесь?
- Оценивать стоимость хранения и обработки данных
- Выбирать технологии Big Data для решения конкретной задачи
- Научитесь пользоваться распределенной файловой системой (HDFS)
- Научитесь пользоваться Apache Spark
- Научитесь строить сервисы, использующие результаты обработки больших объемов данных
Для кого этот курс?
ИТ-специалист, разработчик
- Узнать о современных технологиях для хранения и обработки больших объемов данных
- Получить практические навыки, которые не всегда возможно получить внутри компании (переквалификация или повышение квалификации).
Data scientist
- Расширить кругозор
- Научиться пользоваться инструментами для работы с Big Data
- Понять каким образом принятые алгоритмические решения анализа данных отразятся на сложности внедрения и поддержки этого решения (например - с целью повышения скорости выведения на рынок новых продуктов компании).
Какие знания и навыки необходимы для обучения на курсе?
- Умение программировать на Python (знание базовых структура данных, умение писать функции, отлаживать код)
- Аналитический склад ума (умение решать алгоритмические задачи, понимание нотации "О-большое" сложности вычислений)
Технические требования
Компьютер с предустановленным Python, Docker
Москва, Берсеневская набережная, 6, стр.3Big Data for Data Engineers
Дата проведения: 20.03.2018. Начало в 19:00
Место проведения: Москва , Берсеневская набережная, 6, стр.3
Стоимость: 64000 р.
- Анонс
- Программа
- Участники
- Спикеры
В рамках этого курса вы получите все необходимые навыки эффективного хранения и обработки больших данных.
Экспоненциальный рост данных в современном мире заставляет применять все более сложные инструменты для работы с ними.
Спрос на специалистов в области Big Data (более точно Data Engineers) на международном рынке более чем в 5 раз превышает спрос на специалистов анализа данных (Data Scientist).
Что вы узнаете?
- Получите хорошее понимание экосистемы Hadoop
- Разберетесь в деталях каким образом работает MapReduce и каким образом можно оптимизировать распределенные вычисления
- Узнаете про тонкости хранения данных для оптимизации вычислений в высокоуровневых инструментах типа Hive
- Узнаете что такое Resilient Distributed Dataset (RDD), а также познакомитесь с более высокоуровневым API (Spark SQL, Spark Dataframe).
Чему вы научитесь?
- Оценивать стоимость хранения и обработки данных
- Выбирать технологии Big Data для решения конкретной задачи
- Научитесь пользоваться распределенной файловой системой (HDFS)
- Научитесь пользоваться Apache Spark
- Научитесь строить сервисы, использующие результаты обработки больших объемов данных
Для кого этот курс?
ИТ-специалист, разработчик
- Узнать о современных технологиях для хранения и обработки больших объемов данных
- Получить практические навыки, которые не всегда возможно получить внутри компании (переквалификация или повышение квалификации).
Data scientist
- Расширить кругозор
- Научиться пользоваться инструментами для работы с Big Data
- Понять каким образом принятые алгоритмические решения анализа данных отразятся на сложности внедрения и поддержки этого решения (например - с целью повышения скорости выведения на рынок новых продуктов компании).
Какие знания и навыки необходимы для обучения на курсе?
- Умение программировать на Python (знание базовых структура данных, умение писать функции, отлаживать код)
- Аналитический склад ума (умение решать алгоритмические задачи, понимание нотации "О-большое" сложности вычислений)
Технические требования
Компьютер с предустановленным Python, Docker
https://binarydistrict.com/ru/courses/big-data-for-data-engineers/ - вкладка "программа"