31 января 2024 г. в Москве пройдет митап «Ozon Tech Community BI Meetup».
В этот раз мы познакомимся с командой платформы данных. На встрече нас ждут 5 докладов, в которых спикеры расскажут: про наши основные сервисы работы с данными, о новом подходе к работе с данными – «платформизация», про создание функционала для сжатия данных, а также обсудим термин data quality в отделе обработки данных.
Москва, Пресненская набережная, 10, блок С, 30 этаж, Москва-СитиOzon Tech Community BI Meetup
- Анонс
- Программа
- Участники
- Спикеры
31 января 2024 г. в Москве пройдет митап «Ozon Tech Community BI Meetup».
В этот раз мы познакомимся с командой платформы данных. На встрече нас ждут 5 докладов, в которых спикеры расскажут: про наши основные сервисы работы с данными, о новом подходе к работе с данными – «платформизация», про создание функционала для сжатия данных, а также обсудим термин data quality в отделе обработки данных.
18:30 Начало регистрации
19:00 Марина Самойлова, руководитель направления Платформы данных
Доклад: «Направление платформы данных Ozon».
Интро о BI в Ozon: расскажем о 3-х сервисах работы с данными – Vertica, Clickhouse и Hadoop.
19:30 Александр Барановский, руководитель отдела Интеграции данных
Доклад: «Платформизация в данных, как и зачем».
В рамках доклада обсудим, как работает платформизация в Ozon, предпосылки внедрения нового подхода и что использовали до этого. Детально поговорим про роль единой платформы, какие были сложности и какую цель преследуем.
20:00 Евгения Губарева, руководитель группы автоматизации платформы данных
Доклад: «Как мы строим платформенное решение для транспорта данных от системы-источника до сырого слоя хранилища».
Рассмотрим на примере применение такого подхода, как платформизация в данных, а именно, как мы автоматизируем поставку стриминговых данных от системы источника и до хранилища. Расскажем как нам удалось обобщить процесс траспортировки, какие требования к системе мы получили и как их выполняем.
20:30 Перерыв
20:40 Дмитрий Еричев, руководитель группы разработки инструментов BI
Доклад: «Сжатие данных в ClickHouse через функционал выбора лучших кодеков».
Узнаем про создание функционала под кодовым названием Low Cardinality (LC), который выбирает лучшие кодеки сжатия в зависимости от характера данных.
21:10 Наталья Журавлёва, руководитель группы поддержки DWH
Доклад: «Data Quality».
Поговорим о том, что представляет из себя наш главный актив (спойлер – BI), а также, как мы следим за качеством данных и наши планы на будущее.
21:40 Фуршет, нетворкинг