Бесплатный курс
Apache Iceberg
Полный практический курс по современному табличному формату для data lakes. 6 глав, 19 уроков — от основ до продвинутых тем. Идеально для инженеров данных, аналитиков и всех, кто работает с большими данными.
19 уроков 6 практических глав Бесплатно
Содержание
Первая глава
Основы Iceberg
Погрузитесь в основы Apache Iceberg: узнайте, что это за табличный формат, как он устроен и почему перевернул мир data lakes. Первые шаги к пониманию архитектуры и каталогов.
Cтарт курса 4 урока
Вторая глава
Транзакции и изменения данных
Изучите транзакции и операции изменения данных. Узнайте, как Iceberg обеспечивает ACID-гарантии, безопасную эволюцию схемы и работу с обновлениями и удалениями.
Продолжение 4 урока
Третья глава
Партицирование и кластеризация
Оптимизируйте хранение данных с помощью партицирования и кластеризации. Научитесь скрытому партицированию, трансформациям и Z‑ordering для ускорения запросов.
Продолжение 3 урока
Четвертая глава
Time Travel
Откройте для себя time travel — возможность путешествовать по снапшотам таблицы, откатывать изменения и анализировать историю данных.
Продолжение 2 урока
Пятая глава
Ветвление и метатаблицы
Освойте Git‑подобное ветвление и тегирование, а также метатаблицы для отладки и анализа внутренней структуры Iceberg.
Продолжение 3 урока
Шестая глава
Обслуживание и экосистема
Научитесь обслуживать таблицы, удалять старые снапшоты, компактифицировать файлы и познакомьтесь с экосистемой движков запросов (Spark, Flink, Trino).
Продолжение 3 урока
Курс основан на материалах Tim Berglund «Apache Iceberg: The Complete Guide», дополнен, скорректирован и проверен для русскоязычной аудитории.
