Бесплатный курс

Apache Iceberg

Полный практический курс по современному табличному формату для data lakes. 6 глав, 19 уроков — от основ до продвинутых тем. Идеально для инженеров данных, аналитиков и всех, кто работает с большими данными.
19 уроков 6 практических глав Бесплатно
Первая глава

Основы Iceberg

Погрузитесь в основы Apache Iceberg: узнайте, что это за табличный формат, как он устроен и почему перевернул мир data lakes. Первые шаги к пониманию архитектуры и каталогов.
Cтарт курса 4 урока
Вторая глава

Транзакции и изменения данных

Изучите транзакции и операции изменения данных. Узнайте, как Iceberg обеспечивает ACID-гарантии, безопасную эволюцию схемы и работу с обновлениями и удалениями.
Продолжение 4 урока
Третья глава

Партицирование и кластеризация

Оптимизируйте хранение данных с помощью партицирования и кластеризации. Научитесь скрытому партицированию, трансформациям и Z‑ordering для ускорения запросов.
Продолжение 3 урока
Четвертая глава

Time Travel

Откройте для себя time travel — возможность путешествовать по снапшотам таблицы, откатывать изменения и анализировать историю данных.
Продолжение 2 урока
Пятая глава

Ветвление и метатаблицы

Освойте Git‑подобное ветвление и тегирование, а также метатаблицы для отладки и анализа внутренней структуры Iceberg.
Продолжение 3 урока
Шестая глава

Обслуживание и экосистема

Научитесь обслуживать таблицы, удалять старые снапшоты, компактифицировать файлы и познакомьтесь с экосистемой движков запросов (Spark, Flink, Trino).
Продолжение 3 урока
Курс основан на материалах Tim Berglund «Apache Iceberg: The Complete Guide», дополнен, скорректирован и проверен для русскоязычной аудитории.
background letter background letter background letter background letter background letter background letter background letter background letter