«Spark в действии» — практическое руководство по работе с Apache Spark, обучающее эффективно обрабатывать большие данные и строить высокопроизводительные системы аналитики
Книга подробно объясняет принципы работы Spark, его архитектуру, модули и ключевые инструменты. Авторы шаг за шагом показывают, как работать с RDD, DataFrame, SQL, поточной обработкой и машинным обучением. Издание содержит реальные примеры применения Spark в бизнес-аналитике, обработке логов, рекомендательных системах и масштабируемых бэкенд-проектах.
В книге
- основы архитектуры и принципов Apache Spark;
- практика работы с RDD, Dataset, DataFrame;
GraphX;- оптимизация производительности и кластеры;
- примеры реального применения в больших системах.
«Spark в действии» — идеальная книга для дата-инженеров, аналитиков и разработчиков, работающих с Big Data.