Aprenda Apache Spark: Construa Pipelines Escaláveis com PySpark e Otimização

Author:   Studiod21 Smart Tech Content ,  Diego Rodrigues
Publisher:   Independently Published
Volume:   7
ISBN:  

9798289569998


Pages:   262
Publication Date:   25 June 2025
Format:   Paperback
Availability:   Available To Order   Availability explained
We have confirmation that this item is in stock with the supplier. It will be ordered in for you and dispatched immediately.

Our Price $41.98 Quantity:  
Add to Cart

Share |

Aprenda Apache Spark: Construa Pipelines Escaláveis com PySpark e Otimização


Add your own review!

Overview

APRENDA APACHE SPARK Construa Pipelines Escaláveis com PySpark e Otimização Este livro é indicado para estudantes, desenvolvedores, engenheiros de dados, cientistas de dados e profissionais de tecnologia que buscam dominar Apache Spark na prática, em ambientes corporativos, cloud pública e integrações modernas. Você aprenderá a construir pipelines escaláveis para processamento de dados em larga escala, orquestrando workloads distribuídas com AWS EMR, Databricks, Azure Synapse e Google Cloud Dataproc. O conteúdo abrange integração com Hadoop, Hive, Kafka, SQL, Delta Lake, MongoDB e Python, além de técnicas avançadas de tuning, otimização de jobs, análise em tempo real, machine learning com MLlib e automação de workflows. Inclui: - Implementação de pipelines ETL e ELT com Spark SQL e DataFrames - Processamento de dados em streaming e integração com Kafka e AWS Kinesis - Otimização de jobs distribuídos, tuning de performance e uso de Spark UI - Integração de Spark com S3, Data Lake, NoSQL e bancos relacionais - Deploy em clusters gerenciados na AWS, Azure e Google Cloud - Machine Learning aplicado com MLlib, Delta Lake e Databricks - Automação de rotinas, monitoramento e escalabilidade para Big Data Ao final, você dominará Apache Spark como solução profissional para análise de dados, automação de processos e machine learning em ambientes complexos e de alta performance. apache spark, big data, pipelines, processamento distribuído, aws emr, databricks, streaming, etl, machine learning, integração cloud

Full Product Details

Author:   Studiod21 Smart Tech Content ,  Diego Rodrigues
Publisher:   Independently Published
Imprint:   Independently Published
Volume:   7
Dimensions:   Width: 15.20cm , Height: 1.40cm , Length: 22.90cm
Weight:   0.354kg
ISBN:  

9798289569998


Pages:   262
Publication Date:   25 June 2025
Audience:   General/trade ,  General
Format:   Paperback
Publisher's Status:   Active
Availability:   Available To Order   Availability explained
We have confirmation that this item is in stock with the supplier. It will be ordered in for you and dispatched immediately.
Language:   Portuguese

Table of Contents

Reviews

Author Information

Tab Content 6

Author Website:  

Customer Reviews

Recent Reviews

No review item found!

Add your own review!

Countries Available

All regions
Latest Reading Guide

RGJUNE2025

 

Shopping Cart
Your cart is empty
Shopping cart
Mailing List