Hola, estaré impartiendo un curso de Apache Spark los días 13 y 14 de Octubre en el D.F. La duración es 16 horas y el cupo es limitado.
Aquí les dejo el temario
Objetivo del Curso
El participante adquirirá los principios básico del ecosistema BigData como Hadoop, Spark y entornos Cloud. Además de principios básicos de los sistemas distribuidos y sistemas a gran escala. Se familiarizará con el entorno de trabajo de Apache Spark con Python y además explorara la abstracción de los datos como son los RDD Datasets y DataFrames. Hará un proyecto de análisis y podrá hacer deploy de la solución de manera local o en un clúster. Adquirirá los conocimientos necesarios para monitoreo y desempeño del clúster.
Introducción
1. Introducción a Big data y su ecosistema
2. Herramientas y workflows
3. Introducción al Ambiente Spark
4. Historia y orígenes
5. La necesidad de Spark
6. Set up Spark and Scala
7. Set up Spark y Python
8. Tu primer PySpark Job
9. Introducción a los RDDs
10. Funciones, transformaciones y acciones
11. Map Reduce en Spark
Spark APIS
1. Introducción a la APIS
2. Importar y exportar datos
3. Parsing y transformación de datos
4. Introducción a los DataFrames
5. Agregaciones y Análisis
6. Introducción a Spark SQL
7. Agregando estructura a tus datos
8. Spark SQL y su integración con data flows y workflows
9. Proyecto 1, Análisis de retrasos de vuelo
Spark y Ciencia de Datos
1. ¿Qué es la ciencia en Datos?
2. ¿Dónde encaja Spark en un proyecto de ciencia de datos?
3. Introducción al análisis exploratorio
4. Calidad de los Datos con Accumulators
5. Darles sentido a los datos (Estadística y Distribuciones)
6. Trabajando con Texto (Natural Language Processing)
7. Tokenization y Vectorization con Spark
8. Sumarización con tf-idf
9. Introduccion a Machine Learning
10. Aprendizaje no supervisado – clusterización imlementando K-means
Consideraciones Finales
1. Deployment – Local
2. Deployment – Cluster
3. Performance – Monitoreo y Optimización
4. ¿Qué es lo que sigue?
Costo 12,500 por persona + IVA
Duración 16 horas
Fecha 13 y 14 de Octubre
Lugar
KMMX Campeche 300 Piso 1 Col. Hipódromo Condesa
Para mayor información en isragaytan@gmail.com