Descripción
OBJETIVOS DEL CURSO
El objetivo de este Taller es proporcionar a los participantes una comprensión sólida y práctica sobre Databricks, permitiéndoles desarrollar, optimizar y desplegar flujos de trabajo de procesamiento de datos y machine learning en un entorno distribuido y escalable. A través de este Taller, los alumnos aprenderán a utilizar Apache Spark sobre Databricks para manejar grandes volúmenes de datos, ejecutar consultas eficientes y aplicar técnicas avanzadas de ingeniería de datos.
QUIENES DEBEN ASISTIR
- Ingenieros de Datos.
- Científicos de datos.
- Analistas.
DURACION Y MODALIDAD
Duración: Este curso se dicta en 32 horas cronológicas.
Modalidad: En línea con Relator en vivo o Presencial.
METODOLOGIA
Taller de Desarrollo con Databricks se desarrollará con una metodología enfocada en el aprendizaje práctico y progresivo, combinando teoría con aplicaciones en entornos reales de procesamiento de datos. Aproximadamente el 70% del Taller estará basado en ejercicios prácticos dentro de notebooks de Databricks, mientras que el 30% se enfocará en la teoría y los fundamentos de Spark y Databricks.