Información general
Inicio: 24 de abril de 2024.
Duración: 96 horas.
Modalidad: se dictará en modalidad 100% virtual, con clases sincrónicas (vía ZOOM) lunes, miercoles y viernes de 18:00 a 20:00.
Derechos universitarios: $U69.000, que pueden pagarse hasta en 6 cuotas (VISA y OCA).
Aplican descuentos de Educación Permanente y descuentos por convenio.
Objetivo
El objetivo general del programa es que los estudiantes se familiaricen con el flujo de trabajo de proyectos de ciencia de datos con aplicaciones en ciencias económicas, administración y otras ciencias sociales. En base a esto poder responder preguntas o abordar problemas de interés en diversas áreas basando sus respuestas con evidencia empírica. Esquemáticamente, el flujo de trabajo básico consiste en traducir problemas de negocios u otras ciencias sociales en preguntas de ciencias de datos, aplicar herramientas estadísticas y computacionales para responderlas, y finalmente describir las conclusiones a partir de datos observados.
Se espera que al completar la certificación un estudiante:
- Pueda reconocer problemas o preguntas en su organización que se aborden con herramientas de Ciencia de Datos.
- Conozca fundamentos de programación en R y conceptos estadísticos básicos.
- Se familiariza con herramientas para manipulación, exploración y visualización de datos.
- Tenga conocimiento de algunos algoritmos de Machine Learning utilizados en la práctica y su implementación para responder preguntas de interés.
- Sea capaz de realizar un informe escrito con análisis de datos en un formato que favorezca su reproducibilidad y automatización.
Perfil de los participantes
Profesionales interesados en Ciencia de Datos, ya sea para implementar herramientas de ciencias de datos en su práctica profesional o para interactuar con cientistas de datos en equipos interdisciplinarios. No se requieren conocimientos previos sobre probabilidad, estadística o programación, en caso de acreditar dichos conocimientos es posible revalidar el primer modulo de la certificación.
Coordinación y comité académico
Coordinación:
- Ignacio Álvarez-Castro
Comité académico:
- Ignacio Alvarez-Castro
- Gabriel Budiño
- Riva Quiroga (Chile)
Docentes
Ignacio Alvarez-Castro - Doctorado en Estadística (Iowa State University), Licenciado en Estadística y en Economía (FCEA-UdelaR). Especialista en modelización estadística, inferencia Bayesiana y métodos estadísticos de Machine Learning.Docente de Machine Learning y Ciencia de datos para Negocios en posgrados de FCEA. Experiencia como consultor estadístico y analista de datos.
Gabriel Budiño - Contador Público (Universidad de la República) y Master en Sistemas de Información (Universitario Autónomo del Sur). Profesor Titular de la Unidad Académica Costos y Control de Gestión. Asesor en Sistemas de Información y en particular de herramientas CRM y ERP. Gerente de Proyectos y Consultor SAP.
Natalia Botto Pérez - Ingeniería Eléctrica (Universidad de la República). Magister en Data Science, UTEC/MIT. Especialización en Sistemas de Información de las Organizaciones y Gestión de Empresas de TI por la Universidad de la República. Posee diversas certificaciones en gestión de proyectos, fue presidenta del capítulo Montevideo del Project Management Institute (PMI). Docente de grado en la Unidad Académica de Sistemas de la Facultad de Ciencias Económicas y Administración. Profesora en la Universidad Tecnológica del Uruguay (UTEC).Se desempeña como Project Manager en Uruware.
Natalia da Silva - Doctorado y Maestría en estadística (Iowa State University), Licenciada en Estadística y en Economía (FCEA-UdelaR). Especialista en estadística computacional, visualización de datos y Machine Learning. Docente de Ciencia de Datos y Machine Learning en los programas de Maestría en Finanzas, Maestría en Economía y posgrado en Sistemas de Información en FCEA. Fundadora del capítulo de R-Ladies Montevideo, CHAIR de LatinR (conferencia latinoamericana de uso y desarrollo de R).
Fernando Massa - Maestría en Ingeniería Matemática, Licenciado en Estadística. Especialista en modelización estadística de datos, modelos longitudinales. Desarrollador de software R. Docente en cursos de estadística en MBA (FCEA). Experiencia en consultoría estadística.
Riva Quiroga (Chile) - Consultora independiente en procesamiento de datos, visualización, generación de reportes reproducibles, web scraping y minería de textos. Docente en los módulos de web scraping y minería de texto. Diplomado en Ciencia de Datos de la Facultad de Matemáticas de la Pontificia Universidad Católica de Chile.
María Eugenia Riaño - Maestría en Sistemas de Información Geográfica, Licenciada en Estadística (UdelaR). Especialista en análisis de datos espaciales y datos provenientes de encuestas complejas. Docente en MBA y Posgrado en Administración (FCEA). Experiencia en consultoría estadística.
Isabel Rodríguez - Contadora Pública (Universidad de la República) con diploma en Docencia Universitaria y MBA (Universidad de Montevideo). Certificación Project Manager Professional (PMP) del Project Management Institute. Profesora Adjunta de la Unidad Académica Costos y Control de Gestión. Especializada en consultoría y áreas comerciales, implementando productos de Business Intelligence y Sistemas Integrados de Gestión, así como diseñando cuadros de mando integral.
Andres Sosa - Doctorado en Matemática, Maestría en Ingeniería Matemática y Licenciado en Matemática (UdelaR). Especialista en modelos matemáticos de procesos financieros y finanzas cuantitativas. Docente de Maestría en Finanzas (FCEA). Experiencia en análisis de riesgo de créditos.
Federico Golffeld - Director de Octopus Data Solutions, amplia experiencia en consultoría y capacitación en Business Intelligence y Analytics, con aplicaciones exitosas en el área financiera, seguros, servicios, call center y recursos humanos.
Programa Analítico
Módulo 1: Fundamentos
- Introducción a R.
- Introducción a descripción de datos.
- Introducción a métodos estadísticos.
Introducción a los conceptos de base para poder trabajar en Ciencia de datos. En primer lugar, una introducción a la programación en R para estudiantes sin experiencia previa.
Comienza con la instalación de las herramientas básicas (el lenguaje R y algún editor de software) y los primeros pasos en programación. El trabajo se orienta en las rutinas que sean útiles para la descripción y exploración de datos. En segundo lugar, se introducen las definiciones básicas que permiten resumir, describir y graficar datos para obtener información relevante. Finalmente, se realiza una introducción a métodos estadísticos. Para esto se describen los aspectos fundamentales del problema estadístico de inferencia y se repasan algunas aplicaciones básicas (ejemplo: comparación de medias).
Evaluación: Este módulo no tiene prueba.
Módulo 2: Ciencia de datos en los negocios
Introducir las etapas del flujo de trabajo en proyectos de ciencias de datos y su inserción en las organizaciones. Trabajar sobre cómo plantear problemas o preguntas en las organizaciones y su traducción al lenguaje de Ciencia de Datos. Presentar las distintas fuentes de datos, sus características y buenas prácticas para asegurar la calidad de los mismos. Recorrer las principales herramientas computacionales disponibles. Visión general de las técnicas de aprendizaje estadístico supervisado y no supervisado. Destacar la relevancia de la presentación de resultados a público no experto, y comentar sobre el problema de la reproducibilidad de los análisis de datos.
Evaluación: Entregable (individual): reconocer un problema en la organización en que trabaja y traducirlo a Ciencia de Datos, sugiriendo posibilidades para la implementación de una solución.
Módulo 3: Aprendizaje estadístico aplicado
- Introducción a machine learning.
- Manejo y Visualización de datos.
- Análisis Predictivo.
Este se apoya en los aspectos básicos del módulo 1 y la visión global de la Ciencia de Datos del módulo 2.
Con esta base, el módulo se compone de tres cursos que representan los aspectos centrales para el análisis de datos.
Introducción a machine learning profundiza en algunos algoritmos seleccionados y problemas con aplicación en negocios, por ejemplo segmentación de clientes con métodos supervisados de clasificación. El curso Manejo y Visualización de datos presenta métodos computacionales para ordenar y re-estructurar los datos de forma que queden listos para su análisis. Por otro lado, avanza en la construcción de gráficos más avanzados en un marco de la concepción global de gráficos estadísticos. Finalmente, el curso Análisis predictivo aborda el tratamiento de datos con estructura temporal. Se trabajará en aplicación de técnicas para describir datos temporales y realizar predicciones de variables de interés. En cada curso se presentan conceptos y herramientas computacionales del tema, se contará con algún invitado para contar casos reales, experimentar con software o mostrar uso del software.
Evaluación: Entrega de ejercicios en cada curso que pueden realizarse en grupos reducidos de estudiantes.
Módulo 4: Comunicación de resultados y proyecto final
El punto final del ciclo de trabajo con datos usualmente es la confección de un informe final describiendo la metodología y los principales resultados. Un aspecto clave en reportes de Ciencia de Datos es la que sean reproducibles, es decir que sea posible recrear los resultados descritos por terceros en forma sencilla.
En este módulo se discute la relevancia de la reproducibilidad en la aplicación de soluciones basadas en datos. Presentar herramientas computacionales para la redacción de informes reproducibles y automatizados. Al mismo tiempo se comienza a trabajar en la realización y redacción de un proyecto final aplicado, con datos propuestos por los estudiantes.
Evaluación: Proyecto final con datos de interés para los estudiantes, que recorra las distintas etapas del flujo de trabajo de Ciencia de Datos (módulo 2), aplicando alguna de las técnicas estudiadas (módulo 3) y se realice en un formato reproducible (módulo 4).
Inscripciones
Inscripciones aquí
Una vez completado este paso nos comunicaremos con usted para generar su usuario en la plataforma educativa.
El proceso de inscripción se completa al efectuar el pago.
Por mayor información consúltenos a: Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo. o por WhatsApp: 091 562 200