Información general de la asignatura

MÉTODOS ESTADÍSTICOS PARA DATA ANALYTICS

  • 009839
  • ÁREA ACADÉMICA INDUSTRIAS Y TECNOLOGÍAS DIGITALES

PRESENTACION

La gran mayoría de fenómenos basados en datos están sujetos a situaciones de incertidumbre que modelamos mediante esquemas probabilísticos o aleatorios. La estadística, como ciencia que permite explicar condiciones de algún fenómeno de ocurrencia aleatoria o condicional, es una herramienta esencial para el análisis de datos, el ajuste de modelos y la comprensión de los factores que definen a los mismos. La inclusión de la aleatoriedad y su estudio a través de diversos métodos estadísticos es un componente formativo necesario para el estudiante de la Maestría en Ingeniería y Analítica de Datos. Es necesario que el estudiante comprenda que la generación de un modelo no termina con el proceso de validación sino que existen otra serie de análisis que permitirán establecer la estabilidad y robustez de un modelo probabilístico cualquiera que éste sea. De igual manera, es necesario hacer uso de métodos estadísticos con el fin de caracterizar el comportamiento de grupos de individuos o componentes de forma tal que el fenómeno a modelar sea basado en muestras lo suficientemente representativas y que las técnicas de estimación permitan llegar a conclusiones relevantes para el modelo a estudiar.

OBJETIVO DE APRENDIZAJE

El objetivo de la asignatura MÈTODOS ESTADÌSTICOS PARA DATA ANALYTICS será el de promover y desarrollar en los estudiantes la comprensión e implementación de conceptos y métodos estadísticos, útiles en el campo analítica de datos, que permitan considerar la dimensión aleatoria de fenómenos de variabilidad inherente, su modelamiento y sus implicaciones en las diversas aplicaciones consideradas en este plan de estudios.

CONTENIDOS TEMATICOS

Módulo 1. Estadística descriptiva
Sesión 1. Introducción
Sesión 2. Medidas de tendencia central y dispersión
Sesión 3. Medidas de posición relativa, correlación, regresión

Módulo 2. Distribuciones de probabilidad
Sesión 4. Variables aleatorias y distribuciones
Sesión 5. Distribuciones discretas
Sesión 6. Distribuciones continuas
Sesión 7. Leyes de grandes números y Teorema del Límite Central

Módulo 3. Modelos lineales
Sesión 8. Modelos lineales, estimación de parámetros, comparación de modelos, intervalos de confianza
Sesión 9. Experimentos diseñados, datos observacionales
Sesión 10. Identificación de observaciones inusuales, verificación de supuestos del modelo, errores de escala
Sesión 11. Colinealidad

Módulo 4. Inferencia bayesiana
Sesión 12. Inferencia bayesiana
Sesión 13. Modelos jerárquicos bayesianos y modelos empíricos bayesianos
Sesión 14. Métodos de Monte Carlo (MCMC) para estimación de distribuciones posteriores
Sesión 15. Taller de estadística bayesiana usando R
Sesión 16. Examen Final





BIBLIOGRAFIA BASICA OBLIGATORIA

1.Quinn G, Keough, M. 2002. Experimental Design and Data Analysis for Biologists. Cambridge University Press, New York, USA. 537 pp.


2.Robert C., Casella G. 2010. Introducing Monte Carlo Methods with R. Springer Science + Business Media, New York, USA. 283 pp.


3.Saltelli A., Chan K., Scott, M. 2008. Sensitivity Analysis. John Wiley & Sons, Chichester, England. 492 pp.


4.Andrew Gelman, John B. Carlin, Hal S. Stern, Donald B. Rubin. Bayesian Data Analysis, Second Edition. Chapman & Hall/CRC Texts in Statistical Science, 2009.

5.Dennis D. Boos, L.A. Stefanski. Essential Statistical Inference. Theory and Methods Springer, Nueva York, 2013

6.Larry A. Wasserman . All of Statistics: A Concise Course in Statistical Inference. Springer Texts in Statistics, Nueva York, 2004

Reconocimiento personería jurídica: Resolución 2613 del 14 de agosto de 1959 Minjusticia.

Institución de Educación Superior sujeta a inspección y vigilancia por el Ministerio de Educación Nacional.