Información general de la asignatura

APRENDIZAJE AUTOMÁTICO

  • 009841
  • ÁREA ACADÉMICA INDUSTRIAS Y TECNOLOGÍAS DIGITALES

PRESENTACION

El Análisis de Datos es la obtención de patrones o modelos matemáticos para la interpretación de datos. En este campo convergen la estadística, bases de datos y el aprendizaje automático.
El Aprendizaje Automático (Machine Learning) es el estudio de cómo construir sistemas de computación que aprendan y se adapten de la experiencia. De forma más concreta, se trata de crear programas capaces de construir modelos a partir de datos, provenientes de bases de datos convencionales o de datos no estructurados, en diversos tipos de problemas que incluyen de manera general el aprendizaje supervisado (predicción y clasificación) y no supervisado (agrupamiento, reducción de dimensiones, asociación), teniendo como meta optimizar la capacidad de generalizar comportamientos a nuevos conjuntos de datos. Incluyen técnicas de Inteligencia Artificial (IA), estadística y probabilidades, teoría de computación y optimización, y en general estrategias matemáticas y computacionales que permitan crear modelos adaptativos a partir de los datos.

El aprendizaje automático y el análisis predictivo están transformando la forma como las organizaciones en todos los sectores de la economía se administran. Ser capaz de comprender las tendencias y patrones en datos complejos es fundamental para el éxito de estas organizaciones.

OBJETIVO DE APRENDIZAJE

Conocer y aprender técnicas de aprendizaje de máquina para analizar datos con el fin desarrollar aplicaciones que apoyen la toma de decisiones.

CONTENIDOS TEMATICOS

Parte I.  Conceptos Básicos
Qué es aprendizaje de máquina? Aprendizaje supervisado (clasificación y predicción, incluyendo series temporales) y no supervisado (agrupamiento, reducción de dimensiones y asociación). Aplicaciones.
Minería de Datos. Proceso CRISP-DM.


Parte II. Herramientas de software
Herramientas de Aprendizaje Automático. R, Python, otros. Librerías para conexiones a bases de datos.
Laboratorio. Carga y pre-procesamiento de datos (normalización, escalamiento, imputación de datos, discretización, conversión de factores a variables binarias, etc).


Parte III. Clasificación y Regresión de datos
Regresión. Regresión pesada (Risco, Lasso, Lars, Ransac, Elastic Net).
Laboratorio regresión.
Clasificación. Problemas de dos clases. Regresión logística. Bayes ingenuo. Análisis ROC. Problema Multiclases.
Laboratorio Clasificación
Arboles de clasificación y regresión. Bosques aleatorios. Métodos de agregación: Adaboosting. Máquinas de soporte vectorial para clasificación y regresión.
Laboratorio de métodos avanzados de clasificación y regresión.


Parte IV. Aprendizaje No supervisado
Agrupamiento de datos (Clustering). K-medias, K-medoides. Clusterización jerárquica. Clusterización espectral.
Laboratorio de agrupamiento.
Asociación. Algoritmo a priori. Reducción de dimensionalidad: análisis de componentes principales (ACP).


Parte V. Algoritmos Bioinspirados: algoritmos evolutivos, Algoritmos genéticos. Aplicación a selección de variables.
Redes neuronales y aprendizaje profundo. Modelos convolucionales.
Series de tiempo y datos espaciales.

BIBLIOGRAFIA BASICA OBLIGATORIA

1.Mitchell, T. M. (1997). Machine learning. Computer Science Series (McGraw-Hill, Burr Ridge, 1997).
2.Richert, W. (2013). Building machine learning systems with python. Packt Publishing Ltd.
3.Raschka, Sebastian.Python Machine Learning . ISBN-10: 1783555130 .ISBN-13: 978-1783555130
4.Han, Jiawei.(2006). Data mining: Concepts and Techniques. Morgan Kaufman Publishers.
5.Hernández Orallo, J., Ramírez Quintana, M., Ferri Ramírez, C. (2004). Introducción a la Minería de Datos. Editorial Pearson.
6.Kantardzic, Mehmed. (2003). Data Mining concepts, models, methods and techniques. Wiley-Interscience.
7.Witten, Ian H. (2011). Data mining : Practical machine learning tools and techniques Morgan Kaufmann Publishers.
8.Gareth James,Daniela Witten, Trevor Hastie, Robert Tibshirani (2014). An Introduction to Statistical Learning with Applications in R. Springer.


Complementario:
http://scikit-learn.org/stable/
http://archive.ics.uci.edu/ml/
https://www.kaggle.com/datasets
https://github.com/luispedro/BuildingMachineLearningSystemsWithPython/tree/first_edition
http://scikit-learn.org/stable/
https://github.com/rasbt/python-machine-learning-book
https://www.quantstart.com/articles/Top-5-Essential-Books-for-Python-Machine-Learning

Reconocimiento personería jurídica: Resolución 2613 del 14 de agosto de 1959 Minjusticia.

Institución de Educación Superior sujeta a inspección y vigilancia por el Ministerio de Educación Nacional.