Información general de la asignatura
APRENDIZAJE AUTOMÁTICO
- 009841
- ÁREA ACADÉMICA INDUSTRIAS Y TECNOLOGÍAS DIGITALES
PRESENTACION
El Análisis de Datos es la obtención de patrones o modelos matemáticos para la
interpretación de datos. En este campo convergen la estadística, bases de
datos y el aprendizaje automático.
El Aprendizaje Automático (Machine Learning) es el estudio de cómo
construir sistemas de computación que aprendan y se adapten de la experiencia.
De forma más concreta, se trata de crear programas capaces de construir
modelos a partir de datos, provenientes de bases de datos convencionales o de
datos no estructurados, en diversos tipos de problemas que incluyen de manera
general el aprendizaje supervisado (predicción y clasificación) y no
supervisado (agrupamiento, reducción de dimensiones, asociación), teniendo
como meta optimizar la capacidad de generalizar comportamientos a nuevos
conjuntos de datos. Incluyen técnicas de Inteligencia Artificial (IA),
estadística y probabilidades, teoría de computación y optimización, y en
general estrategias matemáticas y computacionales que permitan crear modelos
adaptativos a partir de los datos.
El aprendizaje automático y el análisis predictivo están transformando
la forma como las organizaciones en todos los sectores de la economía se
administran. Ser capaz de comprender las tendencias y patrones en datos
complejos es fundamental para el éxito de estas organizaciones.
OBJETIVO DE APRENDIZAJE
Conocer y aprender técnicas de aprendizaje de máquina para analizar datos con el fin desarrollar aplicaciones que apoyen la toma de decisiones.
CONTENIDOS TEMATICOS
Parte I. Conceptos Básicos
Qué es aprendizaje de máquina? Aprendizaje supervisado (clasificación y
predicción, incluyendo series temporales) y no supervisado (agrupamiento,
reducción de dimensiones y asociación). Aplicaciones.
Minería de Datos. Proceso CRISP-DM.
Parte II. Herramientas de software
Herramientas de Aprendizaje Automático. R, Python, otros. Librerías para
conexiones a bases de datos.
Laboratorio. Carga y pre-procesamiento de datos (normalización,
escalamiento, imputación de datos, discretización, conversión de factores a
variables binarias, etc).
Parte III. Clasificación y Regresión de datos
Regresión. Regresión pesada (Risco, Lasso, Lars, Ransac, Elastic Net).
Laboratorio regresión.
Clasificación. Problemas de dos clases. Regresión logística. Bayes
ingenuo. Análisis ROC. Problema Multiclases.
Laboratorio Clasificación
Arboles de clasificación y regresión. Bosques aleatorios. Métodos de
agregación: Adaboosting. Máquinas de soporte vectorial para clasificación y
regresión.
Laboratorio de métodos avanzados de clasificación y regresión.
Parte IV. Aprendizaje No supervisado
Agrupamiento de datos (Clustering). K-medias, K-medoides. Clusterización
jerárquica. Clusterización espectral.
Laboratorio de agrupamiento.
Asociación. Algoritmo a priori. Reducción de dimensionalidad: análisis
de componentes principales (ACP).
Parte V. Algoritmos Bioinspirados: algoritmos evolutivos, Algoritmos
genéticos. Aplicación a selección de variables.
Redes neuronales y aprendizaje profundo. Modelos convolucionales.
Series de tiempo y datos espaciales.
BIBLIOGRAFIA BASICA OBLIGATORIA
1.Mitchell, T. M. (1997). Machine learning. Computer Science Series
(McGraw-Hill, Burr Ridge, 1997).
2.Richert, W. (2013). Building machine learning systems with python.
Packt Publishing Ltd.
3.Raschka, Sebastian.Python Machine Learning . ISBN-10: 1783555130
.ISBN-13: 978-1783555130
4.Han, Jiawei.(2006). Data mining: Concepts and Techniques. Morgan
Kaufman Publishers.
5.Hernández Orallo, J., Ramírez Quintana, M., Ferri Ramírez, C. (2004).
Introducción a la Minería de Datos. Editorial Pearson.
6.Kantardzic, Mehmed. (2003). Data Mining concepts, models, methods and
techniques. Wiley-Interscience.
7.Witten, Ian H. (2011). Data mining : Practical machine learning tools
and techniques Morgan Kaufmann Publishers.
8.Gareth James,Daniela Witten, Trevor Hastie, Robert Tibshirani (2014).
An Introduction to Statistical Learning with Applications in R. Springer.
Complementario:
http://scikit-learn.org/stable/
http://archive.ics.uci.edu/ml/
https://www.kaggle.com/datasets
https://github.com/luispedro/BuildingMachineLearningSystemsWithPython/tree/first_edition
http://scikit-learn.org/stable/
https://github.com/rasbt/python-machine-learning-book
https://www.quantstart.com/articles/Top-5-Essential-Books-for-Python-Machine-Learning