Información general de la asignatura
BASES DE DATOS AVANZADAS - BIG DATA
- 009842
- 3
- ÁREA ACADÉMICA INDUSTRIAS Y TECNOLOGÍAS DIGITALES
PRESENTACION
Las Bases de Datos Relacionales (BD) se consideran una tecnología genérica, y
su éxito se evidencia en la utilización de las mismas. Prácticamente todas las
actividades económicas requieren el procesamiento de información. Sin embargo,
el auge en el uso de Internet desde el principio de este siglo, y otros
factores como el uso de dispositivos que generan datos todo el tiempo, ha
creado desafíos en tres dimensiones: volumen, velocidad y variedad
(denominados las tres Vs), aunque a menudo se hablan de más.
El volumen es un factor clave ya que en el mundo se generan 2.5
quintillones de bytes de datos diariamente. Debido al incremento en el volumen
de datos que se están generando (sobre todo de forma automatizada), el 90% de
los datos que existen en el mundo han sido creados en los últimos 2 años. La
velocidad se debe a que es necesario procesar flujos de datos (streams) sin
demora y de forma confiable (por ejemplo, para detectar fraude en las
transacciones de las tarjetas de crédito). La variedad se refiere al hecho que
los datos generados hoy-en-día son cada vez más heterogéneos y complejos:
comprenden texto libre, datos semi-estructurados, BD relacionales e incluso
flujos de video.
Las herramientas convencionales, aunque siguen siendo vigentes para la
mayoría de los casos de uso, se ven limitadas ante semejantes desafíos.
OBJETIVO DE APRENDIZAJE
El objetivo de esta asignatura es que el estudiante adquiera un conocimiento
avanzado en bases de datos relacionales distribuidas y se familiarice con las
tecnologías NoSQL, comprendiendo los cambios de paradigma en almacenamiento y
recuperación de información. Al finalizar, el estudiante será capaz de
identificar, proponer y aplicar factores clave en la arquitectura de bases de
datos distribuidas, tales como la fragmentación de datos, la optimización de
consultas y la integración de datos. Además, podrá valorar las ventajas y
limitaciones de las bases de datos relacionales y NoSQL, y desarrollar una
comprensión crítica de la diversidad de aplicaciones de procesamiento de datos
actuales, con un enfoque en sus requisitos de escalabilidad y disponibilidad.
RESULTADO DE APRENDIZAJE
Diseñar y gestionar arquitecturas de datos escalables y robustas que procesen grandes volúmenes de datos en tiempo real, aplicando tecnologías de big data, cloud computing y bases de datos distribuidas, y considerando la heterogeneidad, privacidad y seguridad de los datos en contextos diversos.