Técnicas Avanzadas de Análisis de Datos

Profesor/a: JORGE CRESPO ÁLVAREZ

Teléfono: 983 00 10 00

Última versión revisada de la guía docente, debidamente informada por parte del profesor en la asignatura.

Supongamos que quiere predecir el precio justo de una vivienda en la que está interesado. Para ello dispone de datos como la localización, superficie, números de plantas o el número de habitaciones de otras viviendas en el vecindario. Su idea es utilizar algún tipo de algoritmo que, basado en dichos datos, le permita realizar una predicción del precio lo más acertada posible.
En esta asignatura se tratarán varios métodos para construir algoritmos de aprendizaje automático que le permitan resolver esta y otras tareas. Además se estudiarán las técnicas requeridas para evaluar el desempeño de los algoritmos desarrollados y como acondicionar los datos para ser explorados y utilizados por parte de los mencionados algoritmos.
En el desarrollo de la asignatura se utilizará Python y scikit-learn, una biblioteca de código abierto para la realización de tareas de aprendizaje automático o Machine Learning.

Prerrequisitos
Conocimientos básicos de programación en Python (nivel grado).
Conocimientos básicos de álgebra y cálculo (nivel grado).
Conocimientos básicos de estadística (nivel grado).

  1. bloque 1:
    1. Fundamentos de Machine Learning:
    2. Regularización:
    3. Selección de características:
    4. Extracción de características:
    5. Árboles de clasificación y regresión:
    6. Métodos de ensembles:
    7. Máquinas de vectores soporte:
    8. Métodos kernel:

Los recursos de aprendizaje que se utilizarán en todas las asignaturas de la titulación (salvo las prácticas externas) para facilitar el proceso de enseñanza-aprendizaje, son:

  • Campus online de la UEMC (Open Campus)
  • Plataforma de Webconference (Adobe Connect)

Las comunicaciones con el profesor serán a través de Open Campus vía Mi correo, Tablón o/y Foro.

CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo
CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación
CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio
CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios
CB9. Que los estudiantes sepan comunicar sus conclusiones -y los conocimientos y razones últimas que las sustentan- a públicos especializados y no especializados de un modo claro y sin ambigüedades
El alumno será capaz de:
  1. El alumnos será capaz de interpretar los modelos de clasificación de datos utilizando las técnicas estudiadas

  2. El alumno conocerá los métodos principales utilizados en minería de datos y su utilidad en casos reales

  • Laura Igual, Santi Seguí (2017), Introduction to Data Science, Springer
  • Steven S. Skiena (2017), The Data Science Design Manual, Springer
  • Kevin P. Murphy (2012), Machine Learning: A Probabilistic Perspective, MIT Press
  • Max Kuhn, Kjell Johnson (2013), Applied Predictive Modelling, Springer
  • Andreas C. Müller, Sarah Guido (2017), Introduction to Machine Learning with Python: A Guide for Data Scientists, O’Reilly Media

https://scikit-learn.org/ (Documentación y guías de la librería Python de aprendizaje automático scikit-learn)

Método dialéctico

Se caracteriza por la participación de los alumnos en las actividades de evaluación continua de debate y la intervención de éstos a través del diálogo y de la discusión crítica (seminarios, grupos de trabajo, etc.). Utilizando este método el alumno adquiere conocimiento mediante la confrontación de opiniones y puntos de vista. El papel del profesor consiste en proponer a través de Open Campus temas referidos a la materia objeto de estudio que son sometidos a debate para, posteriormente, evaluar el grado de comprensión que han alcanzado los alumnos.

Método didáctico

El papel del profesor cobra importancia a través de la impartición de clases magistrales en tiempo real por videoconferencia que podrá utilizar para explicar los contenidos teóricos, resolver dudas que se planteen durante la sesión, ofrecer retroalimentación sobre las actividades de evaluación continua o realizar sesiones de tutoría de carácter grupal.

Método heurístico

Este método puede desarrollarse de forma individual o en grupo a través de las actividades de evaluación continua (entregas de trabajos, resolución de ejercicios, presentaciones, etc.). El objetivo es que el alumno asuma un papel activo en el proceso de aprendizaje adquiriendo los conocimientos mediante la experimentación y la resolución de problemas.

Las actividades formativas que se realizan en la asignatura son las siguientes:

Clases teóricas: Actividad dirigida por el profesor que se desarrollará de forma sincrónica en grupo. Para la realización de esta actividad en Open Campus, la UEMC dispone de herramientas de Webconference que permiten una comunicación unidireccional en las que el docente puede desarrollar sesiones en tiempo real con posibilidad de ser grabadas para ser emitidas en diferido.

Actividades prácticas: Actividades supervisadas por el profesor que se desarrollarán fundamentalmente de forma asíncrona, y de forma individual o en grupo:

    • Actividades de debate. Se trata de actividades en las que se genera conocimiento mediante la participación de los estudiantes en discusiones alrededor de temas de interés en las distintas asignaturas.
    • Entregas de trabajos individuales o en grupos a partir de un enunciado o unas pautas de trabajo que establecerá el profesor.
    • Resolución de ejercicios y problemas que el alumno debe realizar a través de Open Campus en un periodo de tiempo determinado. Esta actividad puede ser en formato test de evaluación.

Tutorías: Las tutorías podrán tener un carácter sincrónico o asíncrono y podrán desarrollarse de manera individual o en grupos reducidos.

Están previstas dos sesiones de tutoría por videoconferencia, una al inicio y otra al final del semestre. En la primera se presentará la asignatura y la guía docente y en la segunda, en las semanas previas a la evaluación final, se dedicará a la resolución de dudas de los estudiantes.

Además, el docente utiliza el Tablón, el Foro y el Sistema de correo interno de Open Campus para atender las necesidades y dudas académicas de los estudiantes.


CV Docente

Jorge Crespo es Ingeniero Civil por el Instituto Superior Politécnico José Antonio Echeverría de Ciudad de la Habana, Cuba en 2005. En 2011 obtuvo su Doctorado por la Universidad de Cantabria en el Departamento de Transportes y Tecnologías de Proyectos y Procesos, en el cual desarrolló un modelo físico-matemático para la predicción del comportamiento ante incendios de hormigones de alta resistencia por el cual recibió la mención de sobresaliente cum laude.Experto en modelado y simulación computacional, sus tareas docentes han estado mayormente vinculadas a la rama de las matemáticas aplicadas y matemáticas superiores, impartiendo asignaturas como Calculo Diferencial e Integral, Matemática Discreta, Matemática Numérica, Estadística y Bioestadística tanto en entornos presenciales como a distancia. Así mismo Jorge ha dirigido trabajos de Fin de Carrera, Máster y Doctorado en el área de Business Intelligence y Aprendizaje Máquina.


CV Profesional

A partir de 2005 Jorge se incorpora al Claustro Docente del Instituto Superior Politécnico José Antonio Echeverría, en La Habana, Cuba, dentro del Departamento de Matemáticas de la Facultad de Ingeniería Civil. En 2006 pasa a formar parte del Grupo de Energía Eólica de Cuba, con la responsabilidad de Ingeniero Supervisor. En 2007 se incorpora al grupo GIDAI de la Universidad de Cantabria para desarrollar su doctorado donde se especializa en modelado y simulación computacional. Ha trabajado como Asesor de Contenido Web para Microsoft. Desde 2014, Jorge desarrolla su carrera profesional como Profesor de las ramas de las Matemáticas de la Universidad Europea del Atlántico, tarea que compagina con la Dirección de Programas de Postgrado, la Coordinación del Máster en Dirección Estratégica en Tecnologías de la Información y la Coordinación del Grado de Ingeniería de Organización Industrial.Es además consultor independiente y colabora o ha colaborado con diversas empresas como Quest Global, Lionbridge, ROMA S.L. y la Universidad Europea Miguel de Cervantes.


CV Investigación

En 2007 comenzó su actividad investigadora conjunto con el inicio de su Doctorado. En la actualidad cuenta con más de treinta publicaciones entre revistas, libros y congresos, de las cuales 16 se encuentran recogidas en el Journal of Citation Report. Cuenta con las acreditaciones de Profesor Contratado Doctor y Profesor de Universidad Privada por la Junta de Castilla y León y cuenta con un sexenio de investigación. Desde 2023 es Full Member de Sigma Xi, The Scientific Research Honor Society, la sociedad científica honorífica mas importante del mundo en el campo de las STEM. 

Créditos totales: 6
Tipo: Obligatorio
Período: 1º Semestre