Fundación Ortega Gasset-Gregorio Marañón

Seminario: Actuales avances en Máquinas de Aprendizaje

Seminario: Actuales avances en Máquinas de Aprendizaje

Presentación

A la aparición del primer algoritmo de aprendizaje máquina –la Regla de Perceptrón– hace seis decenios, como alternativa a las tradicionales modelos estadísticos, siguió un periodo de casi 30 años de desconfianza y estancamiento, que sólo concluyó tras las aportaciones de Rumelhart, Hinton, y otros destacados investigadores. Y de nuevo, tras la emergencia de algoritmos para Perceptrones Multicapa y múltiples aplicaciones prácticas, la evidencia de sus limitaciones redujo el interés, que sólo se mantuvo principalmente por las máquinas de vectores soporte y los conjuntos de máquinas.

Desde mediados de los 2000 se produce el segundo renacimiento, con el desarrollo del aprendizaje profundo, los métodos dinámicos, y otros de gran relevancia práctica, al tiempo que se presta creciente atención a conectar los fundamentos teóricos con los diseños, mientras que la creciente potencia de cómputo posibilita las hoy muy populares tecnologías “Big Data”.

Se han seleccionado para este seminario seis temas muy destacados entre los que reciben actualmente mayor atención, por razón de la extensa e importante experiencia de los conferenciantes en ellos, con el objeto de que los asistentes reciban una visión de primera mano que les permita aprovechar esa experiencia, y también vislumbrar otros caminos. Son esos temas el aprendizaje ante adversarios, el aprendizaje profundo, los nuevos problemas de clasificación, el procesamiento de datos para conseguir mejoras de calidad, los métodos bayesianos para aplicaciones “Big Data”, y también las formulaciones bayesianas para clasificación desequilibrada.

La Fundación Ortega y Gasset-Gregorio Marañón desea que este primer paso en el ámbito de la Inteligencia Artificial resulte provechoso para investigadores y profesionales en esta disciplina.

Lugar de celebración: C/ Fortuny, 53. 28010, Madrid, España (Acceso provisional por Pso. General Martínez Campos)

Programa

Viernes, 28 de septiembre

18:30h: Apertura
A cargo de una personalidad de la política de I+D

18:45h: Presentación
Aníbal R. Figueiras (UC3M, RAIng)

19:00h: Primera conferencia
Aprendizaje de máquina adversario
David Ríos (ICMAT, RACC)

20:00h: Cocktail de bienvenida

Sábado, 29 de septiembre

10:00h: Segunda conferencia
Aprendizaje profundo: evolución y estado
Aníbal R. Figueiras (UC3M, RAIng)

11:00h: Tercera conferencia
Clasificación no estándar: más allá del aprendizaje clásico
Francisco Herrera (UGR)

12:00h: Pausa-café

12:30h: Cuarta conferencia
De “Big Data” a “Smart Data”: más calidad para mejor conocimiento
Francisco Herrera (UGR)

13:30h: Almuerzo informal
Presidido por una personalidad empresarial

15:30h: Primera sesión de demostraciones
Aprendizaje profundo
Marcelino Lázaro (UC3M)

16:30h: Segunda sesión de demostraciones
Aprendizaje de máquina adversario
Roi Naveiro y Víctor Gallego (ICMAT)

17:30h: Fin de la jornada

Domingo, 30 de septiembre

10:00h: Quinta conferencia
Métodos bayesianos para “Big Data”
David Ríos (ICMAT, RACC)

11:00h: Sexta conferencia
Clasificación desequilibrada mediante formulaciones bayesianas
Aníbal R. Figueiras (UC3M, RAIng)

12:00h: Clausura
A cargo de una personalidad de la política de I+D

12:15h: Fin del seminario

 

Institución colaboradora:

Inscripción y matrícula

Coste de matrícula y asistencia:

Asistentes de empresas*, 350 euros
Asistentes de Universidades y OPIS 250 euros
* Aquellas entidades que inscriban a 3 o más participantes serán reconocidas como colaboradoras del Seminario

Lugar de celebración: C/ Fortuny, 53. 28010, Madrid, España (Acceso provisional por Pso. General Martínez Campos)

IMPORTANTE: La pasarela de pago del IUIOG sólo admite Comercio Electrónico Seguro (CES): Exclusivamente válidas las tarjetas asociadas a Verified by Visa, Mastercard Securecode. Hay que tener dado de alta con la entidad la banca electrónica o banca por internet, de este modo, cuando se realiza la transacción, además de los datos habituales (número tarjeta, fecha caducidad, etc.), para poder operar por internet, llega un código distinto al teléfono móvil cada vez que se realiza una operación, o hay que introducir el PIN de la tarjeta.

Resúmenes de las conferencias

– Primera conferencia: Aprendizaje de máquina adversario
El aprendizaje de máquina adversario (AMA) trata de los modelos y técnicas apropiados para oponerse a la actuación de atacantes –adversarios– que buscan engañar a los correspondientes sistemas para obtener un cierto beneficio. Su actual importancia se percibe sin más que mencionar su principal campo de aplicación: la seguridad.
Aunque habitualmente se parte de la teoría de juegos para los estudios y diseños de AMA, ocurre que las necesarias hipótesis de conocimiento común no se satisfacen en las situaciones prácticas. La conferencia revisará aproximaciones tradicionales y presentará un marco alternativo que se basa en el análisis de riesgos adversarios.

– Segunda conferencia: Aprendizaje profundo: evolución y estado
El aprendizaje profundo (DL, por “deep learning”) hizo su aparición hace cincuenta años, como algoritmos de estructura especializada y carácter subóptimo. Fue a comienzos del siglo XXI cuando las propuestas de versiones representacionales proporcionaron un fuerte impulso a esta área, que se consolidó con la aparición de métodos de entrenamiento directo para estructuras de múltiples capas. Dadas sus extraordinarias prestaciones –que llegan a superar las de expertos humanos en tareas en que se consideraban imbatibles, como muchas de visión artificial–, se vive hoy una explosión de nuevos diseños y en las aplicaciones.
La conferencia revisará la evolución de los algoritmos DL, categorizando y cualificando las familias más importantes, y presentará un ejemplo práctico de sus capacidades, para concluir señalando las direcciones de trabajo más prometedoras y con unas recomendaciones de empleo.

– Tercera conferencia: Clasificación no estándar más allá del aprendizaje clásico
Además de la clasificación desequilibrada, diversos tipos de problemas alejados del planteamiento clásico de dos opciones y disponibilidad de muestras etiquetadas para el entrenamiento han venido ganando atención en los últimos años, debido a su amplia presencia y alta relevancia: aprendizaje semi-supervisado, multi-instancia, clasificación multi-etiqueta y con flujo continuo de datos, y aprendizaje de distribuciones de probabilidad sobre clases son casos destacados.
En la conferencia se contextualizarán dichos problemas mediante problemas prácticos y se presentará una introducción a su análisis, con particular atención al algoritmo de vecino más cercano, que permite cómoda visualización, y al ruido entre clases, elemento cuya consideración es esencial para la calidad de los correspondientes algoritmos.

– Cuarta conferencia: De “Big Data” a “Smart Data”: más calidad para mejor conocimiento
No es preciso destacar la explosión de las aplicaciones “Big Data” en el momento actual. No obstante, tan acelerada utilización producirá mayores beneficios si va acompañada de mejoras ajenas a la tecnología “Big Data” propiamente dicha. Una posibilidad muy recomendable es la mejora de la calidad de los datos brutos –que, por su número y dimensión, son particularmente ruidosos y falsamente correlacionados en el caso de “Big Data”– mediante adecuadas técnicas de preprocesamiento, lo que ha dado lugar a la denominación “Smart Data”
La conferencia se dedicará a presentar cómo han de adaptarse los algoritmos de preprocesamiento a técnicas como “Map Reduce”, discutiendo los actuales enfoques mediante casos reales de estudio, y concluyendo con la consideración de algunos retos de investigación hoy abiertos.

– Quinta conferencia: Métodos bayesianos para “Big Data”
Las tecnologías “Big Data (BD) han ganado amplia presencia en innumerables campos de aplicación en los que se dispone de datos masivos (o extensos, o rápidos, o variantes, etc). Sin embargo, las formulaciones consistentes para aplicarlas de manera eficaz y eficiente distan mucho de haberse desarrollado al mismo ritmo.
La metodología bayesiana proporciona un marco coherente para funciones de predicción, de toma de decisiones, y otras formas de inferencia, gracias a que maximizan la máxima utilidad esperada a posteriori. La relativamente reciente introducción de métodos MonteCarlo basados en cadenas de Markov y la disponibilidad de ordenadores de potencia cada vez mayor han abierto una vía para aplicarla con flexibilidad en modelos más complejos.
En la conferencia, tras una breve revisión conceptual, se discutirá cómo aplicar los métodos citados a problemas BD, incluyendo algunos aún pendientes de resolución.

– Sexta conferencia: Clasificación desequilibrada mediante formulaciones bayesianas
La presencia de problemas desequilibrados –aquellos en los que una clase es mucho más numerosa que la alternativa, o equivalentes– es evidente en la mayoría de los ámbitos de aplicación del Aprendizaje Máquina: salud, negocio, seguridad, tratamiento de imágenes y visión artificial, fabricación, finanzas… Curiosamente, los algoritmos máquina tradicionales propenden a cometer los mismos errores que las personas –excederse largamente en decisiones a favor de la clase mayoritaria–; sorprendentemente, la inmensa mayoría de algoritmos de reequilibrado tienen carácter puramente empiricista, lo que provoca serios riesgos en su uso.
En la conferencia, se hará notar que la teoría de Bayes no da lugar a dificultades en estas aplicaciones y que el entrenamiento de máquinas de clasificación con costes surrogados apropiados (divergencias de Bregman) permite establecer una conexión con dicha teoría, útil para determinar cómo llevar a cabo reequilibrados consistentes, eliminando así los riesgos. Se ilustrarán los beneficios de esta perspectiva con varios ejemplos prácticos, y se concluirá con una enumeración de posibles extensiones del trabajo.

Perfiles de los asistentes

Los contenidos del seminario constituyen un valioso complemento a la formación de estudiantes de postgrado que sigan programas de Máster o Doctorado relacionados con la Ciencia o la Ingeniería de Datos, en especial en los ámbitos de Matemáticas y Estadística, Ingenierías Industrial, Informática y de Telecomunicación, Economía y Empresa. También puede resultar útil a estudiantes de último curso de Grado en esos ámbitos que hayan seguido cursos dedicados a Datos.

A profesionales e investigadores activos las distintas conferencias les abrirán nuevas y valiosas perspectivas sobre técnicas avanzadas y sus aplicaciones reales.

Breves biografías de los ponentes

David Ríos Insua
Director de la Cátedra AXA-ICMAT en el ICMAT (Instituto de Ciencias Matemáticas)-CSIC, Catedrático Numerario de Universidad (en excedencia) de Estadística e Investigación Operativa. Previamente ha ocupado puestos de investigación y/o enseñanza en Purdue, Duke, Leeds, Manchester, SAMSI, IIASA, UPM, U. Aalto y U. Paris-Dauphine.
Sus intereses se centran en el Análisis de Riesgo, el Análisis de Decisiones y la Estadística Bayesiana y sus aplicaciones a seguridad, ciberseguridad y robótica social. Es autor de 14 libros y más de 120 artículos con revisión, y ha dirigido más de 60 proyectos de I+D.
El Dr. Ríos es Académico de la Real de Ciencias Exactas, Físicas y Naturales, y Premio De Groot de la Intl. Soc. for Bayesian Analysis.

Aníbal R. Figueiras Vidal
Catedrático Numerario en la UC3M, prestó anteriormente sus servicios en la UPC, UPM, y Universidad de Santiago.
Los ámbitos a que dedica su actualidad docente e investigadora son el Tratamiento de Señales y las Máquinas de Aprendizaje y sus aplicaciones, en particular a imagen, salud y negocios. Ha publicado más de un centenar de artículos en revista –la mayoría JCR– y más de 200 comunicaciones en congresos con revisión, y dirigido casi 100 proyectos y contratos de I+D.
El Dr. Figueiras es Académico de la Real de Ingeniería, cuya presidencia desempeñó entre 2007 y 2011, y ha recibido Doctorados “Honoris Causa” por las universidades de Vigo y San Pablo (Arequipa, Perú). Es “Life Fellow” del IEEE.

Francisco Herrera
Catedrático Numerario en la Universidad de Granada, en el Departamento de Ciencias de la Computación e Inteligencia Artificial, donde dirige el grupo de investigación “Soft Computing y Sistemas de Información Inteligentes”.
Su campo de interés es la Inteligencia Artificial, en particular la Inteligencia Computacional y la Ciencia de Datos. Ha dirigido 42 tesis doctorales y publicado más de 370 artículos en revistas internacionales (más de 59.000 citas, h=121 en Google Scholar; «highly cited researcher» en Clarivate Analytics (WoS) desde 2014). Es editor principal de las revistas “Information Fusion (Elsevier) y “Progress in Artificial Intelligence” (Springer).
El Dr. Herrera es “Fellow” de EurAI y de la Intl. Fuzzy Sys. Association. Entre los premios recibidos cabe destacar los “paper awards” 2008 y 2012 del IEEE T. Fuzzy Systems y 2009-2010 de la IFSA, el XV Premio de Andalucía de Investigación “Maimónides” (en Ciencias Experimentales) 2014, y la Medalla de Andalucía 2017

                                     Acuerdos con: