LinkedIn Google+

Desde hace unos años tenemos presente en nuestro día a día el concepto de Inteligencia Artificial en redes sociales, anuncios de aparatos electrónicos, e incluso en las noticias.

Es un término de moda del que muchos hemos oído hablar, al igual que sobre Machine Learning (aprendizaje automático o aprendizaje de máquinas) o Deep Learning (aprendizaje profundo), conceptos que están relacionados con la Inteligencia Artificial.

Aunque los tenemos presente en nuestro día a día, estos conceptos aún siguen sonando en la sociedad a Ciencia Ficción.

Por este motivo, con este artículo quisiera ofrecer una idea general y clara de qué es esto de la Inteligencia Artificial, el Machine Learning o el Deep Learning, así como las similitudes y diferencias entre ellos. En definitiva, acercar estos conceptos y que se entiendan de una forma sencilla con ejemplos reales.

Definiciones. Elaboración propia.

Inteligencia Artificial

No existe una definición clara ni un consenso entre los expertos sobre lo que es o no es realmente la Inteligencia Artificial. Puede verse desde diferentes puntos de vista y existen varias clasificaciones para categorizar este término.

Para comprender el punto en el que se encuentra la Inteligencia Artificial en la actualidad es importante distinguir entre inteligencia artificial débil e inteligencia artificial fuerte, distinción que introduce el filósofo Searle (Searle J. (1980) Minds, Brains and Programs).

  • La inteligencia artificial débil. Las máquinas parecen tener inteligencia. Se trata de máquinas creadas y entrenadas para poder realizar una tarea concreta. Un buen ejemplo de inteligencia artificial débil son los asistentes virtuales, como Siri o Cortana.
  • La inteligencia artificial fuerte. Las máquinas son inteligentes. Su objetivo es crear máquinas que simulen la inteligencia humana, máquinas que puedan realizar cualquier tarea intelectual como un ser humano. Hasta hoy, sólo la podemos encontrar en películas de ciencia ficción, como The Terminator, 1984 o I Robot, 2004. Este ha sido siempre el objetivo de la Inteligencia Artificial, replicar la inteligencia humana mediante máquinas.

Machine Learning

Es una de las ramas de estudio dentro de la Inteligencia Artificial cuyo objetivo es que las máquinas aprendan comportamientos a través de los datos que se le suministran para su entrenamiento, encuentren patrones o realicen predicciones con el objetivo de que puedan tomar decisiones certeras sin intervención humana (o con la mínima posible).

Existen tres subcampos bien diferenciados en los que se clasifican las técnicas de Machine Learning: aprendizaje supervisado, no supervisado y por refuerzo.

  • Aprendizaje supervisado. En el aprendizaje supervisado tenemos un histórico de datos en el que disponemos de la variable a predecir (o campo objetivo o etiqueta) para entrenar el modelo.
    Veamos un claro ejemplo: clasificar el correo entrante como correo basura (spam) o no (no spam). En este caso dispondremos de un conjunto de datos históricos en el que tenemos mensajes (cientos o miles de mensajes de correos electrónicos), y cada uno de ellos ya lo tenemos correctamente clasificado como spam o no spam. Esta es la estructura de los datos que tenemos para entrenar un modelo en el aprendizaje supervisado.
Histórico de datos de correos clasificados como “spam” o “no spam”
Histórico de datos de correos clasificados como “spam” o “no spam”


Una vez que tenemos el modelo entrenado y comprobamos su validez, lo podremos usar para clasificar futuros nuevos mensajes de correo como spam o no spam. Se basa en la búsqueda de similitudes entre los nuevos correos electrónicos y los previamente analizados del histórico.

  • Aprendizaje no supervisado. Para el entrenamiento del modelo disponemos de un conjunto de datos de históricos que no están etiquetados y el algoritmo descifra la información y clasifica por sí solo. Su función es la agrupación, esto es, el algoritmo agrupará estos datos según afinidades respecto a alguna o algunas características de tal forma que los miembros de un mismo grupo sean lo más parecido posible a la vez que cada grupo se diferencie con los demás lo máximo posible.

Este tipo de aprendizaje se usa de forma habitual en marketing para la identificación de segmentos de clientes según hábitos de compras. Se divide el total de los clientes en grupos de consumidores que tienen necesidades similares sin conocer previamente cuántos grupos se detectarán.

Clasificacion de clientes según hábitos de compra - qosITconsulting

Clasificación de clientes según hábitos de compra. Elaboración propia.
  • Aprendizaje por refuerzo. Las dos cualidades principales del aprendizaje por refuerzo son prueba-error y la recompensa.  Está inspirado en la propia naturaleza y en cómo aprendemos los seres humanos y animales. Un algoritmo que aprende por refuerzo lo que hace es recibir una recompensa positiva si el resultado de la acción es bueno, y negativa o nula si es malo. El objetivo del aprendizaje se consigue mediante la maximización de la función de recompensa.

Para entrenar un algoritmo que aprenda a jugar al ajedrez podemos ofrecer un refuerzo positivo cada vez que se hace un movimiento o se usa una estrategia con el que el algoritmo gana al oponente. El algoritmo recordará con qué estrategias en concreto y bajo qué condiciones previas (mejor secuencia de movimientos) gana el juego. Para entrenar al algoritmo debe enfrentarse múltiples veces a las mismas situaciones, y así ir aprendiendo qué movimientos son los que mejor rendimiento o más éxitos obtiene dependiendo del estado del tablero.

Deep Learning o aprendizaje profundo

Se trata de una clase de algoritmos de Machine Learning con una arquitectura en capas: las redes neuronales profundas. ¿Y qué son las redes neuronales profundas? Es una técnica que usa modelos matemáticos cuya estructura está inspirada en el funcionamiento de las neuronas de nuestro cerebro. Cada neurona dentro de una red neuronal es una función matemática que recibe datos, los transforma y los traspasa a la siguiente capa de neuronas.

En el siguiente diagrama podemos ver la arquitectura de una red neuronal:

Esquema de la red de predicción del ejemplo - qosITconsulting
Esquema de la red de predicción del ejemplo. Elaboración propia.

Todas las redes neuronales tienen una capa de entrada, por donde entran los datos, y una capa de salida, que genera la predicción final. Pero además, en una red neuronal profunda también habrá múltiples capas ocultas por las que pasarán e interactuarán los datos antes de que se devuelva la salida con las predicciones. Las conexiones entre las neuronas se dan a través de los pesos que tienen asociados (Wij) y representan la influencia de la neurona de salida en la neurona de entrada en la conexión.

Veámoslo con un ejemplo para aclarar estos conceptos:

Imaginemos que tenemos una empresa de alquiler de motos y queremos conocer cuántas motos debemos tener disponibles para cubrir la demanda (que nuestros clientes tengan motos disponibles para alquilar), pero que a la vez no tengamos más de las necesarias (no tengamos motos paradas durante mucho tiempo).

¿Qué necesitamos para entrenar la red?

Necesitamos un histórico de datos. Datos con los registros históricos de las variables de entrada a la red como podrían ser la temperatura, humedad, viento, día, mes, año, estación, si es día laborable o fin de semana, etc.; y el dato de salida, es decir, el registro de la demanda de motos que hubo bajo esas condiciones de entrada.


Histórico de datos para entrenar la red . Elaboración propia.

Obsérvese que al disponer de una variable objetivo o etiqueta, estamos trabajando con un modelo supervisado.

¿Qué predicciones obtenemos una vez que tenemos la red entrenada?

Pues, en función de los datos previstos (día, hora, temperatura, laboral/festivo…) la red neuronal profunda nos proporcionará una predicción del número de clientes esperado.

Esquema de la red de predicción del ejemplo. Elaboración propia.

Aplicaciones

Entre las aplicaciones de Machine Learning más frecuentes y que usamos en nuestro día a día están el reconocimiento de imágenes (Google Fotos), sistemas de recomendaciones (Netflix, Amazon, Twitter) o sistemas de reconocimiento de voz (Cortana, Siri) entre muchas otras.

La cantidad de aplicaciones es enorme. Los algoritmos de Machine Learning se pueden desarrollar en cualquier área de interés, sector o negocio, dependiendo casi únicamente de la creatividad o imaginación y de los datos disponibles.

Para más información, consulta el área de Big Data & Analytics de qosITconsulting o su plataforma de soluciones MathIT.

Artículo anterior

DevOps o la transformación cultural desde dentro

Artículo siguiente

Metaheurísticas: ¿Qué son y cómo escoger una para tu proyecto de optimización?

Sin Comentarios

Responder

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *