Cuando usamos aprendizaje automático, podemos realizar tareas de clasificación o de regresión. La diferencia está en el tipo de resultado que queremos que la técnica de machine learning produzca. Veamos la diferencia.

Clasificación

Cuando usamos clasificación, el resultado es una clase, entre un número limitado de clases. Con clases nos referimos a categorías arbitrarias según el tipo de problema.

Por ejemplo, si queremos detectar si un correo es spam o no, sólo hay 2 clases. Y el algoritmo de machine learning de clasificación, tras darle un correo electrónico, tiene que elegir a qué clase pertenece: spam o no-spam. Hay muchos más ejemplos, por supuesto:

  • ¿comprará el cliente este producto? [sí, no]
  • ¿tipo de tumor? [maligno, benigno]
  • ¿subirá el índice bursátil? IBEX mañana [sí, no]
  • ¿es este comportamiento una anomalía? [sí, no]
  • ¿nos devolverá este cliente un crédito? [sí, no]
  • ¿qué deporte estás haciendo? tal y como lo detectan los relojes inteligentes [caminar, correr, bicicleta, nadar]
  • ¿obtendrá una historia un número alto de visitas en un agregador de noticias? [sí, no]

Otro ejemplo famoso en el mundo del Machine Learning, es el concurso de clasificación de imágenes ImageNet. En este concurso, el objetivo es reconocer qué hay en una imagen. Hay 1000 posibilidades. Entre las 1000 clases posibles están: perro, gato, coche, avión, globo, manzana, etc.

ImageNet - Concurso de Machine Learning usando Clasificación
ImageNet – Concurso de Machine Learning usando Clasificación. Dí que hay en la imagen entre 1000 posibles clases

Clasificación con probabilidades

Muchos algoritmos de machine learning dan los resultados de clasificación con probabilidades. Es decir, nos pueden decir que un correo es spam con una probabilidad del 89%. O que una imagen tiene un 67% de probabilidades ser un perro, un 18% de ser un gato, un 9% de ser una oveja, etc.

Normalmente, en el caso que usemos probabilidades, se tiende a elegir la clase con probabilidad más alta como resultado del proceso de clasificación. Otra posibilidad que está a nuestro alcance es fijar un mínimo de probabilidad antes de estar dispuestos a dar un resultado. Por ejemplo, si no estamos seguros con una probabilidad 80% o mayor, diremos que no estamos seguros, en vez de decir que es un perro. Esta estrategia puede ser útil cuando el coste de equivocarnos es alto, comparado con el beneficio de obtener la respuesta correcta.

Técnicas de Machine Learning para Clasificación

Hay varias técnicas de machine learning que podemos usar en problemas de clasificación. Podemos destacar:

Regresión

Cuando usamos regresión, el resultado es un número. Es decir, el resultado de la técnica de machine learning que estemos usando será un valor numérico, dentro de un conjunto infinito de posibles resultados.

Aquí van algunos ejemplos de regresión:

  • Predecir por cuánto se va a vender una propiedad inmobiliaria
  • Predecir cuánto tiempo va a permanecer un empleado en una empresa
  • Estimar cuánto tiempo va a tardar un vehículo en llegar a su destino
  • Estimar cuántos productos se van a vender

Técnicas de Machine Learning para Regresión

Hay varias técnicas de machine learning que podemos usar en problemas de Regresión. Podemos destacar:

Aclaraciones

Aunque hay algunas técnicas que son específicas de clasificación y otras de regresión, la mayoría de las técnicas funcionan con ambos.

Un motivo de confusión frecuente es la técnica de regresión logística. Su nombre podría inducirnos a pensar que puede usarse en problemas de regresión. Sin embargo, la regresión logística, sólo funciona para problemas de clasificación. La explicación completa está aquí.

Recursos

  • [vídeo] introductorio a la Inteligencia Artificial y al Aprendizaje Automático (en inglés)

Suscríbete a IArtificial.net

¿Clasificación o Regresión?

Deja un comentario

avatar
  Suscribir  
Notificar de