Árboles de Decisión con ejemplos en Python

Árbol de Decisión para el problema de clasificación Iris

Los árboles de decisión son una técnica de aprendizaje automático supervisado muy utilizada en muchos negocios. Como su nombre indica, esta técnica de machine learning toma una serie de decisiones en forma de árbol. Los nodos intermedios (las ramas) representan soluciones. Los nodos finales (las hojas) nos dan la predicción que vamos buscando. Los árboles de decisión pueden usarse para resolver problemas tanto de clasificación como de regresión. Veamos cómo

Regresión Polinómica en Python con scikit-learn

Regresión Polinómica

En algunas ocasiones nos encontraremos con datos que siguen una función polinómica. En estos casos, el mejor modelo que podemos usar es la regresión polinómica. Este artículo explica la teoría detrás de la regresión polinómica y cómo usarla en python. Regresión Polinómica – Teoría La regresión polinómica es, en realidad, una regresión lineal. El truco está en: Calcular atributos polinómicos Usar la regresión lineal que ya hemos visto. Vamos a

Regresión Lineal con ejemplos en Python

Regresión Lineal con ejemplos en Python

La regresión lineal es una de las técnicas más usadas en Machine Learning. Su fortaleza estriba en su simplicidad e interpretabilidad. La regresión polinómica, como ya veremos, es una extensión de la regresión lineal. Regresión Lineal – Teoría La regresión lineal es una técnica paramétrica de machine learning. Con «paramétrica» queremos decir que incluso antes de mirar a los datos, ya sabemos cuántos parámetros (o coeficientes) vamos a necesitar. En

Generalización en Machine Learning

Separación de datos en los conjuntos de Entrenamiento y Testeo

En Machine Learning, la Generalización es la capacidad de obtener buenos resultados con datos nuevos. En este artículo vamos a hablar de por qué es tan importante la generalización y cómo medirla. Intuición gráfica de la Generalización en Machine Learning Para explicar el concepto de generalización, vamos a intentar usar un ejemplo gráfico y usar el error cuadrático medio. Una vez que tengamos la intuición gráfica, será más fácil describir

Error Cuadrático Medio para Regresión

Calculando el Error Cuadrático Medio

El Error Cuadrático Medio es el criterio de evaluación más usado para problemas de regresión. Se usa sobre todo cuando usamos aprendizaje automático supervisado. Para cada dato histórico podremos indicar el resultado correcto. Vamos a ver como se calcula. Cálculo del Error Cuadrático Medio Vamos a calcular el error cuadrático medio con un ejemplo. En la figura vemos que estamos usando una regresión lineal (en azul) para estimar los datos

Fases del Proceso de Machine Learning

Fases del Machine Learning

A la hora de usar Machine Learning, es conveniente seguir un proceso si queremos obtener buenos resultados. Al seguir un proceso, podemos hacer un mejor uso de nuestro tiempo. Además tendremos una orientación sobre qué es lo que debemos hacer en caso de que nuestros resultados no sean tan buenos como esperábamos. En este artículo vamos a hablar sobre las fases del proceso de machine learning y cómo están relacionadas

¿Clasificación o Regresión?

ImageNet - Concurso de Machine Learning usando Clasificación

Cuando usamos aprendizaje automático, podemos realizar tareas de clasificación o de regresión. La diferencia está en el tipo de resultado que queremos que la técnica de machine learning produzca. Veamos la diferencia. Clasificación Cuando usamos clasificación, el resultado es una clase, entre un número limitado de clases. Con clases nos referimos a categorías arbitrarias según el tipo de problema. Por ejemplo, si queremos detectar si un correo es spam o