Basura Espacial: competición con machine learning

Distribución de Basura Espacial alrededor de la Tierra

La Agencia Espacial Europea ha creado una competición de machine learning para predecir el riesgo de colisión entre basura espacial y satélites de observación de la Tierra. La competición empieza oficialmente el 16 de Octubre. A partir de ese momento será posible descargar los datos y enviar soluciones. La competición finaliza el 16 de Diciembre de 2019. Basura Espacial El espacio no está tan vacío como solía estar. Más de

Avances en la generación de caras con GANs

Caras generadas a partir de una imagen y una pose

Los modelos generativos, también llamados GANs (Generative Adversarial Networks), permiten la creación de datos (e.g. imágenes) que no existen. En un artículo anterior vimos como los modelos generativos se habían utilizado para generar fotos de habitaciones de hoteles, caras humanas e incluso música. El último avance en la generación de caras nos viene de la mano de ingenieros de Samsung (en Moscú) y del Instituto de Ciencia y Tecnología de

Random Forest (Bosque Aleatorio): combinando árboles

random-forest-bosque-aleatorio

Un Random Forest (Bosque Aleatorio), es una técnica de aprendizaje automático muy popular. Los Random Forests tienen una capacidad de generalización muy alta para muchos problemas. Limitaciones de los Árboles de Decisión Los árboles de decisión tienen la tendencia de sobre-ajustar (overfit). Esto quiere decir que tienden a aprender muy bien los datos de entrenamiento pero su generalización no es tan buena. Una forma de mejorar la generalización de los árboles

Ensembles: voting, bagging, boosting, stacking

Ejemplo en Ensemble por Votación

Un ensemble es un conjunto de modelos de machine learning. Cada modelo produce una predicción diferente. Las predicciones de los distintos modelos se combinan para obtener una única predicción. La ventaja que obtenemos al combinar modelos diferentes es que como cada modelo funciona de forma diferente, sus errores tienden a compensarse. Esto resulta en un mejor error de generalización. Hay varias formas de construir estos ensembles: votación por mayoría bagging

Árboles de Decisión con ejemplos en Python

Árbol de Decisión para el problema de clasificación Iris

Los árboles de decisión son una técnica de aprendizaje automático supervisado muy utilizada en muchos negocios. Como su nombre indica, esta técnica de machine learning toma una serie de decisiones en forma de árbol. Los nodos intermedios (las ramas) representan soluciones. Los nodos finales (las hojas) nos dan la predicción que vamos buscando. Los árboles de decisión pueden usarse para resolver problemas tanto de clasificación como de regresión. Veamos cómo

¿Cómo usar Regresión Logística en Python?

Regresión Logística

La regresión logística es una técnica de aprendizaje supervisado para clasificación. Es muy usada en muchas industrias debido a su escalabilidad y explicabilidad. En este artículo vamos a ver cómo entrenar y usar un modelo de regresión logística. Si quieres repasar la teoría de esta técnica de machine learning, puedes consultar este artículo. Instrucciones rápidas Ejemplo de Regresión Logística en Python Datos Vamos a suponer que queremos predecir cuál es

Regresión Logística para Clasificación

Regresión Logística

La Regresión Logística es una técnica de aprendizaje automático para clasificación. Es una red neuronal en miniatura. De hecho, la regresión logística, se trata de una red neuronal con exactamente una neurona. Matemáticas de la Regresión Logística Podemos representar lo que hace la regresión logística en la siguiente figura: Los valores de x corresponden los distintos atributos de nuestro problema. Por ejemplo, si queremos saber si un correo electrónico es

Máquinas de Vectores de Soporte (SVM)

Máquinas de Vectores de Soporte (SVM)

En este artículo hablamos de las máquinas de de vectores de soporte. También son conocidas con el acrónimo SVM por sus siglas en inglés (Support Vector Machines). Se pueden usar tanto para regresión como para clasificación. Conceptualmente, los SVM son más fáciles de explicar para problemas de clasificación. En este artículo vamos a dar una explicación intuitiva. La máquinas de vectores de soporte surgen para encontrar la manera óptima de

Redes Neuronales Generativas Adversarias (GANs)

Redes Neuronales Generativas Adversarias (GANs)

Las Redes Neuronales Generativas Adversarias son una forma nueva de usar deep learning para generar imágenes que parecen reales. También pueden generar otro tipo de datos tales como música. En este artículo vamos a ver qué son los modelos generativos, cómo funcionan y algunos ejemplos recientes. Las Redes Neuronales Generativas Adversarias también se denominan GANs por sus siglas en inglés (Generative Adversarial Networks). ¿Cómo funcionan las Redes Generativas Adversarias? Los

Regularización Lasso L1, Ridge L2 y ElasticNet

En muchas técnicas de aprendizaje automático, el aprendizaje consiste en encontrar los coeficientes que minimizan una función de coste. La regularización consiste en añadir una penalización a la función de coste. Esta penalización produce modelos más simples que generalizan mejor. En este artículo vamos a hablar de las regularizaciones más usadas en machine learning: Lasso (también conocida como L1), Ridge (conocida también como L2) y ElasticNet que combina tanto Lasso