mayo 9, 2022 10:00 am

Jesús

Todos sabemos cómo la Inteligencia Artificial está liderando hoy en día. El Machine Learning es una parte de ella. La Inteligencia Artificial se consigue tanto con el Machine Learning como con el Deep Learning

Hay tres pasos en el flujo de trabajo de un proyecto de IA. Son la recopilación de datos, el entrenamiento del modelo y el despliegue del mismo. Utilizamos el Machine Learning para los modelos.

En primer lugar, empezaremos por conocer los tipos de Algoritmos de Aprendizaje Automático.

  1. 1
    Aprendizaje Supervisado.
  2. 2
    Aprendizaje no Supervisado.
  3. 3
    Aprendizaje por Refuerzo.

Aprendizaje Supervisado: Los datos que se utilizan en el aprendizaje supervisado son datos etiquetados. El etiquetado es algo que se conoce como categorización. Utilizando estos datos etiquetados se entrena un modelo de aprendizaje automático y, con ese modelo, se predice el resultado de los conjuntos de datos no entrenados. 

Aprendizaje no supervisado: Los datos que se utilizan en el aprendizaje no supervisado son datos no etiquetados. Los datos no etiquetados se dan al modelo de aprendizaje automático y se entrenan. Aquí el modelo formará clusters de acuerdo a características similares y entonces se forman los clusters. Ahora, cuando se envían los datos no entrenados, el modelo los reconocerá y los predice a los clusters correspondientes.

Aprendizaje por refuerzo: Aquí, en el aprendizaje por refuerzo, el modelo de aprendizaje automático no recibe ningún dato, ya sea etiquetado o sin etiquetar. En cambio, aquí la máquina intenta con diferentes acciones y siempre que la máquina ha hecho el modelo correcto, entonces se da la señal de recompensa. De este modo, el modelo se entrena y predice el resultado en el futuro con las experiencias pasadas.

El aprendizaje supervisado se clasifica en algoritmos de regresión y clasificación.

Los algoritmos de regresión se utilizan cuando es necesario predecir variables continuas. Por ejemplo, la predicción del salario, la predicción de la edad, la predicción del mercado de valores, etc.

Mientras que los algoritmos de clasificación se utilizan para la predicción de variables discretas, como la predicción de Verdadero o Falso, la predicción de No, la predicción de 0 o 1, la predicción de aprobado o reprobado, etc. ...., por ejemplo, la regresión logística, el árbol de decisión, la SVM (Support Vector Machine) y la KNN (k-nearest neighbors algorithm).

El aprendizaje no supervisado se basa completamente en la agrupación. El modelo analizará un patrón similar entre las variables de entrada y formará un cluster. Por ejemplo, K means clustering, Hierarchical clustering.

Algunos algoritmos básicos de aprendizaje automático que se utilizan habitualmente:

  1. 1
     Regresión Lineal Simple.
  2. 2
     Regresión Multilineal.
  3. 3
     Regresión Logística
  4. 4
     Árbol de Decisión
  5. 5
    SVM((Support Vector Machine).
  6. 6
    KNN(k-nearest neighbors algorithm).
  7. 7
    K Means Clustering. 

Regresión Lineal Simple

La regresión lineal es un modelo de aprendizaje supervisado que se utiliza para analizar datos continuos. Es un gráfico de datos que representa la relación lineal entre las variables independientes y las dependientes.

Las características se denominan variables independientes y el resultado o la etiqueta se conocen como variables dependientes que dependen de las características. La ecuación de la regresión lineal es:

y=a+bx+e

Donde,

y =

Variable dependiente

x =

Variable independiente

a =

Intercepción

b =

Pendiente

e =

Error del modelo

Entrenar el modelo significa encontrar la pendiente y el intercepto. Con esa pendiente e interceptos el modelo predecirá y con un cambio en x.

Regresión multilineal

La regresión multilineal es casi similar a la regresión lineal simple, excepto que aquí el modelo toma múltiples variables de características para predecir la variable objetivo. Toda la sintaxis y el código son los mismos que los de la regresión lineal simple. En términos sencillos, el modelo predice una variable dependiente con dos o más variables independientes.

La ecuación para una regresión multilineal es:

y=b0+b1x1+…+bnxn+e

Donde,

y =

Variable Independiente

b0 =

Intercepción de y

b1x1 =

Coeficiente de regresión (b1) de la variable independiente x1

bnxn =

Coeficiente de regresión(bn) de la variable independiente xn

e =

Error del modelo

Regresión Losgística

La regresión logística es otro potente algoritmo supervisado de Machine Learning, utilizado para problemas de clasificación binaria (cuando el objetivo es categórico). Es un método sencillo y más eficaz para los problemas de clasificación binaria y lineal. Es un modelo de clasificación muy fácil de realizar y que consigue un rendimiento muy bueno con clases linealmente separables. 

La mejor manera de pensar en la regresión logística es que es una regresión lineal pero para problemas de clasificación. La regresión logística utiliza esencialmente una función logística para modelar una variable de salida binaria. La principal diferencia entre la regresión lineal y la regresión logística es que el rango de la regresión logística está limitado entre 0 y 1. Además, a diferencia de la regresión lineal, la regresión logística no requiere una relación lineal entre las variables de entrada y salida.

Es un algoritmo muy utilizado para la clasificación en la industria.

Decision Tree

Un árbol de decisión es una técnica de aprendizaje automático supervisado. Un algoritmo de árbol de decisión se utiliza tanto para problemas de tipo de regresión como de clasificación.

La clasificación es un proceso de dos pasos, el de aprendizaje y el de predicción, en el aprendizaje automático. En la etapa de aprendizaje, el modelo se desarrolla a partir de unos datos de entrenamiento determinados. En la etapa de predicción, el modelo se utiliza para predecir la respuesta para los datos dados. El árbol de decisión es uno de los algoritmos de clasificación más fáciles y populares de entender e interpretar.

Terminología importante relacionada con los árboles de decisión:

  1. 1
    Nodo raíz: Representa toda la población o muestra y ésta se divide en dos o más conjuntos homogéneos.
  2. 2
    División: Es un proceso de división de un nodo en dos o más sub-nodos.
  3. 3
    Nodo de decisión: Cuando un subnodo se divide en otros subnodos, se denomina nodo de decisión.
  4. 4
    Nodo terminal: Los nodos que no se dividen se denominan nodo hoja o nodo terminal.
  5. 5
    Depuración: Cuando eliminamos los subnodos de un nodo de decisión, este proceso se llama pruning. Se puede decir que es el proceso contrario a la división.
  6. 6
    Sub-división: Una subsección del árbol completo se llama rama (branch) o sub-árbol (sub-tree)
  7. 7
    Nodo padre e hijo: Un nodo dividido en sub-nodos se llama nodo padre de sub-nodos mientras que los sub-nodos son hijos de un nodo padre.

La decisión de realizar divisiones estratégicas afecta en gran medida a la precisión de un árbol. Los criterios de decisión son diferentes para los árboles de clasificación y de regresión.

Los árboles de decisión utilizan múltiples algoritmos para decidir la división de un nodo en dos o más sub-nodos. La creación de sub-nodos aumenta la homogeneidad de los sub-nodos resultantes. En otras palabras, podemos decir que la pureza del nodo aumenta con respecto a la variable objetivo.

Máquina de Vectores de Soporte

La máquina de vectores de soporte es la preferida por muchos, ya que produce una precisión significativa con menos potencia de cálculo. La máquina de vectores de soporte, abreviada como SVM, cuyo significado es Support Vector Machine, puede utilizarse tanto para tareas de regresión como de clasificación. Pero, es ampliamente utilizado en los objetivos de clasificación.

Además de realizar una clasificación lineal, las SVM pueden realizar eficazmente una clasificación no lineal utilizando lo que se denomina el truco del kernel, mapeando implícitamente sus entradas en espacios de características de alta dimensión.

Cuando los datos no están etiquetados, el aprendizaje supervisado no es posible, y se requiere un enfoque de aprendizaje no supervisado, que intenta encontrar la agrupación natural de los datos en grupos, y luego mapear los nuevos datos a estos grupos formados.

K Nearest neighbours (KNN)

K Nearest Neighbors (KNN) es un algoritmo de aprendizaje automático supervisado que puede utilizarse para problemas de regresión y clasificación. El algoritmo KNN se utiliza para predecir datos basándose en medidas de similitud de datos anteriores. Uno de los casos de uso industrial del algoritmo KNN son las recomendaciones en sitios web como amazon.

Los ejemplos de entrenamiento son vectores en un espacio de características multidimensional, cada uno con una etiqueta de clase. La fase de entrenamiento del algoritmo consiste únicamente en almacenar los vectores de características y las etiquetas de clase de las muestras de entrenamiento.

En la fase de clasificación, k es una constante definida por el usuario, y un vector no etiquetado (un punto de consulta o de prueba) se clasifica asignando la etiqueta más frecuente entre las k muestras de entrenamiento más cercanas a ese punto de consulta.

K Means clustering

K Means clustering es un algoritmo de aprendizaje automático no supervisado. Aquí no habrá datos etiquetados. Los datos se clasifican en clusters. Este algoritmo es un algoritmo basado en el centroide. Cada grupo tiene un centroide. El lema de este algoritmo es minimizar la distancia entre el centroide y los puntos de datos.

En el algoritmo K Means, encontramos los mejores centroides asignando alternativamente a un conjunto de datos centros aleatorios. Y de los clusters resultantes se seleccionan los puntos de datos medios para formar nuevos centroides. Este proceso continúa de forma iterativa hasta que se optimiza el modelo.

En el caso de los conjuntos de datos de aprendizaje no supervisado, no hay etiquetas, sólo hay características. Al no haber etiquetas, tenemos que identificar qué puntos de datos del conjunto de datos son similares. Como se trata de un algoritmo heurístico, no hay ninguna garantía de que convergen al óptimo global, y el resultado puede depender de los grupos iniciales.

Conclusión

Este artículo es para los principiantes y también para aquellos que necesitan revisión. El aprendizaje automático abre para las organizaciones posibilidades sin precedentes que facilitan la automatización, la eficiencia y la innovación. 

El panorama del aprendizaje automático cambia constantemente junto al ecosistema de herramientas y procesos que crece y madura. Mientras esto suceda, continuaremos actualizando este documento para que pueda garantizar la buena arquitectura de todas las aplicaciones de aprendizaje automático.


Sobre el Autor

Jesús Martínez es el creador de DataSmarts, un lugar para los apasionados por computer vision y machine learning. Cuando no se encuentra bloggeando, jugando con algún algoritmo o trabajando en un proyecto (muy) cool, disfruta escuchar a The Beatles, leer o viajar por carretera.