El Machine Learning es un tipo de inteligencia artificial que consiste en entrenar un modelo haciéndole analizar una gran cantidad de datos. Por ejemplo, el modelo se alimenta con un conjunto de fotos de gatos; viendo cada vez más, el algoritmo será capaz de reconocerlos. De este modo, reproducimos la inteligencia humana no mediante el razonamiento (un conjunto de reglas lógicas para hacer deducciones), sino mediante el aprendizaje estadístico. El Machine Learning pertenece, por tanto, a la rama conexionista o estadística de la inteligencia artificial.
El machine learning ha permitido confiar a los ordenadores una gran variedad de tareas: visión por ordenador para identificar un objeto concreto en una imagen (incluyendo el reconocimiento facial, por ejemplo), detección de fraudes o spam, etc.
Aprendizaje supervisado, aprendizaje no supervisado
Un modelo de Machine Learning puede entrenarse de forma supervisada o no supervisada. Hablamos de aprendizaje supervisado cuando los datos de entrenamiento del modelo están etiquetados (o anotados) - si, por ejemplo, alimentamos al algoritmo con fotos de gatos, etiquetadas como fotos de gatos.
Hablamos de aprendizaje no supervisado cuando los datos de entrenamiento no están etiquetados: se alimenta al modelo sólo con fotos sin etiquetar, sin indicar si contienen un gato o no; el algoritmo agrupará por sí solo las fotos que contengan un animal con características de gato en una única categoría.
Por último, hablamos de aprendizaje semisupervisado cuando un modelo se entrena con una combinación de datos etiquetados y sin etiquetar.
Extracción de características
Una de las limitaciones frecuentes de un algoritmo de Machine Learning es que, para entrenarlo, no sólo hay que proporcionarle datos (etiquetados o sin etiquetar); también hay que indicarle las características con las que será capaz de identificar esos datos.
Volvamos a nuestro ejemplo - un poco simplificado, lo reconozco: si queremos construir un modelo capaz de reconocer gatos, necesitaremos por tanto proporcionarle no sólo un conjunto de fotos de gatos, sino también las características principales con las que queremos que el modelo sea capaz de reconocer a un gato: sus bigotes, sus orejas, etc. Esta extracción de características (extracción de características) puede ser realizada por un humano o por un algoritmo dedicado... ¡que tendrá que haber sido escrito previamente por un humano! Para superar esta limitación, tendremos que recurrir a una subrama del Machine Learning, llamada aprendizaje profundo, o Deep Learning.