En ocasiones, al leer que una aplicación utiliza inteligencia artificial, se siente como si estuviéramos hablando en términos futuristas. Sin embargo, ¿qué significa esto realmente? En este artículo trataremos de responder esta pregunta exponiendo brevemente algunos de los puntos más importantes del aprendizaje automático (machine learning), una de las principales disciplinas de la inteligencia artificial.
Hoy en día existen diversas aplicaciones (Facebook, Netflix, Spotify, Youtube) que tienen funcionalidades que alguna vez pensamos eran lejanas. Estas aplicaciones reconocen, en base a los gustos del usuario y cómo éste utiliza la aplicación, patrones de comportamiento y de uso que luego transformarán en nuevas recomendaciones.
Esto no es realizado al azar, sino que está apoyado en un sistema de aprendizaje automático dentro del cual se analizan datos y se extrae información.
Machine learning es un método de análisis de datos que automatiza la construcción de un modelo analítico. Utilizando algoritmos que aprenden de forma iterativa a partir de los datos, machine learning permite a los dispositivos encontrar información o ideas ocultas sin programar directamente dónde buscarla.
Evolución
Los primeros pasos de machine learning fueron situaciones de reconocimiento de patrones y la teoría de que las computadoras pueden aprender sin necesidad de ser programadas con funciones específicas. El aspecto iterativo de sus métodos nos lleva a pensar en la habilidad de adaptación que puede llegar a tener a medida que es expuesto a nuevos datos. Estas iteraciones lo llevan a aprender de sus propios resultados previos en orden de producir nuevas decisiones y resultados confiables. Algoritmos de machine learning existen desde hace mucho tiempo, sin embargo, en los últimos años ha ganado un nuevo impulso tanto en usuarios como en funcionalidades y métodos debido a la capacidad de aplicar de forma automática cálculos matemáticos complejos a grandes cantidades de datos, una y otra vez y de forma cada vez más rápida.
Algunos ejemplos de machine learning:
- Automóvil sin conductor de Google (Google driveless car).
- Recomendaciones de ofertas online, cómo las de Amazon y Netflix.
- Detección de fraude al observar anomalías en transacciones realizadas mediante procesos automáticos.
- Reconocimiento facial en imágenes subidas a redes sociales.
¿Por qué es importante?
El resurgir del interés en machine learning se debe a los mismos factores que han hecho a la minería de datos (data mining) y a las redes neuronales más populares que nunca. Factores como el gran crecimiento en variedad y cantidad de datos disponibles, procesamiento computacional más económico y potente, almacenamiento de datos más asequible.
Todo esto significa que es posible producir de manera veloz y automática modelos que permitan analizar una mayor cantidad de datos (no necesariamente sencillos) y ofrecer resultados más efectivos, incluso a gran escala. Mediante la construcción de esos modelos, una empresa aumenta sus posibilidades de identificar nuevas oportunidades, desarrollar nuevos productos comerciales, o incluso evitar riesgos previamente desconocidos.
Supervisado
Los algoritmos de aprendizaje supervisados son entrenados usando ejemplos etiquetados, tales como una entrada donde se conoce la salida deseada. Por ejemplo, un equipo podría tener un conjunto de datos etiquetados como «N» (negativo) o «P» (positivo). El algoritmo de aprendizaje recibe un conjunto de entradas junto con las correspondientes salidas correctas («N» o «P») y aprende comparando su salida real con salidas correctas para encontrar errores. A continuación, modifica el modelo en consecuencia. Mediante métodos como la clasificación, la regresión, la predicción y gradient boosting, el aprendizaje supervisado utiliza patrones para predecir los valores de la etiqueta en los datos adicionales no etiquetados. El aprendizaje supervisado es comúnmente usado en aplicaciones donde los datos históricos predicen eventos futuros. Por ejemplo, puede anticipar cuándo es probable que transacciones con tarjetas de crédito sean fraudulentas o que un cliente de seguros pueda presentar un reclamo.
No supervisado
El aprendizaje sin supervisión se utiliza contra datos que no tienen etiquetas históricas. El sistema no recibe la «respuesta correcta». El algoritmo debe averiguar qué se está mostrando. El objetivo es explorar los datos y encontrar alguna estructura dentro. El aprendizaje no supervisado funciona bien en los datos transaccionales. Por ejemplo, puede identificar segmentos de clientes con características similares que pueden ser tratados de manera similar en campañas de marketing. O puede encontrar las principales características que separan los segmen- tos de los clientes entre sí. Las técnicas populares incluyen mapas de auto-organización, mapeo de vecinos más cercanos, agrupación de k-means y descomposición de valores singulares.
Estos algoritmos también se usan para segmentar componentes de texto (sujetos, predicado, verbos, etc.), recomendar productos e identificar valores atípicos de datos.
¿Cuáles son las diferencias entre data mining, machine learning y deep learning?
Todos estos métodos tienen el mismo objetivo: extraer ideas, patrones y relaciones que pueden usarse para tomar decisiones; pero tienen enfoques y habilidades diferentes.
Data mining
La minería de datos (data mining) puede considerarse como un conjunto de métodos diferentes utilizados para extraer información de los datos e identificar patrones previamente desconocidos. Esto puede incluir algoritmos estadísticos tradicionales, análisis de texto, análisis de series de tiempo y otras áreas de análisis. La minería de datos también aborda cómo está almacenada la información y cómo son manipulados los datos a procesar.
Machine learning
Machine learning agrega distintos enfoques a la hora del procesamiento de datos. A diferencia de data mining donde sus modelos estadísticos se basan en teorías demostradas matemáticamente y esto requiere que estén dadas ciertas hipótesis (que los datos cumplan ciertos supuestos), los modelos de machine learning buscan mejorar a través de un enfoque iterativo donde se retroalimentan de los datos con menor tasa de error hasta que encuentran un patrón robusto.
El aprendizaje automático se ha desarrollado sobre la base de la capacidad de utilizar computadoras para investigar datos de los que no se conoce base teórica por detrás (estructura, patrones, etc.).
Deep learning
El aprendizaje profundo (deep learning) combina avances en el poder de la computación y tipos especiales de redes neuronales para aprender patrones complicados en grandes cantidades de datos.
Una de las primeras demostraciones de deep learning consistió en seleccionar imágenes de gatos dentro de 10mil videos de YouTube (Andrew Ng, 2012), de allí surgió el término de “deep learning”.
Pensemos en un ejemplo de reconocimiento de una señal de Pare (tránsito). Los atributos de una imagen de señal de Pare son cortados y «examinados» por las neuronas: su forma octogonal, su color rojo, sus letras distintivas, su tamaño. La tarea de la red neuronal es concluir si se trata de una señal de Pare o no. La salida tiene asociado un «vector de probabilidad», una conjetura basada en la ponderación de cada capa dentro de la red. En el ejemplo, el sistema puede estar 86% seguro de que la imagen es una señal de Pare, 7% confía en que es un signo de límite de velocidad, y 5% es una cometa pegada en un árbol, y así sucesivamente. La red neuronal finalmente decide si es correcto o no.
Para mejorar la probabilidad de acierto real lo que se necesita es entrenamiento, ver cientos de miles, incluso millones de imágenes, hasta que la ponderación de los pesos de las entradas neuronales se sintonicen con tanta precisión que la red neuronal obtenga la respuesta correcta prácticamente cada vez. Llegado a ese punto es cuando la red neuronal se ha enseñado a sí misma cómo es una señal de Pare.
Hoy en día, el reconocimiento de imágenes por parte de máquinas entrenadas a través de deep learning es en algunos casos mejor que el realizado por seres humanos. Las técnicas de deep learning son utilizadas actualmente para identificar objetos en imágenes y palabras en sonidos. Los investigadores buscan aplicar estos éxitos en nuevas técnicas de reconocimiento de patrones como traducción automática de idiomas, identificación de cáncer en sangre, diagnóstico de tumores en las exploraciones de resonancia magnética entre otros diagnósticos médicos y otros importantes desafíos sociales y empresariales.