AAEAAQAAAAAAAAmOAAAAJGZhMzE2NmFiLWNjMmUtNDcwMy05YzJhLTdhZDgxYjZmOTU0YQ

¿Cómo funciona el aprendizaje automático (machine learning)?

El aprendizaje automático –rama de la inteligencia artificial- está cambiando no sólo la manera en que interactuamos con las máquinas sino como nos relacionamos con el entorno alrededor nuestro. En la década pasada el aprendizaje automático nos dio autos que se manejan por si solos, reconocimiento de voz, búsquedas efectivas en la web, recomendaciones personalizadas, y un vasto entendimiento del genoma humano. El término “aprendizaje automático” se remonta a 1959 cuando Arthur Samuel, un investigador de IBM lo definió como “la habilidad (para las computadoras) de aprender sin ser explícitamente programadas”, y este campo abarca una variedad de técnicas matemáticas donde las computadoras aprenden y redefinen sus propias soluciones basadas en un “entrenamiento” simple de datos. ¿Pero cómo funciona el aprendizaje automático realmente?

Las computadoras fueron originalmente diseñadas para seguir algoritmos. Un algoritmo es simplemente una serie de etapas codificadas en un lenguaje de computadora.  Los programadores informáticos expertos se pondrían en contacto con los expertos en procesos para planificar las operaciones comerciales en diagramas de flujo los cuales entonces serian implementados como programas de computación. Un diagrama de flujo posiciona explícitamente las tareas que deben ser realizadas, en el orden en que deban ser ejecutadas, junto con cualquier decisión que se necesite hacer en el camino. Los diagramas de flujo son excelentes para modelar procesos repetitivos y predecibles donde las decisiones se toman sobre datos inequívocos. Estos sistemas fueron creados para ser determinantes.

Pero no todos los procesos siguen reglas claras e inmutables, y muchas decisiones en el mundo real no conducen a una única respuesta inequívoca.  Los sistemas del aprendizaje automático son probabilísticos: las tareas se ejecutan y las decisiones son hechas sobre información incompleta y a los resultados se les asignan probabilidades de ser correctos. El aprendizaje automático es adecuado para problemas que implican clasificación (dividir objetos entre dos o más clases) regresión (descubrir relaciones entre variables) y agrupación (agrupar objetos con características similares).  Lo cual nos lleva a ciertos usos como:

Reconocer patrones:

  • Objetos en escenarios reales
  • Identidades faciales o expresiones
  • Lenguaje hablado

Extraer conocimientos:

  • De textos de formato libre, audio o video
  • Detección de spam de correo electrónico

Descubrir anormalidades:

  • Secuencias inusuales de transacciones financieras
  • Patrones inusuales de lecturas de sensores

Hacer predicciones:

  • Valor futuro de las acciones o tipos de cambio
  • ¿Qué películas le gustaran a una persona?

 

Existen muchas técnicas matemáticas que apoyan el aprendizaje automático, las más importantes son estas:

Regresión lineal y polinomica

La regresión se ocupa de modelar la relación entre variables numéricas que esta iterativamente refinado usando una medida de error en las predicciones hechas por el modelo. La suposición básica es que la variable de salida (un valor numérico) pueda ser expresado como una combinación (suma ponderada) de un conjunto de variables de salida numéricas.

Arboles de decisión

Estos diagramas de flujo en forma de árbol usan ramificaciones para ilustrar cualquier posible resultado de una decisión. Muchos de estos diagramas de árbol usan ramificación binaria (dos opciones) basados en valores actuales o atributos de los datos. Para grandes volúmenes de datos, se puede crear muchísimos de estos árboles de decisión múltiple, los cuales juntos forman una decisión consensuada sobre los resultados.  Los arboles de decisión se pueden usar para problemas de clasificación y también de regresión.

Redes neuronales

Este concepto está inspirado en la manera que funciona el sistema nervioso, así como el cerebro para procesar información.  Un gran número de elementos de procesamiento altamente interconectados trabajan al unísono para resolver problemas específicos, usualmente de clasificación o de coincidencia de patrones. Cada neurona “vota” sobre el resultado de la decisión, lo cual podría instar a otras neuronas a votar, entonces los votos se contabilizan creando una clasificación de los resultados dependiendo del apoyo que cada uno haya recibido.

Red Bayesiana

Estas estructuras gráficas, también conocidas como red de creencias, son usadas para representar el conocimiento sobre un dominio incierto. La gráfica es un mapa probabilístico de causas y efectos donde cada nodo representa una variable aleatoria, mientras los bordes entre los nodos representan dependencias probabilísticas. Por ejemplo “cielo rojo en la noche” podría conducir a un 75% de probabilidades de “buen clima”. Estas dependencias condicionales son estimadas frecuentemente usando métodos estadísticos y computacionales.

Cadenas de Markov

Son sistemas matemáticos que van de un “estado” (situación o grupo de valores) a otro: se supone que los futuros estados depende solo del estado presente y no de la secuencia de eventos que lo preceden.  Por ejemplo, si haces un modelo de la cadena de Markov sobre el comportamiento de un bebe, podrías incluir “jugar”, “comer”, “llorar” y “dormir” como estados, los cuales junto con otros comportamientos podrían formar un “espacio de estados” que sería una lista de todos los estados posibles.  Adicionalmente, una cadena Markov te dice cuál es la probabilidad de saltar o “trascender” de un estado a otro, por ejemplo la probabilidad de que un bebe que está jugando se quede dormido en los próximos cinco minutos sin llorar antes.

La plétora de los algoritmos disponibles para el aprendizaje automático ha restringido esta tecnología a aquellas compañías con la experiencia requerida para seleccionar la herramienta correcta para el proyecto en mano. Para que el aprendizaje automático pueda ser adoptado más ampliamente, estas tecnologías necesitan ser simplificadas y entregadas como un servicio. Este es el objetivo del servicio de aprendizaje automático de IBM Watson.

Creada sobre Apache Spark, el aprendizaje automático de Watson construye de manera inteligente y automática modelos usando librerías de aprendizaje automático abierto y los grupos de algoritmos más entendibles de la industria.   Su asistencia cognitiva patentada para la tecnología de la ciencia de datos marca cada algoritmo de aprendizaje automático contra los datos proporcionados para recomendar la mejor solución para la necesidad.

Contacta a Nexolution, partner de IBM  para conocer más acerca de los sistemas cognitivos de IBM Watson, aprender como implementarlos y crear una estrategia para tu empresa para que todos los procesos del negocio se vean beneficiados.

Fuente: IBM booklet “How it works-Machine Learning”

SODA (6)