Extracto sobre inteligencia artificial

El aprendizaje del refuerzo profundo.


3 minutos de lectura


Extraído del podcast de Lex Friedman con David Silver. Uno de los desarrolladores del sistema que le gano al campeón mundial Lee Sedol en el juego GO con un resultado de 4 a 1.

Existen muchos niveles en los que se puede entender un sistema. Vislumbrar una necesidad para cumplir con un propósito de la manera más optimizada dentro de las posibilidades.

¿Por donde podríamos iniciar?

En un primer nivel podríamos empezar por el universo. ¿Cuál es su propósito? A simple vista el universo solo sigue las leyes de la física lo que deriva en el constante desarrollo del universo.

Pero como indica la segunda ley de la termodinámica, otra de las cosas que este universo realiza es incrementar la entropía a través del tiempo. Casi como si su propósito fuese maximizar la entropía para poder dispersar toda la energía que abunda.

En otro nivel uno podría inferir que en este sistema la evolución surge como un mecanismo en el que el universo descubre con el fin de dispersar energía lo más eficiente posible. Uno entonces podría interpretar a la evolución como si este fuera el propósito de este mecanismo.

Podemos ir un nivel más y analizar el sistema de la evolución. Su propósito parece ser; hacer de la reproducción de una especie lo más efectiva dentro de las posibilidades. La necesidad de una entidad con la capacidad de sobrevivir y reproducirse. Estas entidades u organismos comenzaron a desarrollar un cerebro o inteligencia para cumplir con su propósito y así acceder tanto a niveles superiores como anteriores.

Universo > entropía > evolución > inteligencia

Estos primeros sistemas tenían propósitos muy simples. Controlar los elementos de manera directa y afectando su contexto.

Esto derivo en un nuevo nivel que son los sistemas de aprendizaje. Logrando que este cerebro fuese capas de aprender por si mismo. Con la capacidad de programarse a si mismo para lograr su propósito.

Existen muchas perspectivas y niveles en los que se puede entender a la inteligencia. Y cada uno de esos niveles a su vez puede tomar múltiples perspectivas.

Sea dispersar energía arbitrariamente u optimizar su funcionamiento para un propósito. Ambas perspectivas no están en contradicción con el hecho de que existe una elección y una decisión para conseguir un objetivo.

El siguiente paso entonces está en la inteligencia artificial. Como este organismo, entidad, cerebro, persona, pueda aprender por si mismo, revelándole nuevos patrones que no existían previamente con el objetivo de realizar su propósito lo más eficientemente posible. Hoy en día ya existen sistemas artificiales con la capacidad de aprender por ellos mismos.

Y así la historia de la perspectiva, la inteligencia y la creatividad pueden reproducirse eternamente.

Nota al pie

Luego del desarrollo de AlphaGo se modificó el algoritmo para que en lugar de aprender con información que se le aportaba al sistema (las reglas del juego por ejemplo). Este fuera un sistema que pudiera aprender por si mismo, sin reglas preestablecidas al que llamaron AlphaZero.

Este sistema jugó durante 40 días contra si mismo. Jugo millones de veces. Sin saber absolutamente nada, llegó a un nivel super humano.

Cuando llegó el turno de competir contra la anterior versión. AlphaZero le gano a AlphaGo 100 a 0.

Hoy en día estos sistemas son utilizados (entre otras cosas) para decodificar el genoma humano, y así como sus creadores, para encontrar la manera más efectiva para cumplir prácticamente cualquier propósito que así lo requiera.