Inteligencia Artificial. Parte III. Go, música y cuántos átomos caben en el universo.

Lee Sedol

¿Cuántos átomos caben en el universo?

Bueno, de caber caben todos, diría Venancio, la pregunta es cuántos hay. Una de las aproximaciones más aceptadas1 es que la cantidad está en el rango de 1078 a 1082 es decir, de un uno con 78 ceros a un uno con 82 ceros. Si a este número le agregamos el otro 95% del universo que no sabemos que sea (materia oscura y energía oscura, dependiendo de lo que no sepamos que estamos hablando2) y pensamos que “eso” también está hecho de átomos entonces el número subiría a un máximo de 1084

Aquí una comparación con otros grandes números:

109, cantidad aproximada de dólares que pagó Google por Deep Mind

1010, cantidad aproximada de humanos en el año 2050

1038, cantidad aproximada de direcciones IPv6

1082, cantidad aproximada de átomos en el universo

10120, número de Shannon3, estimación de la cantidad de partidas posibles en ajedrez

10769, aproximación4 a 361!5. Estimación de la cantidad de partidas posibles en go

El tema viene porque hace unas semanas AlphaGo, una inteligencia artificial creada por DeepMind derrotó al campeón mundial de go, Lee Sedol, en un torneo con reglas oficiales con puntaje final de 4-1, conquistando así uno de los últimos territorios de la mente humana, y en todos los comunicados de prensa este comentario: “el juego de go tiene más combinaciones posibles que la cantidad de átomos que hay en el universo”, pero como la magnitud entre ambos números no es comparable, la comparación es ociosa.

El go es uno de los logros más antiguos del intelecto humano, de acuerdo a diferentes versiones lleva más o menos cinco mil años en oriente y unos trescientos en occidente y su complejidad es tal que más que aprender a jugarlo el estudioso dedica su vida a aprender a intuirlo. El campeón mundial de ajedrez, Emanuel Lasker, decía6 que si algún día conocemos a una inteligencia superior seguramente va a jugar go, quizá sí, y quizá a los marcianos les guste el Cha-cha-cha.

Desde que en 1997 las computadoras le ganaron al campeón de ajedrez, el go ha sido el santo grial de la programación de Inteligencia Artificial, y tratando de alcanzarlo han transcurrido tres etapas. La primera fue intentar romper el juego a la fuerza, occidente puro, un musculoso poder de procesamiento, lo cual resultó inútil ante la inmensidad numérica del juego. Impenetrable. Con el ajedrez, el Jeopardy y el póker, las máquinas entendieron que la intuición es una ventaja estadísticamente comprobable.

La segunda etapa tiene como exponente el trabajo de Rémi Coulom, que aplicó el método de búsqueda Monte Carlo en el proceso de elección de jugadas, Monte Carlo Tree Search (MCTS), en lugar de analizar todas los posibles futuros elegimos algunos aleatoriamente y los tratamos como un muestreo de la población, este avance los llevó hasta el nivel semi profesional del go, después de eso chocaron con una barrera cuasi orgánica, de la cual Coulom decía que “hasta el nivel semi profesional las jugadas del oponente eran cada vez más predecibles, hasta que en cierto escalón en el nivel profesional se hacen totalmente impredecibles, sin puntos medios”. Y listo, un hobbie más en su vida… durante esas noticias7 es interesante notar que se menciona a un legendario maestro discreta y respetuosamente, quizá el mejor jugador… etc., y este maestro no es nada menos que Lee Sedol, el que decía “en el mundo occidental existe el ajedrez, pero el go es incomparablemente mas sútil e intelectual” y que ahora está sentado en una mesa con un monstruo de Google, la tercera etapa. Un poco como en El Informe de Brodie, de Borges, que decía que un gato puede caminar por una casa sin perderse, pero no se puede imaginar una casa. Como de esas personas que aprenden pero no entienden.

Es en esta etapa que aparece DeepMind (aquí un link8 para el que quiera leer un post más técnico del tema) recuerdo que un día vi un video en You Tube de como una máquina había aprendido a jugar Atari… la máquina era como su propia hija y se iba enseñando a sí misma, le dieron una única instrucción: maximiza el puntaje en la pantalla, y la dejaron con un control en la “mano”, poco a poco, ensayo y error, la cosa esa empieza a jugar mejor que cualquier campeón de maquinita de farmacia, me imagino que haber estado en vivo en esos experimentos ha de haber sido como ver al diablo.

Aquí uno de esos videos:

https://www.youtube.com/watch?v=V1eYniJ0Rnk

Y en Facebook vieron ese video y en Google también, y empezó la guerra de ofertas y Deep Mind es adquirida por más o menos 109 dólares. Dos años después Google Deep Mind le anuncia al mundo que ya ganaron unas partidas en secreto ante el campeón de go de Europa.

Esta tercera etapa es la combinación de tres redes: la primera se encarga del MCTS y fuerza bruta, la segunda de la base de datos y todo lo que se sabe del juego, la tercera es la que ha aprendido jugando contra sí misma, cada red da su opinión y las opiniones se combinan para sacar una especie de “mapa de calor” de las mejores jugadas. Todo por supuesto sobre mejores procesadores y recursos. Bien Funky.

El primer juego lo ganó Google, los análisis lo calificaron de sorpresivo (incluso hubo un momento en donde a Lee Sedol se le quedó la boca abierta) pero no espectacular. El segundo9 fue otra cosa, en el 1:17.48 AlphaGo hizo una jugada tan buena que Lee Sedol se levantó y se fue al baño, en el análisis posterior se vio que esta era una decisión que el propio sistema evaluó como una entre diez mil para que la hiciera un humano, pero el “value network” se impuso al “policy network” realizando una jugada que al final resultó ser una extraordinaria y ganadora decisión.

Game2 1.17.48

El policy network y el value network se combinan para elegir el camino que más probabilidad tenga de victoria, y no el que lleve a la victoria más aplastante, algo así como hace Lucy cuando le quita la pelota a Charlie Brown, no busca demolerlo, sino solamente crear situaciones favorables que lo hagan intentar patear la bola. El tercero lo gana AlphaGo y se lleva el millón a casa, en el cuarto Lee Sedol recupera el honor humano, con una de esas jugadas de mil una y de cien ninguna que poco a poco obliga a AlphaGo a rendirse, the land of the brave. En el quinto AlphaGo demostró que no hay presión psicológica que un ventilador no pueda anular y volvió a imponerse.

Como consolación podemos pensar que no es solamente la Inteligencia Artificial la que mejora, Fan Hui, el tres veces campeón de Europa que ayudó a entrenar a Alpha Go, mejoró su juego constantemente durante el experimento, y su rating ha demostrado que se convirtió en un jugador mucho más fuerte después de la experiencia, algo similar a lo que ha sucedido con el ajedrez, en donde la fortaleza en general de los jugadores ha aumentado considerablemente gracias al análisis, estudio y disponibilidad de los procesadores, y como dicen en China: “si tienes problemas en tu juego, tienes problemas en tu vida”.

Y listo, las computadoras ganaron el más humano de los juegos, con respuestas “cuasi orgánicas”, imitando nuestro pensamiento, pero mejor. Sería interesante que lo intentaran con la música: en diez años hacen jingles, en veinte los Beatles, en treinta Mozart y en sesenta Beethoven.

A menos que uno sea parte de esas comunidades primitivas y fundamentalistas que creen que el universo tiene cinco mil años (me imagino que para esa gente ver jugar ajedrez ha de ser como ver a dos hechiceros) lo más probable es que esté de acuerdo en que los seres vivos llegaron a la inteligencia por la ruta de la supervivencia, el ente que fue capaz de entender el entorno y tomar decisiones al respecto tuvo mucho más posibilidades de salir de la incómoda base de la pirámide alimenticia y pasar sus genes a la siguiente generación y así poco a poco se fue perfeccionando el truco.

Las máquinas un día se hicieron inteligentes (o lo harán pronto) sin tener que adquirir conciencia primero, es un territorio desconocido, quizá ahora lo que siga sea la historia del humano que diseña una máquina que diseña a otra máquina. Y estarán pensando, pero no estarán vivas. Zombies filosóficos.

¿Y si termináramos siendo mascotas? Que la Inteligencia Artificial nos tratara como Paris Hilton trata a su French Poodle, ciudades ecosustentables, autosuficientes, lo mismo pero sin trabajar. Dinero. La economía mundial, el clima, crimen, enfermedades, y el etcétera resuelto, y solamente espacio; quizá es lo menos que pueden hacer por nosotros, después de todo nos dejarán desempleados. Y alguien se preguntará cuál es el objetivo (y tendrá mucho tiempo libre para pensarlo) de este viaje sin retorno: una vez la inteligencia artifical esté a cargo, ya no podremos sobrevivir sin ella.

 

2016-04-10-SMBC-comics

 

1 http://www.universetoday.com/36302/atoms-in-the-universe/

2 http://science.nasa.gov/astrophysics/focus-areas/what-is-dark-energy/

3 https://es.wikipedia.org/wiki/N%C3%BAmero_de_Shannon

4 http://filemakerhacks.com/2013/02/15/fun-with-factorials/

5 La exclamación ! significa factorial, es decir, 1x2x3x4….x361

6 While the Baroque rules of Chess could only have been created by humans, the rules of Go are so elegant, organic, and rigorously logical that if intelligent life forms exist elsewhere in the universe, they almost certainly play Go

7 http://www.wired.com/2014/05/the-world-of-computer-go/

8 https://www.tastehit.com/blog/google-deepmind-alphago-how-it-works/

9

https://www.youtube.com/watch?v=l-GsfyVCBu0