Ai ir
AlphaGo y sus sucesores utilizan un algoritmo de búsqueda en árbol de Monte Carlo para encontrar sus jugadas basándose en el conocimiento adquirido previamente por el aprendizaje automático, concretamente por una red neuronal artificial (un método de aprendizaje profundo) mediante un amplio entrenamiento, tanto del juego humano como del informático[4] Una red neuronal es entrenada para identificar las mejores jugadas y los porcentajes de victoria de las mismas. Esta red neuronal mejora la fuerza de la búsqueda en el árbol, lo que resulta en una selección de movimientos más fuerte en la siguiente iteración.
En octubre de 2015, en una partida contra Fan Hui, el AlphaGo original se convirtió en el primer programa informático de Go en vencer a un jugador profesional humano de Go sin hándicap en un tablero de tamaño normal de 19×19.[5][6] En marzo de 2016, venció a Lee Sedol en una partida de cinco juegos, la primera vez que un programa informático de Go ha vencido a un profesional de 9 dan sin hándicap.[7] Aunque perdió contra Lee Sedol en la cuarta partida, Lee renunció en la última partida, lo que dio un resultado final de 4 juegos a 1 a favor de AlphaGo. En reconocimiento a la victoria, AlphaGo fue galardonado con un 9-dan honorífico por la Asociación de Baduk de Corea.[8] Los preparativos y la partida de desafío con Lee Sedol fueron documentados en un documental también titulado AlphaGo,[9] dirigido por Greg Kohs. La victoria de AlphaGo fue elegida por Science como uno de los subcampeones del avance del año el 22 de diciembre de 2016[10].
Campeón de go vs ai
Los productos y servicios que se basan en el aprendizaje automático -programas informáticos que absorben constantemente nuevos datos y adaptan sus decisiones en respuesta- no siempre toman decisiones éticas o precisas. A veces provocan pérdidas en las inversiones, por ejemplo, o contrataciones sesgadas o accidentes de tráfico. Y a medida que estas ofertas proliferan en los mercados, las empresas que las crean se enfrentan a nuevos e importantes riesgos. Los ejecutivos deben comprender y mitigar los posibles inconvenientes de la tecnología.
El aprendizaje automático puede salir mal de varias maneras. Como los sistemas toman decisiones basadas en probabilidades, siempre es posible que se produzcan algunos errores. Sus entornos pueden evolucionar de forma imprevista, creando desconexiones entre los datos con los que fueron entrenados y los datos con los que se alimentan actualmente. Y su complejidad puede dificultar la determinación de si han cometido un error o por qué.
Una pregunta clave que deben responder los ejecutivos es si es mejor permitir que las ofertas inteligentes evolucionen continuamente o “bloquear” sus algoritmos y actualizarlos periódicamente. Además, cada oferta tendrá que ser probada adecuadamente antes y después de su lanzamiento y supervisada periódicamente para asegurarse de que funciona según lo previsto.
El go ai más fuerte
“Con el debut de la IA en los juegos de Go, me he dado cuenta de que no estoy en la cima aunque me convierta en el número uno a través de frenéticos esfuerzos”, dijo Lee a Yonhap. “Aunque me convierta en el número uno, hay una entidad que no puede ser derrotada”.
Durante años, se consideró que el Go estaba fuera del alcance incluso de los programas informáticos más sofisticados. El antiguo juego de mesa es famoso por su complejidad, con más configuraciones posibles para las piezas que átomos en el universo observable.
Lee, que fue el número uno del mundo en el ranking de Go a finales de la década de 2000, predijo inicialmente que vencería a AlphaGo de forma “aplastante” y se mostró sorprendido por sus derrotas, llegando a pedir disculpas al público surcoreano. “He fallado”, dijo tras el torneo. “Me da pena que el partido haya terminado y que haya acabado así. Quería que terminara bien”.
A pesar del resultado, los expertos en Go coincidieron en que el torneo produjo un juego excepcional. AlphaGo sorprendió al mundo con su llamada “jugada 37”, que los expertos humanos pensaron inicialmente que era un error, pero que resultó decisiva en la segunda partida. Lee causó su propio impacto con su jugada “mano de Dios” (movimiento 78), que desconcertó al programa de IA y permitió a Lee ganar una sola partida. Sigue siendo el único humano que ha derrotado a AlphaGo en un torneo. (Durante el entrenamiento, AlphaGo perdió dos partidas con límite de tiempo contra el jugador de Go Fan Hui).
გამოხმაურება
Actualización del 6 de diciembre de 2018: Este artículo se publicó originalmente en febrero de 2018 basado en un artículo publicado en el sitio de preimpresión científica arxiv.org. Ese artículo ya ha sido revisado por pares y publicado en Science, y hemos actualizado este artículo para reflejar la información más reciente.
En octubre de 2017, el equipo de DeepMind publicó los detalles de un nuevo sistema de juego de Go, AlphaGo Zero, que no estudió ninguna partida humana. En su lugar, comenzó con las reglas del juego y jugó contra sí mismo. Los primeros movimientos que realizó fueron completamente aleatorios. Después de cada partida, incorporó nuevos conocimientos sobre lo que conducía a la victoria y lo que no. Al final de estas pruebas, AlphaGo Zero se enfrentó a la versión sobrehumana de AlphaGo que había vencido a Lee Sedol. Ganó 100 partidas a cero.
El año pasado también vimos surgir a robots autodidactas de otro mundo en escenarios tan diversos como el póquer sin límite y Dota 2, un videojuego multijugador en línea enormemente popular en el que héroes de temática fantástica luchan por el control de un mundo alienígena.