El camino hacia la superinteligencia artificial
El camino hacia la superinteligencia artificial
Wu Yongming
presidente y director ejecutivo de Alibaba Cloud Intelligence Group
Wu Yongming describe un camino de tres etapas hacia la IA: primero, "emergencia de la inteligencia": aprendizaje de conocimiento e inteligencia generalizada; luego, "acción autónoma": dominio de herramientas y programación para asistir a los humanos (la etapa actual); y finalmente, "autoiteración": conexión con el mundo físico y aprendizaje para superar a los humanos. Alibaba Cloud sigue este camino mediante la apertura de Tongyi Qianwen y la construcción de una supernube de IA. Alibaba planea invertir 380.000 millones de yuanes en infraestructura durante tres años, y se prevé que el consumo energético de los centros de datos se multiplique por diez para 2032, en comparación con 2022.
Discurso completo en la Conferencia Yunqi 2025
Antes de comenzar mi discurso, quisiera expresar mi más sincero agradecimiento a todos los desarrolladores que apoyan la industria tecnológica en China y en todo el mundo. Hoy se celebra el décimo aniversario de la Conferencia Yunqi, que se originó como la conferencia para desarrolladores de Alibaba Cloud. Son los desarrolladores quienes han impulsado el desarrollo de la computación en la nube, la IA y la industria tecnológica en China y en todo el mundo. Por lo tanto, antes de comenzar mi discurso, quiero expresar mi más sincero agradecimiento a todos ustedes, desarrolladores.
En el mundo actual, una revolución inteligente impulsada por la inteligencia artificial acaba de comenzar. Durante los últimos siglos, la Revolución Industrial amplió las capacidades físicas humanas mediante la mecanización, y la Revolución de la Información amplió las capacidades humanas de procesamiento de información mediante la digitalización. Esta vez, la revolución inteligente superará con creces nuestra imaginación. La inteligencia artificial general (IAG) no solo amplificará la inteligencia humana, sino que también liberará el potencial humano, allanando el camino para el advenimiento de la superinteligencia artificial (ISA).
En los últimos tres años, hemos presenciado claramente su rápido crecimiento. En tan solo unos años, la inteligencia artificial ha evolucionado rápidamente, pasando de ser un estudiante de secundaria a un estudiante de doctorado, incluso ganando medallas de oro en el Fondo Monetario Internacional (OMI). Los chatbots de IA tienen la tasa de penetración de usuarios más rápida en la historia de la humanidad. La tasa de penetración de la IA en la industria supera la de cualquier otra tecnología en la historia. El consumo de tokens se duplica cada dos o tres meses. El año pasado, la inversión global en la industria de la IA superó los 400 000 millones de dólares, y en los próximos cinco años, la inversión global acumulada en IA superará los 4 billones de dólares. Esto representa la mayor inversión en potencia informática e I+D de la historia, e inevitablemente acelerará el desarrollo de modelos más potentes y la penetración de las aplicaciones de IA.
El logro de la IAG —un sistema inteligente con capacidades cognitivas similares a las del ser humano— parece ahora una realidad. Sin embargo, la IAG no representa el fin del desarrollo de la IA, sino un nuevo punto de partida. La IA no se detendrá en la IAG; avanzará hacia la superinteligencia artificial (ISA), que superará la inteligencia humana y será capaz de autoevolucionar.
La IA general busca liberar a los humanos del 80% de las tareas rutinarias, permitiéndonos centrarnos en la creatividad y la exploración. La IA, un sistema con una inteligencia integral que supera a la humana, podría crear una generación de "supercientíficos" e "superingenieros con experiencia completa". La IA resolverá problemas científicos y de ingeniería actualmente sin resolver a un ritmo inimaginable, como la superación de desafíos médicos, la invención de nuevos materiales, la lucha contra la energía sostenible y el cambio climático, e incluso la habilitación de viajes interestelares. La IA impulsará los avances tecnológicos a un ritmo exponencial, marcando el comienzo de una era de inteligencia sin precedentes.
Creemos que el camino hacia ASI pasará por tres fases:
La 1ª etapa es la "emergencia de la inteligencia", caracterizada por el "aprendizaje humano". El desarrollo de internet en las últimas décadas ha sentado las bases para esta emergencia. Internet ha digitalizado prácticamente todo el conocimiento de la historia de la humanidad. La información contenida en estos lenguajes y textos representa el corpus completo del conocimiento humano. Con base en esto, los grandes modelos primero desarrollan inteligencia generalizada al comprender la base de conocimiento global, emergen con capacidades conversacionales generales, comprenden la intención humana y responden a preguntas humanas. Gradualmente, desarrollan la capacidad de razonamiento para considerar problemas de varios pasos. Actualmente, vemos que la IA se acerca a los niveles más altos de rendimiento humano en diversas pruebas, como la medalla de oro en la Olimpiada Internacional de Matemáticas. La IA gradualmente se está volviendo capaz de entrar en el mundo real, resolver problemas reales y crear valor real. Este ha sido el tema principal de los últimos años.
La 2ª etapa es la "acción autónoma", caracterizada por "asistir a los humanos". En esta etapa, la IA ya no se limita a la comunicación verbal, sino que posee la capacidad de actuar en el mundo real. La IA puede simplificar tareas complejas, usar y crear herramientas, e interactuar de forma autónoma con los mundos digital y físico, ejerciendo un profundo impacto en el mundo real, todo ello en el contexto de los objetivos humanos. Esta es la etapa en la que nos encontramos actualmente.
La clave para lograr este avance reside, en primer lugar, en la capacidad de los grandes modelos para usar herramientas, conectando todas las herramientas digitales para completar tareas del mundo real. El punto de partida de la evolución acelerada de la humanidad fue la creación y el uso de herramientas, y los grandes modelos ahora también poseen esta capacidad. Mediante el uso de herramientas, la IA puede acceder a software, interfaces y dispositivos físicos externos como los humanos, realizando tareas complejas del mundo real. En esta etapa, dado que la IA puede mejorar significativamente la productividad, penetrará rápidamente en casi todos los sectores, incluyendo la logística, la manufactura, el software, el comercio, la biomedicina, las finanzas y la investigación científica.
En segundo lugar, las mejoras en las capacidades de codificación de modelos grandes pueden ayudar a los humanos a resolver problemas más complejos y digitalizar más escenarios. Los agentes actuales aún se encuentran en sus primeras etapas, resolviendo principalmente tareas estandarizadas a corto plazo. Para que los agentes puedan abordar tareas más complejas y a largo plazo, se requieren capacidades de codificación de modelos grandes. Dado que los agentes pueden codificar de forma autónoma, teóricamente pueden resolver problemas infinitamente complejos, comprendiendo requisitos complejos y completando la codificación y las pruebas de forma independiente, como un equipo de ingenieros. El desarrollo de capacidades de codificación de modelos grandes es esencial para lograr la IAG.
En el futuro, el lenguaje natural será el código fuente de la era de la IA, permitiendo a cualquiera crear su propio agente utilizando lenguaje natural. Simplemente introduzca su idioma nativo y dígale a la IA lo que necesita. La IA escribirá su propia lógica, invocará herramientas y construirá sistemas, completando prácticamente cualquier tarea en el mundo digital y operando todos los dispositivos físicos a través de interfaces digitales. En el futuro, los agentes y robots podrían superar en número a la población mundial, trabajando junto a los humanos y teniendo un profundo impacto en el mundo real. En este proceso, la IA podrá conectarse a la gran mayoría de los escenarios y datos del mundo real, creando las condiciones para la evolución futura.
La IA entrará entonces en su 3ª fase: la «autoiteración», caracterizada por su capacidad de «superar a los humanos». Esta fase consta de dos elementos clave:
En primer lugar, la IA se conecta a la cantidad total de datos sin procesar del mundo real. Actualmente, la IA está logrando el progreso más rápido en la creación de contenido, las matemáticas y la programación. Observamos características distintivas en estas tres áreas. El conocimiento en estos campos es 100 % definido y creado por humanos, y está contenido en texto. La IA puede comprender plenamente estos datos sin procesar. Sin embargo, en otros campos y en el mundo físico en general, la IA actual está expuesta principalmente al conocimiento resumido por humanos y carece de datos sin procesar extensos provenientes de las interacciones con el mundo físico. Esta información es limitada. Para que la IA logre avances que superen las capacidades humanas, necesita acceder directamente a datos más completos y originales del mundo físico.
Para dar un ejemplo sencillo, supongamos que el director ejecutivo de una empresa automovilística está iterando el producto del próximo año. Probablemente realizará innumerables encuestas de usuarios y debates internos para determinar las características del próximo coche, qué puntos fuertes debería alcanzar en comparación con la competencia y qué capacidades debería conservar. Actualmente, la IA tiene dificultades para lograrlo, principalmente porque los datos y la información que adquiere son datos secundarios de la investigación. Si algún día la IA pudiera conectar toda la información y los datos de un coche en particular, el próximo coche que pudiera crear superaría con creces cualquier cosa creada mediante innumerables sesiones de lluvia de ideas. Este es solo un ejemplo en el mundo humano; el mundo físico, mucho más complejo, está mucho más allá del alcance de la comprensión de la IA basada en el conocimiento humano.
Por lo tanto, para que la IA avance a un nivel superior, necesita adquirir directamente datos más completos y originales del mundo físico. Al igual que en los primeros días de la conducción autónoma, confiar únicamente en resúmenes humanos y enfoques basados en reglas para lograr la conducción autónoma no logró resultados efectivos. La nueva generación de sistemas de conducción autónoma, la mayoría de los cuales utilizan métodos de entrenamiento de extremo a extremo, aprende directamente de los datos sin procesar de la cámara a bordo, logrando un mayor nivel de capacidades de conducción autónoma. Incluso los problemas aparentemente simples de la conducción autónoma hoy en día no pueden resolverse únicamente confiando en el conocimiento y las reglas derivadas de los humanos, y mucho menos en todo el complejo mundo físico. Simplemente hacer que la IA aprenda de las reglas derivadas de los humanos está lejos de ser suficiente. Solo mediante la interacción continua con el mundo real y la adquisición de datos más completos, auténticos y en tiempo real puede la IA comprender y simular mejor el mundo, descubrir leyes más profundas que trascienden la cognición humana y, por lo tanto, crear capacidades inteligentes que son incluso más poderosas que las humanas.
En segundo lugar, el autoaprendizaje
A medida que la IA se adentra en más escenarios del mundo físico y comprende más datos físicos, los modelos y agentes de IA serán cada vez más potentes. Esto les permitirá construir infraestructura de entrenamiento, optimizar los flujos de datos y actualizar las arquitecturas de los modelos para su actualización, logrando así el autoaprendizaje. Este será un momento crucial en el desarrollo de la IA.
A medida que las capacidades sigan mejorando, los modelos futuros interactuarán continuamente con el mundo real, adquiriendo nuevos datos y recibiendo retroalimentación en tiempo real. Aprovechando el aprendizaje por refuerzo y los mecanismos de aprendizaje continuo, optimizarán de forma autónoma, corregirán desviaciones y lograrán la autoiteración y actualizaciones inteligentes. Cada interacción es un ajuste fino, y cada retroalimentación, una optimización de parámetros. Tras innumerables ciclos de ejecución de escenarios y retroalimentación de resultados, la IA se autoiterará para alcanzar capacidades de inteligencia superiores a las humanas, y surgirá una etapa temprana de la superinteligencia artificial (ISA).
Una vez que crucemos una singularidad, la sociedad humana será como pisar el acelerador. La velocidad del progreso tecnológico superará nuestra imaginación, y un nuevo aumento de la productividad impulsará a la sociedad humana a una nueva etapa. El camino hacia la superinteligencia artificial se vislumbra cada vez más claro. Con el avance de la tecnología de IA y la creciente demanda de diversas industrias, la IA también provocará una gran transformación en el sector de las TI.
Nuestra primera conclusión es que los grandes modelos son el sistema operativo de próxima generación. Creemos que la plataforma tecnológica representada por los grandes modelos reemplazará al sistema operativo actual y se convertirá en el sistema operativo de próxima generación. En el futuro, casi todas las interfaces de herramientas que se conectan al mundo real estarán conectadas a grandes modelos. Todas las necesidades de los usuarios y las aplicaciones de la industria se ejecutarán a través de herramientas relacionadas con los grandes modelos. LLM será la capa intermedia que facilita la interacción y la programación entre usuarios, software y recursos informáticos de IA, convirtiéndose en el sistema operativo de la era de la IA. Usemos una analogía simple: el lenguaje natural es el lenguaje de programación de la era de la IA, los agentes son el nuevo software y el contexto es la nueva memoria. Los grandes modelos conectan varias herramientas y agentes a través de interfaces como MCP, similar a la interfaz de bus de la era de la PC. Los agentes, a su vez, utilizan protocolos como A2A para lograr la colaboración entre múltiples agentes, similar a la interfaz API entre software.
Los modelos grandes consumirán software. Como la próxima generación de sistemas operativos, los modelos grandes permitirán a cualquiera crear un número infinito de aplicaciones utilizando lenguaje natural. En el futuro, casi todo el software que interactúe con el mundo informático podría estar compuesto por agentes generados por modelos grandes, en lugar del software comercial actual. El número de desarrolladores potenciales aumentará de decenas de millones a cientos de millones. Anteriormente, debido al coste del desarrollo de software, solo un pequeño número de escenarios de alto valor eran desarrollados por ingenieros y convertidos en sistemas de software comerciales. En el futuro, todos los usuarios finales podrán satisfacer sus necesidades mediante herramientas como los modelos grandes.
Los métodos de implementación de modelos también se diversificarán y funcionarán en todos los dispositivos. El método actual, que consiste en usar modelos mediante API, aún está en sus primeras etapas y parece bastante primitivo. Es similar a la fase de tiempo compartido y multiplexación de la era del mainframe, donde cada persona solo tenía un terminal conectado al mainframe para compartir el tiempo. Este enfoque no aborda la persistencia de los datos, carece de memoria a largo plazo, rendimiento en tiempo real, privacidad y flexibilidad. En el futuro, los modelos se ejecutarán en todos los dispositivos informáticos, con memoria persistente, funcionamiento integral conectado a la nube e incluso la capacidad de actualizar parámetros e iterar automáticamente en cualquier momento, de forma similar a cómo funcionan los sistemas operativos actuales en diversos entornos.
Basándonos en este criterio, tomamos una decisión estratégica: Tongyi Qianwen optó por un enfoque abierto para desarrollar el Android de la era de la IA. Creemos que, en la era LLM, el valor generado y el alcance de los escenarios de aplicación accesibles mediante modelos de código abierto superarán con creces los de los modelos de código cerrado. Optamos firmemente por el código abierto para apoyar plenamente el ecosistema de desarrolladores y explorar las infinitas posibilidades de las aplicaciones de IA con desarrolladores de todo el mundo.
Nuestro segundo juicio: Super AI Cloud es la próxima generación de computadoras.
El Big Model es un nuevo sistema operativo que se ejecuta en la nube de IA. Este sistema operativo puede satisfacer las necesidades de todos. Cada persona tendrá decenas o incluso cientos de agentes que trabajan y colaboran 24/7, lo que requiere enormes recursos informáticos.
El paradigma informático en los centros de datos también está experimentando una transformación revolucionaria, pasando de la computación tradicional centrada en la CPU a la computación de IA centrada en la GPU. Este nuevo paradigma de computación de IA requiere mayor potencia de procesamiento, redes más eficientes y clústeres de mayor tamaño.
Todo esto requiere suficiente energía, un conjunto completo de tecnologías, millones de GPU y CPU, y una coordinación eficiente de redes, chips, almacenamiento y bases de datos para gestionar la demanda global de forma ininterrumpida. Esto requiere una infraestructura a gran escala y un conjunto completo de tecnologías. Solo una supernube de IA puede gestionar demandas tan masivas. En el futuro, es posible que solo haya cinco o seis plataformas de supercomputación en la nube en el mundo.
En esta nueva era, la IA reemplazará a la energía y se convertirá en el recurso más esencial, impulsando el trabajo diario en innumerables industrias. La gran mayoría de las capacidades de IA se generarán y entregarán en forma de tokens en redes de computación en la nube. Los tokens son la electricidad del futuro. En esta nueva era, Alibaba Cloud se posiciona como un proveedor integral de servicios de IA, ofreciendo capacidades inteligentes líderes a nivel mundial y una red global de computación en la nube de IA, proporcionando servicios de IA fáciles de usar para desarrolladores en todo el mundo.
En primer lugar, tenemos Tongyi Qianwen, un modelo a gran escala líder a nivel mundial. Tongyi Qianwen ha publicado en código abierto más de 300 modelos, que abarcan todas las modalidades y tamaños, lo que lo convierte en el modelo de código abierto más popular entre los desarrolladores de todo el mundo. Hasta la fecha, Tongyi Qianwen ha sido descargado más de 600 millones de veces en todo el mundo, con más de 170.000 modelos derivados. Es la matriz de modelos de código abierto más grande del mundo y, posiblemente, el modelo a gran escala más utilizado en dispositivos informáticos.
Al mismo tiempo, Alibaba Cloud ofrece Bailian, una plataforma integral de servicios de modelos que facilita la personalización de modelos y el desarrollo rápido de agentes. También proporciona entornos de ejecución de agentes como AgentBay y una serie de kits para desarrolladores como Lingma/Qoder, que permiten a los desarrolladores utilizar fácilmente las capacidades de los modelos y crear y usar agentes.
En segundo lugar, Alibaba Cloud opera la infraestructura de IA y la red de computación en la nube líderes y avanzadas a nivel mundial de China, lo que la convierte en una de las pocas plataformas de computación en la nube de IA de alto rendimiento del mundo que logra la integración vertical de hardware y software. A nivel de hardware y red, los sistemas de almacenamiento central, la arquitectura de red y los chips informáticos patentados de Alibaba Cloud constituyen la sólida base de sus clústeres informáticos a gran escala.
Alibaba Cloud trabaja arduamente para desarrollar una nueva supercomputadora de IA. Cuenta con la infraestructura y los modelos de IA más avanzados, y puede colaborar en la innovación en el diseño de infraestructura y la arquitectura de modelos para garantizar la máxima eficiencia al llamar y entrenar modelos de gran tamaño en Alibaba Cloud, convirtiéndola en la nube de IA más intuitiva para desarrolladores.
La industria de la IA se está desarrollando a un ritmo que supera con creces nuestras expectativas, y la demanda de infraestructura de IA también las ha superado con creces. Estamos implementando activamente un plan trienal de desarrollo de infraestructura de IA de 380 000 millones de yuanes y seguiremos invirtiendo significativamente más. Basándonos en nuestra comprensión actual del desarrollo a largo plazo de la industria de la IA y las necesidades de los clientes, para prepararnos para la llegada de la era ASI, el consumo energético global del centro de datos de Alibaba Cloud se multiplicará por diez para 2032 en comparación con 2022, el primer año de GenAI. Este es nuestro plan a largo plazo, y creemos que esta saturación de inversión impulsará el desarrollo de la industria de la IA y marcará el comienzo de la era ASI.
Después de la llegada de la superinteligencia artificial, ¿qué tipo de relación colaborativa tendrán los humanos y la IA?
A medida que la IA se vuelve cada vez más poderosa, quizás incluso superando la inteligencia humana, ¿cómo interactuarán los humanos y la IA? Somos optimistas sobre el futuro. Con la llegada de la superIA, los humanos y la IA colaborarán de una forma completamente nueva. Los programadores podrían ya estar experimentando esto: podemos dar una orden y, mediante herramientas como Coding, podemos crear el sistema que necesitamos en tan solo 12 horas. Este es un ejemplo temprano de cómo los humanos y la IA colaborarán en el futuro. Por lo tanto, visualizamos una transición de Vibe Coding a Vibe Working. En el futuro, cada hogar, fábrica y empresa tendrá numerosos agentes y robots trabajando 24/7. Quizás, en el futuro, cada persona necesite usar 100 chips GPU para trabajar para ellos.
Así como la electricidad amplificó en su momento la fuerza física humana, la IA amplificará exponencialmente la inteligencia humana. Antes, dedicábamos 10 horas a obtener resultados. En el futuro, la IA puede multiplicar ese rendimiento de 10 horas por diez o incluso por cien. En retrospectiva, cada revolución tecnológica que ha generado una mayor productividad ha generado nuevas demandas. Los humanos serán más poderosos que nunca.
Finalmente, quiero enfatizar que esto es solo el comienzo. La IA transformará todo el ecosistema de infraestructura, software y aplicaciones, convirtiéndose en un motor clave en el mundo real y marcando el comienzo de una nueva era de revolución inteligente. Alibaba seguirá invirtiendo y trabajando con socios y clientes para integrar profundamente la IA en las industrias y crear un futuro compartido. Les deseo a todos una Conferencia Yunqi gratificante y placentera. ¡Gracias!
24 sept 2025
Comentarios
Publicar un comentario