La importancia de DeepSeek


Juan López Páez 

Área de China CEFMA

La carrera mundial de la IA ha dado un giro intrigante con la aparición del DeepSeek -R1 de China, que algunos consideran un potencial factor disruptivo para el dominio de NVIDIA en el espacio global del hardware de IA. Mientras se arremolinan las especulaciones, los inversores en bolsa, los analistas y los líderes de opinión se enfrentan a una pregunta crucial: ¿es DeepSeek una amenaza real para NVIDIA y la industria estadounidense de la IA en general, o se trata de un caso de noticias exageradas amplificadas por las partes interesadas?.

Cuando el presidente Trump anunció el lanzamiento de un proyecto de infraestructura de inteligencia artificial de 500.000 millones de dólares (Stargate) el martes pasado, una empresa china lanzaba su DeepSeek-R1 que "supera a sus rivales en capacidades avanzadas de codificación, matemáticas y conocimientos generales" y podría haber revolucionado la economía de la IA. La reducción masiva de costos para un modelo que es tan bueno como el o1 de OpenAI. 



El experto en tecnología Adam Button nos lo resume: Imaginemos que estamos en 2017 y que el iPhone X acaba de salir al mercado. Se vendía a 999 dólares y Apple estaba arrasando en ventas y construyendo una amplia ventaja en torno a su ecosistema. Ahora imaginemos que, tan solo unos días después, otra empresa presenta un teléfono y una plataforma que son iguales en todos los aspectos, si no mejores, y el precio es de solo 30 dólares.

Y eso es lo que ha sucedido en el espacio de la IA. La empresa china DeepSeek lanzó un modelo de código abierto que funciona a la par de los últimos modelos de OpenAI, pero cuyo funcionamiento cuesta una fracción ínfima. Es más, incluso puedes descargarlo y ejecutarlo gratis (o por el costo de la electricidad) por tu cuenta.


El producto supone un gran salto en términos de escalabilidad ¹ y eficiencia y puede cambiar radicalmente las expectativas sobre cuánta potencia y computación se necesitarán para gestionar la revolución de la IA.  Además, llega apenas horas antes de que Trump anuncie una inversión de 100.000 millones de dólares en centros de datos estadounidenses. El modelo demuestra que hay diferentes formas de entrenar modelos de IA básicos que ofrecen los mismos resultados con un coste mucho menor. También abre muchas más aplicaciones para la IA que antes habrían sido demasiado caras de ejecutar, lo que debería ampliar las aplicaciones en la economía real.                               

¿Cómo afecta en el mercado bursátil a las acciones tecnológicas?, los compradores piensan: A) la IA es desinflacionaria y B) al principio habrá un gasto masivo en chips y energía para construirlo, lo que creará inflación a corto plazo.

Pues bien el apartado B de esa forma de pensar sufrió un duro revés con DeepSeek, ya que demuestra que entrenar a la IA es más una “cuestión de técnica que de poder”. Dado que es open source (codigo abierto) otros se aprovecharán de la técnica y tal vez la refinarán aún más. De modo que ese gran aumento del gasto ahora está en cuestión y el menor costo podría hacer que la IA sea aún más omnipresente.

El potencial de DeepSeek para alterar NVIDIA y la industria estadounidense de la IA es una pregunta abierta, pero la mejor manera de encontrar una respuesta es esperar a que el mercado de valores analice los próximos resultados de Nvidia (previstos para el 26 de febrero de 2025), el precio de las acciones de NVDA será la mejor guía.

La noticia de que el modelo de DeepSeek superó al o1 de OpenAI en pruebas de razonamiento específicas ha provocado un intenso debate dentro de la comunidad de IA. Este desarrollo tiene implicaciones significativas para el mercado de IA, y podría afectar los precios de las acciones de empresas como NVIDIA y otras empresas relacionadas con la IA, como así ha ocurrido en un lunes negro en que NVIDIA ha perdido más de 500.000 millones de dólares tras la irrupción de DeepSeek, en la mayor destrucción de valor de la historia de la Bolsa. 

Las pérdidas de capitalización bursátil de las tecnológicas rondaban este lunes al billón y medio de dólares, casi el equivalente al PIB español, con el Nasdaq Composite, índice fuertemente ponderado hacia las empresas del sector de tecnología de la información (tanto nacionales como extranjeras) cayendo más de un 3%. La inesperada aparición del modelo de DeepSeek ha supuesto el punto de inflexión para el vaticinado pinchazo de la burbuja de la IA de los augures más pesimistas.

¿Pero NVIDIA conservará la ventaja competitiva  frente a la promesa de DeepSeek que puede simplemente competir en precio y rendimiento sin llegar a replicar el ecosistema de NVIDIA?. Haciendo la analogía de los teléfonos móviles, algunos han utilizado la analogía de que DeepSeek podría ser el “teléfono inteligente más barato” del “iPhone” de NVIDIA. En la industria de los teléfonos inteligentes, la disponibilidad de alternativas más baratas ha modificado innegablemente la participación de mercado, en particular en los mercados emergentes. Pero ¿esto afectó el precio de las acciones de Apple o su dominio entre su base de usuarios leales? No de manera significativa.

NVIDIA ha sido durante mucho tiempo el líder indiscutible en hardware de IA, aprovechando sus GPU y el ecosistema de software CUDA para dominar el mercado. Su ecosistema es complejo: los desarrolladores, los hiperescaladores ² y los clientes empresariales están profundamente arraigados en su plataforma, lo que genera costos de cambio significativos. Esto no es muy diferente del ecosistema de Apple, donde los usuarios leales y los servicios interconectados crean barreras para salir.

En la dinámica de la producción y la tasa de acumulación de capital, lo que se denomina capitalismo informático con el despliegue de las nuevas tecnologías, la innovación del dispositivo de dominio capitalista, suponía que la IA sería la vía rápida hacia el control social absoluto y el gobierno oligárquico en los próximos milenios, pero ahora esos chinos marxistas con su “socialismo con características chinas” han dado la vuelta a la tortilla dejando a las élites occidentales con un problema. Esperaban que sus sanciones a los microchips sabotearan los esfuerzos de China en materia de IA durante al menos una década, pero, en cambio, China ha vuelto rugiendo con un modelo que ha sorprendido a los gigantes tecnológicos occidentales.

Como señala Ron Unz en un artículo reciente:  “entre 2003 y 2007, EEUU lideró en 60 de las 64 tecnologías mientras que, a partir de 2022, China lideró en 52 de las 64 tecnologías. Eso no es una competencia, es una paliza”

“China es hoy líder mundial en muchas de las tecnologías futuras más importantes. El éxito de sus empresas comerciales en telecomunicaciones (Huawei, Zongxin), vehículos eléctricos (BYD, Geely, Great Wall, etc.), baterías (CATL, BYD) y energía fotovoltaica (Tongwei Solar, JA, Aiko, etc.) se basa directamente en esa destreza en I+D.”

“De manera similar, la modernización del Ejército chino se basa en el desarrollo tecnológico masivo de la comunidad científica del país y su base industrial... Con su liderazgo en investigación científica y tecnológica, China está posicionada para superar a los EEUU en los ámbitos económico y militar en los próximos años.”

El artículo “DeepSeek panic triggers tech stock sell-off as Chinese AI tops App Store” de Benj Edwards en Ars Technica describe el pánico con el modelo de razonamiento R1 que sorprendió a los observadores de la industria al desafiar la supremacía de la IA estadounidense con un modelo de bajo costo y disponible gratuitamente cuya aplicación de asistente de IA saltó a la cima de la categoría "Aplicaciones gratuitas" de la App Store de iPhone durante el fin de semana, superando a ChatGPT.

“Tres elementos de DeepSeek R1 que realmente sorprendieron a los expertos. En primer lugar, la startup china parece haber entrenado el modelo por solo 6 millones de dólares como un llamado "proyecto secundario" mientras usaba chips de aceleración de IA Nvidia H800 menos potentes debido a las restricciones de exportación de EEUU sobre GPU de vanguardia. En segundo lugar, apareció solo cuatro meses después de que OpenAI anunciara el modelo o1 en septiembre de 2024. Finalmente, y quizás lo más importante, DeepSeek lanzó el modelo de forma gratuita con una licencia MIT abierta, lo que significa que cualquiera puede descargarlo, ejecutarlo y ajustarlo (modificarlo)”

En LinkedIn, Yann LeCun, científico jefe de IA de Meta, que suele defender los modelos de IA de ponderaciones abiertas y la investigación de IA de código abierto, escribió: “La lectura correcta es: los modelos de código abierto están superando a los propietarios”.

Por si fuera poco, el viernes, el capitalista de riesgo Marc Andreessen echó más leña al fuego, respaldó en X que DeepSeek R1 es "uno de los avances más asombrosos e impresionantes que he visto" y un "regalo profundo para el mundo". 

El modelo R1 funciona de manera diferente a los modelos de lenguaje grandes típicos... Intenta simular una cadena de pensamiento similar a la humana a medida que el modelo resuelve la consulta. Esta clase de lo que podríamos llamar  modelos de "razonamiento simulado", (modelos SR) surgió cuando OpenAI presentó su familia de modelos o1 de OpenAI en septiembre de 2024.

DeepSeek informó que R1 superó a o1 de OpenAI en varios puntos de referencia y pruebas, incluidos AIME (una prueba de razonamiento matemático), MATH-500 (una colección de problemas de palabras) y SWE-bench Verified (una herramienta de evaluación de programación).

¹ Capacidad de un sistema, empresa o proyecto para crecer y adaptarse a los cambios del mercado, sin aumentar los recursos de la misma manera. 

² Centros de datos de gran escala que ofrecen servicios de computación, almacenamiento y red a organizaciones e individuos




Comentarios

Entradas populares de este blog

El conflicto en Venezuela no son las “actas” sino los “actos”

Occidente propone guerra, Rusia y China tratan de evitarla

El imperio amenazado intenta recolonizar nuestra América