AI

DeepSeek

El 21 de enero de 2025, Donald Trump anunció que el proyecto Stargate —empresa conjunta conformada por OpenAI, Oracle, SoftBank y la firma de inversión MGX— planeaba invertir hasta 500.000 millones de dólares para construir la infraestructura de inteligencia artificial (IA) más grande de la historia. Sin embargo, pocas horas antes, un pequeño laboratorio en China sorprendió al mundo lanzando DeepSeek-R1, un modelo de IA de código abierto comparable en rendimiento a ChatGPT. Este acontecimiento marcó un antes y un después en el sector, redefiniendo paradigmas de innovación, costos, accesibilidad y competencia global.

La gigantesca inversión del proyecto Stargate simbolizaba la apuesta de Estados Unidos por afianzar su liderazgo en la tecnología mediante la creación de enormes centros de datos. Su estrategia se basaba en construir infraestructuras centralizadas y chips de alto rendimiento, ambos costosos y controlados. En contraste, DeepSeek-R1 mostró que era posible alcanzar altos niveles de rendimiento utilizando un enfoque innovador disruptivo.

El impacto de DeepSeek-R1 fue de tal magnitud en los mercados que, el 27 de enero de 2025, la confianza en las grandes inversiones en infraestructura tecnológica se puso en duda, provocando una histórica caída en las acciones de Nvidia que se tradujo en pérdidas valoradas en casi 600.000 millones de dólares. Esta situación forzó a otros líderes del sector, como OpenAI, Google, Meta y xAI, a revaluar sus estrategias en términos de inversión y eficiencia, poniendo en tela de juicio la dependencia exclusiva de grandes inversiones en infraestructura.

El artífice de este emprendimiento es Liang Wenfeng, nacido en 1985 en Guangdong, China, y formado en la Universidad de Zhejiang. Con una sólida experiencia previa —como fundador de High-Flyer, un fondo de cobertura que aplicaba la IA al análisis financiero— Liang anunció en mayo de 2023 su interés en desarrollar una ‘Inteligencia Artificial General’ y fundó DeepSeek en julio del mismo año.

DeepSeek-R1 alcanzó rendimientos comparables a los modelos más poderosos de los gigantes estadounidenses como OpenAI, Google y Meta, pero a un costo extremadamente bajo. Según la empresa, el entrenamiento de DeepSeek-V3 —una versión anterior— costó alrededor de 6 millones de dólares, en contraste con los 100 millones estimados para GPT-4 de OpenAI en 2023, y utilizó aproximadamente una décima parte de la potencia computacional de Llama 3.1 de Meta.

Ante las restricciones comerciales impuestas por Estados Unidos a China, que limitaron el acceso a los chips de última generación, DeepSeek se vio obligada a innovar utilizando chips Nvidia de menor capacidad complementados con hardware chino, como los chips Ascend 910C de Huawei. Este ingenioso enfoque ha impulsado una mayor autonomía y competitividad en el ecosistema de IA en China. Liang señaló en una entrevista:

“En el pasado, las empresas chinas estaban acostumbradas a seguir a otros en la innovación tecnológica y enfocarse en la monetización de aplicaciones. Pero esto no es sostenible. Con DeepSeek, nuestro objetivo es estar a la vanguardia de la tecnología y conducir el desarrollo del ecosistema de IA en China. Creemos que, a medida que la economía crezca, deberíamos convertirnos en contribuyentes, no solo beneficiarios”.

Efectivamente, el hecho de que DeepSeek-R1 se publicara bajo la licencia MIT —una de las más permisivas— fomenta la democratización de la IA, permitiendo que desarrolladores y académicos de todo el mundo construyan sobre él, acelerando la innovación y la adopción de IA. En el artículo del World Economic Forum, What is open-source AI and how could DeepSeek change the industry? Charlotte Edmond señala:

“DeepSeek es de código abierto, lo que significa que está disponible para que cualquier persona lo descargue, copie y modifique. Su código y sus explicaciones técnicas completas se comparten libremente”.

La comunidad de código abierto ya ha creado cientos de variantes de DeepSeek en plataformas como Hugging Face, adaptándolo a idiomas minoritarios como el quechua y suajili, y en aplicaciones especializadas, desde análisis legal hasta agricultura de precisión. En el artículo DeepSeek shows there’s room for more AI playerspublicado por IBM, David Cox, afirma que OpenAI y sus contrapartes han difundido durante mucho tiempo la idea que solo con grandes inversiones se podía liderar en IA, pero con DeepSeek y otros modelos de código abierto, ese argumento está comenzando a resquebrajarse. Escribe:

“Estamos viendo un cambio en el que una cantidad mucho más amplia de actores pueden competir en este espacio. No es que cualquiera con 5 millones de dólares pueda crear un modelo de primer nivel de la noche a la mañana, pero las empresas emergentes y de tamaño mediano bien financiadas tienen sin duda grandes oportunidades”.

Xia Hu, profesor en la Universidad Rice, reconoce que DeepSeek ha dado un gran paso en la eficiencia de los sistemas de IA. Sin embargo, explica que todavía se requieren los cuatro componentes críticos: algoritmos, big data, cómputo y distribución. El cambio más significativo probablemente se dará con la adopción de la IA por parte de las empresas. Con la disminución de costos y la mejora en los modelos de código abierto, incluso las empresas más pequeñas podrán desarrollar soluciones personalizadas sin depender exclusivamente de servicios externos. Hu advierte que, si bien las empresas más pequeñas están ganando terreno, los actores principales se están adaptando. Señala:

“Amazon, Meta y Microsoft no se quedarán de brazos cruzados y dejarán que el código abierto se coma su pan. Están trabajando arduamente para descubrir cómo integrar modelos de código abierto y, al mismo tiempo, mantener el control sobre la infraestructura y los datos”.

Andrew Ng de la Universidad de Stanford ve a DeepSeek-R1 como un síntoma de tendencias más amplias: la madurez de la IA china, el auge del código abierto y la necesidad de equilibrar escala con eficiencia. Considera que, aunque los grandes modelos tienen su lugar, el futuro más prometedor está en aplicaciones prácticas construidas sobre bases abiertas y accesibles. Para él, la IA no es una carrera de ‘vencedores únicos’, sino un ecosistema donde la colaboración y la diversidad de enfoques impulsarán beneficios globales. En el artículo DeepSeek-R1 and the Future of Generative AI, Ng destaca los siguientes puntos:

  • China está alcanzando a Estados Unidos en la IA generativa. Cuando se lanzó ChatGPT en noviembre de 2022, Estados Unidos estaba significativamente por delante de China, sin embargo, esta brecha se ha reducido rápidamente en los últimos dos años con modelos chinos como Qwen, KimiInternVL DeepSeek. El hecho de que DeepSeek-R1 sea de código abierto permitirá que muchas empresas e instituciones puedan acceder a esta tecnología. Si Estados Unidos sigue obstaculizando el código abierto, China dominará este nicho, y muchas empresas usarán modelos que reflejan más los valores chinos que los estadounidenses.
  • Los modelos de código abierto están convirtiendo en productos la capa de ‘modelos base’. El negocio de entrenar modelos y vender su acceso a través de APIs es complejo. Por lo cual muchas empresas están buscando alternativas. En contraste, construir aplicaciones sobre ‘modelos base’ ofrece grandes oportunidades. Luego que otros han invertido miles de millones en entrenarlos, se puede construir aplicaciones sobre ellos.
  • El aumento de escala no es el único camino para el progreso de la IA. Varias empresas recaudaron miles de millones vendiendo la narrativa de que, con más capital, podrían escalar y mejorar sus negocios. Así, el enfoque se centró en mayor potencia de cómputo, en lugar de una visión más matizada que considere otras formas creativas de mejorar el rendimiento. La demanda de inteligencia y potencia de cómputo no tiene límites.

La llegada de DeepSeek ha acelerado la creación de un ecosistema tecnológico alternativo en China, impulsando la consolidación de estándares propios y estableciendo barreras frente a sistemas occidentales. La creciente competencia entre Estados Unidos y China podría derivar en dos ecosistemas de IA diferenciados, lo que complicaría la cooperación global en materia de innovación y seguridad. Expertos en seguridad tecnológica han expresado su preocupación. Yoshua Bengio, reconocido como uno de los ‘padres’ de la IA moderna, advirtió en el artículo DeepSeek advances could heighten safety risk, says ‘godfather’ of AI, publicado en The Guardian que el progreso acelerado de DeepSeek podría intensificar la carrera tecnológica, llevando a que empresas tanto estadounidenses como chinas prioricen el liderazgo a expensas de la seguridad. Bengio señaló:

“Estas herramientas son cada vez más fáciles de usar para los no expertos, porque pueden descomponer una tarea complicada en pasos más pequeños que todos pueden entender y luego pueden ayudar de manera interactiva a hacerlo bien. Y eso es muy diferente a usar, por ejemplo, la búsqueda de Google […] Si eres un terrorista, te gustaría tener una IA que sea muy autónoma. A medida que aumentamos la autonomía, aumentamos los beneficios potenciales de la IA y aumentamos los riesgos”.

En enero de 2025 se publicó el International AI Safety Report, el primer informe completo sobre seguridad de la IA elaborado por 96 expertos —entre ellos el premio Nobel Geoffrey Hinton— El informe afirma que los sistemas de IA de propósito general, como los chatbots, se han vuelto más capaces en ‘dominios que son relevantes para el uso malicioso’, como identificar vulnerabilidades de software para hackers, guiar la creación de armas biológicas o químicas, y generar noticias falsas para fraudes financieros, chantajes y pornografía.

DeepSeek ha demostrado que es posible desarrollar modelos de alta capacidad a un costo muy inferior al de los gigantes tecnológicos, democratizando el acceso a la inteligencia artificial y abriendo la puerta a un sinfín de aplicaciones innovadoras. Sin embargo, su éxito también plantea desafíos importantes en términos de privacidad, seguridad y geopolítica. Como señala Andrew Ng:

“El código abierto en IA es como el fuego: puede calentar tu hogar o quemar el bosque. La clave está en cómo lo controlamos.”

En el libro Poder y Progreso, los ganadores del Nobel de Economía 2024, Daron Acemoglu y Simon Johnson, resaltan que la tecnología no es inherentemente beneficiosa o perjudicial; ya que su impacto depende de cómo se utiliza y de quién controla su implementación. Escriben:

“Tenemos a nuestra disposición unas herramientas fascinantes y las tecnologías digitales podrían potenciar todo lo que la humanidad es capaz de hacer, pero sólo si conseguimos que esas herramientas trabajen por y para las personas”.

El desafío es claro: aprovechar el potencial transformador de la IA sin sacrificar la seguridad ni la equidad global. DeepSeek se posiciona como un catalizador de cambio, invitándonos a repensar cómo se debe gestionar y regular la tecnología en un mundo cada vez más interconectado y competitivo. Podemos y debemos tener estos debates, y tomar las decisiones sobre qué rumbo tomar. Redirigir la tecnología consiste en identificar las categorías que aportan más beneficios para todos. Adela Cortina, autora de ¿Ética o ideología de la inteligencia artificial? El eclipse de la razón comunicativa en una sociedad tecnologizada, en una entrevista al diario El País señaló:

“La IA es un saber científico-técnico que hay que encaminar en alguna dirección. Si quienes lo controlan son grandes empresas que quieren poder económico o países que quieren poder geopolítico, entonces no queda nada garantizado que sea bien usado. Si esta tecnología afecta a toda la humanidad, tiene que beneficiar a toda la humanidad”.

En definitiva, el lanzamiento de DeepSeek marca un hito que podría transformar el panorama tecnológico mundial, fomentando la innovación y abriendo nuevas posibilidades para actores de todos los tamaños y orígenes. El futuro de la inteligencia artificial dependerá, en gran medida, de la capacidad de la industria y los gobiernos para equilibrar el progreso con una gestión responsable de sus riesgos. Yuval Noah Harari, en su libro 21 lecciones para el siglo XXI escribió:

“El peligro es que, si invertimos demasiado en el desarrollo de la inteligencia artificial y muy poco en el desarrollo de la conciencia humana, la inteligencia artificial muy sofisticada de las computadoras solo servirá para potenciar la estupidez natural de los humanos”.

Agregar un comentario

Su dirección de correo no se hará público. Los campos requeridos están marcados *