La start-up china DeepSeek ya compite mano a mano con las gigantes tecnológicas de Estados Unidos


El día después de Navidad, una pequeña empresa china llamada DeepSeek presentó un nuevo sistema de inteligencia artificial (IA) con capacidades similares a las de los chatbots de vanguardia de empresas como OpenAI y Google.

Eso ya habría sido todo un hito por sí solo, pero el equipo que desarrolló el sistema, denominado DeepSeek-V3, habló de un paso aún más trascendente. En un artículo de investigación donde explican cómo desarrollaron esa tecnología, los ingenieros de DeepSeek afirman que solo utilizaron una fracción de los chips informáticos altamente especializados de los que dependen las principales empresas de IA para entrenar sus sistemas.

Esos chips son el epicentro de una tensa carrera tecnológica entre Estados Unidos y China. Para mantenerse en la delantera de la carrera mundial de la IA, el gobierno norteamericano está tratando de limitar la cantidad de chips de alta potencia —como los fabricados por la empresa Nvidia de Silicon Valley— que pueden ser vendidos a China y otros países rivales.

Chip de NvidiaFeature China – Future Publishing

Sin embargo, el desempeño del modelo DeepSeek plantea interrogantes sobre las consecuencias indeseadas que pueden tener las restricciones comerciales del gobierno de Estados Unidos, porque son esas restricciones las que han obligado a los investigadores chinos a ser creativos y a ofrecer una amplia gama de herramientas gratuitas disponibles en Internet.

Cuando fue sometido a las mismas pruebas de referencia que vienen utilizando las empresas norteamericanas de IA, el chatbot DeepSeek respondió preguntas, resolvió problemas de lógica y escribió sus propios programas informáticos con la misma habilidad del resto de los productos que ya están en el mercado.

Además, el desarrollo de DeepSeek tuvo un bajo costo, desafiando la idea predominante de que solo los gigantes tecnológicos, todos con sede en Estados Unidos, podían permitirse la fabricación de los sistemas de IA más avanzados. Los ingenieros chinos dijeron que para desarrollar su nuevo sistema solo necesitaron alrededor de 6 millones de dólares en potencia informática bruta, unas 10 veces menos de lo que el gigante tecnológico Meta invirtió para construir su última tecnología de IA.

Hay muchas más empresas que tienen 6 millones disponibles para gastar que las que tienen 100 o 1000 millones”, apunta Chris V. Nicholson, un inversor de la firma de capital de riesgo Page One Ventures, que se centra en tecnologías de IA.

Chris V. Nicholson, de Page One Ventures

Desde 2022, cuando OpenAI desató el auge de la IA con el lanzamiento de su ChatGPT, muchos expertos e inversores habían llegado a la conclusión de que ninguna empresa podía competir con los líderes del mercado sin gastar cientos de millones de dólares en chips altamente especializados.

Las empresas líderes en el mundo en desarrollo de IA entrenan sus chatbots con supercomputadoras que utilizan hasta 16.000 chips, si no más. Los ingenieros de DeepSeek, por otro lado, dicen haber necesitado solo 2000 chips informáticos especializados fabricados por Nvidia.

Las restricciones que tiene China para acceder a los chips obligaron a los ingenieros “a entrenar DeepSeek de manera más eficiente, para que siguiera siendo competitivo”, señala Jeffrey Ding, profesor adjunto de la Universidad George Washington y especialista en tecnología emergente y relaciones internacionales.

A principios de este mes, el ahora exgobierno de Biden emitió nuevas regulaciones cuyo objetivo es evitar que China obtenga chips avanzados de inteligencia artificial de fabricación norteamericana a través de otros países. La regulación se suma a las múltiples rondas de restricciones anteriores que impiden que las empresas chinas puedan comprar o fabricar chips de vanguardia. El presidente Trump aún no ha dicho si mantendrá esas medidas o las dará de baja.

El gobierno de Estados Unidos viene tratando de mantener los chips avanzados fuera del alcance de las empresas chinas por temor a que sean utilizados con fines militares. En respuesta, algunas empresas en China han acumulado decenas de miles de chips, mientras que otras los consiguieron en el floreciente mercado negro del contrabando tecnológico.

Polo tecnológico de Silicon ValleyMichael Vi – Shutterstock

DeepSeek es manejado por una empresa operadora de acciones cuantitativas llamada High Flyer. Para el año 2021, la empresa ya había invertido sus ganancias en la adquisición de los miles de chips Nvidia que utilizó para entrenar sus modelos anteriores. La empresa, que no respondió a las solicitudes de comentarios, se ha hecho conocida en China por captar a los mejores talentos recién salidos de las universidades más prestigiosas con la promesa de salarios altos y de que podrán abocarse a las áreas de investigación que más despiertan su interés.

Zihan Wang, un ingeniero informático que trabajó en un modelo anterior de DeepSeek, dice que la empresa también contrata a personas sin conocimientos informáticos para ayudar al chatbot a comprender y generar poesía, y a acertar las preguntas del notoriamente difícil examen de ingreso a las universidades chinas.

DeepSeek no fabrica ningún producto de consumo, y eso permite que sus ingenieros se concentren por completo en la investigación. También implica que su tecnología no está limitada por el aspecto más estricto de las regulaciones sobre IA que rigen en China, que exigen que toda tecnología orientada al consumidor se someta a los controles del gobierno sobre el manejo de la información.

Mientras tanto, las principales empresas norteamericanas siguen avanzando con su IA de última generación. En diciembre, OpenAI presentó un nuevo “sistema de razonamiento” llamado o3, que supera el desempeño de las tecnologías existentes, aunque todavía no está disponible fuera de la empresa. Pero DeepSeek sigue demostrando que no se queda atrás: este mes, lanzó un impresionante modelo propio de razonamiento.

(The New York Times ha demandado a OpenAI y a su socio, Microsoft, por infringir los derechos de autor de contenido de noticias relacionado con sistemas de IA. OpenAI y Microsoft han negado esas acusaciones).

Kai-Fu Lee, cofundador de la start-up 01.AIpicture alliance – picture alliance

En el centro de este mercado global en constante fluctuación hay una idea que ya tiene muchos años: el software de código abierto. Como muchas otras empresas, DeepSeek ha abierto el código de su último sistema de IA, lo que significa que ha compartido con otras empresas e investigadores el código subyacente a su sistema, posibilitando que otros creen y distribuyan sus propios productos utilizando esa misma tecnología.

Mientras que los empleados de las grandes empresas tecnológicas chinas solo pueden colaborar con sus colegas de trabajo, “cuando se trabaja en código abierto se está trabajando con talentos de todo el mundo”, explica Yineng Zhang, jefe de ingenieros de software de Baseten, San Francisco, que trabaja en el proyecto de código abierto SGLang. Zhang ayuda a otras personas y empresas a crear productos utilizando el sistema de DeepSeek.

El ecosistema de código abierto para IA cobró impulso en 2023 cuando Meta compartió libremente un sistema de IA llamado LLama. Muchos dieron por sentado que esa comunidad de desarrolladores de código abierto solo florecería si las empresas como Meta —gigantes tecnológicos con masivos centros de datos repletos de chips especializados— se sumaban y abrían el código fuente de sus tecnologías. Pero DeepSeek y otras empresas han demostrado que también pueden expandir la potencia de las tecnologías de código abierto”.

Muchos ejecutivos y expertos argumentan que las gigantes norteamericanas no deberían abrir el código fuente de sus tecnologías porque podría usarse para difundir desinformación o causar otros perjuicios graves. De hecho, algunos legisladores norteamericanos han analizado la posibilidad de impedir o restringir esa práctica.

Pero otros argumentan que si los reguladores ponen palos en la rueda del progreso de la tecnología de código abierto en Estados Unidos, China se quedará con una ventaja significativa. Señalan que si las mejores tecnologías de código abierto provienen de China, los desarrolladores norteamericanos construirán sus sistemas en base a esas tecnologías. Y a largo plazo, eso dejaría a China en el centro de la investigación y el desarrollo de IA.

“El centro de gravedad de la comunidad de código abierto se está moviendo hacia China”, apunta Ion Stoica, profesor de informática de la Universidad de California en Berkeley. “Y eso entrañaría un gran peligro para Estados Unidos”, porque permitiría que China acelere el desarrollo de nuevas tecnologías.

Horas después de su toma de posesión, el presidente Trump derogó un decreto del gobierno de Biden que amenazaba con frenar las tecnologías de código abierto.

El presidente estadounidense Donald Trump sostiene la carta del presidente saliente Joe Biden mientras firma órdenes ejecutivas en la Oficina Oval de la Casa Blanca en Washington, DC, el 20 de enero de 2025JIM WATSON – POOL

Recientemente, Stoica y sus alumnos desarrollaron un sistema de inteligencia artificial llamado Sky-T1 que en ciertas pruebas de referencia rivaliza con el desempeño del último sistema de OpenAI, llamado OpenAI o1. Para desarrollarlo solo necesitaban 450 dólares en potencia informática.

Y lo lograron basándose en dos tecnologías de código abierto lanzadas por el gigante tecnológico chino Alibaba.

El Sky-T1 de 450 dólares no es tan potente como la tecnología de OpenAI o el nuevo sistema de DeepSeek. Y es poco probable que las técnicas que utilizaron generen sistemas que superen el rendimiento de las tecnologías de punta, pero el proyecto de Stoica y sus alumnos demostró que hasta los desarrollos con mínimos recursos pueden construir sistemas competitivos.

Reuven Cohen, consultor tecnológico de Toronto, está utilizando DeepSeek-V3 desde fines de diciembre y asegura que su rendimiento es comparable a los últimos sistemas de OpenAI, Google y la empresa emergente de San Francisco Anthropic, además de ser mucho más económico de usar.

DeepSeek me permite gastar menos”, dice Cohen. “Ese es el tipo de tecnología que necesita alguien como yo”.

Por Cade Metz y Meaghan Tobin

Traducción de Jaime Arrambide

The New York Times

Conforme a los criterios de

Los comentarios están cerrados.