DeepSeek, el modelo chino de IA que ha conmocionado a la industria tecnológica y perturbado a Wall Street por su coste significativamente bajo y su buen rendimiento, tiene "algo de innovación real" y es "todo buenas noticias", dijo Satya Nadella, consejero delegado de Microsoft.
Nadella hizo el comentario durante la llamada de resultados trimestrales de la compañía el jueves, cuando dijo que la IA no es en absoluto diferente de los desarrollos informáticos normales. Microsoft ha empezado a ofrecer el modelo DeepSeek-R1 para inferencia, un modelo de IA que revela su "proceso de pensamiento" para que los usuarios puedan comprobar sus resultados. Este modelo se puso a disposición de los usuarios de la plataforma en la nube de Microsoft el mismo día.
Las acusaciones, a pesar del uso de
Microsoft, uno de los principales inversores del competidor estadounidense de DeepSeek, OpenAI, también está investigando si un desarrollador chino de IA obtuvo datos de salida de OpenAI de forma no autorizada.
OpenAI ha informado a los medios de comunicación de que tiene pruebas de que DeepSeek ha estado utilizando el servicio OpenAI para entrenar sus modelos de IA, un comportamiento que no se ajusta a los términos de servicio de OpenAI.
Sin embargo, ni OpenAI ni Microsoft aportaron pruebas.
Mientras la investigación continúa, una persona designada por la administración Trump ya ha acusado a DeepSeek de utilizar tecnología estadounidense "robada".
Howard Lutnick, candidato a Secretario de Comercio, declaró el miércoles en una reunión con senadores estadounidenses que la Administración abordará la cuestión.
Por su parte, David Sacks, asesor de IA del presidente Trump, dijo que hay "pruebas sustantivas" de que DeepSeek "obtuvo conocimientos" de los modelos de OpenAI.
"Distillation violará la mayoría de los términos de servicio, y sin embargo es irónico -o incluso hipócrita- que Big Tech lo critique", dijo el miércoles Lutz Finger, inversor en tecnología y profesor de la Universidad de Cornell. "Entrenar ChatGPT sobre contenidos de Forbes o New York Times también violaría sus términos de servicio".
¿Qué es la "destilación"?
La destilación es el proceso por el que un nuevo modelo de IA consulta repetidamente un modelo mayor y aprende de sus resultados.
Este proceso se describe en los documentos públicos de investigación de DeepSeek, pero los investigadores afirman que lo utilizaron de otra forma. Según la empresa, utilizaron el modelo DeepSeek-R1 para la inferencia como un "modelo mayor" que "enseñó" a otros modelos, como Alibaba Qwen y Meta Llama, a ser también capaces de hacer inferencia.
Los modelos destilados y el R1 original se han publicado para su descarga gratuita, lo que permite a personas con ordenadores menos potentes o incluso smartphones ejecutar los modelos sin conexión con pleno control, algo imposible para los usuarios de ChatGPT porque el modelo que hay detrás del servicio OpenAI está oculto incluso para los usuarios de pago.
Publicaciones en las redes sociales han indicado que DeepSeek a veces se identifica como ChatGPT, lo que podría ser una prueba de robo de datos. Pero como todos los demás modelos de IA, DeepSeek no siempre dice la verdad. Una versión anterior del chatbot Gemini de Google se identificaba como el bot Ernie de Baidu cuando se le preguntaba en chino, pero Baidu nunca ha acusado a Google de robar datos.