DeepSeek presenta nuevo modelo de IA para competir con gigantes tecnológicos

Compartir:

La startup china lanzó las versiones preliminares V4 Flash y V4 Pro, destacando avances en rendimiento y eficiencia, en un contexto de fuerte competencia global.

DeepSeek, la startup china de inteligencia artificial, lanzó las versiones preliminares de su nuevo modelo insignia, denominado V4, en sus variantes Flash y Pro. La compañía presentó estas plataformas como las más potentes de código abierto, buscando competir directamente con rivales como OpenAI, Google y Anthropic.

Según información publicada en la plataforma Hugging Face, los nuevos modelos incorporan mejoras significativas en arquitectura y optimización. Entre las novedades destaca la técnica Hybrid Attention Architecture, que permite mejorar la capacidad de recordar consultas en conversaciones extensas, así como una ventana de contexto de 1 millón de tokens, lo que facilita el procesamiento de documentos completos o bases de código como una sola instrucción.

El lanzamiento ocurre un año después de que DeepSeek provocara una fuerte caída en los mercados bursátiles globales con su modelo R1, un sistema de código abierto que imitaba el razonamiento humano y que, según se afirmaba, fue desarrollado a una fracción del costo de sus competidores. En esta ocasión, la empresa señaló que la capacidad de servicio para la serie V4 Pro es limitada debido a la escasez de cómputo, pero espera que los precios disminuyan significativamente en el segundo semestre, cuando entren en funcionamiento clústeres impulsados por los chips Ascend 950 de Huawei.

En el plano financiero, DeepSeek se encuentra en conversaciones con Tencent y Alibaba para su primera ronda de financiación. Mientras tanto, las acciones de fabricantes chinos de semiconductores, como Semiconductor Manufacturing International Corp., registraron alzas de hasta el 9,4% en la bolsa de Hong Kong, en tanto que rivales como Zhipu cayeron un 8%.

El nuevo modelo V4 utiliza la técnica Mixture-of-Experts, que activa selectivamente solo un subconjunto de parámetros por tarea, lo que permite mantener costos de inferencia reducidos. DeepSeek afirmó que su rendimiento supera al de modelos como GPT-5.2 de OpenAI en pruebas estándar, aunque reconoció que está rezagado entre 3 y 6 meses respecto a los modelos más avanzados del mercado.

El lanzamiento también ha generado controversia. Líderes tecnológicos y funcionarios del gobierno estadounidense han acusado a DeepSeek de utilizar técnicas de destilación —que consiste en entrenar un modelo a partir de la salida de otro— de manera ilícita. Tanto OpenAI como Anthropic han señalado haber detectado este tipo de ataques por parte de la startup china.

También puede interesarte

Elecciones en la UBA: el reformismo mantiene el control de los centros de estudiantes y el peronismo crece

El reformismo retuvo los principales centros de estudiantes en la UBA, mientras el peronismo ganó lugares en consejos directivos. Conocé los resultados facultad por facultad.

Chicago renueva sus estaciones de tren y autobús en 2026 con US$6,5 millones

El alcalde Brandon Johnson lanzó el proyecto Refresh & Renew para renovar 28 estaciones de tren y 14 puntos de giro de autobuses en Chicago durante 2026, con una inversión de 6,5 millones de dólares.

La balanza turística volvió a ser deficitaria en marzo, según el INDEC

El INDEC reportó un déficit de 552 mil turistas en marzo de 2026. Ingresaron 509,6 mil visitantes y salieron 1,06 millones de argentinos. Conoce los detalles del informe.

David Hasselhoff fue visto usando andador tras cirugías de rodilla y cadera

El actor de 73 años fue visto con dificultades para caminar en Los Ángeles. Su representante confirmó que se recupera de cirugías de rodilla y cadera, y que planea un regreso al reboot de Baywatch.