Tecnología
Publicado:

DeepSeek presenta su modelo V3.2-Exp con menor coste y mejor procesamiento de texto largo

La compañía china introduce un modelo experimental con atención dispersa que promete abaratar el entrenamiento y mejorar el análisis de grandes volúmenes de información

2 min lectura
Logotipo de DeepSeek con una ballena blanca y el nombre en tipografía moderna
Imagen ilustrativa. Créditos: Iceebook

La startup china DeepSeek anunció el lanzamiento de su modelo V3.2-Exp, un sistema descrito como un paso intermedio hacia su próxima generación de inteligencia artificial. La compañía con sede en Hangzhou comunicó que la nueva versión destaca por un menor coste de entrenamiento y un mejor desempeño en el procesamiento de secuencias largas de texto.

El anuncio se realizó a través del foro de desarrolladores Hugging Face, donde la empresa enfatizó que V3.2-Exp no es todavía un modelo definitivo, sino un proyecto experimental que prepara el terreno para futuros desarrollos más ambiciosos.

Entre las novedades, DeepSeek incorporó un mecanismo denominado Sparse Attention, que permite reducir el uso de recursos de cómputo sin sacrificar precisión. Según la compañía, esta optimización puede traducirse en un acceso más económico a modelos avanzados de IA, un aspecto clave en la actual carrera tecnológica.

La empresa también anunció que reducirá en más de un 50 % los precios de sus API, una medida con la que busca ampliar la base de usuarios y reforzar su posición frente a competidores tanto en China como a nivel internacional. El recorte se comunicó mediante una publicación oficial en la red social X.

Si bien se trata de un modelo intermedio, DeepSeek considera que V3.2-Exp representa un avance relevante en su estrategia. El objetivo es consolidar su capacidad de innovación tecnológica mientras prepara el lanzamiento de una arquitectura completamente nueva que, según sus propias declaraciones, será su apuesta más importante hasta la fecha.

Expertos apuntan a que, si logra mantener altos niveles de rendimiento con costes menores, la compañía podría ejercer una presión significativa sobre rivales como Qwen de Alibaba en China y OpenAI en Estados Unidos. El precedente de DeepSeek V3 y R1, que ya sorprendieron al mercado, respalda esa expectativa.

El V3.2-Exp se presenta así como un puente entre lo ya logrado y el futuro que planea la empresa. Aunque no ha generado la misma conmoción que sus modelos anteriores, marca un hito técnico que podría redefinir el acceso a sistemas de inteligencia artificial más eficientes y accesibles.

Preguntas frecuentes

¿Qué es el modelo V3.2-Exp de DeepSeek?

Es un modelo experimental de inteligencia artificial lanzado por la startup china DeepSeek. Se presenta como un paso intermedio hacia su próxima generación de modelos más avanzados.

¿Qué innovación principal incorpora el V3.2-Exp?

Introduce un mecanismo llamado Sparse Attention, que permite reducir los costes de computación y mejorar el procesamiento de largas secuencias de texto.

¿Cómo impacta en los precios de las API de DeepSeek?

La empresa anunció una reducción de más del 50 % en los precios de sus API, buscando ampliar su base de usuarios y competir en el mercado global de inteligencia artificial.

¿Por qué este modelo es relevante en la carrera tecnológica?

Aunque se trata de un modelo intermedio, muestra avances en eficiencia y accesibilidad que podrían presionar a rivales como Alibaba y OpenAI, consolidando a DeepSeek como un actor clave en la innovación de IA.

Compartir artículo

Continúa informándote