PEKÍN (EFECOM). La empresa china de inteligencia artificial DeepSeek presentó un nuevo modelo multimodal que combina texto e información visual para procesar documentos extensos con menos recursos computacionales.
El sistema, denominado DeepSeek-OCR, utiliza la percepción visual como medio de compresión para disminuir significativamente el número de tokens, las unidades mínimas de texto que procesan los modelos lingüísticos, informó este martes el diario hongkonés South China Morning Post.
Según la compañía, este método puede reducir el volumen de texto entre siete y veinte veces, lo que permitiría manejar grandes cantidades de información sin elevar los costes informáticos.
El modelo, disponible en código abierto en Hugging Face y GitHub, plataformas usadas por desarrolladores para alojar y compartir modelos de IA y código, se compone de un codificador visual (DeepEncoder) y un decodificador con arquitectura Mixture-of-Experts (MoE) de 570 millones de parámetros.
Además de reconocer texto, puede interpretar elementos visuales como tablas, fórmulas o diagramas, lo que amplía su uso en ámbitos como las finanzas o la investigación científica.
De acuerdo con las pruebas publicadas por la compañía, DeepSeek-OCR superó a otros modelos de reconocimiento óptico de caracteres, como GOT-OCR 2.0 y MinerU 2.0, al mantener una precisión del 97 % con una compresión inferior a diez veces.
La empresa asegura que su sistema puede generar más de 200.000 páginas de datos de entrenamiento al día con una sola tarjeta gráfica Nvidia A100-40G.
El lanzamiento continúa la estrategia de DeepSeek de desarrollar modelos más eficientes y de menor coste, como los anteriores V3 y R1, centrados en el razonamiento y el aprendizaje por refuerzo.
Fundada en Hangzhou, DeepSeek forma parte de la nueva ola de desarrolladores chinos de IA de código abierto, junto con Baidu, Tencent o Alibaba.
Sin embargo, algunos expertos advierten que las estrictas regulaciones sobre contenido en China podrían limitar la expansión internacional de estos sistemas.
internacional
La china DeepSeek lanza modelo de IA que une texto e imagen para reducir costes de cómputo
- Foto: PATRICK PLEUL/DPA
Últimas Noticias
-
1Repsol recorta un 4% producción en 2025, hasta 548.000 barriles diarios, y eleva un 19,7% su margen de refino
-
2MIR Asturias señala seis consejos clave para afrontar con éxito el MIR 2025-26
-
3Llega a España Pluvicto de Novartis, la primera terapia con radioligandos para el tratamiento del cáncer de próstata metastásico resistente a la castración
-
4La libre elección sanitaria se consolida en Madrid
-
5Los asuntos públicos en sanidad, a debate en un webinar que anticipa el primer diploma especializado de AP institute | Universidad Nebrija
Suscríbete nuestro newsletter
Siempre al día de las últimas noticias
- La china DeepSeek lanza modelo de IA que une texto e imagen para reducir costes de cómputo · internacional · Valencia Plaza
-
- València
- Tierra de Empresas
- Opinión
- Plaza Comarcas
- Culturplaza
- Guía Hedonista
- 5 Barricas
- Revista Plaza
- Plaza Deportiva
- Plaza Motor
- Plaza Podcast
- Quiénes somos
- Publicidad
- Contacto
- Acceso accionistas
- Aviso legal
- Política de privacidad
- Cookies