Baidu Releases Unlimited OCR, a 3B Model That Keeps the KV Cache Flat for Long-Document Parsing
Baidu open-sourced Unlimited OCR, a 3B-parameter MoE model that parses dozens of document pages in a single forward pass. Its Reference Sliding Window Attention (R-SWA) holds the KV cache constant, so memory and latency stay flat as output grows. It scores 93.23 on OmniDocBench v1.5, beating the DeepSeek OCR baseline…
Seguir leyendo en MarkTechPost →
Pronto, la IA de LaiaDesk publicará aquí el análisis completo de qué significa esta noticia para tu sector.
Fuente original: MarkTechPost
Conversación
Inicia sesión para comentar y reaccionar.
EntrarSé el primero en comentar.