Menurut Mistral, keunggulan kinerja terbesar OCR 4 terlihat pada bahasa khusus dan low-resource, di mana banyak sistem OCR pesaing biasanya kehilangan akurasi.

Performa Benchmark

Mistral AI mengevaluasi OCR 4 terhadap model OCR native AI, model tujuan umum terdepan, layanan dokumen enterprise, dan model OCR 3 sebelumnya.

in1

Dalam evaluasi preferensi manusia buta yang melibatkan lebih dari 600 dokumen dunia nyata dalam 12+ bahasa, OCR 4 lebih disukai dibandingkan sistem pesaing di sebagian besar dokumen yang diuji.

OCR 4 mencapai skor 85,20 pada OlmOCRBench, 93,07 pada OmniDocBench, dan 0,98 pada evaluasi internal Crawl Multilingual Mistral.

Mistral menekankan bahwa skor benchmark sebaiknya dianggap sebagai indikasi arah, karena masalah seperti anotasi ground-truth yang salah, notasi matematika yang setara, segmentasi persamaan, urutan baca multi-kolom, dan atribusi header/footer dapat menghukum output yang sebenarnya benar.

>>> Honor X80 Pro Max Bawa Baterai 11.000 mAh, Ini Spesifikasi dan Estimasi Harganya di Indonesia

Perusahaan merekomendasikan evaluasi OCR 4 menggunakan dokumen organisasi sendiri.

API OCR 4 vs Document AI

Pengembang dapat mengintegrasikan OCR 4 langsung melalui API, sementara pengguna bisnis dapat mengakses mesin OCR yang sama melalui Document AI di Mistral Studio sebagai alur kerja tanpa kode.

OCR 4 cocok digunakan ketika membutuhkan teks mentah dan output Markdown, bounding boxes, klasifikasi blok, dan skor kepercayaan, ingestion dokumen volume tinggi dengan dukungan Batch API, deployment self-hosted untuk privasi, kedaulatan, atau kepatuhan, serta integrasi langsung ke aplikasi, agen AI, dan pipeline data enterprise.

Document AI tepat digunakan ketika membutuhkan output JSON terstruktur menggunakan skema kustom, anotasi gambar dengan JSON terstruktur, interpretasi dan ringkasan dokumen berbasis prompt, output terstruktur domain-spesifik, serta hasil terstruktur tanpa membangun logika parsing downstream.