Mistral OCR 4 Hadir dengan Ekstraksi Dokumen Terstruktur dan Dukungan 170 Bahasa
Menurut Mistral, keunggulan kinerja terbesar OCR 4 terlihat pada bahasa khusus dan low-resource, di mana banyak sistem OCR pesaing biasanya kehilangan akurasi.
Performa Benchmark
Mistral AI mengevaluasi OCR 4 terhadap model OCR native AI, model tujuan umum terdepan, layanan dokumen enterprise, dan model OCR 3 sebelumnya.
Dalam evaluasi preferensi manusia buta yang melibatkan lebih dari 600 dokumen dunia nyata dalam 12+ bahasa, OCR 4 lebih disukai dibandingkan sistem pesaing di sebagian besar dokumen yang diuji.
OCR 4 mencapai skor 85,20 pada OlmOCRBench, 93,07 pada OmniDocBench, dan 0,98 pada evaluasi internal Crawl Multilingual Mistral.
Mistral menekankan bahwa skor benchmark sebaiknya dianggap sebagai indikasi arah, karena masalah seperti anotasi ground-truth yang salah, notasi matematika yang setara, segmentasi persamaan, urutan baca multi-kolom, dan atribusi header/footer dapat menghukum output yang sebenarnya benar.
>>> Honor X80 Pro Max Bawa Baterai 11.000 mAh, Ini Spesifikasi dan Estimasi Harganya di Indonesia
Perusahaan merekomendasikan evaluasi OCR 4 menggunakan dokumen organisasi sendiri.
API OCR 4 vs Document AI
Pengembang dapat mengintegrasikan OCR 4 langsung melalui API, sementara pengguna bisnis dapat mengakses mesin OCR yang sama melalui Document AI di Mistral Studio sebagai alur kerja tanpa kode.
OCR 4 cocok digunakan ketika membutuhkan teks mentah dan output Markdown, bounding boxes, klasifikasi blok, dan skor kepercayaan, ingestion dokumen volume tinggi dengan dukungan Batch API, deployment self-hosted untuk privasi, kedaulatan, atau kepatuhan, serta integrasi langsung ke aplikasi, agen AI, dan pipeline data enterprise.
Document AI tepat digunakan ketika membutuhkan output JSON terstruktur menggunakan skema kustom, anotasi gambar dengan JSON terstruktur, interpretasi dan ringkasan dokumen berbasis prompt, output terstruktur domain-spesifik, serta hasil terstruktur tanpa membangun logika parsing downstream.
Update Terbaru
10 Jenis Pengobatan yang Tidak Ditanggung BPJS Kesehatan
Rabu / 24-06-2026, 16:21 WIB
Cara Bayar TikTok PayLater Sebelum Jatuh Tempo, Mudah dan Terhindar dari Denda
Rabu / 24-06-2026, 16:21 WIB
Akses Jadi Hambatan Terbesar Literasi di Indonesia, Bukan Minat Baca
Rabu / 24-06-2026, 16:19 WIB
Rupiah Melemah ke Rp17.952, Nyaris Tembus Rp18.000
Rabu / 24-06-2026, 16:19 WIB
Ekspor Daihatsu Naik 30 Persen, Produksi Tembus 169 Ribu Unit hingga Mei 2026
Rabu / 24-06-2026, 16:14 WIB
Prabowo Akui Tahu Pembiaya Demo, Netizen Tanya 'Wapres Pak?'
Rabu / 24-06-2026, 16:14 WIB
Aktivitas Gunung Anak Krakatau Meningkat, Warga dan Nelayan Diminta Tingkatkan Kewaspadaan
Rabu / 24-06-2026, 16:14 WIB
Prabowo: Tanya Petani-Petani, Apakah MBG Perlu atau Tidak?
Rabu / 24-06-2026, 16:14 WIB
8 Buah Terbaik untuk Diet Malam Hari, Rendah Kalori dan Tinggi Serat
Rabu / 24-06-2026, 16:10 WIB
Cara Cek Status Penerima Bantuan Beras dan Minyak Goreng Juni 2026
Rabu / 24-06-2026, 15:54 WIB
Panduan Menjelajahi 5 Inovasi Teknologi Digital Terbaru di CISCE 2026
Rabu / 24-06-2026, 15:50 WIB
Transformasi 37 Kg Shindong Super Junior Picu Perdebatan Panas di Dunia Maya
Rabu / 24-06-2026, 15:49 WIB
WN Portugal Dibekuk di Bandara Bali Bawa 50 Butir Amunisi Tanpa Dokumen
Rabu / 24-06-2026, 15:49 WIB
Janice Tjen dan Eudice Chong Kalahkan Unggulan Kedua di Eastbourne Open 2026
Rabu / 24-06-2026, 15:49 WIB






