Mistral OCR 4 Hadir dengan Ekstraksi Dokumen Terstruktur dan Dukungan 170 Bahasa

Dewi Sartika Rabu 24-06-2026 13:49 WIB

Ukuran Teks

Menurut Mistral, keunggulan kinerja terbesar OCR 4 terlihat pada bahasa khusus dan low-resource, di mana banyak sistem OCR pesaing biasanya kehilangan akurasi.

Performa Benchmark

Mistral AI mengevaluasi OCR 4 terhadap model OCR native AI, model tujuan umum terdepan, layanan dokumen enterprise, dan model OCR 3 sebelumnya.

Dalam evaluasi preferensi manusia buta yang melibatkan lebih dari 600 dokumen dunia nyata dalam 12+ bahasa, OCR 4 lebih disukai dibandingkan sistem pesaing di sebagian besar dokumen yang diuji.

OCR 4 mencapai skor 85,20 pada OlmOCRBench, 93,07 pada OmniDocBench, dan 0,98 pada evaluasi internal Crawl Multilingual Mistral.

Mistral menekankan bahwa skor benchmark sebaiknya dianggap sebagai indikasi arah, karena masalah seperti anotasi ground-truth yang salah, notasi matematika yang setara, segmentasi persamaan, urutan baca multi-kolom, dan atribusi header/footer dapat menghukum output yang sebenarnya benar.

>>> Honor X80 Pro Max Bawa Baterai 11.000 mAh, Ini Spesifikasi dan Estimasi Harganya di Indonesia

Perusahaan merekomendasikan evaluasi OCR 4 menggunakan dokumen organisasi sendiri.

API OCR 4 vs Document AI

Pengembang dapat mengintegrasikan OCR 4 langsung melalui API, sementara pengguna bisnis dapat mengakses mesin OCR yang sama melalui Document AI di Mistral Studio sebagai alur kerja tanpa kode.

OCR 4 cocok digunakan ketika membutuhkan teks mentah dan output Markdown, bounding boxes, klasifikasi blok, dan skor kepercayaan, ingestion dokumen volume tinggi dengan dukungan Batch API, deployment self-hosted untuk privasi, kedaulatan, atau kepatuhan, serta integrasi langsung ke aplikasi, agen AI, dan pipeline data enterprise.

Document AI tepat digunakan ketika membutuhkan output JSON terstruktur menggunakan skema kustom, anotasi gambar dengan JSON terstruktur, interpretasi dan ringkasan dokumen berbasis prompt, output terstruktur domain-spesifik, serta hasil terstruktur tanpa membangun logika parsing downstream.

Tag

#mistral ai #ocr #pengenalan dokumen #rag

Mistral OCR 4 Hadir dengan Ekstraksi Dokumen Terstruktur dan Dukungan 170 Bahasa

Performa Benchmark

API OCR 4 vs Document AI

Update Terbaru

10 Jenis Pengobatan yang Tidak Ditanggung BPJS Kesehatan

Cara Bayar TikTok PayLater Sebelum Jatuh Tempo, Mudah dan Terhindar dari Denda

Akses Jadi Hambatan Terbesar Literasi di Indonesia, Bukan Minat Baca

Rupiah Melemah ke Rp17.952, Nyaris Tembus Rp18.000

Ekspor Daihatsu Naik 30 Persen, Produksi Tembus 169 Ribu Unit hingga Mei 2026

Prabowo Akui Tahu Pembiaya Demo, Netizen Tanya 'Wapres Pak?'

Aktivitas Gunung Anak Krakatau Meningkat, Warga dan Nelayan Diminta Tingkatkan Kewaspadaan

Prabowo: Tanya Petani-Petani, Apakah MBG Perlu atau Tidak?

8 Buah Terbaik untuk Diet Malam Hari, Rendah Kalori dan Tinggi Serat

Cara Cek Status Penerima Bantuan Beras dan Minyak Goreng Juni 2026

Panduan Menjelajahi 5 Inovasi Teknologi Digital Terbaru di CISCE 2026

Transformasi 37 Kg Shindong Super Junior Picu Perdebatan Panas di Dunia Maya

WN Portugal Dibekuk di Bandara Bali Bawa 50 Butir Amunisi Tanpa Dokumen

Janice Tjen dan Eudice Chong Kalahkan Unggulan Kedua di Eastbourne Open 2026

Artikel Pilihan

Batu Empedu Sapi dan Demam Perburuan Dadakan Saat Idul Adha 2026

Trending Fokus

Batu Empedu Sapi dan Demam Perburuan Dadakan Saat Idul Adha 2026

Daftar Film, Series Drakor dan Anime Netflix April 2026 Lengkap dengan Jadwal Tayang

Kalender Jawa April 2026 Lengkap dengan Weton dan Tanggal Merah

Kapan Musim Hujan 2026 Berakhir dan Bagaimana Prediksi Cuaca Mudik Lebaran

Bagaimana Epic Fury Operasi Militer Pertama yang Dipimpin AI Tewaskan Ali Khamenei dalam Serangan Presisi Berbasis Algoritma

Infinix Note 60 Ultra Bawa Baterai 7.000mAh dan Kamera 200MP dengan Layar 144Hz

6 Single Religi Baru Temani Ramadan 2026, Dari Cakra Khan, Ungu, Wali hingga Opick

Performa Benchmark

API OCR 4 vs Document AI

Berita Terkait

Update Terbaru

Artikel Pilihan

Batu Empedu Sapi dan Demam Perburuan Dadakan Saat Idul Adha 2026

Trending Fokus