Mistral AI resmi meluncurkan Mistral OCR 4, model optical character recognition (OCR) terbaru yang dirancang untuk pemahaman dokumen tingkat enterprise.

Berbeda dengan versi sebelumnya yang hanya mengonversi dokumen menjadi teks dan tabel, OCR 4 menghasilkan output dokumen terstruktur lengkap dengan bounding boxes, klasifikasi blok, dan skor kepercayaan untuk setiap halaman dan kata.

in1

>>> Sensor LYTIA 610 Sony Tingkatkan Ketajaman Kamera Telefoto

Model yang ringkas dan fokus ini mendukung 170 bahasa dari 10 kelompok bahasa, menerima berbagai format dokumen enterprise, berjalan dalam satu kontainer untuk deployment self-hosted, dan dirancang sebagai komponen ingestion untuk pencarian enterprise, Retrieval-Augmented Generation (RAG), serta pipeline retrieval domain-spesifik.

Fitur Unggulan Mistral OCR 4

OCR 4 tidak hanya mengekstrak konten dokumen, tetapi juga strukturnya.

Output yang dikembalikan meliputi bounding boxes untuk setiap elemen yang terdeteksi, klasifikasi blok, skor kepercayaan tingkat halaman dan kata, serta output terstruktur dalam format Markdown.

Output terstruktur ini mendukung semantic chunking untuk RAG, pencarian enterprise, pipeline ingestion dan indeks dokumen, pipeline retrieval domain-spesifik, agen AI untuk pengisian formulir, pemrosesan faktur, dan pemeriksaan kepatuhan, serta konektor dokumen kustom.

OCR 4 menerima format dokumen enterprise umum seperti PDF, DOC, PPT, dan OpenDocument, serta mendukung 170 bahasa termasuk bahasa khusus dan low-resource.

Model ringkas ini berjalan dalam satu kontainer, cocok untuk deployment dengan biaya rendah dan volume tinggi.

OCR 4 juga dapat dijalankan secara self-hosted, memungkinkan organisasi dengan persyaratan privasi data, kedaulatan, atau kepatuhan yang ketat untuk menyimpan data dokumen sepenuhnya di infrastruktur mereka sendiri.

Dalam evaluasi internal Crawl Multilingual milik Mistral, OCR 4 unggul di seluruh delapan kelompok bahasa.