Mistral ra mắt API mới biến tài liệu PDF thành định dạng AI

Đăng bởi: Ngày: 07/03/2025

Công ty Mistral, một trong những tên tuổi nổi bật trong lĩnh vực phát triển mô hình ngôn ngữ lớn, vừa ra mắt một API mới mang tên Mistral OCR vào thứ Năm. API này tập trung vào việc chuyển đổi các tài liệu PDF phức tạp thành các tệp văn bản có thể dễ dàng tiêu thụ bởi các mô hình AI. Với Mistral OCR, nhà phát triển có thể lấy nội dung từ các tài liệu phức tạp, giúp cho các quy trình tự động hóa được diễn ra một cách hiệu quả hơn.

Mistral ra mắt API mới biến tài liệu PDF thành định dạng AI

Mistral OCR không chỉ đơn thuần là một API nhận diện ký tự quang học (OCR) thông thường; nó còn là một API đa phương thức, có khả năng phát hiện hình ảnh và đồ họa nằm xen kẽ với các khối văn bản. Điều này giúp cải thiện tính chính xác của những tài liệu có cấu trúc phức tạp.

Hơn nữa, đầu ra của Mistral OCR được định dạng theo Markdown. Đây là một thường thức mà các lập trình viên thường dùng để tạo ra các liên kết, tiêu đề, và các phần định dạng khác trong ngữ liệu văn bản thuần. Hệ thống của Mistral dễ dàng tích hợp với các mô hình ngôn ngữ lớn phổ biến như ChatGPT từ OpenAI, nhờ vào việc sử dụng Markdown để tạo ra các danh sách và liên kết.

Guillaume Lample, đồng sáng lập và Giám đốc khoa học của Mistral, đã nhấn mạnh tầm quan trọng của việc chuyển đổi các tài liệu mà tổ chức sở hữu thành các định dạng có thể tiêu thụ được bởi các hệ thống AI. Ông cho biết, Mistral OCR có thể giúp các doanh nghiệp dễ dàng tiếp cận với lượng tài liệu nội bộ khổng lồ mà họ tích lũy qua nhiều năm, đặc biệt là trong các ngữ cảnh cần khả năng xử lý thông tin nhanh chóng và chính xác.

Với Mistral OCR, công ty cũng mang đến nhiều lựa chọn triển khai, từ nền tảng API của chính mình đến các đối tác đám mây như AWS, Azure, hoặc Google Cloud. Đặc biệt, đối với những doanh nghiệp làm việc với dữ liệu nhạy cảm, Mistral có giải pháp triển khai tại chỗ để đảm bảo bảo mật.

Theo Mistral, API này đã vượt qua các giải pháp tương tự từ Google, Microsoft và OpenAI qua việc thử nghiệm với các tài liệu phức tạp chứa các biểu thức toán học hay bảng biểu. Đặc biệt, nó cũng được kỳ vọng hoạt động tốt hơn với các tài liệu không sử dụng tiếng Anh.

Mistral OCR được cho là nhanh hơn các giải pháp hiện tại trên thị trường nhờ vào khả năng tối ưu hóa cho một nhiệm vụ cụ thể duy nhất — chuyển đổi tài liệu PDF thành định dạng văn bản AI. Khi so với các mô hình ngôn ngữ lớn đa nhiệm mà không chỉ có OCR, sự tách biệt này cho phép Mistral tập trung vào một lĩnh vực hạn chế hơn, qua đó tối ưu hoá hiệu suất.