Meta quyết tâm vượt qua GPT-4 với llama 3, tiết lộ từ tài liệu nội bộ

Đăng bởi: Linh Nguyễn • Ngày: 15/01/2025

Trong một cuộc chiến khốc liệt giữa các công ty công nghệ, đặc biệt là trong lĩnh vực AI, Meta đã thể hiện rõ quyết tâm vượt qua mô hình GPT-4 của OpenAI thông qua việc phát triển mô hình llama 3. Những thông điệp nội bộ bị rò rỉ từ một vụ kiện đã cho thấy tâm huyết và nỗ lực không ngừng nghỉ của các nhà lãnh đạo và nhà nghiên cứu AI của Meta. Đặc biệt, Ahmad Al-Dahle, Phó Giám đốc AI thế hệ mới của Meta, đã bày tỏ rõ điều này trong một tin nhắn vào tháng Mười năm 2023, nhấn mạnh rằng “Mục tiêu của chúng ta cần phải là GPT-4”. Theo ông, công ty đã sẵn sàng hợp tác với 64.000 GPU để đạt được điều này và cần nhanh chóng tiến hành cuộc đua trong lĩnh vực AI.

Mặc dù Meta thường công bố các mô hình AI mở, lãnh đạo của công ty lại chủ yếu tập trung vào việc đánh bại các đối thủ không thường xuyên công khai trọng số các mô hình của họ như OpenAI và Anthropic. Lãnh đạo tại Meta đã coi GPT-4 và mô hình Claude của Anthropic như những tiêu chuẩn vàng cần hướng tới. Thậm chí có nhiều lần thuật toán mới của AI từ một số đối thủ khác như Mistral cũng đã được đề cập, nhưng thái độ của Meta đối với đối thủ này là rất coi nhẹ: “Mistral chỉ là hạt đậu với chúng ta” và “chúng ta nên có khả năng làm tốt hơn”.

Trong bối cảnh đó, Meta đã quyết liệt trong việc thu thập dữ liệu cần thiết để phát triển mô hình llama 3. Các lãnh đạo đã thống nhất rằng “Llama 3 là điều duy nhất tôi quan tâm” trong mối liên lạc giữa các đồng nghiệp. Họ không ngần ngại nói rằng để đạt được điều này, họ phải khai thác các tập dữ liệu hợp lệ, mặc dù điều này trở thành một vấn đề gây tranh cãi lớn.

Với cáo buộc rằng các nhà điều hành của Meta đã cắt góc trong hành trình phát triển mô hình AI, nhà nghiên cứu Hugo Touvron đã chỉ ra rằng sự kết hợp dữ liệu sử dụng cho Llama 2 là không tốt, và đã gợi ý rằng Meta cần có một cách tiếp cận tốt hơn trong việc lựa chọn nguồn dữ liệu cho Llama 3. Bên cạnh đó, Touvron và Al-Dahle đã thảo luận về việc rõ ràng với việc sử dụng tập dữ liệu LibGen, một nguồn chứa các tài liệu có bản quyền từ Cengage Learning, Macmillan Learning và Pearson Education.

Mark Zuckerberg, Giám đốc điều hành của Meta, cũng đã công nhận áp lực lớn từ thị trường khi nói rằng ông đang cố gắng thu hẹp khoảng cách hiệu suất giữa các mô hình Llama và các mô hình khép kín của đối thủ là OpenAI và Google. Trong một bức thư từ tháng 7 năm 2024, ông đã tự tin khẳng định rằng “Năm nay, Llama 3 cạnh tranh với các mô hình tiên tiến nhất và dẫn đầu trong một số lĩnh vực”.

Khi Meta chính thức phát hành Llama 3 vào tháng 4 năm 2024, mô hình dành cho AI mở này đã trở thành một đối thủ cạnh tranh với các mô hình khép kín hàng đầu từ Google và OpenAI, trong khi vượt trội hơn so với những lựa chọn mở khác từ Mistral. Mặc dù vậy, cách mà Meta thu thập dữ liệu để huấn luyện các mô hình của mình vẫn đang gặp phải sự xem xét kỹ lưỡng từ nhiều vụ kiện đang diễn ra do các vấn đề liên quan đến bản quyền.

Cuộc sống nghề nghiệp trong ngành AI hiện tại đang là một cuộc đua không hề đơn giản và Meta đã thể hiện rằng họ điều hành một cuộc chiến không hồi kết để khẳng định vị thế của mình trong lĩnh vực này.