in

InstructGPT: Công cụ xử lý ngôn ngữ tự nhiên mới từ OpenAI

Xử lý ngôn ngữ tự nhiên (NLP) là một nhánh của trí tuệ nhân tạo liên quan đến việc hiểu và tạo các văn bản ngôn ngữ tự nhiên. NLP có nhiều ứng dụng như dịch máy, phân tích tình cảm, tóm tắt văn bản, trả lời câu hỏi, v.v.

Một trong những công cụ NLP mạnh nhất hiện nay là GPT-3, một mô hình ngôn ngữ quy mô lớn do OpenAI phát triển. GPT-3 có thể tạo văn bản mạch lạc và đa dạng về hầu hết mọi chủ đề, được cung cấp lời nhắc văn bản làm đầu vào. Tuy nhiên, GPT-3 cũng có một số hạn chế. Ví dụ: nó có thể tạo ra kết quả đầu ra không trung thực, độc hại hoặc phản ánh tình cảm có hại. Nó cũng có thể không tuân theo các hướng dẫn cụ thể do người dùng đưa ra.

Để giải quyết những vấn đề này, OpenAI gần đây đã giới thiệu InstructGPT, một công cụ NLP mới có thể thực hiện các tác vụ khác nhau dựa trên các hướng dẫn được đưa ra bằng ngôn ngữ tự nhiên. Ví dụ: bạn có thể yêu cầu InstructGPT tóm tắt một bài báo, viết một bài thơ hoặc tạo một hình ảnh. InstructGPT sử dụng công nghệ cơ bản giống như GPT-3 nhưng có các mục tiêu tinh chỉnh khác nhau. Do đó, nó có thể ít có khả năng đạt dung lượng hơn GPT-3.

InstructGPT hoạt động như thế nào?

InstructGPT là mô hình ngôn ngữ kiểu GPT đã được tinh chỉnh bằng phản hồi của con người. Điều này có nghĩa là nó học hỏi từ các ví dụ về đầu ra tốt và xấu cho các tác vụ khác nhau do người dán nhãn cung cấp. Người dán nhãn đánh giá kết quả đầu ra dựa trên mức độ họ làm theo hướng dẫn và mức độ phù hợp của họ đối với nhiệm vụ.

Kết quả là các mô hình InstructGPT làm theo hướng dẫn tốt hơn nhiều so với GPT-3. Họ cũng ít bịa đặt sự thật hơn và cho thấy mức giảm nhỏ trong việc tạo ra sản phẩm độc hại. Người dán nhãn thích đầu ra từ InstructGPT hơn đầu ra từ GPT-3, mặc dù có ít tham số hơn.

Có ba kích thước mô hình cho tham số InstructGPT: 1.3B (tỷ), 6B (tỷ) và 175B (tỷ). Các mô hình lớn hơn có nhiều khả năng hơn để học các tác vụ phức tạp nhưng cũng yêu cầu nhiều tài nguyên tính toán hơn để chạy.

Bạn có thể sử dụng InstructGPT như thế nào?

Bạn có thể truy cập InstructGPT thông qua API OpenAI, đây là nền tảng để truy cập các mô hình AI mới do OpenAI phát triển. Bạn cần đăng ký tài khoản và yêu cầu quyền truy cập để sử dụng API.

Khi bạn có quyền truy cập, bạn có thể sử dụng InstructGPT bằng cách gửi yêu cầu văn bản đến điểm cuối API với hướng dẫn tác vụ bạn muốn làm đầu vào. API sẽ trả về một phản hồi văn bản do InstructGPT tạo ra dựa trên thông tin đầu vào của bạn.

Ví dụ: nếu bạn muốn tóm tắt một bài viết về biến đổi khí hậu bằng InstructGPT 6B (tỷ), bạn có thể gửi yêu cầu này:

json
{
"model": "instructgpt:6B",
"task": "summarize",
"text": "The world is on track for more than 3C of warming by the end of this century, according to a report released on Tuesday by the UN’s climate science body. The report warns that unless there are immediate and large-scale reductions in greenhouse gas emissions, limiting global warming to close to 1.5C or even 2C will be beyond reach."
}

API sẽ trả về một phản hồi văn bản như thế này:

json
{
"text": "A possible summary is: The UN's climate science report says that without drastic action, global warming will exceed safe levels."
}

Bạn có thể thấy rằng InstructGPT đã tạo một bản tóm tắt ngắn gọn về bài viết trong một câu. Bạn cũng có thể thử các tác vụ khác như viết chú thích cho hình ảnh, tạo câu hỏi và câu trả lời, tạo tiêu đề, v.v.

InstructGPT là một framework mã nguồn mở mà bạn có thể tìm thấy trên GitHub. Bạn cũng có thể đọc thêm về cách nó hoạt động và hiệu suất của nó đối với các tác vụ khác nhau trong bài báo này hoặc bài đăng trên blog này.

Written by Linh Nguyễn

0 0 votes
Article Rating
Subscribe
Notify of
guest

0 Comments
Inline Feedbacks
View all comments