Nhóm OpenAI đã phát hành cách sử dụng GPT-4 mới nhất để tạo hệ thống đánh giá nội dung và giảm bớt sự tham gia thủ công

Nguồn hình ảnh: Được tạo bởi Unbounded AI

Vào ngày 16 tháng 8, nhóm OpenAI đã công bố cách sử dụng AI mới, sử dụng GPT-4 để phát triển chính sách nội dung và đưa ra quyết định kiểm duyệt nội dung, cho phép gắn nhãn nhất quán hơn, vòng phản hồi nhanh hơn để tinh chỉnh chính sách và giảm sự tham gia của người tham gia đánh giá thủ công.

Kiểm duyệt nội dung đóng một vai trò quan trọng trong việc duy trì sức khỏe của các nền tảng kỹ thuật số. Các nhà nghiên cứu OpenAI nhận thấy rằng một hệ thống kiểm duyệt nội dung sử dụng GPT-4 có thể lặp lại các thay đổi chính sách nhanh hơn nhiều, giảm thời gian chu kỳ từ hàng tháng xuống hàng giờ.

Đồng thời, GPT-4 cũng có thể diễn giải các quy tắc và sắc thái trong tài liệu chính sách có nội dung dài và thích ứng với các bản cập nhật chính sách ngay lập tức, dẫn đến các nhãn nhất quán hơn. Điều này mang lại một tầm nhìn tích cực hơn cho tương lai của các nền tảng kỹ thuật số, nơi AI có thể giúp điều chỉnh lưu lượng truy cập trực tuyến theo các chính sách dành riêng cho nền tảng và giảm bớt gánh nặng về thể chất và tinh thần cho một số lượng lớn các nhà quản lý con người.

Loại người dùng nào khả dụng: Bất kỳ ai có quyền truy cập vào API OpenAI đều có thể triển khai phương pháp này để tạo hệ thống kiểm duyệt hỗ trợ AI của riêng họ.

Thách thức Kiểm duyệt Nội dung

Việc kiểm duyệt nội dung đòi hỏi nỗ lực tỉ mỉ, sự nhạy cảm, hiểu biết sâu sắc về ngữ cảnh và khả năng thích ứng nhanh với các trường hợp sử dụng mới, khiến quá trình này trở nên tốn thời gian và đầy thách thức. Theo truyền thống, gánh nặng của nhiệm vụ này đổ lên vai những người phụ trách con người, những người được hỗ trợ bởi các mô hình máy học nhỏ hơn dành riêng cho ngành dọc, sàng lọc khối lượng lớn nội dung để lọc ra tài liệu độc hại và có hại. Quá trình này diễn ra chậm và có thể gây căng thẳng về tinh thần cho con người.

Đã giải quyết bằng mô hình ngôn ngữ lớn (LLM)

Nhóm nghiên cứu OpenAI đang khám phá việc sử dụng LLM để giải quyết những thách thức này. Họ lập luận rằng các mô hình ngôn ngữ lớn của họ, chẳng hạn như GPT-4, có thể hiểu và tạo ngôn ngữ tự nhiên, khiến chúng phù hợp để kiểm duyệt nội dung. Các mô hình này có thể đưa ra những đánh giá vừa phải dựa trên hướng dẫn chính sách được cung cấp cho chúng.

Với hệ thống này, quá trình phát triển và tùy chỉnh các chính sách kiểm duyệt nội dung đã được giảm từ hàng tháng xuống hàng giờ.

  1. Khi các hướng dẫn chính sách để xem xét được phát triển, các chuyên gia chính sách có thể tạo một tập dữ liệu vàng bằng cách xác định một số lượng nhỏ các ví dụ và gán cho chúng các nhãn theo chính sách.
  2. GPT-4 sau đó đọc chính sách và gán nhãn cho cùng một tập dữ liệu, nhưng không thấy câu trả lời.
  3. Bằng cách kiểm tra sự khác biệt giữa phán đoán của GPT-4 và phán đoán của con người, các chuyên gia chính sách có thể yêu cầu GPT-4 đưa ra lý do đằng sau các nhãn của nó, phân tích sự mơ hồ trong các định nghĩa chính sách, giải quyết sự nhầm lẫn và cung cấp thêm thông tin chi tiết về chính sách để làm rõ. Chúng tôi có thể lặp lại bước 2 và 3 cho đến khi chúng tôi hài lòng với chất lượng chính sách.

Quá trình lặp đi lặp lại này mang lại các chính sách nội dung tinh chỉnh được dịch thành các bộ phân loại, cho phép triển khai chính sách và kiểm duyệt nội dung trên quy mô lớn.

Ngoài ra, để xử lý lượng lớn dữ liệu ở quy mô lớn, chúng tôi có thể sử dụng các dự đoán từ GPT-4 để tinh chỉnh một mô hình nhỏ hơn.

Ý tưởng đơn giản nhưng mạnh mẽ này mang lại một số cải tiến so với các phương pháp kiểm duyệt nội dung truyền thống:

Nhãn nhất quán hơn. Chính sách nội dung không ngừng phát triển và thường rất chi tiết. Mọi người có thể diễn giải chính sách theo cách khác hoặc một số người kiểm duyệt có thể mất nhiều thời gian hơn để hiểu các thay đổi chính sách mới, dẫn đến việc gắn nhãn không nhất quán. Ngược lại, LL.M. nhạy cảm với các sắc thái trong từ ngữ và có thể ngay lập tức thích ứng với các cập nhật chính sách, cung cấp cho người dùng trải nghiệm nội dung nhất quán.

Vòng phản hồi nhanh hơn. Chu kỳ cập nhật chính sách—tạo ra các chính sách mới, gắn nhãn cho chúng và thu thập phản hồi của con người—thường là một quá trình dài và kéo dài. GPT-4 có thể rút ngắn quy trình này xuống còn vài giờ, cho phép phản ứng nhanh hơn với các mối nguy hiểm mới.

Giảm tải tinh thần. Việc thường xuyên tiếp xúc với nội dung có hại hoặc phản cảm có thể dẫn đến tình trạng cạn kiệt cảm xúc và căng thẳng tâm lý cho người điều hành. Tự động hóa các nhiệm vụ như vậy mang lại lợi ích cho những người liên quan.

Sơ đồ trên giải thích quy trình về cách GPT-4 được sử dụng để kiểm duyệt nội dung (từ phát triển chính sách đến kiểm duyệt quy mô lớn)

Không giống như AI theo hiến pháp, chủ yếu dựa vào các đánh giá nội bộ của chính mô hình về điều gì an toàn và điều gì không, cách tiếp cận của OpenAI giúp việc lặp lại các chính sách nội dung dành riêng cho nền tảng nhanh hơn và tốn ít công sức hơn.

(Trên cùng) Chất lượng ghi nhãn của GPT-4 tương tự như chất lượng của người đánh giá được đào tạo sơ sài (Nhóm B). Tuy nhiên, một người điều hành có kinh nghiệm và được đào tạo bài bản (Nhóm A) vẫn làm tốt hơn cả hai.

Nhóm nghiên cứu OpenAI đang tích cực khám phá những cải tiến hơn nữa đối với chất lượng dự đoán của GPT-4, chẳng hạn bằng cách kết hợp lý luận theo chuỗi hoặc tự phê bình. Đồng thời, nó cũng đang cố gắng phát hiện các phương pháp rủi ro chưa biết và lấy cảm hứng từ AI Hiến pháp, nó nhằm mục đích sử dụng các mô hình để xác định nội dung có khả năng gây hại và đưa ra mô tả cấp cao về nội dung có hại. Những phát hiện này sau đó sẽ cung cấp thông tin cập nhật cho các chính sách nội dung hiện có hoặc sự phát triển của các chính sách nhắm mục tiêu vào các lĩnh vực rủi ro hoàn toàn mới.

*Lưu ý: AI hiến pháp là một cơ chế được phát triển bởi đối thủ cạnh tranh Anthropic, được thành lập bởi các thành viên cũ của OpenAI, cho sản phẩm mô hình quy mô lớn Claude, nhằm mục đích cung cấp cách tiếp cận "dựa trên nguyên tắc" để điều chỉnh các hệ thống AI theo ý định của con người, cho phép ChatGPT -các mô hình giống như sử dụng một bộ nguyên tắc đơn giản làm hướng dẫn để trả lời các câu hỏi. *

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)