Команда OpenAI випустила останню версію використання GPT-4 для створення системи перегляду вмісту та зменшення участі вручну

Джерело зображення: створено Unbounded AI

16 серпня команда OpenAI оголосила про нове використання штучного інтелекту, використання GPT-4 для розробки політики щодо вмісту та прийняття рішень щодо модерації вмісту, що забезпечує більш послідовне маркування, швидші цикли зворотного зв’язку для вдосконалення політики та зменшує участь учасників перевірки вручну.

Модерація вмісту відіграє життєво важливу роль у підтримці працездатності цифрових платформ. Дослідники OpenAI виявили, що система модерації вмісту, яка використовує GPT-4, може повторювати зміни політики набагато швидше, скорочуючи час циклу з місяців до годин.

У той же час GPT-4 також здатний інтерпретувати правила та нюанси в документах політики щодо тривалого вмісту та негайно адаптуватися до оновлень політики, що призводить до більш узгоджених міток. Це пропонує більш позитивне бачення майбутнього цифрових платформ, де штучний інтелект може допомогти регулювати онлайн-трафік відповідно до політики конкретної платформи та полегшити фізичний і психічний тягар великої кількості людських регуляторів.

Який тип користувача доступний: кожен, хто має доступ до OpenAI API, може застосувати цей підхід для створення власної системи модерування за допомогою ШІ.

Проблеми модерації вмісту

Модерація вмісту вимагає кропітких зусиль, чутливості, глибокого розуміння контексту та швидкої адаптації до нових випадків використання, що робить процес трудомістким і складним. Традиційно тягар цього завдання лягає на людей-кураторів, які за допомогою менших вертикальних моделей машинного навчання просіюють великі обсяги вмісту, щоб відфільтрувати токсичний і шкідливий матеріал. Цей процес повільний за своєю природою і може бути психічним стресом для людини.

Вирішено за допомогою великої мовної моделі (LLM)

Дослідницька група OpenAI вивчає використання магістерських програм для вирішення цих проблем. Вони стверджують, що їхні великі мовні моделі, такі як GPT-4, можуть розуміти та генерувати природну мову, що робить їх придатними для модерування вмісту. Ці моделі можуть робити помірковані судження на основі наданих їм політичних вказівок.

Завдяки системі процес розробки та налаштування політики модерації вмісту скоротився з місяців до годин.

  1. Після розробки керівних принципів політики для перегляду експерти з політики можуть створити золотий набір даних, визначивши невелику кількість прикладів і присвоївши їм мітки відповідно до політики.
  2. Потім GPT-4 читає політику та призначає мітку тому ж набору даних, але не бачить відповіді.
  3. Досліджуючи розбіжності між судженнями GPT-4 і людськими судженнями, експерти з питань політики можуть попросити GPT-4 придумати міркування, що стоять за його мітками, проаналізувати неоднозначності у визначеннях політики, усунути плутанину та надати подальше розуміння політики відповідним чином. Ми можемо повторювати кроки 2 і 3, доки не будемо задоволені якістю політики.

Цей ітеративний процес дає вдосконалені політики щодо вмісту, які перетворюються на класифікатори, що дозволяє розгортати політику та модерацію вмісту в масштабі.

Крім того, щоб обробляти великі обсяги даних у масштабі, ми можемо використовувати прогнози з GPT-4 для точного налаштування меншої моделі.

Ця проста, але потужна ідея пропонує декілька покращень у порівнянні з традиційними методами модерування вмісту:

Мітки більш послідовні. Політика щодо вмісту постійно розвивається і часто є дуже детальною. Люди можуть інтерпретувати політику по-різному, або деяким модераторам може знадобитися більше часу, щоб переварити нові зміни політики, що призведе до непослідовного маркування. Навпаки, магістр права чутливий до нюансів у формулюваннях і може негайно адаптуватися до оновлень політики, забезпечуючи користувачам послідовний контент.

Швидші цикли зворотного зв'язку. Цикл оновлення політики — створення нових політик, позначення їх і збір відгуків людей — часто є тривалим і тривалим процесом. GPT-4 може скоротити цей процес до кількох годин, дозволяючи швидше реагувати на нові небезпеки.

Знизьте розумове навантаження. Постійний вплив шкідливого або неприйнятного контенту може призвести до емоційного виснаження та психологічного стресу для модератора. Автоматизація таких завдань сприяє добробуту тих, хто їх залучає.

На діаграмі вище пояснюється процес використання GPT-4 для модерації вмісту (від розробки політики до широкомасштабної модерації)

На відміну від конституційного штучного інтелекту, який покладається насамперед на власні внутрішні судження моделі про те, що безпечно, а що ні, підхід OpenAI робить ітерацію на основі політики контенту для певної платформи швидше та з меншими зусиллями.

(Вгорі) Якість маркування GPT-4 подібна до якості маркування ненавчених рецензентів (група B). Однак досвідчений і добре навчений модератор-людина (група А) все одно перевершує обох.

Дослідницька група OpenAI активно вивчає подальші покращення якості передбачень GPT-4, наприклад, шляхом включення ланцюжкових міркувань або самокритики. У той же час, він також намагається виявити невідомі методи ризику, і, натхненний конституційним штучним інтелектом, він прагне використовувати моделі для ідентифікації потенційно шкідливого вмісту та надання високорівневого опису шкідливого вмісту. Ці висновки потім стануть основою для оновлення існуючої політики щодо вмісту або розробки політик, спрямованих на абсолютно нові сфери ризику.

*Примітка: Конституційний штучний інтелект — це механізм, розроблений конкурентом Anthropic, заснованим колишніми членами OpenAI, для свого великомасштабного модельного продукту Claude, який має на меті забезпечити «основний на принципах» підхід для узгодження систем штучного інтелекту з наміром людини, дозволяючи ChatGPT Подібні моделі використовують простий набір принципів як посібник для відповідей на запитання. *

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити