Дослідницький інститут агентства новин Xinhua випустив звіт про вітчизняні великомасштабні моделі: Xunfei Xinghuo № 1, Baidu Wenxin № 2

Автор: Бу Шуцін

Оскільки ChatGPT викликав сплеск інвестицій у штучний інтелект, вітчизняні великомасштабні моделі виросли, як гриби. Станом на початок липня налічувалося понад 80 великомасштабних моделей штучного інтелекту з масштабом параметрів понад 1 мільярд. Китай. Як, відповідно до цієї нової тенденції, обирати вітчизняні великомасштабні моделі? Яка велика модель найпотужніша?

12 серпня Дослідницький центр розвитку підприємництва Китаю Дослідницького інституту інформаційного агентства Сіньхуа опублікував «Звіт про досвід великої моделі штучного інтелекту 2.0» (далі — «Звіт»), який є найпопулярнішим підприємством вітчизняного виробництва, наприклад як Baidu Wenxin Yiyan і Ali Tongyi Qianwen.Оцінюються загальні програми великої моделі.

Для цього оцінювання було розроблено загалом 500 випадкових запитань, порівнюючи з рівнем людини, яка отримала вищу освіту, підкреслюючи реальну цінність для промисловості та життя, і строго відповідно до чотирьох основних індексів здібностей, індексу IQ, індексу EQ та інструменту індекс ефективності Параметр оцінки зважений для забезпечення суворості всього процесу оцінювання.

Остаточний результат був дещо здивованим.**Сюньфей Сінгхуо посів перше місце в цьому оцінюванні із загальним результатом 1013 балів і посів перше місце за двома параметрами індексу IQ та індексу ефективності інструменту серед чотирьох параметрів оцінювання; Байду Веньсінь Іянь посів перше місце в рейтингу другий і третій відповідно з SenseTime. **

Відповідно до «Звіту», Xunfei Xinghuo має сім основних здібностей, а саме: генерування тексту, розуміння мови, запитання та відповіді на знання, логічне мислення, математичні здібності, здатність до кодування та мультимодальні здібності. Володіти міжпредметними знаннями та здатністю розуміти мову, а також бути здатним розуміти та виконувати завдання на основі природного діалогу.

** У частині основних здібностей розрив між людьми та ШІ незначний. **Продуктивність Baidu Wenxin найбільше привертає увагу серед моделей; SenseTime, Zhipu AI hatGLM, 360 Smart Brain показали хороші результати, Xunfei Xinghuo, Ali Tongyi Qianwen, Lanzhou Technology Mchat, Kunlun Wanwei Tiangong показали хороші результати Все ще добре.

З точки зору оцінки IQ,** люди все ще мають явну перевагу, і бали найвищі. **Серед усіх оцінюваних моделей Xunfei Xinghuo і Zhipu A-ChatGLM посіли перше місце; Baidu Wenxin Yiyan і Kunlun Wanwei Tiangong показали хороші результати.

**Розрив між штучним інтелектом і людиною найбільш виражений, коли йдеться про емоційний інтелект. У «Звіті» зазначено, що явних ознак здатності ШІ сприймати емоції не спостерігалося. Незважаючи на це, SenseTime продемонстрував високий EQ, який перевершив своїх аналогів, посівши перше місце з результатом 346, Baidu Wenxin Yiyan і Lanzhou Technology · Mchat посіли друге та третє місце відповідно.

Нарешті, з точки зору підвищення ефективності роботи, «Звіт» вважає, що ШІ забезпечує надійну підтримку для людей, а швидкість обробки ШІ значно перевищує швидкість обробки людей. Однак, незважаючи на переваги високої швидкості та високої ефективності ШІ, людський інтелект і уява все ще відіграють незамінну роль у деяких складних та інноваційних завданнях. Результати оцінки показують, що Xunfei Xinghuo посіла перше місце з результатом 350 і далеко попереду, тоді як Baidu Wenxin Yiyan і Shangtang Shangdi посіли друге і третє місця відповідно.

«Звіт» вважає, що порівняно з червнем 2023 року поточні великомасштабні моделі продукції в Китаї досягли значного прогресу. Однак, порівняно з високоосвіченими людьми, все ще існує певний розрив між великими моделями з точки зору IQ та EQ. Хоча в різних сферах штучний інтелект і люди демонструють різні переваги та недоліки, але в цілому розробка великомасштабних моделей штучного інтелекту принесла важливий позитивний вплив на якість і ефективність роботи та життя людей, і великомасштабні моделі прискорюються. у Live та увійдіть у галузь.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити