Le modèle linguistique audio Qwen2-Audio d'Open Source d'Alitongyi, dont l'article correspondant a été sélectionné pour la conférence de haut niveau ACL 2024

Golden Ten Data a rapporté le 13 août que le grand modèle d’Ali Tongyi continuait d’être open-source, et que la série Qwen2 de familles open-source ajoutait le modèle de langage audio Qwen2-Audio. Qwen2-Audio peut répondre directement aux questions et réponses sans saisie de texte, comprendre et analyser les signaux audio entrants par les utilisateurs, y compris les voix humaines, les sons naturels, la musique, etc. Le modèle a nettement surpassé les meilleurs modèles précédents dans plusieurs revues faisant autorité. Dans le même temps, l’équipe de Tongyi a également lancé un nouvel ensemble de benchmarks d’évaluation du modèle de compréhension audio, et des articles connexes ont été sélectionnés pour la ACL2024 de la conférence internationale au sommet qui se tient cette semaine.

Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Récompense
  • 3
  • Partager
Commentaire
0/400
ThereIsABuddhaInYouvip
· 2024-10-25 13:07
Attaque de la pièce 100x 📈
Voir l'originalRépondre0
StupidHappyvip
· 2024-09-13 09:38
Piéger la pièce 100x 📈
Voir l'originalRépondre0
StupidHappyvip
· 2024-09-13 09:37
All in All in 🙌
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)