MT-NLG : Le modèle de langage de Microsoft et Nvidia à 105 couches et 530 milliards de paramètres qui nécessite 280 GPU A100

www.zdnet.com

🤯Microsoft et Nvidia ont présenté un modèle de génération de langage naturel qui a 3 fois plus de paramètres que GPT-3 ! Dans un article de blog, ils ont appelé le modèle, MT-NLG, "le modèle de langage de transformateur monolithique le plus grand et le plus puissant entrainé à ce jour".

MT-NLG montre une "précision inégalée" sur les tâches de prédiction et de compréhension de la lecture, de raisonnement, de logique... En revanche, il est toujours aussi biaisé.

Lire...
Linkedin

Voulez-vous recevoir plus de contenus comme celui-ci dans votre boîte aux lettres ?