Mistral AI est une start-up française fondée par Guillaume Lample, Arthur Mensch, et Timothée Lacroix. Le 27 septembre 2023, elle a présenté son premier modèle de traitement du langage naturel, Mistral 7B. Ce modèle, bien que de taille modeste avec ses 7,3 milliards de paramètres, est capable d’accomplir une multitude de tâches complexes, rivalisant ainsi avec Llama 2 de Meta. L’aspect remarquable de ce premier modèle réside dans son efficacité en matière de traitement informatique, avec une réduction significative de 47 % des ressources requises pour l’inférence par rapport à Llama 2. En résumé, Mistral 7B surpasse Llama 2 tout en étant plus optimisé.
Ce modèle est capable de réaliser diverses tâches complexes, notamment la compréhension du langage naturel, la création de contenu textuel, et le raisonnement STEM. Une caractéristique notable de Mistral 7B est sa capacité à fournir des performances similaires à celles de Llama 2 13B, tout en nécessitant moins de puissance de calcul pour son exécution. De plus, ce modèle peut facilement s’attaquer à des tâches textuelles de base.
Mistral AI a récemment publié son tout premier modèle LLM en open source, nommé « Mistral 7B instruct ». Cette initiative vise principalement à démontrer rapidement les compétences conversationnelles de Mistral 7B. À cette fin, les équipes de Mistral AI ont adapté le modèle en utilisant un ensemble de données public de Hugging Face. Cette publication est conçue comme une preuve de concept (PoC) pour mettre en évidence les capacités impressionnantes de Mistral 7B dans le domaine des interactions conversationnelles.