OpenAI lance de nouveaux modèles ouverts : une première depuis GPT-2 !

par adm
OpenAI Just Released Its First Open-Weight Models Since GPT-2

Dans le monde en constante évolution de l’intelligence artificielle, OpenAI a récemment fait des vagues en dévoilant ses premiers modèles en open-source depuis plus de cinq ans. Les modèles gpt-oss-120b et gpt-oss-20b, qui marquent un tournant significatif pour la société, se distinguent par leur capacité à fonctionner localement sur des appareils grand public et à être affinés pour des usages spécifiques. En se détournant de sa stratégie récente axée sur des lancements exclusifs, OpenAI s’oriente désormais vers une offre plus large et plus ouverte, accessible à un public plus vaste. Ce changement de cap promet de révolutionner l’accès à des technologies de pointe, précédemment réservées à une élite.

Sam Altman, PDG d’OpenAI, a exprimé son enthousiasme quant à cette démarche : « Nous sommes ravis de rendre ce modèle, fruit de milliards de dollars de recherche, accessible au monde entier pour maximiser la diffusion de l’IA. » Ces modèles sont téléchargeables gratuitement sur Hugging Face, une plateforme populaire pour les outils d’IA, et représentent une continuation de l’esprit initial qui avait présidé au lancement de GPT-2 en 2019.

Un tour d’horizon des modèles gpt-oss

Les nouveaux modèles d’OpenAI, gpt-oss-120b et gpt-oss-20b, utilisent une approche de raisonnement par chaîne de pensée, une méthode que la firme avait déjà explorée avec son modèle o1. Cette technique permet aux outils d’IA de générer des réponses en plusieurs étapes, offrant ainsi des solutions plus élaborées et contextualisées. Ces modèles, qui se concentrent exclusivement sur le traitement du texte, disposent de capacités telles que la navigation sur le web, l’appel à des modèles basés sur le cloud pour assistance, l’exécution de code, et la manipulation de logiciels en tant qu’agents d’IA. Le modèle le plus petit, gpt-oss-20b, est suffisamment compact pour fonctionner localement sur un appareil avec plus de 16 Go de mémoire.

Avantages de l’open-source et sécurité

L’un des grands avantages des modèles en open-source, comme le gpt-oss, est la transparence de leurs « poids », les paramètres internes qui régissent le traitement des informations. Cela permet à quiconque de comprendre le fonctionnement interne du modèle et de l’adapter à des besoins spécifiques. Toutefois, cette ouverture pose également des défis en termes de sécurité, car elle permet à n’importe qui de potentiellement détourner l’outil à des fins non prévues. Conscient de ces risques, OpenAI a procédé à des tests de sécurité approfondis avant le lancement, et a même affiné le modèle pour évaluer sa résilience face à des utilisations malveillantes potentielles.

Un cadre légal flexible

Les deux modèles sont distribués sous la licence Apache 2.0, un choix populaire pour les modèles en open-source, qui autorise l’utilisation commerciale, la redistribution et l’intégration dans d’autres logiciels sous licence. Cette flexibilité est essentielle pour encourager l’adoption et l’innovation autour de ces modèles, permettant à d’autres entreprises et développeurs de construire sur cette base sans entraves.

Comparaisons et performances

Benchmark et réactions du secteur

Les scores de benchmark pour les modèles gpt-oss sont impressionnants, les plaçant au même niveau, voire au-dessus, des modèles propriétaires précédents d’OpenAI, tels que les o3 et o4-mini. Cette performance accrue, combinée à un coût d’opération réduit, pourrait redéfinir les attentes du marché et stimuler une adoption plus large des technologies d’IA.

Contexte concurrentiel

La sortie des modèles gpt-oss intervient alors que la guerre des talents en IA s’intensifie, avec des offres considérables faites aux chercheurs les plus en vue pour qu’ils changent d’alignement. Avec ces nouvelles offres, OpenAI pourrait bien donner du fil à retordre à d’autres leaders du secteur, comme Meta, qui a également fait des avancées significatives dans le domaine de l’IA open-source avec ses modèles Llama.

En conclusion, l’arrivée de gpt-oss-120b et gpt-oss-20b pourrait bien marquer un tournant dans la manière dont l’intelligence artificielle est développée, partagée et utilisée à travers le monde, promettant une ère d’innovation et d’accessibilité accrues.

Articles similaires

Notez cet article

Laissez un commentaire

La Cité Relais

La Cité Relais est une source d’information de confiance dédiée à l’immobilier, la finance et l’entreprise. Notre équipe d’experts passionnés est déterminée à vous fournir des ressources de qualité pour vous guider vers le succès.

Suivez-nous sur

@2023 – Tous droits réservés. La Cité Relais