Les nouveaux modèles d'IA de Meta font sensation dans les cercles technologiques. Les deux nouveaux modèles, faisant partie de la gamme d'outils d'intelligence artificielle Llama de la maison mère de Facebook, sont tous deux open source, ce qui les distingue des offres concurrentes d'OpenAI et d'autres noms bien connus.
Les nouveaux modèles Llama de Meta ont des ensembles de données sous-jacents de tailles différentes, le modèle Llama 3 8B comprenant huit milliards de paramètres, et le modèle Llama 3 70B environ 70 milliards de paramètres. Plus il y a de paramètres, plus le modèle est puissant, mais toutes les tâches d'IA n'ont pas besoin de l'ensemble de données le plus grand possible.
Les nouveaux modèles de l'entreprise, qui ont été formés sur 24 000 clusters GPU, présentent de bonnes performances dans les benchmarks auxquels Meta les a confrontés, surpassant certains modèles concurrents déjà présents sur le marché. Ce qui compte pour nous qui ne cherchons pas à construire et à publier les modèles d'IA les plus performants ou les plus grands, c'est qu'ils s'améliorent toujours avec le temps. Et le travail. Et beaucoup de calculs.
Alors que Meta adopte une approche open source pour le travail d'IA, ses concurrents préfèrent souvent un travail plus fermé. OpenAI, malgré son nom et son histoire, offre l'accès à ses modèles, mais pas à leur code source. Il y a un débat sain dans le monde de l'IA sur la meilleure approche, à la fois en termes de vitesse de développement et de sécurité. Après tout, certains technologues — et certains prévisionnistes en informatique, pour être clair — s'inquiètent du fait que la technologie IA se développe trop rapidement et pourrait s'avérer dangereuse pour les démocraties et plus encore.
Pour l'instant, Meta entretient les flammes de l'IA, lançant un nouveau défi à ses pairs et concurrents pour surpasser leur dernier modèle. Appuyez sur lecture, et parlons-en!