Des outils d’écriture IA toujours plus précis

Une Ă©quipe de recherche de l’UniversitĂ© 91ÉçÇř a mis au point une nouvelle mĂ©thode qui permet d’amĂ©liorer considĂ©rablement la prĂ©cision et l’efficacitĂ© des grands modèles de langage (GML) pour la gĂ©nĂ©ration de codes informatiques et de textes structurĂ©s.
Les GML sont de puissants outils d’IA capables de rédiger toutes sortes de textes, qu’il s’agisse d’essais ou de scripts, et ce, dans un large éventail de langues. Cependant, il leur arrive souvent de commettre des erreurs et de générer des résultats non fonctionnels lorsqu’on leur impose des contraintes. En outre, les solutions à ces problèmes sont souvent peu fiables ou trop lentes.
Or, une nouvelle approche a Ă©tĂ© mise au point par une Ă©quipe de recherche dont les membres viennent du MIT, de l’ETH ZĂĽrich et de l’UniversitĂ© Yale. DirigĂ©e par Timothy O’Donnell, de l’UniversitĂ© 91ÉçÇř, l’équipe utilise la mĂ©thode Monte-Carlo sĂ©quentielle afin de coordonner la production de multiples rĂ©sultats tout en priorisant les meilleurs d’entre eux Ă chaque Ă©tape et ainsi Ă©carter les rĂ©sultats peu prometteurs dès le dĂ©but du processus.
L’efficacité des calculs s’en trouve renforcée, ce qui se traduit par un gain de temps et une réduction des erreurs et permet même à de petits modèles d’IA d’être plus performants que des modèles beaucoup plus grands. De plus, le GML peut se concentrer sur les résultats les plus susceptibles d’être valides et précis.
« Pour un linguiste comme moi, cette mĂ©thode est particulièrement intĂ©ressante parce qu’elle fournit un cadre dans lequel nous pouvons commencer Ă formuler de vĂ©ritables thĂ©ories du sens. Nous allons au-delĂ des GML pour les mots, vers des modèles symboliques de la signification sous-jacente des mots », explique Timothy O’Donnell, professeur agrĂ©gĂ© et chercheur William-Dawson au DĂ©partement de linguistique de l’UniversitĂ© 91ÉçÇř, et membre acadĂ©mique principal de , oĂą il est titulaire d’une chaire en IA Canada-CIFAR.
Cette percée a des applications potentielles dans les domaines de l’aide à la programmation, de l’analyse de données, de la robotique et de la recherche scientifique. Il s’agit d’une étape importante vers une IA plus intelligible et maîtrisable pour les non-experts.
Les membres du groupe de recherche (le « GenLM Consortium ») ont l’intention de poursuivre leurs travaux et lanceront prochainement le logiciel sous la forme d’une boîte à outils à code source libre.
L’article « Syntactic and Semantic Control of Large Language Models via Sequential Monte Carlo »ĚýaĚýĂ©tĂ©ĚýprĂ©sentĂ© Ă l’International Conference on Learning Representations (ICLR), qui a eu lieu du 24 au 28 avril.
Ěý