mer 25 décembre 2024
AccueilScienceDes chercheurs du MIT utilisent de grands modèles de langage pour signaler...

Des chercheurs du MIT utilisent de grands modèles de langage pour signaler les problèmes dans les systèmes complexes

Date:

L’identification des éoliennes défectueuses dans un parc éolien peut être une tâche complexe, nécessitant l’examen de nombreux signaux et de millions de points de données. Les ingénieurs ont souvent recours à des modèles d’apprentissage profond pour détecter ces anomalies dans les mesures répétées au fil du temps par chaque turbine, appelées données de séries chronologiques. Cependant, former ces modèles pour analyser efficacement les données peut être coûteux et fastidieux, en plus de nécessiter une expertise en matière d’apprentissage automatique.

Une récente étude menée par des chercheurs du MIT a exploré une approche alternative en utilisant des grands modèles linguistiques (LLM) comme outil de détection d’anomalies pour les données de séries chronologiques. Ces LLM pré-entraînés peuvent être déployés immédiatement, offrant une solution prête à l’emploi.

Le cadre développé par les chercheurs, appelé SigLLM, convertit les données de séries chronologiques en entrées textuelles compréhensibles par un LLM. Ce dernier peut ensuite être utilisé pour identifier les anomalies ou prédire les futurs points de données de séries chronologiques.

Bien que les LLM ne surpassent pas les modèles d’apprentissage profond spécialisés dans la détection d’anomalies, ils se comparent favorablement à d’autres approches d’intelligence artificielle. Avec des améliorations futures, ces LLM pourraient devenir des outils précieux pour détecter les problèmes potentiels liés à des équipements tels que des machines lourdes ou des satellites.

Les chercheurs ont mis au point deux approches pour la détection des anomalies, Prompter et Detector. Prompter utilise le LLM seul pour localiser les valeurs anormales, tandis que Detector intègre le LLM dans un pipeline de détection d’anomalies. Dans les tests, Detector s’est avéré plus performant que Prompter, démontrant la capacité des LLM à détecter les anomalies sans nécessiter de formation supplémentaire.

Bien que les LLM nécessitent encore des améliorations pour rivaliser avec les modèles d’apprentissage profond avancés, ils représentent une piste prometteuse pour la détection d’anomalies complexes. Les chercheurs envisagent des pistes d’amélioration telles que le réglage fin, l’accélération des calculs et l’analyse approfondie des performances des LLM.

Cette recherche a été soutenue par plusieurs partenaires industriels, soulignant l’intérêt croissant du secteur pour les applications des LLM dans des domaines tels que la détection d’anomalies.
En savoir plus : https://news.mit.edu/2024/researchers-use-large-language-models-to-flag-problems-0814

Ceci pourrait vous plaire


LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici