Section courante

A propos

Section administrative du site

config.yml

Configuration
RASA

Description

Ce fichier contient la configuration de vos modèles NLU et Core.

Liste des champs

Voici les différents champs contenu dans le fichier de configuration «config.yml» :

Nom Description
language: valeur Ce champ permet d'indiquer le langage humain reconnu par RASA. Les valeurs reconnus sont :
Valeur Description
en Anglais
fr Français
pipeline: Ce champ permet d'indiquer la section de ligne de tuyaux.
    name: Ce sous-champ permet d'indiquer le nom du modèle à utiliser. Les valeurs les plus utilisés sont :
Valeur Description
"ConveRTFeaturizer" Cette valeur permet de créer une représentation vectorielle du message et de la réponse de l'utilisateur (si spécifié) à l'aide du modèle ConveRT.
"ConveRTTokenizer" Cette valeur permet d'indiquer les jetons utilisant le modèle ConveRT. Cette valeur est obsolète ne sera plus supporté dans les nouvelles version de RASA.
"CountVectorsFeaturizer" Cette valeur permet de créer une représentation en sac de mots des messages, intentions et réponses des utilisateurs.
"CRFEntityExtractor" Cette valeur permet d'indiquer une extraction des entités de champ aléatoire conditionnel (CRF).
"DucklingHTTPExtractor" Cette valeur permet d'indiquer l'utilisation de Duckling afin d'extraire des entités communes telles que les dates, les montants d'argent, les distances et autres dans un certain nombre de langues.
"EntitySynonymMapper" Cette valeur permet de cartographier les valeurs d'entité synonymes à la même valeur.
"KeywordIntentClassifier" Cette valeur permet d'indiquer un classificateur d'intention de correspondance de mots clefs simple, destiné aux petits projets à court terme.
"LanguageModelTokenizer" Cette valeur permet d'indiquer un jeton à partir de modèles de langage pré-entraînés. Cette valeur est obsolète ne sera plus supporté dans les nouvelles version de RASA.
"MitieEntityExtractor" Cette valeur permet d'indiquer les extracteurs d'entités extraient des entités, telles que des noms de personnes ou des emplacements, du message de l'utilisateur.
"MitieFeaturizer" Cette valeur permet de créer une représentation vectorielle du message et de la réponse de l'utilisateur (si spécifié) à l'aide de la fonctionnalité MITIE.
"MitieNLP" Cette valeur permet d'indiquer la bibliothèque MITIE.
"MitieTokenizer" Cette valeur permet d'indiquer les jetons utilisant MITIE.
"JiebaTokenizer" Cette valeur permet d'indiquer les jetons utilisant Jieba pour la langue chinoise.
"RegexFeaturizer" Cette valeur permet de créer une représentation vectorielle du message utilisateur à l'aide d'expressions régulières.
"SklearnIntentClassifier" Cette valeur permet d'indiquer un classificateur d'intention Sklearn.
"SpacyEntityExtractor" Cette valeur permet d'indiquer l'extraction d'entités spaCy.
"SpacyFeaturizer" Cette valeur permet de créer une représentation vectorielle du message et de la réponse de l'utilisateur (si spécifié) à l'aide de la fonctionnalité spaCy.
"SpacyNLP" Cette valeur permet d'indiquer la bibliothèque spaCy.
"SpacyTokenizer" Cette valeur permet d'indiquer les jetons utilisant spaCy.
DIETClassifier Cette valeur permet d'indiquer le Dual Intent Entity Transformer (DIET) utilisé pour la classification d'intention et l'extraction d'entités.
HFTransformersNLP Cette valeur permet d'indiquer l'initialiseur de modèle de langage pré-formé basé sur les transformateurs de HuggingFace. Cette valeur est obsolète ne sera plus supporté dans les nouvelles version de RASA.
LanguageModelFeaturizer Cette valeur permet de créer une représentation vectorielle du message et de la réponse de l'utilisateur (si spécifié) à l'aide d'un modèle de langage pré-entraîné.
LexicalSyntacticFeaturizer Cette valeur permet de créer des fonctionnalités lexicales et syntaxiques pour un message utilisateur afin de prendre en charge l'extraction d'entités.
RegexEntityExtractor Cette valeur permet d'indiquer qu'il faut extraire les entités à l'aide des tables de recherche et/ou des expressions régulières définies dans les données d'apprentissage.
    model: Ce sous-champ permet d'indiquer le modèle de langage à charger.
    model_weights: Ce sous-champ permet d'indiquer le poids pré-entraînés à charger.
    cache_dir: Ce sous-champ permet d'indiquer un chemin facultatif vers un répertoire spécifique pour télécharger et mettre en cache les poids de modèle pré-entraînés.
    "intent_tokenization_flag": Ce sous-champ permet d'indiquer le drapeau pour vérifier s'il faut diviser les intentions.
    "intent_split_symbol": Ce sous-champ permet d'indiquer le symbole sur lequel l'intention doit être divisée.
    "token_pattern": Ce sous-champ permet d'indiquer l'expression régulière pour détecter les jetons.
    "model_url": Ce sous-champ permet d'indiquer l'URL à distance et répertoire local des fichiers de modèle.


Dernière mise à jour : Lundi, le 21 décembre 2020