config.yml |
Configuration |
---|---|
RASA |
Description
Ce fichier contient la configuration de vos modèles NLU et Core.
Liste des champs
Voici les différents champs contenu dans le fichier de configuration «config.yml» :
Nom | Description | |
---|---|---|
language: valeur | Ce champ permet d'indiquer le langage humain reconnu par RASA. Les valeurs reconnus sont : | |
Valeur | Description | |
en | Anglais | |
fr | Français | |
pipeline: | Ce champ permet d'indiquer la section de ligne de tuyaux. | |
name: | Ce sous-champ permet d'indiquer le nom du modèle à utiliser. Les valeurs les plus utilisés sont : | |
Valeur | Description | |
"ConveRTFeaturizer" | Cette valeur permet de créer une représentation vectorielle du message et de la réponse de l'utilisateur (si spécifié) à l'aide du modèle ConveRT. | |
"ConveRTTokenizer" | Cette valeur permet d'indiquer les jetons utilisant le modèle ConveRT. Cette valeur est obsolète ne sera plus supporté dans les nouvelles version de RASA. | |
"CountVectorsFeaturizer" | Cette valeur permet de créer une représentation en sac de mots des messages, intentions et réponses des utilisateurs. | |
"CRFEntityExtractor" | Cette valeur permet d'indiquer une extraction des entités de champ aléatoire conditionnel (CRF). | |
"DucklingHTTPExtractor" | Cette valeur permet d'indiquer l'utilisation de Duckling afin d'extraire des entités communes telles que les dates, les montants d'argent, les distances et autres dans un certain nombre de langues. | |
"EntitySynonymMapper" | Cette valeur permet de cartographier les valeurs d'entité synonymes à la même valeur. | |
"KeywordIntentClassifier" | Cette valeur permet d'indiquer un classificateur d'intention de correspondance de mots clefs simple, destiné aux petits projets à court terme. | |
"LanguageModelTokenizer" | Cette valeur permet d'indiquer un jeton à partir de modèles de langage pré-entraînés. Cette valeur est obsolète ne sera plus supporté dans les nouvelles version de RASA. | |
"MitieEntityExtractor" | Cette valeur permet d'indiquer les extracteurs d'entités extraient des entités, telles que des noms de personnes ou des emplacements, du message de l'utilisateur. | |
"MitieFeaturizer" | Cette valeur permet de créer une représentation vectorielle du message et de la réponse de l'utilisateur (si spécifié) à l'aide de la fonctionnalité MITIE. | |
"MitieNLP" | Cette valeur permet d'indiquer la bibliothèque MITIE. | |
"MitieTokenizer" | Cette valeur permet d'indiquer les jetons utilisant MITIE. | |
"JiebaTokenizer" | Cette valeur permet d'indiquer les jetons utilisant Jieba pour la langue chinoise. | |
"RegexFeaturizer" | Cette valeur permet de créer une représentation vectorielle du message utilisateur à l'aide d'expressions régulières. | |
"SklearnIntentClassifier" | Cette valeur permet d'indiquer un classificateur d'intention Sklearn. | |
"SpacyEntityExtractor" | Cette valeur permet d'indiquer l'extraction d'entités spaCy. | |
"SpacyFeaturizer" | Cette valeur permet de créer une représentation vectorielle du message et de la réponse de l'utilisateur (si spécifié) à l'aide de la fonctionnalité spaCy. | |
"SpacyNLP" | Cette valeur permet d'indiquer la bibliothèque spaCy. | |
"SpacyTokenizer" | Cette valeur permet d'indiquer les jetons utilisant spaCy. | |
DIETClassifier | Cette valeur permet d'indiquer le Dual Intent Entity Transformer (DIET) utilisé pour la classification d'intention et l'extraction d'entités. | |
HFTransformersNLP | Cette valeur permet d'indiquer l'initialiseur de modèle de langage pré-formé basé sur les transformateurs de HuggingFace. Cette valeur est obsolète ne sera plus supporté dans les nouvelles version de RASA. | |
LanguageModelFeaturizer | Cette valeur permet de créer une représentation vectorielle du message et de la réponse de l'utilisateur (si spécifié) à l'aide d'un modèle de langage pré-entraîné. | |
LexicalSyntacticFeaturizer | Cette valeur permet de créer des fonctionnalités lexicales et syntaxiques pour un message utilisateur afin de prendre en charge l'extraction d'entités. | |
RegexEntityExtractor | Cette valeur permet d'indiquer qu'il faut extraire les entités à l'aide des tables de recherche et/ou des expressions régulières définies dans les données d'apprentissage. | |
model: | Ce sous-champ permet d'indiquer le modèle de langage à charger. | |
model_weights: | Ce sous-champ permet d'indiquer le poids pré-entraînés à charger. | |
cache_dir: | Ce sous-champ permet d'indiquer un chemin facultatif vers un répertoire spécifique pour télécharger et mettre en cache les poids de modèle pré-entraînés. | |
"intent_tokenization_flag": | Ce sous-champ permet d'indiquer le drapeau pour vérifier s'il faut diviser les intentions. | |
"intent_split_symbol": | Ce sous-champ permet d'indiquer le symbole sur lequel l'intention doit être divisée. | |
"token_pattern": | Ce sous-champ permet d'indiquer l'expression régulière pour détecter les jetons. | |
"model_url": | Ce sous-champ permet d'indiquer l'URL à distance et répertoire local des fichiers de modèle. |
Dernière mise à jour : Lundi, le 21 décembre 2020