Section courante

A propos

Section administrative du site

Voici un tableau de référence des termes et expressions associées à Solr :

Terme Description
Atomic updates Cette expression permet d'indiquer une approche permettant de mettre à jour uniquement un ou plusieurs champs d'un document, au lieu de réindexer l'intégralité du document.
Boolean operators Cette expresion permet d'indiquer un contrôle d'inclusion ou d'exclusion de mots-clefs dans une requête en utilisant des opérateurs tels que AND, OR et NOT.
Cluster Dans Solr, un cluster est un ensemble de noeuds Solr fonctionnant en coordination les uns avec les autres via ZooKeeper et gérés comme une unité. Un cluster peut contenir plusieurs collections. Voir également SolrCloud.
Collection Dans Solr, un ou plusieurs documents sont regroupés dans un seul index logique à l'aide d'une seule configuration et d'un seul schéma. Dans SolrCloud, une collection peut être divisée en plusieurs fragments logiques, qui peuvent à leur tour être répartis sur de nombreux nouds. Les installations à noud unique et les clusters gérés par l'utilisateur utilisent plutôt le concept de cour. Le terme « collection » est le plus souvent utilisé dans le contexte de SolrCloud, mais comme il représente un « index logique », le terme peut également être utilisé pour désigner des cours individuels dans un cluster géré par l'utilisateur.
Commit Ce mot permet d'indiquer l'action de rendre les modifications de documents permanentes dans l'index. Dans le cas de documents ajoutés, ils seraient consultables après une validation.
Core Ce mot permet d'indiquer une instance Solr individuelle (représente un index logique). Plusieurs coeurs peuvent s'exécuter sur un seul noeud. Voir également SolrCloud.
Core reload Pour réinitialiser un noyau Solr après des modifications apportées au fichier de schéma, solrconfig.xml ou d'autres fichiers de configuration.
Distributed search Cette expression permet d'indiquer une recherche dans laquelle les requêtes sont traitées sur plusieurs fragments.
Document Ce mot permet d'indiquer un groupe de champs et leurs valeurs. Les documents constituent l'unité de données de base d'une collection. Les documents sont attribués à des fragments à l'aide d'un hachage standard ou en attribuant spécifiquement un fragment dans l'ID de document. Les documents sont versionnés après chaque opération d'écriture.
Ensemble Terme ZooKeeper pour indiquer plusieurs instances ZooKeeper exécutées simultanément et en coordination les unes avec les autres pour la tolérance aux pannes.
Facet L'organisation des résultats de recherche en catégories basées sur des termes indexés.
Field Ce mot permet d'indiquer le contenu à indexer/rechercher ainsi que les métadonnées définissant comment le contenu doit être traité par Solr.
Inverse document frequency (IDF) Une mesure de l'importance générale d'un terme. Elle est calculée comme le nombre total de documents divisé par le nombre de documents dans lesquels un mot particulier apparaît dans la collection. Voir http://en.wikipedia.org/wiki/Tf-idf et les javadocs Lucene TFIDFSimilarity pour plus d'informations sur la notation basée sur TF-IDF et la notation Lucene en particulier. Voir également Fréquence des termes.
Inverted index Il s'agit d'une méthode permettant de créer un index consultable répertoriant tous les mots et les documents les contenant, à l'instar d'un index à la fin d'un livre répertoriant les mots et les pages sur lesquelles ils peuvent être trouvés. Lors de recherches par mots-clés, cette méthode est considérée comme plus efficace que l'alternative qui consisterait à créer une liste de documents associés à chaque mot utilisé dans chaque document. Étant donné que les utilisateurs effectuent des recherches à l'aide de termes qu'ils s'attendent à trouver dans des documents, la recherche du terme avant le document permet d'économiser des ressources de traitement et du temps.
Leader Une réplique unique pour chaque fragment se chargeant de coordonner les mises à jour d'index (ajouts ou suppressions de documents) vers d'autres répliques du même fragment. Il s'agit d'une responsabilité transitoire attribuée à un noeud via une élection. Si le chef de fragment actuel tombe en panne, un nouveau noeud sera automatiquement élu pour prendre sa place. Voir également SolrCloud.
Metadata Littéralement, des données sur des données. Les métadonnées sont des informations sur un document, comme son titre, son auteur ou son emplacement.
Natural language query Une recherche saisie à l'oral ou à l'écrit par un utilisateur, par exemple : «Qu'est-ce que l'aspirine ?»
Node Une instance JVM exécutant Solr. Également connu sous le nom de serveur Solr.
Optimistic concurrency Également connu sous le nom de «verrouillage optimiste», il s'agit d'une approche permettant de mettre à jour les documents actuellement présents dans l'index tout en conservant le verrouillage ou le contrôle des versions.
Overseer Un noeud unique dans SolrCloud étant responsable du traitement et de la coordination des actions impliquant l'ensemble de l'unité d'allocation. Il assure le suivi de l'état des noeuds, collections, fragments et répliques existants et attribue de nouvelles répliques aux noeuds. Il s'agit d'une responsabilité transitoire attribuée à un noeud via une élection. Si le superviseur actuel tombe en panne, un nouveau noeud sera automatiquement élu pour prendre sa place. Voir également SolrCloud.
Query parser Cette expression permet d'indiquer qu'un analyseur de requêtes traite les termes saisis par un utilisateur.
Recall Ce mot permet d'indiquer la capacité d'un moteur de recherche à récupérer toutes les correspondances possibles à la requête d'un utilisateur.
Relevance Ce mot permet d'indiquer l'adéquation d'un document à la recherche effectuée par l'utilisateur.
Replica Ce mot permet d'indiquer un noyau agissant comme une copie physique d'un fragment dans une collection SolrCloud.
Replication Ce mot permet d'indiquer une méthode de copie d'un index leader d'un serveur vers un ou plusieurs serveurs «suiveurs» ou «enfants».
RequestHandler Ce mot permet d'indiquer les paramètres logiques et de configuration indiquant à Solr comment gérer les «requêtes» entrantes, que les requêtes visent à renvoyer des résultats de recherche, à indexer des documents ou à gérer d'autres situations personnalisées.
SearchComponent Ce mot permet d'indiquer les paramètres logiques et de configuration utilisés par les gestionnaires de requêtes pour traiter les requêtes. Les composantes de recherche incluent notamment le facettage, la mise en surbrillance et la fonctionnalité «plus comme ça».
Shard Dans SolrCloud, une partition logique d'une seule collection. Chaque fragment est constitué d'au moins une réplique physique, mais il peut y avoir plusieurs répliques réparties sur plusieurs noeuds pour la tolérance aux pannes. Voir également SolrCloud.
SolrCloud Ce mot permet d'indiquer un terme générique désignant une suite de fonctionnalités dans Solr offrant la possibilité de gérer un unité d'allocation de noeuds Solr pour l'évolutivité, la tolérance aux pannes et la haute disponibilité.
Solr Schema (managed-schema.xml ou schema.xml) Le schéma d'index Solr définit les champs à indexer et le type du champ (texte, entiers,...). Par défaut, les données du schéma peuvent être «gérées» au moment de l'exécution à l'aide de l'API Schema et sont généralement conservées dans un fichier nommé managed-schema.xml que Solr modifie selon les besoins, mais une collection peut être configurée pour utiliser un schéma statique, n'étant chargé qu'au démarrage à partir d'un fichier de configuration modifié par un humain - généralement nommé schema.xml. Voir Configuration de la fabrique de schémas pour plus de détails.
SolrConfig (solrconfig.xml) Le fichier de configuration d'Apache Solr. Définit les options d'indexation, les gestionnaires de requêtes, la mise en surbrillance, la vérification orthographique et diverses autres configurations. Le fichier, solrconfig.xml, se trouve dans le répertoire de configuration de base de Solr.
Spell Check La capacité de suggérer des orthographes alternatives de termes de recherche à un utilisateur, afin de vérifier les fautes d'orthographe entraînant peu ou pas de résultats.
Stopwords En général, il s'agit de mots n'ayant pas beaucoup de sens pour la recherche d'un utilisateur, mais pouvant avoir été saisis dans le cadre d'une requête en langage naturel. Les mots vides sont généralement de très petits pronoms, conjonctions et prépositions (tels que «le», «avec» ou «et»).
Suggester Fonctionnalité dans Solr offrant la possibilité de suggérer des termes de requête possibles aux utilisateurs au fur et à mesure qu'ils tapent.
Synonyms Les synonymes sont généralement des termes ayant une signification proche et pouvant se substituer les uns aux autres. Dans une implémentation de moteur de recherche, les synonymes peuvent être des abréviations ainsi que des mots, ou des termes n'étant pas systématiquement séparés par un trait d'union. Des exemples de synonymes dans ce contexte seraient «Inc.» et «Incorporated» ou «iPod» et «i-pod».
Term frequency Cette expression permet d'indiquer le nombre de fois qu'un mot apparaît dans un document donné. Voir http://en.wikipedia.org/wiki/Tf-idf et les javadocs Lucene TFIDFSimilarity pour plus d'informations sur la notation basée sur TF-IDF et la notation Lucene en particulier. Voir également Inverse document frequency (IDF).
Transaction log Cette expresion permet d'indiquer un journal d'ajoutant uniquement des opérations d'écriture conservé par chaque réplica. Ce journal est requis avec les implémentations SolrCloud et est créé et géré automatiquement par Solr.
Wildcard Ce mot permet d'indiquer un remplacement une ou plusieurs lettres d'un mot pour tenir compte d'éventuelles variations d'orthographe ou de temps.
ZooKeeper Également connu sous le nom d'Apache ZooKeeper. Système utilisé par SolrCloud pour suivre les fichiers de configuration et les noms de noeuds d'un unité d'allocation. Un unité d'allocation ZooKeeper est utilisé comme magasin de configuration central pour l'unité d'allocation, coordinateur pour les opérations nécessitant une synchronisation distribuée et système d'enregistrement pour la topologie d'un unité d'allocation. Voir également SolrCloud.


Dernière mise à jour : Lundi, le 18 septembre 2023