Fiche technique | |
---|---|
Type de produit : | Bibliothèque |
Auteur : | Apache |
Licence : | Apache License 2.0 |
Date de publication : | 2011 à maintenant |
Site Web : | https://lucene.apache.org/ |
Introduction
L'Apache Lucene est une bibliothèque open-source pour Java, utilisée pour l'indexation et la recherche de texte en plein texte. Créée par Doug Cutting et maintenant maintenue par la fondation Apache, Lucene est à la base de nombreux moteurs de recherche, offrant des fonctionnalités puissantes pour effectuer des recherches rapides et précises sur de grands ensembles de données textuelles.
Voici les caractéristiques principales de Lucene :
- Indexation de texte : Lucene convertit les documents en index, ce qui permet de rechercher rapidement des mots ou des phrases dans de grandes quantités de texte.
- Recherche full-text : Lucene supporte des recherches complexes, incluant des opérateurs booléens (ET, OU, PAS), des recherches par phrases, des recherches de proximité, des recherches par troncature, et bien plus.
- Pointage de pertinence : Lucene utilise un algorithme de pointage pour déterminer la pertinence des documents par rapport à une requête. Chaque résultat de recherche est classé en fonction de sa proximité avec les mots-clés de la requête.
- Support des langues : Lucene est capable de gérer plusieurs langues avec des fonctionnalités de segmentation de texte adaptées aux besoins linguistiques spécifiques, telles que la "racine" des mots (stemming) et l'analyse morphologique.
- Facettes et suggestions de recherche : Lucene permet la recherche facettée (classant les résultats par catégories) et des suggestions de recherche (sous forme d'auto-complétion) pour améliorer l'expérience utilisateur.
- Analyseurs (Analyzers) : Lucene fournit des analyseurs pour segmenter le texte en jetons (mots ou phrases) selon différentes règles (par exemple, en ignorant la casse ou les mots très fréquents, comme "le" ou "et").
- Moteur de recherche flexible : Lucene peut être intégré dans des applications, sites web, ou systèmes d'information qui nécessitent des capacités de recherche.
Remarques
- Le projet publie une bibliothèque de recherche principale, nommée Lucene core, ainsi que PyLucene, une liaison Python pour Apache Lucene.
- La bibliothèque Apache Lucene est utilisé par de nombreux projets comme Compass, Solr,...
Dernière mise à jour : Jeudi, le 12 septembre 2024