Comment configurer Solr utilisation de Levenshtein approximative de la correspondance de chaîne?
N'Apache Solr moteur de recherche, de fournir approximative de la chaîne correspond, par exemple, via l'algorithme de Levenshtein?
Je suis à la recherche d'un moyen de trouver des clients par nom de famille. Mais je ne peux pas garantir l'exactitude des noms. Comment puis-je configurer Solr, de sorte qu'il va trouver la personne
"Levenshtein" même si j'ai de la recherche pour "Levenstein" ?
OriginalL'auteur prinzdezibel | 2009-11-17
Vous devez vous connecter pour publier un commentaire.
Typiquement, cela se fait avec la SpellCheckComponent, qui utilise en interne la Lucene Correcteur D'Orthographe par défaut, qui met en œuvre Levenshtein.
La wiki explique très bien comment il fonctionne, comment le configurer et quelles options sont disponibles, aucun point de le répéter ici.
Ou vous pouvez simplement utiliser Lucene est floue opérateur de recherche.
Une autre option est d'utiliser un phonétique filtre au lieu de Levenshtein.
OriginalL'auteur Mauricio Scheffer
Grande réponse par Mauricio, mon seul "cheapo" plus est de simplement ajouter le caractère ~ tous les termes que vous souhaitez correspondance floue sur la façon de solr. Si vous utilisez le réglage par défaut, cela vous donnera correspondance floue.
Si vous mettez des guillemets autour de la pomme, je pense qu'il devient une expression de requête, de sorte que le ~2 consiste en la recherche de proximité, au lieu de la distance d'édition. Essayez de laisser tomber les guillemets
J'ai essayé de supprimer les guillemets, mais il donne trop de résultats parce que j'ai utilisé phonétique de filtrage sur les deux index et une requête. J'ai collé ma question ici - [stackoverflow.com/questions/27484326/.... Pouvez-vous m'aider s'il vous plaît?
OriginalL'auteur MattMcKnight