[Perl] Module Lucy::Analysis::RegexTokenizer et les patterns

Dominique Asselineau asseline at telecom-paristech.fr
Mer 29 Nov 18:52:58 CET 2017


Bonjour,

Pour un moteur de recherche j'ai finalement opté pour Lucy qui semble
plutôt bien marcher.  Je fais du multilingue, j'ai donc un index par
langue et je cherche un pattern (motif) pour le module
Lucy::Analysis::RegexTokenizer également par langue, sachant que celui par
défaut est visiblement fait pour l'anglais.

Auriez-vous une solution ou au moins une source ?  Surtout pour le
français car c'est un peu compliqué avec l'apostrophe.

Dominique
-- 


Plus d'informations sur la liste de diffusion Perl