[Perl] utf8 et lettre à

Dominique Asselineau asseline at telecom-paristech.fr
Jeu 15 Sep 13:27:44 CEST 2016


Bonjour,

Les 2 lignes suivantes sont-elles présentes dans les déclarations :

use utf8;
use feature 'unicode_strings';

Dominique

minc wrote on Thu, Sep 15, 2016 at 01:17:23PM +0200
> Bonjour,
> 
> J’extraie des mots d'un dictionnaire en xml avec la regex
> 
> suivante  :  my $extract=qr{<orthography>\s*(?<word>.*?)\s*</orthography>} ;
> 
> les résultats sont correctes sauf pour les mots se terminant par 'à' tel que
> "déjà" ou j'obtiens
> 
> "déj\xC3" sachant que 'à' en utf8 est la suite 'C3 A0'.
> 
> Les autres caractères accentués ne me semble pas poser de problème.
> 
> Le résultat est corrigé avec :
> 
>     my $extract=qr{<orthography>(?<word>.*?)</orthography>} ;
> 
> Quelle hypothèse peut-on formuler pour expliquer cette "troncation" ?
> 
> Merci.
> 
> Charles
> 

> begin:vcard
> note;quoted-printable:Put your hand on a hot stove for a minute, and it seems like an hour. Sit=
> 	 with a pretty girl for an hour, and it seems like a minute. That's relat=
> 	ivity.=0D=0A=
> 	(A. Einstein)
> version:2.1
> end:vcard
> 

> _______________________________________________
> Perl mailing list
> Perl at mongueurs.net
> http://listes.mongueurs.net/mailman/listinfo/perl


-- 


Plus d'informations sur la liste de diffusion Perl