[Perl] utf8 et lettre à
Laurent Rosenfeld
laurent.rosenfeld at googlemail.com
Jeu 15 Sep 14:06:14 CEST 2016
Bonjour,
pas trop le temps de me pencher là-dessus tout de suite, mais voici un lien
qui peut aider:
http://perl.developpez.com/tutoriels/perl/intelligible-guide-perl5/
Cordialement, Laurent.
Le 15 septembre 2016 à 13:27, Dominique Asselineau <
asseline at telecom-paristech.fr> a écrit :
> Bonjour,
>
> Les 2 lignes suivantes sont-elles présentes dans les déclarations :
>
> use utf8;
> use feature 'unicode_strings';
>
> Dominique
>
> minc wrote on Thu, Sep 15, 2016 at 01:17:23PM +0200
> > Bonjour,
> >
> > J’extraie des mots d'un dictionnaire en xml avec la regex
> >
> > suivante : my $extract=qr{<orthography>\s*(?<word>.*?)\s*</orthography>}
> ;
> >
> > les résultats sont correctes sauf pour les mots se terminant par 'à' tel
> que
> > "déjà" ou j'obtiens
> >
> > "déj\xC3" sachant que 'à' en utf8 est la suite 'C3 A0'.
> >
> > Les autres caractères accentués ne me semble pas poser de problème.
> >
> > Le résultat est corrigé avec :
> >
> > my $extract=qr{<orthography>(?<word>.*?)</orthography>} ;
> >
> > Quelle hypothèse peut-on formuler pour expliquer cette "troncation" ?
> >
> > Merci.
> >
> > Charles
> >
>
> > begin:vcard
> > note;quoted-printable:Put your hand on a hot stove for a minute, and it
> seems like an hour. Sit=
> > with a pretty girl for an hour, and it seems like a minute.
> That's relat=
> > ivity.=0D=0A=
> > (A. Einstein)
> > version:2.1
> > end:vcard
> >
>
> > _______________________________________________
> > Perl mailing list
> > Perl at mongueurs.net
> > http://listes.mongueurs.net/mailman/listinfo/perl
>
>
> --
> _______________________________________________
> Perl mailing list
> Perl at mongueurs.net
> http://listes.mongueurs.net/mailman/listinfo/perl
>
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://listes.mongueurs.net/mailman/private/perl/attachments/20160915/ddcb8a17/attachment.html>
Plus d'informations sur la liste de diffusion Perl