[Perl] utf8 et lettre à

Laurent Rosenfeld laurent.rosenfeld at googlemail.com
Jeu 15 Sep 14:06:14 CEST 2016


Bonjour,

pas trop le temps de me pencher là-dessus tout de suite, mais voici un lien
qui peut aider:

http://perl.developpez.com/tutoriels/perl/intelligible-guide-perl5/

Cordialement, Laurent.

Le 15 septembre 2016 à 13:27, Dominique Asselineau <
asseline at telecom-paristech.fr> a écrit :

> Bonjour,
>
> Les 2 lignes suivantes sont-elles présentes dans les déclarations :
>
> use utf8;
> use feature 'unicode_strings';
>
> Dominique
>
> minc wrote on Thu, Sep 15, 2016 at 01:17:23PM +0200
> > Bonjour,
> >
> > J’extraie des mots d'un dictionnaire en xml avec la regex
> >
> > suivante  :  my $extract=qr{<orthography>\s*(?<word>.*?)\s*</orthography>}
> ;
> >
> > les résultats sont correctes sauf pour les mots se terminant par 'à' tel
> que
> > "déjà" ou j'obtiens
> >
> > "déj\xC3" sachant que 'à' en utf8 est la suite 'C3 A0'.
> >
> > Les autres caractères accentués ne me semble pas poser de problème.
> >
> > Le résultat est corrigé avec :
> >
> >     my $extract=qr{<orthography>(?<word>.*?)</orthography>} ;
> >
> > Quelle hypothèse peut-on formuler pour expliquer cette "troncation" ?
> >
> > Merci.
> >
> > Charles
> >
>
> > begin:vcard
> > note;quoted-printable:Put your hand on a hot stove for a minute, and it
> seems like an hour. Sit=
> >        with a pretty girl for an hour, and it seems like a minute.
> That's relat=
> >       ivity.=0D=0A=
> >       (A. Einstein)
> > version:2.1
> > end:vcard
> >
>
> > _______________________________________________
> > Perl mailing list
> > Perl at mongueurs.net
> > http://listes.mongueurs.net/mailman/listinfo/perl
>
>
> --
> _______________________________________________
> Perl mailing list
> Perl at mongueurs.net
> http://listes.mongueurs.net/mailman/listinfo/perl
>
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://listes.mongueurs.net/mailman/private/perl/attachments/20160915/ddcb8a17/attachment.html>


Plus d'informations sur la liste de diffusion Perl