[Perl] Conversion Unicode vers LaTeX

Paul Gaborit paul.gaborit at gmail.com
Mar 30 Aou 07:43:19 CEST 2016


Le 29/08/2016 à 22:27, Dominique Asselineau a écrit :
> Philippe Delavalade wrote on Mon, Aug 29, 2016 at 08:22:46PM +0200
>> Salut.
>>
>> Pourquoi ne pas mettre tout bêtement dans ton préambule LaTeX
>> \usepackage[utf8]{inputenc} ?
>
> Tout simplement parce que je ne maîtrise pas le contexte dans lequel
> le code produit va être utilisé.  Il s'agit d'un serveur de
> bibliographie qui permet entre autres l'export en BibTeX.  Ensuite les
> opérateurs, humains ou d'autres machines, exploitent le résultat dans
> leur environnement propre.  Je vais en effet ajouter une option pour
> permettre l'export en UTF-8 mais en standard, ce devrait être encodé
> avec les séquences LaTeX qui passent quel que soit l'encodage cible.

Ça marchera... avec le risque de produire des caractères UTF-8 non 
reconnus par le moteur TeX (certains packages augmentent le nombre de 
caractères reconnus mais aucun ne les définit tous - même en supposant 
l'utilisation d'une police qui les propose). Pour en savoir plus, il 
faut lire la documentation du package (LaTeX) 'inputenc' et en 
particulier la section "1.2 UTF-8 encoding support" p.3.

À terme, c'est effectivement la solution la plus universelle... qui 
oblige tout de même l'utilisation d'outils LaTeX modernes (biber et non 
pas bibtex).

>>
>> De plus, \'e{} ou \cc{} devraient te donner malgré tout un é ou un ç.
>
> Visiblement non.  Dès que j'ai mis ma nouvelle version en production,
> les réclamations n'ont pas tardé à arriver.  Peut-être que ça
> fonctionne dans un environnement LaTeX particulier mais pas avec
> \usepackage[francais]{babel}.

Pourtant l'approche de TeX::Encode (un encodage en pur ASCII) me semble 
meilleure pour tous ceux qui ne maîtrisent pas encore ou ne peuvent pas 
utiliser l'UTF-8 en LaTeX puisque le module signale (par un warning) les 
caractères qu'il ne sait pas encoder. Mais ce module semble produire des 
séquences erronées : le "\'e{}" fonctionne correctement (partout) mais 
le "\cc{}" devrait être "\c{c}" ou "\c c{}".


-- 
     Paul Gaborit


Plus d'informations sur la liste de diffusion Perl