vide en ligne depuis 02.10.1998

Convertir de l'UNICODE UTF-16 en UTF-8

convert

Voici une méthode rapide pour convertir des fichiers UTF-16 issus du monde Windows :

Utilisons la commande " file " pour glaner quelques informations concernant le fichier :

$ file le_fichier.txt

Ce qui nous donnes :

le_fichier.txt: Little-endian UTF-16 Unicode English text, with CRLF line terminators

Nous avons bien à faire à un fichier encodé en UTF-16 et nous allons le convertir en UTF-8 avec la commande " iconv " :

$ iconv -f UTF-16 -t UTF-8 -o fichier_de_sortie.txt le_fichier.txt

Si on ré-exécute " file " avec le fichier obtenu :

$ file fichier_de_sortie.txt

UTF-8 Unicode English text, with CRLF line terminators

Il est bien ré-encodé en UTF-8...