Archive marquée par ‘howto’
Comment remplacer les caract√®res bizzares dans WordPress lorsqu’on a mal fait la conversion
Accrocheur mon titre n’est-ce pas? Je trouve ça tellement pas drôle lorsque ça m’arrive ce genre de situation avec les caractères accentués. Le problème n’arrive pas tout le temps qu’avec WordPress.
Voici, enfin, une suite a mon billet Pourquoi tout ces caractères bizzares. Je devais travailler sur un problème de conversion de caractères pour un client dus a une conversion non réussie et/ou terminée entre latin1 et utf-8 puis je me suis remis a penser a ce problème. Pourquoi ne pas le régler, et documenter!
Voilà pourquoi ce billet
La situation
Mon cas était bien simple. J’avait mal fait ma sauvegarde lors d’un transfert et j’avait tout mes commentaires, billets, et autres données qui avait des accents “transform√©s comme √áa” (transformés comme ça).
Ce genre de problème arrive pour toutes sortes de raisons. Mais le symptôme est le même. Si vous avez des
Je partage avec vous mon bout de code a «copier-coller» dans phpmyadmin pour votre blogue WordPress si vous avez ces problèmes (oubliez-pas de faire des sauvegardes là(!)).
Plusieurs tutoriels existent pour régler la situation mais mon cas était assez unique. J’ai conservé le problème puis j’ai publié plusieurs billets (qui sortent bien) et laissé ceux “ab√Æm√©s” là. Il n’était plus question d’extraire, convertir et ré-importer.
Pourquoi?!
C’est une réponse assez complexe. L’article UTF-8 sur TikiWiki.org l’explique en détail.
In short, UTF-8 is a character encoding that uses 1 to 3 bytes for each character.
It is one of the existing character encodings of the UCS (Universal Character Set), that contains nearly a hundred thousand abstract characters (including ASCII characters).UTF-8 greatly simplifies the task of internationalization by replacing multiple alternative encodings (such as ISO8859-15 Latin-9, which encodes those English, French, German, Spanish and Portuguese characters not available in ASCII).
En simple, le UTF-8 est un format d’encodage qui utilise 1 a 3 bytes pour chaque caractère. C’est un format d’encodage qui comprend près de plusieurs centaines de milliers de caractères (Incluant ceux du ASCII).
UTF-8 est fait pour contenir tout les caractères existants pour simplifier l’internationalisation.
C’est un standard qui est pas nécessairement jeune mais qui n’était pas non plus supporté partout.
MySQL a commencé a le supporter qu’a partir de la version 4.1.
Ce qui arrive c’est qu’avec le temps, les gens prennent de plus en plus soin de rendre accessible pour toutes les langues leur applications. Ainsi un russe pourrait écrire en cyrillic et un Japonais en Kanji dans la même base de donnée. Le coup est difficile! Surtout que les versions de MySQL et PHP et Java offrent maintenant le choix par défaut en UTF-8… lorsqu’on fait pas attention: on se fait coincer!
Installer PHP 5.3.1 sous Debian et/ou Ubuntu via un repository non officiel
J’était, hier, en train de jouer avec des appels SOAP pour préparer un projet et j’ai réalisé que ma version compilée de php 5.3.0 était défectueuse.
Je dis que mon installation est défectueuse car lorsque j’instantiait $client = new Zend_Soap_Client; plus rien ne répondait. Même aller en error_reporting(E_ALL); et tout ce qui est imaginable. C’est après quelques heures a tourner en rond je me suis dit que si même $client = new SoapClient; avec un résultat du genre “Class does not exists”. C’est le PHP… pas le code ou le Framework. Pas de doute.
J’ai donc pensé recompiler la dernière version PHP 5.3.1 qui est considérée stable… quant à recompiler, autant mettre à jour sur la dernière version!
Ce billet vous permettra d’installer la version stable PHP 5.3.1 a partir d’un repository déjà configuré au lieu de le compiler.



