Desde que hace ya casi dos años Diego iniciase su cruzada a favor de la codificación UTF-8 en la blogosfera, he estado tentado en varias ocasiones de acometer el cambio desde el iso-8859-1 con que configuré Mangas Verdes en WordPress. Desde entonces, también todo nuevo sitio que he abierto en la Red lo he hecho con codificiación Unicode (UTF-8), pero se me habían quedado relegados los más veteranos: Mangas Verdes, Proyecto Isla, Útil y ¡Gratis! y Cuando calienta el sol.
Así pues, unas veces por miedo y otras porque al intentarlo a la primera no salía, lo había ido postergando hasta que ahora, por fin, me decidí a emprender la conversión con todas sus consecuencias.
El problema era casi siempre el mismo, seguía los pasos indicados (gracias, Armonth):
1.- Bajarte una copia de la base de datos a tu disco duro.
2.- Hacer una copia de seguridad de la misma.
3.- Abrir una de las copias con UltraEdit.
4.- En ‘Archivos>Conversiones’ ejecutar ‘ASCII a UTF-8 (Unicode).
5.- Reemplazar la base de datos del servidor con la copia convertida.
Pero, nada. Por alguna extraña circunstancia, quizás achacable a alguna configuración del servidor, el blog no cambiaba lo más mínimo. Es decir, en apariencia la base de datos seguía codificada en iso-8859-1.
En esta ocasión volví a intentarlo, pero nada.
Probé también con un viejo truco que descubrí hace un tiempo cuando tuve que resolver un problema de cambio de servidor:
1.- Realizar una exportación de la base de datos al navegador (no a un archivo descargable).
2.- Una vez la visualizas en la pantalla, vas al menú ‘Ver>Codificación de caracteres’ (Firefox) y eliges la opción adecuada para la conversión que vayas a realizar.
3.- Cuando se refresque la página con la nueva codificación, copias el texto y lo insertas vía SQL en la base de datos (asegúrate de exportar con la opción ‘Drop Table’, para que te vaya borrando las antiguas tablas a medida que actualizas).
Pero en esta ocasión tampoco funcionaba.
Y así me he tirado las últimas 24 horas probando, inventando, en fin… hasta que, al final, casi accidentalmente se produjo el ‘milagro’. Me dio por abrir la copia de seguridad de la base de datos guardada en mi disco duro con el WordPad de toda la vida… y ¡voilá! allí estaba la tabla llena de caracteres raros, es decir, en codificación UTF-8.
Así que supuse que sólo tenía que copiar lo que me aparecía en el WordPad en el servidor vía SQL para llevar a cabo la conversión… ¡Y funcionó! Cutresalchichero, pero efectivo.
Algunos usuarios podrán haber visto a última hora de la tarde de ayer que el blog estaba hecho un ocho y probablemente se hayan sobresaltado. Para mí, sin embargo, era la mejor señal. Cambié el formato del WordPress a UTF-8, y todo perfecto. Eso sí, tuve que reinicializar algunos plugins que se vieron afectados por la conversión, y prescindir de uno de ellos, el wp2pdf (convierte los posts en documentos PDF). Afortunadamente, encontré un recambio perfecto en post2PDF, excelente trabajo de los amigos de Sentido Web, que aunque dispone de un surtido de fuentes limitado, cumple perfectamente con su función.
Y luego ya el gran curro de corregir todas las plantillas para sustituir todos los caracteres acentuados, aperturas de exclamación, interrogación, eñes y demás por su correspondiente código html.
Y ya está. Más contento que unas pascuas con este nuevo formato que, entre otras cosas, me permitirá a mí publicar más cómodamente y respetando más los estándares (algunos caracteres latinos provocan la no validación), y a los lectores de cualquier parte del planeta ver los caracteres sin extraños símbolos o ‘?’ de por medio. Eso, y mucho más. Pero para que tengas una visión más amplia te recomiendo el completo y apasionado alegato de minid.
13 comentarios
Ya te ha costado migrar ya… xD
Seguramente se me olvido decirtelo pero la exportación a UTF-8 no era el problema si no la importación a la BBDD: suele pasar que se intente vía phpMyAdmin y dé problemas… para eso nada mejor que subir el sql al FTP y desde SSH hacer un “mysql datos-conexion nombre-bbdd
Ejem… (eso de que se vea bien en el borrador pero no en el comentario):
“mysql datos-conexion nombre-bbdd < fichero-sql-en-utf8.sql”
Que honor que uses nuestro plugin. Sobre el tema de las fuentes, en el directorio fonts del plugin hay otro directorio que se llama ttf2ufm en el que hay una aplicacion para pasar cualquier TTF a formato que admite el plugin (bueno, con algunas da fallo). Hay un archivo README.TXT en el que explica cómo hacerlo.
Por cierto, que gracias a mirar cómo se hacía he encontrado otro fallo en el plugin que pasaré a corregir en breve.
Saludos
yo creo que bastaría con que cada uno declarase correctamente cuále es el juego de caracteres que usa 🙂
¿Qué tiene de malo el iso-8859-1?
En principio nada, pero luego te das cuenta de que todo se guarda en la BBDD en UTF-8 y al pasarlo a iso es menos óptimo, no puedes salirte del set prefijado (el día que te ves con la necesidad de usar carácteres que no están en el ascii/latin la cagaste) y un buen etcétera…
Además es mejor que todos tengamos un estándar universal que permita hacer de todo a no tener cada uno un estándar de su madre y su padre…
Estoy de acuerdo con Armonth, por experiencia propia se el infierno que es modificar la codificación de todo un proyecto a UTF8 porque un listo no tenía ni idea de qué era y luego ha sido necesario.
#Armonth, ya te digo si me ha costado. Pero gracias, otra vez 🙂
#Luis, el honor es mío. La escasez de plugins que cumplan esta función demuestra bien a las claras la dificultad de su programación. Así, que un 10. Sobre las fuentes, ufff… A ver si me pongo a ello 😉
#Fernando, desde luego que es una opción personal. A mí el iso siempre me fue bien, salvo a la hora de validar y de trabajar por ejemplo con hacks y plugins externos. Me obligaba a sustituir los caracteres ‘extraños’ en los titulares por código html si quería que validara y se viera bien en cualquier plataforma. Ahora, sin embargo, va todo como la seda y no tengo que preocuparme más que de escribir 🙂
Un saludo.
Hola Manuel!
Puede que no tenga que ver, pero te comento que desde el 25 de enero que mi Xcast (lector RSS de Mac) no actualiza mangasverdes…. Antes iba como la seda, y de hecho todos los otros urls no dan problemas….alguna variante en feedburner? Algun caracter por el camino?
Saludos y admiro tu valentía: hace tanto que lo tengo en el “todo list” de muchos de nuestros sitios….
Hola, Camilo. Pues es bastante extraño lo que comentas y, en todo caso, tendría más que ver con la actualización a WordPress 2.1 (que fue el 24 de enero) que con la conversión a UTF-8. He resincronizado el feed en FeedBurner por si había algo mal configurado. En mis lectores se actualiza sin problemas. Asegúrate de estar suscrito al feed correcto y, si es así, y siguen los problemas, prueba a borrarlo y darle de alta otra vez. Si continúan los problema, dímelo.
Un saludo.
¿Qué tiene de malo el iso-8859-1? eso digo yo
por otro lado, hablando de carácteres, me encantan esos cotejamientos “latin1”, nada mas sujestivo que el cotejamiento latino sabrosón y sandunguero
para colmo de lo curioso el latin por defecto es el “latin1_swedish_ci” que digo yo ¿que tendrán que ver los suecos con lo latino? pero no pasa nada bienvenidas tambien las suecas y los suecos al merengue latino que ¿no?
¿otra movida más tipo blog sin anuncios y similares?
Pues si, habra toleado mi Xcast con tanto feed que actualizar. Me acabo de pasar el Vienn (recomendadísimo!) y MV va como la seda. Saludos!
[…] tiempo leyendo Mangas Verdes ponía una posible solución a este tipo de “problema”. Revisando el sitio de WordPress encontré un útil plugin […]
[…] que utilizar la “solución cutresalchichera” que encontré en Mangas Verdes… menos mal que backupeo absolutamente todo… […]