Red de conocimiento de divisas - Preguntas y respuestas sobre Forex - Herramientas o páginas web que convierten kanji japonés a kanji chino

Herramientas o páginas web que convierten kanji japonés a kanji chino

¿El sitio web existente está codificado en GB2312? ¿Está emocionado de ver las ventajas de la codificación UTF-8? Este artículo le enseña cómo convertir un sitio web de GB2312 a UTF-8.

GB2312 es la codificación de chino simplificado, por lo que cuando los artículos/páginas web contienen chino tradicional, japonés y coreano, es posible que estos contenidos no estén codificados correctamente.

Existe una codificación un poco más amplia que la codificación GB2312, que es GBK. Incluye codificación para chino tradicional, pero todavía hay problemas con idiomas con alfabetos no latinos en otros países.

La codificación UTF-8 es una codificación muy utilizada actualmente en páginas web. En realidad, es una codificación Unicode, que se dedica a integrar todos los idiomas del mundo en una codificación unificada. En la actualidad, UTF-8 ha incluido varios idiomas asiáticos importantes, incluidos el chino tradicional y simplificado, y los caracteres japoneses y coreanos. En cierto sentido, las páginas web que utilizan codificación UTF-8 están "en línea con los estándares internacionales". Además, muchos terminales de teléfonos móviles utilizan codificación UTF-8. Si un sitio web considera desarrollar una interfaz WAP y los datos del sitio web en sí están codificados en UTF-8, se elimina el problema de transcodificación al desarrollar una interfaz WAP.

¿Los sitios web existentes están codificados en GB2312? ¿Estás emocionado de ver la codificación UTF-8? Este artículo le enseña cómo convertir un sitio web de GB2312 a UTF-8.

Antes de realizar la conversión, debes considerar si es necesario transcodificar el sitio web. Proporciono algunos puntos como referencia:

1. ¿Está el sitio web dirigido a un pequeño círculo de personas, China continental, toda China, incluidos Hong Kong, Macao y Taiwán, o incluso el mundo?

2. En la codificación GB2312, un carácter chino ocupa 2 bytes, pero en UTF-8, un carácter chino ocupa 3 bytes. ¿Vale la pena el costo de este aumento de espacio?

3. Es posible que los sistemas de bases de datos antiguos (como mysql 4.0 y versiones anteriores) no tengan soporte integrado para UTF-8. Aunque este artículo tiene una solución, no descarta que todavía existan algunas. posibles problemas menores.

4. ¿Es fácil editar archivos de páginas web después de convertirlos a codificación UTF-8? Actualmente uso ZDE4 y, después de configurarlo, admite muy bien la codificación UTF-8. El método de configuración es hacer clic en la pestaña Edición en el menú Herramientas->Preferencias y cambiar la Codificación a UTF-8.

Una vez que haya considerado la decisión de transcodificar, puede comenzar. Este artículo solo toma PHP 4.0~5.0 + MySQL 3.23~4.0 como ejemplo.

Primero, cree una nueva base de datos y la estructura de tabla correspondiente para que la base de datos se transcodifique para almacenar los resultados de la transcodificación. Si opera en un sistema de base de datos que no tiene soporte integrado para UTF-8, se recomienda cambiar los campos CHAR, VARCHAR y TEXT utilizados para almacenar chino a BINARY, VARBINARY y BLOB respectivamente. Aunque lo he intentado. y no hay problema sin cambiarlo.

Luego ejecute el siguiente comando en la línea de comando del sistema operativo para exportar la base de datos original (reemplace {dbname} con el nombre de la base de datos, reemplace {path1} con una ruta temporal existente y los datos exportados se almacenarán aquí):

mysqldump --opt --comments=0 -n -t --fields-terminate-by=, --fields-escaped-by=\ {dbname} -uroot -p - - tab={path1}

La raíz del usuario en el comando anterior también se puede cambiar a otro usuario, pero debe asegurarse de tener permiso de volcado. Utilice una herramienta de transcodificación, como ConvertZ, para convertir todos los archivos en la {ruta1} anterior a codificación UTF-8. Tenga cuidado de desactivar la opción BOM. Supongamos que el archivo transcodificado se guarda en la ruta {ruta2}.

Conéctese al servidor MySQL como usuario con permisos LOAD DATA, use el comando use para seleccionar la base de datos recién creada y luego ejecute el siguiente comando para cada tabla {table_name}:

CARGAR ARCHIVO DE DATOS ' {ruta2}{nombre_tabla}.txt' EN LA TABLA {nombre_tabla} CAMPOS TERMINADOS POR ',' ESCAPADO POR '\';

Consejo: Cuando hay muchas tablas, puedes escribir una Pequeño programa para generar un script SQL.

Es posible que aparezcan advertencias al ejecutar el comando anterior. Preste atención a las filas de advertencia. Es posible que algunos datos no se conviertan correctamente, como campos desalineados.

Según la experiencia, esta situación se debe principalmente a que el código hexadecimal del byte al final de los datos es mayor que 7F. Por lo general, el número de estas líneas es relativamente pequeño y se pueden corregir manualmente.

En este punto, se completa la transcodificación de la base de datos. La limpieza de los archivos temporales de la base de datos original y el proceso de transcodificación no se describirán en detalle aquí.

Convertir páginas web: utilice también la herramienta de transcodificación para convertir todas las páginas web del sitio web a codificación UTF-8.

Luego abra el archivo de página web/archivo de plantilla de página web que contiene el encabezado y reemplace esta línea:

con esto:

Según mi experiencia, si la página web Utilice la hoja de estilo CSS para controlar el estilo de la página web. Si la fuente está configurada en la etiqueta del cuerpo de CSS, entonces, bajo la codificación gb2312 original, la configuración de fuente se puede heredar en intput y textarea, pero después de convertirla a utf-8. , debe configurarse en entrada y área de texto. Restablezca la fuente en la etiqueta del área de texto.

上篇: ¿Cuáles son las principales acciones de gestión térmica de vehículos de nueva energía? 下篇: Ensayos | Notas de viaje sobre Nanhu
Artículos populares