Recientemente (bueno, vale, hace tres meses ya...) el W3C ha publicado un interesante documento sobre internacionalización,
Character Model for the World Wide Web 1.0: Fundamentals, el primero de una serie de tres.
En éste se detallan algunos principios básicos acerca de la representación de caracteres en diferentes idiomas, de cómo se perciben y como se intentan representar en el mundo digital, y los problemillas que ello acarrea.
Es un artículo muy teórico y con muchos conceptos, y aunque aún no lo he leído del todo (vale que uno tenga una vida social escasa, pero de ahí a pasar la tarde del domingo leyendo especificaciones del W3C va un trecho) me ha parecido muy interesante.
Los otros dos documentos de la serie, aún en desarrollo, son (copio y pego) "
Modelo de Caracteres para la World Wide Web 1.0: Normalización, que especifica la normalización uniforme temprana y la similitud de entidad de cadena para la manipulación de texto, y
Modelo de Caracteres para la World Wide Web 1.0: Identificadores de Recurso, que especifica convenciones IRI."