|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||
|
|
> Voyage dans la tour de Babel du net
9 mai 2003,
message de Banzaï
Et vous savez quoi ? Quand on laisse le champ libre aux américains, la première chose qu’ils font c’est se croire seuls sur terre (i.e. : comme ils n’ont pas d’accents - les pauvres - dans leur alphabet, forcément personne n’est censé en avoir => codage ASCII C.Q.F.D. !)
echo bouton_block_invisible("message460258");
?>
> Voyage dans la tour de Babel du net,
15 octobre 2006
Sa t’arrive de réfléchir a la base le net sa a été developper pour l’us army et en anglais pas d’accent donc la question ne saity même pas posé elle ne sait posé que quand le pc a fait sont apparition et qu’il est sortie hors des USA a grande echelle donc la ils ont essayé avec tout le monde de faire de tables mais c’est c’etait le bordel d’ou l’invention d’unicode et notamment d’utf-8 qui arrange tout sa. |
> Voyage dans la tour de Babel du net |
> Voyage dans la tour de Babel du net
14 septembre 2002,
message de Siva
[je comptais signaler une erreur pour l’orthographe du mot « Iliade » mais mes caractères Unicode ne passant pas, je suis forcé de les transmettre en tant qu’entités HTML ; je ne sais pas si cela marchera] Article intéressant, mais je pense que le mot « ???????? » est une erreur. En grec ancien, le poème d’Homère se nomme « ????? », ou « ??????? » au génitif, en capitales : « ????? / ??????? », en capitales et sans diacritiques : « ????? / ??????? ». De plus, je me permets de signaler l’existence du forum de discussion fr.comp.normes.unicode ainsi que celle de trois forums (peut-être bientôt un quatrième) qui, sur la hiérarchie francophone, acceptent des articles codés en utf-8 : – fr.lettres.langues-anciennes.grec ; Unicode est une norme très utile tout autant pour Internet qu’Usenet. Enfin, il est dommage que vous donniez comme exemple pour le vietnamien un texte rédigé dans une écriture qui n’a plus oficiellement cours, le « chu nom » (cf. ce document), composée de caractères d’origine chinoise. Le vietnamien s’écrit maintenant dans un alphabet latin très riche en diacritiques, dit « quoc ngu », pour lequel Unicode s’avère aussi très pratique (cf. ce document). Siva
echo bouton_block_invisible("message293698");
?>
Vietnamien,
Fil,
8 mars 2003
echo bouton_block_invisible("message423287");
?>
> Voyage dans la tour de Babel du net,
Laurent,
5 avril 2005
echo bouton_block_invisible("message466143");
?>
bridal,
bridal,
16 novembre 2006
|
> Voyage dans la tour de Babel du net
27 août 2002,
message de Priareos
Pour y a t-il 5 chiffres pour le mot tête ? D’après ce que j’ai compris c’est le chiffre hexa EA qui code ê. D’autre part si je veux écrire en cyrillique, ne serait-il pas plus économique de spécifier que le nombre hexa 400 doit être ajouté à tous les chiffres qui suivent, un peu comme une balise HTML ? Par exemple le chiffre 34 serait interprété comme étant 434 soit la 5ème lettre de l’alphabet cyrillique.
echo bouton_block_invisible("message466163");
?>
boxes,
boxes,
16 novembre 2006
|
> Problème de bit ?
echo bouton_block_invisible("message282696");
?>
> Problème de bit ?,
Cassé Hugues,
24 août 2002
echo bouton_block_invisible("message282700");
?>
> Ascii is fun,
jul,
24 août 2002
Il ya aussi un certain nombre de caratcère "non imprimable" dans les tables ascii. L’ascii était pour les télétypes (espèces de machines à écrire reliées par des lignes spécialisée au départ) des commandes spécifiques à faire. Par exemple il y a dans la table ascii : CR (Carriage Return) (0xD) retour du chariot en début de ligne (dégagement du ressort tenant le chariot) LF (Line Feed) (0xA) faire tourner le tambour de une ligne. Sous windows si vous regarder un fichier texte en héxadécimal, vous verrez en "fin de ligne" 0D0A. Sous unix seul LF est spécifié. J’aime l’archéologie informatique. On y voit souvent les travers de la croyance : on imprimera toujours sur des imprimantes texte, tout programme suffisamment bien fait tiendra dans 640Ko. Le standard se suffit à lui même et l’utilisateur n’a que peu son mot à dire.
echo bouton_block_invisible("message466111");
?>
gift,
gift,
16 novembre 2006
echo bouton_block_invisible("message459312");
?>
> Problème de bit ?,
9 juin 2005
echo bouton_block_invisible("message466178");
?>
personalized,
personalized,
17 novembre 2006
echo bouton_block_invisible("message466034");
?>
gamesandcasino,
gamesandcasino,
15 novembre 2006
|
> Voyage dans la tour de Babel du net
21 août 2002,
message de Erwan
Bonjour, français au Japon je suis bien au fait de ces problèmes... Cela dit ça se résoud très bien sous Windows supérieur à 2000 ou sous Linux (configurer plusieurs méthodes de saisie étant un peu plus dur sur ce dernier). En effet, il existe trois encodages pour le japonais : ISO, sjis (au depart sous Windows) et euc-jp (au depart sous Unix). Concernant l’unicode, les japonais ne l’aiment pas. D’une part parcequ’il manque de compacité (ce qui est un peu inévitable quand on veut coder tous les langages) mais surtout parce qu’il code de la même façon le chinois et le japonais. Les Japonais ont importé les caractères chinois il y a environ 1000 an, mais ceux-ci ont évolué dans les deux pays. Maintenant la façon de les écrire est un peu différente. Selon les auteurs d’unicode, on code les caractères mais pas les glyphes : c’est le rôle des polices de caractère. Conclusion : si vous voulez mélanger japonais et chinois dans un texte, vous devrez choisir le "style" japonais ou le "style" chinois pour l’afficher. De plus le navigateur ne peut pas savoir s’il s’agit de chinois ou de japonais. Ca s’affiche alors a la japonaise sur les ordinateurs japonais et a la chinoise sur les ordinateurs chinois... Pour répondre à cela un professeur de l’université de Tokyo a créé un OS (utilisé surtout dans les téléphones portable) avec son propre système d’encodage qui code absolument tous les caractères existant mais aussi ayant existé. en ligne : TRON
echo bouton_block_invisible("message282615");
?>
> Voyage dans la tour de Babel du net,
Trajan,
22 août 2002
echo bouton_block_invisible("message282653");
?>
Pr. Ken Sakamura,
Erwan,
23 août 2002
echo bouton_block_invisible("message466064");
?>
hall,
hall,
16 novembre 2006
echo bouton_block_invisible("message282697");
?>
> Voyage dans la tour de Babel du net,
Jefferson,
24 août 2002
Je me permet d’émettre cette petite remarque.
echo bouton_block_invisible("message282703");
?>
Encore une misconception sur XML/ erreur introduite par MS,
jul,
24 août 2002
XML décrit des données, et les encapsule dans des méta-données. XML ne fait rien d’autre que décrire. L’internationalisation que ne résous pas le XML. Il faut un standard qui pré-existe. Si il spécifie qu’il faut une fonte il y a intérêt à ce que la donnée soit compréhensible éxemple livre sterling => £ Cette association pour exister nécessite que tout le monde soit d’accord sur la table d’association symbole => glyphe (représentation graphique) Et cela s’appelle un standard. Par exemple ISO 8859-15 décrit les fontes européennes avec le symbole euro. Le rédacteur à raison. Il faut respecter des normes et c’est suffisant. Et même si dans le logiciel libre nous avons une image de "farfelus" nous respectons les normes les plus strictes au pied de la lettre, c’est ce qui fait que mon fureteur affiche toutes les pages webs du monde sans coup férir. Sauf celle sous windows mal faites. En effet quand vous faites "sauver sous HTML" sous windows il ne respecte pas les standards (donc on voit des ? à la place des guillemets apostrophes ou autres). C’est très bien expliqué dans le lien. Bref, la sérieuse société miscrosoft code l’internationalistaion de manière farfelus, les dilettantes du logiciel libre les codes de manières strictes.
echo bouton_block_invisible("message283013");
?>
ouh les méchants MS, oh la la...,
le corbeau ,
31 août 2002
echo bouton_block_invisible("message283097");
?>
> ouh les méchants MS, oh la la...,
jul,
1er septembre 2002
L’argument n’est pas bon parce qu’il y a une faute d’ortografe ? MS n’est pas méchant, MS n’est juste pas rigoureux, leur service qualité ne doit pas être ISO-9000. Sinon, je suis sûr qu’ils sont de bons bougres. Je ne suis pas un anti microsoft, j’aime juste un peu plus les personnes qui font leurs oeuvres rigoureusement.
echo bouton_block_invisible("message283108");
?>
> ouh les méchants MS, oh la la...,
2 septembre 2002
Hum, je ne pense pas que ce soit un manque de rigueur de leur part. C’est juste qu’implementer les standards ca ne les arrange pas. Ce n’est pas propre a MS mais a la grande majorite des entreprises d’informatique : la division des Unix dans les annees 70 a ete un bon exemple de non-respect (volontaire) des standards. Pas besoin de MS pour ca.
echo bouton_block_invisible("message466091");
?>
idea,
idea,
16 novembre 2006
echo bouton_block_invisible("message283915");
?>
> Voyage dans la tour de Babel du net,
Jean-Marc,
18 septembre 2002
Salut, Erwann Ton message décrit bien ce que certains japonais reprochent à unicode, mais passe à coté des raisons pour lesquelles c’est injuste et délirant. Il est vrai que unicode pose cette difficulté quand on veut mélanger japonais et chinois dans un même texte, mais comment cela se passe-t-il si on utilise un des encodages japonais ou chinois courants à la place pour ce texte ? Eh bien, non seulement on a le même problème, mais en fait la majorité des caractères chinois ne seront tout simplement pas représentables en sjis. Avec 20 000 caractères chinois de base dans unicode, il est même beaucoup plus probable d’arriver à y représenter un caractère rare qu’en sjis ou même big-5. Et cela, c’est sans compter avec l’extension récente de 40 000 caractères suplémentaires. Il est vrai que si l’on parle par exemple de deux sites web différents l’un en chinois et l’autre en japonais le problème est d’actulité en théorie. Il reste qu’unicode se concentre sur l’aspect sémantique d’un caractère, et pas sur le fait de coder chaque différence d’aspect par un caractère différent, ce qui est délibérément et définitivement délégué au niveau du choix de la police utilisée pour l’affichage. Mais ce type de site répond à un besoin de spécialistes et pas à celui d’échanger des données sous une forme correctement standardisée et sera disponibles par avance sur l’ordinateur du destinataire. Quand a l’inconvénient de compacité, elle oublie un peu vite que c’est surtout dû à des choix par lesquels unicode simplifie énormément la manipulation des chaînes par rapport aux autres encodages. La forme sur deux octets compense l’inconvenient de représenter l’ASCII sur deux octets par la simplicité d’une longueur fixe, et la forme a longueur variable doit le fait qu’elle représente les caractères chinois sur trois octet au lieu de deux, a des propriété de synchronisation garantie extrêmement utiles dans les déplacement et les recherches de texte. |