Léa-Linux & amis :   LinuxFR   GCU-Squad   GNU
Aidez moi à trouver
Envoyé par: otari

Bonjour,

je cherche et n' arrive pas à trouver le "unicode chart for norvegien".

Ne pouviez vous pas m'indiquez où pouvais-je le trouver?

Merci d'avance.



Poste le Saturday 28 April 2007 15:12:21
Répondre     Citer    
Re: Aidez moi à trouver

Google sur unicode chart for norwegian (attention à l'orthographe anglaise de norwegian) donne immédiatement des résultats pertinents dont ceci

Tu n'as donc pas dû chercher plus d'une minute....

----

Basile STARYNKEVITCH

Membre de l'APRIL « promouvoir et défendre le logiciel libre » - adhérez vous aussi à l'APRIL!

Projet logiciel libre: RefPerSys

Poste le Saturday 28 April 2007 15:18:36
Répondre     Citer    
Re: Aidez moi à trouver
Envoyé par: otari

Et bien, je cherchais pendant tout la journée et je tombais toujours sur ce document, mais quand j' utilisait ses paramettres dans mon programme il ne marchais pas. C' est pourquoi que je doutais d' avoir trouvé un bon document car le programme marche bien avec des autres langues. Le programme cherchela statistique de frequence des lettres dans telleoutelle langue.

Poste le Saturday 28 April 2007 15:40:21
Répondre     Citer    
Re: Aidez moi à trouver

Que fait ton programme? L'encodage des caractères Unicode sous Linux est compliqué (UTF8, UTF16 et tout ça).

Tu pourrais t'appuyer sur une librarie facilitant Unicode. Commences par lire attentivement le Unicode HOWTO

Dans quel langage codes tu?

----

Basile STARYNKEVITCH

Membre de l'APRIL « promouvoir et défendre le logiciel libre » - adhérez vous aussi à l'APRIL!

Projet logiciel libre: RefPerSys

Poste le Saturday 28 April 2007 15:50:08
Répondre     Citer    
Re: Aidez moi à trouver
Envoyé par: otari

J'écris mon programme en C. Il fait l' analyse statistique de frequences des lettres(fait le pourcentage pour chaque lettre) dans des differentes langue.
À l' entrée standart on passe le fichier.txt en argument.
Les parametres se changent en fonction en quelle langue est redigé le texte de ce fichier.txt.
Le programme renvoit une liste des lettres avec les pourcents convenables.

Poste le Saturday 28 April 2007 16:10:17
Répondre     Citer    
Re: Aidez moi à trouver

Citation
otari
J'écris mon programme en C.

Il te faut alors probablement utiliser des caractères larges wchar_t et convertir l'entrée (en caractères encodés, probablement UTF8). Peut-être que des libraries comme iconv (dans un GNU libc récente) te seraient utiles.

Il me semble que certaines libraries en C++ facilitent la chose. En particulier, QT4 et FOX ont de quoi traiter Unicode. En C, la GLIB (contenue dans GTK) a des fonctions pour manipuler Unicode. (rappel: on peut, même si c'est inhabituel, utiliser QT ou GTK en dehors d'une application graphique).

Dans le détail, c'est compliqué et technique. Il te faut donc passer du temps à lire la documentation.

En particulier, en encodage UTF8, un caractère (glyphe) a une largeur variable (1 à 3 ou 4 octets) et la lecture du flot (conversion d'UTF8 vers Unicode wchar_t) est à états.

Bon courage, car c'est probablement plus compliqué que tu ne le crois (car Unicode est complexe).

----

Basile STARYNKEVITCH

Membre de l'APRIL « promouvoir et défendre le logiciel libre » - adhérez vous aussi à l'APRIL!

Projet logiciel libre: RefPerSys

Poste le Saturday 28 April 2007 17:26:58
Répondre     Citer    
Re: Aidez moi à trouver
Envoyé par: nicola

J’ai codé un petit truc en C tout bête, et l’usage d’utf8 dans les printf du code passe sans problème.

--
On ne prête qu’aux riches, et on a bien raison, parce que les autres remboursent difficilement.
-+- Tristan Bernard (1866-1947) -+-

Poste le Saturday 28 April 2007 17:28:28
Répondre     Citer    
Re: Aidez moi à trouver

Citation
nicola
J’ai codé un petit truc en C tout bête, et l’usage d’utf8 dans les printf du code passe sans problème.

En règle générale, produire une sortie est plus simple qu'analyser une entrée.

En l'espèce, l'UTF8 dans ton format de printf a été encodé par l'éditeur de ton programme C (par exemple emacs). Donc évidemment, tout marche bien. Et ce n'est même pas ton programme qui a fait l'encodage....

Mais pour lire de l'UTF8 et y distinguer les caractères norvégiens des accents thaïlandais, tu dois analyser le flot UTF8 (dont l'encodage est à longueur variable).


----

Basile STARYNKEVITCH

Membre de l'APRIL « promouvoir et défendre le logiciel libre » - adhérez vous aussi à l'APRIL!

Projet logiciel libre: RefPerSys

Poste le Saturday 28 April 2007 17:51:37
Répondre     Citer    

Veuillez vous authentifier auparavant pour commenter.

 

Ce forum !
Aidez moi à trouver
Posez dans ce forum les questions qui ne trouvent pas place dans les autres...

Sauf mention contraire, les documentations publiées sont sous licence Creative-Commons