[Index Software] Coin des développeurs :]
-
- Intarissable
- Messages : 7750
- Enregistré le : dimanche 19 mai 2013 à 12:03
- Localisation : En haut à gauche
Re: Coin des développeurs :]
Non, moi j'y connais rien !
Peut-être faudrait-il préciser quand même le langage de l'API que tu recherches, non ?
Peut-être faudrait-il préciser quand même le langage de l'API que tu recherches, non ?
TSA, diagnostic établi à mes 33 ans par le CRA de ma région.
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"
-
- Modérateur
- Messages : 41271
- Enregistré le : jeudi 15 novembre 2012 à 0:13
- Localisation : Nord-44
Re: Coin des développeurs :]
Pas forcément ...Bubu a écrit :Peut-être faudrait-il préciser quand même le langage de l'API que tu recherches, non ?
Mon questionnement de fond concerne le codage des
chaines de caractères, particulièrement en Unicode,
dans les APIs des systèmes d'exploitations (ce qui,
je l'espère, est à peu près normalisé dans les APIs) ...
Quelqu'un habitué à utiliser ces APIs me ferait gagner
du temps. De ce que j'ai pu voir dans mes premières
recherches, Linux gère ses chaines en UTF8, tandis
que Windows les gère en UTF16 (little endian ?) ...
Ça reste à confirmer. Mais ça s'annonce sportif pour
faire évoluer une vieille bibliothèque de chaines à
l'ancienne en version Unicode bi-plateforme ...
TCS = trouble de la communication sociale (24/09/2014).
-
- Intarissable
- Messages : 7750
- Enregistré le : dimanche 19 mai 2013 à 12:03
- Localisation : En haut à gauche
Re: Coin des développeurs :]
Eh bien malheureusement, ce ne sera pas moi.Tugdual a écrit : Quelqu'un habitué à utiliser ces APIs me ferait gagner
du temps.
TSA, diagnostic établi à mes 33 ans par le CRA de ma région.
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"
-
- Modérateur
- Messages : 41271
- Enregistré le : jeudi 15 novembre 2012 à 0:13
- Localisation : Nord-44
-
- Intarissable
- Messages : 7750
- Enregistré le : dimanche 19 mai 2013 à 12:03
- Localisation : En haut à gauche
Re: Coin des développeurs :]
Tip of the day :
le type 'char' en C et C++ est codé sur un octet, 8 bits.
le type 'char' en Java est codé sur 2 octets, 16 bits.
Bref....
Vous savez ce qu'il y a de pire quand on programme pour Android ?
Non, ce n'est pas le fait que les tailles d'écrans sont arbitraires. (C'est embêtant mais on exprime tout en rapports de tailles d'écran, c'est tout. )
Même pas le fait qu'il y a un nombre incalculable de 'périphériques'.
C'est d'utiliser Android Studio ! Je n'avais encore jamais vu un IDE qui rame tant.
Sinon.... j'ai une vraie question :
Connaissez vous un format de fichier que Java peut lire en mode texte qui puisse représenter tout texte, de toute langue ? (Même hors de notre alphabet latin)
le type 'char' en C et C++ est codé sur un octet, 8 bits.
le type 'char' en Java est codé sur 2 octets, 16 bits.
Bref....
Vous savez ce qu'il y a de pire quand on programme pour Android ?
Non, ce n'est pas le fait que les tailles d'écrans sont arbitraires. (C'est embêtant mais on exprime tout en rapports de tailles d'écran, c'est tout. )
Même pas le fait qu'il y a un nombre incalculable de 'périphériques'.
C'est d'utiliser Android Studio ! Je n'avais encore jamais vu un IDE qui rame tant.
Sinon.... j'ai une vraie question :
Connaissez vous un format de fichier que Java peut lire en mode texte qui puisse représenter tout texte, de toute langue ? (Même hors de notre alphabet latin)
TSA, diagnostic établi à mes 33 ans par le CRA de ma région.
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"
-
- Intarissable
- Messages : 8889
- Enregistré le : lundi 28 septembre 2009 à 13:55
- Localisation : オルセー
Re: Coin des développeurs :]
Je ne pratique pas ce langage. En général la sélection de l'encodage de caractère appliqué à un programme est gérable par la modification des propriétés régionales, en tout cas c'est comme ça qu'on fait chez les gens sérieux.
Identifié Aspie (広島, 08/10/31) Diagnostiqué (CRA MP 2009/12/18)
話したい誰かがいるってしあわせだ
Être Aspie, c'est soit une mauvaise herbe à éradiquer, soit une plante médicinale à qui il faut permettre de fleurir et essaimer.
話したい誰かがいるってしあわせだ
Être Aspie, c'est soit une mauvaise herbe à éradiquer, soit une plante médicinale à qui il faut permettre de fleurir et essaimer.
-
- Intarissable
- Messages : 7750
- Enregistré le : dimanche 19 mai 2013 à 12:03
- Localisation : En haut à gauche
Re: Coin des développeurs :]
Merci pour ta réponse. Disons que je ne suis pas sérieux, alors.
Pour l'instant j'ai un fichier utf8 qui contient le français, l'anglais et l'espagnol.
Je veux juste connaître un codage de caractères qui puisse représenter toutes les langues.
(Je me dis que ça existe car les 'char' en Java sont sur 16 bits .... plus de 65.000 caractères codables)
Pour l'instant j'ai un fichier utf8 qui contient le français, l'anglais et l'espagnol.
Je veux juste connaître un codage de caractères qui puisse représenter toutes les langues.
(Je me dis que ça existe car les 'char' en Java sont sur 16 bits .... plus de 65.000 caractères codables)
TSA, diagnostic établi à mes 33 ans par le CRA de ma région.
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"
-
- Prolifique
- Messages : 4667
- Enregistré le : jeudi 20 mars 2014 à 20:59
- Localisation : 92
Re: Coin des développeurs :]
Je n'ai pas de diagnostic /!\
Ce que tu as la force d'être, tu as aussi le droit de l'être - Max Stirner
Ce que tu as la force d'être, tu as aussi le droit de l'être - Max Stirner
-
- Intarissable
- Messages : 7750
- Enregistré le : dimanche 19 mai 2013 à 12:03
- Localisation : En haut à gauche
Re: Coin des développeurs :]
Oui , je crois que c'est ça que je cherchais ! Merci !
TSA, diagnostic établi à mes 33 ans par le CRA de ma région.
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"
-
- Intarissable
- Messages : 8889
- Enregistré le : lundi 28 septembre 2009 à 13:55
- Localisation : オルセー
Re: Coin des développeurs :]
Il me semble qu'une appli unicode charge en memoire beaucoup trop de trucs pour un usage simple (si 2 bytes suffisent)
C'est encore pire pour les langues basees sur les ideogrammes mais qui n'en exploitent pas un quart.
Ceci dit, il y a peut etre des optimisations.
C'est encore pire pour les langues basees sur les ideogrammes mais qui n'en exploitent pas un quart.
Ceci dit, il y a peut etre des optimisations.
Identifié Aspie (広島, 08/10/31) Diagnostiqué (CRA MP 2009/12/18)
話したい誰かがいるってしあわせだ
Être Aspie, c'est soit une mauvaise herbe à éradiquer, soit une plante médicinale à qui il faut permettre de fleurir et essaimer.
話したい誰かがいるってしあわせだ
Être Aspie, c'est soit une mauvaise herbe à éradiquer, soit une plante médicinale à qui il faut permettre de fleurir et essaimer.
-
- Modérateur
- Messages : 41271
- Enregistré le : jeudi 15 novembre 2012 à 0:13
- Localisation : Nord-44
Re: Coin des développeurs :]
Les normes UTF-8, UTF-16 et UTF-32 se contentent
d'encoder de l'UNICODE (basé sur l'ISO-10646), et
permettent de prendre en compte 0x110000 caractères
(17 plans de 16 bits), soit tous les caractères possibles.
Donc attention : tout caractère ne tient pas sur 16 bits,
puisque certains peuvent être codés sur jusqu'à 20+1 bits.
De plus, ces normes ne codent pas les caractères, mais
des "points de code", qui peuvent représenter aussi bien
des caractères que des morceaux de caractères, voire des
informations non affichables (par exemple la ligature).
Un caractère affichable (genre caractère accentué)
peut en outre avoir plusieurs codages possibles,
ce qui complique les comparaisons et les tris ...
Pour y remédier, la norme UNICODE propose
plusieurs formes de normalisation de ces codages ...
Enfin, les polices de caractères gèrent très rarement
tous les points de codes définis dans ces normes ...
Bref, la gestion de chaines n'est plus si simple ...
d'encoder de l'UNICODE (basé sur l'ISO-10646), et
permettent de prendre en compte 0x110000 caractères
(17 plans de 16 bits), soit tous les caractères possibles.
Donc attention : tout caractère ne tient pas sur 16 bits,
puisque certains peuvent être codés sur jusqu'à 20+1 bits.
De plus, ces normes ne codent pas les caractères, mais
des "points de code", qui peuvent représenter aussi bien
des caractères que des morceaux de caractères, voire des
informations non affichables (par exemple la ligature).
Un caractère affichable (genre caractère accentué)
peut en outre avoir plusieurs codages possibles,
ce qui complique les comparaisons et les tris ...
Pour y remédier, la norme UNICODE propose
plusieurs formes de normalisation de ces codages ...
Enfin, les polices de caractères gèrent très rarement
tous les points de codes définis dans ces normes ...
Bref, la gestion de chaines n'est plus si simple ...
TCS = trouble de la communication sociale (24/09/2014).
-
- Prolifique
- Messages : 4667
- Enregistré le : jeudi 20 mars 2014 à 20:59
- Localisation : 92
Re: Coin des développeurs :]
On peut même dire que c'est un cauchemar
C'est comme Python qui ne veut pas fonctionner sur mon ordi car il y a un caractère spécial dans mon nom d'utilisateur Comme c'est stupide
C'est comme Python qui ne veut pas fonctionner sur mon ordi car il y a un caractère spécial dans mon nom d'utilisateur Comme c'est stupide
Je n'ai pas de diagnostic /!\
Ce que tu as la force d'être, tu as aussi le droit de l'être - Max Stirner
Ce que tu as la force d'être, tu as aussi le droit de l'être - Max Stirner
-
- Intarissable
- Messages : 7750
- Enregistré le : dimanche 19 mai 2013 à 12:03
- Localisation : En haut à gauche
Re: Coin des développeurs :]
Oui ça à l'air d'être l'horreur bien comme il faut ....
Sinon, je pensais à coder le texte dans un fichier xml plutôt que dans un texte brut. Tout caractère devrait être codable, non ?
Qu'en pensez-vous ?
Sinon, je pensais à coder le texte dans un fichier xml plutôt que dans un texte brut. Tout caractère devrait être codable, non ?
Qu'en pensez-vous ?
TSA, diagnostic établi à mes 33 ans par le CRA de ma région.
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"
-
- Modérateur
- Messages : 41271
- Enregistré le : jeudi 15 novembre 2012 à 0:13
- Localisation : Nord-44
Re: Coin des développeurs :]
Tout caractère UNICODE est codable parBubu a écrit :Sinon, je pensais à coder le texte dans un fichier xml plutôt que dans un texte brut. Tout caractère devrait être codable, non ?
les normes UTF-8, 16 et 32, c'est même
exactement pour ça qu'elles ont été conçues ...
Note tant que j'y pense : gaffe en UTF-16,
il y a deux normes (Little et Big Indian).
C'est juste qu'on a définitivement perdu
l'ancienne correspondance bien pratique
"un caractère" = "un octet (ou un mot)",
pour passer à "un caractère" = "un nombre
variable de points de codes de 8 à 20+1 bits" ...
Ce n'est pas gênant au niveau du stockage,
(que ce soit en mémoire ou dans un fichier)
mais c'est plus compliqué pour toutes les
opérations de plus haut niveau (comparaison
et tri en tête), et même pour l'affichage ...
C'est d'ailleurs pour gérer cette complexité
que le norme UNICODE ajoute des règles à
la norme sur laquelle elle s'appuie (ISO-10646).
En fait, je ne vois pas ce qui te pose soucis ...
Ainsi :
Ok.Bubu a écrit :Pour l'instant j'ai un fichier utf8 qui contient le français, l'anglais et l'espagnol.
Tu es en UTF-8 : c'est donc le cas.Bubu a écrit :Je veux juste connaître un codage de caractères qui puisse représenter toutes les langues.
Où est le problème ?
TCS = trouble de la communication sociale (24/09/2014).
-
- Intarissable
- Messages : 7750
- Enregistré le : dimanche 19 mai 2013 à 12:03
- Localisation : En haut à gauche
Re: Coin des développeurs :]
Au fait, merci pour tes 2 réponses très détaillées.Tugdual a écrit : Où est le problème ?
Je crois que le problème, c'est que j'y comprends et connais rien ....
Moi à part l'ASCII .....
Si tu me le permets je te MP plutôt pour continuer, à moins que ce soit un sujet intéressant ?
TSA, diagnostic établi à mes 33 ans par le CRA de ma région.
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"
"Ce syndrome est caractérisé chez ce patient par l’absence de détérioration intellectuelle, un syndrome dysexécutif, un déficit d'attention"