"Letter frequency"@en . . "20174"^^ . . "15601"^^ . . "\u5B57\u6BCD\u9891\u7387"@zh . "Le calcul de la fr\u00E9quence des lettres dans une langue est difficile et soumis \u00E0 interpr\u00E9tation. On compte la fr\u00E9quence des lettres d\u2019un texte arbitrairement long, mais un certain nombre de param\u00E8tres influencent les r\u00E9sultats : \n* Le style narratif : s\u2019il y a beaucoup de verbes \u00E0 la 2e personne du pluriel (le vouvoiement, pr\u00E9sent dans beaucoup de dialogues), il y aura significativement plus de \u00AB Z \u00BB. \n* Le vocabulaire sp\u00E9cifique du document : si l\u2019on parle de chemins de fer, il y aura beaucoup plus de \u00AB W \u00BB (wagon) ; si l\u2019un des protagonistes se d\u00E9nomme Lo\u00EFs, le nombre d'\u00AB \u00CF \u00BB s\u2019en ressentira. \n* Le type de document : des petites annonces en France pr\u00E9senteront souvent le symbole Euro (\u20AC), qui est absent de la plupart des autres documents. \n* La langue d'origine du texte : les noms propres restant g\u00E9n\u00E9ralement les m\u00EAmes entre sa version originale et sa version traduite, certaines variations de fr\u00E9quences de lettres rares en fran\u00E7ais peuvent se faire ressentir. Dans un texte d'un auteur anglais par exemple, les noms propres auront tendance \u00E0 faire augmenter les fr\u00E9quences de lettres relativement communes dans cette langue, telles que le H, le W ou le Y. \n* L'\u00E9poque \u00E0 laquelle le texte a \u00E9t\u00E9 r\u00E9dig\u00E9 : un texte fran\u00E7ais du dix-huiti\u00E8me si\u00E8cle ne contiendra pas ou peu de W, car cette lettre \u00E9tait \u00E0 cette \u00E9poque beaucoup moins utilis\u00E9e qu'aujourd'hui. \n* Les param\u00E8tres techniques : on peut facilement calculer des statistiques sur des textes informatis\u00E9s, mais souvent ceux-ci ne comportent pas de majuscules accentu\u00E9es (car difficiles \u00E0 entrer sur certains ordinateurs) et il arrive aux auteurs d'oublier des accents. La graphie de l\u2019e-dans-l\u2019o (\u0153) est impossible \u00E0 repr\u00E9senter dans le codage latin-1 qui est souvent utilis\u00E9 pour les textes en fran\u00E7ais. C'est un probl\u00E8me parce que \u00AB \u0153 \u00BB n'est pas une ligature esth\u00E9tique (optionnelle) mais une ligature linguistique (obligatoire), elle se prononce diff\u00E9remment de la suite de voyelles \u00AB oe \u00BB . Par exemple, \u00AB \u0153 \u00BB va se prononcer [\u025B] dans \u0153sophage alors que \u00AB oe \u00BB va se prononcer [\u0254.\u025B] dans coexistence. \n* La pr\u00E9sence de caract\u00E8res non alphab\u00E9tiques (symboles de ponctuation, chiffres, parenth\u00E8ses et accolades, symboles math\u00E9matiques courants\u2026) peut ou non \u00EAtre prise en compte ; la virgule, le point ou l\u2019apostrophe sont par exemple plus fr\u00E9quents que plus de la moiti\u00E9 des lettres[r\u00E9f. souhait\u00E9e]. Si ces param\u00E8tres ont un impact spectaculaire sur les symboles les moins fr\u00E9quents (la fr\u00E9quence du \u0153 varie entre 0,002 % et 0,09 % pour trois textes pris au hasard)[r\u00E9f. n\u00E9cessaire], elle est \u00E9galement sensible m\u00EAme pour les lettres les plus fr\u00E9quentes (l\u2019ordre de fr\u00E9quence des lettres A, S, I, T et N, qui sont les plus fr\u00E9quentes \u00E0 part E, fluctue d\u2019un texte \u00E0 l\u2019autre)."@fr . . . . . . "Frequ\u00EAncia de letras"@pt . . "Freq\u00FC\u00E8ncia de les lletres"@ca . . . . . . . . . . . . . . . . "\u0427\u0430\u0441\u0442\u043E\u0442\u043D\u043E\u0441\u0442\u044C"@ru . . . . . . . . . . . . . "Bokstavsfrekvens"@sv . "Le calcul de la fr\u00E9quence des lettres dans une langue est difficile et soumis \u00E0 interpr\u00E9tation. On compte la fr\u00E9quence des lettres d\u2019un texte arbitrairement long, mais un certain nombre de param\u00E8tres influencent les r\u00E9sultats :"@fr . . . . . . . . . . . "Fr\u00E9quence d'apparition des lettres en fran\u00E7ais"@fr . . . "190463324"^^ . . . . . . . . . . . . . . . . . . . . . .