LINGVO.ORG Kodoj





^

UTF-8 (Unikodo)

Idento

Kiam UTF-8-igante vian TTT-paĝon, nepre metu ene de <head></head> la jenon (HTML): <meta http-equiv="Content-type" content="text/html; charset=UTF-8"> sed en XHTML: <meta http-equiv="Content-type" content="text/html; charset=UTF-8"/>

Tiam, uzu la UTF-8-an paron por la E-supersignitaj literoj - temas ne pri &xxx;&yyy; sed rekte entajpu la kodon (PC-e, ALT-0xxxALT-0yyy) (kiu surcele donus Ĉ (do Cx)):

Rimarkoj

Estas iuj cimoj en TTT-legiloj (versiaj 4) rilate al UTF-8, tamen UTF-8 estas uzinda. UTF-8 estas la normo en XML, WAP-telefonoj, kaj multaj aliaj.

Normo

Kodo (dekume) Kodo (deksesume) Donas literon
196 136 C4 88 Ĉ = C kun cirkumflekso Ĉ
196 137 C4 89 ĉ = c kun cirkumflekso ĉ
196 156 C4 9C Ĝ = G kun cirkumflekso Ĝ
196 157 C4 9D ĝ = g kun cirkumflekso ĝ
196 164 C4 A4 Ĥ = H kun cirkumflekso Ĥ
196 165 C4 A5 ĥ = h kun cirkumflekso ĥ
196 180 C4 B4 Ĵ = J kun cirkumflekso Ĵ
196 181 C4 B5 ĵ = j kun cirkumflekso ĵ
197 156 C5 9C Ŝ = S kun cirkumflekso Ŝ
197 157 C5 9D ŝ = s kun cirkumflekso ŝ
197 172 C5 AC Ŭ = U kun bireto Ŭ
197 173 C5 AD ŭ = u kun bireto ŭ

plussigno = + (ne estas neceso singardi pri + en UTF-8)

Teknike

Kiel 196 136 el 264 ?

264                dekume =
0108               deksesume =
00000001 00001000  duume =
     001 00001000  duume =
     00100 001000  duume =>
11000100 10001000  UTF-8 duume =
C4 88              UTF-8 deksesume =
196 136            UTF-8 deksese
ASCII-e, uzu 0bbbbbbb; sed Latin-1-e kaj Latin-A-e (kie estas E-o) 110bbbbb10bbbbbb.


^

UTF-7 (Unikodo)

Idento

Se temas pri UTF-7-igante vian TTT-paĝon, nepre metu ene de <head></head> la jenon:   <meta http-equiv="Content-type" content="text/html; charset=x-unicode-2-0-utf-7"> kaj simple uzu la 7-bitan &#unikodo; (memoru ke &#230; ktp ĉiam rilatas al ISO-8859-1, neniam ajn al ISO-8859-3) (aŭ la 7-bitan +utf7kodo-).

Rimarkoj

UTF-7 estas Unikodo 7-bite (do por ekzemple retpoŝto) laŭ formato +base64-

Normo

Kodo Donas literon
+AQg- Ĉ = C kun cirkumflekso
+AQk- ĉ = c kun cirkumflekso
+ARw- Ĝ = G kun cirkumflekso
+AR0- ĝ = g kun cirkumflekso
+ASQ- Ĥ = H kun cirkumflekso
+ASU- ĥ = h kun cirkumflekso
+ATQ- Ĵ = J kun cirkumflekso
+ATU- ĵ = j kun cirkumflekso
+AVw- Ŝ = S kun cirkumflekso
+AV0- ŝ = s kun cirkumflekso
+AWw- Ŭ = U kun bireto
+AW0- ŭ = u kun bireto



^

NCR de HTML (Unikodo)

Idento

Vi ne bezonas (?) tiun <meta...> se temas pri pura HTML NCR. Simple uzu la 7-bitan &#unikodo; (memoru ke &#230; ktp ĉiam rilatas al ISO-8859-1, neniam ajn al ISO-8859-3).

Rimarkoj

Unikodo uzebla en HTML (version >=4) En Java kaj en ECMAscript, uzu \uHHHH kie HHHH estas deksesume.

&#43; = + = plussigno (singardu pri + en UTF-7)(ekzemple en UTF-7 estu ne <font size=+1> sed <font size=+-1> !)

Normo

Kodo (dekume - prefere) Kodo (deksesume - evitinde) Donas literon
&#264; &#x108; Ĉ = C kun cirkumflekso
&#265; &#x109; ĉ = c kun cirkumflekso
&#284; &#x11C; Ĝ = G kun cirkumflekso
&#285; &#x11D; ĝ = g kun cirkumflekso
&#292; &#x124; Ĥ = H kun cirkumflekso
&#293; &#x125; ĥ = h kun cirkumflekso
&#308; &#x134; Ĵ = J kun cirkumflekso
&#309; &#x135; ĵ = j kun cirkumflekso
&#348; &#x15C; Ŝ = S kun cirkumflekso
&#349; &#x15D; ŝ = s kun cirkumflekso
&#364; &#x16C; Ŭ = U kun bireto
&#365; &#x16D; ŭ = u kun bireto



^

Unikodaj URL-oj

Normo

URL kodo Donas literon
%c4%88 [Ĉ] Ĉ = C kun cirkumflekso
%c4%89 [ĉ] ĉ = c kun cirkumflekso
%c4%9c [Äœ] Ĝ = G kun cirkumflekso
%c4%9d [ĝ] ĝ = g kun cirkumflekso
%c4%a4 [Ĥ] Ĥ = H kun cirkumflekso
%c4%a5 [Ä¥] ĥ = h kun cirkumflekso
%c4%b4 [Ä´] Ĵ = J kun cirkumflekso
%c4%b5 [ĵ] ĵ = j kun cirkumflekso
%c5%9c [Åœ] Ŝ = S kun cirkumflekso
%c5%9d [ŝ] ŝ = s kun cirkumflekso
%c5%ac [Ŭ] Ŭ = U kun bireto
%c5%ad [Å­] ŭ = u kun bireto (ekz. eÅ­ropo)

Testo kaj klarigo

Ligoj




^

MES-1

Rimarkoj

MES-1 (kaj do MES-2 & MES-3) subtenas Esperanton.

Normo

Unikodo XX__ Unikodo __XX
00 20-7E, A0-FF
01 00-13 16-2B 2E-4D 50-7F B7 EE EF
02 18-1B 1E 1F 7C 92 C7 D8-DB DD
1E 02 03 0A 0B 1E 1F 40 41 56 57 60 61 6A 6B 80-85 9B F2 F3
20 15 18 19 1C 1D AC
21 22 26 5B-5E 90-93
26 6A

Ligoj




^

T.51

Rimarkoj

Oficiala laŭ normo de ITU, ŝajne (?) uzata en Teletekso/Videotekso (do Minitel) kaj Teleteksto 2 kaj ties tiparo.

Ekzistas 7-bita versio de T.51.

Normo

Kodo (dekume) Kodo (deksesume) Donas literon
65 41 A = A
195 67 C3 43 Ĉ = C kun cirkumflekso
195 99 C3 63 ĉ = c kun cirkumflekso
195 71 C3 47 Ĝ = G kun cirkumflekso
195 103 C3 67 ĝ = g kun cirkumflekso
195 72 C3 48 Ĥ = H kun cirkumflekso
195 104 C3 68 ĥ = h kun cirkumflekso
195 74 C3 4A Ĵ = J kun cirkumflekso
195 106 C3 6A ĵ = j kun cirkumflekso
195 83 C3 53 Ŝ = S kun cirkumflekso
195 115 C3 73 ŝ = s kun cirkumflekso
198 85 C6 55 Ŭ = U kun bireto
198 117 C6 75 ŭ = u kun bireto
241 F1 æ = ae ligita

Ligoj




^

JIS

Rimarkoj

Malkiel Unikodo, ne estas tie ĉi Han-unuiĝo.

Kelkaj normoj

TiparoEnkodigoKomentoj
JISShift-JISEUC
JIS-Latin (Japanio)JesJesJesASCII sed kun ¥ anstataŭ \, kaj kun du aliaj modifoj
Duonlarĝa Katakana (Japanio)JesJesJesPor fremd-vortoj kaj emfazoj, eĉ meze de Kanji
JIS X 0208-1990 (Japanio)JesJesJesInkludas la sensupersignitajn Latin-literojn A-Z
JIS X 0212-1990 (Japanio)JesNeJesLa Esperantaj literoj, kaj ĉiuj supersignitaj Latin-literoj, troviĝas en rangoj 10 kaj 11
KS C 5601-1992 (Koreio)JesNeJes
GB 2312-80 (Ĉinio)JesNeJes
Granda Kvinaĵo (Tajvano)NeNeJes

Ligoj




^

ISO-8859-3

Idento

ISO-8859-3 = Latin-3.

Kiam Latin-3-igante vian TTT-paĝon, nepre metu ene de <head></head> la jenon: <meta http-equiv="Content-type" content="text/html; charset=ISO-8859-3"> (sed multaj kroziloj miskomprenas tiun ĉi linion stultece).

Rimarkoj

Metodo evitinda pro tio ke multaj ĝaĝaj sistemoj ne subtenas la normon.

La nova versio de Latin-3 (versio 1998) enhavas nenion novan krom la Unikodigon de la nomoj de la literoj/simboloj. Eĉ la simbolo por la eŭro (€) mankas!

Normo

Kodo (dekume) Kodo (deksesume) Donas literon
198 C6 Ĉ = C kun cirkumflekso
230 E6 ĉ = c kun cirkumflekso
216 D8 Ĝ = G kun cirkumflekso
248 F8 ĝ = g kun cirkumflekso
166 A6 Ĥ = H kun cirkumflekso
182 B6 ĥ = h kun cirkumflekso
172 AC Ĵ = J kun cirkumflekso
188 BC ĵ = j kun cirkumflekso
222 DE Ŝ = S kun cirkumflekso
254 FE ŝ = s kun cirkumflekso
221 DD Ŭ = U kun bireto
253 FD ŭ = u kun bireto

Ligoj




^

ESPERANTO-ASCII

Idento

EO-ASCII estas la "norma" ASCII por Esperanto.
charset=EO-ASCII
alinome sed malprefere, charset=ENKI (Esperanta Norma Kodo por Informinterŝanĝo)

Rimarkoj

Laŭ normo Z.314 de ITU, estas nur dek 7-bitaj kodoj uzeblaj por aliaj lingvoj (vidu unuan suban tabelon). (Tamen, en Teleteksto 1, uzeblaj estas dek tri, nome 23=# 24=$ 40=@ 5B=[ 5C=\ 5D=] 5E=^ 5F=_ 60=` 7B={ 7C=| 7D=} 7E=~.) La kodoj de la normo EO-ASCII estis zorge elektitaj, ekzemple pro formo @ ] } $ ~ ^. La normo estas, kvankam interesa, neniam uzita kaj ne oficiale agnoskita.

Normo : EO-ASCII

EN-ASCII Kodo (deksesume) EO-ASCII
@ 40 Ĉ = C kun cirkumflekso
` 60 ĉ = c kun cirkumflekso
[ 5B Ĝ = G kun cirkumflekso
{ 7B ĝ = g kun cirkumflekso
\ 5C = eŭro
| 7C ne uzata
] 5D Ĵ = J kun cirkumflekso
} 7D ĵ = j kun cirkumflekso
# 23 Ŝ = S kun cirkumflekso
$ 24 ŝ = s kun cirkumflekso
^ 5E Ŭ = U kun bireto
~ 7E ŭ = u kun bireto

Ligoj


A. Irvine 1994..2008