Kiam UTF-8-igante vian TTT-paĝon, nepre metu ene de <head></head> la jenon (HTML):
<meta http-equiv="Content-type" content="text/html; charset=UTF-8">
sed en XHTML: <meta http-equiv="Content-type" content="text/html; charset=UTF-8"/>
Tiam, uzu la UTF-8-an paron por la E-supersignitaj literoj - temas ne pri &xxx;&yyy; sed rekte entajpu la kodon (PC-e, ALT-0xxxALT-0yyy) (kiu surcele donus Ĉ (do Cx)):
Rimarkoj
Estas iuj cimoj en TTT-legiloj (versiaj 4) rilate al UTF-8, tamen UTF-8 estas uzinda. UTF-8 estas la normo en XML, WAP-telefonoj, kaj multaj aliaj.
Normo
Kodo (dekume)
Kodo (deksesume)
Donas literon
196 136
C4 88
Ĉ
= C kun cirkumflekso Ĉ
196 137
C4 89
ĉ
= c kun cirkumflekso ĉ
196 156
C4 9C
Ĝ
= G kun cirkumflekso Ĝ
196 157
C4 9D
ĝ
= g kun cirkumflekso ĝ
196 164
C4 A4
Ĥ
= H kun cirkumflekso Ĥ
196 165
C4 A5
ĥ
= h kun cirkumflekso ĥ
196 180
C4 B4
Ĵ
= J kun cirkumflekso Ĵ
196 181
C4 B5
ĵ
= j kun cirkumflekso ĵ
197 156
C5 9C
Ŝ
= S kun cirkumflekso Ŝ
197 157
C5 9D
ŝ
= s kun cirkumflekso ŝ
197 172
C5 AC
Ŭ
= U kun bireto Ŭ
197 173
C5 AD
ŭ
= u kun bireto ŭ
plussigno = + (ne estas neceso singardi pri + en UTF-8)
Se temas pri UTF-7-igante vian TTT-paĝon, nepre metu ene de <head></head> la jenon:
<meta http-equiv="Content-type" content="text/html; charset=x-unicode-2-0-utf-7">
kaj simple uzu la 7-bitan &#unikodo; (memoru ke æ ktp ĉiam rilatas al ISO-8859-1, neniam ajn al ISO-8859-3)
(aŭ la 7-bitan +utf7kodo-).
Rimarkoj
UTF-7 (RFC 2152) estas Unikodo 7-bite (do por ekzemple retpoŝto) laŭ formato +base64-
Vi ne bezonas (?) tiun <meta...> se temas pri pura HTML NCR.
Simple uzu la 7-bitan &#unikodo; (memoru ke æ ktp ĉiam rilatas al ISO-8859-1, neniam ajn al ISO-8859-3).
Rimarkoj
Unikodo uzebla en HTML (version >=4)
En Java kaj en ECMAscript, uzu \uHHHH kie HHHH estas deksesume.
+ = + = plussigno (singardu pri + en UTF-7)(ekzemple en UTF-7 estu ne <font size=+1> sed <font size=+-1> !)
Kiam Latin-3-igante vian TTT-paĝon, nepre metu ene de <head></head> la jenon:
<meta http-equiv="Content-type" content="text/html; charset=ISO-8859-3">
(sed multaj kroziloj miskomprenas tiun ĉi linion stultece).
Rimarkoj
Metodo evitinda pro tio ke multaj ĝaĝaj sistemoj ne subtenas la normon.
La nova versio de Latin-3 (versio 1998) enhavas nenion novan krom la Unikodigon de la nomoj de la literoj/simboloj. Eĉ la simbolo por la eŭro (€) mankas!
EO-ASCII estas la "norma" ASCII por Esperanto.
charset=EO-ASCII alinome sed malprefere, charset=ENKI (Esperanta Norma Kodo por Informinterŝanĝo)
Rimarkoj
Laŭ normo Z.314 de ITU, estas nur dek 7-bitaj kodoj uzeblaj por aliaj lingvoj (vidu unuan suban tabelon).
(Tamen, en Teleteksto 1, uzeblaj estas dek tri, nome 23=# 24=$ 40=@ 5B=[ 5C=\ 5D=] 5E=^ 5F=_ 60=` 7B={ 7C=| 7D=} 7E=~.)
La normo estas, kvankam interesa, neniam uzita kaj ne oficiale agnoskita.