Caracteres Especiais

HTML permite que caracteres especiais sejam representados por sequências de escape, indicadas por três partes: um & inicial, um número ou cadeia de caracteres correspondente ao caracter desejado, e um ; final.

Quatro caracteres ASCII - <, >, e & têm significados especiais em HTML, e são usados dentro de documentos seguindo a correspondência:

Entidade Caracter
&lt; <
&gt; >
&amp; &

Outras sequências de escape suportam caracteres ISO Latin1. Temos aqui uma tabela com os caracteres mais utilizados em Português:

Entidade Caracter Entidade Caracter
&aacute; á &Aacute; Á
&acirc; â &Acirc; Â
&agrave; à &Agrave; À
&atilde; ã &Atilde; Ã
&ccedil; ç &Ccedil; Ç
&eacute; é &Eacute; É
&ecirc; ê &Ecirc; Ê
&iacute; í &Iacute; Í
&oacute; ó &Oacute; Ó
&ocirc; ô &Ocirc; Ô
&otilde; õ &Otilde; Õ
&uacute; ú &Uacute; Ú
&uuml; ü &Uuml; Ü

Como vemos, as sequências de escape são sensíveis à caixa.


Ao usar caracteres acentuados, pode-se inserir uma indicação do esquema de codificação ISO Latin1, escrevendo:

<HTML>
<HEAD>
<TITLE>...</TITLE>
<META HTTP-EQUIV="Content-Type"
CONTENT="text/html; charset=ISO-8859-1">
</HEAD>
...


Existem alguns símbolos que vêm sendo incorporados ao conjunto de caracteres reconhecidos em HTML 3.2. Por exemplo, &copy;, que é o símbolo ©, &reg; para ®, e &sect; para §.

Também se pode usar seqüências com códigos ASCII, por exemplo:

&#191;Qué pasa, señor?

¿Qué pasa, señor?

Tutorial HTML - ICMSC-USP
topicoIntrodução à linguagem HTML
topicoO documento básico e seus componentes
topicoFormatação de textos e caracteres
itemBlocos de texto
itemFrases
itemCaracteres Especiais
itemCores e Fontes
itemBlink
itemMarquee
topicoLigações (uso de links)
topicoInserção de imagens

Por que usar essas formatações?

Os browsers costumam também mostrar corretamente os caracteres acentuados normalmente - á em lugar de &aacute;, por exemplo. Essa prática, embora facilite sobremaneira a digitação dos documentos, não é recomendada, devido a um problema relativo à transmissão desses caracteres.

Chama-se conjunto de caracteres uma representação digital de texto. O conjunto de representação amplamente utilizado é o ASCII. O ASCII padrão tem 7 bits, porém o que se usa são versões particulares desse padrão - o ASCII americano, ASCII português, etc., que usam 8 bits. Se geramos um texto em ASCII de 8 bits e, na transmissão, esse texto é tratado por um sistema que “compreende” apenas o ASCII de 7 bits, os caracteres especiais serão transformados em caracteres diferentes, pela perda do 8o. bit.

Os usuários da Internet já devem ter sofrido experiência semelhante com mensagens de e-mail.

Na World-Wide Web, os acentos da Língua Portuguesa chegam a travar os browsers de usuários em outros países, que usam um conjunto de caracteres diferente do ISO Latin 1.





Os símbolos especiais

Assim como outras inovações introduzidas por browsers, e adotadas em HTML 3.2, os elementos especiais, tais como &copy;, ainda não são apresentados por alguns browsers. Porém, como os browsers mais populares já os adotaram, seu uso está cada vez mais difundido.


© 1995-96-97 - Maria Alice Soares de Castro - [email protected]