Personagem definido em html

Personagem definido em html
Sempre que um usuário de computador atinge uma chave no teclado, um código de caractere relevante é gerado para representar que o pressionamento. Esses códigos de caracteres formam um conjunto de caracteres que deve ser capaz de se comunicar com o computador. O conjunto de caracteres HTML permite carregar as páginas corretamente usando códigos de caracteres de símbolos/caracteres. Neste post, você obteria os vários conjuntos de personagens que estão sendo usados ​​em HTML.

Personagem definido em html

Existem inúmeros conjuntos de caracteres que foram usados ​​em versões anteriores do HTML. Aqui, discutiremos todo o conjunto de personagens anteriormente e atualmente suportado.

Conjunto de caracteres ASCII

O ASCII é um conjunto de personagens de 7 bits que permite que 128 caracteres representem os termos do idioma inglês em formato compreensível de computador. Algumas características do ASCII são descritas abaixo:

- Os dígitos (0-9) e todas as 26 letras alfabéticas podem ser representadas usando ASCII

- Todos os conjuntos de personagens usados ​​no HTML são baseados em ASCII

A limitação principal do conjunto de caracteres ASCII é que ele suporta apenas 128 caracteres que poderiam suportar apenas termos de inglês (alfabetos), dígitos (0-9) e marcas de pontuação. dependente da linguagem e limitado.

Conjunto de caracteres ISO 8859-1

Das versões recentes, html 4.0 surgiu com o ISO-8859-1 como seu conjunto de caracteres padrão. A ISO 8859-1 é uma extensão do conjunto de caracteres ASCII e representa os caracteres em código de 8 bits. Pode representar 256 caracteres, o que também o torna um esquema de codificação dependente de idioma. Um conjunto de caracteres é definido na metatag do documento HTML e o código a seguir ajudará o uso da ISO 8859-1 no seu documento HTML:

Observação: Embora o HTML5 contenha um conjunto de caracteres UTF-8, ele também pode ser usado com ISO-8859-1 usando a seguinte linha em sua tag de cabeça.

Conjunto de caracteres UTF-8

O conjunto de caracteres Unicode é composto pelos valores decimais que representam os caracteres, símbolos e marcas de pontuação. Esses valores decimais baseados em Unicode são então convertidos em formato compreensível por computador usando UTF-8, UTF-16 ou UTF-32. No entanto, o UTF-8 é recomendado para páginas da web, pois abrange todos os personagens/símbolos/marcas de pontuação que podem ser usados ​​em um documento HTML.

A seguir, são apresentados os recursos salientes do UTF-8

- O último conjunto de personagens veio como um padrão para HTML5.

- Também pode ser adicionado à versão html4.

- O UTF-8 funciona com base no ASCII e os primeiros 128 caracteres no UTF-8 são os mesmos do ASCII.

- Suporta todos os símbolos, personagens e marcas de pontuação usados ​​em todo o mundo

- Converte os números/caracteres/símbolos/marcas de pontuação em um a quatro bytes

A partir da discussão acima, a importância do UTF-8 fez um terreno sólido para a obsolção de conjuntos ASCII e ISO-8859-1-CARACTER.

Observação: O unicode.Org fornece todos os unicodos dos personagens, símbolos, emojis, marcas de pontuação.

Como usar o UTF-8 no HTML4

O HTML4 veio com ISO-889-1 como o conjunto de caracteres padrão. No entanto, você pode adicionar o conjunto UTF-8-Character no HTML4 usando a seguinte meta tag.

Como usar ISO-8859-1 em html5

Como o conjunto de caracteres padrão de HTML5 é UTF-8, que supera os conjuntos de caracteres mais antigos. No entanto, você pode adicionar o caractere ISO-8859-1 no seu documento HTML usando a seguinte linha em nossa tag de cabeça.

Conclusão

O conjunto de personagens converte os símbolos, caracteres ou qualquer pressionamento de tecla para um formato legível por computador. Este artigo fornece uma visão geral dos conjuntos de caracteres usados ​​no HTML, começando de versões anteriores para o mais recente HTML5. O ASCII é o personagem mais antigo, com suporte limitado para caracteres e idioma (apenas o idioma inglês). Mais tarde, o ASCII foi estendido a 256 caracteres com suporte de 8 bits para construir um novo conjunto de personagens chamado ISO-8859-1. O ISO-8859-1 é o conjunto de caracteres padrão para HTML4, mas oferece suporte limitado de caracteres (256). O UTF-8 abrange todas as deficiências do ISO-8859-1 e, portanto, o UTF-8 veio como um caractere padrão definido no HTML5.