Personagem definido em html
Existem inúmeros conjuntos de caracteres que foram usados em versões anteriores do HTML. Aqui, discutiremos todo o conjunto de personagens anteriormente e atualmente suportado.
Conjunto de caracteres ASCII
O ASCII é um conjunto de personagens de 7 bits que permite que 128 caracteres representem os termos do idioma inglês em formato compreensível de computador. Algumas características do ASCII são descritas abaixo:
- Os dígitos (0-9) e todas as 26 letras alfabéticas podem ser representadas usando ASCII
- Todos os conjuntos de personagens usados no HTML são baseados em ASCII
A limitação principal do conjunto de caracteres ASCII é que ele suporta apenas 128 caracteres que poderiam suportar apenas termos de inglês (alfabetos), dígitos (0-9) e marcas de pontuação. dependente da linguagem e limitado.
Conjunto de caracteres ISO 8859-1
Das versões recentes, html 4.0 surgiu com o ISO-8859-1 como seu conjunto de caracteres padrão. A ISO 8859-1 é uma extensão do conjunto de caracteres ASCII e representa os caracteres em código de 8 bits. Pode representar 256 caracteres, o que também o torna um esquema de codificação dependente de idioma. Um conjunto de caracteres é definido na metatag do documento HTML e o código a seguir ajudará o uso da ISO 8859-1 no seu documento HTML:
Observação: Embora o HTML5 contenha um conjunto de caracteres UTF-8, ele também pode ser usado com ISO-8859-1 usando a seguinte linha em sua tag de cabeça.
Conjunto de caracteres UTF-8
O conjunto de caracteres Unicode é composto pelos valores decimais que representam os caracteres, símbolos e marcas de pontuação. Esses valores decimais baseados em Unicode são então convertidos em formato compreensível por computador usando UTF-8, UTF-16 ou UTF-32. No entanto, o UTF-8 é recomendado para páginas da web, pois abrange todos os personagens/símbolos/marcas de pontuação que podem ser usados em um documento HTML.
A seguir, são apresentados os recursos salientes do UTF-8
- O último conjunto de personagens veio como um padrão para HTML5.
- Também pode ser adicionado à versão html4.
- O UTF-8 funciona com base no ASCII e os primeiros 128 caracteres no UTF-8 são os mesmos do ASCII.
- Suporta todos os símbolos, personagens e marcas de pontuação usados em todo o mundo
- Converte os números/caracteres/símbolos/marcas de pontuação em um a quatro bytes
A partir da discussão acima, a importância do UTF-8 fez um terreno sólido para a obsolção de conjuntos ASCII e ISO-8859-1-CARACTER.
Observação: O unicode.Org fornece todos os unicodos dos personagens, símbolos, emojis, marcas de pontuação.
Como usar o UTF-8 no HTML4
O HTML4 veio com ISO-889-1 como o conjunto de caracteres padrão. No entanto, você pode adicionar o conjunto UTF-8-Character no HTML4 usando a seguinte meta tag.
Como usar ISO-8859-1 em html5
Como o conjunto de caracteres padrão de HTML5 é UTF-8, que supera os conjuntos de caracteres mais antigos. No entanto, você pode adicionar o caractere ISO-8859-1 no seu documento HTML usando a seguinte linha em nossa tag de cabeça.
Conclusão
O conjunto de personagens converte os símbolos, caracteres ou qualquer pressionamento de tecla para um formato legível por computador. Este artigo fornece uma visão geral dos conjuntos de caracteres usados no HTML, começando de versões anteriores para o mais recente HTML5. O ASCII é o personagem mais antigo, com suporte limitado para caracteres e idioma (apenas o idioma inglês). Mais tarde, o ASCII foi estendido a 256 caracteres com suporte de 8 bits para construir um novo conjunto de personagens chamado ISO-8859-1. O ISO-8859-1 é o conjunto de caracteres padrão para HTML4, mas oferece suporte limitado de caracteres (256). O UTF-8 abrange todas as deficiências do ISO-8859-1 e, portanto, o UTF-8 veio como um caractere padrão definido no HTML5.