Unicode começou com um conjunto de caracteres de dois bytes fixo, mas mais tarde, foi alterado. O Unicode consiste em mais de cem mil caracteres e mais de cem idiomas para lidar com a vasta multidão de idiomas diferentes, incluindo personagens complexos como emojis, modificadores e outros personagens desconhecidos.
Se tentarmos imprimir um personagem especial como um emoji na linguagem C, o compilador não dará o resultado da impressão que o emoji. Em vez disso, ele retorna um código para esse emoji que não será útil para o usuário. Para resolver esse assunto, praticaremos o processo Unicode em C.
Sintaxe:
Para imprimir um unicode na linguagem C, usamos uma função nomeada_setmode na qual definimos os bits de personagem. Na figura a seguir, estamos dando a U16 como um parâmetro, por isso imprime apenas os caracteres com limite de 16 bits. Por padrão, o idioma c imprime apenas caracteres de 8 bits.
Usamos o WPRINTF em vez da função Printf para imprimir a linha. E vamos colocar L no início da declaração de que queremos imprimir. Além da sintaxe a seguir, também precisamos adicionar dois inclui que são:
#incluirNota: Unicode não é uma função ou método em C, então não há sintaxe específica. A sintaxe anexada aqui é apenas para referência.
Exemplo 1:
Vamos entender melhor o tópico seguindo este exemplo. Na figura, você pode entender que importamos duas bibliotecas extras para o nosso código. Um é e o outro é . O que nos permite criar os novos tipos de dados para armazenar os caracteres especiais neles. Na linguagem C, o cabeçalho é usado para definir as configurações baseadas em localização, por exemplo, símbolos como moedas e diferentes formatos de data.
No bloco de código de função principal, chamamos de função setLocale (). Esta é a função do cabeçalho. Na função setLocale (), passamos por um parâmetro de LC_CTYPE. Esta função tem muitos parâmetros como LC_All, que define tudo. LC_CTYPE afeta todas as funções de caracteres. Ele define os atributos do personagem, como conversão de casos e classificações de caracteres.
Depois disso, declaramos duas variáveis de Wchar_t Datatype: Star1 e Star2. Passamos pelo unicode para esse emoji para nossas variáveis. Depois disso, escrevemos os valores de nossas variáveis. Discutimos anteriormente que usamos o wprintf para impressão unicode. Também podemos ver no código a seguir que usamos o wprintf em vez de printf.
#incluirApós a execução bem -sucedida do nosso código C, obtemos a seguinte saída. Podemos ver que, em vez de imprimir os valores que passamos para nossas constantes, o sistema imprimiu duas estrelas. Isso ocorre porque passamos o unicode para essas estrelas para nossas variáveis. Então, por causa da função setLocale () e seu parâmetro LC_CTYPE, o sistema verificou o personagem em relação a esse código específico e encontrou uma estrela em preto e branco contra esse valor. Também usamos o Wprintf, então o sistema imprimiu o personagem contra o valor aprovado da estrela negra e a estrela branca.
Exemplo 2:
No exemplo anterior, usamos um método complexo para permitir que você entenda como o unicoding funciona. Neste exemplo, executaremos uma tarefa para imprimir um unicode com a ajuda de menos linhas de código possível. Dependendo do sistema operacional do seu computador ou máquina, você também pode imprimir os caracteres Unicode simplesmente usando a função Printf. Mas, para esse fim, você terá que passar um valor para que o compilador saiba que ele precisa imprimir um caractere unicode.
Neste exemplo, tentamos imprimir um rosto sorridente, que é um personagem não inglês. Passamos o valor unicode desse emoji para o nosso código. No código a seguir, simplesmente imprimimos uma mensagem "Olá" com um sorriso no final da declaração. O código para Happy Smiley é “0001f600”. Então, passamos por isso começando com \ u exatamente como a impressão de uma string \ s é passada para que o sistema entenda que ele precisa imprimir uma string.
Uma coisa que você deve ter notado é que não usamos os cabeçalhos que usamos no exemplo anterior. Isso ocorre porque não estamos usando essas funções e técnicas para deixar o sistema ler os caracteres Unicode.
#incluirA saída do nosso código após a compilação é a seguinte. O sistema imprime a mensagem do personagem como é, mas primeiro lê o assinatura \ u e entende que o próximo valor que é passado é um unicode. Portanto, o sistema entenderá que deve converter o próximo código em seu respectivo emoji. Depois de converter o valor em caracteres unicode, o sistema exibirá o rosto sorridente como uma saída.
Conclusão
Discutimos sobre o Unicoding neste artigo. Explicamos o que é um caráter unicode, por que é usado e quais foram as razões pelas quais o padrão de unicoding foi introduzido. Discutimos como operar com os caracteres Unicode na linguagem C, pois a linguagem C fornece suporte para apenas cerca de 256 caracteres. Nos exemplos dados, explicamos como podemos codificar um conjunto de valores em um emoji ou personagem unicode. Por toda a explicação que foi dada anteriormente, podemos dizer que o unicoding é uma abordagem muito útil para combater a ponte de comunicação. Com a ajuda de desenvolvedores e programadores Unicode de todos os cantos do mundo, podemos codificar e escrever os programas em seus idiomas. Além disso, todos os aplicativos podem ser desenvolvidos em diferentes idiomas, o que os ajuda a se tornarem mais compreensíveis e legíveis para os usuários. O unicoding ajuda a alterar os idiomas da interface do usuário não apenas dos aplicativos, mas também de todo o sistema operacional. Portanto, o unicoding não é uma função ou biblioteca específica na linguagem C. É um padrão de codificação internacional que pode ser aplicado em qualquer linguagem de programação.