Quantil em r

Quantil em r

Antes de construir qualquer algoritmos de aprendizado de máquina em um conjunto de dados, a análise estatística inferencial é essencial. A obtenção de inferências estatísticas dos dados também faz parte desse processo. Nas estatísticas, alguns conceitos -chave descrevem a variabilidade de uma variável numérica. Estes termos são IQR, quartis, quantis, média e mediana. Eles ajudam a identificar qualquer anomalia na coluna e a distribuição da coluna. Este post é para determinar o quantil da coluna. A variabilidade dos dados é medida usando as funções quantil. Depois de classificar os dados, você pode usar quantis para dividir os números em uma determinada distribuição em subgrupos iguais. Podemos calcular facilmente quantis em r usando a função quantil, que retorna todos os quantis de 0%, 25%, 50%, 75%e 100%.

Quantiles in R Language de programação no Ubuntu 20.04

Quantil é uma função genérica que gera quantis de amostra para probabilidades especificadas. Uma probabilidade de 0 corresponde à menor observação, enquanto uma probabilidade de 1 corresponde ao maior. Lá, temos sintaxe para quantis usados ​​em uma linguagem de programação R.

1
Quantil (x, probs = seq (0, 1, 1/4), na na.rm = false, nomes = true, tipo = 5, dígitos = 5,…)

A seguir, uma descrição do argumento anterior passou dentro da função quantil:

X: Um item de uma categoria para a qual uma função foi especificada ou um vetor numérico onde os quantis de amostra são necessários. A menos que Na.RM é "verdadeiro", os valores de NA e NAN não podem ser usados ​​em vetores numéricos.

Probs: A probabilidade com valores em um vetor numérico; Os valores fora desse intervalo até “2E-14” são reconhecidos e transferidos para o seguinte endpoint mais próximo.

n / D.rm: Se for verdade, algum valores de NA e NAN em x são eliminados antes que os quantis sejam avaliados.

Nomes: Quando é verdade, o recurso inclui um atributo de nome. Defina como "false" para reduzir o tempo necessário para resolver um problema com um grande número de variáveis.

Dígitos: Quando verdadeiro, implemente a precisão para utilizar porcentagens de formatação. Internamente, nas versões R antes de 4.0.x, isso foi definido como max (2, getOption ("dígitos"))).

Este artigo ensinará o que são quantis e como calculá -los em r (quartis, octiles, deciles e percentis). Para obter quantis de amostra para um conjunto de dados, use o utilitário quantile () em r.

Exemplo 1: Usando uma função quantil simples para vetores de deslocamento em r no Ubuntu 20.04

Vejamos como a função quantil em r funciona com um exemplo simples que gera os quantis para a entrada de dados. Precisamos criar dados para aplicar as funções quantil. Aqui, definimos os dados variáveis ​​dentro, que contêm os dados do vetor. Em seguida, a função quantil é usada onde passamos os dados especificados anteriormente junto com a sequência declarada. Ao executar este comando da função quantil, recebemos os quantis dos vetores, como mostrado no seguinte prompt de R:

No prompt R a seguir, utilizamos novamente a função quantil para calcular os deciles. Para isso, passamos a sequência 0, 1 e ¼.

Aqui, avaliamos o interesse dos quantis aleatórios. Definimos os dados dentro do argumento do probs, mostrando simultaneamente a saída dos percentis. Observe que a função quantil dividiu os dados em porções iguais, com a mediana servindo como centro, a metade inferior restante servindo como quartil inferior e a metade mais alta que serve como o quartil superior.

Exemplo 2: Usando a função Quantiles para calcular a coluna em um quadro de dados em r no Ubuntu 20.04

Também podemos encontrar o quantil da coluna fornecida do quadro de dados. Definimos os dados dentro da função do quadro de dados no script R a seguir. Geramos listas com os nomes "List1", "List2" e "List3" com valores numéricos aleatórios.

Depois disso, chame a função quantil e insira o nome da coluna com o símbolo "$" como como especificamos "$ list3" para quantil. Como você pode ver, a função quantil coloca os valores de entrada em ordem crescente antes de retornar os percentis necessários.

Podemos usar a função Sapply (), como mostrado dentro do prompt de R, se quisermos avaliar os quantis de inúmeras colunas de uma só vez. Passamos a opção Função (x) dentro da função Sapply junto com a função Quantil, que possui os parâmetros x e os probs. A saída desta função exibe todos os quantis das colunas de uma só vez.

Exemplo 3: Usando a função Quantiles e lidando com o erro NAN em R no Ubuntu 20.04

Nans podem ser encontrados em quase qualquer situação. Esses Nans, também conhecidos como valores ausentes, estão se tornando mais comuns no mundo digital de hoje, orientado a dados. Se os dados contiverem esses números ausentes, a saída poderá conter Nans ou erros. Também temos dados vetoriais que incluem alguns valores de NA chamados dados do vetor na função quantil. A exceção é lançada pelo compilador R mostrado abaixo:

Podemos remover este erro usando o parâmetro quantil na.rm. Temos que definir o NA.Valor de RM para "True", o que nos ajuda a eliminar esta exceção de Nans. Como você pode ver na saída, obtivemos os valores percentuais e removemos com sucesso os valores de NA.

Exemplo 4: Usando a função Quantiles com o parâmetro probs em r em Ubuntu 20.04

Há também a opção "Probs", que permite especificar os percentis necessários. O argumento dos probs, também conhecido como argumento de "probabilidades", deve estar entre 0 e 1. Dentro do script R a seguir, usamos a opção Probs com os valores 33 e 66 na função quantil. A saída tem uma mensagem de erro de que os probs estão fora do intervalo.

Ao definir a opção Probs dentro do intervalo de 0 e 1, mostra os valores dos percentis em vez de valores falsos.

Conclusão

Tentamos fazer o possível para descrever e explorar a função r quantile () em várias dimensões usando vários exemplos. O formulário quantil é a função mais valiosa na análise de dados, pois mostra dados adicionais com informações específicas sobre informações específicas. Ilustramos alguns exemplos mostrando claramente o funcionamento da função quantil. Espero que agora você entenda melhor a função quantil () do R.