Crosstab ccepy

Crosstab ccepy

A linguagem de programação Python oferece uma variedade de bibliotecas incríveis que fornecem uma longa lista de funções úteis. Usando essas bibliotecas e funções, qualquer aplicação prática pode ser gerenciada facilmente. Neste artigo, explicaremos a função de crosstab disponível na biblioteca scipy. A Scipy Library é uma das bibliotecas mais usadas da linguagem de programação Python, pois fornece funções para todos os tipos de operações estatísticas e matemáticas. Crosstab é a função de outra biblioteca cipy na qual discutiremos neste guia. Vamos começar!

O que é Crosstab?

Crosstab significa tabulação cruzada que é usada para criar uma tabela de contingência de dois ou mais fatores, contando as frequências dos pares correspondentes. Em palavras simples, ele retorna uma tabela que contém a contagem de cada combinação única dos itens em dois ou mais conjuntos de dados. Ele pode ser usado para realizar uma análise de dados poderosa construindo uma tabela de resumo.

Neste artigo, demonstraremos alguns exemplos para mostrar como usar a função de crosstab em um programa Python. Com esses exemplos, você poderá entender a função de uma maneira melhor e poderá implementá -la em seus programas. Antes de passar para a seção de exemplos, vamos entender a sintaxe da função de crosstab.

Qual é a sintaxe da função de crosstab?

A função Crosstab é fornecida pela Biblioteca Cipy no pacote de estatísticas e na classe de contingência. A sintaxe da função Crosstab é a seguinte:


Os conjuntos de dados de parâmetros* representam a sequência de conjuntos de dados cuja tabulação cruzada deve ser calculada. O tamanho de ou os itens devem corresponder a todos os conjuntos de dados. Os níveis e parâmetros esparsos são parâmetros opcionais. Se eles não forem fornecidos, seu valor padrão será usado. O argumento dos níveis mantém a lista de itens que devem ser contados nos conjuntos de dados. O número dos "níveis" e o número de conjuntos de dados devem ser os mesmos.

Os valores fornecidos no parâmetro do nível são contados nos conjuntos de dados. Se algum valor correspondente não existir no conjunto de dados, eles serão ignorados e sua contagem não será devolvida na matriz resultante. O parâmetro das peças de reposição mantém um valor verdadeiro ou falso, indicando se deve retornar uma matriz esparsa ou não. É falso por padrão.

A função Crosstab retorna dois elementos - um é uma tupla de comprimento e a outra é uma contagem. A “tupla do comprimento” contém a sequência de itens que são contados. O elemento "contagem" contém a contagem de cada par de contingência, que também é conhecido como uma tabela de contingência. Agora que aprendemos a sintaxe da função de crosstab, vamos ver alguns exemplos para entender como a função de crosstab pode ser implementada em um programa Python.

Exemplo 1:

Vamos começar com um exemplo simples para que não tenhamos nenhum problema em entender o funcionamento básico da função de crosstab. Considere o código de amostra no snippet de código a seguir:

de Scipy.Estatísticas.Importação de contingência Crosstab
a = ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'b', 'b', 'b' ]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z' ]
(Avals, XVals), Count = Crosstab (a, x)
Print ('Array 1 contém:', AVALS)
Print ('\ Narray 2 contém:', xvals)
Print ('\ nthe Count of Crosstab é: \ n', contagem)


Primeiro, a Biblioteca Cipy, juntamente com o pacote de estatísticas e a classe de contingência, é importada para o programa para chamar a função Crosstab. Depois disso, duas matrizes do mesmo comprimento são fornecidas. Ambos são passados ​​para a função de crosstab. Três variáveis ​​são declaradas, cada uma mantendo um resultado único da função de crosstab. Agora, vamos ver o resultado da função de crosstab no seguinte:


A primeira matriz contém 2 itens exclusivos - A e B. Enquanto a segunda matriz contém três itens exclusivos - x, y e z. A contagem de contingência é [[2, 2, 2] [2, 2, 2]], o que significa que o par (a, x) ocorre duas vezes, o par (a, y) ocorre duas vezes, o par (a, z ) ocorre duas vezes, o par (b, x) ocorre duas vezes, o par (b, y) ocorre duas vezes, e o par (b, z) ocorre duas vezes.

Exemplo 2:

Como discutimos no exemplo anterior, o Crosstab aceita o maior número possível de conjuntos de dados. Ele calcula a tabela de contingência para todos os conjuntos de dados. No exemplo anterior, fornecemos apenas 2 conjuntos de dados. Vamos adicionar mais um e ver o resultado da função de crosstab. Considere o seguinte código de amostra:

de Scipy.Estatísticas.Importação de contingência Crosstab
a = ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'b', 'b', 'b' ]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z' ]
p = [0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1]
(Avals, XVals, Pvals), Count = Crosstab (A, X, P)
Print ('Array 1 contém:', AVALS)
Print ('\ Narray 2 contém:', xvals)
Print ('\ Narray 3 contém:', PVals)
Print ('\ nthe Count of Crosstab é: \ n', contagem)


Agora, vamos ver a seguinte saída para entender como o resultado das mudanças de crosstab:


Como tivemos três conjuntos de dados, o primeiro conjunto de dados contém dois itens exclusivos - A e B. O segundo conjunto de dados contém três itens exclusivos - x, y e z. E o terceiro conjunto de dados contém dois itens exclusivos - 0 e 1. Temos os seguintes pares (a, x, 0), (a, x, 1), (a, y, 0), (a, y, 1), (a, z, 0), (a, z, 1), (b, x, 0), (b, x, 1), (b, y, 0), (b, y, 1), (b, z, 0), (b, z, 1) , com contagens [[[2 0] [0 2] [2 0]] [[0 2] [2 0] [0 2]], respectivamente, respectivamente.

Exemplo 3:

Como sabemos, Crosstab leva dois parâmetros opcionais - um é níveis e o outro é escasso. Neste exemplo, o guiaremos sobre como fornecer explicitamente os parâmetros de nível e como a função Crosstab gerencia. Considere o seguinte exemplo:

de Scipy.Estatísticas.Importação de contingência Crosstab
a = ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'b', 'b', 'b' ]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z' ]
opt = ['a', 'b', 'x', 'y', 'z']
(Avals, XVals), Count = Crosstab (a, x, níveis = (opt, opt))
Print ('Array 1 contém:', AVALS)
Print ('\ Narray 2 contém:', xvals)
Print ('\ nthe Count of Crosstab é: \ n', contagem)


Como discutimos anteriormente, o número de níveis deve ser o mesmo que o número de conjuntos de dados. Então, damos os níveis = (opt, opt) para corresponder ao número de conjuntos de dados. Vamos ver a tabela de contingência na seguinte saída:

Exemplo 4:

O segundo argumento opcional da função de crosstab é escasso. Neste exemplo, definiremos explicitamente o parâmetro escasso como verdadeiro para obter a matriz esparsa como resultado. Considere o código de amostra no snippet de código a seguir:

de Scipy.Estatísticas.Importação de contingência Crosstab
a = ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'b', 'b', 'b' ]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z' ]
opt = ['a', 'b', 'x', 'y', 'z']
(Avals, XVals), Count = Crosstab (a, x, níveis = (opt, opt), esparso = true)
Print ('Array 1 contém:', AVALS)
Print ('\ Narray 2 contém:', xvals)
Print ('\ nA matriz esparsa é: \ n', contagem)
Print ('\ nthe Count of Crosstab é: \ n', contagem.A)


Aqui está a saída da função de crosstab que contém todos os parâmetros necessários e opcionais:

Conclusão

Este artigo é uma visão geral rápida da função de crosstab fornecida pela Scipy Library. Crosstab significa tabulação cruzada. É usado para obter a tabela de contingência dos dados fornecidos. É preciso uma lista de conjuntos de dados, conta a contingência dos itens fornecidos no conjunto de dados e retorna a matriz de contagens. Com a ajuda de exemplos, aprendemos a fornecer os diferentes parâmetros à função e obter o resultado desejado dele.