Pandas de Json

Pandas de Json

A notação de objeto JSON ou JS é um formato de dados de texto que armazena dados de texto como valor-chave. Na internet, os dados são frequentemente trocados por meio de arquivos JSON. Entre colchetes encaracolados (), o JSON é representado. JSON usa vírgulas para denotar a separação de cada par de chaves/valor. JSON Data se assemelha a um dicionário de Python na aparência. No entanto, os dicionários são estruturas de dados, enquanto JSON é um formato de dados. Nos pandas, a função read_json permite a leitura de arquivos json para pandas dados. Você pode ver nos exemplos abaixo como converter arquivos JSON em dados de dados de pandas que os arquivos JSON podem ser lidos no quadro de dados de pandas.

Como ler os arquivos JSON em pandas?

Usamos a função read_json () para extrair os arquivos com o .Extensão JSON passando o caminho do arquivo JSON desejado dentro dos parênteses da função. Uma vez feito isso, um "DataFrame" (uma tabela com linhas e colunas para armazenar dados) é retornada. Podemos especificar o link para a localização do arquivo, em vez de um caminho local, se quisermos recuperar um arquivo JSON que é armazenado em um servidor remoto. Às vezes, pode ser necessário transformar um arquivo com um .Extensão JSON em Pandas Dataframe. O método pandas read_json (), que emprega a seguinte sintaxe, simplifica fazer isso.

Sintaxe: read_json ('caminho', Orient = 'Index')

Onde,

caminho: coloca o caminho do arquivo JSON.

orientar: a orientação do arquivo json. O valor padrão é "índice", mas você também pode definir "dividir", "registros", "colunas" ou "valores".

Vamos ver como os arquivos com extensões JSON podem ser lidas em um quadro de dados nos exemplos abaixo.

Exemplo 1: Usando a função read_json () para ler um arquivo json

Primeiro, temos que baixar um arquivo json no site de código aberto. Podemos simplesmente baixar um arquivo com um .Extensão JSON de vários sites. Em vez de obter um arquivo JSON da Internet, você pode criar um. Nós baixamos um arquivo 'Iris.JSON 'de um site de código aberto. Para ler este arquivo em pandas, usaremos a função read_json ().

Nós usamos o PD.Método read_json () para ler o arquivo local (.arquivo json) na variável 'df'. Passamos o caminho do arquivo json como uma string para a função. Com este método, os dados de arquivos JSON serão automaticamente convertidos em dataframe. O pacote de pandas foi inicialmente importado como PD. Na linha final, exportamos as dez linhas de amostra do DataFrame. O método read_json () pegou as 150 linhas e 5 colunas de dados do arquivo de dados da íris como entrada.

Usando o DF.Função de amostra (), exibimos apenas uma amostra de 5 linhas de dados neste bloco de saída. Os dados do DataFrame são recuperados aleatoriamente pela função de amostra (). Um número definido de linhas (aleatório) é retornado pelo método de amostra (). Se um valor não for especificado, a função de amostra () retorna 1 linha. Se especificarmos o parâmetro Orient da função read_json () com diferentes valores como 'divisão', 'colunas', 'registros' ou 'valores', a saída pode ser ligeiramente diferente.

Exemplo 2: Usando a função read_json () para ler um JSONFILE da localização remota

Um arquivo localizado em um sistema CICS diferente (sistema de controle de informações do cliente). Usando o envio da função CICS, os pedidos de controle de arquivos CICS feitos contra arquivos remotos são enviados para o sistema remoto. Os aplicativos podem ser feitos para acessar arquivos, mesmo quando são colocados em um local/servidor desconhecido. Ao usar o URL remoto em vez do caminho do arquivo, podemos ler dados JSON de um local remoto. O método read_json () pode ler em locais que não sejam apenas arquivos locais. Os arquivos JSON mantidos em servidores distantes também podem ser lidos. Podemos simplesmente fornecer a chamada de função com o caminho para o arquivo JSON externo.

Usamos uma API HTTP acessível ao público que contém dados de formato JSON. O método read_json () também é usado para ler os dados JSON do URL remoto. Esta saída contém uma amostra de cinco linhas de dados JSON usando o método read_json (). Esses dados são de um URL público e possuem 150 linhas e cinco colunas.

Exemplo 3: Usando PD.Função DataFrame () para ler um arquivo JSON no Pandas DataFrame

Nos exemplos anteriores, baixamos o arquivo de dados JSON ou usamos o URL remoto para ler os dados. Agora, criaremos dados JSON e depois os convertemos em uma estrutura de dados usando o PD.Função DataFrame (). Antes de criar os dados JSON ou o DataFrame de pandas, precisamos importar os módulos dos pandas para usar suas funções e recursos.

Nossos dados json 'j_data' são criados com duas colunas: "Nome" e "Age" com valores ('1': 'Brock', '2': 'Fin', '3': 'John', '4': 'Moris', '5': 'Jack', '6': 'Anna') e ('1': 38, '2': 26, '3': 41, '4': 35, '5': 28, '6': 27) respectivamente. Agora, passaremos nossos dados JSON dentro do PD.Função DataFrame () para lê -lo no DataFrame.

Simplesmente passamos a função 'j_data' dentro da função DataFrame () para converter os dados JSON em Pandas DataFrame.

Exemplo 4: Usando PD.Função DataFrame () para ler uma Estruturas JSON aninhadas em Pandas Dataframe

Criaremos dados JSON usando dicionários aninhados, neste exemplo. Em Python, você pode usar dicionários aninhados para criar dados JSON. Há uma coluna ou variável no arquivo json para cada item no dicionário externo. A chave de cada item é o cabeçalho da coluna e seus dados são outro dicionário composto pelas linhas nessa coluna específica. Criaremos um dicionário que usaremos para criar um arquivo json com detalhes sobre alguns aleatórios.

Nós criamos nossos dados JSON aninhados. As chaves dos dicionários são especificadas como "nome", "id", "curso" e "idade". Agora, vamos usar o PD.Função DataFrame () para converter o dicionário aninhado em dados de dados de pandas.

Nosso dicionário aninhado de dados JSON é convertido com sucesso em um dataframe.

Exemplo 5: Usando a função json_normalize () para ler uma estrutura JSON aninhada no Pandas Dataframe

Para ler Strings JSON aninhadas e devolver um DataFrame, a função “json_normalize ()” é comumente usada. O json.Função () da função do pacote python json deve ser usada primeiro para ler a string json antes de usar o método json_normalize (). A função json_normalize () receberá este objeto JSON e retornará os dados necessários na forma de um quadro de dados.

Junto com os pandas, também importamos os módulos JSON e JSON_Normalize para usar as funções e os recursos fornecidos por eles. Usamos o JSON.Cargas () para ler as Strings JSON. Um objeto de arquivo é passado para JSON.load (), que retorna um objeto JSON. É usado para ler dados que foram codificados por JSON de um arquivo, transformá-los em um dicionário de Python e depois desserializam o arquivo original. Os dados necessários estavam contidos pela chave 'Rec', que é então passada na função json_normalize () para achatar os dados no quadro de dados de pandas.

Conclusão

Neste tutorial, discutimos os arquivos de dados JSON e como podemos lê -los usando a função read_json (). Vimos a sintaxe do método read_json () para entender como funciona. Implementamos alguns exemplos neste artigo para ensinar como ler um arquivo JSON de uma localização local e remota usando a função read_json () e como ler ou converter o arquivo json e a estrutura JSON aninhada em Pandas Dataframe usando o PD.Função DataFrame () e JSON_Normalize ().