Colunas divididas de pandas por delimitador

Colunas divididas de pandas por delimitador
"Pandas" é um pacote Python. É flexível e tem um design expressivo de estrutura de dados para trabalhar com dados de diferentes maneiras. Além disso, os quadros de dados do panda são ótimos para manipular os dados. Na maioria das vezes, trabalhamos em dados que possuem uma coluna contendo um valor delimitado de string, por exemplo, "x, y, z" e queremos que eles estejam em colunas separadas. Isso é possível usando uma função dos pandas que discutiremos neste artigo. Vamos aprender a dividir uma coluna de texto em colunas separadas individualmente. Para essa função de pandas da coluna dividida por delimitador, deve ser usado. Sua sintaxe é como a função Python String "str ()". Mas os pandas se dividem por coluna, divide os dados de todo o quadro de dados. Para a implementação do código, usaremos a ferramenta "Spyder". Como é o software Python Language Friendly.

Sintaxe

Str.dividir()

A sintaxe acima é usada para dividir o texto em colunas em um quadro de dados. Funciona dividindo a coluna por delimitador em várias colunas. Implementamos a sintaxe da série Pandas “STR.função split () ”na coluna“ endereço ”e passe com a“ vírgula ”para a separação da coluna que queremos dividir.

Parâmetros

Existem alguns parâmetros que usaremos posteriormente nos exemplos de coluna PANDA SPLIT da Delimiter:

Expandir: Ele expande o valor da string em uma coluna separada.

Condições: se "verdadeiro", retornará o quadro de dados; Se "false", retorna a série/índice (strings).

"N" limita o número de uma divisão na saída.

A seguir, estão as maneiras pelas quais os Pandas se dividem por delimitador podem ser realizados:

  • Coluna Pandas Split da Delimiter (Adicione uma nova coluna ao "DF").
  • Coluna Pandas Split da Delimiter (dentro de uma lista).
  • coluna de divisão de pandas por delimitador especificando o número de divisões.

Criando o quadro de dados para os exemplos de implementação da coluna Pandas Split pela Delimiter

Depois de abrir a ferramenta "Spyder", importe a biblioteca de pandas como "PD". Agora, comece a criar o "df". O "DF" é a abreviação do "DataFrame". O "DF" tem o endereço completo de algumas áreas dos diferentes países, como: "5632 Main Street, Park, Canadá"; "2525 Downtown, Salt Mine, Itália"; "7896 Sky View, Apartment, México"; e a estrada Sunshine "3988", Villa, Japão ”. Aqui, vemos que os dados são separados por coluna. Nos próximos exemplos, aprenderemos a dividir essas áreas de "vírgula" nas colunas separadamente usando a função Pandas Split by Delimiter.

A saída mostra a criação de dados dos dados fornecidos no código.

Exemplo 01: coluna Pandas Split by Delimiter em várias colunas

Neste exemplo, dividiremos as colunas de dados de texto em várias colunas por delimitador da função dividida de pandas. O DataFrame consiste nos endereços das ruas como: "5623 Main Street, Shopping Center, Turquia"; "4585 Downtown, área escolar, França"; "0032 Sky View, College, Indonésia"; e “1125 Sunshine a seguir, Universidade, China”. Todos esses endereços são de diferentes áreas, estaremos separando essas áreas de texto "vírgula" em uma coluna separada. Podemos dizer que podemos considerá -lo como operador de reconhecimento do separador para dividir. Estaremos aplicando a função dividida de pandas no "endereço". Então, a vírgula neste caso estará dividindo. Além disso, precisamos passar os parâmetros como "expandir" para o valor "verdadeiro".

A saída exibe as colunas separadas do endereço na coluna "0". Na coluna "1", temos as áreas particularmente e na coluna "2", temos os nomes dos países. Um quadro de dados bem apresentado e organizado é criado.

Exemplo 02: coluna Pandas Split da Delimiter dentro de uma lista

Criaremos um quadro de dados para a implementação de exemplo da coluna Pandas Split pela Delimiter desta vez "dentro de uma lista". O DataFrame é como "7854 Main Street, Loja de Tire"; "8009 Downtown, Sweet Shop, Tóquio"; "1003 Sky View, sorveteria, Sri Lanka"; e “7009 Sunshine a seguir, ensino médio, África”. Agora, não passaremos o parâmetro true neste exemplo para fazer a divisão dentro da coluna.

Aqui na saída, a divisão é feita dentro das colunas. Mas isso não acabou de exibir a criação de colunas separadas porque a divisão está dentro de uma lista. Se queremos dividir em uma coluna separada, o último exemplo mostrará.

Exemplo 03: Coluna Pandas Split da Delimiter (Adicione uma nova coluna ao "DF")

Neste exemplo, estaremos adicionando outra coluna ao quadro de dados ao lado das colunas separadas que podem ser feitas facilmente pela coluna dividida de pandas e pela função delimitadora. O DataFrame é o mesmo que o último exemplo. Agora, selecionamos o "estado" como uma coluna complementar. Temos todo o quadro de dados e mais uma coluna em uma coluna separada. Dessa forma, se queremos alterar ou executar qualquer análise dessa quantidade específica de dados, podemos tê -los separadamente sem afetar os dados originais.

A tela separou colunas e adiciona a coluna de "estado" em uma coluna separada por si só. São quatro por quatro colunas, o que significa 2 linhas e 2 colunas.

Exemplo 04: coluna Pandas Split por delimitador especificando o número de divisões

No Exemplo 01 acima, fizemos a divisão das colunas de texto, fornecendo o endereço na ocorrência do delimitador "vírgula", o que resultou em três colunas da separação. Da mesma forma, podemos especificar o número de divisões que queremos. Nesse caso, estaremos aprendendo a fazer isso. O DataFrame consiste nos endereços como: “4585 12º Rua, supermercado, Nova York ”,“ 7000 Portlands, aeroporto, Itália ”; “4555 13º Rua, estação de trem, Espanha ”; e o “7777 Commercial Next, Candy Shop, Austrália”. O "n = 1" indica que queremos dividir o quadro de dados uma vez. A divisão acontecerá na primeira ocorrência, as outras colunas de esquerda serão vistas juntas.

A saída exibe a divisão do quadro de dados usando a coluna Pandas Split pela função delimitadora e denotando n como "1". Então, a divisão é feita apenas uma vez. As cidades e os estados estão na segunda coluna e a primeira ocorrência dos endereços está na primeira coluna.

Conclusão

A coluna dividida da função de pandas pelo delimitador é útil e eficiente. Quantas vezes de acordo com a necessidade, queremos ter os dados em uma coluna ou convenção específica pela necessidade. Portanto, tudo isso pode ser feito usando a coluna Pandas Split por delimiter. Realizamos funções como várias colunas, dividindo -se dentro da coluna, dividindo e adicionando uma nova coluna e, finalmente, dividindo -se especificando o número de divisões.