Pandas para string

Pandas para string
“As abordagens DataFrame e série que os pandas nos oferecem podem ser usadas para todas as colunas do seu quadro de dados e foram projetadas para trabalhar com strings. Usando o método "ApplyMap (str)", podemos alterar o quadro de dados em strings, como você pode ver na amostra abaixo. Este método converterá facilmente um tipo de dados em um tipo de string. Nos pandas, usamos principalmente o "objeto" como o tipo de dados para string. Podemos determinar o número total de caracteres incluídos nos valores da coluna, utilizando a técnica "comprimento ()" no processamento de strings.”

A sintaxe para converter o DataFrame para string

A sintaxe para apresentar o comprimento dos valores de string presente em uma coluna

Exemplo 1: Converta o DataFrame em strings usando o ApplyMap (STR)

Em Python, existem muitos métodos construídos para trabalhar com strings. Cada um desses métodos retorna um novo valor sem alterar a string original. Para valores de string, o tipo de dados "objeto" é usado. Em Python Pandas, o tipo de dados de texto é referido como uma "string" ou um "objeto". Uma string pode incluir uma frase de palavra ou também pode ser um número. Nesse caso, usaremos "ApplMap (str)" para transformar um quadro de dados inteiro em um tipo de string. O "Apply (STR)" é usado para converter os números inteiros em strings, e o ApplaMap (STR) é utilizado para converter o quadro de dados completo em strings.

Vamos agora falar sobre executar nosso código. Para executar nosso código, usamos a ferramenta "Spyder". A biblioteca de pandas deve ser importada primeiro como "PD". Nós então construímos nosso quadro de dados. O DataFrame é chamado "Data". Temos três colunas neste "curso", "taxa" e "hora de crédito". Essas colunas agora têm certos valores atribuídos a eles. Temos uma lista de cursos "Python", "OOP", "Virtual_ Studio" e "Java" na coluna "Curso". Os valores para a coluna "Taxa" que temos "35000", "30000", "20000" e "15000" e na última coluna "Credit_hour", temos "3", "4", "3" e " 3 ”. Portanto, o “PD.DataFrame ”está sendo usado para criar o quadro de dados. Nesta ilustração, também estamos exibindo os "tipos de dados" do nosso programa usando a função "print ()" com "df. tipos de dados". Em essência, “df.Datatipos ”é usado para criar um tipo de dados para um DataFrame.

Agora estamos nos mudando para o objetivo principal do nosso programa. Para converter o quadro de dados em uma string, utilizamos “df.AplicarMap (STR) ”. Usando o método "ApplyMap ()", uma função pode ser aplicada duas vezes a qualquer elemento de dados de dados. Nos pandas, o "STR" é usado principalmente para recuperar os valores dos quadros de dados ou séries. O que está ocorrendo neste programa é que esta função converte os tipos de dados de "Inteiro" para "String" Tipos de dados. Invocando a função "print ()", agora estamos exibindo nosso quadro de dados e seus tipos de dados depois de usar o "ApplyMap (str)".

Dois quadros de dados com os tipos de dados serão exibidos na imagem de saída do nosso programa. Podemos ver no segundo quadro de dados que ele converteu o quadro de dados em uma string alterando o tipo de dados. Os tipos de dados inteiros agora são mostrados como tipos de dados "objeto". Para string, usamos "objeto" como o tipo de dados. Esse tipo de dados da string "objeto" permite que ele seja um único valor, número ou frase. No primeiro DataFrame, os tipos de dados para as colunas "Taxa" e "Credit_hour" eram inteiros; No entanto, depois de serem convertidos em cordas, os tipos de dados para essas colunas são exibidos como "objetos". Por fim, exibe "dtype: objeto", indicando que foi convertido em uma string.

Exemplo 2: Valores da coluna de conversão para o tipo de string usando a função "ASTYPE ()"

Neste exemplo, um tipo de dados de uma única coluna será convertida em um tipo "string". No exemplo anterior, todo o quadro de dados foi convertido em strings, enquanto neste caso, apenas uma única coluna é convertida em strings. Convertemos a coluna em tipo de string usando a função "ASTYPE ()". A função "ASTYPE ()" em pandas é utilizada principalmente quando desejamos transformar um tipo de dados em outro tipo de dados; No entanto, existem outros métodos alternativos no Python para alterar simultaneamente um ou mais tipos de dados.

Agora comece a codificação. A biblioteca de pandas deve primeiro ser importada como um “PD.”A etapa a seguir envolve a criação do quadro de dados com o mesmo nome que os“ dados ”do estágio anterior. Este DataFrame possui quatro colunas "Curso", "Cobras", "Duração" e "Desconto". Para cada uma dessas colunas, listamos certos valores. Os valores na primeira coluna são os seguintes "Java", "Graphic_desiging", "Android_studio" e "OOP". Na segunda coluna, "Cobras", temos "20000", "21000", "20000" e "24000". Temos os valores "1_month", "2_month" e "3_month" na terceira coluna, "duração" e, na entrada final, temos os descontos "20%" e "30%" para os cursos. O DataFrame é então gerado usando “PD.quadro de dados". O DataFrame agora será exibido na tela usando a função "print ()", e seus tipos de dados também serão impressos usando o "DF.comando dtypes ”.

Agora usaremos a função "astypes ()" para converter a coluna em particular em uma string. Com "astype ()" e o nome da coluna de parâmetros "cobranças" e tipo de dados "string" dentro dela, estamos convertendo a coluna "cobranças" em uma string neste caso. Agora, aplicaremos a função "print ()" para mostrar os resultados na tela.

Como podemos ver, o tipo de dados para a coluna "Charge" no primeiro caso é "Int64", o que significa que os valores na coluna são inteiros, mas quando a coluna foi convertida em uma string, uma "string" foi mostrada em Frente da "carga" como um tipo de dados. O tipo de dados para uma string no python é um "objeto" e, como as três colunas restantes são strings, isso indica que agora todo o quadro de dados será transformado em strings.

Exemplo 3: Determinando o comprimento da string para uma determinada coluna em um quadro de dados

Neste exemplo, determinaremos o comprimento de cada valor da string para uma determinada coluna no quadro de dados. Usando a função "comprimento ()", podemos determinar o comprimento dos valores de string. Este método é usado para determinar o total de caracteres em uma string de entrada.

Depois de importar a biblioteca de pandas para iniciar o terceiro exemplo do nosso artigo, devemos construir um DataFrame com três colunas, semelhante ao exemplo anterior, usando “PD.quadro de dados". "Student_name", "roll_number" e "Total_marks" estão disponíveis como colunas. Essas colunas estão listadas com alguns valores. "Albert", "Jhon", "Ava", "Oliver" e "Amelia" estão listados na primeira coluna, enquanto seus números de rolo são listados na segunda coluna como "1", "2", "3", " 4 "e" 5 ". E na coluna final, fornecemos suas marcas finais "498", "470", "444", "390" e "489", respectivamente. Agora que a declaração "DataFrame" foi impressa, usaremos a função "print ()" para exibir o quadro de dados por baixo.

Depois disso, exibimos uma linha de declaração que diz: "Calculando o comprimento da string em uma coluna" e estamos calculando isso usando a função "comprimento ()". Podemos observar em nosso quadro de dados que a coluna "Student_name" contém valores de string para que possamos determinar o comprimento de seus valores. Usamos esta coluna. Portanto, estamos utilizando "DF [nome do aluno]" com "Apply (Len)". Isso adicionará o número total de cada um dos valores nesta coluna, que será exibido como uma nova coluna no DataFrame com o nome "Student_name_length". Vamos recorrer aos seus resultados atualmente.

Dois quadros de dados são exibidos aqui, como você pode ver. O segundo dataframe tem uma coluna adicional, "student_name_length" e, como podemos ver, ele calculará o número inteiro de palavras e exibirá lá. Por exemplo, o nome "Albert" tem um total de 6 caracteres. Isso indica que esta função opera com sucesso em nosso programa.

Conclusão

Os pandas oferecem vários métodos para transformar um dados de dados em uma string. Todo o DataFrame pode ser convertido em uma string usando "ApplyMap (STR)", que transformará o tipo de dados inteiro para string. Calcular os caracteres dos valores de string em uma coluna usando o método "length ()" também é muito útil. Se desejarmos calcular vários valores únicos, esta técnica de pandas nos simplificará. Será mais simples para trabalharmos se aplicarmos estratégias pequenas e diretas. Prevemos que, se empregarmos essas estratégias de maneira eficaz, nosso trabalho será muito simples.