Como usar os pandas .em função?
Nos pandas, o método AT é usado para extrair dados ou valores específicos de um quadro de dados e extrair valores do objeto da série. Para usar o .Em função para série e dataframe, temos que seguir sua sintaxe. Vejamos a sintaxe deles antes de usá -la para extrair dados.
Sintaxe de .na função nos quadros de dados
A sintaxe do quadro de dados.na função é a seguinte:
Sintaxe: Quadro de dados.na [posição, etiqueta]
Onde,
posição: Posição do elemento na coluna DataFrame.
rótulo: Nome da coluna a ser usada.
Valor de retorno: O valor localizado lá é retornado pelo .no método.
Erros: Se os argumentos fornecidos como rótulos da coluna e índice de linha estiverem fora dos limites ou estão ausentes no quadro de dados, o erro principal será levantado.
Sintaxe da função astype () na série
A sintaxe da série.na função é a seguinte:
Sintaxe: Series.no[]
Parâmetro: Nenhum
Não há parâmetro necessário para a série.No método, podemos obter o valor apenas usando o valor que queremos extrair dentro dos parênteses.
Retornos: Valor único é passado.
KeyError aumentará se o rótulo da série estiver ausente.
Agora, vimos a sintaxe do .em função com série e dataframe. Vamos implementar o .em função com série e quadro de dados nos exemplos a seguir, para que você aprenderá a usar o .em função por você mesmo.
Exemplo # 1: Recuperar dados por índice e nomes de colunas no DataFrame usando o DataFrame.na [] função
Agora vamos construir um quadro de dados com várias linhas e colunas para que possamos demonstrar nosso exemplo e examinar a saída. Antes de criar o DataFrame, importaremos o módulo de pandas. Os pandas são uma das ferramentas mais usadas em ciência de dados e aprendizado de máquina para limpar e analisar dados. O Pandas é a ferramenta ideal para lidar com esses dados caóticos do mundo real.
Os módulos de pandas foram importados para o script acima. Criamos várias listas segurando os registros de esportistas. Então criamos um DataFrame usando o PD.Função DataFrame (). Dentro do PD.Função DataFrame, passamos nossas listas (jogadores), colunas que contêm o nome de cada coluna do DataFrame e o índice para nomear o índice do nosso DA DATAFRAME DF. Para ilustrar nosso quadro de dados DF, usaremos a função Print () e, dentro dela, passaremos nosso DataFrame DF como uma entrada.
Você pode ver que existem 4 colunas nome, idade, esportes e país mostrando os dados de seis esportistas de diferentes esportes que pertencem a diferentes países.
Agora, recuperaremos o valor do elemento do nome da coluna "Esportes" no nome da linha "2".
Como você pode ver, ele recuperou o esporte "badminton" da linha no índice dois. Vamos considerar o exemplo em que tentamos recuperar o valor de uma célula, fornecendo um nome de linha que não está presente.
O console está exibindo um erro chave porque, em nosso quadro de dados, não há índice com o nome "7".
Exemplo # 2: recuperar dados do quadro de dados usando o nome da variável
Primeiro de tudo, importaremos a biblioteca de pandas para o ambiente atual. Usaremos o mesmo DataFrame DF neste exemplo, que foi criado no Exemplo # 1.
Depois de importar pandas, criamos 2 variáveis LOC para armazenar a posição do índice e o COL para armazenar o nome da coluna. Atribuímos 4 à variável loc e "nome" à variável col, o que significa que ele precisa recuperar dados do 4º índice da coluna de nome. Para examinar o resultado do DataFrame.Em função, podemos imprimir o valor recuperado passando seu nome de variável (i.e., obtenha) na função print ().
A saída pode ser comparada, como visto na saída, e pode -se notar que o valor na coluna Nome na quarta posição é semelhante à saída.
Esse .em [] apenas retorna um único valor, diferentemente.loc []. O DataFrame.Em [3: 6, col], portanto, retornará um erro. Esta abordagem é mais rápida do que. loc [] porque se aplica apenas a valores únicos.
Exemplo # 3: Especifique ou substitua um valor a uma linha/coluna específica usando o DataFrame.no[]
Usaremos o DF DataFame, que foi criado no Exemplo # 1. Primeiro, verificaremos os dados em nosso DATAFRAME DF usando a função print ().
Vamos supor que precisamos mudar os esportes na linha 5. Como você pode ver, atualmente o esporte na linha 5 é tênis. Vamos modificar o valor da célula neste exemplo. Usando dados.Quadro.no[]. Para substituir ou alterar os dados, precisamos acessar a célula específica primeiro.
Acessamos com sucesso a célula necessária. Agora, definiremos um novo valor nesta célula usando o DataFrame.na [] função.
Mudamos o valor de "tênis" para "basquete". Você pode ver a saída imprimindo nosso DATAFRAME DF DF.
Você pode observar que o valor na linha 5 e os esportes da coluna é alterado para basquete. Usando .Em [], você pode definir apenas o valor de uma coluna ou linha que existe em nosso quadro de dados; Caso contrário, ele exibirá um erro no console.
Exemplo # 4: Recupere um único valor em qualquer local em particular em uma série usando série.at [] atributo
Vimos dos exemplos abaixo como você pode extrair dados de célula única de .no[]. Agora, neste exemplo, obteremos o valor da série usando a série.at [] atributo. Primeiro, criaremos uma série de objetos depois de importar o módulo pandas.
Como você pode ver, criamos uma série contendo os nomes das pessoas. Para visualizar nossa série, a função print () pode ser usada.
Temos uma série de 6 nomes, indexando de 0 a 5. Para recuperar os dados de um local específico em uma série, podemos simplesmente passar o índice dentro dos parênteses da série.at [] atributo. Vamos recuperar o valor no local do índice 4.
Leo 'é o valor listado na posição 4 no objeto da série fornecida, como pode ser visto na saída da série.no atributo. Também podemos definir um valor em um local de índice especificado em série usando séries.em [] como fizemos no Exemplo # 3.
Conclusão
Neste artigo, discutimos como usar o .na propriedade [] para selecionar ou obter um valor celular individual ou dados de um quadro de dados de pandas. Implementamos exemplos diferentes neste artigo usando o DataFrame.em [] e série.No atributo [] para que você possa aprender como recuperar dados por nomes de índice e colunas no quadro de dados e recuperar dados do DataFrame usando um nome de variável, especificar ou substituir um valor a uma linha/coluna específica.