Pandas para Numpy

Pandas para Numpy
A “Biblioteca de Análise de Dados Python” é “pandas”. Em "Pandas", a série é simples de gerar, e também podemos transformá -los em matrizes Numpy. Sugere -se utilizar a matriz Numpy sempre que possível devido ao seu gerenciamento abrangente de dados. Os dados podem ser rápidos e facilmente dimensionados e normalizados usando matrizes Numpy, que podem ser usadas para preparar os dados para treinar modelos de aprendizado de máquina. O pacote "Pandas" oferece diferentes maneiras de transformar a série em uma matriz Numpy. Discutiremos todos os métodos que nos ajudam a transformar a série "Pandas" na "Array Numpy". Este artigo mostrará todas as maneiras possíveis de mudar a série para uma matriz Numpy e aplicar todos os métodos em nosso código "pandas" aqui.

Métodos para transformar a série "pandas" em "Numpy Array"

Os "pandas" facilitam três métodos distintos que nos ajudam a transformar a série "pandas" na "matriz numpy". Esses métodos são discutidos nesta seção:

  • Pandas.Series.função to_numpy ()
  • Pandas.Series.Propriedade dos valores
  • Pandas.Series.propriedade da matriz

Aplicaremos esses métodos à série "Pandas" para transformar a série "Pandas" na "Array Numpy". Também mostraremos vários exemplos neste artigo em que utilizamos esses métodos.

Exemplo # 01

Esses códigos são apresentados neste artigo usando a ferramenta “Spyder”. Para criar a série "pandas", devemos "importar" os módulos de "pandas". Então, adicionamos "importação" e, com a ajuda dessa "importação", estamos importando os "pandas como PD". Então, criamos uma série colocando “PD.Série ”e acrescentou“ Finlândia, Dinamarca, Hungria, Angola, Israel, China e América ”nesta série e também armazenou esta série na variável“ Série_data ”. Temos o "print ()" no qual colocamos "série_data", então esta série imprimirá no terminal. Simplesmente mostramos a série e, depois de mostrar a série, converteremos esta série em "Numpy Array".

A série é exibida aqui, pois executamos este código com a ajuda das teclas "Shift+Enter". Observe que a série contém os valores do índice padrão. Vamos seguir em frente para transformar esta série na matriz Numpy.

Estamos utilizando os “pandas.Series.Método to_numpy () ”, que mudará a série para a matriz Numpy. Adicionamos uma variável "Array" para armazenar a matriz Numpy, que recebemos depois de aplicar os “pandas.Series.para_numpy () ”função. Colocamos o nome da série, que é "série_data", e depois o método "to_numpy ()". Então, esta série se converte na matriz Numpy. Também queremos mostrar essa matriz Numpy, por isso adicionamos a variável "Array" na "Print ()".

A série anterior agora é transformada na matriz Numpy e também é mostrada neste resultado. A matriz Numpy não contém os valores do índice, como mostrado aqui:

Exemplo # 02

Utilizamos duas bibliotecas, "Pandas" e "Numpy". A série que criamos é o "Job_data" usando "PD.Série ", e contém" freelancer, engenheiro de software, médico, escritor técnico, professor, instrutor e construtor ". Primeiro imprimimos esta série “Job_Data” e depois convertemos a série “Job_Data” na matriz Numpy, colocando o “NP.Método Array () ”e adicionando o nome da série a ele, e também colocando o“ Array ”com o nome da série dentro desta função. Isso transformará a série "Job_Data" na "Array Numpy" e salvá -la em "Job_array". Em seguida, passamos "Job_array" para a "impressão".

A série e a matriz Numpy são mostrados nesta saída. Observe que a série contém os valores do índice, mas a matriz Numpy não possui os valores do índice.

Exemplo # 03

A série "FRUITS_DATA" neste código contém "Mulberry, Date Palm, Cherry, Orange, Peach, Damasco, Olive, Apple, Pear e Melancia". Em seguida, escrevemos "print ()" e adicionamos "frutits_data" a ele. Depois disso, transformamos a série "FRUITS_DATA" em The Numpy Array com a ajuda do método "to_numpy ()". Esta matriz Numpy também é armazenada no "FRUITS_ARRAY", e o "FRUITS_ARRAY" é adicionado ao "Print ()".

Aqui estão a série "Pandas" e a matriz Numpy no resultado do código anterior. Você também pode observar a série e as diferenças de matriz Numpy aqui:

Exemplo # 04

Aqui, usamos bibliotecas "Numpy" e "pandas". Utilizando “PD.Série ", construímos uma série chamada" Data "que inclui" AY123, AY678, AY876, AY908, AY987, AY912, AY456 e AY012 ". A série "Data" é impressa pela primeira vez e depois é transformada em uma matriz Numpy usando o “NP.Método Array () ”, adicionando o nome da série e depois“ valores ”. Também estamos armazenando a matriz Numpy na variável “new_array”. A série "Data" se transformará na "Array Numpy" e será salva no "new_array."O" new_array "é passado para a" impressão ".

Esta saída fornecida exibe tanto a série quanto a matriz Numpy. Lembre -se de que a matriz Numpy não possui os valores do índice, mas a série contém valores de índice.

Exemplo # 05

Agora, estamos criando o quadro de dados "s_df", colocando o método "pandas", que é "dataframe ()" neste caso. Adicionamos colunas diferentes, e cada coluna do DataFrame também é chamada de série. Adicionamos "nome" que contém "Roman, Collins, Ethan, Poppy, Edward, Archie, Benjamin e Bromley". Então, as "marcas" chegam a seguir, adicionando "278, 344, 239, 310, 485, 298, 453 e 670". Em seguida, inserimos “37%, 54%, 15%, 59%, 76%, 34%, 61%e 80%” na coluna “porcentagem”. Digitamos "print ()" e adicionamos "s_df" a ele. Então, o "s_df" será exibido.

Agora, estamos convertendo duas colunas do DataFrame na matriz Numpy porque também discutimos que a coluna do DataFrame também é a série de "pandas". Primeiro convertemos a série "Nome" em Numpy Array usando "NP.Array "e adicionando" S_DF "DataFrame com a coluna" Nome "e depois digitando" valores "com ele. Salvamos essa matriz Numpy na variável "my_array1" e depois a exibimos. Aplicamos o mesmo método, mas desta vez mencionamos a coluna "Marks" do DataFrame para convertê -lo na matriz Numpy. Esta segunda matriz Numpy é salva em "my_array2" e adicionada à "impressão" para renderizar.

O DataFrame é apresentado primeiro. Em seguida, a coluna "nome" ou a série "nome" é convertida na matriz Numpy e exibida. Além disso, a coluna "Marks" é convertida na matriz Numpy e renderizada aqui.

Exemplo # 06

Agora, leremos o arquivo CSV aqui e depois converteremos seus dados no quadro de dados e séries. Além disso, a série na matriz Numpy. O "file_data" é inicializado com o "PD.read_csv () ”, e o caminho do arquivo CSV é inserido nele. Estamos lendo o “arquivo.CSV ”, e esse método converte os dados do arquivo no DataFrame e o armazena no“ file_data ”. Também adicionamos o método "Dropna ()", que soltará os valores nulos se estiver presente neste DataFrame.

Agora, usamos “impressão” e, depois disso, utilizamos o “PD.Método da série () e adicione o nome do quadro de dados e uma coluna do DataFrame, que é "s_location". Isso o converterá em uma série e salvá -lo em "my_series". Estamos aplicando o método "to_numpy ()" para converter os dados "s_location" na matriz Numpy, e o método "to_numpy" é adicionado em "impressão", por isso também será exibido.

Os dados que obtemos depois de ler o “arquivo.O CSV ”é exibido na forma do quadro de dados e, em seguida, uma de suas colunas,“ s_location ”, é convertida na matriz Numpy.

Conclusão

Neste artigo, discutimos a matriz Numpy em "Pandas". Aqui, explicamos usando métodos diferentes para transformar uma série "pandas" em The Numpy Array. Vimos as idéias de transformar a série em uma matriz Numpy e também transformar colunas do quadro de dados em uma matriz Numpy. Além disso, este artigo demonstrou como lidar com valores nulos ao transformar uma série em uma matriz Numpy. Neste tutorial, usamos três métodos distintos, que facilitam bastante a conversão da série na matriz Numpy. Este conceito foi completamente explicado aqui.