Série de pandas para CSV

Série de pandas para CSV

As séries.Método to_csv () ”em pandas produz o objeto da série especificado em uma notação de valores separados por vírgula (CSV). Essa função simplesmente pega os valores de uma série e modifica seu formato adicionando vírgulas para a separação dos valores do índice e da coluna.

Para empregar essa função, temos que utilizar a seguinte sintaxe:

Este artigo fornecerá duas técnicas diferentes para aprender as maneiras de empregar esse método em um programa Python.

Exemplo # 1: Utilizando a série.Método to_csv () para converter uma série com DateTimeIndex em valores separados por vírgula

Para modificar uma série em um formato CSV, empregaremos a “série.Função para_csv () ”. Esta ilustração gerará uma série com um DateTimeIndex e depois a converterá em um formato de valores separados por vírgula.

Para colocar esse método em operação, devemos ter uma ferramenta que suporta a programação do Python. A ferramenta "Spyder" é optada por compilar os códigos. Para escrever o script, lançamos a ferramenta instalada em nosso sistema. O programa Python precisa de uma biblioteca para exercer seus métodos para alcançar o resultado necessário. A biblioteca que carregamos aqui é o "pandas". Na mesma linha de código, o alias desta biblioteca é identificado como "PD". Então, onde quer que esteja no programa, precisamos escrever "pandas" para acessar uma função. Em vez disso, escrevemos "PD".

O primeiro passo para começar com o código é gerar uma série de pandas. Precisamos escrever “PD” para empregar o método de criação da série da Pandas. O “PD.A função da série () ”é chamada para construir uma série com os valores especificados. Os valores que fornecemos para a série são "Istambul", "Izmir", "Ancara", "Ancara", "Antalya", "Konya" e "Bursa". Se você quiser dar um nome a essa variedade de valores, pode fazê -lo usando o parâmetro "nome". Aqui, nomeamos essa variedade de valores “cidades”, pois está mantendo os nomes de 6 cidades. Para armazenar esta série, um objeto da série "Turquia" foi criado.

Para criar um DateTimeIndex, invocamos o “PD.Método date_range () ”. Entre os parênteses desta função, passamos por 4 argumentos que são: "Iniciar", "Freq", "Períodos" e "TZ".

O argumento "Start" leva uma data e hora para começar a gerar um intervalo de data a partir dele. Aqui, especificamos a data e a hora de início como “2022-03-02 02:30”. O parâmetro "Freq" está classificando a frequência para o intervalo de data. Então, fornecemos o valor "D". Agora, ele criará um intervalo de data na frequência diária. O argumento "período" é definido como "6", o que significa que ele gerará um intervalo de data para 6 dias. O último parâmetro é "TZ", que especifica o fuso horário para a área especificada. Especificamos o fuso horário para "Ásia/Istambul".

Para armazenar esse intervalo de data, criamos uma variável variável "DateTime". Para definir o DateTimeIndex, empregamos a “série.índice ”Propriedade. O nome da série "Turquia" é fornecido com o ".Propriedade do índice ”e atribuído a ele o intervalo de horário de data armazenado na variável“ DateTime ”. Assim, a propriedade "índice" retirará os valores da variável "DateTime" e fará com que eles a lista de índice da série "Turquia". Por fim, para visualizar a série de saída, empregamos o método "print ()" e passamos a série "Turquia" como entrada para exibir seu conteúdo.

Acabamos de pressionar a opção "Run File" para executar o script. Consequentemente, podemos ver uma série com o DateTimeIndex a partir de “2022-03-02 02: 30: 00+03: 00” e terminando em “2022-03-07 02: 30: 00+03: 00”, criando um período de 6 dias. Abaixo da série, o "Freq: D", o nome da lista de matrizes "Cities" e o Dtype "Object" também são mencionados.

Agora, aprenderemos a converter esta série que acabamos de ver no instantâneo acima em um formato CSV. Para modificar a série para valores separados por vírgula, temos um método fornecido pelo módulo Pandas, que é “Série.to_csv () ”. Este método leva os valores da série fornecida e adiciona vírgulas entre os valores da coluna.

As séries.A função to_csv () ”é chamada. O nome da série que queremos converter é mencionado com o método como “Turquia.to_csv () ”. Para preservar os valores separados por vírgula, criamos uma variável "Comma_separated" e depois colocamos seu conteúdo na janela de saída invocando a função "print ()".

Aqui está a nossa série no formato CSV. Podemos ver no instantâneo que o índice e os valores da série foram separados usando as vírgulas neles.

Exemplo # 2: Utilizando a série.Método to_csv () para converter uma série com valores de nan em valores separados por vírgula

A segunda técnica para exercer a “série.O método to_csv () ”é aplicar este método para converter uma série que está mantendo algumas entradas nulas em um formato CSV.

Inicialmente importamos os pacotes necessários. O "PD" é feito um pseudônimo para pandas e "np" como um alias para Numpy. O kit de ferramentas Numpy é carregado aqui porque faremos algumas entradas nulas em nossa série usando “np.Nan ”enquanto cria o PANDAS“ PD.Método da série ().

O “PD.A função Série () ”é invocada para a construção de uma série de pandas com esses valores:“ Nile ”,“ Amazon ”, NP.Nan, "Ganges", "Mississippi", "NP.Nan "," Yangtze "," Danúbio "," Mekong "," NP.Nan "e" Volga ". Há um total de 21 valores definidos para a série das quais 3 entradas estão segurando “NP.Valores de nan ”, o que significa que 3 valores estão ausentes na série. A propriedade "Nome" está especificando o nome para esta matriz de valores que fornecemos "títulos". A propriedade "índice" é utilizada para definir a lista de índice definida pelo usuário em vez de seguir a lista padrão.

Aqui, queremos a lista de índices com os valores "10", "11", "12", "13", "14", "16", "17", "18", "19", "20", e 21 ”. Agora, nossa série terá a lista de índices a partir de "10" em vez de "0". Agora, armazene esta série para que possamos usá -la mais tarde no programa. Inicializamos um objeto de série "Rivers" e otamos a série de saída gerada a partir de chamando o "PD.Método da série (). A série pode ser vista colocando -a em exibição usando a função "Print ()" por Python.

A saída renderizada no terminal imprimiu uma série cuja lista de índices está a partir de 10 e termina em 21, o que significa que a série está tendo 21 valores.

A série será transformada em um formato CSV com a “série.to_csv () ”método.

Nós invocamos a “série.to_csv () ”Método com nossa série“ Turquia ”. Portanto, esse método levará os valores da série “Turquia” e os converterá em um formato de valores separados por vírgula. O resultado é salvo na variável "convertida_csv". E, finalmente, a série convertida é impressa com a ajuda da função "print ()".

No instantâneo do resultado abaixo, você pode ver que os valores da série agora são alterados de uma maneira em que uma vírgula é usada para separá -los da lista de índices. Além disso, onde estão faltando os valores, apenas o número do índice é impresso com uma vírgula.

Conclusão

A modificação de uma série de pandas em um formato CSV é uma abordagem prática. Isso pode ser alcançado usando a série Pandas “.Função para_csv () ”. Este guia trouxe em prática duas técnicas para empregar este método. Na primeira ilustração, invocamos esse método para converter uma série com um DateTimeIndex em um formato de valores separado por vírgula. A 2ª instância usou a “série.TO_CSV () ”Função para modificar uma série com algumas entradas ausentes em um formato CSV. Ambas as técnicas foram praticamente implementadas usando a ferramenta "Spyder" no sistema operacional Windows.