Como instalar e usar o Rattle no Linux para criar algoritmos complexos de mineração de dados

Como instalar e usar o Rattle no Linux para criar algoritmos complexos de mineração de dados

Chocalho é uma ferramenta gráfica baseada em interface do usuário que usa R para correr. É usado para mineração de dados e visualização. A Rattle fornece certas funcionalidades a seus usuários que lhes permitem construir relatórios exploratórios de análise de dados, transmutar dados para que possam ser executados por diferentes modelos estatísticos e matemáticos, construir modelos de aprendizado de máquina não supervisionados e supervisionados para os dados e exibir os resultados em um visual, maneira intuitiva. Esses resultados podem ser exibidos em gráficos, gráficos e gráficos dimensionais variáveis.

Tudo isso é feito usando o núcleo R funcionalidade da estrutura. Rattle converte todas as ações que você executa em sua interface gráfica em um script R que é executado pela instalação R subjacente. É assim que o Rattle pode alcançar toda a sua poderosa funcionalidade de análise de dados.

Instalação

Para instalar Chocalho Na sua máquina Linux, você precisará de um invólucro especial do gerenciador de pacotes que poderá fazer o download e instalar todas as dependências de chocalho em sua máquina. Isto é o Wajig ferramenta para Linux, que atua como um invólucro em torno do padrão apt e dpkg Gerentes de pacotes. Forneceu fácil utilidade para APT e DPKG e adicionou funcionalidade além desses dois gerentes de pacotes.

1. Vamos começar instalando Wajig Ao executar o seguinte comando no terminal:

$ sudo apt-get install wajig


Você deve ver uma saída de terminal semelhante a este:


2. Agora adicionaremos alguns repositórios de software usando arquivos de pacotes pessoais (PPA) que contêm as dependências necessárias para executar o chocalho.

PPAs são repositórios de software e aplicativos projetados para executar em máquinas Linux. Isso permite que os desenvolvedores distribuam o software criado usando o link para o repositório.

Execute os seguintes comandos:

$ wajig addrepo ppa: marutter/rrutter4.0


$ wajig addrepo ppa: c2d4u.Equipe/C2D4U4.0+



3. Vamos atualizar o Wajig Lista de fontes de repositório local para que os repositórios de software que adicionamos anteriormente possam ser descobertos pelo gerenciador de pacotes e posteriormente baixados e instalados.

Execute o seguinte comando:

$ wajig distupgrade


4. Como o Rattle usa R e r-cran Para executar com sucesso, instalaremos aqueles que usam o Wajig Package Manager. Também estaremos instalando algumas outras dependências junto com os pacotes R acima mencionados.

Execute o seguinte comando:

$ wajig install libgtk2.0-DEV R-BASE-DEV R-RE-RE-RECOMENDO


Você deve ver uma saída semelhante à imagem a seguir em seu terminal:


5. Com R agora instalado, vamos executá -lo e instalar Chocalho de dentro r.

Execute o seguinte comando para executar R:

$ R


Você deve ver um prompt de R semelhante aberto em seu terminal:


6. Agora vamos instalar o Chocalho Pacote de dentro de R executando os seguintes comandos:

> Instale.Pacotes ("Rattle")


Você deve ver uma saída de terminal semelhante:


Se o comando anterior não funcionar para você, tente o seguinte comando:

> Instale.Pacotes ("https: // acesso.TOGAWARE.com/rgtk2_2.20.36.2.alcatrão.gz ", repos = nulo)
> Instale.Pacotes ("rgtk2")


7. Depois que ambos os comandos são baixados e instalados, podemos carregar o Chocalho pacote na biblioteca R.

Execute o seguinte comando no prompt R:

> Biblioteca (chocalho)



8. Com Chocalho carregado no R Biblioteca, podemos executá -lo executando o seguinte comando no prompt R:

> Rattle ()


Você deve ver uma instância de chocalho se abrir em sua máquina Linux.

Guia de usuario

Podemos usar Chocalho Para configurar nossa rotina de mineração de dados de acordo com nossos requisitos. Como você pode ver na imagem acima, existem diferentes opções que você pode configurar.

No Dados guia, podemos selecionar diferentes formatos de arquivos de dados, incluindo arquivos de valor separados por vírgula, arquivos de texto, bancos de dados abertos e até dados contidos nos scripts. Isso permite que o Rattle insira dados de qualquer forma que exija.


Depois de importar os dados, podemos visitar o Transformar guia para fazer alterações em nossos dados. Podemos selecionar categorias únicas ou múltiplas em nossos dados e fazer transformações de acordo com nossas necessidades. Podemos alcançar rapidamente as coisas selecionando os botões de rádio por cima e reordenando os dados com base em alguma prioridade ou classificação que atribuímos. Podemos normalizar os dados escalando -os com base em algum intervalo que fornecemos, ou podemos aumentar os valores ausentes, colocando o valor médio, mínimo ou máximo encontrado em uma categoria.


Essas são apenas algumas coisas que podemos fazer com o Chocalho Ferramenta baseada em GUI.

Conclusão

Rattle é uma ferramenta de mineração de dados muito popular que continua a crescer em popularidade devido à sua interface de usuário gráfica fácil de usar. Não requer nenhum tipo de código para ser escrito e pode ser simplesmente usado interagindo com sua interface de aplicativo. Pesquisadores, estudantes e programadores em todo o mundo o usam para atender aos requisitos de mineração de dados. Como o Rattle fornece um back -end muito sofisticado, ele pode atingir requisitos complexos de ciência de dados estatísticos e analíticos com poucos cliques de mouse.

O Rattle é uma das melhores ferramentas disponíveis para as pessoas que estão apenas começando sua jornada de ciência de dados, pois é extremamente poderosa e fornece controles intuitivos que os usuários podem aprender. O chocalho é altamente recomendado pelos analistas de dados juniores e especialistas em todo o mundo devido à sua capacidade inata de ajudar a criar alguns dos pipelines de mineração de dados mais poderosos usados ​​hoje.