Orange é um software de mineração de dados que fornece a seus usuários soluções exclusivas e prontas para uso para problemas diários de análise de dados. Ele utiliza uma interface de programação visual que permite que os usuários entendam e controlem seus fluxos de trabalho de dados de maneira visualmente intuitiva. Na sua essência, ele usa módulos baseados em Python que o deixam herdar sua funcionalidade principal a ser implementada nos dados que são carregados nele. Além das técnicas de mineração de dados, ele também fornece um ótimo suporte para algoritmos de aprendizado de máquina que ajudam os usuários a gerar insights profundos a partir de seus dados.
O Orange é amplamente utilizado no domínio educacional e de pesquisa e é considerado uma ótima ferramenta por grupos de pesquisa não baseados em programação. A interface de programação visual chamada Tela laranja facilita a realização do trabalho mesmo para pessoas que não têm uma formação abrangente em programação. A tela funciona deixando os usuários colocarem widgets que representam alguma funcionalidade principal de um fluxo de trabalho de análise de dados. Esses widgets podem então ser empilhados um após o outro para criar um pipeline completo pelo qual os dados se movem e gera a saída necessária.
No final deste artigo, você poderá:
Instalação
Como discutido anteriormente, Orange usa módulos Python, e é por isso que pode ser facilmente baixado do Python Package Manager chamado pip. Para usar o PIP, primeiro precisamos baixar e instalá -lo.
Siga as etapas para a instalação completa de laranja em sua máquina Linux.
1. Primeiro, precisamos atualizar o local apt Repositórios usando o seguinte comando:
Atualização $ sudo apt-get
Você deve obter uma saída que seja semelhante a isso:
2. Depois de atualizar o apt Repositórios locais, agora você instala alguns pacotes Python que o ajudarão a baixar e instalar Laranja. Isso é feito, já que o Orange é essencialmente um módulo Python que usa alguma funcionalidade principal de outros módulos Python para fornecer a você recursos de mineração e análise de dados.
Execute o seguinte comando para baixar o pip gerente de pacotes e python virtualenv configurar:
$ sudo apt-get install git python-pip python-virtualenv
Você deve obter uma saída semelhante a isso:
Agora, execute o segundo comando que baixa todos os módulos Python necessários exigidos pela Orange para executar corretamente:
$ sudo apt-get install git python3-dev python3-numpy python3-scipy
python3-pyqt4 python-qt4-dev python3-sip-dev libqt4-dev
Observação: Este comando pode levar algum tempo para concluir a corrida, dependendo da sua conexão com a Internet.
Em segundo lugar, você pode ser solicitado a pressionar o Y Chave para aceitar a instalação de outros pacotes principais.
Você deve esperar uma produção semelhante a isso:
3. Agora criamos um ambiente virtual para instalar todos os Laranja módulos e dependências.
Execute os seguintes comandos:
$ mkdir Orange3env
$ virtualenv -p python3-packages-sistema Orange3Env
$ fonte Orange3Env/Local/Bin/Ative
Observação: Se o comando anterior não funcionar, execute o seguinte comando:
$ fonte Orange3env/bin/ativação
4. Instalar Laranja ligando pip que baixamos anteriormente.
Execute o seguinte comando:
$ pip install Orange3
Você deve obter a seguinte saída:
5. A saída bem -sucedida da etapa anterior significa que Laranja foi baixado e instalado usando o Python Package Manager pip.
Agora executamos o seguinte comando para executar laranja:
$ python -m laranja.tela
Observação: Se o seguinte Laranja As telas da GUI se abrem, isso significa que todos os seus esforços foram bem -sucedidos e o Orange é instalado e aberto em sua máquina Linux.
Guia de usuario
Orange é uma ferramenta prática de mineração e análise de dados que permite aos usuários criar fluxos de trabalho de análise de dados de maneira visual e interativa. Isso significa que você pode criar modelos complexos usando uma técnica simples de arrastar e soltar.
O módulo laranja vem com uma tela que pode ser usada para arrastar e soltar os widgets que representam as diferentes funcionalidades. Vamos construir um pipeline simples neste guia que importa os dados para laranja e depois executar algumas ações nesses dados e produzir os resultados.
Por exemplo, podemos ver todas as diferentes maneiras da imagem a seguir em que os dados podem ser importados para a ferramenta laranja, que incluem a importação de tabelas SQL, arquivos CSV, dados de pintar e mais.
Importamos os dados de um arquivo CSV para os fins deste tutorial.
Agora que especificamos qual formato de dados esperamos entrar em nosso pipeline, selecionamos uma ação que queremos executar nesses dados.
Nós agora vamos para o Transformar guia e selecione o widget aleatório que leva todas as entradas de dados em nossos dados e randomize seu pedido.
Agora que sabemos o que queremos fazer com nossos dados importados, podemos escolher como queremos exibir os resultados desses dados.
Para o nosso guia, vamos construir um gráfico de barra dos dados randomizados para que possamos ver a que classes os dados pertencem e quanto dos dados estão contidos nessas classes.
Depois que os dados são importados para o modelo que criamos, ele atravessa automaticamente todo o pipeline, seguindo o seu caminho da importação para a criação da plotagem da barra. A saída que recebemos em nossos dados pode ser vista no seguinte:
Além disso, também podemos simplesmente exibir os dados usando o widget Tabela de dados na categoria Visualize.
Conclusão
Como pode ser visto, trabalhar em laranja para ciência de dados é extremamente fácil e intuitivo. Tudo o que você precisa fazer é arrastar e soltar as diferentes funcionalidades que você deseja que seus dados passem e colete as saídas. Essa ferramenta é especialmente útil para as pessoas que não têm formação de programação, mas ainda precisam executar determinadas avaliações em seus dados. As comunidades de pesquisa e academia usam Laranja abundantemente, pois permite que eles gerem a inferência e as idéias de seus dados com relativa facilidade e pouco ou nenhum conhecimento prévio de programação.