Lista dos 10 melhores livros e descrições de ciências de dados para o generalista

Lista dos 10 melhores livros e descrições de ciências de dados para o generalista

A Ciência dos Dados é o campo de estudo que lida com grandes quantidades de dados usando métodos científicos, processos, algoritmos e sistemas para encontrar os padrões invisíveis, derivar informações significativas, tomar decisões de negócios em empresas e também usar em instituições não comerciais. As instituições não comerciais incluem indústrias para assistência médica, jogos, reconhecimento de imagens, sistemas de recomendação, logística, detecção de fraude (instituições bancárias e financeiras), pesquisa na Internet, reconhecimento de fala, publicidade direcionada, planejamento de rota aérea e realidade aumentada. A ciência de dados é um subconjunto de inteligência artificial. Os dados usados ​​para análise podem vir de muitas fontes diferentes e são apresentados em vários formatos. Alguns dos dados de origem podem ser padronizados; Outros podem não ser padronizados.

Para colocá -lo de outra maneira, diferentes metodologias são usadas para coletar os dados (plural de dados). Em seguida, o conhecimento (conclusões valiosas) é extraído dos dados montados. No processo, após a coleta dos dados, a pesquisa é feita sobre eles (dados) para obter novos dados (resultados) dos quais os problemas são resolvidos.

A ciência dos dados como disciplina (principal) existe no nível de bacharelado e mestrado na universidade. No entanto, apenas poucas universidades do mundo oferecem a ciência de dados no bacharel ou mestrado. No nível de bacharel, os estudantes se formam com um diploma em ciência de dados. Isso é como um diploma de propósito geral. No nível de mestrado, o aluno sai com uma pós -graduação em ciência de dados, especializada em análise de dados, engenharia de dados ou como cientista de dados.

Pode surpreender o leitor e, possivelmente, infelizmente, que o aprendizado de máquina, modelagem, estatística, programação e bancos de dados são conhecimentos de pré -requisito para estudar a ciência de dados no nível de bacharel, apesar de serem respeitados cursos universitários em seus próprios direitos, estudados em Outras disciplinas no nível de bacharel ou nível de mestre. Não obstante, quando um aluno vai a uma universidade para estudar ciência de dados no nível de graduação, todos esses cursos ainda serão estudados, juntamente ou antes dos cursos adequados, para ciência de dados.

Ciência de dados para o diploma de bacharel ou suas especializações como análise de dados, engenharia de dados ou cientista de dados ainda está sendo desenvolvido; embora tenham chegado a um estágio em que são aplicados nas indústrias depois de terem sido estudados (na universidade). A ciência de dados é uma disciplina relativamente muito nova, geral.

Lembre -se de que você deve primeiro ser um generalista antes de se tornar um especialista. As distinções entre programas de especialistas ainda não estão claros. As distinções entre o generalista e os programas especializados ainda não estão claros.

Como a ciência dos dados é uma disciplina relativamente nova, os livros prescritos neste documento são baseados na cobertura de conteúdo e não na pedagogia (como o livro ensina). E eles são para o programa de bacharel (generalista). Existem diferentes cursos generalistas.

A lista

Para mais detalhes e possível compra com cartão de crédito, um hiperlink para cada um dos livros é fornecido. Nenhum dos livros cobre todos os cursos generalistas.

Matemática essencial para ciência de dados: cálculo, estatística, teoria de probabilidade e álgebra linear

Escrito por: Hadrien Jean

  • Editor: Hadrien Jean
  • Data publicada: após 30 de setembro de 2020
  • Idioma: inglês
  • Não. de páginas: mais de 400

O conteúdo deste livro pode ser visto como o curso de matemática para ciência de dados. Embora não seja recomendado aprender ciência de dados por si mesmo, um graduado do ensino médio que deseja aprender a ciência de dados por si mesmo deve começar com este livro.

Conteúdo: cálculo; Estatística e probabilidade; Álgebra Linear; Escalares e vetores; Matrizes e tensores; Extensão, dependência linear e transformação espacial; Sistemas de equações lineares; Vetores próprios e autovalores; Decomposição do valor singular.

https: // www.EssentialMathfordatascience.coma

Um guia de senso comum para estruturas e algoritmos de dados: subir de nível suas habilidades de programação principal / 2ª edição

Escrito por: Jay Wengrow

  • Editora: Pragmatic Bookshelf
  • Data publicada: 15 de setembro de 2020
  • Idioma: inglês
  • Dimensões: 7.5 x 1.25 x 9.25 polegadas
  • Não. de páginas: 508

Este livro lida com algoritmos e estruturas de dados que são usadas na ciência de dados. Supondo que alguém esteja aprendendo ciência de dados sozinho depois de se formar no ensino médio, este é o próximo livro a ler depois de ler o livro de matemática anterior. Os programas de exemplo são apresentados em JavaScript, Python e Ruby.

Conteúdo: por que as estruturas de dados são importantes; Por que os algoritmos são importantes; O sim! Grande notação o; Acelerando seu código com Big O; Otimizando o código com e sem grande O; Otimizando para cenários otimistas; Grande O no código cotidiano; Buscando uma pesquisa rápida com mesas de hash; Criação de código elegante com pilhas e filas; Recorrente recursivamente com recursão; Aprendendo a escrever em recursivo; Programaçao dinamica; Algoritmos recursivos para velocidade; Estruturas de dados baseadas em nó; Acelerando todas as coisas com árvores de busca binária; Manter suas prioridades diretas com montes; Não dói para Trie; Conectar tudo com gráficos; Lidar com restrições de espaço; Técnicas para otimização de código

Ciência de dados mais inteligente: sucesso com dados de grau corporativo e projetos de IA / 1st Edição

Escrito por: Neal Fishman, Cole Stryker e Grady Booch

  • Editor: Wiley
  • Data publicada: 14 de abril de 2020
  • Idioma: inglês
  • Não. de páginas: 286

Conteúdo: escalar a escada da IA; Enquadramento Parte I: Considerações para as organizações usando a IA; Enquadramento Parte II: Considerações para trabalhar com dados e IA; Uma retrospectiva das análises: mais de um martelo; Um olhar para a Analytics: nem tudo pode ser um prego; Abordando as disciplinas operacionais na escada da IA; Maximizar o uso de seus dados: sendo orientado por valor; Avaliar dados com análise estatística e permitir acesso significativo; Construindo a longo prazo; O final de uma jornada: um IA para ai.

Aprendizado de máquina: uma perspectiva probabilística (série de computação adaptativa e aprendizado de máquina) edição ilustrada

Escrito por: Kevin P. Murphy

  • Editor: The MIT Press
  • Data publicada: 24 de agosto de 2012
  • Idioma: inglês
  • Dimensões: 8.25 x 1.79 x 9.27 polegadas
  • Não. de páginas: 1104

Este livro é bom para iniciantes. Novamente, como todo o restante dos livros prescritos neste documento, este livro não cobre tudo o que é necessário para o programa generalista que, infelizmente, ainda não está finalizado (os programas especializados também não estão finalizados). O iniciante típico aqui é um graduado do ensino médio com um passe em matemática e ciência da computação.

Conteúdo: Introdução (aprendizado de máquina: o que e por quê?, Aprendizagem não supervisionada, alguns conceitos básicos no aprendizado de máquina); Probabilidade; Modelos generativos para dados discretos; Modelos gaussianos; Estatísticas bayesianas; Estatísticas freqüentistas; Regressão linear; Regressão logística; Modelos lineares generalizados e a família exponencial; Modelos gráficos direcionados (Nets Bayes); Modelos de mistura e o algoritmo EM; Modelos lineares latentes; Modelos lineares esparsos; Kernels; Processos gaussianos; Modelos de função de base adaptativa; Modelos Markov e Hidden Markov; Modelos de espaço estadual; Modelos gráficos não direcionados (campos aleatórios de Markov); Inferência exata por modelos gráficos; Inferência variacional; Mais inferência variacional; Inferência de Monte Carlo; Inferência de Markov Chain Monte Carlo (MCMC); Clustering; Aprendizado de estrutura de modelo gráfico; Modelos variáveis ​​latentes para dados discretos; Aprendizado profundo.

Ciência dos Dados para Negócios: O que você precisa saber sobre Mineração de Dados e Pensamento Analítico de Dados / 1ª Edição

Escrito por: Tom Fawcett e Foster Provost

  • Editora: O'Reilly Media
  • Data publicada: 17 de setembro de 2013
  • Idioma: inglês
  • Dimensões: 7 x 0.9 x 9.19 polegadas
  • Não. de páginas: 413

Conteúdo: pensamento analítico de dados; Problemas de negócios e soluções de ciência de dados; Introdução à modelagem preditiva: da correlação à segmentação supervisionada; Ajustar um modelo aos dados; Exagerado e sua evasão; Similaridade, vizinhos e grupos; Pensamento analítico de decisão i: o que é um bom modelo?; Visualizar desempenho do modelo; Evidência e probabilidades; Representando e minerando texto; Pensamento analítico da decisão II: em direção à engenharia analítica; Outras tarefas e técnicas de ciência de dados; Ciência de dados e estratégia de negócios; Conclusão.

https: // www.Amazonas.com/dados-ciência-business-data-analítico-pensamento/dp/b08vl5k5zx

Estatística prática para cientistas de dados: mais de 50 conceitos essenciais usando R e Python / 2nd Edition

Escrito por: Peter Bruce, Andrew Bruce e Peter Gedeck

  • Editora: O'Reilly Media
  • Data publicada: 2 de junho de 2020
  • Idioma: inglês
  • Dimensões: 7 x 0.9 x 9.1 polegada
  • Não. de páginas: 368

Conteúdo: Análise de dados exploratórios, distribuições de dados e amostragem, experimentos estatísticos e teste de significância, regressão e previsão, classificação, aprendizado estatístico de máquina, aprendizado sem supervisão.

O livro de porquê: a nova ciência da causa e efeito

Escrito por: Judea Pearl, Dana Mackenzie

  • Editor: Livro Básico
  • Data publicada: 15 de maio de 2018
  • Idioma: inglês
  • Dimensões: 6.3 x 1.4 x 9.4 polegadas
  • Não. de páginas: 432

Enquanto muitos livros de ciência de dados usam a indústria de negócios pura para ilustração, este livro usa a indústria médica e outras disciplinas para ilustração.

Conteúdo: Introdução: Mente sobre dados; A escada da causa; De buccaneers a porquinhos -da -índia: a gênese da inferência causal; De evidências a causas: Reverendo Bayes atende ao Sr. Holmes; Confatiando e desconfundando: ou, matando a variável oculta; O debate cheio de fumaça: limpando o ar; Paradoxos em abundância!; Além do ajuste: a conquista da intervenção do Monte; Contrafactuais: mundos de mineração que poderiam ter sido; Mediação: a busca por um mecanismo; Big data, inteligência artificial e as grandes questões.

Construa uma carreira em ciência de dados

Escrito por: Emily Robinson e Jacqueline Nolis

  • Editor: Manning
  • Data publicada: 24 de março de 2020
  • Idioma: inglês
  • Dimensões: 7.38 x 0.8 x 9.25 polegadas
  • Não. de páginas: 354

Conteúdo: começar com a ciência de dados; Encontrar seu trabalho de ciência de dados; Instalando -se na ciência de dados; Crescendo em sua função de ciência de dados.

https: // www.tripulação.com/books/Build-a-Acarer-in-Data-Science

Ciência dos Dados para manequins / 2ª edição

Escrito por: Lillian Pierson

  • Editora: para manequins
  • Data publicada: 6 de março de 2017
  • Língua inglesa
  • Dimensões: 7.3 x 1 x 9 polegadas
  • Não. de páginas: 384

Este livro pressupõe que o leitor já tenha o conhecimento pré-realizado de matemática e programação.

Conteúdo: envolver sua cabeça em torno da ciência de dados; Explorar pipelines e infraestrutura de engenharia de dados; Aplicar informações orientadas a dados aos negócios e indústria; Aprendizado de máquina: aprender com dados com sua máquina; Matemática, probabilidade e modelagem estatística; Usando clustering para subdividir dados; Modelagem com instâncias; Construir modelos que operam dispositivos da Internet das coisas; Seguindo os princípios do design de visualização de dados; Usando D3.js para visualização de dados; Aplicativos baseados na Web para design de visualização; Explorando as melhores práticas no design do painel; Fazer mapas a partir de dados espaciais; Usando Python para ciência de dados; Usando o código aberto R para ciência de dados; Usando SQL na ciência de dados; Fazendo ciência de dados com Excel e Knime; Ciência dos dados em jornalismo: pregando os cinco WS (e um H); Aprofundando a ciência dos dados ambientais; Ciência de dados para impulsionar o crescimento do comércio eletrônico; Usando ciência de dados para descrever e prever a atividade criminosa; Dez recursos fenomenais para dados abertos; Dez ferramentas e aplicativos de ciência de dados gratuitos.

Mineração de conjuntos de dados maciços / 3rd Edição

Escrito por: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Editora: Cambridge University Press
  • Data publicada: 13 de fevereiro de 2020
  • Língua inglesa
  • Dimensões: 7 x 1 x 9.75 polegadas
  • Não. de páginas: 565

Este livro também pressupõe que o leitor já tenha o conhecimento pré-realizado de matemática e programação.

Conteúdo: mineração de dados; MapReduce e a nova pilha de software; Algoritmos usando o mapReduce; Encontrar itens semelhantes; Fluxos de dados de mineração; Análise de links; Itens frequentes; Clustering; Publicidade na web; Sistemas de recomendação; Gráficos de rede social de mineração; Redução de dimensionalidade; Aprendizado de máquina em larga escala.

Conclusão

As distinções entre programas de especialistas ainda não estão claros. As distinções entre os programas generalistas e especializados também não estão claros. No entanto, depois de ler a lista fornecida de livros, o leitor estará em posição de apreciar melhor os papéis especiais do analista de dados, engenharia de dados e cientista de dados e depois seguir em frente.