Métodos estatísticos são uma parte crucial da ciência de dados; ainda assim, poucos cientistas de dados têm formação estatística.
Os cursos e livros sobre estatística básica raramente abordam os tópicos sob a perspectiva da ciência de dados.
Este guia prático explica como aplicar diversos métodos estatísticos em ciência de dados, ensina a evitar seu mau uso e aconselha sobre o que é importante e o que não é.
Muitos recursos da ciência de dados incorporam métodos estatísticos, mas carecem de uma perspectiva estatística aprofundada. Se você está familiarizado com a linguagem de programação R e tem algum conhecimento estatístico, este guia fará a ponte de forma fácil e acessível.
Com este livro, você aprenderá:
?? Por que a análise exploratória de dados é um passo prévio importante na ciência de dados
?? Como a amostragem aleatória pode reduzir o viés e resultar um conjunto de dados de maior qualidade, mesmo em big data
?? Como os princípios do design experimental resultam respostas definitivas
?? Como usar regressão para estimar resultados e detectar anomalias
?? Principais técnicas de classificação para prever a quais categorias um registro pertence
?? Métodos de aprendizado de máquina estatístico que “aprendem” com os dados
?? Métodos de aprendizado não supervisionado para extração de significado de dados não rotulados
” Este livro não é só mais um livro universitário de estatística ou um manual de aprendizado de máquina.
É muito melhor: ele faz a conexão entre termos e princípios estatísticos úteis e os jargões e a prática da exploração de dados, com explicações clarase muitos exemplos.
Este livro é uma referência incrível para iniciantes e veteranos da ciência de dados.”
-Galit Shmueli
Principal autora da série best-seller
Data Mining for Business Analytics e professora titular na National Tsing Hua University, Taiwan