SINOPSE
Técnicas estatísticas e de aprendizado de máquina são essenciais para trabalhar com grandes conjuntos de dados. O ecossistema do Hadoop se destaca como uma ferramenta poderosa para análises, permitindo que cientistas e analistas de dados explorem fluxos de trabalho complexos e técnicas de armazém de dados. A prática se concentra em análises específicas, em vez de aspectos de implantação e desenvolvimento.
Os leitores aprenderão a escrever aplicações MapReduce e Spark com Python, além de gerenciar dados com ferramentas como Spark MLlib, Hive e HBase. O domínio de processos analíticos e sistemas de dados é fundamental para lidar com volumes massivos de informações.
