SINOPSE
O processo de ciência de dados envolve técnicas estatísticas e computacionais para analisar grandes volumes de informações. A fase de pré-processamento, que inclui a seleção, limpeza e transformação dos dados, é a mais demorada, consumindo cerca de 80% do tempo total. Essas atividades, conhecidas como Data Wrangling, são essenciais para garantir a qualidade dos dados antes da análise.
Com uma abordagem prática, o conteúdo explora a biblioteca pandas, amplamente utilizada no ambiente Python. Através de um projeto real, são apresentados os passos necessários para o pré-processamento de dados, culminando na aplicação em um modelo de Machine Learning voltado para classificação.
