Data Science & ML Concluído

Employee Attrition Analytics

Solução completa de analytics para predição e análise de rotatividade de funcionários utilizando Machine Learning e dashboard interativo em Streamlit

Duração: 3 meses
Ano: 2024

Visão Geral do Projeto

O Employee Attrition Analytics é uma solução completa de analytics para predição e análise de rotatividade de funcionários (employee attrition), desenvolvida utilizando o dataset da IBM HR Analytics. O projeto fornece insights acionáveis para RH e gestores, permitindo ações proativas de retenção de talentos.

Com uma arquitetura robusta baseada em Machine Learning, o sistema oferece predição de risco individual com score de probabilidade, dashboard interativo com visualizações em tempo real, insights estratégicos baseados em dados e calculadora de ROI para justificar investimentos em programas de retenção.

O projeto alcançou resultados excepcionais com AUC-ROC de 0.87, identificando corretamente 85% dos funcionários de alto risco e gerando uma economia potencial de $450K anuais com ROI de 350% em programas de retenção.

Principais Resultados

0.87
AUC-ROC Score

Modelo com alta capacidade discriminativa superando benchmark de 0.85

85%
Precisão na Identificação

Taxa de identificação correta de funcionários de alto risco

350%
ROI dos Programas

Retorno sobre investimento em iniciativas de retenção de talentos

Principais Funcionalidades

Predição de Risco Individual

Score de probabilidade personalizado para cada funcionário com identificação de fatores de risco específicos.

Dashboard Interativo

Interface completa em Streamlit com 4 tabs principais, 15+ visualizações e filtros dinâmicos.

Insights Estratégicos

Recomendações acionáveis baseadas em análise de dados e padrões identificados.

Calculadora de ROI

Ferramenta para justificar investimentos em programas de retenção com análise de custo-benefício.

Segmentação Avançada

Análise por departamento, idade, salário e outros fatores relevantes para RH.

Relatórios Exportáveis

Geração de relatórios detalhados em PDF e Excel para apresentações executivas.

Stack Tecnológico

Machine Learning

Scikit-Learn XGBoost SHAP Feature Engineering

Análise de Dados

Python 3.8+ Pandas NumPy Matplotlib Seaborn

Interface & Dashboard

Streamlit 1.28.0 Plotly HTML5/CSS3 UI/UX Design

Deploy & Infraestrutura

Streamlit Cloud GitHub Actions Docker CI/CD Pipeline

Principais Insights Descobertos

Fatores de Alto Risco

Overtime: 31% de attrition vs 10% sem overtime - Principal fator de risco identificado
Baixa Satisfação: 25% de attrition para funcionários com satisfação ≤ 2
Funcionários Jovens: 22% de attrition para funcionários com menos de 30 anos

Fatores Protetivos

Alta Satisfação: Apenas 3% de attrition para satisfação = 4
Longa Permanência: 5% de attrition para funcionários com mais de 10 anos

Padrões Identificados

Curva de Attrition: Pico nos primeiros 2 anos, depois estabiliza
Por Departamento: Sales (20%) > R&D (14%) > HR (12%)

Arquitetura da Solução

Dashboard Interativo

Streamlit App Visão Geral Predições Analytics Insights

Motor de Machine Learning

XGBoost Classifier Feature Engineering SHAP Explainability Model Validation

Processamento de Dados

IBM HR Dataset Data Preprocessing EDA Pipeline Feature Selection

Visualizations & Reports

Plotly Charts KPI Metrics ROI Calculator Export Functions