[EN] This project focuses on building a machine learning classification model to understand and predict employee attrition. The workflow includes data cleaning, feature engineering, exploratory analysis, model development, and evaluation. The goal is to help organizations identify key factors that drive attrition and support data-driven retention strategies.
Project Overview
Dataset: 50,000+ employee records
Steps:
Data preprocessing & cleaning
Feature engineering
Exploratory data analysis (EDA)
Model training and validation
Insights extraction on attrition factors
Technologies Used
Python
Pandas, NumPy
Scikit-learn
Matplotlib / Seaborn
Jupyter Notebook
[FR] Ce projet consiste à développer un modèle de classification en machine learning afin de comprendre et prédire l’attrition des employés. Le travail inclut le nettoyage des données, l’ingénierie des variables, l’analyse exploratoire, le développement du modèle et son évaluation. L’objectif est d’aider les organisations à identifier les principaux facteurs d’attrition et soutenir des stratégies de rétention basées sur les données.
Aperçu du projet
Jeu de données : plus de 50 000 enregistrements
Étapes :
Prétraitement et nettoyage des données
Feature engineering
Analyse exploratoire (EDA)
Entraînement et validation du modèle
Extraction d’insights sur les facteurs d’attrition
Technologies utilisées
Python
Pandas, NumPy
Scikit-learn
Matplotlib / Seaborn
Jupyter Notebook