🗓️ Projet: Identifier des profils atypiques ou des compétences émergentes
L’objectif est de développer un système pour repérer des profils atypiques ou des compétences émergentes dans les candidatures (CV et lettres de motivation). Cela vous permettra d’identifier des talents innovants, comme un candidat combinant une expertise en intelligence artificielle et une expérience en gestion des ressources humaines, qui sortent des profils standards et apportent une valeur ajoutée unique.
Étapes du Projet :
1. Rassembler les CV et lettres de motivation des candidats pour constituer une base de données à analyser.
- Informations utilisées : Compétences techniques (ex. programmation, outils spécifiques), compétences non techniques (ex. leadership, communication), parcours professionnel (postes occupés, durée), formations, certifications, et projets réalisés.
- Outils : Un ATS ou un SIRH généralistepour centraliser et structurer les candidatures dans une base exploitable.
2. Nettoyer les données brutes et extraire les informations pertinentes pour l’analyse.
- Actions :
- Supprimer les données sensibles (nom, adresse, âge, photo) pour éviter les biais et respecter la législation.
- Utiliser des techniques de traitement du langage naturel (NLP) pour extraire les compétences, expériences et autres éléments clés des textes non structurés.
- Outils : Bibliothèques Python comme SpaCy ou NLTK pour l’analyse de texte, ou des modèles avancés comme BERT pour une extraction plus précise.
3. Développer un modèle d’apprentissage non supervisé pour identifier les profils atypiques.
- Méthode :
- Entraîner le modèle sur un historique de candidatures pour apprendre ce qui constitue un profil "standard".
- Utiliser un algorithme de détection d’anomalies (ex. Isolation Forest) ou de clustering (ex. DBSCAN) pour repérer les profils qui se distinguent par des combinaisons de compétences rares ou inhabituelles.
- Outils : Scikit-learn en Python pour implémenter les algorithmes de machine learning.
4. Tester et valider le modèle pour m’assurer qu’il détecte correctement les profils atypiques.
- Méthode : Comparer les résultats de l’algorithme avec une évaluation manuelle réalisée par des recruteurs, et ajuster les paramètres si nécessaire.
- Outils : Scripts Python pour calculer les KPI (voir section ci-dessous).
5. Intégrer le modèle dans le processus de recrutement et fournir une interface aux recruteurs.
- Actions :
- Connecter le modèle à l’ATS existant.
- Créer une interface simple pour visualiser les profils atypiques et leurs caractéristiques (ex. compétences rares mises en évidence).
- Former les recruteurs à utiliser le système.
- Outils : Flask ou Django pour développer une API ou une interface web.
Indicateur pour Déterminer si l’Algorithme Fonctionne Bien
Pour évaluer la performance de l’algorithme, je vais utiliser les indicateurs suivants :
- Taux de Détection :
- Définition : Pourcentage de profils atypiques correctement identifiés par le modèle.
- Objectif : Mesurer la capacité globale de l’algorithme à repérer les candidatures innovantes.
- Précision :
- Définition : Proportion de vrais profils atypiques parmi ceux identifiés comme tels (vrais positifs / (vrais positifs + faux positifs)).
- Objectif : S’assurer que les profils signalés sont réellement atypiques, pour éviter de surcharger les recruteurs avec des résultats inutiles.
- Rappel :
- Définition : Proportion de profils atypiques détectés par rapport au total des profils atypiques présents (vrais positifs / (vrais positifs + faux négatifs)).
- Objectif : Garantir que le modèle ne passe pas à côté de profils précieux.
- Satisfaction des Recruteurs :
- Définition : Feedback qualitatif des recruteurs sur la pertinence des profils identifiés.
- Objectif : Vérifier l’utilité pratique du système dans le processus de recrutement.
Ces indicateurs seront calculés à partir des prédictions du modèle comparées à une évaluation manuelle réalisée par des experts en recrutement.
Contraintes Réglementaires
Le projet doit respecter la législation française, notamment le RGPD (Règlement Général sur la Protection des Données) et les lois anti-discrimination. Voici les points clés :
- Non-Discrimination :
- Exigence : Conformément à l’Article L1132-1 du Code du travail, l’algorithme ne doit pas discriminer sur la base de critères interdits (genre, âge, origine, etc.).
- Action : Supprimer les données sensibles (ex. nom, âge) lors du prétraitement et auditer régulièrement le modèle pour détecter d’éventuels biais.
- Justification des Critères d’Analyse :
- Exigence : Les critères utilisés (ex. combinaisons de compétences) doivent être pertinents pour le poste.
- Action : Documenter et valider avec les recruteurs que les caractéristiques détectées (ex. IA + gestion RH) répondent à un besoin spécifique de l’entreprise.
- Consentement des Candidats :
- Exigence : Si le traitement des données va au-delà de l’analyse standard des candidatures, informer les candidats et obtenir leur consentement (RGPD, Article 6).
- Action : Ajouter une clause dans le formulaire de candidature expliquant l’utilisation de l’algorithme et demandant l’accord explicite des candidats.
- Protection des Données :
- Exigence : Respecter le RGPD en limitant les données collectées, en assurant leur sécurité, et en permettant aux candidats d’exercer leurs droits (accès, rectification, suppression).
- Action : Chiffrer les données, restreindre l’accès, et mettre en place un processus pour répondre aux demandes des candidats.