La Caf et vous

L'actu au sens large pour tous

Contrôles et dataming à la Caf - Des prestations au juste droit pour tous

 

Qu’est-ce que le datamining ?

Le datamining est une démarche scientifique, qui repose sur une étude statistique. Elle vise à déterminer des probabilités de risque pour un individu, un dossier, un traitement. Elle s’appuie sur des informations quantitatives, présentes dans le système d’informations des Caf. 
Ces études sont réalisées par des experts des statistiques et de l’informatique.  


Le datamining, dans les Caf, en quoi ça consiste ?

Dans les Caf, le datamining a commencé à être utilisé en 2011, après avoir été autorisé par la Cnil. Contrairement à une idée reçue, il n’est pas construit pour lutter contre la fraude. 
Il existe, au sein des Caf, deux modèles de datamining qui visent un paiement des prestations conforme à la législation. L’un permet d’identifier des potentielles situations d’erreurs déclaratives, l’autre des potentielles erreurs internes de traitement des dossiers. Le premier outil ne conduit jamais automatiquement et systématiquement à un contrôle du dossier. Il constitue l’un des éléments utilisés par les Caf pour déclencher un contrôle le cas échéant. Dans certains cas, ces contrôles permettent de détecter des erreurs, générant des indus (l’ a trop perçu), mais aussi des rappels (l’allocataire n’a pas assez perçu), et parfois, lorsque le contrôle révèle une intention frauduleuse, des cas de fraudes.


Le datamining, comment ça fonctionne ?

L’utilisation du datamining nécessite trois étapes :

  1. un modèle est élaboré par une équipe d’experts, sur la base de cas authentiques et récents d’erreurs de déclaration et de cas sans erreur ;
  2. on utilise ce modèle pour déterminer les dossiers qui vont nécessiter une analyse humaine ;
  3. un agent dûment habilité analyse le dossier pour vérifier le paiement à bon droit.

L’équipe d’experts surveille régulièrement l’adéquation du modèle à son contexte de déploiement, et notamment aux évolutions de la législation. 
Depuis quelques mois, dans le cadre de la construction d’un nouveau modèle, a été mis en place une « démarche éthique dès la conception », qui implique notamment la consultation du comité d’éthique des usages des données, des algorithmes et de l’intelligence artificielle de la Caisse nationale des Allocations familiales (pour plus de détail sur ce comité d’éthique, nous vous invitons à cliquer sur ce lien). 


Qu’est-ce que le « score de risque » ?

Chaque dossier allocataire se voit attribuer par le modèle datamining un « score de risque » (risque d’indu significatif et durable) à partir duquel la Caf va classer les dossiers en fonction du niveau de score, donc de l’ampleur du risque d’indu qu’il présente. Le contrôleur de la Caf va s’appuyer sur cette information, parmi d’autres, pour sélectionner les dossiers à contrôler pour sécuriser le risque et limiter les erreurs dans les prestations versées. Le datamining est donc un outil d’aide à la décision de diligenter des contrôles pour les Caf.


Comment fonctionnent les contrôles à la Caf ?

Ceux-ci peuvent être réalisés sur pièces, ou sur place. Les contrôles sur place sont réalisés par l’un des 700 contrôleurs assermentés qui travaillent au sein des Caf pour vérifier que l’allocataire concerné perçoit bien les prestations auxquelles il a droit, et qu’ils les touchent au juste droit. Si ce n’est pas le cas, soit l’allocataire doit rembourser les sommes trop perçues, soit il bénéficiera d’un rappel de ce qui aurait dû lui être versé.
 

Quelques résultats

En 2024 :

  • près de 2,5 millions de contrôles sur pièces (dont 119 000 issus du datamining)
  • 91 000 contrôles sur place (dont près de 52 % issus du datamining).
  • moins de 2 % de tous ces contrôles aboutissent à une suspicion de fraude.
  • 29 millions de contrôles automatisés grâce à des échanges de données avec d’autres organismes (ex : ).
  • 50 % des sont contrôlés chaque année et un quart des montants régularisés sont des rappels.
  • Le datamining représente 1 % des contrôles diligentés par les Caf. 

Le vrai/faux du datamining


Les contrôleurs de la Caf ont accès à toutes les informations qu’ils souhaitent à l’insu des allocataires.

❌ Faux. Les contrôleurs ont principalement accès aux données que la Caf possède et qui ont donc été fournies par les allocataires. Mais la branche Famille peut aussi bénéficier d’informations émanant de tiers ou de partenaires, dans le cadre d’échanges de données ou de demande d’informations prévues par des textes. 


Plus de 1 000 données concernant les allocataires sont utilisées dans le modèle de datamining des Caf. 

❌ Faux. Seules les données possédées par les Caf sont utilisées. 
Il s’agit essentiellement d’informations portant sur la situation familiale des allocataires (couple ou personne isolée, situation des enfants à charge), sur la situation professionnelle (en activité, demandeur d’emploi...), sur la situation financière (revenus et , avantages en nature...), ainsi que sur la résidence en France. 
Dans le modèle actuel, une quarantaine de variables sont utilisées pour calculer le score de risque. 


Les contrôles se font uniquement par un logiciel. 

❌ Faux. La décision de contrôle et le contrôle lui-même, qu’il soit réalisé sur pièces ou sur place, sont toujours réalisés par un humain. Le contrôle sur place est réalisé par l’un des 700 contrôleurs assermentés des Caf.


Avoir un score élevé déclenche automatiquement un contrôle.

Faux. Le contrôle est toujours déclenché par un être humain, sur la base d’un ensemble d’informations et pas uniquement le score de risque issu du datamining. Un score de risque élevé ne conduit pas automatiquement à un contrôle : ainsi, plus du tiers des dossiers dont le score de risque est situé parmi les 10 % les plus élevés ne sont pas contrôlés dans l’année qui suit.


Un allocataire peut être contrôlé plusieurs fois.

Vrai. Un allocataire peut subir plusieurs contrôles. La Caf veille cependant à respecter un certain délai entre chaque contrôle. Ainsi, la Caf ne peut réaliser un autre contrôle sur place issu du datamining que 18 mois après le premier, si celui-ci n’avait pas eu de conséquence financière. Dans le cas inverse, le délai est ramené à 12 mois. Un allocataire peut néanmoins être sollicité plus fréquemment pour clarifier des incohérences repérées automatiquement sur son dossier.


Les allocations sont suspendues pendant le contrôle. 

Faux. Les allocations ne sont pas suspendues, elles continuent à être versées, sauf dans les cas où l’allocataire ne répond pas aux sollicitations de la Caf ou refuse de fournir les éventuels éléments complémentaires nécessaires à l’analyse de son dossier. 


Les contrôleurs sont payés aux résultats. 

Faux. Les contrôleurs ne reçoivent pas de prime en fonction de leurs résultats. 


Les contrôles sont réalisés uniquement pour récupérer de l’argent. 

Faux. Les contrôles sont réalisés pour permettre à chacun de toucher des montants de prestations conformes à la législation. Dans le cas des indus, la Caf récupère effectivement de l’argent versé en trop mais 25 % des montants des régularisations réalisées sont des rappels de prestations qui auraient dû être versées aux allocataires.


Le datamining stigmatise les allocataires et les considère comme des potentiels fraudeurs.

Faux. Ayant pour objectif le paiement « à bon droit », le datamining recherche les situations qui peuvent générer des indus, qui ne relèvent le plus souvent pas de fraudes. Moins de 2 % des contrôles aboutissent à une suspicion de fraude. 25 % des montants des régularisations réalisées sont des rappels de prestations qui auraient dû être versées aux allocataires.