Avis 20235199 Séance du 12/10/2023

Monsieur XX, a saisi la Commission d'accès aux documents administratifs, par courrier enregistré à son secrétariat le 17 juillet 2023, à la suite du refus opposé par le directeur général des finances publiques à sa demande de communication, en sa qualité de journaliste, par courrier électronique, des documents suivants, relatifs au programme CFVR (ciblage de la fraude et valorisation des requêtes) utilisé dans le cadre du contrôle fiscal, fondé notamment sur des analyses de données basées sur de l’intelligence artificielle, de son fonctionnement à ses performances : 1) le cahier des charges, ou tout autre document préliminaire exposant les objectifs des algorithmes du programme ; 2) le code source complet de l’algorithme utilisé actuellement pour cibler les fraudes ou, à défaut, sa version précédente ; 3) le modèle de machine learning entraîné, c’est-à-dire : les fichiers des poids d’entrainement (weights), les paramètres et hyperparamètres ou tout autre fichier de configuration nécessaires à l’entraînement, la validation ou l’inférence du modèle ou à défaut, leurs versions précédentes ; 4) tous les documents décrivant les variables utilisées, leur mode de collecte et/ou leur calcul ; 5) tous les éléments de documentation du système ; 6) tous les documents s'apparentant à des modes d’emploi du système pour leurs utilisateurs finaux ; 7) les éventuels fichiers de données fictives générées à des fins d'entraînement, de test ou d’évaluation du système ; 8) tous les rapports, présentations ou autres documents visant à évaluer ou tester le système ou à décrire ses éventuels biais ; 9) tous les rapports, présentations ou autres documents visant à formuler des recommandations pour améliorer le fonctionnement de ce simulateur. 10) l’intégralité des courriers échangés avec la CNIL concernant cet outil. La commission relève, à titre liminaire, que les documents sollicités ont été produits par la direction générale des finances publiques dans le cadre de sa mission de service public. Ils revêtent, dès lors, le caractère de document administratif au sens de l'article L300-2 du code des relations entre le public et l’administration (CRPA), soumis au droit d’accès ouvert par le livre III de ce code (avis de partie II n° 20144578 du 8 janvier 2015 ; avis n° 20161989 du 23 juin 2016). 1. En ce qui concerne le point 1) : La commission estime que les documents généraux détaillant les objectifs d’un algorithme utilisé par l’administration sont librement communicables à quiconque en fait la demande, en application de l’article L311-1 du CRPA. En l’espèce, le directeur général des finances publiques a informée la commission que les objectifs du projet CFVR, dont la commission a pris connaissance, ainsi que le contrat de financement du projet CFVR par le fond de la transformation publique, signé en 2018, ont été transmis à Monsieur X. La commission, qui n’a connaissance d’aucun autre document susceptible de lui être adressé par ailleurs déclare, en l’état, la demande d’avis sans objet sur ce point. 2. En ce qui concerne le point 7) : Le directeur général des finances publiques a précisé que les modèles sont entraînés à partir de données réelles et non fictives. La commission en prend note et déclare, par suite, la demande d’avis sans objet en son point 7). 3. En ce qui concerne le point 10) : La commission rappelle que les documents soumis à la CNIL par les responsables de traitements dans le cadre des formalités préalables prévues par le chapitre IV de la loi du 6 janvier 1978, de même que les décisions prises par cette commission au terme de ces procédures, font l'objet d'un régime particulier de communication, qui échappe au champ d'application du livre III du code des relations entre le public et l’administration. En l’espèce, la commission comprend de la réponse du directeur général des finances publiques que le traitement CVFR a fait l’objet de formalités préalables au titre de l’article 31 de la loi du 6 janvier 1978. L'article L342-2 du CRPA n'ayant pas étendu ses compétences au régime d’accès prévu par la loi du 6 janvier 1978, la commission ne peut, dès lors, que se déclarer incompétente sur ce point. 4. En ce qui concerne les points 2), 3), 4), 5), 6), 8) et 9) : En premier lieu, la commission rappelle que la loi n° 2016-1321 du 7 octobre 2016 pour une République numérique a renforcé la transparence de l’action publique, d’une part, en créant au profit des personnes faisant l’objet d’une décision administrative individuelle prise sur le fondement d’un traitement algorithmique, un droit d’accès aux règles définissant ce traitement et aux principales caractéristiques de sa mise en œuvre (article L311-3-1 du CRPA) et, d’autre part, en imposant aux administrations de publier en ligne les règles gouvernant les principaux traitements algorithmiques utilisés dans l’accomplissement de leurs missions, lorsqu’ils fondent des décisions individuelles (article L312-1-3 du CRPA). La commission relève, toutefois, que ces dispositions concernent uniquement les traitements algorithmiques fondant des décisions individuelles et ne consacrent pas un droit d’accès à l’algorithme lui-même, mais seulement à certaines informations le concernant, qui sont précisées à l’article R311-3-1-2 du code précité. En outre, ces obligations s’exercent dans la limite des secrets protégés au 2° de l’article L311-5 du CRPA. En deuxième lieu, la commission précise que le g) du 2° de l’article L311-5 exclut du droit à communication les documents administratifs dont la consultation ou la communication porterait atteinte à la recherche et à la prévention, par les services compétents, d'infractions de toute nature. La commission précise que le Conseil d’État a jugé, dans sa décision du 24 juillet 2023, n° 462778, que ces dispositions font « obstacle à la communication des documents administratifs présentant les critères utilisés par une autorité administrative chargée de rechercher des infractions à des obligations légales ou contractuelles pour sélectionner les personnes qu’elle envisage de contrôler, tel que le code-source d’un modèle algorithmique de ciblage des contrôles sur la base d’un profilage des personnes concernées ». La commission ajoute qu’il ressort de la jurisprudence du Conseil d’État rendue en matière fiscale, que sont notamment couvertes par cette réserve les mentions relatives aux critères retenus par l'administration pour sélectionner les dossiers afin d’entreprendre des opérations de contrôle (CE, 12 octobre 1992, n° 100036). Comme elle l’a fait dans son avis de partie II n° 20215795 du 16 décembre 2021, la commission précise que cette exception a pour objet de préserver, en toute hypothèse, l’efficacité des contrôles, de sorte qu’il n’y a pas lieu de différencier selon la plus ou moins grande sophistication des méthodes employées, ni selon que le document met en cause la recherche d’une infraction donnée ou pourrait de manière générale porter atteinte au contrôle de l’application d’une législation. Après avoir pris connaissance des observations du directeur général des finances publiques, la commission relève que la demande tend à la communication de documents en lien avec le traitement CFVR, qui a été mis en œuvre par l’administration fiscale pour améliorer l’efficacité des activités de ciblage des dossiers des contribuables, en amont des opérations de contrôle, et qui repose sur les techniques d’apprentissage automatique. En s’inspirant de la solution qu’elle a dégagée dans son conseil n° 20225787 et son avis n° 20226179 du 15 décembre 2022, la commission estime que la liste des critères utilisés par les algorithmes d’identification des infractions fiscales, ainsi que les coefficients associés à ces variables, relèvent du champ de la réserve prévue par le g) du 2° de l’article L311-5 du CRPA et ne sont, dès lors, pas communicables. La commission ajoute qu’il en est de même des fragments de code source ainsi que de tout document qui révéleraient la nature ou la méthode de construction des variables utilisées. La commission précise, toutefois, que dans l’hypothèse où le modèle utilisé fait l’objet de versions successives, seules les variables utilisées dans le modèle actuel sont protégées, à l’exclusion des variables se rapportant aux versions antérieures du modèle. Elle estime qu’il en irait en revanche différemment pour les modèles faisant l’objet de mise à jour régulière. La commission relève, par ailleurs, que le directeur général des finances publiques a également précisé que si le code source était transmis dans une version occultée, l’analyse des fonctions mathématiques et informatiques employées et l’enchaînement des lignes de codes et des différents scripts pourraient permettre de reconstituer les données qui ont été occultées. Des opérations de rétro-ingénierie pourraient également permettre de contourner les algorithmes afin d’échapper aux contrôles. Ce risque serait facilité par le fait qu’une grande partie des schémas de données utilisées est publique. La commission rappelle, à cet égard, que dans un avis n° 20230314, du 30 mars 2023, elle a estimé s’agissant d’un logiciel reposant sur un algorithme de reconnaissance d’entités nommées ayant été entraîné grâce à la technique de l’apprentissage automatique, qu’eu égard à la finalité et aux spécifiés de cet algorithme, le risque allégué de reconstitution des données occultées dans les décisions de justice constituant le jeu de données utilisé pour entraîner le modèle présente, en l’état actuel des connaissances scientifiques, un caractère suffisant de vraisemblance pour être tenu pour acquis. En l’état des informations portées à sa connaissance, eu égard en particulier à la sensibilité et à la finalité du traitement CFVR, qui a été mis en œuvre par l’administration fiscale pour améliorer l’efficacité des activités de contrôle fiscal, et à ses spécificités, ce logiciel reposant sur des techniques d’apprentissage automatique, la commission estime que les documents sollicités aux points 2) à 6), 8) et 9) entrent dans le champ de la réserve prévue par le g) du 2° de l’article L311-5 du CRPA. Elle émet, dès lors, un avis défavorable à leur communication.