Avis 20235950 Séance du 02/11/2023

Monsieur X, jounaliste X, a saisi la Commission d'accès aux documents administratifs, par courrier enregistré à son secrétariat le 5 octobre 2023, à la suite du refus opposé par le directeur général de Pôle emploi à sa demande de communication, en sa qualité de journaliste, des documents suivants relatifs à la conception de deux outils informatiques utilisés par Pôle Emploi, « SILLAGE » et « OCAPI » : 1) le cahier des charges, ou tout autre document préliminaire exposant les objectifs des algorithmes ; 2) le code source complet de l’algorithme utilisé actuellement pour cibler les fraudes ou, à défaut, sa version précédente ; 3) le modèle de machine learning entraîné, c’est-à-dire : les fichiers des poids d’entrainement (weights), les paramètres et hyperparamètres ou tout autre fichier de configuration nécessaires à l’entraînement, la validation ou l’inférence du modèle ; 4) tous les documents décrivant les variables utilisées, leur mode de collecte et/ou leur calcul ; 5) tous les éléments de documentation du système ; 6) tous les documents s'apparentant à des modes d’emploi du système pour les utilisateurs finaux ; 7) les éventuels fichiers de données fictives générées à des fins d'entraînement, de test ou d’évaluation du système ; 8) tous les rapports, présentations ou autres documents visant à évaluer ou tester le système ou à décrire ses éventuels biais ; 9) tous les rapports, présentations ou autres documents visant à formuler des recommandations pour améliorer le fonctionnement de ce simulateur ; 10) l’intégralité des courriers échangés avec la CNIL concernant cet outil ; 11) toutes les correspondances (notamment les courriers, courriels, SMS…) reçues et envoyées par Monsieur X, directeur général de Pôle Emploi, qui mentionnent l’outil de priorisation des e-mails, OCAPI ou SILLAGE depuis le 1er mars 2023, dans le contexte d’annonce par le gouvernement d’une intensification de la lutte contre la fraude sociale. La commission relève, à titre liminaire, que les documents sollicités ont été produits par Pôle Emploi dans le cadre de sa mission de service public. Ils revêtent, dès lors, le caractère de document administratif au sens de l'article L300-2 du code des relations entre le public et l’administration (CRPA), soumis au droit d’accès ouvert par le livre III de ce code (avis de partie II, n° 20144578, du 8 janvier 2015 ; avis n° 20161989, du 23 juin 2016). 1. En ce qui concerne le point 11) : En réponse à la demande qui lui a été adressée, le directeur général de Pôle emploi a précisé n’avoir échangé aucune correspondance mentionnant les logiciels OCAPI et SILLAGE, depuis le 1er mars 2023, dans le contexte d’annonce par le gouvernement d’une intensification de la lutte contre la fraude sociale. La commission en prend note et déclare, par suite, la demande d’avis sans objet sur ce point. 2. En ce qui concerne la communication des autres documents se rapportant à l’outil OCAPI, logiciel de détection des fraudes, développé en interne il y a plus de dix ans : 2.1. Questions préalables : En premier lieu, le directeur général de Pôle emploi a précisé que le modèle a été entraîné à partir de données réelles et non fictives. La commission en prend note et déclare, par suite, la demande d’avis sans objet en son point 7). En second lieu, il ressort des pièces du dossier que Pôle emploi a communiqué au demandeur un certain nombre de documents susceptibles de répondre partiellement aux points 1), 6), 8), 9) et 10) de la demande, dans une version occultée des mentions dont la communication porterait atteinte à la recherche et à la prévention d’infractions, à la sécurité des systèmes d’information de Pôle emploi, à la protection de la vie privée, ou qui feraient apparaître le comportement d’une personne dont la divulgation pourrait lui porter préjudice. La commission constate, toutefois, que cette communication ne satisfait pas Monsieur X. Elle relève, par ailleurs, que le directeur général de Pôle emploi a maintenu son refus de communiquer les documents sollicités aux points 2) à 5), en faisant valoir que leur communication porterait atteinte à la recherche et à la prévention d’infractions, conformément au point g) du 2° de l’article L311-5 du CRPA. En l’état des informations portées à sa connaissance, la commission en déduit que la demande conserve son objet. 2.2. Principe de communication des documents sollicités : - S’agissant du point 1) : La commission estime que les documents mentionnés au point 1) sont librement communicables à toute personne qui en font la demande en application de l’article L311-1 du CRPA. Elle émet donc un avis favorable à leur communication. - S’agissant des points 2), 3), 4), 5), 6), 8) et 9) : En premier lieu, la commission rappelle que la loi n° 2016-1321 du 7 octobre 2016 pour une République numérique a renforcé la transparence de l’action publique, d’une part, en créant au profit des personnes faisant l’objet d’une décision administrative individuelle prise sur le fondement d’un traitement algorithmique, un droit d’accès aux règles définissant ce traitement et aux principales caractéristiques de sa mise en œuvre (article L311-3-1 du CRPA) et, d’autre part, en imposant aux administrations de publier en ligne les règles gouvernant les principaux traitements algorithmiques utilisés dans l’accomplissement de leurs missions, lorsqu’ils fondent des décisions individuelles (article L312-1-3 du CRPA). La commission relève, toutefois, que ces dispositions concernent uniquement les traitements algorithmiques fondant des décisions individuelles et ne consacrent pas un droit d’accès à l’algorithme lui-même, mais seulement à certaines informations le concernant, qui sont précisées à l’article R311-3-1-2 du code précité. En outre, ces obligations s’exercent dans la limite des secrets protégés au 2° de l’article L311-5 du CRPA. Comme elle l’a fait dans son avis de partie I n°20213847 du 13 janvier 2022, la commission précise, en deuxième lieu, que les codes sources des administrations devraient en principe être librement et intégralement communicables à toute personne qui en fait la demande, en application de l’article L311-1 du CRPA. Si la sécurité des systèmes d’information ne devrait en principe pas pouvoir être opposée aux fragments du code traduisant la mise en œuvre de l’algorithme, c’est-à-dire la manière dont sont prises les décisions administratives, en revanche, les vulnérabilités des fragments du code décrivant techniquement l’ensemble des éléments déployés pour la sécurité et la gestion fonctionnelle de l’infrastructure sont vecteurs de risque pour la sécurité des systèmes d’information. Sont en particulier visés les secrets cryptographiques et les éléments de configuration des systèmes assurant la sécurité des systèmes informatiques utilisés, tels que ceux permettant de sécuriser la transmission des données avec les serveurs de l’administration. La divulgation de ces éléments est de nature à faciliter l’exploitation des failles de sécurité du système d’information développé et, par suite, à favoriser des intrusions informatiques ou des situations dangereuses, telles que des contournements ou des interférences dans le fonctionnement du système. La commission constate donc qu’en pratique, la libre communication de l’intégralité des codes sources des administrations est, à un instant donné, intrinsèquement liée à la qualité des systèmes d’information développés et des codes sources correspondants. La commission estime, dès lors, que doivent être occultés ou disjoints avant toute communication, en application du d) du 2° de l’article L311-5 du CRPA, les fragments du code décrivant techniquement l’ensemble des éléments déployés pour la sécurité et la gestion fonctionnelle de l’infrastructure dans la mesure où ils sont vecteurs de risque pour la sécurité des systèmes d’information. La commission précise qu’il en est de même de tout document révélant des informations sur ces fragments de code. Elle rappelle, enfin, que cette réserve, par nature temporaire, les administrations devant se mettre en situation de respecter l’article L311-1 du CRPA, le cas échéant progressivement et en tout état de cause dans les meilleurs délais, doit être appréciée strictement, à partir d’éléments circonstanciés fournis par les administrations. En troisième lieu, la commission précise que le g) du 2° de l’article L311-5 exclut du droit à communication les documents administratifs dont la consultation ou la communication porterait atteinte à la recherche et à la prévention, par les services compétents, d'infractions de toute nature. Elle ajoute que le Conseil d’État a jugé, dans sa décision du 24 juillet 2023, n° 462778, que ces dispositions font « obstacle à la communication des documents administratifs présentant les critères utilisés par une autorité administrative chargée de rechercher des infractions à des obligations légales ou contractuelles pour sélectionner les personnes qu’elle envisage de contrôler, tel que le code-source d’un modèle algorithmique de ciblage des contrôles sur la base d’un profilage des personnes concernées ». Il ressort de la jurisprudence du Conseil d’État rendue en matière fiscale, que sont notamment couvertes par cette réserve les mentions relatives aux critères retenus par l'administration pour sélectionner les dossiers afin d’entreprendre des opérations de contrôle (CE, 12 octobre 1992, n° 100036). Par ailleurs, il résulte des travaux parlementaires attachés à la loi n° 2016-1321 du 7 octobre 2016 pour une République numérique, que la réserve prévue par le g) du 2° de l’article L311-5 du CRPA concerne désormais toutes les procédures répressives, qu’il s’agisse des procédures pénales ou des procédures administratives susceptibles de conduire au prononcé d’une sanction, ou encore des procédures de sanction en matière disciplinaire. Comme elle l’a fait dans son avis de partie II n° 20215795 du 16 décembre 2021, la commission précise que cette exception a pour objet de préserver, en toute hypothèse, l’efficacité des contrôles, de sorte qu’il n’y a pas lieu de différencier selon la plus ou moins grande sophistication des méthodes employées, ni selon que le document met en cause la recherche d’une infraction donnée ou pourrait de manière générale porter atteinte au contrôle de l’application d’une législation. La commission déduit de ce qui précède que la solution dégagée par le Conseil d’État est transposable à la politique de contrôle mise en œuvre par Pôle Emploi afin de détecter des situations de fraude. Comme elle l’a fait dans son conseil n° 20225787 et son avis n° 20226179 du 15 décembre 2022, la commission précise que la liste des variables utilisées par un algorithme pour détecter des dossiers d’allocataires présentant des risques d’indus afin de les proposer en priorité pour un contrôle ultérieur, ainsi que les coefficients associés à ces variables, relèvent du champ de la réserve prévue par le g) du 2° de l’article L311-5 du CRPA. Ces mentions doivent, dès lors, être occultées avant toute communication. La commission ajoute qu’il en est de même des fragments de code source ainsi que de tout document qui révèleraient la nature ou la méthode de construction des variables utilisées. La commission précise, toutefois, que dans l’hypothèse où le modèle utilisé fait l’objet de versions successives, seules les variables utilisées dans le modèle actuel sont protégées, à l’exclusion des variables se rapportant aux versions antérieures du modèle. En quatrième lieu, la commission rappelle qu’aux termes de l’article L311-6 du CRPA, ne sont pas communicables aux tiers les informations dont la communication porterait atteinte à la protection de la vie privée, portant une appréciation ou un jugement de valeur sur une personne physique désignée ou identifiable ainsi que les mentions révélant le comportement d’une personne et dont la divulgation lui porterait préjudice. S’agissant de la protection de la vie privée, la commission relève que dans un avis n° 20230314 du 30 mars 2023, elle a estimé que la divulgation des modèles d’apprentissage spécifiquement entraînés par la Cour de cassation dans le cadre de la mise en œuvre de son logiciel de pseudonymisation des décisions de justice étaient de nature à porter atteinte à la protection de la vie privée des personnes intéressées au sens du 1° de l'article L311-6 du CRPA. Eu égard à la finalité et aux spécificités de l’algorithme de reconnaissance d’entités nommées concerné, la commission a estimé que le risque allégué de reconstitution des données occultées dans les décisions de justice constituant le jeu de données utilisé pour entraîner le modèle présente, en l’état actuel des connaissances scientifiques, un caractère suffisant de vraisemblance pour être tenu pour acquis. Elle précise que le risque d’atteinte à la vie privée allégué doit être suffisamment étayé pour être tenu pour établi, en application des principes dégagés dans cet avis. En application de ces principes, la commission émet un avis favorable à la communication des documents sollicités aux points 2), 3), 4) 5), 6), 8), et 9), sous les réserves et dans les conditions rappelées ci-dessus. - S’agissant du point 10) : La commission constate que demande d’avis adressée à la CNIL en novembre 2014 relative à l’applicatif Datamining, ensuite rebaptisé OCAPI, a été transmise au demandeur. Elle s’étonne par ailleurs de la réponse du directeur général de Pôle Emploi selon qui les autres documents correspondant à ce point de la demande ont pu être égarés en raison de réorganisations et des mouvements de personnels. La commission rappelle que les documents soumis à la CNIL par les responsables de traitements dans le cadre des formalités préalables prévues par le chapitre IV de la loi du 6 janvier 1978, de même que les décisions prises par cette commission au terme de ces procédures, font l'objet d'un régime particulier de communication, qui échappe au champ d'application du livre III du CRPA. Les documents qui ne sont pas échangés avec la CNIL dans le cadre des formalités préalables prévues par le chapitre IV de la loi du 6 janvier 1978 constituent en revanche des documents administratifs communicables à toute personne qui en fait la demande, sous réserve de l'occultation préalable des mentions protégées par les dispositions des articles L311-5 et L311-6 du CRPA. Dans l’hypothèse où Pôle Emploi détiendrait des échanges intervenus avec la CNIL en dehors des procédures de formalités préalables, la commission émettrait un avis favorable à leur communication, sous ces réserves. L'article L342-2 du CRPA n'ayant pas étendu ses compétences au régime d’accès prévu par la loi du 6 janvier 1978, elle ne pourrait en revanche que se déclarer incompétente pour le surplus.  3. En ce qui concerne la communication des autres documents se rapportant à l’outil SILLAGE, outil de gestion administrative des dossiers présumés frauduleux : En premier lieu, la commission relève que Monsieur X sollicite la communication du code source de l’algorithme utilisé pour cibler les fraudes. Le directeur général de Pôle emploi a toutefois informé la commission que le logiciel SILLAGE, qui est un outil de gestion administrative des dossiers suspectés d'être frauduleux et d'établissement de statistiques, ne comporte aucun traitement algorithmique de détection des fraudes. Eu égard à la finalité de ce logiciel, la commission en déduit que le point 2) de la demande, tel qu’il est libellé, est sans objet en tant que portant sur des documents inexistants. La commission estime qu’il en va de même des points 3) et 7), dès lors qu’il n’apparaît pas que ce logiciel aurait été développé à partir de modèles entraînés. Elle déclare enfin également le point 10) sans objet, le directeur général de Pôle emploi ayant précisé qu’aucun document n’a été échangé avec la CNIL au sujet de l’outil SILLAGE. En deuxième lieu, la commission estime que les documents mentionnés au point 1) sont librement communicables à toute personne qui en font la demande en application de l’article L311-1 du CRPA. Elle émet donc un avis favorable à leur communication. En troisième lieu, la commission estime que les documents cités aux points 4), 5), 6), 8) et 9) sont également librement communicables à quiconque en fait la demande. Ce droit doit toutefois s’exercer dans le respect des intérêts protégés par les articles L311-5 et L311-6 du CRPA. Par ailleurs, aux termes de l’article L311-7 : « Lorsque la demande porte sur un document comportant des mentions qui ne sont pas communicables en application des articles L311-5 et L311-6 mais qu'il est possible d'occulter ou de disjoindre, le document est communiqué au demandeur après occultation ou disjonction de ces mentions ». N’ayant pas pris connaissance de ces documents, la commission précise, d’une part, que devront être préalablement disjoints ou occultés, en application du d) du 2° de l’article L311-5 du CRPA, les éléments dont la communication porterait atteinte à la sécurité des systèmes d’information de Pôle emploi. Elle rappelle à nouveau que l’atteinte à la sécurité des systèmes d’information s’interprète de manière stricte, dans les conditions posées par son avis de partie II, n° 20213847, du 13 janvier 2022. Elle ajoute que devront aussi être disjointes ou occultées, le cas échéant, en application du g) du 2° de l’article L311-5 du CRPA, les mentions dont la communication porterait atteinte à la recherche et à la prévention, par les services compétents, d’infractions de toute nature, en application des principes qui ont été précédemment développés. La commission rappelle, d’autre part, qu’en application de l'article L311-6 du CRPA, devront également être occultées, le cas échéant, les mentions dont la communication porterait atteinte à la protection de la vie privée, qui porteraient une appréciation ou un jugement de valeur sur une personne physique désignée ou identifiable ou qui feraient apparaître un comportement d'une personne dont la divulgation pourrait lui porter préjudice. La commission émet, sous ces réserves, un avis favorable à la communication des documents sollicités.