Skynet est un programme utilisé pour identifier des membres d’Al-Qaida puis les tuer avec des drones. “Le Monde” révèle en détails comment fonctionne le principe.
Les agents de la NSA ne manquent pas d’humour… noir. Ils ont appelé Skynet, du nom du système informatique incontrôlable de “Terminator”, leur programme chargé d’analyser les métadonnées d’appels téléphoniques pour tenter de détecter des activités suspectes. Selon “Le Monde”, qui a exploité les documents révélés en avril par Edward Snowden, Skynet a été déployé au Pakistan pour identifier des membres d’Al-Qaida, puis les tuer à coups de drones télécommandés.
Le quotidien révèle en détails comment fonctionne ce programme.
- Collecter des données sur le mode de vie des cibles
Cela commence par une collecte massive de métadonnées, principalement celles des compagnies de téléphone mobile (lieu, temps de conversation…). Au total, ce sont 80 catégories de données qui sont extraites puis analysées. “L’hypothèse fondamentale est que le mode de vie des cibles à identifier diffère fortement de celui des citoyens ordinaires”, écrit “Le Monde”.
- Séparer “terroristes” et “innocents” grâce à des algorithmes
Skynet s’appuie également sur la “vérité de terrain”, un lot de données dans lequel les utilisateurs de téléphones mobiles ont été classés en deux catégories : “terroristes” et “innocents”. Mais comment savoir qui est terroriste et qui est innocent ? Les documents de l’agence suggèrent que Skynet utilise les données personnelles de membres connus d’Al-Qaida afin d’établir un profil type de terroriste, à lequel est comparé l’ensemble des autres profils.
Une série d’algorithmes produit ensuite un score pour chaque individu, avec un seuil prédéterminé : si le score d’un individu est supérieur au seuil, c’est un terroriste, et si son score est inférieur, il est innocent.
“En fonction des données de la ‘vérité de terrain’, la NSA s’offre une marge de sécurité en choisissant un seuil garantissant que seul un certain pourcentage de ‘terroristes’ seront formellement classés comme tels”, indique “Le Monde”. Selon les documents divulgués par Edward Snowden, l’agence a choisi 50 % : la moitié des “terroristes” sont des innocents ou des “faux négatifs” ; la moitié des “innocents” sont des terroristes, soit des “faux positifs”.
Des résultats “invalides”
En comparant les données de 100.000 individus à sept téléphones de terroristes connus, la NSA détermine un pourcentage de “faux positifs”. Là où on avait 50% de faux négatifs, l’algorithme détermine finalement 0,18% de faux positifs ou même 0,008 % pour sa version améliorée.
“En réalité, ces résultats sont scientifiquement invalides”, note “Le Monde”. “Cette méthode ne permet pas la généralisation souhaitée, car les 100.000 individus sont choisis au hasard, alors que les sept terroristes proviennent d’un lot déjà connu. […] Il aurait fallu mélanger les ‘terroristes’ à la population générale avant de choisir un échantillon au hasard, mais cela ne serait pas pratique, à cause de leur nombre minuscule – sept au total.”
Cette erreur qui peut paraître insignifiante est en fait très importante : “0,008 % de la population du Pakistan représente près de 15.000 ‘innocents’ accusés à tort – tandis que, dans le même temps, 50 % des ‘terroristes’ ne seront pas visés, car leur score est inférieur au seuil fixé arbitrairement”.
On ignore toutefois si tous les individus classés comme “terroristes” par Skynet sont ensuite systématiquement visés par des drones.
avec l’obs