Retour en Africa Check

Pourquoi des statistiques fiables sont si importantes pour les vérificateurs de faits

Andrew Dudfield, chef de production chez Full Fact, distille les grandes lignes des entretiens menés avec des vérificateurs de faits du monde entier sur les données statistiques qu'ils utilisent.

Les vérificateurs de faits s'appuient sur les données des instituts nationaux de statistiques pour faire leur travail de lutte contre la désinformation. L'Open Data Institute (ODI) et Full Fact ont interrogé des vérificateurs de faits du monde entier sur les données statistiques qu'ils utilisent. Dans ce blog, Andrew Dudfield, chef de production chez Full Fact, présente les grandes lignes de ces entretiens.

L'une des clés de la déconstruction des fausses informations est l'accès facile à de bonnes informations de haute qualité. Les statistiques – en particulier les statistiques officielles – sont universellement l'une des sources les plus importantes de ces informations de haute qualité. Les statistiques sont au cœur de la plupart des affirmations que nous vérifions à Full Fact. Elles constituent la base de tant de discours dans la société et sont une composante essentielle de la manière dont nous demandons des comptes aux gens.

Cela n'a jamais été aussi clair que pendant la pandémie actuelle. Nous avons tous été bombardés par des vagues de données et de mesures officielles – le taux de R (le taux de R est un moyen d'évaluer la capacité de propagation du coronavirus ou de toute autre maladie), le nombre d'infections pour 100 000 personnes – et dans notre travail de vérification des faits, nous avons également trouvé des domaines où le manque de données de haute qualité crée un espace favorable au développement des fausses informations.

Améliorer la façon dont les statistiques sont publiées pour faciliter la vérification des faits

En 2019, Full Fact, Chequeado, Africa Check et l'Open Data Institute (ODI) ont reçu une subvention de Google.org dans le cadre du programme global AI impact challenge. Cette subvention nous a permis d'accélérer notre travail pour aider à comprendre où la technologie, et en particulier l'IA, peut améliorer le travail des vérificateurs de faits. 

Dans le cadre de ce travail, nous avons abordé trois sujets :

  1. Aider à identifier les bonnes choses à vérifier chaque jour
  2. Vérifier les faits aussi rapidement que possible
  3. Trouver les resurgissements des éléments que nous avons déjà vérifiés

Entre octobre et décembre 2020, l'ODI et Full-Fact ont mené 15 entretiens avec des fact-checkers, des statisticiens et des technologues pour essayer de comprendre au mieux comment les statistiques peuvent être publiées pour aider les fact-checkers.

Les participants venaient de huit pays situés dans cinq continents différents, et se composaient de:

  • Neuf fact-checkers (ou personnes qui dirigent des fact-checkers)
  • Trois technologues qui travaillent dans des organisations de vérification des faits
  • Trois experts en publication de données statistiques nationales (mais qui ne sont pas des fact-checkers)

Ce que nous avons découvert à travers nos recherches

L'importance du contexte

Le fait de comprendre d'où viennent les données, comment elles ont été obtenues et s'il y a des choses à surveiller est souvent extrêmement important dans le travail de vérification des faits. Les fact-checkers incluent souvent le contexte dans leurs articles. Et un contexte supplémentaire est parfois nécessaire pour montrer aux lecteurs s'ils doivent faire confiance aux chiffres publiés par les instituts nationaux de statistiques. Il permet également de montrer les lacunes des données, si elles existent. Cela contribue ensuite à renforcer la confiance des lecteurs dans les vérificateurs de faits.

Il est utile de savoir si des méthodes « expérimentales » sont utilisées – telles que la modélisation ou l'échantillonnage – et cela est particulièrement pertinent lorsque l'institut national de statistique utilise davantage de méthodes de science des données ou d'apprentissage automatique. 

Fiabilité des données pour la vérification des faits

Un thème crucial était de savoir si un vérificateur des faits peut compter sur les données. L'actualité des données –  le caractère récent des informations – est considérée comme une priorité absolue. Cependant, elle fait souvent défaut dans les pays ou les services disposant de moins de ressources.

De nombreux fact-checkers ont déclaré qu'il était très important de relier les données dans le temps et de faire des comparaisons avec les années précédentes. Une longue série historique dont la méthodologie n'a pas changé donne un sentiment de stabilité ou de fiabilité des données. La comparabilité a également été mentionnée assez souvent – les vérificateurs de faits veulent pouvoir comparer des données sur un sujet similaire provenant de deux endroits différents ou de deux périodes différentes.

Le fait que plusieurs organisations publient des données sur un sujet similaire est une question complexe selon le pays. Alors que certains trouvent qu'il est bon d'avoir une source unique de vérification, d'autres estiment qu'il est utile d'avoir plusieurs organisations pour étayer ou ajouter plus de confiance aux chiffres. Les données provenant d'autres organisations peuvent compléter celles publiées par les instituts nationaux de statistiques ou constituer un filet de sécurité en cas de défaillance du service public.

Lorsque les données et les informations sont réparties entre plusieurs organisations, cela crée un problème lorsqu'il s'agit de grandes questions structurelles comme la Covid-19, le changement climatique ou l'environnement. Ce problème se pose moins pour des questions ou des sujets spécifiques et ciblés.

La publication et le format comptent beaucoup

Les fichiers CSV sont de loin le format le plus demandé pour la publication de données, mais ils ne sont pas toujours disponibles pour les vérificateurs de faits. Ces derniers doivent souvent « décomposer » les données du support dans lequel elles ont été publiées, par exemple des images plates ou des PDF. Ils créent ensuite souvent leurs propres feuilles de calcul ou ensembles de données pour effectuer leur propre analyse.

Les instituts nationaux de statistiques devraient donc publier des feuilles de calcul connexes en même temps que le rapport dans lequel ils incluent des données.

Sans surprise, les API étaient très populaires auprès des technologues. Cependant d'autres vérificateurs de faits férus de technologie ont eu à les réclamer.

Conclusion et prochaines étapes

Les thèmes de cette recherche n'étaient pas inattendus, mais ils montrent bien le défi auquel nous sommes confrontés.

Un accès facile et constant à des statistiques de haute qualité facilite la vérification des faits, surtout quand elles sont sous une forme que les machines peuvent traiter. Cela signifie que nous pouvons utiliser la technologie pour réduire le temps nécessaire à la vérification des faits. Le fait de disposer de statistiques que les machines peuvent non seulement traiter, mais aussi en comprendre le contexte, les réserves et la complexité des chiffres, changerait la donne.

Sur cette base, notre projet collectif va maintenant produire des exemples du type de changements que nous pensons pouvoir être apportés par ceux qui publient des statistiques pour aider spécifiquement les vérificateurs de faits. Notre objectif est d'être pratique.

Nous nous baserons sur des exemples allant de simples changements dans la façon dont un CSV est publié pour en faciliter l'utilisation, jusqu'à des idées plus sophistiquées sur la façon dont le contexte et les avertissements peuvent être ajoutés aux API. Nous partagerons au fur et à mesure ce travail, ouvertement, au cours du reste de l'année. 

Si vous travaillez dans le domaine des statistiques nationales ou de la vérification des faits, jetez un coup d'œil à notre première ébauche de lignes directrices pour la publication de données afin de soutenir les vérificateurs de faits et faites-nous savoir ce que vous en pensez.

 

Ce blog a également été publié par Full Fact et l'Open Data Institute.

Ajouter un commentaire

HTML restreint

  • Balises HTML autorisées : <a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd> <h2 id> <h3 id> <h4 id> <h5 id> <h6 id>
  • Les lignes et les paragraphes vont à la ligne automatiquement.
  • Les adresses de pages web et les adresses courriel se transforment en liens automatiquement.
limit: 600 characters