La crise sociopolitique dans les deux régions anglophones (Nord-Ouest et Sud-Ouest) du Cameroun, qui perdure depuis près de huit ans, est un exemple de la manière dont le biais d'échantillonnage des données crée un terrain fertile pour la désinformation et la mésinformation. Le Cameroun abrite une population majoritairement francophone, les deux régions anglophones étant minoritaires. Compte tenu de cette disparité linguistique, les données relatives au pays peuvent ne pas représenter correctement l'ensemble de sa population et ce décalage crée des possibilités de biais.

Cet article explore de quelle manière le biais d'échantillonnage des données contribue à la diffusion de la désinformation, en utilisant la crise sociopolitique actuelle dans les régions anglophones du Cameroun comme étude de cas. Je discuterai également des stratégies visant à atténuer le biais d’échantillonnage des données afin d’assurer une représentation plus précise de la réalité.

Mésinformation vs Désinformation

L'oxford advanced learners dictionary (OALD) définit la mésinformation comme une information incorrecte ou inexacte partagée sans intention de tromper. Ce type d'information comprend souvent des détails trompeurs ou faux, qui peuvent se propager en raison de l'ignorance, de la négligence ou d'une erreur humaine. D'autre part, la désinformation est une fausse information intentionnelle, conçue pour induire en erreur et manipuler la perception du public, souvent pour des raisons politiques ou stratégiques (OALD). La principale différence entre les deux réside dans l’élément d’intention. La désinformation est délibérément conçue et partagée par des entités telles que des organisations gouvernementales, des acteurs politiques ou d’autres parties prenantes pour atteindre un objectif spécifique. La désinformation et la mésinformation peuvent avoir des effets néfastes sur la société en faussant la compréhension du public sur des questions essentielles, en réduisant la confiance dans les institutions et en nuisant à l'harmonie sociale.

Biais d'échantillonnage des données

Dans le contexte de la recherche, l'échantillonnage des données fait référence au processus de sélection d'un sous-ensemble d'une population plus large afin d'estimer les caractéristiques de l'ensemble de ce groupe. Idéalement, l'échantillon doit être représentatif de la population dont il est tiré. Cependant, des biais apparaissent souvent lorsque l'échantillon ne reflète pas fidèlement la population. Les biais d'échantillonnage peuvent être dus à diverses causes, telles que l'échantillonnage de commodité ou l'échantillonnage volontaire, où les données sont collectées uniquement auprès de participants facilement accessibles ou de ceux qui se portent volontairement volontaires pour participer à l'enquête. Ces formes d'échantillonnage peuvent conduire à des résultats faussés parce qu'elles ne représentent pas l'ensemble de la population. Par conséquent, les conclusions tirées de ces données sont susceptibles d'être erronées (Loftus, 2022). Les données biaisées peuvent donc servir de base à la mésinformation et, dans des cas plus extrêmes, elles peuvent être utilisées comme outil de désinformation. Par exemple, un échantillonnage biaisé des données dans les zones touchées par un conflit peut déformer la situation sur le terrain et conduire à des conclusions qui ne reflètent pas les véritables réalités auxquelles sont confrontées les populations touchées. Des données inexactes peuvent facilement être mal interprétées ou manipulées par différents acteurs pour créer des récits trompeurs, diffusant ainsi de fausses informations qui intensifient les tensions.

Impact des biais d'échantillonnage sur les régions anglophones du Cameroun

L'impact du biais d'échantillonnage est clairement visible dans les régions anglophones du Cameroun, qui sont impliquées dans un violent conflit depuis près d'une décennie. Un exemple de ce biais peut être observé dans les rapports sur les taux de reprise scolaire dans les régions du Nord-Ouest et du Sud-Ouest (NW & SW). Le 9 septembre 2024, la radio-télévision camerounaise (CRTV) a rapporté qu'environ 5 000 élèves avaient repris l'école dans ces régions. À première vue, ce chiffre semble encourageant, suggérant que de nombreux élèves retournent à l'école malgré la crise actuelle. Cependant, un reportage plus détaillé d'Equinox Television a indiqué que ces 5 000 étudiants provenaient principalement d'une seule ville, Nkambe. Lorsque ces informations sont replacées dans leur contexte, elles donnent une image différente. Si l'on compare le nombre d'élèves qui ont repris l'école au nombre total d'élèves qui devraient reprendre l'école dans l'ensemble de la région, la disparité devient alarmante. Cet exemple montre comment le biais d'échantillonnage peut masquer la vérité. Le reportage initial de CRTV peut avoir involontairement induit le public en erreur en lui faisant croire que la situation dans les régions anglophones s'améliorait, alors qu'en réalité, une partie importante de la population étudiante n'était pas retournée à l'école. Il s'agit d'un cas clair où la présentation de données biaisées - qu'elle soit intentionnelle ou non - peut conduire à la diffusion de mésinformations. Lorsque ces informations unilatérales sont délibérément utilisées pour faire avancer un récit, elles se transforment en désinformation, ce qui peut avoir des conséquences considérables, en particulier dans des environnements politiquement chargés.

Par ailleurs, en 2017, le ministère camerounais de la fonction publique, en collaboration avec le ministère de la justice, a lancé un programme de recrutement de magistrats anglophones de common law. Prévu à l'origine pour une durée de quatre ans, ce programme est toujours en cours. Selon les directives de recrutement, 80 % des candidats retenus doivent provenir des régions du Nord-Ouest et du Sud-Ouest touchées par la crise, tandis que les 20 % restants doivent être issus des huit autres régions. Cette stratégie vise à résoudre le problème anglophone.

Cependant, une question importante et non résolue persiste parmi les Camerounais: Qui peut être qualifié d'anglophone? S'agit-il d'une personne originaire du Nord-Ouest ou du Sud-Ouest, d'une personne qui a grandi dans cette région et qui parle anglais, ou d'une personne éduquée dans le système éducatif anglophone? De nombreux Camerounais des huit autres régions ont également étudié exclusivement en anglais et connaissent la common law. L'absence de définition claire favorise les biais d'échantillonnage, ce qui peut avoir un impact négatif sur la prise de décision, la communication et l'harmonie sociale.

En outre, environ 7 000 Camerounais se sont inscrits aux examens en 2017, mais en 2024, ce nombre était tombé à moins de 200 candidats. Entre-temps, un bâtiment impressionnant a été construit à l'École nationale d'administration et de magistrature pour la section de droit commun - un recrutement qui n'est pas indéfini. Ce biais d'échantillonnage peut conduire à la désinformation. Par conséquent, au lieu de résoudre le problème anglophone, le gouvernement risque de créer par inadvertance de nouveaux problèmes.

Atténuer les biais d'échantillonnage grâce à l'échantillonnage aléatoire stratifié

Pour atténuer le risque de biais d'échantillonnage, les chercheurs et les décideurs politiques peuvent recourir à l'échantillonnage aléatoire stratifié (EAS). Le EAS est un type d'échantillonnage aléatoire dans lequel la population est divisée en sous-groupes ou strates distincts sur la base de caractéristiques communes, telles que la langue, la situation géographique ou le statut socio-économique. Un échantillon aléatoire est ensuite sélectionné dans chaque strate, ce qui garantit que tous les sous-groupes sont proportionnellement représentés dans l'échantillon final (Nguyen et al., 2021). Dans le cas du Cameroun, le EAS pourrait aider à différencier les populations distinctes des régions francophones et anglophones, ce qui permettrait une collecte et une analyse plus précises des données. Cela permettrait de s'assurer que les défis spécifiques auxquels est confrontée la population anglophone ne sont pas négligés ou marginalisés dans les rapports nationaux. Le EAS est particulièrement efficace lorsqu'il existe des différences significatives au sein d'une population, comme c'est le cas avec les deux systèmes d'éducation et de justice du Cameroun. En traitant chaque région ou sous-groupe comme une population à part entière, les chercheurs peuvent recueillir des données plus précises qui reflètent les conditions réelles sur le terrain. Cette approche permet non seulement de réduire les biais d'échantillonnage, mais aussi de prévenir la propagation de la mésinformation et de la désinformation en garantissant que les données utilisées dans le discours public sont plus représentatives de la population dans son ensemble (Saksena, 2020).

Je pense que les organisations de la société civile et le public qui s'appuient sur des données de recherche devraient d'abord s'assurer qu'ils comprennent la population et vérifient la taille de l'échantillon. Toute donnée qui ne représente pas toutes les couches de la population doit être considérée avec prudence, car elle peut contribuer à la mésinformation ou à la désinformation. Une compréhension claire de chaque strate de la population est essentielle pour analyser les données de manière à refléter fidèlement chaque groupe.

Conclusion

En conclusion, le biais d'échantillonnage des données présente un risque important pour l'exactitude des informations et peut servir de terreau à la fois à la mésinformation et à la désinformation. Dans des pays comme le Cameroun, où les tensions sociopolitiques sont fortes, des données biaisées peuvent fausser la perception du public et aggraver les conflits. Il est donc essentiel de minimiser le biais d'échantillonnage afin d'éviter la propagation néfaste de fausses informations. L'échantillonnage aléatoire stratifié constitue un moyen efficace d'atténuer ce biais, en veillant à ce que les données reflètent plus fidèlement la diversité de la population. En nous attaquant aux causes profondes du biais d'échantillonnage, nous pouvons contribuer à construire une société plus informée et plus résiliente, mieux équipée pour contrer la mésinformation et la désinformation.

Point de discussion

Le biais d'échantillonnage peut-il être totalement éliminé pour obtenir une représentation parfaite des données? Faites-nous part de vos réflexions dans les commentaires.

Hashtags: #Biais des données #Mésinformation #Prévention de la désinformation #Biais d'échantillonnage #Échantillonnage des données.

Références:

1. Boukouvalas, Z. et Shafer, A., 2023. Rôle des statistiques dans la détection de la mésinformation : A review of the state of the art, open issues, and future research directions. Annual Review of Statistics, 11, pp.27-50. Disponible à l'adresse : https://doi.org/10.1146/annurev-statistics-040622-033806 [Consulté le 12 septembre 2024.

2. Loftus, E.F. et Klemfuss, J.Z., 2022. Mésinformation-passée, présente et future. Psychology, Crime & Law, 30(4), pp.312-318. Disponible à l'adresse : https://doi.org/10.1080/1068316X.2023.2219813 [consulté le 20 septembre 2024].

3. Nguyen, Trong & Shih, Ming-Hung & Srivastava, Divesh & Tirthapura, Srikanta & Xu, Bojian. (2021). Stratified random sampling from streaming and stored data. Distributed and Parallel Databases. 39. 1-46. 10.1007/s10619-020-07315-w.

4. Dictionnaire Oxford pour apprenants avancés, 7e édition

5. Rahman, Md & Tabash, Mosab & Salamzadeh, Aidin & Abduli, Selajdin & Rahaman, Md. Saidur. (2022). Techniques d'échantillonnage (probabilités) pour les chercheurs en sciences sociales quantitatives : A Conceptual Guidelines with Examples. SEEU Review. 17. 42-51. 10.2478/seeur-2022-0023.