Eléments pour une sociologie scientifique

Un article de Caverne des 1001 nuits.

(Différences entre les versions)
Version du 21 mai 2009 à 14:49 (modifier)
1001nuits (Discuter | Contributions)
(publish)
← Différence précédente
Version du 21 mai 2009 à 14:50 (modifier) (défaire)
1001nuits (Discuter | Contributions)
m (a renommé Elements pour une sociologie scientifique en Eléments pour une sociologie scientifique)
Différence suivante →

Version du 21 mai 2009 à 14:50

Si l'on prend pour définition de base le fait que la sociologie soit l'étude d'une société, que par cette définition on passe outre habilement les grandes querelles sur la nature de cette science dite «humaine», si l'on vise à user de méthodes scientifiques sans pour autant être tenté systématiquement par des interprétations conjecturales des résultats, voire même tenté de créer des études en vue d'y exprimer un point de vue personnel, il semble naturel d'élucider le concept même de «données sociales».

Sommaire

Données et phénomène négligeable en sciences

Naturellement, il est question de trouver un point de repère dans cette démarche, point de repère qui ne peut venir que de la science elle-même, dans la mesure où cette dernière nous montre, au travers de l'épistémologie, comment une pensée se conceptualise au travers de données éparses afin d'aboutir à une théorie vérifiable, et plus récemment à des théories envisagées comme modèles[1].

Dans la démarche scientifique, on constate un incessant aller-retour entre théorie et données expérimentales. Une théorie est souvent créée à partir d'un jeu de données derrière lesquelles on envisage qu'il puisse exister une loi, une relation cachée qu'il est du travail du scientifique d'exhiber[2]. Les premières versions de la théorie visent souvent à extrapoler ces données afin de trouver une approximation sous forme de fonction de la loi considérée, les expériences ultérieures permettant d'infirmer ou de confirmer la loi, et le plus souvent de la corriger.

Le problème des lois de la science est que, plus ce processus de correction devient précis, plus il est nécessaire de se poser des questions sur les «variables» de la loi.

Considérons un exemple précis : un jet de pierre en mécanique newtonienne. Dans des conditions idéales, la trajectoire de la pierre dépend d'un nombre limité de paramètres : angle de lancée, accélération du lancement, poids de la pierre, attraction terrestre. Dès lors que cette loi envisage que la pierre n'est pas lancée dans le vide, un facteur correctif apparaît pour prendre en compte le paramètre résistance de l'air. Si l'on veut être encore plus précis, nous pouvons aller jusqu'à ajouter d'autres termes correctifs comme le sens du vent ou même les effets de la rotation de la Terre sur la trajectoire de la pierre (Force de Coriolis). L'équation finale de la trajectoire pourra donc, en fin de compte s'avérer beaucoup plus complexe que ce qu'elle était initialement.

Afin de pouvoir être en mesure d'utiliser des lois simples dans les cas dans lesquels il ne se justifie pas de mesurer très précisément les phénomènes, les scientifiques ont recours à des approximations, qui, quoique que n'indique pas le terme utilisé, obéissent à des règles très précises permettant de justifier, au vu de ce que l'on étudie, si l'approximation est valide ou non, si le facteur correctif est négligeable ou pas. Afin de déterminer si un facteur correctif est négligeable, il faut le comparer avec le phénomène principal étudié et établir des échelles de valeurs mesurables. Ainsi, pour négliger un terme dans une équation, le scientifique fera un calcul d'incertitude et encadrera le terme négligé par une borne supérieure et une borne inférieure. Si la marge d'erreur est très nettement en deçà des échelles auxquelles on observe le phénomène principal, le terme sera déclaré négligeable.

Cette notion de négligeabilité (barbarisme) est bien entendu à la fois très puissante et un peu dangereuse si elle n'est pas appliquée de manière rigoureuse au sein des calculs. Elle peut donc être facilement une source d'erreur si par hasard, un terme négligé s'avère non négligeable. Néanmoins, bien utilisée, cette notion permet de hiérarchiser les variables d'un problème complexe en fonction de leur effet sur le phénomène étudié.

De plus en plus en sciences, on s'aperçoit que la plupart des lois simples peuvent n'être qu'une solution particulière à des lois plus générales. En effet, quand une loi dépend de plusieurs variables interconnectées et dépendant elles-mêmes d'autres paramètres, les lois sont volontiers exprimées avec des équations aux dérivées partielles. Ainsi, les équations de Maxwell, par exemple, lient la différence d'intensité constatée d'un champ électrique avec l'évolution dans le temps d'un champ magnétique dit induit, dite dérivée partielle du champ magnétique par rapport au temps (selon certaines conditions opératoires).

Dans ce genre d'équations, la relation entre les dérivées partielles est souvent le résultat intéressant, alors que la fonction solution peut n'être pas connue. D'ailleurs, il est fort probable qu'un grand nombre de fonctions de plusieurs variables vérifient cette équation sans forcément qu'aucune d'entre elles ne puisse être explicitée. On appelle cela des familles de solutions. Pourquoi, dans la plupart des cas, les scientifiques ne sont que peu gênés par le fait de ne pas pourvoir exprimer la loi en elle-même mais seulement une propriété de la fonction loi ? Parce que ces propriétés lient entre elles des fonctions qui ne peuvent exister que conjointement.

Le concept est extrêmement intéressant : deux fonctions liées l'une à l'autre sans pouvoir être exprimées de manière claire de manière unitaire, autrement que dans leurs interactions respectives. Depuis, l'introduction de ce genre de fonctions de plusieurs variables, la vision épistémologique de la science a changé.

Des données de la sociologie

Les données expérimentales de la sociologie offrent, quant à elles, un certain nombre de caractéristiques étonnantes par rapport aux autres données scientifiques résultant de l'expérience. La principale caractéristique est leur simplicité :

  • elles ne semblent pas dépendre du temps,
  • elles semblent absolues,
  • elles semblent être des nombres plutôt que des fonctions,
  • elles semblent ne devoir participer qu'à des fonctions d'une seule variable,
  • elles ne sont corrélées entre elles qu'au biais d' interprétation conjecturale.

Les sondages en sont le plus bel exemple. Outil ultime du sociologue, le sondage n'est que peu souvent mis en rapport avec le temps, non que le sondage n'ait pas pour but de capter les sentiments d'une opinion publique après ou avant un certain événement, mais que les résultats ne sont pas véritablement envisagés sur la durée. La raison en est simple : un sondage doit coller à la réalité, par conséquent, les questions doivent changer selon l'objet étudié : la fonction réponse à la question n'a donc pas de composante temporelle[3].

Ce manque de mise en perspective du sondage dans le temps est un problème qui s'ajoute au fameux problème de l'«échantillon représentatif», difficile à trouver, et dont l'expression peut être alle aussi biaisée par des phénomènes extérieurs. Les résultats d'autres sondages sur les sondés ne sont jamais non plus pris en compte, jamais modélisés en tant que tel, ce qui fait de cet outil, comme tout le monde peut le savoir, à la fois le seul thermomètre social mais aussi un des plus imprécis.

L'utilisation du sondage par les sociologues est donc très tentante car ce dernier a les apparats de la donnée scientifique (sans que personne ne se pose la question de comment ces données ont été recueillies ni quel travers les questions pouvaient comporter envers les sondés) et peut être interprété dans le sens que l'on souhaite, sans un effort surhumain.

Vers des données sociologiques plus fiables

L'erreur à mon avis fondamentale de l'analyse par sondages et d'une certaine façon d'une grande part des analyses sociologiques, est de vouloir mesurer l'homme directement. En d'autres termes, c'est souvent l'homme qui est à la source de la donnée, or il est bien connu que l'homme est une «source de données» très changeante... D'où la grande ambiguïté de la sociologie de pressentir des formes structurelles dans la société sans réellement parvenir à les mettre en exergue du fait de la mesure au travers de l'homme. Pour en revenir à l'exemple de la pierre lancée, c'est comme si des scientifiques attachaient sur la pierre une caméra pour comprendre son mouvement en regardant les images. Il y a là une perspective d'analyse contestable.

Or, pour obtenir des données sur la société, l'homme peut n'être pas le seul moyen de quantifier : des indicateurs non mesurés sont là à nous attendre ; ils sont quantifiables, objectifs, et ne dépendent pas des hommes. Bien entendu, les résultats seront soumis à des interprétations qui pourront être partiales, mais les données resteront, elles, les mêmes, ce qui ouvre une perspective immense, en totale rupture avec les méthodes de type sondage : si une analyse fondée sur ces données est contestable, elle pourra être refaite à partir des mêmes données et de la mise en perspective des données utilisées avec d'autres sources de données. En d'autres termes, le résultat de l'expérience sera incontestable et pourra être utilisé par divers personnes n'ayant pas eu de rôle dans l'établissement d'un quelconque questionnaire servant de base à un sondage.

Parvenir à un mode de fonctionnement de la sorte lèverait une des grandes ambiguïtés de la sociologie où le sociologue est souvent juge et parti, créateur du questionnaire et interprète des réponses. Le scientifique, lui, mesure avec des instruments qu'il ne peut pas (ou ne devrait pas pouvoir) influencer et tente des interprétations, ce qui est tout à fait différent.

Dans le reste de cet article, nous proposerons deux axes d'investigation qui pourraient permettre d'obtenir des données objectives desquelles des lois sociologiques scientifiques pourraient être dérivées, à l'aide de l'arsenal d'outils que proposent les mathématiques ou la physique : statistiques, fonctions de plusieurs variables, équations au dérivées partielles, intégration, probabilités, mathématiques fractales[4], etc.

Bien entendu, cette approche est contestable notamment dans sa partie interprétative, mais elle a au moins le mérite de déterminer un protocole d'étude et d'acquisition des données dans lequel les données relatives aux comportements humains sont récoltées sans faire intervenir l'homme dans la phase de sondage (constitution du domaine d'étude et formulation de ce qui doit être étudié), ni en tant qu'unique source de données, avec l'inconscient collectif en toile de fond.

Nous proposerons dans l'immédiat deux axes d'étude qui nous paraissent fort prometteuses dans cet aspect mesure des données brutes : les mesures relatives au temps, et les mesures relatives aux mots.

Les mesures relatives au temps

Il s'agit dans cette optique de commencer par compter le temps des personnes, prises par exemple dans le cadre de cet échantillon représentatif, de mesure leur temps de travail, de réflexion, leur temps avec d'autres personnes ou leur temps de loisirs.

Cela permettrait de décomposer le spectre du temps d'une personne type et de s'intéresser aux écarts avec une certaine norme, d'entrevoir les moments où cette personne peut s'occuper de soi ou de sa famille, et de corréler ces mesures avec d'autres mesures sur le temps des enfants, le temps de sommeil ou les temps de vacances. Ces mesures de temps humains peuvent aussi servir à estimer l'influence des médias sur les personnes, simplement par un calcul quantitatif (et donc insuffisant bien entendu) du nombre de minutes à regarder la couverture récurrente d'un même événement à la télévision, dans la presse ou à la radio par exemple.

Dans le cadre de ces comptages de temps, des indices pourraient être trouvés qui mettraient en relation des facteurs de diversité ou de routine des comportements humains, routines ou diversités qui pourraient être quantifiées à leur tour et mise en relation avec des événements externes dans la même période de temps.

On pourra ensuite s'intéresser aux mesure des temps des médias, par exemple, comment est couvert un événement médiatique en terme de minutes (ce qui est d'ailleurs fait au niveau des campagnes électorales et du temps de parole des candidats de chaque parti aux élections), la fréquence de récurrence d'un événement dans les médias, le nombre de mots prononcés à chaque fois, l'utilisation de mots d'un certain registre lexical, l'influence sur le comportement des gens en terme de dépense de temps personnel, d'énergie visible.

De vastes champs peuvent s'ouvrir depuis cette approche simpliste, si et seulement si de véritables modèles sont créés a posteriori à partir de ces données afin de tenter d'établir des lois explicites ou implicites sur des données variant suivant de nombreux paramètres.

Les mesures des mots

Les mesures de mots peuvent obéir aux mêmes visées : compter les mots dans les articles de journaux, prononcés à la télévision, établir une cartographie de la richesse du vocabulaire courant et des facteurs de finesse des idées, même pourquoi pas pour les volontaires, compter les mots prononcés et les champs lexicaux fréquemment utilisés pour arriver à établir une représentation de l'inconscient collectif d'un pays au travers d'un échantillon représentatif de sa population.

Le travail sur les mots est un des plus aisés à réaliser car, d'une certaine façon, il peut être traité de manière massive à partir de certaines sources de données sur internet par exemple et de règles simples transformables en programmes pour l'acquisition de ces données. Bien entendu, si l'expérience peut théoriquement (et quoique dans un domaine restreint) être plus accessible au travers de l'informatique, rien ne pourra se faire si de vastes modèles ne sont pas construits par des sociologues scientifiques en vue de suivre le même chemin que toutes les modélisations des sciences, soit des incessants allers-retours entre la théorie et les données.

Le fantôme de Big Brother

Dans ces démarches qui visent à obtenir des données brutes, il reste un problème d'acceptation de la démarche, car qui dit mesure de l'homme en dehors de l'intervention active de l'homme, je dirais même l'intervention «consciente» de l'homme, dit surveillance, et peut aller jusqu'à dériver sur les violations de droits de l'homme, etc. Il ne faut, en la matière, ne sous-estimer ni la résistance active ou passive à des études sur notre société au travers du traitement d'un très grand nombre de données en provenance de l'analyse de notre vie quotidienne, ni la résistance des sociologues incapables de projeter leur données autrement que dans des modèles mettant en situation des fonctions non corrélées ne dépendant que d'une variable.

D'un autre côté, il faut savoir que l'étude de l'homme passe par mettre des hommes en situation exceptionnelle. Milgram[5], par exemple, aurait-il pu faire ses expériences aujourd'hui, alors que ses cobayes humains, désireux de toucher un peu d'argent sortaient souvent traumatisés de l'expérience ?

Il faut que la communauté des sciences humaines se positionne clairement sur son futur. L'homme doit-il être un sujet/objet d'étude (je suis très méfiant quant à ces disjonctions) ou l'étude de l'homme est-elle, pour diverses raisons tabou ? D'une certaine façon, revenir aux comptages purs et simples de faits insignifiants est déjà un aveu d'échec puisque, si l'expérience était tentée véritablement, nous pourrions la comparer avec une démarche purement phénoménologique : cherchez tous les phénomènes et nous verrons bien ce que nous trouverons plus tard. Cela dit, une phénoménologie sans création de concept est absurde[6]. Peut-être que la phénoménologie pourrait être le tremplin vers le renouveau de la sociologie, à condition que certains acteurs principaux de ce domaine prennent leurs responsabilités.

Notes

  1. A suivre un article de fond en préparation sur la différence d'approche scientifique entre théorie et modèle.
  2. Cette notion a été l'objet de nombreux débats au début du XXème siècle au sujet des fondements des mathématiques entre les intuitionnistes et les constructivistes. En substance, les uns voyaient dans les mathématiques la découverte de la Vérité tandis que les autres n'y voyaient qu'une représentation du monde parmi d'autres.
  3. Ce n'est pas toujours vrai, et il faut aussi noter que le contexte changeant relativement souvent, certaines questions de sondage deviennent d'elles-mêmes obsolètes.
  4. Cf. [(Les lois d'échelle en sciences humaines]].
  5. Cf. De la culpabilité allemande face au nazisme.
  6. Cf. A propos de l'existentialisme.