Articles tagués : statistique

Torse nu

Un internaute « bien intentionné » – et plus rigoriste que les mœurs – s’est étonné de ce que sur Google des images d’adolescents torse nu apparaissent en premier lorsque l’on tape « argoul » ou « argoul.com ». Je ne l’avais pas remarqué, n’utilisant que très peu le moteur de recherches américain Google. Mais c’est vrai, bien plus que les vahinés – pourtant seins nus – qui sont fort nombreuses dans les notes sur Tahiti.

argoul images google

Question : suis-je « obsédé » par les torses nus ? Réponse : pas plus qu’un autre.

La cause principale en est les voyages (Cuba par exemple) parce que telle est la vie là-bas, ensuite la catégorie Mer et marins (avec la plage) où c’est la tenue évidente. Il y a aussi l’idée, en philosophie, que la jeunesse est la vie (Nietzsche : « innocence et oubli, un jeu ») ou, pour la philosophie grecque, que la nudité représente la sincérité, la transparence, l’appel au débat démocratique. Toutes ces catégories (voyages, mer et marins, politique, philo, BD) font l’objet de nombreuses notes sur ce blog. D’où peut-être l’impression de voir ressurgir les mêmes modes d’illustration, peut-être. La jeunesse dénudée (jamais au-delà de la décence admise) est un bienfait pour le regard, représentant la santé, la joie et la vie – tous les parents le savent bien. Encore qu’il faille relativiser : sur les peut-être 5000 images, combien de torses nus ? L’illusion statistique aggrave l’impression, il est nécessaire de raisonner en pourcentage et pas en absolu.

L’après mai 68 a desserré les carcans du vêtement comme des façons de vivre, valorisant chacun jusqu’en son corps, hier neutralisé dans le costume neutre (blouse à l’école, costume-cravate hommes, tailleur-jupe femmes). Sur les environ 1800 notes du blog, seules quelques-unes concernent les plages où le torse nu est roi. Il existe, certes, une pression puritaine pour voiler les femmes et les garçons (crainte du soleil, crainte du regard, crainte de la pollution), exacerbée par l’intégrisme quaker aux États-Unis, et par l’intégrisme catho, juif et islamique en Europe. De plus, les « bonnes intentions » pavent de plus en plus l’enfer de la vie en commun, à la Tartuffe : « Cachez ce sein que je ne saurais voir ! » disait-il en lorgnant la poitrine opulente de l’accorte servante… Mais je ne vois pas en quoi le « torse nu » est réprimandé par la loi (française), hors du droit à l’image de chacun (ce pourquoi je floute volontairement le visage sur toute image trop récente). Quiconque se reconnaîtrait, avec des arguments réels, peut d’ailleurs me demander le retrait de l’image.

Mais il suffit de consulter les AUTRES moteurs de recherche images sur argoul pour constater que les adolescents torse nu ne sont pas mis en valeur autant que sur Google. Chacun peut y aller voir : par exemple Bing :

argoul images bing

Ou Yahoo :

argoul images yahoo

Ou le moteur français libre Qwant :

argoul images qwant

Ou d’autres moteurs moins connus mais moins pubés comme Lycos :

argoul images lycos

et Exalead :

argoul images exalead

Ou encore des moteurs qui ne traquent pas les requêtes (donc les « plus demandées ») mais la fréquence : comme Privatelee :

argoul images privatelee

Ou DuckDuckGo :

argoul images duckduckgo

Il y a donc un problème Google. Il rencontre probablement, le « nu » comme obsession de notre époque hyper-individualiste et sans repères, comme je l’ai déjà pointé dans une note humoristique : « à poil » – où j’ai même publié la photo d’une chatte ado toute nue, vous vous rendez compte ? Depuis 2014, je n’ai pas été interdit… Traquer le nu est un poncif de toute observation sur les requêtes des internautes ; ajouter le mot à toute interrogation portant sur les gens, même peu susceptibles de se montrer nu (« Hollande nu », « pape François nu », et j’en passe…) est une manie ; se poster en vidéo sur Youtube en défi et torse nu est très courant aux États-Unis (qui donnent le ton à la jeunesse) donc ailleurs. Il est probable que la majorité des internautes a moins de 20 ans, ce qui explique ce prurit sensuel de la peau et cette obsession de se mesurer aux autres, de se comparer, de les voir tels qu’ils sont en leur natureté. Internet n’est apparu dans le paysage qu’à la fin des années 1990 et seuls les 15 à 20 ans ont pu naître dedans.

Mais il y a aussi l’indistinction volontaire de la société occidentale pour tous les repères, considérés comme « fascistes » (blancs, machos, sexistes, dominateurs, coloniaux, etc.). L’enfance comme mythe d’innocence est valorisée bien au-delà de ce qu’il est réaliste, comme je l’ai pointé après d’autres dans une note. Attention ! Les « anges » des prêtres catholiques appartenaient à ce genre de mythe éthéré – et l’on a vu ce qu’il en est advenu ! Qui veut faire l’ange fait la bête, on le sait pourtant depuis Pascal, spécialiste ès catholiques. Considérer les enfants comme de vrais enfants et des adolescents comme bouleversés par la puberté (et non  pas comme des anges innocents) serait une meilleure façon de ne pas les voir en objets sexuels ou poupées affectives – mais de les regarder comme des personnalités en devenir que tout adulte, qui a passé ces caps, doit protéger et aider. Contrairement à ceux qui voudraient « revenir » aux mœurs du passé, je me suis interrogé : vraiment, « c’était mieux avant ? » Pour ma part, j’ai toujours prêté une particulière attention et une réelle affection aux enfants auxquels je me suis attachés. « On est responsable de ceux qu’on apprivoise », dit le renard au petit Prince.

J’ai aussi clairement écrit sur une note de voyage à La Havane que les relations sexuelles sans la maturité qui va avec ont de très graves conséquences pour les enfants et les trop jeunes adolescents. Telle est ma position – très claire – sur le sujet. Je n’hésite d’ailleurs jamais à mettre à la corbeille tout commentaire qui fait allusion au sexe ou contrevient à la loi. Ce pourquoi les commentaires sont et resteront modérés sur ce blog.

Mais pourquoi vous étonneriez-vous que Google – moteur de recherches traquant les métadonnées d’internautes et vivant essentiellement de publicité – évite la tentation du « plus demandé » et valorise l’ordre de ses images selon ce qui serait le plus cliqué pour faire passer la pub ? Pour comprendre le business model de Google, lire ici, et là encore.

La fréquence statistique (réelle) a alors peu de choses à voir avec le ranking marketing (profitable). Car le site d’hébergement « gratuit » du blog, WordPress, doit vivre ; pour cela, il insère en fin de certaines notes très lues des publicités que l’auteur – moi – ne voit pas, ne choisit pas et dont il ne touche pas un centime. L’obsession portée au mot « nu » fait remonter les billets si le terme y figure – quel que puisse être ce qui est raconté dans le billet. Aussi, une image illustrant parfois le texte au second degré, comme cette transgression à l’autorité, figurée par un collégien torse nu dans une classe, attire-t-elle plus de lecteurs sur le sujet « régression socialiste » que si la réflexion sur le socialisme était publiée sans aucune illustration. L’image vient en appui du texte, elle n’est pas en soi : « 50% d’ex-profs au gouvernement, c’est trop : un prof dit ce qu’il faut faire, il ne le fait jamais. Les Français, tancés comme s’ils étaient en classe, osent s’y mettre en slip et tourner les clowns imbus d’eux-mêmes en dérision. Ce qui vient de se produire en Grande-Bretagne… » Seul un regard ambigu peut y voir une incitation ambiguë, je suis désolé de le rappeler aux apprentis-censeurs un brin trop zélés.

Car il ne faut pas confondre ce qui est « le plus populaire » dans les classements Google et ce qui est « effectivement publié ».  Quiconque suit le blog constate très vite que ni l’adolescence, ni le nu, ni la sexualité, ne sont les thèmes favoris sur argoul.com. « Sauter » sur ces images comme si elles représentaient la majorité des images montre combien le regard peut être orienté, guidé peut-être par des désirs inavoués, vaguement pervers. La poutre se moque volontiers de la paille, si celle-ci est perçue dans l’œil du voisin. Un article de conseils sur la façon de rechercher sur moteur donne sa conclusion : « La réussite/pertinence de la recherche survient quand l’Intelligence de celui qui interroge le moteur rencontre l’intelligence de ceux qui l’ont conçu ». Cherchez la rage, vous trouverez forcément un chien.

Mais quiconque tape « web » au lieu d' »images » trouve sans peine les « catégories les plus lues » : Stevenson, Le Clézio, Bretagne, Cannabis (hum ?) et Polynésie. Quiconque prend la peine de chercher sur ce blog trouve très vite les notes publiées – honnêtement, à partir des statistiques WordPress – sur les requêtes moteurs qui aboutissent à argoul.com Dans la dernière, depuis l’origine, « 28 435 concernent les vahinés, les filles nues ou les seins ; 4 631 seulement concernent les garçons, ados torse nu principalement ». Mais la « zone euro » est par exemple plus demandée que les torses nus : 5479 – CQFD.

Alors, torses nus oui, sexualité non.

Plus il y a de notes, plus il y a l’item « nu » – mais c’est à comparer à l’ensemble. Ne pas prendre l’arbre pour la forêt est le b-a ba du vrai chercheur. Trop nombreux sont ceux qui se content d' »impressions » immédiates au lieu de faire un effort « honnête », mais qui leur prend du temps …

Catégories : Société | Étiquettes : , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,

Prédiction, prévision, prospective

Chacun sait qu’il est plus facile de « prévoir » le passé que l’avenir… Chacun croit savoir ce qu’il aurait fait s’il s’était trouvé dans telle situation. La raison en est que l’enchaînement des causes, survenues par hasard, peut être logiquement reconstitué lorsque l’on a une vue d’ensemble : il fallait « évidemment » choisir le camp de la résistance fin juin 1940… et pourtant De Gaulle et ceux qui ont refusé d’obéir aux ordres du gouvernement Pétain « légitimement » nommé étaient juridiquement des traîtres.

Si le passé est écrit définitivement, l’avenir reste ouvert et incertain. Cette incertitude fait peur, tant l’être raisonnable qu’est l’humain a besoin de logique pour agir en sécurité. Selon la gradation du plus fantaisiste au plus scientifique, il va chercher à prédire l’avenir, à prévoir les événements, ou à bâtir une prospective. La différence entre ces trois mots est importante.

boule ado a prevoir avenir

La prédiction pré-dit, c’est-à-dire qu’elle veut énoncer tout simplement l’avenir tel qu’il va advenir. Ce sont les mots des prophètes, des voyants, mais aussi des dogmatiques : le prédicatif affirme d’une façon absolue et définitive. Nous sommes dans la croyance, qu’elle soit religieuse, idéologique ou scientiste – nous ne sommes pas dans la raison. Le performatif règne en maître – où dire c’est faire ; l’annoncer, c’est comme si c’était fait. Les politiciens sont passés maîtres dans cet art de la com’ qui s’apparente au mensonge, sous couvert d’une apparente volonté.

Prédire est affirmer ce qu’on voudrait qu’il advienne, sans autre certitude que celle de sa conviction : la « vraie » vie dans l’au-delà, la fin du monde, la société sans classe de l’avenir radieux, le bonheur-santé-richesse des marabouts et autres diseuses de bonne aventure. Rappelons cependant que Madame Soleil, qui « voyait tout » selon ses dires, n’a jamais prévu le contrôle fiscal qui lui est tombé dessus pour ses gains en liquides non déclarés…

La prévision est moins affirmative, elle ne « dit » pas l’avenir, elle se contente d’en avoir une « vision » plausible. L’intelligence entre alors en scène et maîtrise les émotions sur le futur. Le raisonnement intervient, étayé par des chiffres, des théories, des modèles (tous révisables). La statistique permet de calculer des séries temporelles, que l’on peut projeter ensuite dans l’avenir. Le plus fiable est par exemple la démographie : tous les humains qui auront l’âge de la retraite dans 10 ans sont déjà nés, la seule incertitude réside dans la mortalité de cette cohorte d’ici-là – et dans l’âge de la retraite lui-même, qui peut changer. Le moins fiable est peut-être la bourse ou la météo, les deux dépendant de tant de variables qu’il est difficile de dessiner une tendance – sauf lorsque la situation reste à peu près stable ou dans un trend établi.

Prévoir, c’est prendre des précautions logiques en fonction de ce que l’on connait aujourd’hui. Ce n’est pas affirmer un avenir certain, mais seulement un avenir possible. C’est considérer comme plus ou moins probable la survenance de tel évènement (chaque probabilité est calculable) – et s’y préparer « au cas où ».

La prospective est plus large. Elle vient d’un terme d’optique qui permet d’élargir la vision. Il s’agit de différents scénarios plausibles, plus ou moins probables mais dont aucun n’est certain. Ils forment des cadres de réflexion pour effectuer des prévisions plus concrètes dans des domaines particuliers. Cette « façon de regarder de loin » trace non pas une ligne véritable mais une tendance vraisemblable. Rien n’est écrit, rien n’est certain, mais certaines logiques sont déjà l’œuvre maintenant, qui peuvent se confirmer.

Ainsi le prospect est-il un probable futur client, la prospection explore les lieux où découvrir de possibles gisements, la prospective réunit historiens et sociologues pour proposer une évolution possible de notre société et de notre monde.

Si prédire n’est guère utile aux décideurs (sauf à agiter une croyance comme banderole pour se faire élire), prévoir est indispensable pour ne pas aller dans le mur (ainsi François Hollande et son « inversion » de la courbe du chômage), et la prospective manque cruellement (dans ce monde de court-terme et de zapping médiatique permanent).

  • N’importe quel gourou autoproclamé peut prédire les cours de bourse en n’ayant raison que par hasard (Paul Jorion aime par exemple à se faire le prophète annoncé de la grande catastrophe financière imminente et nombreux sont ceux qui le trouvent génial parce qu’il leur dit seulement ce qu’ils ont envie d’entendre… bien qu’il se trompe régulièrement depuis 8 ans !)
  • N’importe quel gérant peut évaluer les probabilités plus réalistes qu’à un cycle en succède un autre, en se fondant sur les statistiques de cours passées mais aussi sur la psychologie de marché (la période novembre-avril est propice à la monté des cours de bourse, la période mai-octobre est au contraire plus agitée).
  • Mais il faut faire l’effort d’investir du temps, de la réflexion et des échanges pour bâtir une prospective qui se tienne. Sa logique est en partie contenue dans les tendances à l’œuvre dès aujourd’hui, mais les réactions, inventions, découvertes et mutations restent ouvertes dans le futur.

Quittez donc le monde de la « croyance » pour celui de la raison, vous vous en porterez mieux, en bourse comme en politique, et même pour votre confort mental.

Catégories : Philosophie | Étiquettes : , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,

Éclairer les sondages

Un sondage peut-il faire le printemps ? On a beaucoup glosé, chez les journaleux, sur « le » sondage qui place pour une fois Sarkozy devant Hollande au premier tour… dans 40 jours. SOFRES serait confirmé par IFOP le lendemain. Rappelons qu’un sondage n’est pas une élection et que 1638 personnes, même triées selon la méthode des quotas, ne font pas 43,2 millions d’électeurs

L’opinion publique est une cristallisation de la diversité des opinions privées en « courant ». D’un côté, l’opinion est soumise à la contrainte sociale, culturelle et historique. Elle est convenue, stéréotypée, elle recherche le semblable. De l’autre, chaque opinion est relativement libre, non-conformiste, originale, issue de l’histoire personnelle affective, familiale, sociale, éducative et professionnelle de l’individu. C’est le propre de la raison grecque que d’avoir fait émerger l’individu pensant ; c’est le propre de la politique grecque que d’avoir fait se rencontrer les individus-citoyens sur une agora pour en débattre de façon démocratique. Via les Lumières, nous sommes héritiers de cette « libération » du biologique, du social et du dévots. Ces clans, traditions et religions qui restent si prégnantes dans d’autres « civilisations » visent à empêcher chacun de se faire par lui-même une opinion éclairée. Publique, l’opinion assure la cohésion de groupe nécessaire à tout projet politique. Privées, les opinions préparent les changements lents de la société.

La gageure des sondeurs est de transformer l’opinion individuelle, recueillie en expression personnelle de face à face, en une opinion commune censée représenter au mieux l’état du sentiment public. Pour schématiser la France entière, la méthode est de recourir à un échantillon statistique représentatif de la population. Cet échantillon ne doit pas être trop grand pour des raisons d’efficacité (trop de temps et trop de coût), mais pas trop petit non plus sous peine de ne plus signifier grand-chose (notamment pour les proportions faibles). La loi statistique de Laplace-Gauss permet d’estimer avec, par exemple, une probabilité de 95 chances sur 100 que les réponses se situent dans un intervalle d’écart peu significatif (écart-type), dit « de confiance ». Pour réduire de moitié l’intervalle de confiance, il faut multiplier par quatre la taille de l’échantillon. Plus la fréquence relative observée de la réponse est faible, moins la donnée est précise. C’est l’une des raisons pour lesquelles le vote Le Pen a été sous-estimé en 2002 et le vote Mélenchon mal situé fin 2011.

Est utilisée le plus souvent la méthode des quotas qui est un modèle réduit de la population en âge de voter à partir des grandes variables que sont le sexe, l’âge, la situation matrimoniale, la catégorie socioprofessionnelle, la préférence politique, le niveau d’instruction, le revenu, la religion, la commune habitée, etc. Il ne s’agit donc pas d’interrogations au hasard de personnes dans la rue, par téléphone ou Internet, ni d’une seule région, ni de gens qui se connaissent entre eux. Les limites de cette méthode sont connues : elles exigent un recensement récent et fiable de la population ce qui, malgré les progrès de l’INSEE, n’est jamais qu’approximation. Surtout que le recensement général est abandonné car trop cher, au profit d’estimations par sondages de population. Le calcul des chances qu’a un individu d’appartenir à l’échantillon est impossible à préciser, on le met donc arbitrairement dans des « cases » préétablies ; le contrôle scientifique des instituts d’enquêtes est difficile, chacun ayant sa méthode d’interrogation, ses approximations statistiques pour catégoriser l’échantillon et ses « recettes » empiriques de redressement des sous ou surévaluations connues.

Le questionnaire soumis à l’échantillon sondé doit être examiné avec attention.

  • Un sondage qui soumet la préférence pour le candidat à la Présidentielle à des choix de « couples » : Carla/Nicolas, François/Valérie induit une idée reçue de monarchisme, de pipolisation et même de staracadémisation. Ce « point de vue » (images du monde ?) est biaisé – car le vote est pour un décideur sur un projet politique, pas sur une future dynastie destinée à assurer un héritier…
  • Plus la question est compliquée, moins la réponse sera claire.
  • Moins l’alternative est nette (oui ou non), moins le résultat sera « estimable » (au sens statistique). Notamment les alternatives négatives « n’avez-vous pas déjà… » : en bonne logique on peut répondre « oui, je n’ai pas déjà » ou « non, je n’ai jamais » – ce qui est inexploitable.
  • Plus le questionnaire est long, plus la tendance est de répondre vite sur la fin.
  • Plus les mots sont évaluatifs (pire, meilleur, plus apte…), moins la réplique sera fiable.
  • Certaines questions suggèrent même la réponse dans leur formulation : « ne pensez-vous pas que M. X est le meilleur pour… ».
  • Quant aux questions dites « ouvertes » pour ne pas enfermer les réponses dans la seule alternative oui ou non, elles intimident, elles engendrent incompréhension ou réplique maladroite, envie de « faire plaisir » à celui qui pose la question… bref, elles biaisent sérieusement les résultats quand la population n’est pas homogène !

Le principe de tout sondeur devrait être de partir de l’idée cynique que tout questionné est borné, changeant et de mauvaise humeur. Cet ours mal léché, on l’ennuie avec ces questions perso un peu intellos. La possibilité de se voir répondre n’importe quoi, même du ton le plus froid, ne doit jamais être négligée. Il faut donc être clair, utiliser un langage approprié à la population enquêtée en évitant le jargon, les poncifs, le technocratique, les mots-valise, la résonance affective ou polémique, etc. Rien n’est simple quand tout se complique, dessinait Sempé… Depuis une cinquantaine d’années que les sondages se sont acclimatés en France, les méthodes se sont affinées et sont devenues professionnelles. Mais la course au résultat, notamment lorsque la politique est en jeu, fait souvent aller trop vite.

Il faut notamment remettre en cause de façon régulière les méthodes de « redressement ». Il s’agit de vérifier, par des échantillons superposés, que les taux de réponses reçues par catégorie statistique ne varient pas trop. Éventuellement de « corriger » les écarts trop grands par des coefficients testés. Les personnes aux deux extrémités de l’échelle sociale sont moins facilement joignables et répugnent plus que les autres à répondre, par exemple. Les personnes âgées sont plus méfiantes envers les questions. Les habitants des villes, très sollicités par les démarcheurs en tous genres, se mettent aux abonnés absents. Les électeurs portés à voter autrement que politiquement correct ont soit tendance à en rajouter « pour emmerder le monde », soit à minimiser leurs préférences pour cacher leurs convictions intimes. Les réponses par Internet sont hautement fantaisistes, attirant les geeks qui se foutent de la politique. Et cela change selon les époques ! Ainsi, le vote Le Pen apparaissait-il comme « honteux » en 2002, mais beaucoup moins en 2012 où il s’est normalisé. Une sous-évaluation il y a 5 ans peut devenir une surévaluation aujourd’hui si les statisticiens ne surveillent pas attentivement le phénomène.

Sonder est un métier, interpréter les sondages aussi. Plus une science se veut opératoire, plus elle doit avoir conscience de ses limites. Les chiffres bruts ne sont jamais à prendre au premier degré, surtout lorsqu’on est loin de l’élection. Et encore moins anticiper le second tour alors que le premier n’est pas encore passé ! Les tendances importent, les évolutions au fil du temps qui dégagent des courants. Mais il faut surtout observer les sous-catégories où les variations se partagent. Si le résultat électoral ne compte ni les abstentions ni les votes blanc, il ne faut jamais oublier les « non réponses » ou les « indifférents » dans les enquêtes. Moins les gens répondent, moins le sondage doit être pris au sérieux.

En bref, la méthode du sondage est empirique ; elle n’a rien de scientifiquement prédictif. Elle est manipulée par ce qu’on attend comme réponse, utilisée comme propagande par les gagnants. C’est curieux comme Bayrou, Le Pen ou Mélenchon affectent de mépriser les sondages quand ils ne leur sont pas favorables… et s’empressent de les valoriser quand la tendance se raffermit pour eux !

Mais c’est bien ça la politique : la mauvaise foi, la caricature, la calomnie. De quoi se méfier encore et toujours des politiciens, de quelque bord qu’ils soient, et leur opposer encore et toujours des contrepouvoirs.

Catégories : Politique, Science | Étiquettes : , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,