Article modifié en raison des ambiguités qu'il pouvait comporter et qui ont fait réagir bon nombre de personnes. Les ajouts figurent en gras.
Pour le comprendre, prenons un exemple simple : je me rends chez un ami qui a deux enfants mais dont j’ignore s’il s’agit de filles ou de garçons. Je frappe à la porte, une petite fille m’ouvre. Quelle est la probabilité pour que l’autre enfant soit un garçon ? Un premier raisonnement consiste à dire que la seule chose que j’apprends quand j’ouvre la porte, c’est que mon ami n’a pas deux garçons. Parmi les quatre combinaisons équiprobables fille/fille, garçon/fille, fille/garçon et garçon/garçon, il ne reste plus que les trois premières. Par conséquent, ayant observé une fille, il y a deux chances sur trois que l’autre enfant soit un garçon. Ce faisant, on suppose a priori que si mon ami a une fille et un garçon, c'est systématiquement la fille qui va ouvrir la porte, sans quoi il n'y aurait plus équiprobabilité.
Un deuxième raisonnement consiste à dire qu’il y a autant de chance que ce soit l’aîné qui ouvre la porte que le cadet. S’il s’agit de l’aîné alors les deux combinaisons possibles sont fille/fille et fille/garçon. S’il s’agit du cadet alors les deux combinaisons possibles sont fille/fille et garçon/fille. Dans les deux cas, la probabilité pour que l’autre enfant soit un garçon est 1/2.
Les deux raisonnements font une hypothèse commune qui est que chaque naissance est un évènement indépendant qui a autant de chance de donner une fille qu’un garçon. Le premier raisonnement fait une hypothèse supplémentaire qui consiste à dire que voir une petite fille ouvrir la porte est strictement équivalent à dire qu’il y a au moins une fille parmi les deux enfants (ou que la fille ouvre systématiquement la porte en cas de configuration fille/garçon ou garçon/fille). Le second raisonnement, quant à lui, postule qu’aîné et cadet ouvrent la porte avec la même probabilité. Ainsi, deux hypothèses a priori différentes donnent des probabilités différentes. On ne peut pas dire que l’une soit vraie et que l’autre soit fausse, d’un point de vue mathématique, l’énoncé du problème est incomplet pour trancher.
Les choses peuvent être assez subtiles. Par exemple, bon nombre de personnes n’ont pas l’impression de faire appel à une hypothèse supplémentaire dans le premier raisonnement, ce qui les conduit à affirmer que la probabilités EST 1/3 et que ceux qui disent le contraire se trompent, ils n'ont en fait pas conscience qu'en voyant une fille, les quatre configurations initiales ne sont plus équiprobables, sauf à évoquer l'hypothèse forte que les filles ouvrent toujours la porte. L’erreur peut également être faite pour l’autre raisonnement, pour peu qu’on le modifie quelque peu. Supposons que la probabilité pour que l’aîné ouvre la porte ne soit plus 1/2, mais P. Alors il y a P chances pour que la fille que j’observe soit l’aînée, dans lequel cas l’autre enfant est un garçon avec une probabilité 1/2 et il y a 1-P chances pour que la fille que j’observe soit la cadette, dans lequel cas l’autre enfant est un garçon avec une probabilité 1/2 également. En regroupant ces deux cas, la probabilité pour que l’autre enfant soit un garçon vaut P*1/2+(1-P)*1/2, c’est-à-dire 1/2, quelle que soit la valeur de P. On peut donc en conclure que dans tous les cas la probabilité est 1/2 et que ceux qui disent le contraire se trompent. Pourtant, le simple fait de postuler l’existence de cette probabilité P est une hypothèse, ce qui rend le résultat obtenu aussi subjectif que celui issu du premier raisonnement.
Pour terminer sur cet exemple, si l’on part de l’hypothèse qu’il n’y a aucun moyen de savoir quelle est la façon dont les enfants vont ouvrir les portes chez mon ami, on ne peut pas vraiment trancher. Si l’on suppose un modèle à peu près réaliste de la façon dont les enfants vont ouvrir les portes chez mon ami, on dit 1/2. [les lecteurs intéressés pourront lire les commentaires où une autre hypothèse a priori naturelle donne 1-ln(3)/2 au lieu de 1/2]
Ce long exemple paraîtra évident pour certains, inutile pour d’autres. Dès lors que l’on y réfléchit un petit peu, on comprend bien que les mathématiques (et donc les probabilités) ne sont que des reformulations d’énoncés en appliquant des règles élémentaires de logique. Un modèle mathématique, par lui-même, n’apporte aucun élément d’information supplémentaire et donc aucun moyen de prédire des choses dont on n’a aucune idée. Pourtant, dans la vie courante et en particulier dans la sphère économique, on a tendance à oublier qu’une probabilité est une fonction déterministe des hypothèses que l’on retient, ce qui fait qu’on les objectivise. Par exemple, on parle des chances et des risques comme s’ils existaient par eux-mêmes : quelle est la probabilité que la France batte la Nouvelle-Zélande en rugby ? Quel est le niveau de risque de tel produit financier ? Pire, dans les sondages on donne des résultats assortis d’une marge d’erreur (de plus ou moins 3% par exemple), oubliant de mentionner que ce calcul de marge d’erreur est également subjectif, qu’il dépend de la validité du modèle utilisé. Mais quelle est la probabilité que le modèle employé soit le bon ?
Dès lors que l’on traite d’évènements en très grand nombre, une hypothèse semble plus naturelle que les autres, celle qui consiste à dire que la probabilité d’un évènement individuel peut être révélée par des statistiques sur les évènements réalisés. Imaginons que je lance un jeton 1000 fois en l’air, que 700 fois il retombe sur pile et 300 fois sur face, alors une hypothèse raisonnable consiste à dire que ce jeton est vraisemblablement pipé et que la probabilité d’obtenir pile vaut 7/10. Le même genre d’hypothèses peut être fait en sciences physiques, économiques ou sociales. Tous ces modèles consistent toutefois à dire qu’on peut lire l’avenir dans le passé, ce qui est une hypothèse questionnable.
Nicholas Taleb, dans son livre Le Cygne Noir, fournit un bon contre-exemple à ce raisonnement basé sur le passé. Imaginons une dinde qui est nourrie pendant 1000 jours par ses propriétaires avant d’être mangée pour Thanksgiving. Du point de vue de la dinde, la probabilité de l’évènement « mes propriétaires vont me tuer » ne fait que diminuer au fil des 1000 premiers jours, si bien que c’est au moment où la dinde à le plus confiance en ses maîtres que ceux-ci la tue pour la manger. Dans ce cas, l’observation du passé, loin de rapprocher la dinde de la réalité, l’en éloigne. Dans le même ordre d’idée, Goldman Sachs a du fermer un de ses fonds monétaires en 2008 dont la probabilité de défaut avait été estimée à 1/100^138 avant la crise des subprimes. Accorder le moindre crédit à ce type de probabilité, c’est se comporter de façon plus stupide que la dinde : en effet, comme toute probabilité, celle-ci était basée sur des hypothèses, c’est-à-dire un modèle, et la probabilité que le modèle soit faux est incroyablement plus élevée que 1/10^138.
Les approches statistiques sont très intéressantes et fiables pour estimer des probabilités d’évènements nombreux et réguliers, elles doivent être regardées avec beaucoup plus de circonspection pour les évènements individuels et irréguliers. Beaucoup des probabilités dont on parle quotidiennement font appel à tellement d’hypothèses que leur valeur explicative est quasiment nulle : demander à un économiste quelle est la probabilité pour que la crise soit terminée d’ici à la fin de l’année, comme le font tous les journalistes, cela revient à peu près au même que de demander son avis à un astrologue pour prédire ses problèmes sentimentaux.
Le problème avec les probabilités, c’est qu’on les enseigne à travers les jeux de cartes ou les casinos, qui sont en fait les seuls endroits sur Terre où elles peuvent être précisément calculées car les lois y sont précisément connues. A force de ressasser les mêmes hypothèses (les cartes ou les dés ne sont pas pipés, les tirages ou les lancés sont équiprobables), on finit par les oublier et ne plus les écrire. Du coup, les probabilités semblent prendre une réalité propre, objective. Par assimilation, on se dit alors que toutes les probabilités ont une réalité propre, indépendamment des hypothèses qui les fondent.
Au moment où l’on parle beaucoup de régulation de l’économie et de la finance, une bonne idée, très peu coûteuse, consisterait à offrir le livre d’Henri Poincaré à tous les traders, économistes et hommes politiques. Afin que chacun intègre bien qu'une probabilité n'a de sens qu'à travers un modèle théorique et que la validité de ce modèle théorique est elle-même soumise à l'incertitude.