Le problème traité dans le chapitre précédent a nécessité l'emploi d'un critère pour er les décisions. Nous avons introduit deux critères permettant de faire un choix entre des décisions dont les conséquences sont incertaines, nous les verrons à nouveau plus loin (paragraphe 3) en comnie d'autres critères classiques. Nous nous concentrons tout d'abord sur le rangement des conséquences elles-mêmes et celui qui s'en déduit pour les décisions dont les conséquences sont certaines (paragraphe 1). Nous élissons le rapport entre ces rangements (préférences) et l'optimisation d'un critère (paragraphe 2) ; nous poursuivrons cette démarche au chapitre suivant pour justifier le fondement du critère de l'utilité espérée. Auparavant, nous aurons passé en revue plusieurs difficultés concernant les critères : les critères multiples, l'agrégation des critères de décideurs différents et le problème de la dynamique rencontré dans le chapitre précédent.
1. Décisions rationnelles sans incertitude
Pour choisir la meilleure décision (ou l'une parmi les meilleures), il faut les avoir ordonnées. Ranger les décisions ne peut se faire que lorsque le décideur sait remonter des conséquences qu'il a rangées aux décisions elles-mêmes. C'est en cherchant à exprimer son ordre de préférence sur les conséquences que le décideur se rend souvent compte de la nécessité de définir très précisément les conséquences de ses décisions.
Pour souligner les difficultés que peuvent présenter ces deux étapes, prenons l'exemple du choix d'investissements sans risque. Il s'agit d'un problème de décision sans incertitude puisque les taux de rendement des différents actifs sont connus. Cependant, en cherchant à déterminer un ordre sur ces actifs, l'investisseur se rendra souvent compte que les taux de rendement annoncés ne lui suffisent pas à er les actifs : d'autres éléments comme les facilités de paiement, les dates d'échéances qui peuvent influencer la taxation des revenus, la fréquence des versements, etc. font que deux actifs de mêmes taux ne seront pas nécessairement indifférents pour un investisseur donné. Les conséquences des investissements pourront alors être définies par des rendements calculés par des procédures comples faisant intervenir les différentes caractéristiques pertinentes : taux, taxes, échéanciers Appelons « rendements actualisés » ces conséquences des investissements. La définition des conséquences étant
donnée (grace aux comples), reste à les er. Ici les rendements actualisés s'ordonnent naturellement par valeurs croissantes et cet ordre est celui des préférences de la plupart des investisseurs. Une fois ce rangement des conséquences éli, l'investisseur pourra s'interroger sur les décisions qui amèneront aux meilleures conséquences.
Supposons que les investissements possibles portent sur des actifs d'échéances différentes. Pour définir la fonction conséquence (qui relie décisions et conséquences), il faudra élir une procédure d'actualisation qui permette de er les rendements. Une fois la fonction conséquence bien définie, la structure même des décisions rendra leur rangement plus ou moins aisé. Supposons que les décisions de l'investisseur puissent jouer sur deux variables : la quantité investie et l'échéance. L'ordre sur les conséquences est simple, mais il ne s'en déduit pas immédiatement un ordre sur les décisions qui permette de faire un choix. Cela ent de ce que les décisions ont ici deux composantes : à échéance donnée, les quantités investies sont naturellement rangées dans l'ordre des rendements qu'elles procurent ; à quantité fixée, les échéances sont rangées dans l'ordre des taux qu'elles procurent. Mais le décideur doit er des décisions comme : 100 unités, échéance trois mois et 10 unités, échéance dix ans. Pour cela, il devra définir un critère unique sur les deux variables de décision qui soit cohérent avec l'ordre qu'il a défini sur les conséquences. Ici. le critère s'impose, il est à nouveau éli par calcul comple : c'est le rendement actualisé de l'investissement (qui est ici justement ce que nous avons défini comme la conséquence de l'investissement). Le décideur choisira donc un couple quantité-échéance qui lui procure le plus haut rendement actualisé possible sous les contraintes (de trésorerie, institutionnelles) de son problème d'investissement. Le rendement actualisé est le critère de décision de ce problème. Dans ce problème, qui est simple parce que le critère de décision est aussi la fonction conséquence, il suffit de trouver les meilleures conséquences pour obtenir les meilleures décisions.
2. Représentation des préférences par un critère
Lorsqu'une collection de pièces de monnaie courante est présentée à un adulte et à un enfant, il est possible de prévoir le choix qu'ils vont respectivement faire parce que nous connaissons leurs préférences. En ce qui concerne l'adulte, sachant qu'il a une préférence pour le pouvoir d'achat le plus élevé, on se doute que son choix se portera sur une des pièces sur laquelle est inscrit le plus grand chiffre. Quant à un enfant que le pouvoir d'achat ne concerne pas encore, une observation plus fine de son comportement s-à-s des objets devra avoir été faite au préalable. Admettons que l'enfant préfère les choses les plus colorées et les plus brillantes, nous pourrons prédire qu'il choisira la plus brillante des pièces colorées lorsque l'alternative est simple, mais nous ne saurons peut-être pas laquelle il choisira entre une pièce d'un euro (brillante) et une pièce de 20 centimes (plus colorée mais terne).
Les pièces ayant été conçues par des adultes pour des adultes, il n'est pas surprenant de constater que le critère qui sert à les choisir est écrit dessus ! Les chiffres écrits sur les pièces représentent l'ordre donné par leur pouvoir d'achat. La valeur inscrite sur les pièces est le critère qui représente les préférences de l'adulte. Les préférences de l'enfant peuvent aussi être représentées par un critère, à condition qu'elles vérifient certaines propriétés. Si seule la taille importait, il nous serait facile de ranger toutes les pièces et de leur allouer des nombres, leurs diamètres en millimètres par exemple, qui croissent dans le même ordre que celui du rangement. Ces nombres définiraient alors le critère de choix de l'enfant : l'enfant rationnel choisirait une des pièces ayant le plus grand diamètre.
Si la couleur et la brillance importent, sans que l'une ne prévale sur l'autre, il ne sera pas possible de ranger strictement les pièces, ni par conséquent de les numéroter directement en suivant le rangement. D y a une difficulté à représenter par un critère unique des préférences qui sont définies par un double critère. De telles préférences ne permettent pas de définir un ordre grace auquel toutes les alternatives peuvent être ées (nous revenons sur ce problème au paragraphe 3).
Lorsque les préférences portent sur un ensemble fini d'objets (ou un ensemble dénombrable, c'est-à-dire que l'on peut numéroter tous les objets par des nombres entiers), comme l'ensemble des pièces de monnaie, un critère n'est rien d'autre qu'une numérotation de ces objets. L'adulte et un enfant qui ne s'intéresserait qu'à la taille, n'auront pas la même numérotation (avec des pièces européennes). Nous dirons d'un tel critère qu'il « représente » les préférences. Pour que les préférences puissent être représentées, il faut que tous les objets soient ables. Ceux qui sont indifférents se verront attribuer la même valeur par le critère, un objet strictement préféré à un autre aura une valeur supérieure à celle du premier. Cette propriété des préférences, qu'elles soient capables de er tous les objets, suffit à l'existence d'un critère (il n'est pas unique, mais tous amèneront aux mêmes choix : au lieu de ranger les pièces selon leurs diamètres en millimètres, on peut les ranger selon leurs surfaces en mètres carrés, ou la racine carrée de celle-ci, etc.. sans changer le rangement).
Lorsque l'ensemble des objets sur lesquels portent les préférences n'est pas fini (ni dénombrable), cette propriété n'est pas suffisante pour représenter les préférences par un critère. Par exemple, si les conséquences d'investissement sont des rendements qui peuvent prendre toutes valeurs réelles entre - 10 et + 10, et que le critère soit le rendement lui-même, cela signifie que les préférences rangent les rendements selon l'ordre naturel des nombres et qu'elles ont donc les mêmes propriétés que cet ordre. Pour pouvoir définir un critère qui représente des préférences sur de tels ensembles, il faudra qu'elles vérifient une propriété de continuité qui donne, à l'ensemble ordonné par les préférences, la même structure que l'ensemble des nombres réels auquel on cherche à le faire correspondre. Cette propriété de continuité est fondamentale pour la représentation de préférences sur des ensembles généraux. Elle est apparue dans les modèles formalisés de l'économie où les préférences des agents portent sur des paniers de biens qu'ils peuvent consommer ou produire (Debreu [1970]).
Choisir la, ou une. « meilleure » décision consiste, une fois le critère défini, à résoudre un problème d'optimisation (de ce critère) grace aux outils et méthodes de la programmation mathématique.
Le problème traité dans ce chapitre consiste donc à traduire, par un critère (éventuellement plusieurs critères) sur les décisions, une relation de préférences sur leurs conséquences. Mathématiquement, un critère est une fonction à valeur numérique, et la représentation de préférences par un critère consiste à trouver une fonction, disons V, telle que si la conséquence de la décision « a » est préférée à celle de la décision « b », alors V(a) 2 V(b). Remarquons que, réciproquement, V(a) S V(b) définit une relation entre a et b et par conséquent entre leurs conséquences. Cette relation est particulière ; c'est ce que les mathématiques appellent un préordre.
Nous avons rencontré la première condition que doit vérifier une relation de préférence pour pouvoir être représentée par une fonction : toutes les conséquences doivent pouvoir être ées par la relation ; on dit dans ce cas que le préordre est total. La théorie de la décision appelle « axiomes » ces conditions ; l'axiome 0 sera donc :
A0 : la relation de préférence est un préordre total.
Les préférences sur des ensembles finis (ou dénombrables) qui vérifient cet axiome pourront donc être représentées par une fonction. Rappelons que toute fonction croissante de cette fonction les représente aussi (qu'elles soient numérotées 1, 2, 3 ou bien 26, 42, 354, les décisions sont rangées dans le même ordre). Ce résultat s'étend de manière édente aux ensembles non finis mais dénombrantes.
Lorsque l'ensemble des conséquences n'est ni fini ni dénom-brable, par exemple s'il s'agit de montants pouvant prendre toutes valeurs comprises entre 0 et 1 000, une condition supplémentaire de « continuité » devra être vérifiée : il ne faudrait pas qu'une suite de conséquences, qui sont toutes préférables à une certaine conséquence c, ait pour limite une conséquence qui ne soit pas préférée à c (nous en donnerons un exemple en construisant le critère de l'utilité espérée au chapitre v, paragraphe 3). Cette condition est exprimée de manière informelle par l'axiome :
A, : les préférences sont « continues ».
En pratique, on « numérotera » des conséquences dénom-brables selon l'ordre des préférences, puis on complétera la représentation en prenant les limites des suites des valeurs des conséquences pour représenter les conséquences qui ne sont pas dans l'ensemble dénombrable. Un contre-exemple de préférences qui ne respectent pas cet axiome est donné dans l'encadré du paragraphe 5.
3. Critères classiques de décisions dans l'incertain
Un critère est donc une fonction qui associe un nombre à chaque décision et qui croit avec les préférences du décideur. Quand il n'y a pas d'incertitude sur les conséquences des décisions, nous avons vu au paragraphe 1 qu'il suffisait de définir le critère sur les conséquences (les taux de rendement des investissements, par exemple), pour l'obtenir sur les décisions elles-mêmes, une fois que la fonction qui relie décisions et conséquences est clairement définie.
Mais quand les conséquences des décisions sont aussi fonction d'un aléa, il n'est plus aussi simple de remonter des conséquences aux décisions. Nous avons vu au chapitre précédent que, d'une manière ou d'une autre, il nous fallait agréger les différentes conséquences d'une même décision pour obtenir un critère. C'est ce que font les différents critères que nous présentons ici en utilisant, ou non, des probabilités sur les aléas.
L'approche axiomatique, qui est celle de la théorie de la décision, a été précédée par le
développement de méthodes pragmatiques de résolution de problèmes de décision. Nous présentons, au chapitre v et au chapitre n, des constructions de critères représentant les préférences d'agents qui vérifient certains axiomes. 11 est par ailleurs important, et c'est ce que nous faisons ici, de signaler l'utilisation d'un certain nombre d'autres critères dont l'emploi est justifié par des considérations adaptées à certains problèmes de décision, mais qui n'ont généralement pas été construits à partir d'une représentation axiomatique des préférences de décideurs.
Voyons sur un petit exemple comment les différents critères que nous présentons ent trois décisions dont les conséquences dépendent de trois états aléatoires.
Considérons trois investissements (a, b et c) dont les taux de rendement possibles, selon l'état qui se réalisera à l'échéance, sont :
- pour a : 10 % 20 % 30 % ;
- pour b : 4 % 25 % 30 % ;
- pour c : 5 % 15 % 50 %.
C'est volontairement que nous ne précisons rien sur la vraisemblance ou la probabilité d'occurrence de ces états, nous ne le ferons que lorsque certains critères le nécessiteront.
D'une manière générale, les critères affectent une valeur à une décision d, dont nous noterons c,(d) la conséquence dans l'état i (dans l'exemple : c,(a) = 10, c2(c) = 15, etc.). Nous supposerons qu'il y a un nombre fini d'états, soit n, quoique certains des critères puissent être définis pour un ensemble d'états plus général.
Historiquement, le critère dit « de Laplace » est sans doute le premier qui ait été proposé (bien avant Laplace et au moins par Huygens plus d'un siècle avant). Il intègre en une seule valeur les différentes conséquences possibles (ce sont des conséquences numériques) d'une décision dans l'incertain : iJ s'agit de la moyenne arithmétique des gains.
Le critère de Laplace range donc les décisions dans l'ordre croissant : c, a, b.
L'idée de prendre la moyenne arithmétique, qui correspond à une pondération uniforme, est justifiée par une absence d'information sur les probabilités des événements élémentaires (i = 1 n). C'est aussi cette distribution de probabilité uniforme qui fut utilisée dans la première formulation de l'utilité espérée proposée par Cramer et Bernoulli (nous y reendrons au chapitre v). À la différence du critère de Laplace. ce ne sont pas directement les conséquences numériques dont la moyenne est calculée, mais une fonction de ceux-ci, comme nous l'avons vu dans l'exemple traité au chapitre précédent. Cette fonction déforme les conséquences afin de traduire l'attitude de l'agent s-à-s de la richesse, ou, plus généralement, de conséquences numériques (les taux, dans notre exemple). De plus, ce critère peut être défini pour des conséquences qui ne sont pas numériques, puisque l'utilité de la conséquence, elle, est numérique (utilité d'un bien de consommation, par exemple).
La fonction logarithme exprime qu'un accroissement de 1 euro pour une richesse de 1 euro est plus « utile » qu'un même accroissement de 1 euro pour une richesse de 100 euros. Cette propriété ent de ce que la fonction logarithme est « concave » ; la plupart des fonctions d'utilité utilisées le sont aussi pour la même raison.
Le critère de Bernoulli range donc les décisions dans l'ordre croissant : a, c, b. Remarquons que a et c ont été inversés par rapport au rangement obtenu par le critère de Laplace, du fait que la fonction logarithme donne plus d'importance relative aux petites valeurs (qui sont plus importantes pour a que pour c).
Les critères de Laplace et de Bernoulli pondèrent également
(-) les trois états. Toutefois, il est des situations où les
probabilités des états sont connues ou du moins appréciées numériquement. Les deux critères qui suivent sont des versions probabilisées des deux critères précédents, ou, dit autrement, ces deux derniers sont des cas particuliers des suivants si
les probabilités des résultats sont identiques : -.
En tenant compte d'une distribution de probabilité connue sur les différents états (p,, probabilité de l'état i), le critère de Laplace deent le critère de l'espérance mathématique que nous avons utilisé au chapitre précédent.
Le critère de l'espérance de l'utilité (ici, logarithmique) rangerait donc les décisions dans l'ordre croissant : a, c, b. Comme dans le cas des critères de Laplace et de Bemoulli, remarquons que l'ordre de a et c est inversé.
Les trois autres critères ne font pas intervenir de pondération, probabiliste ou pas, des états, mais sont concernés par les conséquences extrêmes [gain maximal M(a), gain minimal m(a), correspondant à chaque décision a)]. Ainsi le critère de Wald fera prendre une décision qui a le plus grand gain minimal, c'est-à-dire qui maximise le gain minimal, d'où aussi son nom de critère MaxiMin. Ce critère correspond à un comportement de prudence extrême s-à-s du risque et peut être justifié comme un cas limite d'utilité espérée.
4. Préférences et critères
Les ensembles de conséquences sont souvent définis par des variables quantitatives mesurant certains caractères des décisions. Une conséquence est alors définie par un vecteur de valeurs correspondant, par exemple, à la tranche d'age, à la taille, au rendement, etc. Chacun de ces caractères est ordonné naturellement par la relation de préférence et correspond, en fait, à une représentation partielle de cette relation. En pratique, les préférences sont donc généralement définies par des critères portant sur différents caractères, mais la multiplicité de ces critères laisse entière la difficulté de définir la relation de préférence dans sa globalité.
Considérons ainsi un ensemble de conséquences constitué de deux caractères, disons une date et un rendement monétaire. Sur la première composante, c'est-à-dire pour une valeur donnée du rendement, les préférences vont dans l'ordre décroissant des dates : la date la plus proche est celle qui est préférée. Sur le second critère, les préférences vont dans l'ordre décroissant des valeurs.
Les conséquences A et B sont clairement rangées : B est préférée à A puisque la date t, est inférieure donc meilleure que la date t,, et que le rendement r, est supérieur donc meilleur que le rendement r,. De même B est préférée à C puisque, à date égale, elle présente un rendement supérieur, et B est préférée à D puisque, à rendement égal, elle est disponible à une date plus proche. A est able de la même manière à C et à D ; en revanche, C et D ne sont pas ables sur la seule base des critères sur leurs composantes. En effet, D est préférée à C en termes de rendement, mais c'est l'inverse en ce qui concerne la date. Pour définir les préférences sur les couples date-rendement, les deux critères ne nous suffisent donc pas. Une relation de préférence sera définie globalement en ant tous les couples. Des courbes rejoignant tous les couples indifférents entre eux (appelées « courbes d'indifférence ») éliront un rangement des couples, comme le montre le graphe e suivante.
Avec une relation de préférence complétée par les courbes d'indifférence (dont seules celles correspondant aux conséquences A, B, C, D, sont représentées), il apparait que la conséquence D est préférée à la conséquence C (puisque, à la date 0, le rendement du point situé sur la courbe des conséquences indifférentes à D est supérieur à celui du point correspondant de la courbe d'indifférence de C). Pour une telle relation de préférence, une représentation est facile à définir : à tous les points d'une courbe d'indifférence, on peut affecter le rendement (ou une fonction croissante du rendement) de l'intersection de cette courbe avec l'axe horizontal de la date 0. Ainsi la relation de préférence est représentée par un critère unique qui est cohérent avec les deux critères sur les composantes.
La difficulté à définir la relation de préférence ou sa représentation, à partir des deux critères sur les composantes, ent de la multiplicité de possibilités d'agrégation de deux critères en un critère unique. Parmi ces agrégations possibles, certaines vérifieront les préférences du décideur, d'autres non, et l'utilisation d'un critère unique ne peut se faire que sur la base de l'observation des préférences du décideur.
5. Aides multicritères à la décision
Les nombreuses techniques d'optimisation multicritères pourraient laisser croire que le problème de la représentation des préférences par un critère unique peut être été. Certaines de ces techniques, telles les méthodes « multiattributs » (Keeney et Raiffa [1976] ; Vincke [1989]), permettent de résoudre des programmes qui fournissent des solutions satisfaisant les différents critères à respecter. Toutefois, ces programmes sont élis sur la base de combinaisons linéaires des différents critères (en général, certaines méthodes sophistiquées utilisant des fonctions non linéaires). De telles combinaisons sont donc, de fait, des agrégations de critères, elles doivent être justifiées par des théories axiomatiques sur les préférences. Ces théories sont beaucoup plus restrictives encore que celles dont nous poursuivrons la présentation dans les chapitres suivants puisqu'elles les utilisent et les complètent.
D'autres méthodes s'attachent bien à faire révéler les préférences des décideurs et à les représenter par une relation dite de « surclassement » qui ne vérifie généralement pas l'axiome A" qui requiert que toutes les conséquences soient ables (voir, plus haut, le paragraphe 2). Les préférences ne sont souvent, en effet, ni totales ni transitives. Les méthodes de surclassement (Roy [1985]) font cependant intervenir dans leur exploitation des pondérations de critères qui permettent de n.e pas se limiter à des solutions non dominées (une conséquence est dominée par une autre si elle est moins bonne pour tous les critères). La définition de ces pondérations ne va sans doute pas aussi loin que l'agrégation de critères utilisés dans les méthodes « multiattributs ». Celles-ci posent pour axiome que les décideurs cherchent à optimiser une fonction agrégeant les critères. Cette fonction a pour effet de préciser les différents caractères à prendre en compte dans le problème de décision. Dans la pratique, cette fonction est linéaire, c'est-à-dire qu'en fait elle pondère les différents critères. La linéarité d'une telle fonction est assurée par des axiomes précisant une indépendance des différents critères, de teis axiomes sont à rapprocher des axiomes d'indépendance que nous rencontrerons par la suite pour assurer la linéarité des critères représentant les préférences des agents (voir aussi les paragraphes 6 et 7 plus loin).
Sans avoir recours à une agrégation de critères, des précisions sur les préférences du décideur peuvent amener à définir un ordre total sur des conséquences à partir des critères sur leurs composantes. Un exemple classique est celui de l'ordre lexicographique ' qui suppose une prédominance de certains critères sur d'autres. Ainsi dans notre exemple sur les couples date-rendement, un ordre lexicographique pourra être éli si le rendement domine la date : les couples sont d'abord rangés par ordre de rendements croissants, puis parmi les couples de mêmes rendements, les dates sont ées. Cela définit un ordre total sur les couples, tous peuvent être és : ainsi D est préféré à C puisque son rendement est supérieur, B est préféré à D puisque, à rendement égal, D a une date supérieure. L'ordre est donc B, D, C, A. Toutefois, il est possible de démontrer que cet ordre (qui vérifie l'axiome A0) ne peut pas être représenté par une fonction (parce qu'il ne vérifie pas l'axiome A,).
6. Agrégation des critères de différents décideurs
La multiplicité des critères et leur agrégation posent un problème pour la représentation d'une relation de préférences qui résume ou agrège celles de décideurs multiples. Ce problème est au centre des théories du choix social où une agence centrale (un gouvernement, par exemple) doit prendre une décision qui satisfasse au mieux un ensemble d'agents économiques dont les préférences diffèrent. Les fondements théoriques de l'utilitarisme consistent à trouver des conditions sur les préférences des agents qui justifient leurs représentations par des fonctions dites d'« utilité » et surtout l'agrégation de ces fonctions d'utilité en une seule fonction, dite de « choix social ». L'utilitarisme exige de plus que la fonction de choix social soit combinaison linéaire des fonctions d'utilité indiduelle. Pour cela, des axiomes devront être vérifiés par les préférences qui assurent la linéarité de la fonction qui les agrège : il s'agit ici aussi d'axiomes imposant une certaine indépendance des critères indiduels ; de tels axiomes ont la même portée normative et la même limite descriptive que ceux utilisés par la méorie de l'utilité multiattributs.
Un exemple classique montre bien l'importance de ces difficultés, il a été rendu célèbre par Condorcet (né marquis en 1743, mort ci-devant en 1794) qui, en proposant une solution, s'est trouvé face à un paradoxe.
Le choix entre trois candidats à une élection (ou entre trois décisions) est éli par 60 votants (ou décideurs différents). Appelons A, B et C ces candidats et demandons à chaque votant comment il les ordonne. Les candidats se répartissent de la manière suivante sur quatre rangements possibles :
Nombre de volants 23 19 16 2
En tête A B C C
En second B C B A
En dernier C A A B
En utilisant la règle de la majorité, A est en tête (23 voix). Pourtant, s'il était en ballottage contre un seul candidat, il perdrait contre B ( 19 + 16 pour B contre 23 + 2 pour A) et contre C aussi (19 +16 + 2 pour C contre 23 pour A). Condorcet propose une règle qui tienne compte de ces combinaisons d'opinions en proposant de se fonder sur le rangement des trois candidats le plus probable au sens suivant :
- B gagne sur A 35 fois contre 25 ;
- C gagne sur A 37 fois contre 23 ;
- C gagne sur B 41 fois contre 19.
Le rangement le plus probable est donc : C, B, A. Ce qui donne C comme vainqueur, C est appelé le « gagnant de Condorcet ». (Remarquons que C sérail aussi le vainqueur s'il était élu selon un système proportionnel fondé sur l'attribution de deux points chaque fois qu'il est classé premier, un point quand il est classé second et zéro sinon.)
A gagne contre B 33 fois contre 27 ; B gagne contre C 42 fois contre 18 ; C gagne contre A 35 fois contre 25.
Ce cycle, intransitité de la règle, est connu sous le nom de paradoxe de Condorcet, qui, pour le résoudre, a proposé la solution suivante : couper le cycle en son point le plus faible ; ici, c'est A contre B, ce qui donne B comme gagnant.
La difficulté à trouver une procédure de décision, ou des préférences sociales, à partir de celles d'agents différents a été clairement mise en édence par le théorème d'impossibilité d'Arrow. Kenneth Arrow a en effet montré que, sous des conditions qui semblent indiscules pour une Constitution démocratique, il n'est pas possible de trouver une règle de choix social (c'est-à-dire une règle que pourrait suivre un gouvernement, par exemple) qui soit cohérente avec les préférences des indidus concernés par cette Constitution. Ces conditions peuvent être exprimées de la manière suivante : on considère un ensemble de conséquences possibles sur lequel sont définies des relations de préférences des différents indidus concernés par une Constitution à déterminer qui définira une relation de préférences sociales. L'intérêt de ce théorème ent de ce qu'il s'adresse à une population mal définie, comme c'est le cas pour un pays, pour laquelle il serait illusoire de chercher à faire une liste exhaustive de tous les habitants.
Uniformité : la Constitution respecte toutes les relations de préférences possibles sur l'ensemble des conséquences.
Monotonie : si une conséquence, x, est préférée à une autre, y, pour une relation de préférences sociales et si l'on propose une nouvelle relation de préférences sociales pour laquelle x satisfait plus l'un des agents et n'en désatisfait aucun autre, alors x est socialement préféré à y dans la nouvelle relation de préférences sociales.
Indépendance : deux relations de préférences sociales qui procèdent au même rangement des conséquences pour tous les indidus déterminent le même choix social.
Absence de contrainte : la Constitution n'est pas contrainte par une paire de conséquences pour laquelle le choix social soit le même pour toute relation de préférences sociales.
Absence de dictateur : la Constitution ne définit pas la relation de préférences sociales comme étant la relation de préférences (strictes) d'un indidu (qui serait alors un dictateur).
Théorème d'impossibilité d'Arrow : il n'existe pas de Constitution qui vérifie les cinq conditions précédentes.
Moralité : à moins d'être un dictateur (celui qui dicte les décisions à prendre), un décideur public ne peut se référer à la théorie de la décision indiduelle pour guider ou justifier des choix dont les conséquences sont collectives.
7. Dynamique de décisions
Nous avons vu, dans l'exemple du chapitre précédent, deux manières de traiter un problème dynamique et nous avons constaté que les solutions ne sont pas toujours les mêmes. Lorsque les conséquences d'un problème de décision diffèrent dans le temps, la définition d'une relation de préférence globale, intertemporelle donc, peut poser des difficultés. U s'agit encore dans ce cas d'agréger, en un seul critère portant sur la séquence des conséquences, des critères portant chacun sur les conséquences instantanées. (Dans notre exemple du chapitre m, nous avons supposé que le critère était le même : espérance des profits ou de leurs utilités, et que le critère global, aussi, était le même. Mais la fonction d'utilité du décideur pourrait fort bien changer au cours du temps et en fonction de ses informations, par exemple, le décideur pourrait être remplacé en deuxième période selon les résultats de sa stratégie.)
Le principe de la programmation dynamique consiste à calculer une suite optimale de décisions à partir de sous-suites optimales. Ainsi, pour une suite de décisions à horizon fini, on calculera la décision optimale concernant la dernière période en fonction de la décision de l'avant-dernière période, puis celle-ci en fonction de la décision précédente et ainsi de suite jusqu'à la décision initiale. Ce calcul se fait en optimisant à chaque période le critère de décision instantané. Ce critère doit donc être connu dès le départ, et le calcul n'est valable - en ce sens que la suite de décisions ainsi calculée est optimale pour le décideur - que dans la mesure où les préférences sur les suites de décisions sont représentées par un critère qui se décompose selon les critères utilisés en chaque période. Inversement, cela suppose que le critère global est une agrégation des critères instantanés. Cette décomposition, ou cette agrégation, suppose donc une cohérence entre les préférences sur les conséquences en chaque période et les préférences sur les suites de décisions. Réciproquement, comme en pratique ce sont les critères instantanés qui sont connus plutôt que le critère global, le problème est de savoir quelles conditions doivent vérifier les préférences pour qu'une agrégation (combinaison linéaire en particulier) des critères représente bien les préférences sur les suites de conséquences.
Dans l'exemple du chapitre précédent, nous aons (habilement) été ces difficultés en ne considérant que les profits à la période finale. Dans la pratique, les gains et les pertes intermédiaires sont à gérer aussi ; en chaque instant, un profit réalisé (positif ou négatif) nécessite un placement ou un emprunt ou pour le moins une évaluation à la période finale (profit actualisé, par exemple).
Conclusion
Ce chapitre a pu avoir un effet décourageant ! Nous n'avons fait qu'y exposer des difficultés et mettre en garde le lecteur contre un optimisme que les exemples traités auraient pu laisser naitre. Prendre des décisions n'est pas devenu facile parce qu'un corps de recherche a pu construire des théories. Toutefois, ces théories servent de guides et se sont avérées utiles. Comment construire un critère qui correspond aux préférences d'un décideur dans des situations de risque ? Nous allons le voir au chapitre suivant, et, s'il ne peut pas être utilisé, nous en verrons d'autres au chapitre ii. Comment utiliser ce critère pour mesurer le risque et tenir compte du comportement du décideur ? C'est ce dont traite le chapitre . Mais il faut bien faire des statistiques pour évaluer les probabilités, et la théorie justifie aussi certaines pratiques statistiques, car, là comme ailleurs, il y a des décisions à prendre, nous le verrons au chapitre i. La théorie de la décision ne se contente pas de mettre en lumière des difficultés, elle apporte aussi quelques réponses !