Nous avons exposé, au chapitre précédent, un problème d'exploitation d'un site minier. Précisons-le et voyons comment nous pouvons en résoudre une version simple '. Le décideur est une comnie pétrolière et son expérience de la prospection lui permet de savoir qu'une première série de forages dans la zone en question donnera des résultats sur la qualité de la nappe ; ces résultats peuvent AStre répartis en trois catégories : P (positif), D (douteux) ou N (négatif). L'expérience, dans des zones semblables, a montré que, dans cinquante pour cent des cas, le résultat était douteux et dans les autres cas le résultat n'était positif qu'une fois sur deux. Dit
autrement, la comnie met une probabilité a priori de ' sur la possibilité de trouver un résultat positif, - de trouver un
résultat douteux et - de trouver un résultat négatif A la suite de
ce premier forage. Mais dire que le forage est positif ne veut pas nécessairement dire que le site est exploile : un second forage pourra permettre de conclure définitivement si le gisement est exploile (G) ou non (G). La vraisemblance de cette réponse dépend du résultat du forage précédent : dans le cas d'un premier résultat positif, la probabilité que le second forage indique que le site est exploile est plus importante que dans le cas où la première réponse est douteuse.
1. Analyse du problème
A€ ce stade de l'analyse du problème, les décisions que peut prendre le décideur sont de deux types : d'une part, mettre l'exploitation en route ou non ; d'autre part, faire procéder A l'un et/ou A l'autre forage. Nous avons, par exemple : ne pas faire de forage et abandonner le site ; ne pas faire de forage et mettre le site en exploitation ; faire un premier forage et mettre en route l'exploitation si le résultat n'est pas négatif ; faire les deux forages et procéder A l'exploitation si le site est déclaré exploile, etc.
Mais au lieu de faire déjA une liste exhaustive, voyons quelles sont les conséquences des décisions.
Deux choses sont A prendre en compte : les coûts et les gains éventuels. Nous comptons en unités monétaires, des millions d'euros, par exemple. L'achat du site a déjA coûté 6 unités, le premier forage en coûte 4, le second 10 et la mise en exploitation 100. Quant aux gains, ils sont nuls si le gisement n'est pas exploile, ils sont de 1 020 unités s'il l'est (lA , bien sûr, nous simplifions beaucoup car les gains dépendent de la qualité du puits et de facteurs économiques extérieurs au problème d'exploitation). Les conséquences sont les profits possibles, leur liste est longue puisqu'ils varient de ' 110 unités (mettre en exploitation après le premier forage et se retrouver avec un site inexploile) A 1 020 unités (mettre en exploitation sans avoir fait aucun forage et avoir la chance de tomber sur un site exploile). Nous excluons dès l'abord les décisions stupides qui consisteraient A exploiter le site bien que le second forage l'ait déclaré inexploile ; de mASme, si la réponse est G, nous ne considérons pas la possibilité de ne pas exploiter le site en fin de compte.
Ce qui veut dire que la comnie sait qu'il y a très peu de chances que le gisement soit exploile. Aussi, exploiter sans faire de forage pourrait présenter un grand risque : celui de perdre 106 unités A 86 chances contre 100, contre un gain possible, mais peu probable, de 914 unités.
Mais il y a de nombreuses autres décisions possibles et il serait prématuré de décider d'exploiter avant de les avoir analysées. Pour cela, il faut en faire la liste et exprimer la relation entre ces décisions et les conséquences ; nous allons le faire en construisant un arbre.
Sur cet arbre, nous représentons par un carré les décisions partielles du décideur ; de ces carrés partent des arAStes qui représentent les conséquences momentanées de cette décision. Au départ, trois décisions possibles : abandonner le site (A|), exploiter sans forage (E,) ou faire le premier forage (F,).
Après (A,), l'arASte donne la conséquence : - 6.
Après (E,), les conséquences dépendent de l'exploiilité du site ; nous représentons les deux possibilités gar des arAStes partant d'un rond, elles correspondent A G et G ; nous en indiquons les probabilités entre parenthèses. Au bout de ces arAStes, les conséquences sont 914 et - 106.
Après (F,), trois résultais aléatoires sont possibles : P, D et N, nous les représentons par des arAStes partant d'un rond sur lesquelles sont indiquées les probabilités de ces résultats. Au bout de chacune de ces arAStes, nous représentons par un carré la prise d'une nouvelle décision partielle : abandonner (A2), exploiter (E.) ou faire le second forage (FJ.
Après (A2) et (E,), les arAStes donnent les conséquences finales.
Après (F2), les arAStes conduisent A des ronds d'où partent les dernières arAStes correspondant aux réponses finales et A leurs conséquences en termes de profits (positifs ou négatifs).
Le schéma nous donne la sion d'ensemble des décisons partielles et des informations qui pourront AStre obtenues A partir de la décision de faire le premier forage. Sur ce schéma, nous pouvons lire toutes les décisions qui incluent F,, ainsi que leurs conséquences. Les chemins sur l'arbre sont appelés des
stratégies ; ce sont des suites d'arAStes telles F D, A2, ce qui se lit : - Faire le premier forage, et, si la réponse est douteuse, arrASter. - Sa conséquence est - 10. Ou encore, P D, F: : - Faire le premier forage, et, si la réponse est douteuse, faire le second, puis (nous l'avons sous-entendu) exploiter si et seulement si le site est exploile. - Sa conséquence est 900 si le site est exploile. - 20 sinon. Nous trouvons donc une liste de 14 stratégies possibles et la liste de leurs conséquences pour chaque état aléatoire.
ArrAStons-nous un instant sur deux manières d'ensager ce problème. La première consiste A voir les stratégies comme des décisions ; elle consiste donc A prendre en compte la dynamique du problème. La seconde manière de voir le problème consiste A le ramener A un problème statique, c est-A -dire un problème où le temps ne joue pas de rôle.
Cet ouvrage se limitera pour l'essentiel A une présentation d'une théorie de la décision dans un cadre statique. En effet, la dynamique fait intervenir, pour AStre convenablement traitée, de nombreuses hypothèses dont l'exposé dépasserait les possibilités du cadre de cet ouvrage. Nous traiterons cependant ce problème particulier A la fois sous l'angle statique, et, dans un second temps, sous l'angle dynamique afin de faire prendre conscience des différences que ces traitements impliquent. Avant mASme de commencer, distinguons les décisions qui, dans le traitement dynamique, sont des stratégies, c'est-A -dire des suites de décisions partielles qui dépendent du temps et des informations, alors que, dans le traitement statique, elles sont définies globalement.
Voici deux exemples de stratégies (dynamiques) :
' - faire le premier sondage, puis, si le résultat est positif, procéder A l'exploitation, s'il est douteux, faire le second sondage, s'il est négatif, abandonner le site - ;
' - abandonner le site sans faire de sondage. -
Voici trois exemples de décisions globales (statiques) :
' - faire le premier sondage, puis le second - ;
' - faire le premier sondage, puis abandonner - ;
' - abandonner le site sans faire de sondage - (oui, c'est aussi une
stratégie puisque, prise dès le départ, cette décision ne fait pas intervenir le temps).
2. Traitement statique du problème de décision
Nous considérons le problème globalement, c'est-A -dire que nous définissons les différentes décisions possibles concernant tout le processus, et, sur la base d'un critère que nous nous donnons, nous choisissons parmi ces décisions. Les décisions, telles que nous les avons définies au chapitre précédent, sont des ensembles de stratégies telles celles qui comprennent F, et F, ; on remarque sur l'arbre du schéma que toutes ces stratégies ont les mASmes conséquences finales. Appelons F,-F, une telle décision, sa conséquence si G se réalise est 900 et - 20 sinon.
La comnie peut tout d'abord exprimer certaines contraintes ; par exemple : - La perte ne peut pas dépasser 100. - Dans ce cas, la décision E, est éliminée, mais il faut tout de mASme un critère pour examiner les deux dernières décisions. Le profit moyen (ou, plus correctement, - espérance mathématique du profit -) est un critère, nous le verrons au chapitre iv. Le gain moyen de F,-F2 est : 900 x 0,14 - 20 x 0,86 = 126 - 17,2 = 108,8. qui est largement positif. Dans ce cas, la décision de faire les forages sera prise mASme si l'on n'élimine pas la décision E, puisque le profit espéré de celle-ci est : 914 x 0,14 - 106 x 0,86 = 127,96 - 91,16 = 36,8, bien inférieur A celui de F1-F2.
3. Traitement dynamique du problème de décision
Si nous prenons en compte le rôle du temps, les décisions sont les stratégies, c'est-A -dire des suites de décisions. Chacune de celles-ci sera prise selon des critères qui portent sur leurs conséquences momentanées ; ces critères dépendent donc généralement du temps et de l'état de l'information. Le fait que les critères dépendent aussi du processus de décision introduit de grandes difficultés théoriques que nous allons éter en supposant, ici. que le décideur s'en tient toujours au mASme critère, celui du profit espéré, par exemple.
Sous cette hypothèse, nous allons pouvoir utiliser le principe de la programmation dynamique : selon ce principe, le décideur va remonter le temps en partant de la fin, en choisissant A chaque étape la décision momentanée la meilleure ; sa stratégie optimale sera alors formée de la suite des décisions optimales en chaque instant.
Bien sûr ! Cela ent du fait que, puisque dans la seconde étape nous choisissons toujours la mASme décision, l'aspect dynamique du problème disparait.
En utilisant les utilités espérées, nous aurions eu le mASme effet. Dans la seconde période, après le résultat du premier forage, nous aurions trouvé que, dans tous les cas, l'utilité espérée de F, est supérieure et donc que, dans la première période, l'utilité espérée de F, est celle de la décision (globale) F,-F2 (nous aons trouvé : 31,35).
Dans ce cas, les conclusions du traitement dynamique du problème sont identiques A celles du traitement statique du fait que le décideur ne prend pas des décisions qui dépendent de ses informations en seconde période.
L'aspect dynamique du problème ne disparait pas si les décisions momentanées de la seconde période diffèrent selon le résultat du premier forage. C'est ce qui se passe si les probabilités conditionnelles sont celles du second leau :
' si le premier forage est positif, la probabilité d'avoir un gisement exploile est si haute qu'il vaut mieux procéder immédiatement A l'exploitation (son profit espéré est supérieur) ;
' en revanche, dans le cas où le premier forage donne un résultat douteux, c'est la décision de faire un second forage qui doit AStre prise ;
' enfin, dans le dernier cas, la probabilité d'avoir un gisement exploile est si faible qu'il vaut mieux abandonner.
La décision est donc vérilement une stratégie, elle consiste A faire le premier forage, puis, selon les cas, A exploiter sans attendre, A faire un second forage ou A abandonner le site.
Moralité
- Rien ne sert de courir, il faut partir A point - Le lièvre et la tortue en sont un très mauvais témoignage, d'abord parce qu'ils ne font généralement pas la course et que, lorsque la garrigue prend feu, c'est malheureusement la tortue, et non le lièvre, dont la chair est bien meilleure, qui est rôtie A point. La fable, dite par La Fontaine, est pourtant un régal. Cet exemple de problème de décision ne prétend pas l'AStre, mais il nous a permis, comme les fables, de soulever quelques lièvres :
' la formalisation : elle simplifie extrASmement le problème. Il faut veiller A n'en pas perdre des éléments sous l'influence de quelques
données ; ici. le leau des probabilités conditionnelles de départ pouvait cacher l'aspect dynamique du problème ;
' l'ébauche d'un arbre de décison : l'arbre entier étant généralement trop important pour AStre proprement dessiné, l'ébauche permet de mettre en édence les éléments pertinents du problème ;
' la liste des décisions : elle est souvent simplifiée par les considérations de dominance, celles-ci sont élies en analysant les conséquences ;
' les conséquences : dans la fable, elles sont absentes, si le feu de garrigue suscite la course, le lièvre part A point. Les décisions seront rangées selon les pertes et les gains, mais ceux-ci dépendent généralement d'aléas ;
' les aléas : il est fondamental de les répertorier, et, autant que possible, de les quantifier parce qu'ils pourront AStre ainsi agrégés dans un critère ;
' un critère : c'est une fonction des conséquences dont on cherche le maximum (ou le minimum si c'est un critère qui décroit en fonction de ce que le décideur préfère), nous en verrons quelques-uns au chapitre rv, les deux que nous avons utilisés sont les plus connus, ils ne sont pas exempts de défauts : le premier (profit espéré) ne tient pas compte de l'asymétrie entre la perception des gains et des pertes ; le second, que nous justifierons au chapitre v et que nous utiliserons aux chapitres et vu, ne tient pas compte de la perception subjective des probabilités (c'est-A -dire de la déformation subjective des probabilités données, nous en parlerons au chapitre i).