Logique et raisonnement scientifique cours transversal Collège Doctoral Pr. Alain Lecomte
6- Faut-il brûler la logique classique? 6-1. Les logiques modales
C. I. Lewis, 1918 : les « paradoxes » de l’implication matérielle (1) (2) ad impossibile sequitur quodlibet Ex: si « l’eau bout à 100° » est vraie, alors il est vrai que « si Charlemagne fut empereur, alors l’eau bout à 100° » Distinguer une « implication stricte » d’une implication matérielle?
Implication stricte P implique strictement Q si et seulement s’il est impossible que P soit vrai sans que Q le soit Fait intervenir la notion de modalité
… une idée pas neuve Aristote, Premiers Analytiques cf. discussion sur l’aporie de Diodore Kronos (J. Vuillemin, 1984)
Aporie de Diodore - 1 A – le passé est irrévocable, B – si q suit nécessairement de p, alors s’il n’est pas possible que q, il n’est pas possible que p C – il y a des possibles qui ne se réaliseront jamais, D – de ce qui se réalise il n’a jamais été vrai qu’il ne se réalisera pas, E – de ce qui ne se réalise pas et ne se réalisera jamais, il a été vrai (à quelque moment) qu’il ne se réalisera jamais
Aporie de Diodore - 1 Pp MPp L(p q)(Mq Mp) (Mp p Fp) A – le passé est irrévocable, B – si q suit nécessairement de p, alors s’il n’est pas possible que q, il n’est pas possible que p C – il y a des possibles qui ne se réaliseront jamais, D – de ce qui se réalise il n’a jamais été vrai qu’il ne se réalisera pas, E – de ce qui ne se réalise pas et ne se réalisera jamais, il a été vrai (à quelque moment) qu’il ne se réalisera jamais Pp MPp L(p q)(Mq Mp) (Mp p Fp) p PFp p Fp PFp
Aporie de Diodore - 2 toute thèse étant nécessaire (axiome de nécessitation), on a : L(p PFp) (par D) p Fp PFp (par E) PFp MPFp (par A) p Fp MPFp par transitivité (syllogisme) L(p PFp) (MPFp Mp) (par B) MPFp Mp (par modus ponens appliqué à 1 et 5) p Fp Mp (par 4, 6 et transitivité) Mp p Fp (contraposition de 7), autrement dit : C.
Intérêt des logiques modales Introduire : le temps dans la logique (logique temporelle) sous l’aspect d’opérateurs tels que P et F (passé et futur), les considérations de contingence et de nécessité (logique aléthique), celles de permission et d’obligation (logique déontique) les notions de savoir et de croyance (logiques épistémiques et doxastiques).
opérateurs logique aléthique : le nécessaire est le dual du possible logique déontique : l’obligatoire est le dual du permis logique de la prouvabilité : le prouvable est le dual du « consistant avec » ◊p □p
Premières approches : Lewis et Langford, 1932 Présentation à la Hilbert
L’approche syntaxique (2) Interprétation « naturelle »: □p = « il est nécessaire que p » La logique modale (propositionnelle) est une extension du calcul propositionnel : Toute logique modale doit contenir comme théorèmes au minimum toutes les tautologies du CP, Comme il existe une procédure pour les déterminer (décidabilité), on peut admettre que chaque tautologie du CP est prise comme axiome
L’approche syntaxique (3) + axiomes « propres », permettant de manipuler « □ » Axiomes CP : toute formule ayant la forme d’une tautologie Axiome K : □() (□ □) Règles : modus ponens : |— |— |— nécessitation : |— |— □
L’approche syntaxique (4) Règles dérivées : Théorème : □() □ Preuve: () - axiome CP - □(() ) - nécessitation - □(() ) (□() □) - axiome K - □() □ - modus ponens
L’approche syntaxique (5) Règles dérivées : Théorème : □() (□ □) Preuve: : □() □ - th1- □() □ - th1- □() (□□) - règle du CP - : ( ()) - axiome CP - □ □( ()) - <vérifier!> - □( ()) (□ □()) - axiome K - □ (□ □()) □ □ □()
L’approche syntaxique (6) Théorème de la déduction : Théorème : si 1,2… n,|— alors 1,2… n|— Preuve: Supposons 1,2… n,|— , alors dérivable à partir de 1,2… n, et de théorèmes 1, … m en utilisant seulement la règle de modus ponens (cf. restriction sur nécessitation), donc 1, … m,1,2… n,|— dans le CP, d’où par le théorème de la déduction dans CP: |— 1( … (m (1 (2 … (n ( ))…)))…). Cette formule est une tautologie de CP, donc un axiome 1 de K. Puisque 1, … m sont des théorèmes dans K, on obtient par MP: |— 1 (2 … (n ( ))…). En utilisant encore MP: 1,2… n|—
L’approche syntaxique (7) Problèmes avec l’approche syntaxique il est « facile » d’imaginer toutes sortes de systèmes d’axiomes… du genre: □, □ □□ , ◊□ , etc. mais… quel sens cela a-t-il véritablement? (insuffisance de notre intuition) Besoin d’une approche sémantique
Sémantique de la logique modale Sémantique dite « de Kripke » Deux notions-clés : Monde possible Relation d’accessibilité
La théorie des mondes possibles
Semantic frame Un « frame » F est un couple (W, ) où: W : un ensemble non vide (de « mondes possibles ») une relation binaire sur W Un modèle (de Kripke) sur F est un couple (F, V) où: F est un « frame » V est une application de {p1, p2, …, pn} W dans {0,1} (à chaque lettre propositionnelle et chaque monde possible: une valeur de vérité)
Sémantique (3) Si dans le modèle M, V(p, w) = 1 (p: une lettre propositionnelle, w: un monde), on écrit: VM,w(p) = 1 ou: |=M,w p ou encore w |=M p On étend V à toute formule au moyen de: VM,w() = 1 ssi VM,w() = VM,w() = 1 VM,w() = 0 ssi VM,w() = VM,w() = 0 VM,w() = 1 ssi VM,w() = 0 VM,w() = 1 ssi pour tout w’ tel que ww’, VM,w’() = 1
Sémantique (4) |= ? ( découle sémantiquement de l’ensemble de prémisses ) On définira |= par: « pour tout M et tout w, si w |= pour tout dans , alors w |= » ie: si, quel que soit le modèle M, tout monde possible pour M qui admet toutes les formules de vraies, admet aussi pour vraie, alors on dit que est une conséquence de
Correction de la sémantique par rapport à K Si |—K, alors |= Dém: par récurrence sur la longueur de la dérivation. Cas de base: est un axiome, alors on vérifie que est bien vraie quel que soit le modèle M. Hyp de récurrence: vrai pour une dérivation de longueur n. Soit une dérivation de longueur n+1, supposons que son dernier pas soit une application de la règle de nécessitation, alors cela signifie que est obtenue par cette règle au moyen d’une formule p de longueur de dérivation n et que = �p. Supposons que |≠ �p. alors il existerait un monde w tel que w |≠ �p. Donc il existerait un monde w’ tel que ww’ et w’ |≠ p et on aurait |≠ p, ce qui est contradictoire avec l’hypothèse de récurrence.
Liens entre propriétés de et formules vraies dans une logique modale Supposons que nous prenions comme axiome supplémentaire, la formule : □ Quelle est sa signification en termes de « frame » ou de « relation d’accessibilité »?
Si est vraie dans tout monde accessible au monde actuel w0, alors est vraie dans ce monde actuel Autrement dit: w0 fait partie de ces mondes accessibles à partir de lui-même w0 w0 Autrement dit: est réflexive
□ w0 □
□ w2 w1 w3 w0 w7 w4 w6 w5
□ w2 w1 w3 w0 ? w7 w4 w6 w5
□ w2 w1 w3 w0 ? w7 w4 w6 w5
Propriétés de et formules vraies Idem pour: □ □□ Si est vraie dans tout monde accessible au monde actuel w0, alors c’est le cas également de □ Pour que □ soit vraie dans tout monde w accessible à w0, il faut que soit vraie dans tout monde accessible à tout monde w accessible à w0. Donc la formule exprime le fait que si est vraie dans tout monde accessible à w0, alors elle est encore vraie dans tout monde accessible à tout monde accessible à w0.
ceci est assuré si: est transitive
□ □□ w0 □
□ □□ w2 w1 w3 w0 w7 w4 w6 w5
□ □□ □□ ? w0 w6 w5
□ □□ □□ ? w0 □ w6 w5 □
□ □□ □□ ? w0 w6 w5
□ □□ □□ ? w0 w6 w5
Qu’en est-il de: ◊□ ?
S’il existe un monde possible accessible au monde actuel où □ est vraie, alors est vraie dans le monde actuel Soit w1 ce monde, dire que □ est vraie dans w1, c’est dire que est vraie dans tout monde possible accessible à w1 Si on veut que toujours en ce cas, soit vraie dans w0, il suffit que w0 soit toujours accessible à w1 Et ce, quel que soit le monde w1 accessible à w0 Donc que soit symétrique
Caractérisation d’un frame caractérise une propriété de si et seulement si tout frame <W, > ayant cette propriété admet comme formule vraie une relation est dite euclidienne si et seulement si : xyz x y x z y z
Caractérisation (2) □ (axiome T) caractérise les frames réflexifs □ □□ (axiome 4) caractérise les frames transitifs ◊□ (axiome B) caractérise les frames symétriques ◊ □◊ (axiome 5) caractérise les frames euclidiens
Différentes logiques On a vu K (pas de propriété particulière de ) (logique modale minimale) K + □ : logique T T + □ □□ : logique S4 S4 + ◊ □◊ : logique S5 si on ajoute □ : collapsus (retour à CP)
complétude Chacune de ces logiques est complète par rapport à son cadre Propriété du modèle fini : Un système S possède cette propriété si et seulement s’il existe une sémantique pour S telle que, pour toute formule qui peut être rendue fausse sur un certain modèle, elle peut nécessairement l’être aussi sur un modèle fini. Les systèmes modaux possèdent la propriété du modèle fini
Une conséquence : décidabilité K, T, S4, S5 : Axiomatisables on peut énumérer les déductions possibles D1, D2, …Dn, …. Complètes si non démontrable, alors a un contre-modèle Pté modèle fini se contenter de contre-modèles finis on peut énumérer les modèles finis M1, M2, …, Mk, … faire : suite alternée D1, M1, D2, M2, …. Dn, Mn, …. tôt ou tard: soit une preuve de , soit un contre-modèle de
discussion (1) � : modalités ontiques : modalités épistémiques : s’il est nécessaire que , alors modalités épistémiques : s’il est su que , alors mais : s’il est cru que , alors modalités déontiques : s’il est obligatoire que , alors
discussion (2) � �� modalités ontiques : la nécessité de la nécessité =la nécessité (clôture) modalités épistémiques : s’il est su que , alors il est su qu’il est su que ? (conscience du savoir) si je crois que , alors je crois que je le crois? plutôt: je sais que je le crois modalités déontiques : s’il est obligatoire que , alors il est obligatoire que cela soit obligatoire
discussion (3) ◊ �◊ modalités ontiques : la possibilité est toujours nécessaire modalités épistémiques : si j’ignore que non- ,alors je sais que je l’ignore modalités déontiques : s’il est permis que , alors il est obligatoire que cela soit permis
Problèmes de la logique déontique O O( ) Est-ce que, si je dois payer mes impôts avant le 15 mars, je dois payer mes impôts ou regarder passer l’Isère ? Pb avec K :O() (O O): S’il est obligatoire d’acheter son billet pour aller à Nantes, si je dois aller à Nantes, je dois acheter mon billet mais… si je n’y vais pas?
Logique épistémique (1) |— |— K toute vérité (logique) est connue…! (omniscience) Axiome K : si x sait que A B alors s’il sait A, il sait B (« distribution ») Connaissance : x sait que Modus ponens
Logique épistémique (2) 4 : Ki Ki Ki Axiome de l’introspection positive 5 : Ki Ki Ki Axiome de l’introspection négative B : KiKi ???
Logique épistémique (3) Mondes possibles : un agent i sait une chose dans un monde actuel w0 si et seulement si cette chose est vraie dans tous les mondes que i peut se représenter à partir de ce monde actuel, autrement dit les mondes alternatifs qu’il peut concevoir en laissant fixes par ailleurs toutes les autres connaissances qu’il possède, y compris bien sûr celle des lois de la logique.
Problèmes de la logique épistémique Le paradoxe de la connaissabilité (Fitch, 1963) S’il existe une vérité inconnue, alors le fait que ce soit une vérité inconnue est lui-même… inconnaissable! donc : si on admet que toute vérité peut-être connue,… il n’existe pas de vérité inconnue! ou : si toutes les vérités sont connaissables… elles sont toutes connues!
La preuve 1) admettons (KP) : p (p Kp) (toute vérité peut être connue) supposons que nous soyons non omniscient : (NonO) : p (p Kp) (il y a une vérité non connue) donc, soit p telle que p Kp (KP) (p Kp) K(p Kp) (MP) K(p Kp)
La preuve mais… 2) on a prouvé : (A) K(p q) Kp Kq on a l’axiome K : (B) Kp p supposons : K(p Kp), (hyp. abs.) alors : par (A) : Kp KKp par (B) : Kp Kp – contradiction – donc K(p Kp) donc �K(p Kp) – nécessitation – donc K(p Kp)
La preuve donc une contradiction découle de (KP) + (NonO) Si on veut que toute vérité soit connaissable, il faut nier que l’on soit non omniscient : p (p Kp) d’où il découle : p (p Kp) c’est-à-dire : p (p Kp) d’où : p (p Kp) (toute vérité est connue)
Solution « intuitionniste » en logique intuitionniste, l’élimination de la double-négation n’est pas valide, (p Kp) =/=> (p Kp) nous avons : p (p Kp) nous n’avons pas de moyen de trouver une vérité p que nous ne connaissons pas ! (car alors, on la connaîtrait !)
Deux conceptions du savoir Une conception « réaliste » : Les « vérités » sont dans le monde et elles sont à connaître. A un certain moment, certaines sont connues et d’autres non (paradigme de la « découverte ») Le réaliste est classique Une conception « anti-réaliste » ou « constructiviste » : Il n’y a pas de vérité en dehors du sujet connaissant. Toute vérité est une construction, donc par définition, on les connaît toutes ! L’anti-réaliste est intuitionniste
Les problèmes de la connaissance partagée: paradoxe de Conway 5 enfants jouent, à qui on a demandé de surtout ne pas se salir, mais 3 d’entre eux ont reçu sans s’en rendre compte de la boue sur le front. On suppose qu’ils sont très intelligents (!) et ne répondent que quand on leur pose une question. Le père arrive et dit une première fois : « au moins l’un de vous a de la boue sur le front, est-ce que chacun de vous peut me dire s’il a de la boue sur le front? » Ils répondent tous « non », évidemment… Le père redit exactement la même chose… même réponse Puis le père redit encore une fois la même chose… et là, chaque enfant sali est capable de donner la bonne réponse Pourquoi?
paradoxe de Conway (solution) Par récurrence sur le nombre k d’enfants ayant de la boue sur le front k = 1 : l’enfant qui a de la boue voit bien que les autres n’en ont pas, il en déduit que c’est lui qui s’est sali Hypothèse de récurrence : s’il y a k enfants salis, alors chaque enfant sali donne la bonne réponse à la kème formulation de la question Induction: imaginons qu’il y ait k+1 enfants avec de la boue sur le front, si à la kème formulation de la question, tout le monde répond toujours « non », c’est, d’après l’hypothèse de récurrence que le nombre d’enfants ayant de la boue sur le front est supérieur à k. Comme chaque enfant sale voit bien qu’il y en a exactement k autres que lui qui ont également de la boue sur le front, il en déduit que lui aussi a de la boue sur le front.
Pourquoi ce paradoxe a-t-il un lien avec la circularité? Ce qui est bizarre : Le fait que répéter plusieurs fois de suite la même information… change la situation! Imaginons k>1 : en ce cas, chaque enfant sait qu’au moins un enfant a de la boue sur le front, on pourrait dire : « inutile donc de le leur dire », or le fait de dire cette information change les choses… Quel est donc le statut de cette information qui est dite ?
Information partagée En la disant, l’information est rendue publique, elle devient partagée… Autre exemple : jouer aux cartes avec jeu à découvert et jouer aux cartes avec jeu caché mais en trichant et en regardant le jeu de son voisin… Premier cas: le joueur A connaît le jeu du joueur B mais le joueur B le sait et le joueur A sait que le joueur B sait qu’il le connaît, et ainsi de suite! L’information est publique, ou partagée (le joueur A sait que le joueur B sait que le joueur A connaît son jeu etc.) Deuxième cas: le joueur B ne sait pas que le joueur A connaît son jeu et le joueur A sait que le joueur B ne sait pas qu’il connaît son jeu L’information est privée
Formaliser la connaissance partagée Que signifie le fait qu’un groupe d’agents connaît ? DG : le groupe G a la connaissance « distribuée » de . Si quelqu’un connaissait tout ce que les membres de G connaissent, alors il connaîtrait . SG : quelqu’un dans G connaît . EG : tout le monde dans G connaît . EGk : EG1 = EG ; EGk+1 = EGEGk. CG : est « connaissance partagée » dans G : CG = EG EG2 … EGk …
Alice et Bob Considérons par exemple le cas où k = 2, Considérons l’état de connaissance d’un enfant. Prouvons que, avant que le père parle, EGk-1 est le cas, mais pas EGk. Alice et Bob sont les deux seuls enfants qui ont de la boue sur le front. Chaque enfant voit au moins un enfant qui a de la boue sur le front, donc : EG. Toutefois, Alice voit un seul enfant ayant de la boue sur le front. Elle peut très bien supposer qu’il est le seul à avoir de la boue sur le front, auquel cas, elle pense que Bob ne sait pas qu’un enfant a de la boue sur le front. Autrement dit, elle ne sait pas que Bob sait qu’au moins un enfant a de la boue sur le front, ce qui signifie qu’on n’a pas EG2.
suite Or, dans le cas présent, il faut qu’elle sache que Bob sache aussi qu’il y a au moins un enfant qui a de la boue sur le front pour qu’elle puisse déduire qu’elle en a nécessairement. Autrement dit, EG ne suffit pas, mais EG2 suffirait. Or pour être sûr que tout le monde (même Bob, du point de vue d’Alice) sait qu’au moins un enfant a de la boue sur le front, il suffit qu’une personne extérieure le dise. Autrement dit, l’énoncé du père a cette fonction. Dès que le père a parlé, les enfants ont une connaissance partagée de ce fait : quand le père énonce , les enfants savent que (autrement dit : EG) et que le père a énoncé : donc chaque enfant sait aussi que les enfants savent que (EG2). Donc, quand le père énonce , chaque enfant sait que , que EG et que EG2, donc on a EG3. Et ainsi de suite…
Un énoncé « point fixe » Si on identifie « le père énonce » et EG( « le père énonce »), on a : « le père énonce » = EG( « le père énonce ») = EG( EG( « le père énonce »)) = EG( EG( EG( « le père énonce »))) = etc. une solution de l’équation : = EG() ou encore : « le père énonce » = EG() EG2 EG3 … EGk …. Or, il s’agit là exactement de l’opérateur de connaissance partagée.
Information partagée (2) Comment représenter l’information partagée? Supposons que A, B et C acquièrent à partir d’un évènement e la connaissance partagée d’un fait , alors on a simultanément: e |= (l’évènement e est tel que soit vrai) e |= A sait e (l’évènement e est tel que A sait que e) e |= B sait e id e |= C sait e id
Information partagée (3) On peut donc caractériser un évènement minimal e comme le plus petit supportant tous ces faits, d’un point de vue ensembliste: e = {, A sait e, B sait e, C sait e } Ce qui donne une structure circulaire
Information partagée (4) e = {, A sait e, B sait e, C sait e } e = {, A sait {, A sait e, B sait e, C sait e }, B sait e, C sait e } e = {, A sait {, A sait e, B sait e, C sait e }, B sait {, A sait e, B sait e, C sait e }, C sait {, A sait e, B sait e, C sait e } } etc.
e A sait B sait C sait
Les tableaux Chaque monde est représenté par un tableau à deux colonnes Dans l’une on met ce qui est vrai en ce monde Dans l’autre on met ce qui est faux en ce monde Dès qu’une proposition vient s’inscrire dans les deux colonnes d’un même tableau : on a une contradiction
S4 : □(p q) □(□p □q) Supposons que cela soit faux Alors il existe un monde w où elle est fausse, c’est-à-dire où □(p q) est vrai mais □(□p □q) faux, Si □(□p □q) est faux dans w, alors il existe un monde w’ accessible à w où □p □q est faux, c’est-à-dire où □p est vrai mais □q faux, Si □q est faux dans w’ alors il existe un monde w’’ accessible à w’ où q est faux, Comme l’accessibilité est transitive, w’’ est accessible à w, donc p q y est vrai, de même que p puisque w’’ est accessible à w’, d’où q devrait y être vrai, or il est faux
S4 : □(p q) □(□p □q) □(□ p □q) w w’ V F V F w’’ V F
Logiques temporelles A. N. Prior, 1967 Past, Tense and Future G se traduit par : « il sera toujours le cas » H : « il a été toujours le cas » F : « il sera au moins une fois le cas » P : « il a été au moins une fois le cas »
Sémantique des logiques temporelles un couple (T, <) (au lieu de (W, )) où T est un ensemble non vide d’instants et où « < » est la relation d’antériorité entre instants
Axiomes courants CP : toutes les tautologies du CP K1 : G() (GG) K2 : H() (HH) Axiome 3 : PG, FH
Sémantique - 2 T: une suite totalement ordonnée, sans origine ni fin? Au minimum : un « ordre linéaire strict »: R est transitive R est irréflexive R est faiblement connexe:
Sémantique - 2 Au minimum : un « ordre linéaire strict »: R est transitive : G GG, et H HH R est irréflexive : ??? R est faiblement connexe:
Sémantique - 3 Des propriétés plus faibles: Une relation R est dite non branchante vers le futur si et seulement si : Une relation R est dite non branchante vers le passé si et seulement si :
Sémantique - 3 Des propriétés plus faibles: Une relation R est dite non branchante vers le futur si et seulement si : Fp G(p Pp Fp), Une relation R est dite non branchante vers le passé si et seulement si : Pp H(p Pp Fp) Densité du temps GG G, et HH H. :
le temps branchant On peut combiner des modalités Par exemple , et G, H (il sera toujours le cas que, il a été toujours le cas que, avec leurs duales F - il sera au moins une fois que - et P – il a été au moins une fois que -) Admettons que les mondes possibles aient un axe temporel commun VM,w,t() = 1 ssi pour tout w’ tel que wRw’: VM,w’,t() = 1 VM,w,t(G) = 1 ssi pour tout t’ tel que t<t’: VM,w,t’() = 1 Mais l’accessibilité entre les mondes change avec le temps! VM,w,t() = 1 ssi pour tout w’ tel que wRtw’: VM,w’,t() = 1
représentation du temps branchant Idée: wRtw’ ssi w et w’ ont eu la même « histoire » jusqu’à t t0 t1 t2 t3 t4
formalisation des contrefactuels Si Pierre était venu, il aurait rencontré Marie p = Pierre vient q = Pierre rencontre Marie P(p(p Fq)) = Il a été une fois dans le passé un monde où p était faux et où dans tous les mondes alternatifs possibles à ce monde où p était vrai, il allait être le cas au moins une fois dans le futur que q
Pas si simple… P(p(p Fq)) |— P(p((p r) Fq)) Alors s’il est vrai que: Si Pierre était venu il aurait rencontré Marie est-il vrai que: Si Pierre était venu et en venant s’était tué sur la route, il aurait rencontré Marie ?
Pas si simple… Si Pierre était venu, toutes choses étant égales par ailleurs, il aurait rencontré Marie (p q) « q est vrai dans tous les mondes alternatifs où p est vrai », (p q) = « q est vrai dans tous les mondes alternatifs où p est vrai, tout autre état de choses demeurant constant » --> introduction d’une relation de similarité entre les mondes
Temps branchant – suite - Une représentation très « réaliste » du temps : les mondes existeraient indépendamment des histoires parallèles… cf. Many-Worlds Interpretation of Quantum Mechanics, Everett, 1957 : chaque fois qu’une expérience quantique a lieu, avec différents résultats (cf. fentes de Young), tous les résultats sont obtenus, chacun dans un monde différent, même si nous ne sommes avertis que du monde comportant le résultat que nous avons vu !!!
Autres conceptions du temps Clausewitz : « en raison de leurs conséquences, les évènements possibles doivent être jugés comme réels » tout possible se réalise, soit dans le présent, soit dans le futur un changement dans la conception de la liberté? l’avenir : un point fixe à déterminer?
L'irréel n'a pas d'être, le réel ne cesse jamais d'être