De la structuration de l'ensemble des entiers naturels

Un article de Caverne des 1001 nuits.

(Différences entre les versions)

Version du 8 décembre 2007 à 11:40

Avertissement : cet article est un article polémique qui met en doute des notions d'infinis dénombrable et non dénombrable. Il met en cause la légitimité de certains axiomes de la théorie des ensembles Zermelo-Fraenkel avec un but qui n'est pas mathématique et qui sera explicité dans un autre article à venir.

Sommaire

Définition de ℵ

Prenons ℵ, ensemble des entiers naturels. La construction de cet ensemble implique souvent la notion de successeur utilisée dans le cadre de la théorie des ensemble[1]. ℵ nous sert à compter et par conséquent à indexer les suites ; il est la base, la référence de l'indexage.

On peut aussi formaliser sa construction par la suite dite des successeurs :

  • u0 = 0,
  • ∀ n>0, un+1 = un +1.

Cette définition a pour avantage de mettre en exergue une définition quasi tautologique de cet ensemble, plus évidente que la définition en provenance de la théorie des ensembles. ℵ semble donc défini comme l'ensemble plat, la dimension 1 de l'infini, dit « infini dénombrable ».

Notons que la définition de ℵ par la suite v n'est pas plus explicite :

  • ∀ n ≥0, vn = n.

De la récurrence

Dans cette définition, on constate une utilisation de la récurrence, récurrence qui est intimement liée à la structure de ℵ lui-même. La récurrence introduit la notion d'infini.

Prenons un exemple de démonstration par récurrence. Nous allons montrer, au regard des deux définitions ci-dessus que u et v sont deux suite identiques, cela en utilisant la récurrence. Nous cherchons donc à démontrer que :

  • ∀ n ∈ ℵ, un = vn.

Démonstration :

  • u0 = 0 = v0.
  • Supposons un = vn.
  • un+1 = un + 1 = vn + 1 = n + 1 = vn+1.
  • Donc ∀ n ∈ ℵ, un = vn.

La récurrence est une notion de propagation pas à pas d'une propriété, et est souvent utilisée pour dire : « donc c'est vrai jusqu'à l'infini ». Oui, mais qu'est-ce que l'infini ?

De la bijection

La notion de bijection entre ℵ et tout autre ensemble devient, avec la récurrence et cette définition simpliste de ℵ par lui-même, la pierre angulaire des mathématiques Cantoriennes et de la notion d'infini dénombrable. Or, lorsque Cantor fait passer à l'infini ses bijections, il est discutable que l'on continue d'appeler ces objets des "bijections".

La raison en est simple : pourquoi nommer de la même façon une fonction opérant sur un ensemble fini et une fonction opérant sur des ensembles infinis ? Sont-ce réellement les mêmes objets, les mêmes concepts ? La nature de l'ensemble sur laquelle s'applique la fonction change-t-il la nature de la fonction ? Comment le prouver ou prouver l'inverse ?[2] Nous faisons donc face, comme en théorie des ensemble, sur une ambiguïté des termes utilisés, ambiguïté qui se propage dans un certain nombre de résultats des mathématiques.

Prenons, par exemple, la fonction de l'intervalle [0,n] dans l'intervalle 2[0,n] (ensemble des nombres pairs inférieurs ou égaux à 2n) qui fait correspondre à chaque entier son double :

  • fn : [0,n] → 2[0,n],
  • ∀ i ∈ [0,n], fn(i) = 2i.

Cette fonction est une bijection.

Prenons, maintenant, la fonction f de ℵ dans 2ℵ qui fait correspondre à chaque entier son double :

  • f : ℵ → 2ℵ,
  • ∀ n, f(n) = 2n.

Cette fonction est aussi une bijection au sens mathématique, car à tout élément de ℵ, on peut associer un et un seul élément de 2ℵ et vice-versa. Mais, pour autant, ces bijections ont-elles les mêmes natures ? Car, au travers de cette généralisation hâtive, nous avons introduit sous le même mot et donc sous le même concept la notion de bijection infinie. Une conséquence fâcheuse de cette définition est qu'il est très tentant de mélanger ce résultat avec les failles que l'on pressent dans la théorie des ensembles (notamment autour de la définition des symboles ∈ et ⊂).

Les ensembles d'ensembles

Tous ceux qui ont fait un peu de mathématiques se souviennent du fameux paradoxe de « l'ensemble des ensembles ne se contenant pas », paradoxe absurde si on peut dire car totalement non paradoxal. En substance, si cet ensemble existe et se contient, c'est absurde, car il ne contient que des ensembles ne se contenant pas. S'il existe et ne se contient pas, alors c'est absurde car il devrait se contenir.

Or, derrière ces paradoxes simples est un problème de définition de concept : un ensemble d'éléments n'est pas un ensemble d'ensembles. La raison en est simple : structurellement, un ensemble n'est pas un élément, ce ne sont pas les mêmes objets. Il est d'ailleurs très étrange de constater que la notation mathématique, au départ "rigoureuse", dérive à un certain degré de complexité. En effet, on décrit l'appartenance à un ensemble par le symbole ∈ et l'inclusion d'un ensemble dans un autre par le symbole ⊂. Or, si l'on considère l'ensemble des parties d'un ensemble, la notation dérive et brouille les concepts.

En effet, prenons : A = {1, 2}. L'ensemble des parties de A est défini comme suit : P(A) = {∅, {1}, {2},{1,2}}.

Or, on note {1} ∈ P(A), ce qui est un abus sémantique grave, car P(A) est un ensemble d'ensembles et on attribue au singleton {1} à la fois les propriétés d'un élément et celles d'un ensemble. Quelque part, dans le contexte de l'ensemble P(A), tous les éléments de P(A) sont donc indéterminés logiquement.

Il faudrait inventer un autre symbole dans la logique suivante :

  • 1 et 2 sont des éléments de A, donc on peut écrire 1 ∈ A ;
  • {1} ⊂ A est valide car nous comparons ce qui est comparable, soit deux ensembles opérant au même niveau mathématique, sous-entendu avec la même définition de ce qu'est un élément ;
  • {1} φ P(A), au lieu de {1} ∈ P(A), car dans le contexte, le symbole "∈" ne s'applique qu'aux éléments de A.

Une autre notion pourrait être :

  • 1 ∈A A ;
  • {1} ⊂A A ;
  • {1} ∈P(A) P(A), au lieu de {1} ∈ P(A).

Nous voyons bien que les deux symboles logiques ∈A et ∈P(A) ne sont pas les mêmes. Il n'y a donc pas de paradoxe.

On commence à constater que la logique Zermelo-Fraenkel laisse quelque peu à désirer dans la précision des concepts proposés. En arithmétique, on peut donc trouver des objets dont la nature est floue, tout cela probablement parce que leur caractère naturel et intuitif a permis de graves entorses avec la logique.

La bijection infinie

Si l'on en revient à la notion de bijection infinie et que l'on suit la notation Cantorienne, on peut écrire par abus de langage :

  • 0 = card(ℵ).

On peut définir en restant dans les abus de concepts l'association entre le comptage des éléments d'un ensemble infini et la bijection portant sur des ensembles infinis. Cela signifie que s'il existe une bijection entre un ensemble quelconque A et ℵ, ces ensembles ont le même nombre d'éléments. Cantor abuse du sens commun par un passage à l'infini très facile, parfaitement prohibé dans d'autres domaines des mathématiques[3]. Effectivement, fn (voir définition ci-dessus) est une bijection, cela pour tout n. Mais cela ne veut absolument pas dire que f en est une. C'est un objet d'une autre nature.

Cantor commet donc une double approximation qui, comme on va le voir, pourrait être à l'origine de bien des soucis conceptuels dans les mathématiques :

  • il définit la notion de cardinal d'un ensemble ayant une infinité d'éléments de manière imprécise,
  • il prétend définir une arithmétique de l'infini.

Son résultat est donc le suivant : ℵ0 est le cardinal de tous les ensembles isomorphes à ℵ.

Amusons-nous avec l'infini

Malheureusement, dans ces conditions, il est difficile d'admettre que card(2&alefsym) = card(ℵ) car, intuitivement, il y a deux fois plus d'entiers que d'entiers pairs.

Proposition : card(2&alefsym) = 1/2.card(ℵ).

Démonstration :

  • ∀ n≥0, un = card([0..n]) = n+1.
  • ∀ n≥0, vn = card( {n pair dans [0..n] }) = (n/2) + 1 si n est pair (et que l'on compte 0), sinon (n+1)/2.

On peut donc écrire : un = 1/2.vn si n impair ou 1/2.vn +1/2 si n pair.

D'où un ≈ 1/2.vn pour n grand.

Cela étant vrai pour tout n, par passage à l'infini, j'obtiens :
card(2&alefsym) = 1/2.card(ℵ).

Cette démonstration est simpliste et fait elle-aussi usage de concepts non définis et d'approximations. Son but est uniquement de mettre en question cette soi-disant arithmétique de l'infini et montrer que la vision cantorienne est biaisée.

La notion de vitesse de divergence, par exemple, n'intervient pas dans cette théorie alors que c'est probablement une des caractéristiques importantes de l'arithmétique de l'infini). On pourrait licitement postuler une fonction de vitesse de divergence Vd basée sur Vd(ℵ) = 1, ce qui donnerait avec la définition ad hoc Vd(2ℵ) = 2. Mais une fois encore, le but de ces subterfuges n'est pas dé démontrer quelque chose, mais de mettre en exergue le fait que des ensembles infinis dénombrables soient isomorphes est insuffisant.

Cantor poursuivit ses travaux avec l'analyse du card(ℜ) = ℵ1. Il mourut fou avant de démontrer que ℵ1 = 20[4]. Cantor définissait donc deux types d'infinis, encore largement enseignés aujourd'hui : l'infini dénombrable et l'infini non dénombrable. Au bout de tant d'hypothèses cavalières et de confusions de concepts, on en arrivait à cela : il n'existe que deux types d'infinis, conclusion un peu courte pour des démonstrations un peu légères[5].

L'optique cantorienne encore très largement répandue est une illustration que les axiomes de Zermelo-Fraenkel ont des failles et que l'on peut exploiter ces failles pour arriver à des théories arithmétiques absurdes ou inutiles.

Pistes sur la structuration de ℵ

L'infini de ℵ peut ne pas paraître plat, de manière intuitive. On pourrait même le voir comme un espace très fortement structuré.

En effet, on peut écrire :

  • soit P ⊂ ℵ, P ensemble des nombres premiers, P = {p1, p2, ..., pn, ...} ;
  • ∀ n ∈ ℵ, ∃ k ∈ ℵ, ∃ {i1, i2, ..., ik } ∈ ℵk : n = ∏j∈[1..k] pjij.

Prenons le logarithme népérien de ce produit juste pour l'écriture :

  • ln(n) = ∑j∈[1..k] ij.ln(pj) soit une écriture de décomposition dans un espace vectoriel sur des vecteurs de base. On exhibe donc une réelle base de décomposition des éléments de ℵ sur une base P génératrice de ℵ.

Certaines propriétés sont à noter :

  • les ij sont des éléments de ℵ, ce qui est gênant (le fait de se structurer avec soi-même réapparaît comme dans les définitions tautologiques de ℵ),
  • la base P est infinie quoique les nombres premiers soient "moins nombreux" que les entiers,
  • tout entier se décompose sur un nombre fini de vecteurs de bases, ce qui est tout à fait intéressant car on pourrait imaginer un autre type d'infini entre ℵ0 et ℵ1 en imaginant un espace contenant des entiers finis mais aussi des entiers s'exprimant sous la forme d'une série infinie de composantes non nulles sur l'ensemble de la base P.

La structure de ℵ apparaît donc non liée à ℵ0, mais plutôt de dimension card(P) = P 0. Encore que, plus exactement, si on compare P avec une base d'espace vectoriel infini, tous les objets pouvant exister dans P ne sont pas dans ℵ. Par exemple, α = ∏j∈[1..∞] pj est un objet de l'espace généré par la base P et non inclus dans ℵ. On pourrait donc définir la notion d'objet divergent en les exprimant sans forcément avoir besoin de les calculer. Dans ce cas, si E(P) est l'espace généré par P, ℵ ⊂ E(P) mais différent de E(P). Les relations de ℵ et de E(P) sont d'ailleurs très intéressantes : on pressent une "densité" de ℵ dans E(P), même si cette densité serait à redéfinir probablement dans le cadre de l'arithmétique et non dans un cadre réel.

Or, la base P a la propriété très étrange d'être la seule base actuellement connue de génération des entiers. Cette propriété devrait aussi être étudiée, car elle donne peut-être naissance à nouveau type de concept en terme d'espaces : des espaces définis par une base singulière. On pourrait aussi étudier les sous-espaces de dimension finie de P, en prenant la base Pn = {p1,...,pn} et en étudiant la nature des entiers qu'elle engendre.

Pour ce qui est des coordonnées de chaque entier dans cet espace engendré restreint de base Pn, on se retrouve à associer un entier n à sa n-ième coordonnée sur le vecteur pi. Il s'agit donc d'une fonction de ℵ → ℵ avec des règles dépendant de la nature des entiers.

Tout cela sent la loi d'échelle et le fait qu'après déstructuration de ℵ, on en arrive à pouvoir associer à tout n, un vecteur de composantes dans ℵ, fait sentir l'espace fractal. De ℵ à sa structure, il y a changement d'échelle. De n, élément de ℵ à ses composantes, il y a changement d'espace, mais, pour chacune des composantes, des règles identiques à l'échelle de départ. Intuitivement, il y a de l'invariance dans l'étude de la struture de ℵ mais aussi des lois dépendant des échelles. On pourrait même parler d'intuition de la "multifractalité", si on prend pour hypothèse que chaque n est associé à un vecteur dimensionnel plus ou moins grand suivant son nombre de composantes sur P. Intuitivement, l'ensemble ℵ serait donc plus "simple" structurellement aux alentours des petits nombres qu'il ne le serait dans les grands. Tous les nombres pourraient être regroupées par dimension et nous pourrions étudier les caractéristiques arithmétiques de ces ensembles. Les sauts entre dimensions pourraient être aussi étudiés, c'est-à-dire la décomposition des coordonnées de n sur P en produits de facteurs premiers.

On pourrait étudier les suite intradimensionnelles du type de la suivante :

  • soit n ∈ ℵ, u0 = n = ∏i,j pij.

On choisit un indice i = k et on enregistre le j correspondant (composante de n sur pk) et on définit u1 = j.

On décompose j en produit de facteurs premiers et on lui associe sa composante sur pk. Et ainsi de suite. A vue de nez, je dirais que ces suites tendent toutes vers 1, mais que le nombre (entier !) de facteurs différents de 1 peut avoir un lien avec une dimension dont le concept serait voisin du concept de dimension fractale.

Conclusion provisioire

ℵ semble bien être un ensemble très complexe et structuré d'une manière beaucoup plus élaborée que Cantor ne voulait bien l'admettre. Bien sûr, tout cela n'est qu'une ébauche de théorie très basique et probablement un peu naïve, mais elle montre qu'aussi bien l'approche des ensembles que l'approche de l'arithmétique des nombres naturels est un peu bancale et qu'il ne faut pas s'étonner que l'on mette plusieurs centaines de pages à démontrer le théorème de Fermat. Car l'arithmétique est tout sauf une théorie : ses définitions sont souvent négatives (les nombres premiers sont le plus bel exemple), ses infinis sont primitifs et sa conceptualisation par les anneaux et les suites n'est que guère convaincante. Il est temps de changer d'état d'esprit par rapport à ce fleuron de la doctrine Zermelo-Fraenkel qui a, certes, fait avancer les mathématiques, mais qui, à l'instar de la théorie de la gravitation de Newton, a fait son temps.

Notes

  1. Cf. wikipedia:Construction des entiers naturels.
  2. En informatique, par exemple, il est clair qu'un isomorphisme portant sur des ensembles de cardinaux infinis ne pourrait pas être représenté de la même façon qu'un ismorphisme opérant sur des ensembles de cardinaux finis.
  3. Par exemple, en analyse, on ne peut licitement inverser des intégrales infinies portant sur des variables différentes qu'au prix de caractéristiques incroyables de la fonction de plusieurs variables à intégrer.
  4. Respectivement en 1938 et en 1963, il fut montré par Gödel et Cohen qu'on ne pouvait démontrer que l'hypothèse de Cantor était fausse ou vraie. Quelque part, cette hypothèse semblait ne servir à rien dans le cadre de l'arithmétique.
  5. Cela n'est pas sans rappeler la grande querelle intuitionniste du début du siècle, ou les affirmations des grands chimistes de la même époque tonnant qu'il n'y aurait plus rien à découvrir en chimie après 1910.