Théorème d'approximation de Komlós-Major-Tusnády

Le théorème d'approximation de Komlós-Major-Tusnády ou approximation KMT est un résultat d'approximation forte qui donne une borne d'approximation de la somme partielle de variables aléatoires centrées réduites i.i.d. dont la fonction génératrice des moments est définie sur un voisinage de 0. Il affirme en particulier que cette somme peut être approchée par un mouvement brownien avec une erreur de O ( log n ) {\displaystyle O(\log n)} .

Histoire

En 1961, le mathématicien Skorokhod établit qu'une somme de variables i.i.d. centrées réduites pouvait être représentée par un mouvement brownien stoppé en certains temps d'arrêt[1].

C'est avec ce résultat que Strassen démontra en 1964 qu'une telle somme pouvait être approchée par un mouvement brownien avec une erreur de o ( n log log n ) {\displaystyle o\left({\sqrt {n\log \log n}}\right)} [2]. Bien que ce soit la meilleure borne, elle est insuffisamment générale pour démontrer des théorèmes de convergence classiques comme le théorème de Donsker[3]. La théorie de l'approximation forte émerge à partir de ce résultat.

C'est en 1975-1976 qu'émerge une meilleure approximation grâce aux mathématiciens János Komlós, Gábor Tusnády et Péter Major. Sous réserve d'une hypothèse plus forte, il est possible d'approcher la somme partielle par un mouvement brownien avec une erreur de O ( log n ) {\displaystyle O(\log n)} . La preuve de ce résultat utilise une méthode appelée la construction hongroise[4],[5].

Énoncé

Approximation forte des sommes partielles

Soit une suite de variables ( X n ) n N {\displaystyle (X_{n})_{n\in \mathbb {N} ^{*}}} i.i.d. centrées réduites dont la fonction génératrice des moments est définie sur un voisinage de 0. Il existe alors un mouvement brownien ( B t ) t 0 {\displaystyle (B_{t})_{t\geq 0}} vérifiant pour tout x R {\displaystyle x\in \mathbb {R} } et n N {\displaystyle n\in \mathbb {N} ^{*}} ,

P ( max 1 k n | S k B k | > C log n + x ) < K e λ x {\displaystyle \mathbb {P} \left(\max _{1\leq k\leq n}|S_{k}-B_{k}|>C\log n+x\right)<Ke^{-\lambda x}} ,

C , K , λ {\displaystyle C,K,\lambda } sont des constantes positives dépendant de la distribution des X n {\displaystyle X_{n}} .

En particulier, le lemme de Borel-Cantelli implique que max 1 k n | S k B k | = p.s. O ( log n ) {\displaystyle \max _{1\leq k\leq n}|S_{k}-B_{k}|{\overset {\text{p.s.}}{=}}O(\log n)} .

Approximation forte du processus empirique

Ce théorème admet également une version pour l'approximation forte du processus empirique uniforme Si ( U n ) n N {\displaystyle (U_{n})_{n\in \mathbb {N} ^{*}}} est une suite de variables i.i.d. de loi uniforme sur [ 0 , 1 ] {\displaystyle [0,1]} alors il existe une suite de ponts browniens ( P n ( t ) ) n N {\displaystyle (P_{n}(t))_{n\in \mathbb {N} ^{*}}} tel que

n N , x > 0 , P ( sup 0 t 1 | α n U ( t ) P n ( t ) | > n 1 / 2 ( C log n + x ) ) L e λ x , {\displaystyle \forall n\in \mathbb {N} ^{*},\quad \forall x>0,\quad \mathbb {P} \left(\sup _{0\leq t\leq 1}|\alpha _{n}^{U}(t)-P_{n}(t)|>n^{-1/2}(C\log n+x)\right)\leq Le^{-\lambda x},}

avec C , L , λ {\displaystyle C,L,\lambda } des constantes universelles positives. Par conséquent, d'après le lemme de Borel-Cantelli,

sup t [ 0 , 1 ] | α n U ( t ) P n ( t ) | = O ( n 1 / 2 log n ) . {\displaystyle \sup _{t\in [0,1]}|\alpha _{n}^{U}(t)-P_{n}(t)|=O(n^{-1/2}\log n).}

Bretagnolle et Massart ont même pu donner des valeurs pour les constantes universelles : ils ont montré que l'on pouvait prendre en particulier C = 12 , L = 2 , λ = 1 / 6 {\displaystyle C=12,L=2,\lambda =1/6} [6].

Rappel : le processus empirique uniforme est défini par

0 t 1 , α n U ( t ) = n ( [ 1 n i = 1 n 1 { U i t } ] t ) . {\displaystyle \forall 0\leq t\leq 1,\quad \alpha _{n}^{U}(t)={\sqrt {n}}\left(\left[{\frac {1}{n}}\sum _{i=1}^{n}\mathbf {1} _{\{U_{i}\leq t\}}\right]-t\right).}

Optimalité

La bornée proposée par KMT est la meilleure possible excepté le cas où X 1 {\displaystyle X_{1}} serait lui-même une loi normale. En effet[3], s'il existe un mouvement brownien ( B t ) t 0 {\displaystyle (B_{t})_{t\geq 0}} vérifiant | S n B n | = o p.s. ( log n ) {\displaystyle |S_{n}-B_{n}|=o_{\textrm {p.s.}}(\log n)} alors X i {\displaystyle X_{i}} est une loi normale centrée réduite.

Ce résultat est également optimal dans le sens où si l'hypothèse d'existence de la fonction génératrice des moments au voisinage de 0 est supprimée alors la borne donnée par KMT n'est plus valide. En effet[3], si c'est le cas alors pour tout mouvement brownien ( B t ) t 0 {\displaystyle (B_{t})_{t\geq 0}} , presque-sûrement on a,

lim sup n + S n B n log n = + . {\displaystyle \limsup _{n\to +\infty }{\frac {S_{n}-B_{n}}{\log n}}=+\infty .}

L'approximation est également optimale dans le cas du processus empirique. En effet[4], pour toute suite de ponts browniens ( P t ) 0 t 1 {\displaystyle (P_{t})_{0\leq t\leq 1}} définis sur le même espace de probabilité que le processus empirique ( α n U ( t ) ) 0 t 1 {\displaystyle (\alpha _{n}^{U}(t))_{0\leq t\leq 1}} on a que

P ( sup 0 t 1 | α n U ( t ) P n ( t ) | 1 6 n 1 / 2 log n ) n + 1. {\displaystyle \mathbb {P} \left(\sup _{0\leq t\leq 1}|\alpha _{n}^{U}(t)-P_{n}(t)|\geq {\frac {1}{6}}n^{-1/2}\log n\right){\underset {n\to +\infty }{\longrightarrow }}1.}

Références

  1. (ru) A. Skorokhod, « Research on the Theory of Random Processes », Kiew,‎
  2. (en) V. Strassen, « An Invariance Principle for the Law of the Iterated Logarithm », Z. Wahrscheinlichkeitstheorie, no 3,‎ , p. 211-226
  3. a b et c (en) M. Csörgo et P. Révész, Strong approximations in probability and statistics
  4. a et b (en) J. Komlos, P. Major et G. Tusnady, « An approximation of partial sums of independent RV’-s, and the sample DF. I », Z. Wahrscheinlichkeitstheorie verw, no Gebiete 32,‎ , p. 211-226 (lire en ligne)
  5. (en) J. Komlos, P. Major et G. Tusnady, « An approximation of partial sums of independent RV'-s and the sample DF. II », Z. Wahrscheinlichkeitstheorie verw, no Gebiete 34,‎ , p. 33-58 (lire en ligne)
  6. (en) J. Bretagnolle et P. Massart, « Hungarian Constructions from the Nonasymptotic Viewpoint », The Annals of Probability, vol. 17, no 1,‎ , p. 239–256 (ISSN 0091-1798 et 2168-894X, DOI 10.1214/aop/1176991506, lire en ligne, consulté le )
  • icône décorative Portail des mathématiques
  • icône décorative Portail des probabilités et de la statistique