Teorema de Mann-Wald

Em teoria das probabilidades, o teorema de Mann–Wald ou teorema do mapeamento contínuo afirma que funções contínuas preservam os limites mesmo se seus argumentos forem sequências de variáveis aleatórias. Uma função contínua, na definição do matemático alemão Eduard Heine, é uma função que mapeia sequências convergentes em sequências convergentes: se x n x {\displaystyle x_{n}\rightarrow x} , então g ( x n ) g ( x ) {\displaystyle g(x_{n})\rightarrow g(x)} . O teorema de Mann–Wald afirma que isto também será verdadeiro se substituirmos a sequência determinística { x n } {\displaystyle \{x_{n}\}} por uma sequência de variáveis aleatórias { X n } {\displaystyle \{X_{n}\}} e substituirmos a noção padrão de convergência de números reais ( {\displaystyle \rightarrow } ) por um dos tipos de convergência de variáveis aleatórias.[1] O teorema recebe este nome em homenagem ao matemático norte-americano Henry Mann e ao matemático romeno Abraham Wald, que o provaram pela primeira vez em 1943.[2]

Demonstração

Considere { X n } , X {\displaystyle \{X_{n}\},X} elementos aleatórios definidos em um espaço métrico S {\displaystyle S} . Suponha uma função g : S S {\displaystyle g:S\rightarrow S'} (em que S {\displaystyle S'} é outro espaço métrico) que tem o conjunto de pontos de descontinuidade D g {\displaystyle D_{g}} tal que Pr [ X D g ] = 0 {\displaystyle \Pr[X\in D_{g}]=0} . Então,[3]

  1. X n d X g ( X n ) d g ( X ) ; {\displaystyle X_{n}{\xrightarrow {d}}X\quad \Rightarrow \quad g(X_{n}){\xrightarrow {d}}g(X);}
  2. X n p X g ( X n ) p g ( X ) ; {\displaystyle X_{n}{\xrightarrow {p}}X\quad \Rightarrow \quad g(X_{n}){\xrightarrow {p}}g(X);}
  3. X n q . c . X g ( X n ) q . c . g ( X ) . {\displaystyle X_{n}{\xrightarrow {q.c.}}X\quad \Rightarrow \quad g(X_{n}){\xrightarrow {q.c.}}g(X).}

Prova

Espaços S {\displaystyle S} e S {\displaystyle S'} estão equipados com certas métricas. Para simplificar, denotaremos ambas as métricas usando a notação | x y | {\displaystyle |x-y|} , ainda que as métricas possam ser arbitrárias e não necessariamente euclidianas.

Convergência em distribuição

Precisaremos de uma demonstração particular do teorema de Pormanteau: que a convergência em distribuição X n d X {\displaystyle X_{n}{\xrightarrow {d}}X} é equivalente a

lim sup n Pr ( X n F ) Pr ( X F )   para todo conjunto fechado   F . {\displaystyle \limsup _{n\to \infty }\operatorname {Pr} (X_{n}\in F)\leq \operatorname {Pr} (X\in F)\ {\text{para todo conjunto fechado}}\ F.}

Fixe um conjunto fechado arbitrário F S {\displaystyle F\subset S'} . Denote por g 1 ( F ) {\displaystyle g^{-1}(F)} a pré-imagem de F {\displaystyle F} sob o g {\displaystyle g} mapeante: o conjunto de todos os pontos x S {\displaystyle x\in S} tal que g ( x ) F {\displaystyle g(x)\in F} . Considere uma sequência { x k } {\displaystyle \{x_{k}\}} tal que g ( x k ) F {\displaystyle g(x_{k})\in F} e x k x {\displaystyle x_{k}\rightarrow x} . Então, esta sequência repousa em g 1 ( F ) {\displaystyle g^{-1}(F)} e seu ponto limite x {\displaystyle x} pertence ao fechamento deste conjunto, g 1 ( F ) ¯ {\displaystyle {\overline {g^{-1}(F)}}} (pela definição de fechamento. O ponto x {\displaystyle x} pode ser tanto:

  • um ponto de continuidade g {\displaystyle g} , no caso em que g ( x k ) g ( x ) {\displaystyle g(x_{k})\rightarrow g(x)} e assim g ( x ) F {\displaystyle g(x)\in F} , porque F {\displaystyle F} é um conjunto fechado, e, por isso, neste caso, x {\displaystyle x} pertence à pré-imagem de F {\displaystyle F} ; como
  • um ponto de descontinuidade de g {\displaystyle g} , de modo que x D g {\displaystyle x\in D_{g}} .

Assim, a seguinte relação se aplica:

g 1 ( F ) ¯ g 1 ( F ) D g . {\displaystyle {\overline {g^{-1}(F)}}\subset g^{-1}(F)\cup D_{g}.}

Considere o evento { g ( X n ) F } {\displaystyle \{g(X_{n})\in F\}} . A probabilidade deste evento pode ser estimada como:

Pr ( g ( X n ) F ) = Pr ( X n g 1 ( F ) ) Pr ( X n g 1 ( F ) ¯ ) , {\displaystyle \operatorname {Pr} {\big (}g(X_{n})\in F{\big )}=\operatorname {Pr} {\big (}X_{n}\in g^{-1}(F){\big )}\leq \operatorname {Pr} {\big (}X_{n}\in {\overline {g^{-1}(F)}}{\big )},}

e, pelo teorema de Portmanteau, o limite superior da última expressão menor ou igual a Pr ( x g 1 ( F ) ¯ ) {\displaystyle \Pr(x\in {\overline {g^{-1}(F)}})} . Usando a fórmula que derivamos no parágrafo anterior, isto pode ser escrito como

Pr ( X g 1 ( F ) ¯ ) Pr ( X g 1 ( F ) D g ) Pr ( X g 1 ( F ) ) + Pr ( X D g ) = Pr ( g ( X ) F ) + 0. {\displaystyle {\begin{aligned}&\operatorname {Pr} {\big (}X\in {\overline {g^{-1}(F)}}{\big )}\leq \operatorname {Pr} {\big (}X\in g^{-1}(F)\cup D_{g}{\big )}\leq \\&\operatorname {Pr} {\big (}X\in g^{-1}(F){\big )}+\operatorname {Pr} (X\in D_{g})=\operatorname {Pr} {\big (}g(X)\in F{\big )}+0.\end{aligned}}}

Ao conectar isto de volta com a expressão original, pode-se ver que:

lim sup n Pr ( g ( X n ) F ) Pr ( g ( X ) F ) , {\displaystyle \limsup _{n\to \infty }\Pr {\big (}g(X_{n})\in F{\big )}\leq \Pr {\big (}g(X)\in F{\big )},}

que, pelo teorema de Portmanteau, implica que g ( X n ) {\displaystyle g(X_{n})} converge a g ( X ) {\displaystyle g(X)} em distribuição.[4][5]

Convergência em probabilidade

Fixe um arbitrário ε > 0 {\displaystyle \varepsilon >0} . Então, para qualquer δ > 0 {\displaystyle \delta >0} , considere o conjunto B δ {\displaystyle B_{\delta }} como:

B δ = { x S x D g :   y S :   | x y | < δ , | g ( x ) g ( y ) | > ε } . {\displaystyle B_{\delta }={\big \{}x\in S\mid x\notin D_{g}:\ \exists y\in S:\ |x-y|<\delta ,\,|g(x)-g(y)|>\varepsilon {\big \}}.}

Este é o conjunto de pontos de continuidade x {\displaystyle x} da função g ( ) {\displaystyle g(\cdot )} , para o qual é possível encontrar, na interior da δ {\displaystyle \delta } -vizinhança de x {\displaystyle x} , um ponto que mapeia fora da ε {\displaystyle \varepsilon } -vizinhança de g ( x ) {\displaystyle g(x)} . Por definição de continuidade, este conjunto encolhe conforme δ {\displaystyle \delta } vai a zero, de modo que lim δ 0 B δ = {\displaystyle \lim _{\delta \to 0}B_{\delta }=\varnothing } . Agora suponha que | g ( X ) g ( X n ) | > ε {\displaystyle |g(X)-g(X_{n})|>\varepsilon } . Isto implica que, pelo menos, uma das afirmações seguintes é verdadeira: ou | X X n | δ {\displaystyle |X-X_{n}|\geq \delta } , ou X D g {\displaystyle X\in D_{g}} , ou X B δ {\displaystyle X\in B_{\delta }} . Em termos de probabilidades, isto pode ser escrito como:

Pr ( | g ( X n ) g ( X ) | > ε ) Pr ( | X n X | δ ) + Pr ( X B δ ) + Pr ( X D g ) . {\displaystyle \Pr {\big (}{\big |}g(X_{n})-g(X){\big |}>\varepsilon {\big )}\leq \Pr {\big (}|X_{n}-X|\geq \delta {\big )}+\Pr(X\in B_{\delta })+\Pr(X\in D_{g}).}

Do lado da mão direta, o primeiro converge a zero conforme n {\displaystyle n\rightarrow \infty } para qualquer δ {\displaystyle \delta } fixo, pela definição de convergência em probabilidade da sequência { X n } {\displaystyle \{X_{n}\}} . O segundo termo converge a zero conforme δ 0 {\displaystyle \delta \rightarrow 0} , já que o conjunto B δ {\displaystyle B_{\delta }} encolhe a um conjunto vazio. O último termo é identicamente igual a zero pela pressuposição do teorema. Por isso, a conclusão é que:

lim n Pr ( | g ( X n ) g ( X ) | > ε ) = 0 , {\displaystyle \lim _{n\to \infty }\Pr {\big (}{\big |}g(X_{n})-g(X){\big |}>\varepsilon {\big )}=0,}

o que significa que g ( X n ) {\displaystyle g(X_{n})} converge a g ( X ) {\displaystyle g(X)} em probabilidade.[4][5]

Convergência quase certa

Por definição de continuidade da função g ( ) {\displaystyle g(\cdot )} ,

lim n X n ( ω ) = X ( ω ) lim n g ( X n ( ω ) ) = g ( X ( ω ) ) {\displaystyle \lim _{n\to \infty }X_{n}(\omega )=X(\omega )\quad \Rightarrow \quad \lim _{n\to \infty }g(X_{n}(\omega ))=g(X(\omega ))}

em cada ponto X ( ω ) {\displaystyle X(\omega )} em que g ( ) {\displaystyle g(\cdot )} é contínua. Por isso,

Pr ( lim n g ( X n ) = g ( X ) ) Pr ( lim n g ( X n ) = g ( X ) , X D g ) Pr ( lim n X n = X , X D g ) = 1 , {\displaystyle {\begin{aligned}\operatorname {Pr} {\Big (}\lim _{n\to \infty }g(X_{n})=g(X){\Big )}&\geq \operatorname {Pr} {\Big (}\lim _{n\to \infty }g(X_{n})=g(X),X\notin D_{g}{\Big )}\\&\geq \operatorname {Pr} {\Big (}\lim _{n\to \infty }X_{n}=X,X\notin D_{g}{\Big )}=1,\end{aligned}}} ,

porque a intersecção de dois eventos quase certos é quase certa.

Por definição, concluímos que g ( X n ) {\displaystyle g(X_{n})} converge a g ( X ) {\displaystyle g(X)} quase certamente.[4][5]

Referências

  1. Takeshi., Amemiya, (1985). Advanced econometrics. Cambridge, Mass.: Harvard University Press. ISBN 0674005600. OCLC 11728277 
  2. Mann, H. B.; Wald, A. (setembro de 1943). «On Stochastic Limit and Order Relationships». The Annals of Mathematical Statistics (em inglês). 14 (3): 217–226. ISSN 0003-4851. doi:10.1214/aoms/1177731415 
  3. der., Vaart, A. W. van (1998). Asymptotic statistics. Cambridge, UK: Cambridge University Press. ISBN 0521496039. OCLC 38738910 
  4. a b c Patrick., Billingsley, (1968). Convergence of probability measures. New York,: Wiley. ISBN 0471072427. OCLC 387624 
  5. a b c Patrick., Billingsley, (1999). Convergence of probability measures 2nd ed. New York: Wiley. ISBN 0471197459. OCLC 41238534