Analiza sekwencyjna

Analiza sekwencyjna – technika statystyczna pozwalająca realizować badanie etapowo, i przerwać je gdy tylko jedna z analiz etapowych wykaże, że zebrane do tego momentu wyniki wystarczają do potwierdzenia hipotezy badawczej.

W odróżnieniu od niezaplanowanego „podglądania danych”, które jest nadużyciem metodologicznym, i podwyższa ryzyko błędnego uznania fałszywej hipotezy za prawdziwą (popełnienia błędu I rodzaju), analiza sekwencyjna uwzględnia poprawki na wielokrotne testowanie danych, dzięki czemu kontroluje błąd I rodzaju na nominalnym poziomie istotności. Zatrzymanie pobierania danych następuje zgodnie z predefiniowaną regułą zatrzymania obserwacji. Wniosek można dzięki temu postawić często wcześniej niż w klasycznym podejściu testowania hipotez statystycznych lub estymacji, co zmniejsza koszty badania. Jest to szczególnie użyteczne w obszarach, w których uzyskanie każdej obserwacji jest wyjątkowo drogie, niebezpieczne, lub w inny sposób trudne – np. w wieloletnich medycznych badaniach klinicznych.

Procedury

Proste procedury korekcji wartości p dla analiz etapowych zaproponowali m.in. Pocock[1][2], O'Brien i Fleming[3], Haybittle i Peto[4][5], oraz Lan i DeMets[6]. Niektóre z tych metod nazywa się „wydatkowaniem wartości p”, ponieważ w praktyce polegają na proporcjonalnym rozdzielaniu ogólnego, przyjętego ryzyka popełnienia błędu I rodzaju (np. konwencjonalne 5%) na określoną liczbę części.

Należy zaznaczyć, że choć stosuje się niższe nominalne wartości krytyczne w analizach pośrednich, ryzyko popełnienia błędu I rodzaju dla całego badania pozostaje na pełnym poziomie, np. 5%, i tak należy je sprawozdać[7].

Metoda Pococka

Metoda Pococka jest prosta, ale wymaga zaplanowania z góry liczby analiz etapowych[1][2].

Przykładowe skorygowane wartości p dla analiz etapowych, przy założeniu że w badaniu przyjęto poziom istotności α=0,05
Liczba zaplanowanych analiz etapowych Analiza etapowa Krytyczna wartość p
2 1 0,0294
  2 (końcowa) 0,0294
3 1 0,0221
  2 0,0221
  3 (końcowa) 0,0221
4 1 0,0182
  2 0,0182
  3 0,0182
  4 (końcowa) 0,0182
5 1 0,0158
  2 0,0158
  3 0,0158
  4 0,0158
  5 (końcowa) 0,0158

Metoda Haybittle–Peto

Metoda Haybittle–Peto jest bardziej konserwatywna[4][5].

Przykładowe skorygowane wartości p dla analiz etapowych, przy założeniu że w badaniu przyjęto poziom istotności α=0,05
Liczba zaplanowanych analiz etapowych Analiza etapowa Krytyczna wartość p
2 1 0,001
  2 (końcowa) 0,05
3 1 0,001
  2 0,001
  3 (końcowa) 0,05
4 1 0,001
  2 0,001
  3 0,001
  4 (końcowa) 0,05
5 1 0,001
  2 0,001
  3 0,001
  4 0,001
  5 (końcowa) 0,05

Historia

Analiza sekwencyjna została stworzona przez Abrahama Walda ze współpracownikami na uniwersytecie Columbia jako narzędzie do bardziej efektywnego sterowania jakością produkcji w czasie II wojny światowej. Ze względu na ich dużą użyteczność, były objęte tajemnicą do końca wojny[8]. W późniejszych latach technikę rozwijał m.in. Kenneth Arrow[9].

Metody sekwencyjne były wykorzystywane w trakcie wojny niezależnie przez Alana Turinga, jako część procedury Banburismus, stosowanej w ośrodku kryptograficznym w Bletchley Park do weryfikacji hipotez roboczych na temat tego, czy różne wiadomości szyfrowane Enigmą mogą być łączone razem w celu analizy. Badania te objęte były tajemnicą do początku lat osiemdziesiątych 20. wieku.

Literatura

  • Abraham Wald, "Sequential Tests of Statistical Hypotheses", Annals of Mathematical Statistics, 16, (1945), 117–186
  • Abraham Wald, Sequential Analysis, (1947)
  • Stanisław Trybuła "Sequential estimation in processses with independent increments", Dissertationes Mathematicae, 60, (1968), 1–46

Zobacz też

  • estymacja sekwencyjna
  • test Walda

Linki zewnętrzne

  • Sequential Analysis – Design Methods and Applications, „Sequential Analysis” [dostęp 2020-03-15]  (ang.).

Przypisy

  1. a b Stuart J.S.J. Pocock Stuart J.S.J., Group Sequential Methods in the Design and Analysis of Clinical Trials, „Biometrika”, 64 (2), 1977, DOI: 10.2307/2335684, ISSN 0006-3444, JSTOR: 2335684 [dostęp 2017-01-31]  (ang.).
  2. a b Stuart J.S.J. Pocock Stuart J.S.J., Interim Analyses for Randomized Clinical Trials: The Group Sequential Approach, „Biometrics”, 38 (1), 1982, s. 153–162, DOI: 10.2307/2530298, JSTOR: 2530298 [dostęp 2017-01-31] .
  3. Peter C.P.C. O'Brien Peter C.P.C., Thomas R.T.R. Fleming Thomas R.T.R., A Multiple Testing Procedure for Clinical Trials, „Biometrics”, 35 (3), 1979, s. 549–556, DOI: 10.2307/2530245, JSTOR: 2530245 [dostęp 2017-01-31] .
  4. a b J.L.J.L. Haybittle J.L.J.L., Repeated assessment of results in clinical trials of cancer treatment, „The British Journal of Radiology”, 44 (526), 1971, s. 793–797, DOI: 10.1259/0007-1285-44-526-793, ISSN 0007-1285 [dostęp 2017-01-31] .
  5. a b R.R. Peto R.R. i inni, Design and analysis of randomized clinical trials requiring prolonged observation of each patient. I. Introduction and design, „British Journal of Cancer”, 34 (6), 1976, s. 585–612, DOI: 10.1038/bjc.1976.220, ISSN 0007-0920 [dostęp 2017-01-31]  (ang.).
  6. K.K. GORDONK.K.G. LAN K.K. GORDONK.K.G., DAVID L.D.L. DEMETS DAVID L.D.L., Discrete sequential boundaries for clinical trials, „Biometrika”, 70 (3), 1983, s. 659–663, DOI: 10.1093/biomet/70.3.659, ISSN 0006-3444 [dostęp 2017-01-31]  (ang.).
  7. Kenneth FK.F. Schulz Kenneth FK.F., David AD.A. Grimes David AD.A., Multiplicity in randomised trials II: subgroup and interim analyses, „The Lancet”, 365 (9471), s. 1657–1661, DOI: 10.1016/s0140-6736(05)66516-6 .
  8. Jean-FrançoisJ.F. Hêche Jean-FrançoisJ.F., Thomas M.T.M. Liebling Thomas M.T.M., Dominique deD. Werra Dominique deD., Recherche opérationnelle pour ingénieurs, PPUR presses polytechniques, 2003, s. 145, ISBN 978-2-88074-459-5 [dostęp 2017-01-31]  (fr.).
  9. K.J.K.J. Arrow K.J.K.J., D.D. Blackwell D.D., M.A.M.A. Girshick M.A.M.A., Bayes and Minimax Solutions of Sequential Decision Problems, „Econometrica”, 17 (3/4), 1949, s. 213–244, DOI: 10.2307/1905525, JSTOR: 1905525 [dostęp 2017-01-31] .