Analiza sekwencyjna

Analiza sekwencyjna – technika statystyczna pozwalająca realizować badanie etapowo, i przerwać je gdy tylko jedna z analiz etapowych wykaże, że zebrane do tego momentu wyniki wystarczają do potwierdzenia hipotezy badawczej.

W odróżnieniu od niezaplanowanego „podglądania danych”, które jest nadużyciem metodologicznym, i podwyższa ryzyko błędnego uznania fałszywej hipotezy za prawdziwą (popełnienia błędu I rodzaju), analiza sekwencyjna uwzględnia poprawki na wielokrotne testowanie danych, dzięki czemu kontroluje błąd I rodzaju na nominalnym poziomie istotności. Zatrzymanie pobierania danych następuje zgodnie z predefiniowaną regułą zatrzymania obserwacji. Wniosek można dzięki temu postawić często wcześniej niż w klasycznym podejściu testowania hipotez statystycznych lub estymacji, co zmniejsza koszty badania. Jest to szczególnie użyteczne w obszarach, w których uzyskanie każdej obserwacji jest wyjątkowo drogie, niebezpieczne, lub w inny sposób trudne – np. w wieloletnich medycznych badaniach klinicznych.

Procedury

Proste procedury korekcji wartości p dla analiz etapowych zaproponowali m.in. Pocock^[1]^[2], O'Brien i Fleming^[3], Haybittle i Peto^[4]^[5], oraz Lan i DeMets^[6]. Niektóre z tych metod nazywa się „wydatkowaniem wartości p”, ponieważ w praktyce polegają na proporcjonalnym rozdzielaniu ogólnego, przyjętego ryzyka popełnienia błędu I rodzaju (np. konwencjonalne 5%) na określoną liczbę części.

Należy zaznaczyć, że choć stosuje się niższe nominalne wartości krytyczne w analizach pośrednich, ryzyko popełnienia błędu I rodzaju dla całego badania pozostaje na pełnym poziomie, np. 5%, i tak należy je sprawozdać^[7].

Metoda Pococka

Metoda Pococka jest prosta, ale wymaga zaplanowania z góry liczby analiz etapowych^[1]^[2].

Przykładowe skorygowane wartości p dla analiz etapowych, przy założeniu że w badaniu przyjęto poziom istotności α=0,05
Liczba zaplanowanych analiz etapowych	Analiza etapowa	Krytyczna wartość p
2	1	0,0294
	2 (końcowa)	0,0294
3	1	0,0221
	2	0,0221
	3 (końcowa)	0,0221
4	1	0,0182
	2	0,0182
	3	0,0182
	4 (końcowa)	0,0182
5	1	0,0158
	2	0,0158
	3	0,0158
	4	0,0158
	5 (końcowa)	0,0158

Metoda Haybittle–Peto

Metoda Haybittle–Peto jest bardziej konserwatywna^[4]^[5].

Przykładowe skorygowane wartości p dla analiz etapowych, przy założeniu że w badaniu przyjęto poziom istotności α=0,05
Liczba zaplanowanych analiz etapowych	Analiza etapowa	Krytyczna wartość p
2	1	0,001
	2 (końcowa)	0,05
3	1	0,001
	2	0,001
	3 (końcowa)	0,05
4	1	0,001
	2	0,001
	3	0,001
	4 (końcowa)	0,05
5	1	0,001
	2	0,001
	3	0,001
	4	0,001
	5 (końcowa)	0,05

Historia

Analiza sekwencyjna została stworzona przez Abrahama Walda ze współpracownikami na uniwersytecie Columbia jako narzędzie do bardziej efektywnego sterowania jakością produkcji w czasie II wojny światowej. Ze względu na ich dużą użyteczność, były objęte tajemnicą do końca wojny^[8]. W późniejszych latach technikę rozwijał m.in. Kenneth Arrow^[9].

Metody sekwencyjne były wykorzystywane w trakcie wojny niezależnie przez Alana Turinga, jako część procedury Banburismus, stosowanej w ośrodku kryptograficznym w Bletchley Park do weryfikacji hipotez roboczych na temat tego, czy różne wiadomości szyfrowane Enigmą mogą być łączone razem w celu analizy. Badania te objęte były tajemnicą do początku lat osiemdziesiątych 20. wieku.

Literatura

Abraham Wald, "Sequential Tests of Statistical Hypotheses", Annals of Mathematical Statistics, 16, (1945), 117–186
Abraham Wald, Sequential Analysis, (1947)
Stanisław Trybuła "Sequential estimation in processses with independent increments", Dissertationes Mathematicae, 60, (1968), 1–46

Zobacz też

estymacja sekwencyjna
test Walda

Linki zewnętrzne

Sequential Analysis – Design Methods and Applications, „Sequential Analysis” [dostęp 2020-03-15] (ang.).

Przypisy

↑ ^a ^b Stuart J.S.J. Pocock Stuart J.S.J., Group Sequential Methods in the Design and Analysis of Clinical Trials, „Biometrika”, 64 (2), 1977, DOI: 10.2307/2335684, ISSN 0006-3444, JSTOR: 2335684 [dostęp 2017-01-31] (ang.).
↑ ^a ^b Stuart J.S.J. Pocock Stuart J.S.J., Interim Analyses for Randomized Clinical Trials: The Group Sequential Approach, „Biometrics”, 38 (1), 1982, s. 153–162, DOI: 10.2307/2530298, JSTOR: 2530298 [dostęp 2017-01-31] .
↑ Peter C.P.C. O'Brien Peter C.P.C., Thomas R.T.R. Fleming Thomas R.T.R., A Multiple Testing Procedure for Clinical Trials, „Biometrics”, 35 (3), 1979, s. 549–556, DOI: 10.2307/2530245, JSTOR: 2530245 [dostęp 2017-01-31] .
↑ ^a ^b J.L.J.L. Haybittle J.L.J.L., Repeated assessment of results in clinical trials of cancer treatment, „The British Journal of Radiology”, 44 (526), 1971, s. 793–797, DOI: 10.1259/0007-1285-44-526-793, ISSN 0007-1285 [dostęp 2017-01-31] .
↑ ^a ^b R.R. Peto R.R. i inni, Design and analysis of randomized clinical trials requiring prolonged observation of each patient. I. Introduction and design, „British Journal of Cancer”, 34 (6), 1976, s. 585–612, DOI: 10.1038/bjc.1976.220, ISSN 0007-0920 [dostęp 2017-01-31] (ang.).
↑ K.K. GORDONK.K.G. LAN K.K. GORDONK.K.G., DAVID L.D.L. DEMETS DAVID L.D.L., Discrete sequential boundaries for clinical trials, „Biometrika”, 70 (3), 1983, s. 659–663, DOI: 10.1093/biomet/70.3.659, ISSN 0006-3444 [dostęp 2017-01-31] (ang.).
↑ Kenneth FK.F. Schulz Kenneth FK.F., David AD.A. Grimes David AD.A., Multiplicity in randomised trials II: subgroup and interim analyses, „The Lancet”, 365 (9471), s. 1657–1661, DOI: 10.1016/s0140-6736(05)66516-6 .
↑ Jean-FrançoisJ.F. Hêche Jean-FrançoisJ.F., Thomas M.T.M. Liebling Thomas M.T.M., Dominique deD. Werra Dominique deD., Recherche opérationnelle pour ingénieurs, PPUR presses polytechniques, 2003, s. 145, ISBN 978-2-88074-459-5 [dostęp 2017-01-31] (fr.).
↑ K.J.K.J. Arrow K.J.K.J., D.D. Blackwell D.D., M.A.M.A. Girshick M.A.M.A., Bayes and Minimax Solutions of Sequential Decision Problems, „Econometrica”, 17 (3/4), 1949, s. 213–244, DOI: 10.2307/1905525, JSTOR: 1905525 [dostęp 2017-01-31] .