Summary
A new class of stagewise rejective test procedures is proposed for the multiple test problem consisting of n ≥ 2 pairs of null and alternative hypotheses with mutually independent test statistics. The members of this class, called stagewise rejective linear minmax tests, are generated by the closing principle applied to global combination tests whose corresponding test statistics are linear combinations of the minimum, P (1), and the maximum, P (n), of the p-values associated with the single tests. The respective weights are determined by a single parameter k ∈ [0,1] and the level α. The well-known test based exclusively on P (1) proposed by Tippett (1931) is a special case (K = 0); its extension to a multiple test is due to Holm (1979). On the other hand, the test for K = 1 rejects the global null hypothesis if (1 − α)P (1) + αP(n) ≤ α. It is shown that all tests of the class exhaust the multiple level a and therefore cannot be improved uniformly. Their relative merits have to be judged by means of power functions for multiple test procedures. Such functions are presented and discussed in a more general context. The expected number of correctly rejected null hypotheses is recommended as a relatively simple and comprehensive way to summarize the performance of multiple tests. The various power functions are illustrated by their application to three members of the class (k = 0, 0.9, 1) and to the Simes-Hommel test by means of simulations. For the simultaneous test with k = 1 numerical derivations of the power functions are presented. On the basis of these results, it is argued that the stagewise rejective linear minmax test with k = 0.9 has a performance that is always close to that of the best performing competitor and is therefore to be recommended when little a priori information on the number and type of possible alternatives is available.
Zusammenfassung
Für ein multiples Testproblem bestehend aus n ≥ 2 paaren von Null- und Alternativhypothesen, für deren Prüfung unabhängige Teststatistiken gegeben sind, wird eine neue Klasse von Testprozeduren vorgeschlagen. Diese Tests, schrittweise verwerfende lineare minmax-Tests genannt, werden mit Hilfe des Abschlußprinzips aus Kombinationstests erzeugt. Deren Prüfgrößen sind Linearkombinationen von P (1) und P (n), des kleinsten und größten der mit den Einzeltests assoziierten p-Werte. Die beiden Gewichte sind durch einen einzigen Parameter, k ∈ [0,1], und das Signifikanzniveau a bestimmt. Tippett’s (1931) nur auf dem kleinsten p-Wert basierender Test gehört zu dieser Klasse (k = 0); die entsprechende multiple Version geht auf Holm (1979) zurück. Im Fall k = 1 wird die globale Nullhypothese verworfen, falls (1 − α)P (l) + αP(n) ≤ α. Es wird gezeigt, daß alle Tests dieser Klasse das multiple Niveau α ausschöpfen und deshalb nicht gleichmäßig verbessert werden können. Um ihre Trennschärfe beurteilen zu können, werden Gütefunktionen für multiple Testprozeduren eingeführt und in einem allgemeineren Rahmen diskutiert. Die erwartete Anzahl korrekterweise verworfener Nullhypothesen wird als ein relativ einfaches und brauchbares Kriterium zur Beurteilung der Güte multipler Tests vorgeschlagen. Die verschiedenen Gütekonzepte werden illustriert anhand dreier Tests der Klasse (k = 0, 0.9 und 1) und des Simes-Hommel Tests. Dies erfolgt mit Hilfe von Simulationsstudien. Im Falle des Simultantests mit k = 1 werden die Gütefunktionen auch analytisch hergeleitet und numerisch bestimmt. Auf Grund der erhaltenen Ergebnisse ist es offensichtlich, daß die Güte des schrittweise verwerfenden linearen minmax Tests mit k = 0.9 immer ”nahe” der Güte des besten der untersuchten Tests ist und die Anwendung dieser Testprozedur deshalb immer dann zu empfehlen ist, wenn wenig a priori Information über die Zahl und Art der möglichen Alternativen gegeben ist.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
References
Bauer, P. (1987). On the assessment of the performance of multiple test procedures. Biom. J. 29, 895 — 906.
Bergmann, B. and Hommel, G. (1988). Improvements of general multiple test procedures for redundant systems of hypotheses. These proceedings.
David, H.A. (1981). Order statistics. 2nd edition, Wiley, New York.
Fisher, R. A. (1950). Statistical methods for research workers. 11th Edition, Oliver and Boyd, London. Hochberg, Y. and Tamhane, A.J. (1987). Multiple comparison procedures. Wiley, New York.
Holm, S. (1979). A simple sequentially rejective multiple test procedure. Scand. J. Statist. 6, 65–70. Hommel, G. (1985). Grundlagen multipler Testprozeduren. Unpublished manuscript.
Hommel, G. (1988). A stagewise rejective multiple test procedure based on a modified Bonferroni test. Biometrika 75, to appear.
Hommel, G. and Hoffmann, I. (1988). Controlled uncertainty. These proceedings.
Hommel, G., Maurer, W. and Mellein, B. (1988). Ein neuer Kombinationstest und dessen Erweiterung zur Identifikation von Alternativen. In: Selbmann, H. K. (ed.): Medizinische Informationsverarbeitung und Epidemiologie im Dienste der Gesundheit. Springer, Berlin.
Marcus, R. Peritz, E. and Gabriel, K. R. (1976). On closed testing procedures with special reference to ordered analysis of variance. Biometrika 63 655–660.
Maurer, W. and Hommel, G. (1987). Erweiterung klassischer Kombinationstests zur Identifikation von Alter- nativhypothesen. Seminar der Internationalen Biometrischen Gesellschaft, Region Deutschland, Trier.
Miller, R.G. ( 1966, 1981). Simultaneous statistical inference. First and second editions, McGraw-Hill, New York.
Royen, Th. (1987). Eine verschärfte Holm-Prozedur zum Vergleich aller Mittelwertpaare. EDV in Med. und Biol. 18, 45–49.
Shaffer, J. P. (1986). Modified sequentially rejective multiple test procedures. J. Amer. Statist. Assoc. 81, 826–831.
Simes, R. J. (1986). An improved Bonferroni procedure for multiple tests of significance. Biometrika 73, 751–754.
Sonnemann, E. (1982). Allgemeine Lösungen multipler Testprobleme. EDV in Med. und Biol. 13, 120–128.
Sonnemann, E. (1983). Zusammenfassen unabhängiger Experimente. Seminar der Internationalen Biometrischen Gesellschaft, Region Österreich - Schweiz, Basel.
Spjotvoll, E. (1972). On the optimality of some multiple comparison procedures. Ann. Math. Statist. 48, 398–411.
Tippett, L. H. G. (1931). The methods of statistics. Williams and Norgate, London.
Author information
Authors and Affiliations
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 1988 Springer-Verlag Berlin Heidelberg
About this paper
Cite this paper
Maurer, W., Mellein, B. (1988). On New Multiple Tests Based on Independent p-Values and the Assessment of Their Power. In: Bauer, P., Hommel, G., Sonnemann, E. (eds) Multiple Hypothesenprüfung / Multiple Hypotheses Testing. Medizinische Informatik und Statistik, vol 70. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-52307-6_4
Download citation
DOI: https://doi.org/10.1007/978-3-642-52307-6_4
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-50559-4
Online ISBN: 978-3-642-52307-6
eBook Packages: Springer Book Archive