Skip to main content
Log in

Multicollinearity and the prediction error

Der Prognosefehler bei Multikollinearität

Collinéarités et l’erreur de prévision

Ошибка в прогнозе при муль тиколлинеарности

  • Published:
Statistische Hefte Aims and scope Submit manuscript

Zusammenfassung

In diesem Aufsatz wird versucht, die Auswirkungen von, Multikollinearität auf die Genauigkeit der Prognoseschätzungen präzise, und für didaktische Zwecke geeignet, darzustellen. Hiermit soll eine m.E. in ökonometrischen Lehrbüchern existierende Lücke geschlossen werden, da dort in der Regel das Multikollinearitätsproblem zwar im Hinblick auf die Zuverlässigkeit der Parameterschätzungen ausführlich, dagegen bezüglich der Größenordnung des Prognosefehlers nur sehr kurz behandelt wird; (vgl. z.B. Schneeweiß, Kap. 3.2., oder Schönfeld, Kap. 3.52).

Nach einigen grundlegenden Definitionen und einer Einführung in die Problemstellung im 1. Abschnitt wird im 2. Abschnitt Kollinearität in “Reinkultur” studiert, und zwar als Identifikationsproblem. Dies ermöglicht im Zusammenhang mit einem Ergebnis von, Scheffé über schätzbare Funktionen eine geschlossene Beantwortung der Frage, wann und wie trotz exakter Kollinearität optimale Prognoseschätzungen durchgeführt werden können. Im 3. Abschnitt wird der praktisch relevante Fall fastkollinearer Regressoren behandelt und mit Hilfe geometrischer Überlegungen eine Darstellung der Formel der Prognosefehlervarianz gefunden, aus welcher der Einfluß von Multikollinearität direkt ablesbar wird. Im letzten Abschnitt wird die praktische Bedeutung dieser Formel an Hand eines (fiktiven) numerischen Beispiels diskutiert.

Summary

In this paper I try to give a detailed representation of the multicollinearity’s effects on the accuracy of predictive estimation which suits didactic purposes. The aim is to fill a gap in econometric text-books, where the effect on the prediction error is treated only very shortly; on the other hand there the problem of multicollinearity is exhaustively discussed as far as it concerns the variance of the regression coefficients estimators. (compare e.g. Schneeweiß, chap 3.2 or Schönfeld, chap 3.52).

After some basic definitions and an introduction to the problems in section 1 exact collinearity is studied as a problem of identifiability in section 2. The results of these studies are combined with a result of scheffé concerning estimable functions; thus it is possible to give precise conditions when and how in spite of collinearity the regressand may be predicted optimally. In section 3 the practically relevant case of almost collinear regressors is treated. By means of some geometric considerations the formula for the prediction error variance may be represented in such a way that it is possible to read directly the influence of multicollinearity. In the last section the practical relevance of this formula is discussed by aid of a (fictive) numerical example.

Résumé

Dans cet article je tâche à représenter en détail les effets de collinéarités exactes et approximatives sur la précision de l’estimation prévisionnel dans une maniére qui est apte aux buts didactiques. J’ai en vue à remplir une lacune dans les livres d’enseignement de l’économétrie où les problémes de collinéaritiés sont discutées en détail en contexte avec les variances des estimateurs des coefficients de la régression, mais où l’effect sur l’erreur de prévision est traité seulement en peu de mots; (voie par exemple Schneeweiß, chap. 3.2 ou Schönfeld, chap 3.52).

Après quelques définitions fondamentals et une introduction aux problèmes dans section 1 collinéarité exact est étudié comme une probléme d’identifiabilité dans section 2. En combinant les résultats des cettes recherches avec un résultat sur les fonctions estimables de Scheffé on peut donner des conditions précises, quand et comme une optimal prévision de la variable endogène est possible malgré de collinéarité. Dans section 3 les collinéarités approximatives qui apparaissent souvent en practice, sont traitées. Par quelques réflexions géométriques la formule la variance de l’erreur de prévision est répresentée ainsi qu’on peut lire directement l’influence des collinéarités approximatives. Dans la derniére section l’importance practique de cette formule est discutée par une (fictive) exemple numérique.

Резюме

Автор этой статьи пытается точно изложить последствия мультиколлинеарности на точность прогнознях оценок, что является подходящим для дидактических целей. Этим должен быть восполнен пробел в учебниках эконометрии, так как проблема мультиколлинеарности в расчете на надежность параметрических оценок рассматривается в них обмирно, а в расчете на величину омибки в прогнозе очень коротко (ср. напр. Шнейвейс, гл. 3.2., или Шейнфельд гл. 3.52).

После нескольких основных определений и после введения в постановку проблемы в первой части, исследуется во второй части коллинеарность как проблема идентификации. Это дает возможность в связи с сдним результатом, полученным Шефе, а относящимся к оцениваемым функциам, точно ответить на вопрос: когда и как несмотря на точную коллинеарность возможно провести оптимальные прогноэные оценки. В третьей части рассматривается практически важный случай почти коллинеарных регрессоров и при помощи геометрических соображений находится представление формулы дисперсии ошибок в прогнозе, из которого возможно непосредственно установить влияние мультиколлинеарности. В последней чаати рассматривается практическое значение этой формулы, а то при помощи (фиктивного) нумерического примера.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

References

  1. Lancaster, P.: Theory of matrices, Academic Press, New York and London, 1969.

    MATH  Google Scholar 

  2. Scheffé, H.: The analysis of variance, J. Wiley, New York, 1959.

    MATH  Google Scholar 

  3. Schneeweiß, H.: Ökonometrie, Physica-Verlag, Würzburg-Wien, 1971.

    MATH  Google Scholar 

  4. Schönfeld, P.: Methoden der Ökonometrie, Band 1, Verlag Franz Vahlen, Berlin und Frankfurt, 1969.

    Google Scholar 

Download references

Authors

Rights and permissions

Reprints and permissions

About this article

Cite this article

Seifert, H.G. Multicollinearity and the prediction error. Statistische Hefte 18, 233–253 (1977). https://doi.org/10.1007/BF02932783

Download citation

  • Issue Date:

  • DOI: https://doi.org/10.1007/BF02932783

Keywords

Navigation