Artikel werden geladen
Autoren:
Verlag:
Springer-Verlag Weitere Titel dieses Verlages anzeigen
| Inhaltsverzeichnis | ||||||
| 1. | Grundbegriffe und Elementare Methoden | 1 | ||||
| 1.1 | Einführung | 1 | ||||
| 1.1.1 | Stichprobe und Grundgesamtheit | 1 | ||||
| 1.1.2 | Beispiele | 2 | ||||
| 1.1.3 | Schätzer, Test, Konfidenzintervall | 4 | ||||
| 1.1.4 | Einteilen der Verfahren. Skalen | 9 | ||||
| 1.2 | Ein-Stichproben Situation | 11 | ||||
| 1.2.1 | Deskription: Histogramm, Geordnete Stichprobe | 12 | ||||
| 1.2.2 | Deskription: Lage, Streuung, Schiefe | 16 | ||||
| 1.2.3 | Inferenz für Lageparameter | 19 | ||||
| 1.2.4 | Anpassung | 22 | ||||
| 1.3 | Zwei-Stichproben Situation | 28 | ||||
| 1.3.1 | Tests und Konfidenzintervalle für Normalverteilungsparameter | 29 | ||||
| 1.3.2 | Mann-Whitney U-Test | 30 | ||||
| 1.4 | Bivariate Stichprobe | 33 | ||||
| 1.4.1 | Scattergramm, Korrelationskoeffizient | 34 | ||||
| 1.4.2 | Einfache lineare Regression | 37 | ||||
| 1.4.3 | Partielle Korrelation | 42 | ||||
| 1.4.4 | Rangkorrelation | 44 | ||||
| 1.4.5 | Kontingenztafel | 45 | ||||
| 1.5 | Weiterführende Verfahren | 49 | ||||
| 1.5.1 | Simultane Verfahren | 49 | ||||
| 1.5.2 | Asymptotische Verfahren | 50 | ||||
| 1.5.3 | Bootstrap Verfahren | 51 | ||||
| 1.6 | Bestimmungsschlüssel | 54 | ||||
| 1.6.1 | Gleiche Funktion, gleiche Skalen | 54 | ||||
| 1.6.2 | Kriteriums- und Kovariable | 55 | ||||
| 1.6.3 | Multivariate Verfahren | 56 | ||||
| 2. | Varianzanalyse | 57 | ||||
| 2.1 | Einfache Klassifikation | 58 | ||||
| 2.1.1 | Lineares Modell und Parameterschätzung | 58 | ||||
| 2.1.2 | Testen der globalen Nullhypothese | 60 | ||||
| 2.1.3 | Simultane Tests und Konfidenzintervalle | 63 | ||||
| 2.1.4 | Varianzhomogenität | 68 | ||||
| 2.2 | Zweifache Varianzanalyse, Kreuzklassifikation A x B | 72 | ||||
| 2.2.1 | Lineares Modell und Parameterschätzung | 72 | ||||
| 2.2.2 | Testen von Hypothesen | 74 | ||||
| 2.2.3 | Wechselwirkung | 75 | ||||
| 2.2.4 | Simultane Konfidenzintervalle, Paarvergleiche | 77 | ||||
| 2.3 | Varianzanalyse mit 3 Faktoren | 81 | ||||
| 2.3.1 | Kreuzklassinkation A x B x C | 81 | ||||
| 2.3.2 | Lateinisches Quadrat | 83 | ||||
| 2.4 | Ein Faktor mit korrelierten Beobachtungen | 85 | ||||
| 2.4.1 | Lineares Modell | 86 | ||||
| 2.4.2 | Schätz- und Testgrößen | 87 | ||||
| 2.4.3 | Simultane Konfidenzintervalle | 89 | ||||
| 2.5 | Rang-Varianzanalysen | 94 | ||||
| 2.5.1 | kunabhängige Stichproben | 94 | ||||
| 2.5.2 | kverbundene Stichproben | 98 | ||||
| 3. | Lineare Regressionsanalyse | 105 | ||||
| 3.1 | Multiple lineare Regression | 106 | ||||
| 3.1.1 | Lineares Modell und Parameterschätzung | 107 | ||||
| 3.1.2 | Testen von Hypothesen | 108 | ||||
| 3.2 | Standardfehler, Konfidenzintervalle | 114 | ||||
| 3.2.1 | Konfidenzintervalle | 115 | ||||
| 3.2.2 | Prognoseintervalle | 116 | ||||
| 3.2.3 | Spezialfall der einfachen Regression | 118 | ||||
| 3.3 | Variablenselektion | 119 | ||||
| 3.3.1 | Schrittweise Regression | 119 | ||||
| 3.3.2 | Best-subset Selektion | 121 | ||||
| 3.4 | Prüfen der Voraussetzungen | 124 | ||||
| 3.4.1 | Residuenanalyse | 125 | ||||
| 3.4.2 | Fishers Linearitätstest | 129 | ||||
| 3.5 | Korrelationsanalyse | 131 | ||||
| 3.5.1 | Multipler Korrelationskoeffizient | 132 | ||||
| 3.5.2 | Partieller Korrelationskoeffizient | 134 | ||||
| 3.6 | Kovarianzanalyse | 136 | ||||
| 3.6.1 | Lineares Modell und Schätzer der einfachen Kovarianzanalyse | 137 | ||||
| 3.6.2 | F-Tests der einfachen Kovarianzanalyse | 138 | ||||
| 3.6.3 | Lineares Modell und Schätzer der zweifachen Kovarianzanalyse | 140 | ||||
| 3.6.4 | F-Tests der zweifachen Kovarianzanalyse | 145 | ||||
| 4. | Kategoriale Datenanalyse | 149 | ||||
| 4.1 | Binäre logistische Regression | 149 | ||||
| 4.1.1 | Modell und Parameterschätzung | 151 | ||||
| 4.1.2 | Residuen, Goodness-of-flt | 153 | ||||
| 4.1.3 | Asymptotische x2Test-Statistiken | 154 | ||||
| 4.2 | Multikategoriale logistische Regression | 160 | ||||
| 4.2.1 | Multikategoriales Modell | 160 | ||||
| 4.2.2 | Inferenz im multikategorialen Modell | 162 | ||||
| 4.2.3 | Kumulatives Modell | 163 | ||||
| 4.2.4 | Kumulatives Modell: Parameterschätzung | 164 | ||||
| 4.2.5 | Kumulatives Modell: Diagnose und Inferenz | 165 | ||||
| 4.3 | Zweidimensionale Tafel: Unabhängigkeitsproblem | 170 | ||||
| 4.3.1 | Unabhängigkeitshypothese | 170 | ||||
| 4.3.2 | Cross-product ratios | 171 | ||||
| 4.3.3 | Strukturelle Nullen | 174 | ||||
| 4.4 | Zweidimensionale Tafel: Homogenitätsproblem | 177 | ||||
| 4.4.1 | Homogenitätshypothese | 177 | ||||
| 4.4.2 | Simultane Konfidenzintervalle und Tests | 179 | ||||
| 4.5 | Mehrdimensionale Kontingenztafeln | 181 | ||||
| 4.5.1 | Dreidimensionale Kontingenztafel | 181 | ||||
| 4.5.2 | Saturiertes Modell und hierarchische Unter-Modelle | 183 | ||||
| 4.5.3 | Schätzen und Testen | 184 | ||||
| 4.5.4 | Übersicht: Modelle, Hypothesen, Schätzer | 187 | ||||
| 4.5.5 | Schätzen und Testen der λ -Terme | 190 | ||||
| 4.5.6 | Vierdimensionale Kontingenztafel | 192 | ||||
| 4.6 | Logit-Modelle | 194 | ||||
| 4.6.1 | Logit-Modell mit 2 Regressoren A und B | 194 | ||||
| 4.6.2 | Spezielle Logit-Modelle mit 2 Regressoren | 195 | ||||
| 4.6.3 | Logit-Modell mit 3 Regressoren A, B und C | 198 | ||||
| 5. | Nichtlineare, nichtparametrische Regression | 199 | ||||
| 5.1 | Nichtlineare Regression | 200 | ||||
| 5.1.1 | Modell und MQ-Methode | 202 | ||||
| 5.1.2 | Konfidenzintervalle und Tests | 204 | ||||
| 5.1.3 | Beispiele | 205 | ||||
| 5.2 | Nichtparametrische Regression: Kernschätzer | 208 | ||||
| 5.2.1 | Nichtparametrisches Regressionsmodell | 209 | ||||
| 5.2.2 | Kerne | 209 | ||||
| 5.2.3 | Kernschätzer | 210 | ||||
| 5.2.4 | Asymptotische Eigenschaften | 211 | ||||
| 5.3 | Nichtparametrische Regression: Splineschätzer | 215 | ||||
| 5.3.1 | Natürliche Splinefunktionen | 216 | ||||
| 5.3.2 | Penalisiertes MQ-Kriterium, Splineschätzer | 217 | ||||
| 5.3.3 | Hat-Matrix, Matrizenrechnung | 219 | ||||
| 5.3.4 | Rechengang zur Bestimmung des Splineschätzers | 221 | ||||
| 5.4 | Additive Modelle | 222 | ||||
| 5.4.1 | Smoothing Operator, smoothing Matrix | 223 | ||||
| 5.4.2 | Backfitting Algorithmus | 225 | ||||
| 5.4.3 | Semiparametrisches lineares Modell | 228 | ||||
| 6. | MANOVA und Diskriminanzanalyse | 231 | ||||
| 6.1 | Einfache MANOVA | 232 | ||||
| 6.1.1 | Lineares Modell und Parameterschätzung | 232 | ||||
| 6.1.2 | Produktsummen-Matrizen, Testkriterien | 234 | ||||
| 6.1.3 | Simultane Tests und Konfidenzintervalle | 239 | ||||
| 6.2 | Zweifache MANOVA | 243 | ||||
| 6.2.1 | Lineares Modell und Parameterschätzung | 244 | ||||
| 6.2.2 | Testen von Hypothesen | 245 | ||||
| 6.3 | Diskriminanzanalyse | 249 | ||||
| 6.3.1 | Geometrische Beschreibung | 250 | ||||
| 6.3.2 | Spezialfall zweier Gruppen | 251 | ||||
| 6.3.3 | Diskriminanzfunktionen | 253 | ||||
| 6.3.4 | Fishers Klassifikationsfunktionen | 259 | ||||
| 6.3.5 | Schrittweise Diskriminanzanalyse | 263 | ||||
| 7. | Hauptkomponenten- und Faktoranalyse | 267 | ||||
| 7.1 | Hauptkomponentenanalyse | 268 | ||||
| 7.1.1 | Hauptkomponenten aus der Kovarianzmatrix | 269 | ||||
| 7.1.2 | Hauptkomponenten aus der Korrelationsmatrix | 271 | ||||
| 7.1.3 | Tests und Konfidenzintervalle | 276 | ||||
| 7.2 | Faktoranalyse | 277 | ||||
| 7.2.1 | Darstellung des Beobachtungsvektors | 278 | ||||
| 7.2.2 | Zerlegung der Korrelationsmatrix | 279 | ||||
| 7.2.3 | Schritte der Faktoranalyse | 280 | ||||
| 7.2.4 | Kommunalitäten, Extraktion der Faktoren | 281 | ||||
| 7.2.5 | Rotation | 285 | ||||
| 7.2.6 | Faktorwerte | 287 | ||||
| 8. | Clusteranalyse | 289 | ||||
| 8.1 | Probleme, Begriffe, Methodik | 291 | ||||
| 8.1.1 | Partitionen und Enumeration | 291 | ||||
| 8.1.2 | Distanzmaße | 291 | ||||
| 8.1.3 | Gütemaße | 293 | ||||
| 8.1.4 | Clusterbewertungen | 294 | ||||
| 8.1.5 | Einteilung der Clusterverfahren | 296 | ||||
| 8.2 | Hierarchische Verfahren | 297 | ||||
| 8.2.1 | Agglomerative Verfahren | 297 | ||||
| 8.2.2 | Die agglomerativen Verfahren im Überblick | 303 | ||||
| 8.2.3 | Divisive Verfahren | 305 | ||||
| 8.3 | Nicht-hierarchische Verfahren | 305 | ||||
| 8.3.1 | Totale Enumeration | 305 | ||||
| 8.3.2 | Hill-climbing Verfahren | 306 | ||||
| 8.3.3 | k-means Verfahren | 307 | ||||
| 8.4 | Clustern bei kategorialen Daten | 308 | ||||
| 8.4.1 | Transinformation als Heterogenitätsmaß | 309 | ||||
| 8.4.2 | Transinformation einer Partition | 310 | ||||
| 8.4.3 | Agglomeratives hierarchisches Verfahren | 312 | ||||
| 8.4.4 | Clusteranalyse in einer Übergangsmatrix | 314 | ||||
| 9. | Zeitreihenanalyse | 317 | ||||
| 9.1 | Einführung | 317 | ||||
| 9.1.1 | Aufgaben der Zeitreihenanalyse | 317 | ||||
| 9.1.2 | Bestimmung eines Trends | 320 | ||||
| 9.1.3 | Saisonkomponente | 323 | ||||
| 9.2 | Kenngrößen stationärer Prozesse | 326 | ||||
| 9.2.1 | Stationarität, Kovarianzfunktion | 326 | ||||
| 9.2.2 | Spektraldichte | 328 | ||||
| 9.3 | Schätzen und Testen der Kenngrößen | 329 | ||||
| 9.3.1 | Empirische Autokorrelation | 329 | ||||
| 9.3.2 | Asymptotische Eigenschaften des Korrelogramms | 330 | ||||
| 9.3.3 | Empirische partielle Autokorrelation | 332 | ||||
| 9.3.4 | Periodogramm einer Zeitreihe | 333 | ||||
| 9.3.5 | Periodogramm-Analyse | 338 | ||||
| 9.3.6 | Spektraldichteschätzer | 342 | ||||
| 9.3.7 | Asymptotisches Verhalten des Spektraldichteschätzers | 344 | ||||
| 9.4 | Zeitreihenmodelle | 346 | ||||
| 9.4.1 | Moving average Prozesse | 347 | ||||
| 9.4.2 | Autoregressive Prozesse | 348 | ||||
| 9.4.3 | ARMA und ARIMA Prozesse | 351 | ||||
| 9.4.4 | Schätzen von ARMA-Parametern (aus den Residuen) | 354 | ||||
| 9.4.5 | Schätzen von AR-Parametern (aus dem Korrelogramm) | 355 | ||||
| 9.5 | Modelldiagnostik und Prognose | 360 | ||||
| 9.5.1 | Identifikation, Residuenanalyse | 360 | ||||
| 9.5.2 | Prognoseverfahren | 361 | ||||
| 9.5.3 | Box-Jenkins Forecast-Formel | 362 | ||||
| 9.5.4 | Prognoseintervalle | 363 | ||||
| 9.6 | Bivariate Zeitreihen | 364 | ||||
| 9.6.1 | Kenngrößen einer bivariaten Zeitreihe | 365 | ||||
| 9.6.2 | Schätzen der Kenngrößen | 367 | ||||
| A. | Fallstudien zur Statistik | 371 | ||||
| A.1 | Waldzustand Spessart [Spessart] | 371 | ||||
| A.2 | Baumwollsamen-Ertrag [Cotton] | 375 | ||||
| A.3 | Porphyrgestein [Porphyr] | 376 | ||||
| A.4 | Insektenfallen [Insekten] | 377 | ||||
| A.5 | Stylometrie in Texten [Texte] | 380 | ||||
| A.6 | Gesteinsproben Toskana [Toskana] | 382 | ||||
| A.7 | Bodenproben Höglwald [Höglwald] | 383 | ||||
| A.8 | Pädiatrischer Längsschnitt [Laengs] | 385 | ||||
| A.9 | Primaten-Taxonomie [Primaten] | 387 | ||||
| A.10 | Klima Hohenpeißenberg [Hohenpeißenberg] | 390 | ||||
| A.11 | Sonnenfleckenzahlen [Sunspot] | 392 | ||||
| A.12 | Qualität pflanzlicher Nahrungsmittel [VDLUFA] | 393 | ||||
| A.13 | Verhalten von Primaten [Verhalten] | 394 | ||||
| B. | Quantil-Tabellen | 395 | ||||
| Literaturverzeichnis | 403 | |||||
| Index | 407 | |||||
Vorwort
Statistik dringt in immer weitere Bereiche der Naturwissenschaft, Technik, Medizin und Ökologie vor: Man denke an
Wirksamkeits- und Qualitätsprüfung von Medikamenten oder von technischen Apperaturen
Ermittlung von Faktoren, die Schäden im Wald oder im menschlichen Körper bewirken
Prädiktion von Naturereignissen, von Lagerstätten oder von klimatischen Entwicklungen.
Nach der Datenerhebung tauchen typischer Weise solche Fragen auf:
Sind die beobachteten Effekte signifikant - oder können sie durch Zufall entstanden sein?
Wie reduziere ich einen Satz miteinander korrelierter Variablen bzw. wie kombiniere ich diese zu wenigen - aber aussagekräftigen - Faktoren?
Wie können Datenpunkte in mehrdimensionalen Räumen visualisiert werden? Bei welcher Art von Projektion geben sie verborgene Strukturen preis?
Mit welchen Streubreiten muß bei den abgegebenen Prädiktionen gerechnet werden?
Solchen Fragen rückt der Statistiker mit seinem Methodenarsenal zu Leibe: Varianz- und Regressionsanalyse, Diskriminanz-, Cluster- und Faktoranalyse, Zeitreihenanalyse, mitsamt den darin enthaltenen Verfahren des Schätzens, Testens und Errichtens von Konfidenzbereichen. Alle diese Methoden gehen von gewissen einschränkenden Modellannahmen aus und lassen deshalb auch nur eingeschränkte Aussagen zu. Diese aber werden in quantifizierter und objektiv nachvollziehbarer Form gegeben.
Organisation des Buches. Ausgehend von Grundbegriffen und elementaren Verfahren (Kap. 1) wenden wir uns den (im Wesentlichen linearen) Standardverfahren der Regressions- und Varianzanalyse zu (Kap. 2 und 3). Nichtlineare statistische Methoden (Kap. 4 und 5.1) werden namentlich bei kategorialen Daten benötigt. Diesem Datentyp begegnet der Statistiker immer häufiger, weil aus Datenschutzgründen oft original metrische Daten codiert werden. Nichtparametrische Kurvenanpassungen folgen (5.2 - 5.4). Interessieren uns als Zielgrößen mehrere Variablen gleichzeitig, so gelangen wir zu den multivariaten Verfahren (Kap. 6 bis 8), die eine außerordentliche Attraktivität in den "life sciences" haben. Wir schließen mit den Analysemethoden für Zeitreihen (Kap. 9), die sowohl in der Ökologie als auch in der Ökonomie von Bedeutung sind.
Jedes Verfahren wird in der Regel durch ein Anwendungsbeispiel illustriert. Diese Beispiele sind größeren real-wissenschaftlichen Fallstudien entnommen, die im Anhang A mit Daten(auszug) und kurzen Erläuterungen vorgestellt werden. Den Fallstudien sind Programme in der Syntax der bekannten Statistikpakete Splus/R, SPSS, SAS angefügt. Mit ihrer Hilfe wurden die präsentierten Auswertungen mitsamt der Abbildungen und Tabellen produziert. Allerdings wurde stets eine Straffung der bisweilen sehr umfangreichen Programm-Outputs vorgenommen. Die Programme im Anhang A enthalten jeweils den Rahmen und die Variablendefinitionen. Die Methoden-spezifischen Codes finden sich in den jeweiligen Abschnitten des Buches.
Aus der umfangreichen Literatur zu den Programmpaketen soll erwähnt werden: Venables & Ripley (1997), Handl (2002), Zöfel (2002), Falk (1995), (2005), Dufner et al (2002). Informationen über das open source Paket R erhält man über http://cran.r-projekt.org/ .
Die Zielgruppe, die mit diesem Buch anvisiert wird, besteht: Einerseits aus den Anwendern in den oben genannten Gebieten, die mit komplexeren Auswertungsproblemen konfrontiert sind, und die bis zu einer Feinanalyse ihrer Daten vordringen möchten. Andererseits können sich Studenten und Dozenten in den Methodenwissenschaften (Mathematik, Statistik, Informatik) einen Einblick in die Fragestellungen und Lösungsangebote der Statistik verschaffen.
Vorausgesetzt werden Kenntnisse in der Wahrscheinlichkeitsrechnung, im Wesentlichen eine gewisse Vertrautheit mit Grundbegriffen wie Wahrscheinlichkeit, Zufallsvariable, Verteilung, Erwartungswert, Varianz, Kovarianz, Korrelation, Unabhängigkeit. Dieser Stoff wird in Einführungsvorlesungen in die Stochastik an unseren Hochschulen angeboten und in der Einführungsliteratur behandelt. Genannt seien: Bosch (2003), Krickeberg & Ziezold (1995), Georgii (2002). Das erste Kapitel des vorliegenden Buches stellt eine (komprimierte) Einführung in die Statistik dar.
Neben den Notationen aus der Stochastik werden - verstärkt ab Kap. 4 - solche aus der Vektor- und Matrizenrechnung verwendet.
Dank habe ich an viele Personen zu entrichten. Neben meinen Kollegen am Mathematischen Institut, insbesondere den Mitarbeitern am ehemaligen Lehrstuhl von Prof. Gänßler, muß ich Wissenschaftler aus anderen Instituten nennen, an deren Projekte ich mich beteiligen konnte. Stellvertretend für viele erwähne ich Prof. Göttlein, dessen Waldzustandsdaten aus dem Spessart für mich einen ständigen Ansporn zur statistischen Modellbildung und zur Methodenbeschaffung darstellen. Erprobt wurde der vorliegende Text an vielen "Studentengenerationen", die an meinen Vorlesungen und Praktika über Angewandte Statistik teilgenommen haben.
Errata werden nach Entdeckung auf meiner homepage
www.mathematik.uni-muenchen.de/~pruscha/ aufgelistet. Dort finden sich auch Dateien zu Fallstudien, die im Anhang A nur in Auszügen abgedruckt werden konnten. Mitteilungen erbittet der Autor per e-mail unter
pruscha@mathematik.uni-muenchen.de .
Helmut Pruscha
München Juni 2005
Statistik dringt in immer weitere Bereiche der Naturwissenschaften, der Technik, Medizin und Ökologie vor. Den immer komplexer werdenden Daten muss der Statistiker mit einem ausreichenden Methodenarsenal und mit entsprechender statistischer Software gerecht werden.
Ausgehend von Grundbegriffen und elementaren Verfahren wendet sich das Buch zunächst den Standardverfahren der multiplen Regression und den Modellen der Varianzanalyse zu. Nichtlineare statistische Methoden, wie sie namentlich bei kategorialen Daten benötigt werden, und nichtparametrische Methoden zur Kurvenanpassung folgen. Besteht die Zielgröße aus mehreren korrelierten Variablen gleichzeitig, so gelangt man zu den multivariaten Verfahren, die eine außerordentliche Attraktivität in den ,,life sciences" erlangt haben: Manova, Diskriminanz-, Faktor- und Clusteranalyse. Das Buch schließt mit den Analysemethoden für Zeitreihen, die sowohl in der Ökologie als auch in der Ökonomie wachsende Bedeutung gewinnen.
Jedes Verfahren wird durch Anwendungsbeispiele illustriert, die größeren real-wissenschaftlichen Fallstudien entnommen sind, sowie durch Programmcodes ergänzt, die in der Syntax der bekannten Statistikpakete Splus/R, SPSS oder SAS geschrieben sind.
Anwendern in den oben genannten Gebieten, die mit komplexeren Auswertungsproblemen konfrontiert sind, und die bis zur Feinanalyse ihrer Daten vordringen wollen sowie Studenten und Dozenten in den Methodenwissenschaften (Mathematik, Statistik, Informatik) erhalten einen Einblick in die Fragestellungen und in die Lösungsangebote der Statistik und der sie unterstützenden Programmpakete.
ISBN 3-540-26006-4
Index
AAmplitudenspektrum 366
- empirisches 368
Anpassungstest 22, 24, 154
AR(l)-Prozess 349
AR(2)-Prozess 350
AR(p)-Prozess 348
als Regressionsmodell 356
ARIMA(p, d, q)-Prozess 353
ARMA(p, q)-Prozess 351
- integrierter 353
Aspin-Welch 30
Austausch-Verfahren 306
Autokorrelation 327
- der Residuen 126, 361
- empirische 37, 330, 355
- partielle 327
- partielle empirische 332
Autokovarianz 326
- empirische 329, 355
autoregressiver Prozess 346
BBandbreite 210
Bartlett 69
Bartlettfenster 343
Bestimmtheitsmaß 119
Bestimmungsschlüssel 54
Bestrafungsterm 218
Bias 4, 212
asymptotischer 214
Binomialverteilung 3
Bonferroni 49, 65, 240, 241, 331
bootstrap 51
Box-Jenkins 362
Boxplot 17
CChi-Quadrat Verteilung 395
Clusteranzahl 291
Clusterbewertung 294
Clusterverfahren
- agglomerativ 297, 312
- average-linkage 299
centroid 299
complete-linkage 298
- divisiv 305
- hierarchisch 296
- hill-climbing 306
- in Übergangsmatrix 314
- in Kontingenztafel 309
- k-means 307
- nicht-hierarchisch 305
- single-linkage 298
- Ward 299
Compound symmetry 85, 87
Cramers V 46
cross-product ratio 171
cross-validation 221, 260
DDanielfenster 343
Dendrogramm 296
Designmatrix 59
Diskriminanzanalyse 249
- schrittweise 263
Diskriminanzfunktion 251, 254
Diskriminanzgerade 250
Diskriminanzkoeffizient 251, 255
- standardisierter 251, 255
Diskriminanzraum 254
Diskriminanzscore 251, 254
Distanzmaß
- Euklidisch 292
- Mahalanobis 292
Distanzniveau 298
Durbin-Watson 126, 361
Durchschnitt gleitender 321
EErwartung bedingte 362
Erwartungstreue 4
- asymptotische 338, 345
Extraktion eines Faktors 281
FF-Test
- der einfachen Kovarianzanalyse 139, 140
- der einfachen Varianzanalyse 60
- der Regressionsanalyse 109
- der zweifachen Kovarianzanalyse 146
- der zweifachen Varianzanalyse 74
- partieller 110
F-to-enter 111, 119, 263
F-to-remove 120
F-Verteilung 395
Faktoranalyse 277
Faktorladung 278
- rotierte 285
Faktormatrix 278
Faktorscore 272, 287
Faktorvariable 278
Faktorwert 272, 287
Fallstudie
- Cotton 61, 70, 75, 79, 375
- Hoeglwald 247, 383
- Hohenpeissenberg 324, 332, 340, 368, 390
- Insekten 91, 142, 147, 377
- Laengs 267, 273, 277, 282, 286, 288, 385
- Porphyr 57, 62, 66, 97, 376
- Primaten 290, 300, 307, 387
- Spessart 11, 14, 18, 21, 27, 32, 35, 41, 47, 53, 106, 111, 116, 122, 127, 135, 150, 157, 167, 187, 191, 196, 199, 214, 222, 371
- Sunspot 322, 345, 358, 364, 392
- Texte 206, 380
- Toskana 231, 238, 242, 252, 261, 264, 382
- VDLUFA 101, 393
Verhalten 172, 176, 180, 394
Fehler
- Art 7, 19, 49
- Art 7, 22
Fenster 343
Fisher 153, 259, 339
Forecast-Formel 362
Forecast-Funktion 361
Fourierfrequenz 334
Fourierkoeffizient 335
Fouriertransformierte 328, 338, 342
Frequenzanalyse 328
Friedman 98
Funktionalmatrix 200, 202
GGauß-Seidel Algorithmus 226
Glättungsparameter 209, 218
Grundgesamtheit 1
Gruppeneffekte 59
HHatmatrix 219
Hauptachse 270
Haupteffekt 73, 183, 194, 244
Hauptfaktor 271
Hauptkomponente 270
Hauptkomponentenanalyse 269
Heterogenitätsmaß 293
Histogramm 12
homogenisierende Blöcke 98
homogenisierende Variable 137
Homoskedastizität 124
Hotellings Spur 237
Hypothese
- der Isotropie 276
- der Unabhängigkeit 46, 170
- Einzelvariable 239
- globale 60, 109, 235, 237
- hierarchische 184
- lineare 204
- partielle 110, 255
IInformationsmatrix 153, 162, 165
Interpolationsspline 219
iterative proportional fitting 175, 185
KKaiser-Normalisierung 285
Kern 210
Kernschätzer 211
Klassifikationsfunktion 259
Klassifikationsregel 252
Klassifikationsscore 259
Klassifikationstafel 154, 260
Knotenstelle 215
Kohärenzspektrum 367
Kolmogorov-Smirnov 25
Kommunalitäten 279
Konfidenzintervall 8
- asymptotisches 35, 51, 153, 163, 191, 195, 204, 213, 276, 331, 339, 345, 357 - bootstrap 52
- für μ 20
- für Regressionsgerade 39
- für Regressionshyperebene 115
- für Regressionskoeffizienten 115, 204
- simultanes 40, 50, 63, 77, 89, 115, 138, 142, 240
- simultanes asymptotisches 172, 179, 339
Konfidenzniveau 8
Konsistenz 5, 345
Kontingenzkoefflzient 46
Kontingenztafel 45
- dreidimensionale 181
- vierdimensionale 192
- zweidimensionale 170
Korrelationskoeffizient
- multipler 132, 281
- partieller 42, 111, 134
- Pearson34
- Spearman44
Korrelationsmatrix 267, 271
- reduzierte 279
Korrelogramm 330
Kovariable 42
Kovarianz empirische 34
Kovarianzanalyse 263
- einfache 137
- zweifach 140
Kovarianzmatrix 269
- within 235, 245, 250
Kreisfrequenz 334
Kreuzkorrelation 365
- empirische 367
Kreuzkovarianz 365
- empirische 367
Kreuzspektrum 366
Kruskal-Wallis 95
Kurvenschätzer 209
LLagfenster 342
lateinisches Quadrat 84
leave-out-one Methode 220, 260
Levene 68
leverage value 125
Lilliefors-Quantil 26
linearer Kontrast 63, 77, 89, 138, 142, 179, 240
linearer Prozess 348
log-Likelihood 152, 162, 164
logistische Funktion 151
Logitfunktion 151
MMA( ∞)-Prozess 348
MA(l)-Prozess 347
MA(q)-Prozess 347
Mahalanobis-Distanz 292
Mann-Whitney 30
MANOVA 231
- einfache 233
- zweifache 244
Markov-Schema 349
Matrix
- between 235, 245, 293
- total 235, 245, 293
within 235, 245, 293
Maximum-Likelihood 5mean squared error 60
Median 13, 20
Messreihe 1
Minimum-Quadrat 5
Mittelwert 16
- adjustierter 137, 141
- gestutzter 16
Mittelwertkorrektur 354, 356
Mittelwertvektor 234, 244
Mittelwertvergleich
multipler 66, 78, 90, 241
ML-Methode 5, 282
ML-Schätzer 5, 152, 163
Modell
- additives 222
- generalisiertes lineares 149
- grouped continuous 164
- hierarchisches 183, 194
- log-lineares 182, 193
- Logit 194, 198
- saturiertes 183, 193, 198
- semiparametrisches 228
Modell-Identifikation 360
Monatswert 323
moving average Prozess 346
MQ-Methode 5, 38, 108, 133, 202, 355
- penalisierte 218
MQ-Schätzer 5, 60, 73, 203
NN(0, 1)-Verteilung 395
Newton Verfahren 203
nichtlineares Modell 200, 202
Nichtzentralitätsparameter 60
normal probability plot 22, 125
Normalgleichungen lineare 108
nichtlineare 202
Normalverteilung 2, 395
- asymptotische 51, 213
Normalverteilungs-Annahme 60, 109
Nullhypothese 5
PP-Wert 7, 396
Paarvergleich simultaner 63, 77, 90, 96, 100, 138, 142, 180
Parametermenge 4
Partition 291
Parzenfenster 343
Periodogramm 337
Perzentil 13
- bootstrap 52
Phasenspektrum 366
- empirisches 368
Plus-Funktion 216
Polynom
- Ausgleichs320
- lokales 321
Population 1
Prädiktions-Wahrscheinlichkeit 153
Prädiktionsvektor 219
Prädiktionswert 38, 108, 203
principal axis factoring 280
Prognosefehler 361, 363
Prognoseintervall 116, 363
QQuantil 395
- empirisches 13
Quartil 13
Quartilabstand 16
Quartimax-Rotation 285
Quasi-Unabhängigkeit 174
RRangkorrelationskoeffizient 44
Rangsumme 20, 31, 95, 99, 102
Rangvarianzanalyse
- einfache 94
- zweifache 99, 102
Rangzahl 13, 44
Regel von Bishop 195
Regel von Fisher 24
Regression
- binäre logistische 152
- kumulative logistische 163
- multikategorielle logistische 162
- nichtlineare 200
- nichtparametrische 209
Regressionsanalyse
- einfache 118
- multiple 107
- schrittweise 119
Regressionsfunktion 209, 223
Regressionsgerade 37
Regressionskoeffizient 38, 108
- innerhalb 137, 141
- total 139
Regressionsterm linearer 152, 161, 205
Regressor 106
repeated measurements 85
Residuenanalyse 125, 360
Residuenplot 125, 166
Residuenzeitreihe 319
Residuum 38, 108, 153, 166, 203, 354
Responsefunktion 162
Rotation 285
Roy-Bose 241
Ss-m Plot 69
Saisonkomponente 323
Schätzer 4
- bootstrap 51
- Gasser-Müller 211
- konsistenter 5, 342
- Nadaraya-Watson 211
Scheffe 40, 64, 77, 96, 115
Schiefe 17
Scorevektor 152, 162, 165
Signifikanzniveau 5
Signifikanztest 6smoothing Matrix 224
smoothing Operator 223
smoothing Parameter 218
Spearman 44
Spektraldichte 328
Spektraldichteschätzer 342
Spektralfenster 342
Spektrum 328
Spline kubischer 216
Splineschätzer 218
split-plot 85
Spur W-Kriterium 294
Standardabweichung 16
Standardfehler 9, 114
- approximativer 153, 165, 172, 179, 191, 195
- bootstrap 52
Stationaritätsbedingung 348
Statistik beschreibende 1
schließende 1
- to-enter 155, 156, 263
- to-remove 155, 205
Stichprobe 1
- bivariate 33
- bootstrap 51
- geordnete 13
- gruppierte 24
- multivariate 267
- trivariate 42
- verbundene 21, 98
Stirlingsche Zahl 291
Streuungszerlegung 61, 74, 83, 109, 139, 235
Strukturelle Null 174
Substitutionsprinzip 123, 265
Tt-Verteilung 395
Test
- Aspin-Welch 30
- asymptotischer 51, 276
- asymptotischer x2 46, 171, 178, 186
- auf p (l) = 0 331
- auf Linearität 130
- auf Unabhangigkeit 46
- auf unkorrelierte Zufallsreihen 367
- auf Unkorreliertheit 35
- auf Zufallsreihe 331, 339
- Bartlett 69
- des Regressionskoeffizienten 39
- Durbin-Watson 126, 361
- Ein-Stichproben t20
- exakter 50
- Friedman 99
- goodness-of-fit 154
- Hotellings Spur 237
- K-S Normalverteilungs26
- Kolmogorov-Smirnov 25
- konditionaler log-LQ 186
- Kruskal-Wallis 95
- Levene 68
- log-LQ 46, 155, 171, 178, 186
- Mann-Whitney U31
- Pearson x2 24
- Pillai 237
- Roy 237, 246
- Score 156
- simultaner 49, 239
- simultaner asymptotischer 172, 180
- verbundene Stichproben t21
- Vorzeichen 100
- Wald 156, 204
- Wilcoxon Vorzeichen-Rang 20
- Wilks' Λ 236, 246, 256, 263
- Zwei-Stichproben Varianz 30
Teststatistik 5 time lag 37, 326
time lead 361
Transformation
- Fishers z35
- varianzstabilisierende 69
Transinformation 309, 315
Trendbereinigung 322
Trendkomponente 320
truncation point 342
Tukey 64, 77, 97
UUnabhängigkeitshypothese 46, 170
VVariablenselektion backward 120
- best subset 121
- forward 120
Varianz
- empirische 16
- innerhalb 234
- merkmalspezifische 278
Varianzanalyse
- dreifache 81
- einfache 58
- multivariate 231, 244
- zweifache 72
Varianzhomogenität 29, 59, 68
Varianzkriterium 293, 299, 306
Varianzschätzer bootstrap 52
Varimax-Rotation 285
Verteilungsfunktion empirische 14
Verwerfungsbereich 5
Verzerrung 4, 212
WWachstumsfunktion 201, 205
Wechselwirkung 73, 75, 86, 183, 194, 244, 247
Wilcoxon 20
YYule-Schema 350
Yule-Walker Gleichungen 349, 350
- empirische 355
ZZackentest 320
Zeitreihe
- bivariate 365
- differenzierte 352
- integrierte 353
- Komponenten 318
- stationäre 326
Zufallsreihe 319
Aus den Rezensionen: "Der Text umfasst verschiedene wichtige Bereiche der Statistik. ... Dem Titel entsprechend integriert der Autor zudem Programmcode in den Text. Die Fallstudien werden im Anhang mit ... kurzer Erklärung vorgestellt und im Text an geeigneter Stelle als Anwendungsbeispiele angeführt. ... Jedoch erscheint ... für statistisch weniger vorgebildete Leser das Hinzuziehen eines eher spezialisierten und ausführlicheren Textes für die jeweils aktuelle Fragestellung angeraten." (R. Schlittgen, in: Zentralblatt MATH, 2006, Vol. 1080, S. 31) Aus den Rezensionen: ". ... Mit Hilfe von sehr anschaulichen Fallbeispielen gelingt es dem Autor, das sehr breite Methodenspektrum vertiefend und stets verständlich zu behandeln. ... Erwähnenswert sind die vorbildlich dokumentierten Fallstudien im Anhang. Jede Fallstudie wird kurz beschrieben, wobei auch auf die Urheber und weiterführende Literatur hingewiesen wird. ... kann ... uneingeschränkt empfohlen werden. Die Ausführungen sind präzise, sehr strukturiert, gut lesbar und werden durch zahlreiche Beispiele unterstützt. Zudem enthält das Buch einen umfassenden Schlagwortindex, es eignet sich daher nicht zuletzt auch aufgrund der klaren Strukturierung als gutes Nachschlagewerk ..." (Matthias Meyer, in: OR News Gesellschaft für Operations Research, 2006, S. 53f)