Artikel werden geladen

    Statistisches Methodenbuch

    Verfahren, Fallstudien, Programmcodes

    € 42,99 Buch kaufen
    Alle Preise inkl. MWSt. versandkostenfrei     zzgl. 3 € Versand
    Statistisches Methodenbuch
    Verfahren, Fallstudien, Programmcodes

    Autoren:

    Verlag:
    Springer-Verlag   Weitere Titel dieses Verlages anzeigen

    Erschienen: September 2005
    Seiten: 412
    Sprache: Deutsch
    Maße: 240x156x28
    Einband: Kartoniert / Broschiert
    Reihe: Statistik und ihre Anwendungen
    ISBN: 3540260064
    EAN: 9783540260066

    Inhaltsverzeichnis

    Inhaltsverzeichnis
    1.Grundbegriffe und Elementare Methoden1
    1.1Einführung1
    1.1.1Stichprobe und Grundgesamtheit1
    1.1.2Beispiele2
    1.1.3Schätzer, Test, Konfidenzintervall4
    1.1.4Einteilen der Verfahren. Skalen9
    1.2Ein-Stichproben Situation11
    1.2.1Deskription: Histogramm, Geordnete Stichprobe12
    1.2.2Deskription: Lage, Streuung, Schiefe16
    1.2.3Inferenz für Lageparameter19
    1.2.4Anpassung22
    1.3Zwei-Stichproben Situation28
    1.3.1Tests und Konfidenzintervalle für Normalverteilungsparameter29
    1.3.2Mann-Whitney U-Test30
    1.4Bivariate Stichprobe33
    1.4.1Scattergramm, Korrelationskoeffizient34
    1.4.2Einfache lineare Regression37
    1.4.3Partielle Korrelation42
    1.4.4Rangkorrelation44
    1.4.5Kontingenztafel45
    1.5Weiterführende Verfahren49
    1.5.1Simultane Verfahren49
    1.5.2Asymptotische Verfahren50
    1.5.3Bootstrap Verfahren51
    1.6Bestimmungsschlüssel54
    1.6.1Gleiche Funktion, gleiche Skalen54
    1.6.2Kriteriums- und Kovariable55
    1.6.3Multivariate Verfahren56
    2.Varianzanalyse57
    2.1Einfache Klassifikation58
    2.1.1Lineares Modell und Parameterschätzung58
    2.1.2Testen der globalen Nullhypothese60
    2.1.3Simultane Tests und Konfidenzintervalle63
    2.1.4Varianzhomogenität68
    2.2Zweifache Varianzanalyse, Kreuzklassifikation A x B72
    2.2.1Lineares Modell und Parameterschätzung72
    2.2.2Testen von Hypothesen74
    2.2.3Wechselwirkung75
    2.2.4Simultane Konfidenzintervalle, Paarvergleiche77
    2.3Varianzanalyse mit 3 Faktoren81
    2.3.1Kreuzklassinkation A x B x C81
    2.3.2Lateinisches Quadrat83
    2.4Ein Faktor mit korrelierten Beobachtungen85
    2.4.1Lineares Modell86
    2.4.2Schätz- und Testgrößen87
    2.4.3Simultane Konfidenzintervalle89
    2.5Rang-Varianzanalysen94
    2.5.1kunabhängige Stichproben94
    2.5.2kverbundene Stichproben98
    3.Lineare Regressionsanalyse105
    3.1Multiple lineare Regression106
    3.1.1Lineares Modell und Parameterschätzung107
    3.1.2Testen von Hypothesen108
    3.2Standardfehler, Konfidenzintervalle114
    3.2.1Konfidenzintervalle115
    3.2.2Prognoseintervalle116
    3.2.3Spezialfall der einfachen Regression118
    3.3Variablenselektion119
    3.3.1Schrittweise Regression119
    3.3.2Best-subset Selektion121
    3.4Prüfen der Voraussetzungen124
    3.4.1Residuenanalyse125
    3.4.2Fishers Linearitätstest129
    3.5Korrelationsanalyse131
    3.5.1Multipler Korrelationskoeffizient132
    3.5.2Partieller Korrelationskoeffizient134
    3.6Kovarianzanalyse136
    3.6.1Lineares Modell und Schätzer der einfachen Kovarianzanalyse137
    3.6.2F-Tests der einfachen Kovarianzanalyse138
    3.6.3Lineares Modell und Schätzer der zweifachen Kovarianzanalyse140
    3.6.4F-Tests der zweifachen Kovarianzanalyse145
    4.Kategoriale Datenanalyse149
    4.1Binäre logistische Regression149
    4.1.1Modell und Parameterschätzung151
    4.1.2Residuen, Goodness-of-flt153
    4.1.3Asymptotische x2Test-Statistiken154
    4.2Multikategoriale logistische Regression160
    4.2.1Multikategoriales Modell160
    4.2.2Inferenz im multikategorialen Modell162
    4.2.3Kumulatives Modell163
    4.2.4Kumulatives Modell: Parameterschätzung164
    4.2.5Kumulatives Modell: Diagnose und Inferenz165
    4.3Zweidimensionale Tafel: Unabhängigkeitsproblem170
    4.3.1Unabhängigkeitshypothese170
    4.3.2Cross-product ratios171
    4.3.3Strukturelle Nullen174
    4.4Zweidimensionale Tafel: Homogenitätsproblem177
    4.4.1Homogenitätshypothese177
    4.4.2Simultane Konfidenzintervalle und Tests179
    4.5Mehrdimensionale Kontingenztafeln181
    4.5.1Dreidimensionale Kontingenztafel181
    4.5.2Saturiertes Modell und hierarchische Unter-Modelle183
    4.5.3Schätzen und Testen184
    4.5.4Übersicht: Modelle, Hypothesen, Schätzer187
    4.5.5Schätzen und Testen der λ -Terme190
    4.5.6Vierdimensionale Kontingenztafel192
    4.6Logit-Modelle194
    4.6.1Logit-Modell mit 2 Regressoren A und B194
    4.6.2Spezielle Logit-Modelle mit 2 Regressoren195
    4.6.3Logit-Modell mit 3 Regressoren A, B und C198
    5.Nichtlineare, nichtparametrische Regression199
    5.1Nichtlineare Regression200
    5.1.1Modell und MQ-Methode202
    5.1.2Konfidenzintervalle und Tests204
    5.1.3Beispiele205
    5.2Nichtparametrische Regression: Kernschätzer208
    5.2.1Nichtparametrisches Regressionsmodell209
    5.2.2Kerne209
    5.2.3Kernschätzer210
    5.2.4Asymptotische Eigenschaften211
    5.3Nichtparametrische Regression: Splineschätzer215
    5.3.1Natürliche Splinefunktionen216
    5.3.2Penalisiertes MQ-Kriterium, Splineschätzer217
    5.3.3Hat-Matrix, Matrizenrechnung219
    5.3.4Rechengang zur Bestimmung des Splineschätzers221
    5.4Additive Modelle222
    5.4.1Smoothing Operator, smoothing Matrix223
    5.4.2Backfitting Algorithmus225
    5.4.3Semiparametrisches lineares Modell228
    6.MANOVA und Diskriminanzanalyse231
    6.1Einfache MANOVA232
    6.1.1Lineares Modell und Parameterschätzung232
    6.1.2Produktsummen-Matrizen, Testkriterien234
    6.1.3Simultane Tests und Konfidenzintervalle239
    6.2Zweifache MANOVA243
    6.2.1Lineares Modell und Parameterschätzung244
    6.2.2Testen von Hypothesen245
    6.3Diskriminanzanalyse249
    6.3.1Geometrische Beschreibung250
    6.3.2Spezialfall zweier Gruppen251
    6.3.3Diskriminanzfunktionen253
    6.3.4Fishers Klassifikationsfunktionen259
    6.3.5Schrittweise Diskriminanzanalyse263
    7.Hauptkomponenten- und Faktoranalyse267
    7.1Hauptkomponentenanalyse268
    7.1.1Hauptkomponenten aus der Kovarianzmatrix269
    7.1.2Hauptkomponenten aus der Korrelationsmatrix271
    7.1.3Tests und Konfidenzintervalle276
    7.2Faktoranalyse277
    7.2.1Darstellung des Beobachtungsvektors278
    7.2.2Zerlegung der Korrelationsmatrix279
    7.2.3Schritte der Faktoranalyse280
    7.2.4Kommunalitäten, Extraktion der Faktoren281
    7.2.5Rotation285
    7.2.6Faktorwerte287
    8.Clusteranalyse289
    8.1Probleme, Begriffe, Methodik291
    8.1.1Partitionen und Enumeration291
    8.1.2Distanzmaße291
    8.1.3Gütemaße293
    8.1.4Clusterbewertungen294
    8.1.5Einteilung der Clusterverfahren296
    8.2Hierarchische Verfahren297
    8.2.1Agglomerative Verfahren297
    8.2.2Die agglomerativen Verfahren im Überblick303
    8.2.3Divisive Verfahren305
    8.3Nicht-hierarchische Verfahren305
    8.3.1Totale Enumeration305
    8.3.2Hill-climbing Verfahren306
    8.3.3k-means Verfahren307
    8.4Clustern bei kategorialen Daten308
    8.4.1Transinformation als Heterogenitätsmaß309
    8.4.2Transinformation einer Partition310
    8.4.3Agglomeratives hierarchisches Verfahren312
    8.4.4Clusteranalyse in einer Übergangsmatrix314
    9.Zeitreihenanalyse317
    9.1Einführung317
    9.1.1Aufgaben der Zeitreihenanalyse317
    9.1.2Bestimmung eines Trends320
    9.1.3Saisonkomponente323
    9.2Kenngrößen stationärer Prozesse326
    9.2.1Stationarität, Kovarianzfunktion326
    9.2.2Spektraldichte328
    9.3Schätzen und Testen der Kenngrößen329
    9.3.1Empirische Autokorrelation329
    9.3.2Asymptotische Eigenschaften des Korrelogramms330
    9.3.3Empirische partielle Autokorrelation332
    9.3.4Periodogramm einer Zeitreihe333
    9.3.5Periodogramm-Analyse338
    9.3.6Spektraldichteschätzer342
    9.3.7Asymptotisches Verhalten des Spektraldichteschätzers344
    9.4Zeitreihenmodelle346
    9.4.1Moving average Prozesse347
    9.4.2Autoregressive Prozesse348
    9.4.3ARMA und ARIMA Prozesse351
    9.4.4Schätzen von ARMA-Parametern (aus den Residuen)354
    9.4.5Schätzen von AR-Parametern (aus dem Korrelogramm)355
    9.5Modelldiagnostik und Prognose360
    9.5.1Identifikation, Residuenanalyse360
    9.5.2Prognoseverfahren361
    9.5.3Box-Jenkins Forecast-Formel362
    9.5.4Prognoseintervalle363
    9.6Bivariate Zeitreihen364
    9.6.1Kenngrößen einer bivariaten Zeitreihe365
    9.6.2Schätzen der Kenngrößen367
    A.Fallstudien zur Statistik371
    A.1Waldzustand Spessart [Spessart]371
    A.2Baumwollsamen-Ertrag [Cotton]375
    A.3Porphyrgestein [Porphyr]376
    A.4Insektenfallen [Insekten]377
    A.5Stylometrie in Texten [Texte]380
    A.6Gesteinsproben Toskana [Toskana]382
    A.7Bodenproben Höglwald [Höglwald]383
    A.8Pädiatrischer Längsschnitt [Laengs]385
    A.9Primaten-Taxonomie [Primaten]387
    A.10Klima Hohenpeißenberg [Hohenpeißenberg]390
    A.11Sonnenfleckenzahlen [Sunspot]392
    A.12Qualität pflanzlicher Nahrungsmittel [VDLUFA]393
    A.13Verhalten von Primaten [Verhalten]394
    B.Quantil-Tabellen395
    Literaturverzeichnis403
    Index407



    Vorwort

    Vorwort

    Statistik dringt in immer weitere Bereiche der Naturwissenschaft, Technik, Medizin und Ökologie vor: Man denke an

    • Wirksamkeits- und Qualitätsprüfung von Medikamenten oder von technischen Apperaturen

    • Ermittlung von Faktoren, die Schäden im Wald oder im menschlichen Körper bewirken

    • Prädiktion von Naturereignissen, von Lagerstätten oder von klimatischen Entwicklungen.

    Nach der Datenerhebung tauchen typischer Weise solche Fragen auf:

    • Sind die beobachteten Effekte signifikant - oder können sie durch Zufall entstanden sein?

    • Wie reduziere ich einen Satz miteinander korrelierter Variablen bzw. wie kombiniere ich diese zu wenigen - aber aussagekräftigen - Faktoren?

    • Wie können Datenpunkte in mehrdimensionalen Räumen visualisiert werden? Bei welcher Art von Projektion geben sie verborgene Strukturen preis?

    • Mit welchen Streubreiten muß bei den abgegebenen Prädiktionen gerechnet werden?

    Solchen Fragen rückt der Statistiker mit seinem Methodenarsenal zu Leibe: Varianz- und Regressionsanalyse, Diskriminanz-, Cluster- und Faktoranalyse, Zeitreihenanalyse, mitsamt den darin enthaltenen Verfahren des Schätzens, Testens und Errichtens von Konfidenzbereichen. Alle diese Methoden gehen von gewissen einschränkenden Modellannahmen aus und lassen deshalb auch nur eingeschränkte Aussagen zu. Diese aber werden in quantifizierter und objektiv nachvollziehbarer Form gegeben.

    Organisation des Buches. Ausgehend von Grundbegriffen und elementaren Verfahren (Kap. 1) wenden wir uns den (im Wesentlichen linearen) Standardverfahren der Regressions- und Varianzanalyse zu (Kap. 2 und 3). Nichtlineare statistische Methoden (Kap. 4 und 5.1) werden namentlich bei kategorialen Daten benötigt. Diesem Datentyp begegnet der Statistiker immer häufiger, weil aus Datenschutzgründen oft original metrische Daten codiert werden. Nichtparametrische Kurvenanpassungen folgen (5.2 - 5.4). Interessieren uns als Zielgrößen mehrere Variablen gleichzeitig, so gelangen wir zu den multivariaten Verfahren (Kap. 6 bis 8), die eine außerordentliche Attraktivität in den "life sciences" haben. Wir schließen mit den Analysemethoden für Zeitreihen (Kap. 9), die sowohl in der Ökologie als auch in der Ökonomie von Bedeutung sind.

    Jedes Verfahren wird in der Regel durch ein Anwendungsbeispiel illustriert. Diese Beispiele sind größeren real-wissenschaftlichen Fallstudien entnommen, die im Anhang A mit Daten(auszug) und kurzen Erläuterungen vorgestellt werden. Den Fallstudien sind Programme in der Syntax der bekannten Statistikpakete Splus/R, SPSS, SAS angefügt. Mit ihrer Hilfe wurden die präsentierten Auswertungen mitsamt der Abbildungen und Tabellen produziert. Allerdings wurde stets eine Straffung der bisweilen sehr umfangreichen Programm-Outputs vorgenommen. Die Programme im Anhang A enthalten jeweils den Rahmen und die Variablendefinitionen. Die Methoden-spezifischen Codes finden sich in den jeweiligen Abschnitten des Buches.

    Aus der umfangreichen Literatur zu den Programmpaketen soll erwähnt werden: Venables & Ripley (1997), Handl (2002), Zöfel (2002), Falk (1995), (2005), Dufner et al (2002). Informationen über das open source Paket R erhält man über http://cran.r-projekt.org/ .

    Die Zielgruppe, die mit diesem Buch anvisiert wird, besteht: Einerseits aus den Anwendern in den oben genannten Gebieten, die mit komplexeren Auswertungsproblemen konfrontiert sind, und die bis zu einer Feinanalyse ihrer Daten vordringen möchten. Andererseits können sich Studenten und Dozenten in den Methodenwissenschaften (Mathematik, Statistik, Informatik) einen Einblick in die Fragestellungen und Lösungsangebote der Statistik verschaffen.

    Vorausgesetzt werden Kenntnisse in der Wahrscheinlichkeitsrechnung, im Wesentlichen eine gewisse Vertrautheit mit Grundbegriffen wie Wahrscheinlichkeit, Zufallsvariable, Verteilung, Erwartungswert, Varianz, Kovarianz, Korrelation, Unabhängigkeit. Dieser Stoff wird in Einführungsvorlesungen in die Stochastik an unseren Hochschulen angeboten und in der Einführungsliteratur behandelt. Genannt seien: Bosch (2003), Krickeberg & Ziezold (1995), Georgii (2002). Das erste Kapitel des vorliegenden Buches stellt eine (komprimierte) Einführung in die Statistik dar.

    Neben den Notationen aus der Stochastik werden - verstärkt ab Kap. 4 - solche aus der Vektor- und Matrizenrechnung verwendet.

    Dank habe ich an viele Personen zu entrichten. Neben meinen Kollegen am Mathematischen Institut, insbesondere den Mitarbeitern am ehemaligen Lehrstuhl von Prof. Gänßler, muß ich Wissenschaftler aus anderen Instituten nennen, an deren Projekte ich mich beteiligen konnte. Stellvertretend für viele erwähne ich Prof. Göttlein, dessen Waldzustandsdaten aus dem Spessart für mich einen ständigen Ansporn zur statistischen Modellbildung und zur Methodenbeschaffung darstellen. Erprobt wurde der vorliegende Text an vielen "Studentengenerationen", die an meinen Vorlesungen und Praktika über Angewandte Statistik teilgenommen haben.

    Errata werden nach Entdeckung auf meiner homepage

    www.mathematik.uni-muenchen.de/~pruscha/ aufgelistet. Dort finden sich auch Dateien zu Fallstudien, die im Anhang A nur in Auszügen abgedruckt werden konnten. Mitteilungen erbittet der Autor per e-mail unter

    pruscha@mathematik.uni-muenchen.de .

    Helmut Pruscha

    München Juni 2005

    Klappentext

    Statistik dringt in immer weitere Bereiche der Naturwissenschaften, der Technik, Medizin und Ökologie vor. Den immer komplexer werdenden Daten muss der Statistiker mit einem ausreichenden Methodenarsenal und mit entsprechender statistischer Software gerecht werden.

    Ausgehend von Grundbegriffen und elementaren Verfahren wendet sich das Buch zunächst den Standardverfahren der multiplen Regression und den Modellen der Varianzanalyse zu. Nichtlineare statistische Methoden, wie sie namentlich bei kategorialen Daten benötigt werden, und nichtparametrische Methoden zur Kurvenanpassung folgen. Besteht die Zielgröße aus mehreren korrelierten Variablen gleichzeitig, so gelangt man zu den multivariaten Verfahren, die eine außerordentliche Attraktivität in den ,,life sciences" erlangt haben: Manova, Diskriminanz-, Faktor- und Clusteranalyse. Das Buch schließt mit den Analysemethoden für Zeitreihen, die sowohl in der Ökologie als auch in der Ökonomie wachsende Bedeutung gewinnen.

    Jedes Verfahren wird durch Anwendungsbeispiele illustriert, die größeren real-wissenschaftlichen Fallstudien entnommen sind, sowie durch Programmcodes ergänzt, die in der Syntax der bekannten Statistikpakete Splus/R, SPSS oder SAS geschrieben sind.

    Anwendern in den oben genannten Gebieten, die mit komplexeren Auswertungsproblemen konfrontiert sind, und die bis zur Feinanalyse ihrer Daten vordringen wollen sowie Studenten und Dozenten in den Methodenwissenschaften (Mathematik, Statistik, Informatik) erhalten einen Einblick in die Fragestellungen und in die Lösungsangebote der Statistik und der sie unterstützenden Programmpakete.


    ISBN
    3-540-26006-4

    Register

    Index


    A

    Amplitudenspektrum 366
    - empirisches 368
    Anpassungstest 22, 24, 154
    AR(l)-Prozess 349
    AR(2)-Prozess 350
    AR(p)-Prozess 348
    als Regressionsmodell 356
    ARIMA(p, d, q)-Prozess 353
    ARMA(p, q)-Prozess 351
    - integrierter 353
    Aspin-Welch 30
    Austausch-Verfahren 306
    Autokorrelation 327
    - der Residuen 126, 361
    - empirische 37, 330, 355
    - partielle 327
    - partielle empirische 332
    Autokovarianz 326
    - empirische 329, 355
    autoregressiver Prozess 346


    B

    Bandbreite 210
    Bartlett 69
    Bartlettfenster 343
    Bestimmtheitsmaß 119
    Bestimmungsschlüssel 54
    Bestrafungsterm 218
    Bias 4, 212
    asymptotischer 214
    Binomialverteilung 3
    Bonferroni 49, 65, 240, 241, 331
    bootstrap 51
    Box-Jenkins 362
    Boxplot 17


    C

    Chi-Quadrat Verteilung 395
    Clusteranzahl 291
    Clusterbewertung 294
    Clusterverfahren
    - agglomerativ 297, 312
    - average-linkage 299
    centroid 299
    complete-linkage 298
    - divisiv 305
    - hierarchisch 296
    - hill-climbing 306
    - in Übergangsmatrix 314
    - in Kontingenztafel 309
    - k-means 307
    - nicht-hierarchisch 305
    - single-linkage 298
    - Ward 299
    Compound symmetry 85, 87
    Cramers V 46
    cross-product ratio 171
    cross-validation 221, 260


    D

    Danielfenster 343
    Dendrogramm 296
    Designmatrix 59
    Diskriminanzanalyse 249
    - schrittweise 263
    Diskriminanzfunktion 251, 254
    Diskriminanzgerade 250
    Diskriminanzkoeffizient 251, 255
    - standardisierter 251, 255
    Diskriminanzraum 254
    Diskriminanzscore 251, 254
    Distanzmaß
    - Euklidisch 292
    - Mahalanobis 292
    Distanzniveau 298
    Durbin-Watson 126, 361
    Durchschnitt gleitender 321


    E

    Erwartung bedingte 362
    Erwartungstreue 4
    - asymptotische 338, 345
    Extraktion eines Faktors 281


    F

    F-Test
    - der einfachen Kovarianzanalyse 139, 140
    - der einfachen Varianzanalyse 60
    - der Regressionsanalyse 109
    - der zweifachen Kovarianzanalyse 146
    - der zweifachen Varianzanalyse 74
    - partieller 110
    F-to-enter 111, 119, 263
    F-to-remove 120
    F-Verteilung 395
    Faktoranalyse 277
    Faktorladung 278
    - rotierte 285
    Faktormatrix 278
    Faktorscore 272, 287
    Faktorvariable 278
    Faktorwert 272, 287
    Fallstudie
    - Cotton 61, 70, 75, 79, 375
    - Hoeglwald 247, 383
    - Hohenpeissenberg 324, 332, 340, 368, 390
    - Insekten 91, 142, 147, 377
    - Laengs 267, 273, 277, 282, 286, 288, 385
    - Porphyr 57, 62, 66, 97, 376
    - Primaten 290, 300, 307, 387
    - Spessart 11, 14, 18, 21, 27, 32, 35, 41, 47, 53, 106, 111, 116, 122, 127, 135, 150, 157, 167, 187, 191, 196, 199, 214, 222, 371
    - Sunspot 322, 345, 358, 364, 392
    - Texte 206, 380
    - Toskana 231, 238, 242, 252, 261, 264, 382
    - VDLUFA 101, 393
    Verhalten 172, 176, 180, 394
    Fehler
    - Art 7, 19, 49
    - Art 7, 22
    Fenster 343
    Fisher 153, 259, 339
    Forecast-Formel 362
    Forecast-Funktion 361
    Fourierfrequenz 334
    Fourierkoeffizient 335
    Fouriertransformierte 328, 338, 342
    Frequenzanalyse 328
    Friedman 98
    Funktionalmatrix 200, 202


    G

    Gauß-Seidel Algorithmus 226
    Glättungsparameter 209, 218
    Grundgesamtheit 1
    Gruppeneffekte 59


    H

    Hatmatrix 219
    Hauptachse 270
    Haupteffekt 73, 183, 194, 244
    Hauptfaktor 271
    Hauptkomponente 270
    Hauptkomponentenanalyse 269
    Heterogenitätsmaß 293
    Histogramm 12
    homogenisierende Blöcke 98
    homogenisierende Variable 137
    Homoskedastizität 124
    Hotellings Spur 237
    Hypothese
    - der Isotropie 276
    - der Unabhängigkeit 46, 170
    - Einzelvariable 239
    - globale 60, 109, 235, 237
    - hierarchische 184
    - lineare 204
    - partielle 110, 255


    I

    Informationsmatrix 153, 162, 165
    Interpolationsspline 219
    iterative proportional fitting 175, 185


    K

    Kaiser-Normalisierung 285
    Kern 210
    Kernschätzer 211
    Klassifikationsfunktion 259
    Klassifikationsregel 252
    Klassifikationsscore 259
    Klassifikationstafel 154, 260
    Knotenstelle 215
    Kohärenzspektrum 367
    Kolmogorov-Smirnov 25
    Kommunalitäten 279
    Konfidenzintervall 8
    - asymptotisches 35, 51, 153, 163, 191, 195, 204, 213, 276, 331, 339, 345, 357 - bootstrap 52
    - für μ 20
    - für Regressionsgerade 39
    - für Regressionshyperebene 115
    - für Regressionskoeffizienten 115, 204
    - simultanes 40, 50, 63, 77, 89, 115, 138, 142, 240
    - simultanes asymptotisches 172, 179, 339
    Konfidenzniveau 8
    Konsistenz 5, 345
    Kontingenzkoefflzient 46
    Kontingenztafel 45
    - dreidimensionale 181
    - vierdimensionale 192
    - zweidimensionale 170
    Korrelationskoeffizient
    - multipler 132, 281
    - partieller 42, 111, 134
    - Pearson34
    - Spearman44
    Korrelationsmatrix 267, 271
    - reduzierte 279
    Korrelogramm 330
    Kovariable 42
    Kovarianz empirische 34
    Kovarianzanalyse 263
    - einfache 137
    - zweifach 140
    Kovarianzmatrix 269
    - within 235, 245, 250
    Kreisfrequenz 334
    Kreuzkorrelation 365
    - empirische 367
    Kreuzkovarianz 365
    - empirische 367
    Kreuzspektrum 366
    Kruskal-Wallis 95
    Kurvenschätzer 209


    L

    Lagfenster 342
    lateinisches Quadrat 84
    leave-out-one Methode 220, 260
    Levene 68
    leverage value 125
    Lilliefors-Quantil 26
    linearer Kontrast 63, 77, 89, 138, 142, 179, 240
    linearer Prozess 348
    log-Likelihood 152, 162, 164
    logistische Funktion 151
    Logitfunktion 151


    M

    MA( ∞)-Prozess 348
    MA(l)-Prozess 347
    MA(q)-Prozess 347
    Mahalanobis-Distanz 292
    Mann-Whitney 30
    MANOVA 231
    - einfache 233
    - zweifache 244
    Markov-Schema 349
    Matrix
    - between 235, 245, 293
    - total 235, 245, 293
    within 235, 245, 293
    Maximum-Likelihood 5

    mean squared error 60
    Median 13, 20
    Messreihe 1
    Minimum-Quadrat 5
    Mittelwert 16
    - adjustierter 137, 141
    - gestutzter 16
    Mittelwertkorrektur 354, 356
    Mittelwertvektor 234, 244
    Mittelwertvergleich
    multipler 66, 78, 90, 241
    ML-Methode 5, 282
    ML-Schätzer 5, 152, 163
    Modell
    - additives 222
    - generalisiertes lineares 149
    - grouped continuous 164
    - hierarchisches 183, 194
    - log-lineares 182, 193
    - Logit 194, 198
    - saturiertes 183, 193, 198
    - semiparametrisches 228
    Modell-Identifikation 360
    Monatswert 323
    moving average Prozess 346
    MQ-Methode 5, 38, 108, 133, 202, 355
    - penalisierte 218
    MQ-Schätzer 5, 60, 73, 203


    N

    N(0, 1)-Verteilung 395
    Newton Verfahren 203
    nichtlineares Modell 200, 202
    Nichtzentralitätsparameter 60
    normal probability plot 22, 125
    Normalgleichungen lineare 108
    nichtlineare 202
    Normalverteilung 2, 395
    - asymptotische 51, 213
    Normalverteilungs-Annahme 60, 109
    Nullhypothese 5


    P

    P-Wert 7, 396
    Paarvergleich simultaner 63, 77, 90, 96, 100, 138, 142, 180
    Parametermenge 4
    Partition 291
    Parzenfenster 343
    Periodogramm 337
    Perzentil 13
    - bootstrap 52
    Phasenspektrum 366
    - empirisches 368
    Plus-Funktion 216
    Polynom
    - Ausgleichs320
    - lokales 321
    Population 1
    Prädiktions-Wahrscheinlichkeit 153
    Prädiktionsvektor 219
    Prädiktionswert 38, 108, 203
    principal axis factoring 280
    Prognosefehler 361, 363
    Prognoseintervall 116, 363


    Q

    Quantil 395
    - empirisches 13
    Quartil 13
    Quartilabstand 16
    Quartimax-Rotation 285
    Quasi-Unabhängigkeit 174


    R

    Rangkorrelationskoeffizient 44
    Rangsumme 20, 31, 95, 99, 102
    Rangvarianzanalyse
    - einfache 94
    - zweifache 99, 102
    Rangzahl 13, 44
    Regel von Bishop 195
    Regel von Fisher 24
    Regression
    - binäre logistische 152
    - kumulative logistische 163
    - multikategorielle logistische 162
    - nichtlineare 200
    - nichtparametrische 209
    Regressionsanalyse
    - einfache 118
    - multiple 107
    - schrittweise 119
    Regressionsfunktion 209, 223
    Regressionsgerade 37
    Regressionskoeffizient 38, 108
    - innerhalb 137, 141
    - total 139
    Regressionsterm linearer 152, 161, 205
    Regressor 106
    repeated measurements 85
    Residuenanalyse 125, 360
    Residuenplot 125, 166
    Residuenzeitreihe 319
    Residuum 38, 108, 153, 166, 203, 354
    Responsefunktion 162
    Rotation 285
    Roy-Bose 241


    S

    s-m Plot 69
    Saisonkomponente 323
    Schätzer 4
    - bootstrap 51
    - Gasser-Müller 211
    - konsistenter 5, 342
    - Nadaraya-Watson 211
    Scheffe 40, 64, 77, 96, 115
    Schiefe 17
    Scorevektor 152, 162, 165
    Signifikanzniveau 5
    Signifikanztest 6

    smoothing Matrix 224
    smoothing Operator 223
    smoothing Parameter 218
    Spearman 44
    Spektraldichte 328
    Spektraldichteschätzer 342
    Spektralfenster 342
    Spektrum 328
    Spline kubischer 216
    Splineschätzer 218
    split-plot 85
    Spur W-Kriterium 294
    Standardabweichung 16
    Standardfehler 9, 114
    - approximativer 153, 165, 172, 179, 191, 195
    - bootstrap 52
    Stationaritätsbedingung 348
    Statistik beschreibende 1
    schließende 1
    - to-enter 155, 156, 263
    - to-remove 155, 205
    Stichprobe 1
    - bivariate 33
    - bootstrap 51
    - geordnete 13
    - gruppierte 24
    - multivariate 267
    - trivariate 42
    - verbundene 21, 98
    Stirlingsche Zahl 291
    Streuungszerlegung 61, 74, 83, 109, 139, 235
    Strukturelle Null 174
    Substitutionsprinzip 123, 265


    T

    t-Verteilung 395
    Test
    - Aspin-Welch 30
    - asymptotischer 51, 276
    - asymptotischer x2 46, 171, 178, 186
    - auf p (l) = 0 331
    - auf Linearität 130
    - auf Unabhangigkeit 46
    - auf unkorrelierte Zufallsreihen 367
    - auf Unkorreliertheit 35
    - auf Zufallsreihe 331, 339
    - Bartlett 69
    - des Regressionskoeffizienten 39
    - Durbin-Watson 126, 361
    - Ein-Stichproben t20
    - exakter 50
    - Friedman 99
    - goodness-of-fit 154
    - Hotellings Spur 237
    - K-S Normalverteilungs26
    - Kolmogorov-Smirnov 25
    - konditionaler log-LQ 186
    - Kruskal-Wallis 95
    - Levene 68
    - log-LQ 46, 155, 171, 178, 186
    - Mann-Whitney U31
    - Pearson x2 24
    - Pillai 237
    - Roy 237, 246
    - Score 156
    - simultaner 49, 239
    - simultaner asymptotischer 172, 180
    - verbundene Stichproben t21
    - Vorzeichen 100
    - Wald 156, 204
    - Wilcoxon Vorzeichen-Rang 20
    - Wilks' Λ 236, 246, 256, 263
    - Zwei-Stichproben Varianz 30
    Teststatistik 5 time lag 37, 326
    time lead 361
    Transformation
    - Fishers z35
    - varianzstabilisierende 69
    Transinformation 309, 315
    Trendbereinigung 322
    Trendkomponente 320
    truncation point 342
    Tukey 64, 77, 97


    U

    Unabhängigkeitshypothese 46, 170


    V

    Variablenselektion backward 120
    - best subset 121
    - forward 120
    Varianz
    - empirische 16
    - innerhalb 234
    - merkmalspezifische 278
    Varianzanalyse
    - dreifache 81
    - einfache 58
    - multivariate 231, 244
    - zweifache 72
    Varianzhomogenität 29, 59, 68
    Varianzkriterium 293, 299, 306
    Varianzschätzer bootstrap 52
    Varimax-Rotation 285
    Verteilungsfunktion empirische 14
    Verwerfungsbereich 5
    Verzerrung 4, 212


    W

    Wachstumsfunktion 201, 205
    Wechselwirkung 73, 75, 86, 183, 194, 244, 247
    Wilcoxon 20


    Y

    Yule-Schema 350
    Yule-Walker Gleichungen 349, 350
    - empirische 355


    Z

    Zackentest 320
    Zeitreihe
    - bivariate 365
    - differenzierte 352
    - integrierte 353
    - Komponenten 318
    - stationäre 326
    Zufallsreihe 319



    Reviews

    Aus den Rezensionen: "Der Text umfasst verschiedene wichtige Bereiche der Statistik. ... Dem Titel entsprechend integriert der Autor zudem Programmcode in den Text. Die Fallstudien werden im Anhang mit ... kurzer Erklärung vorgestellt und im Text an geeigneter Stelle als Anwendungsbeispiele angeführt. ... Jedoch erscheint ... für statistisch weniger vorgebildete Leser das Hinzuziehen eines eher spezialisierten und ausführlicheren Textes für die jeweils aktuelle Fragestellung angeraten." (R. Schlittgen, in: Zentralblatt MATH, 2006, Vol. 1080, S. 31) Aus den Rezensionen: ". ... Mit Hilfe von sehr anschaulichen Fallbeispielen gelingt es dem Autor, das sehr breite Methodenspektrum vertiefend und stets verständlich zu behandeln. ... Erwähnenswert sind die vorbildlich dokumentierten Fallstudien im Anhang. Jede Fallstudie wird kurz beschrieben, wobei auch auf die Urheber und weiterführende Literatur hingewiesen wird. ... kann ... uneingeschränkt empfohlen werden. Die Ausführungen sind präzise, sehr strukturiert, gut lesbar und werden durch zahlreiche Beispiele unterstützt. Zudem enthält das Buch einen umfassenden Schlagwortindex, es eignet sich daher nicht zuletzt auch aufgrund der klaren Strukturierung als gutes Nachschlagewerk ..." (Matthias Meyer, in: OR News Gesellschaft für Operations Research, 2006, S. 53f)