|
|
| |
|
| |
|
 |
|
| |
Christoph Draxler
Korpusbasierte Sprachverarbeitung
Eine Einführung
erschienen September 2008 281 Seiten, ca. 30 Abb., ca. 20 Tab., Paperback
Gunter Narr Verlag, A. Francke Verlag, Attempto Verlag | ISBN: 3823363948
| |  | 19.90 EUR |  | | |
|
|
|
|
| |
Innerhalb 24 Stunden versandfertig. Expressversand: In Deutschland versandkostenfrei | Österreich: 4 € | Schweiz: ab 4 € | Europaweit ab 6 €. Versandkostenübersicht weltweit. Alle Preise inkl. MwSt. |
|
|
Ähnliche Bücher anzeigen
|
|
|
| |
| |
| VORWORT | öffnen |
|
VorwortDas Münchner Institut für Phonetik und Sprachverarbeitung IPS ist in einer beneidenswerten Lage: institutionell eingebettet in die Geisteswissenschaften der LMU München, in regem akademischen Austausch mit der Computerlinguistik, Physik, Informatik, Elektrotechnik und der Neurolinguistik, und aktiv in der Kooperation mit der Industrie. Wie nur an wenigen Orten sonst in Deutschland kommen hier geistes- und naturwissenschaftliche Grundlagenforschung mit Technologieentwicklung zusammen, und ...
[weiter lesen]
|
|
|
| KLAPPENTEXT | öffnen |
|
Gesprochene Sprache steht im Fokus moderner sprachwissenschaftlicher Forschung und sprachtechnologischer Entwicklung. Das vorliegende Buch gibt eine systematische Einführung in die technischen Grundlagen und zeigt auf, wie, ausgehend von konkreten Forschungsfragen, Sprachdaten erhoben, annotiert, gewichtet und in Form von Sprachdatenbanken verfügbar gemacht werden. Ein besonderes Interesse gilt dabei innovativen web-basierten Verfahren, die es gestatten, im Feld oder Studio qualitativ hochwerti... [weiter lesen] |
|
|
| INHALTSVERZEICHNIS | öffnen |
Inhalt Vorwort 8 1 Einleitung 10 1 Sprachdatenbanken 12 2 Aufbau des Buches 22 3 Für wen ist dieses Buch?24 2 Grundlagen 25 1 Schwingungen 26 2 Signal 29 3 Spektrum 34 4 Digitalisierung 37 5 Zusammenfassung 40 6 Aufgaben 41 3 Gesprochene Sprache 42 1 Grundlagen gesprochener Sprache 44 2 Sprachlaute 47 3 Sprachlaut und Signal 55 4 Zusammenfassung 60 5 Aufgaben 63 4 Sprachsignale am Computer 64 1 Oszillogramm 64 2 Sonagramm 64 3 Weitere Signalarten 69 4 Aufgaben 80 5 Signaldaten 81 1 Dateiformate für Signaldaten 81 2 Datenkompression 88 3 Digitales Audio 93 4 Digitales Video 99 5 Aufgaben 109 6 Symbolische Daten 110 1 Implizite und explizite Strukturierung 110 2 Exkurs: Datenkonversion 117 3 XML 119 4 Datenbanksysteme 122 5 Weitere Software 128 6 Aufgaben 131 7 Aufnahmetechnik 132 1 Mikrofone 132 2 Aufnahmegeräte 143 3 Exkurs: Aufnahmekoffer 149 4 Räume 150 5 Aufnahmen im Feld 153 6 Aufnahmeverfahren 158 7 Einwilligung zu Aufnahmen 165 8 Exkurs: Sprecherdatenbank 168 9 Aufgaben 170 8 Annotation 171 1 Annotation von Sprachsignalen 173 2 Klassen von Annotationen 177 3 Annotationen in Sprachdatenbanken 178 4 Exkurs: Wie kriege ich die /bl 0 dan/ Zeichen in meinen Text?185 5 Annotationsmodell 189 6 Aufgaben 191 9 Erstellung von Sprachdatenbanken 192 1 Ein Beispiel vorab 192 2 Phasenmodell 193 3 Spezifikation 195 4 Vorbereitung 204 5 Datensammlung 211 6 Datenaufbereitung 215 7 Annotation 216 8 Dokumentation 218 9 Validierung 218 10 Distribution 220 11 Aufgaben 221 10 Die Sprachdatenbank Ph@ttSessionz 222 1 Ausgangslage 222 2 Die Vorläuferprojekte 224 3 Ph@ttSessionz Aufnahmespezifikation 226 4 Verarbeitung der Signaldaten 234 5 Ph@ttSessionz v. 1.0237 11 Wichtige Links 243 12 Checkliste 245 13 IPA Alphabet 252
[weiter lesen] |
|
|
|
|
| REGISTER | öffnen |
Index AA/D Wandler, 144, 147, 156 Abtastpunkt, 37, 189 Abtastrate, Samplerate, 37 Alphabet, 110 Amplitude, 27 Analysefenster - Dreiecksfenster, 65 - Hamming, 65 - Hanning, 65 - Kaiser, 65 Annotation, 174, 200, 230 automatisch, 176 - hierarchisch, 178 - manuell, 176 - Morphologie, 180 - netzwerkartig, 178 - Part of Speech, POS, 180 - phonemisch, 216 - Pragmatik, 180 - Prosodie, 180 - Semantik, 180 - Syntax, 180 Annotationsgraph, 189 Audio AAC, 97, 98 AC 3, 98 ATRAC, 97 - Codec, 95, 97 - digital, 93 - flac, 96-98 - MP 3, 97, 98 - Real-Audio, 97 - Shorten, 96 - Vorbis, 97, 98 Audio-Interface, 144 Audiodaten, 82 Audioformat, 93, 203 AIFF, 93 - SND, 93 - WAVE, 93 Audiokarte, 147 Aufnahmebuch, 98, 159, 209, 214 Aufnahmekoffer, 149, 228 Aufnahmeraum, 150, 205 Aufnahmeskript, 159, 197, 229 BBeobachtungszeitraum, 29 Betriebssystem, 81, 147, 188, 215 Bildgebende Verfahren, 70, 74 CCheckliste, 192, 211 Codec, 84, 91 Container format - AVI, 84 - MPEG-4, 84, 203 - Quick-Time, 84, 203 - Windows Media Format, 203 DDämpfung, 33 DAT, 98, 144 Datei - Austauschformat, 84, 121 - Binärdatei, 81, 84 - Containerformat, 84 - Format, 83 - Four Character Code, 86 - gemischt, 81 - hierarchisch, 82 - Import, Export, 84 - interleaving, 83 - Magic Number, 86 - Zugriff, 81 Dateiextension, 85 Dateiformat, 81, 84, 202 - BPF, 110, 117 DTD, 120, 203 - ISO 9660, 85 - NIST Sphere, 93 - PDF, 203 - SWF, 114 - Text, 116, 203 - Text-Grid, 118 - XML, 203 Dateiname - nummerisch, 202 - semantisch, 202 Dateisystem, 81, 94, 144, 217 Datenbank - Abfrage, 125, 174 Datendefinition, 124 Datenbanksystem, 122, 217 Datenformat, 202 Datenmodellierung, 122, 189 - ER-Diagramm, 122 Datenrate, 40, 71, 87, 88, 95, 96, 100, 101, 147, 231 Datensatz, 110 Datenschutz, 198 Datensicherung, 205 - rollierend, 206 Datenstrom, 82 Dezibel, dB, 31 Dialogsystem, 197 Digitale Recorder, 144 Digitalisierung, 37 Dokumenttypdefinition (DTD), 119, 203 Dynamik, 31 EEchtzeitfaktor, 14 Editieren, 104 Einstrahlung, 213 Einverständniserklärung, 166, 208, 213, 227 Elektromagnet. Artikulographie, 72, 197, 214 Elektropalatographie, 72, 197 Elision, 182 Emu, 117, 118 Energie, 30 - root mean square, 30 Evaluation, 156, 219 Experiment-Situation, 196 FFeldaufnahme, 153 Filter, 34, 36 - Bandpassfilter, 36, 96 - Hochpassfilter, 36 - ideale, 36 - Tiefpassfilter, 36 flac, 231 Formanten, 47 Formantkarte, 49 Forum, 129, 210, 218, 220 Fourier-Transformation, 27 Frequenz, 29 Frequenzbereich, 34, 43 GGesprächsanalyse, 157 Gesprochene Sprache, 42 Glyphe, 114 Grenzfrequenz, 36 Grundfrequenz, 30, 69 HHäsitation, 181, 235 Harmonische, 30 Headset, 136 Hertz, Hz, 29 Hidden Markov Toolkit, 83 HTML, 110 Hyperlink, 113, 119 Iiconv, 118 Interview, 155 IPA Alphabet, 179, 181, 184 ISO-8859, 91, 114, 118 JJava, 83, 229 - Audiobibliothek, 232 - Audiobibliothek, 83 JPEG, 101 KKabel, 140 - Fire-Wire, IEEE 1394, iLInk, 147 Koaxialkabel, 142 - optische, 142 - USB, 144, 147 Kategorisierung, 171 - analytisch, 171 - empirisch, 171-173 Klirrfaktor, 133 Kodierung, 115 Kommunikationsprotokoll - S/PDIF, 143 Kompression, 88 - Bewegungskompensation, 101 - Differenzverfahren, 101 - Einzelbildkompression, 101 - gzip, 91, 98 - Huffman-Kodierung, 89, 96 Kompressionsrate, 89 - LZW (Liv-Zempel-Welch), 89 - RLE (run length encoding), 89, 96 - verlustbehaftet, 75, 91 - verlustfrei, 88, 90, 231 Kopierschutz, 97 LLaptop, 98 Laryngographie, 71 Laryngoskopie, 75, 214 Lexikon, 220 Lizenz, 203 Luftdruck, 42 MMagnetresonanz-Aufnahmen, 76 MapTask, 154 Meilenstein, 194, 195, 219 Metadaten, 13 Mikrofon, 132, 200 - Übertragungfunkt ion, 133 - Ansteckmikrofon, 137, 155 - dielektrisch, 133 - Elektretmikrofon, 133 - elektro-dynamisch, 133 - Frequenzgang, 133 - Lavalier-Mikrofon, 137 Mausmikrofon, 140, 157 - Nahbesprechung, 136 - Nahbesprechungsmikrofon , 157 - piezoelektrisch, 132 - Raummikrofon, 139 - Reportagemikrofon, 138, 155 - Richtcharakteristik, 134 - Studiomikrofon, 138 Mikrofonarray, 135 MIMB-Type, 86
[weiter lesen] |
|
|
|
|
|
|