Erhalten Sie Zugang zu diesem und mehr als 300000 Büchern ab EUR 5,99 monatlich.
Dieses Buch gibt Spanischstudierenden ein zugängliches und zugleich anspruchsvolles Grundlagenwerk zur Lautlehre ihres Studienfachs an die Hand. Es verknüpft bewährtes Basiswissen mit neueren theoretischen Ansätzen (u. a. Merkmalsgeometrie, Optimalitätstheorie, Autosegmentale Phonologie) und führt in den Umgang mit der Sprachanalysesoftware Praat ein. Ein Schwerpunkt liegt auf prosodischen Phänomenen wie Silbe, Akzent, Rhythmus und Intonation. Europäische und amerikanische Varietäten erfahren dabei eine gleichberechtigte Darstellung. Vergleiche mit anderen romanischen Sprachen und dem Deutschen ermöglichen vertiefte Einblicke in die lautlichen Strukturen. Die Neuauflage wurde um ein Kapitel zum Sprachkontakt erweitert, das neben unterschiedlichen Kontaktsituationen in Amerika und Europa auch das Spanische als Herkunftssprache (USA, Deutschland) und als Fremdsprache in den Blick nimmt.
Sie lesen das E-Book in den Legimi-Apps auf:
Seitenzahl: 986
Veröffentlichungsjahr: 2025
Das E-Book (TTS) können Sie hören im Abo „Legimi Premium” in Legimi-Apps auf:
Christoph Gabriel / Trudel Meisenburg
Spanisch: Phonetik und Phonologie
Eine Einführung
DOI: https://doi.org/10.24053/9783381100125
© 2025 • Narr Francke Attempto Verlag GmbH + Co. KGDischingerweg 5 • D-72070 Tübingen
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen.
Alle Informationen in diesem Buch wurden mit großer Sorgfalt erstellt. Fehler können dennoch nicht völlig ausgeschlossen werden. Weder Verlag noch Autor:innen oder Herausgeber:innen übernehmen deshalb eine Gewährleistung für die Korrektheit des Inhaltes und haften nicht für fehlerhafte Angaben und deren Folgen. Diese Publikation enthält gegebenenfalls Links zu externen Inhalten Dritter, auf die weder Verlag noch Autor:innen oder Herausgeber:innen Einfluss haben. Für die Inhalte der verlinkten Seiten sind stets die jeweiligen Anbieter oder Betreibenden der Seiten verantwortlich.
Internet: www.narr.deeMail: [email protected]
ISSN 0941-8105
ISBN 978-3-381-10011-8 (Print)
ISBN 978-3-381-10013-2 (ePub)
Unser Lehrbuch wendet sich in erster Linie an Studierende des Spanischen und gibt ihnen ein zugängliches und zugleich anspruchsvolles Grundlagenwerk zur Lautlehre ihres Studienfachs an die Hand. Ziel ist es hierbei, bewährtes Grundlagenwissen zur Phonetik und Phonologie des Spanischen mit aktuellen Methoden phonetischer Datenanalyse und neueren Ansätzen phonologischer Theoriebildung wie der Merkmalsgeometrie, der Optimalitätstheorie und dem Autosegmental-Metrischen Modell der Intonationsforschung zu verknüpfen. Ein besonderer Schwerpunkt liegt dabei auf prosodischen Phänomenen wie Silbe, Akzent, Rhythmus und Intonation. Eingeführt wird zudem in den Umgang mit der Sprachanalysesoftware Praat.
Aufbauend auf in der universitären Lehre erprobten Konzepten haben wir eine Darstellungsweise angestrebt, die für Studienanfänger nach dem Absolvieren eines Einführungskurses in die Romanische oder Spanische Sprachwissenschaft zugänglich ist, zugleich aber die Nutzung des Bandes für Fortgeschrittene, etwa zur Wiederholung bei der Prüfungsvorbereitung, ermöglicht. Das Spanische wird hierbei nicht als homogene Sprache aufgefasst; die Aussprache amerikanischer und europäischer Varietäten erfährt vielmehr eine gleichberechtigte Darstellung. Bei der Transkription orientieren wir uns am Verbreitungsgrad der Realisierungsvarianten und notieren entsprechend dem zahlenmäßigen Überwiegen der seseo-Varietäten bei caza ‘Jagd’, cerrar ‘schließen’ etc. durchgehend den alveolaren Frikativ /s/, also [ˈkasa], [seˈraɾ]. Ein weiteres Anliegen besteht darin, das Spanische nicht isoliert zu betrachten. Zu diesem Zwecke stellen wir Vergleiche mit anderen romanischen und nichtromanischen Sprachen an, wobei der Kontrastierung mit dem Deutschen ein besonderes Gewicht zukommt.
Internetquellen sind nicht mit dem Datum des letzten Abrufs versehen; wir haben alle Links jedoch unmittelbar vor Drucklegung auf ihre Korrektheit hin überprüft.
Einführende Werke lassen sich nicht verwirklichen, ohne die Adressaten mit einzubeziehen. So konnten wir auch beim Verfassen des vorliegenden Bands von kritischen und konstruktiven Beiträgen und Fragen von studentischer Seite profitieren. Dafür sind wir sehr dankbar. Unser Dank gilt auch all denjenigen, die uns bei der Durchsicht des Manuskripts, beim Korrekturlesen sowie beim Erstellen der Übungsaufgaben, des Literaturverzeichnisses und des Registers Hilfestellung geleistet haben. Zu nennen ist hier in erster Linie Carolin Buthke, der wir für ihre umfassende Unterstützung zu großem Dank verpflichtet sind. Weiterhin bedanken wir uns bei Ariadna Benet, Jonas Grünke, Kathrin Kraller, Manuela Kühnle, Henning Mittag, Nils Netz, Annika Reuwand, Julia Rieck, Rafèu Sichel-Bazin und Franziska Stuntebeck. Nicht zuletzt danken wir Kathrin Heyng für die kompetente verlagsseitige Betreuung der Veröffentlichung und dem Narr-Verlag (Tübingen) für die Aufnahme des Bandes in die Reihe narr studienbücher.
Hamburg, Osnabrück und Regensburg, im April 2013
Christoph Gabriel, Trudel Meisenburg und Maria Selig
Seit dem Erscheinen unseres Lehrbuchs Spanisch: Phonetik und Phonologie. Eine Einführung vor mehr als zehn Jahren ist in zahlreichen Lehrveranstaltungen damit gearbeitet worden; zudem sind zwei Rezensionen erschienen (Elissa Pustka 2015, Romanische Forschungen 127: 411–413; Carolin Patzelt 2015, Zeitschrift für romanische Philologie 131: 1106–1113). Beide haben konstruktive Kritik geübt, die wir im Rahmen der Überarbeitung gerne aufgegriffen haben. Die beständige Weiterentwicklung des Forschungsgebiets hat zudem dazu geführt, dass die hier vorgelegte Neuauflage nicht nur in Bezug auf in den vergangenen zehn Jahren erschienene Literatur aktualisiert, sondern auch in inhaltlicher Hinsicht erweitert wurde. So wurde das Kapitel zum Sprachrhythmus um einen Abschnitt zum sog. Kontroll- und Kompensationsindex ergänzt (4.4.2). Neu hinzugekommen ist das fünfte Kapitel, in dem wir unterschiedliche Szenarien des Sprachkontakts behandeln und neben dem lautlichen Einfluss anderer Sprachen auf das Spanische in mehrsprachigen Gebieten (u. a. Mexiko, Andenraum, Paraguay, Katalonien, Baskenland, Galicien; vgl. 5.1) auch das Spanische als Herkunftssprache und Diasporavarietät (5.2) und als Fremdsprache (5.3) in den Blick nehmen.
Für inhaltliche Anmerkungen und Hinweise auf Errata, die wir gerne korrigiert haben, danken wir Jonas Grünke (Mainz). Bei Bistra Andreeva (Saarbrücken/Sofia) und Svenja Lippmann (Mainz) bedanken wir uns für ihre Mithilfe bei Recherchearbeiten. Für die umsichtige Hilfe bei der Aktualisierung der Literaturliste und bei den Schlusskorrekturen sind wir Birgitta Pees (Mainz) zu großem Dank verpflichtet. Schließlich bedanken wir uns herzlich bei Kathrin Heyng für die gewohnt kompetente verlagsseitige Betreuung des Projekts. Wie bei der Erstauflage wurden alle Links vor der Drucklegung auf ihre Korrektheit überprüft; sie sind deshalb nicht mit dem Datum des letzten Abrufs versehen.
Mainz, Berlin/Osnabrück und Regensburg, im Juni 2024
Christoph Gabriel, Trudel Meisenburg und Maria Selig
In einem Laden, den er nie zuvor betreten hat, richtet ein Kunde – nennen wir ihn Juan – folgende Frage an die Verkäuferin: ¿Tiene mandarinas? ‘Haben Sie Mandarinen?’. Die Antwort kommt prompt: ¡Claro que sí! ‘Ja, klar’. Diese kurze verbale Interaktion ist ein alltäglicher Kommunikationsvorgang, der in ähnlicher Form immer wieder stattfinden kann: Ein Kunde hat mittels sprachlicher Zeichen einer Verkäuferin mitgeteilt, dass er eine bestimmte Obstsorte sucht (vermutlich, um sie zu kaufen); die Verkäuferin signalisiert ihm, wiederum mit sprachlichen Zeichen, dass sie ihm diese Obstsorte selbstverständlich anbieten kann. Sie hätte auch wortlos auf die Kiste mit Mandarinen deuten können, die der Kunde offensichtlich übersehen hat. Damit wäre zwar das Informationsbedürfnis des Fragenden erfüllt gewesen, doch hätte er vielleicht den Laden verlassen, ohne Mandarinen zu kaufen, und die Interaktion wäre erfolglos geblieben.
Alltägliche Gesprächssituationen wie diese scheinen auf den ersten Blick kaum der Rede wert zu sein: Warum soll man auch über eine kommunikative Routine nachdenken, die doch ohne weiteres Überlegen tagtäglich funktioniert? Eine solche Sichtweise ist als Alltagsperspektive durchaus sinnvoll, denn würden wir stets darüber reflektieren, was genau wir sagen wollen und wie wir es ausdrücken, kämen wir vor lauter Nachdenken vermutlich kaum zum Sprechen. Aus wissenschaftlicher Perspektive ist der kleine Verkaufsdialog jedoch unter unterschiedlichen Aspekten interessant: Man kann ihn inhaltlich-strategisch analysieren und sich z. B. fragen, warum die sprachliche Reaktion der Verkäuferin angemessener ist als eine rein gestische, und ihn als einen bestimmten Typus sozialer Interaktion betrachten. Man kann jedoch auch speziell die von den Gesprächspartnern genutzten sprachlichen Verfahren in den Blick nehmen und diese in Bezug auf Textkohärenz, Satzbau, Wortwahl und Aussprache untersuchen. Mit den lautsprachlichen Aspekten der Kommunikation befassen sich Phonetik und Phonologie, zwei sprachwissenschaftliche Teildisziplinen, die auch mit dem Terminus Lautlehre zusammengefasst werden. Die Tonaufnahme eines solchen Gesprächs dient dann als Datengrundlage zur Untersuchung der Regeln und Gesetzmäßigkeiten, die die Lautseite sprachlicher Zeichen in der verwendeten Sprache – hier im Spanischen – bestimmen. Außerhalb des Untersuchungsbereichs der Lautlehre liegen dagegen alle Ausdrucksformen, die nicht lautsprachlich sind: So wird das uns alltäglich geläufige Nebeneinander von Sprechen und Schreiben (und Hören und Lesen) weitgehend ausgeblendet. Dies ist eine berechtigte Einschränkung, denn sofern keine Beeinträchtigung des Hörvermögens vorliegt, ist die Lautsprache unsere grundlegende Ausdrucks- und Kommunikationsform, und auch beim Erwerb der Muttersprache (L1) werden wir zuerst mit der Lautseite von Sprache konfrontiert.
Wie erklärt sich die Aufteilung der Lautlehre in die beiden Subdisziplinen Phonetik und Phonologie? Die Trennung geht zurück auf Nikolaus Sergejewitsch Trubetzkoy (Николай Сергеевич Трубецкой, wiss. Transliterierung: Nikolaj Sergeevič Trubeckoj; 1890–1938). Dieser bezog sich in seinen 1939 erschienenen Grundzügen der Phonologie (Trubetzkoy 1939/71989) auf Ferdinand de Saussure (1857–1913), der in seinem Cours de linguistique générale (Saussure 1916/2013) vorgeschlagen hatte, zwischen der konkreten Sprachverwendung, der sog. parole, und dem ihr zugrundeliegenden Sprachsystem, der langue, zu differenzieren. Wissenschaftlicher Untersuchungsgegenstand ist nach Saussure ausschließlich die langue, verstanden als die Gesamtheit der Regularitäten, die für alle Mitglieder einer Sprachgemeinschaft gelten und die deren sprachliches Wissen ausmachen. Die parole hingegen sei lediglich insofern von Interesse, als man ausgehend von konkret produzierter Sprache auf die Beschaffenheit des Systems schließen könne. Trubetzkoy übernahm diese Unterscheidung und wandte sie auf den lautsprachlichen Bereich an: Die Phonetik solle sich mit der parole beschäftigen und mittels naturwissenschaftlicher Methoden die konkreten physikalischen und physiologischen Ereignisse des lautsprachlichen Kommunikationsakts untersuchen. Gegenstand der Phonologie sei hingegen die langue, die der Vielfalt der in einer Sprachgemeinschaft realisierten Lautformen als geordnetes System von Einheiten und Regeln gegenübersteht (vgl. Trubetzkoy 1939/71989: 6). Die Trennung zweier lautbezogener linguistischer Disziplinen führte in der Folgezeit dazu, dass naturwissenschaftlich ausgerichtete Phonetiker einerseits und geistes- bzw. kognitionswissenschaftlich orientierte Phonologen andererseits teilweise getrennt voneinander arbeiteten. Für Trubetzkoy waren beide Disziplinen jedoch untrennbar miteinander verbunden, da die Einheiten und Regeln, die das System konstituieren, aus konkreten Lautungen abgeleitet sind und nur unter Rückgriff auf diese erfasst und verstanden werden können.
Phonetik und Phonologie untersuchen die lautlichen Aspekte sprachlicher Kommunikation. Als experimentelle Wissenschaft widmet sich die Phonetik den physikalischen und physiologischen Prozessen lautsprachlicher Kommunikation. Die Phonologie arbeitet das System- und Regelhafte der Lautsprache heraus und sucht, dies modellhaft zu erfassen.
Neben dem rein wissenschaftlichen Erkenntnisinteresse lassen sich für die lautsprachliche Forschung anwendungsbezogene Bereiche benennen. Einer davon ist die Verbesserung der Lerneraussprache im FremdsprachenunterrichtZweitspracherwerb, wozu vertiefte Kenntnisse der artikulatorischen und auditorisch-perzeptiven Grundlagen der Lautsprache notwendig sind (vgl. 5.3). Dies gilt auch für die Bereiche Sprecherziehung und Logopädie, die auf Optimierung der artikulatorischen Fähigkeiten bzw. auf die Behandlung physisch oder psychisch bedingter Schwierigkeiten beim Sprechen abzielen (vgl. Lauer & Birner-Janusch 2007, Fiukowski 82010). Auch die Therapiemaßnahmen bei Aphasie, d. h. beim pathologisch bedingten Verlust der Sprachfähigkeit, nutzen die Erkenntnisse über die physiologischen und neuronalen Prozesse, die sich beim Sprechen und bei der Sprachwahrnehmung vollziehen (vgl. Lutz 32004, Bauer & Auer 2008). Weitere Anwendungsbereiche liegen in der forensischen Phonetikforensische Phonetik, die mit vorwiegend kriminologischer Zielsetzung technische Verfahren zur Identifizierung von Stimmen entwickelt (vgl. Jessen 2012), sowie in den Bereichen SpracherkennungSpracherkennung und SprachsyntheseSprachsynthese (vgl. Fellbaum 22013).
Wie jede wissenschaftliche Disziplin befassen sich Phonetik und Phonologie mit ausgewählten Aspekten eines komplexen Geschehens. Die Konzentration auf die lautliche Seite sprachlicher Kommunikation zielt auf das Allgemeine; bei konkreten Kommunikationsereignissen werden daher individuelle und pragmatische Aspekte (wer spricht wann und wo mit wem weshalb worüber?) ausgeblendet. Abstrahiert wird von der Tatsache, dass lautsprachliche Zeichen von Situation zu Situation nie in völlig identischer Form produziert werden, auch nicht, wenn es sich um ein und denselben Sprecher handelt. Dies ist für die Kommunikation auch nicht weiter schlimm, denn die Hörer blenden kleinere Abweichungen, die die Kommunikation nicht stören, automatisch aus. So ist es z. B. unerheblich, ob ein Sprecher des Spanischen den betonten Vokal im Wort pomo ‘Frucht’, der in offenen (d. h. auf einen Vokal endenden) Silben normalerweise als geschlossenes [o]1 wie in dt. Ofen ausgesprochen wird, etwas offener realisiert und einen Laut produziert, der eher dem [ɔ] wie in dt. offen entspricht (zur Aussprache des spanischen o in unterschiedlichen lautlichen Umgebungen vgl. genauer 2.5.3.1). Die Hörer werden trotzdem pomo ‘Frucht’ verstehen, nicht zuletzt deshalb, weil es im Spanischen keine Wortpaare gibt, die sich nur durch den Kontrast zwischen offenem und geschlossenem o unterscheiden. Dies ist im Deutschen anders (vgl. unser Beispiel [ˈoːfən] Ofen vs. [ˈɔfən] offen), ebenso im Französischen (z. B. [pom] paume ‘Handfläche’ vs. [pɔm] pomme ‘Apfel’).2 Lautliche Variabilität kann aber auch Information vermitteln, die den Hörern ermöglicht, Sprecher in Bezug auf ihre geographische Herkunft einzuordnen. Realisiert jemand z. B. in Wörtern wie calle ‘Straße’ und yo ‘ich’ den Laut [ʃ] (der der deutschen sch-Ausspracheentspricht)oder [ʒ] wie im Anlaut von Jalousie, d. h. [ˈkaʃe]/[ˈkaʒe] bzw. [ʃo]/[ʒo], so können andere Spanischsprachige daraus schließen, dass sie es mit einem Sprecher aus dem Río de la Plata-Raum (Argentinien, Uruguay) zu tun haben,wo der sog. šeísmo/žeísmo(vgl. 2.5.1.2) fester Bestandteil der regionalen Aussprache ist.
Aber nicht nur die regionale Zugehörigkeit von Sprechern, sondern auch die spezifischen Kontextbedingungen beeinflussen die lautsprachliche Kommunikation. Dies zeigt der Vergleich zwischen der informellen, spontanen Alltagskommunikation unter vertrauten Gesprächspartnern und dem kontrollierten, reflektierten Sprechen in öffentlichen Situationen oder auch beim Vorlesen. Wenn wir uns mit Freunden unterhalten, sind Schnellsprechformen, eine weniger sorgfältige Artikulation sowie häufige Pausen und Wiederholungen normal; es handelt sich dabei um typische Kennzeichen spontanen, ungeplanten Sprechens. Beim Sprechen in offiziellen Kontexten und beim Vorlesen artikulieren wir dagegen sorgfältiger und setzen gegebenenfalls Intonation (Sprachmelodie), Lautstärke und Sprechgeschwindigkeit bewusst zur stilistischen Gestaltung ein. Beim Vorlesen treten i. d. R. auch weniger sog. SprechunflüssigkeitenSprechunflüssigkeit (engl. speech disfluencies, sp. disfluencias del habla) auf, da wir bei dieser Form des Sprechens nicht zugleich formulieren müssen. Um derartige situationsbedingte Unterschiede angemessen zu berücksichtigen, untersucht man in der neueren Forschung unterschiedliche Datentypen (spontane Interaktion im freien Gespräch, im Labor erhobene Semi-Spontandaten, Leseaussprache etc.) und arbeitet die entsprechenden lautlichen Unterschiede heraus (vgl. 4.5.4 zur Datenanalyse speziell in der Intonationsforschung).
Der (sprachliche und außersprachliche) Kontext ist auch insofern wichtig, als er wesentlich zum Gelingen sprachlicher Kommunikation beiträgt: Wenn wir miteinander sprechen, beruht unsere Verständigung nicht ausschließlich auf der Information, die die sprachlichen Zeichen ausdrücken. Vielmehr bringen die Kommunikationspartner Vorwissen mit, auf das sie im Gespräch aufbauen können. Dies gilt auch in lautlicher Hinsicht: Sehr häufige Wörter können wir z. B. nachlässig artikulieren und etwa Auslautsilben verschleifen oder weglassen, weil ihr häufiger Gebrauch dazu beiträgt, dass sie von den Hörern auch in reduzierter Form erkannt werden. Wir wissen zudem aus Erfahrung, welche Wörter häufig mit bestimmten anderen Wörtern in der Redekette auftreten, und wir können das Wissen um diese Kombinatorik beim Sprachverstehen nutzen (vgl. 2.4.2). Weiterhin sind für das Sprachverstehen auch visuell wahrnehmbare Informationen relevant, denn außer beim Telefonieren nutzen die Gesprächspartner i. d. R. redebegleitende Gesten, Blickkontakt, mimische Veränderungen und Körperhaltung, um das auszudrücken, was sie mitteilen wollen. Diese Multimedialität der Kommunikation wird deutlich, wenn wir die Mitschrift eines spontanen Gesprächs unter Freunden lesen: Ohne Angaben zu den visuell wahrnehmbaren Ausdrucksverfahren ist dessen Inhalt oft nur schwer zu verstehen. Grundsätzlich ist nicht nur relevant, was gesagt wird, sondern auch, wie es gesagt wird. Zusätzlich zu den bereits erwähnten nichtsprachlichen Mitteln setzen wir auch sog. parasprachlicheparasprachliche Funktion (< agr. παρά pará ‘dabei, neben’) Mittel ein, d. h. solche, die an Lautsprache gebunden sind, aber über die inhaltliche Informationsvermittlung hinausgehen: So können z. B. Stimmqualität und Lautstärke Emotionen vermitteln oder über die Einstellung des Sprechers zum besprochenen Sachverhalt Auskunft geben.
Die Mehrdimensionalität sprachlicher Kommunikation zeigt sich auch in den unterschiedlichen Funktionen unserer Fähigkeit, Schall zu produzieren und durch unseren Artikulationsapparat zu manipulieren. Wir haben bereits auf sprecherbezogene Informationen hingewiesen, die wir z. B. durch die Verwendung regionaler Aussprachevarianten erhalten. Man spricht hier von der indexikalischen Funktionindexikalische Funktion lautsprachlicher Phänomene, da sie uns zu Schlüssen auf die Herkunft, die soziale Stellung oder den Charakter des Sprechers veranlassen und unser Verhalten ihm gegenüber bestimmen können. Derartige Stereotype mögen zwar klischeehaft sein, sie sind jedoch konventionalisiert und damit Untersuchungsgegenstand einer an sozialen Normen orientierten Linguistik. Indexikalisch ist auch die Stimmqualität: Sie erlaubt uns nicht nur das Wiedererkennen individueller Sprecher, sondern lässt uns auch auf Persönlichkeitstypen wie ‘energisch’, ‘arrogant’, ‘vulgär’ etc. schließen, und zwar unabhängig davon, ob ein Sprecher bewusst zu dieser Stilisierung greift oder nicht.
Lautsprachliche Phänomene wie Sprechtempo, (absolute) Tonhöhe, Lautstärke oder Sorgfalt der Artikulation haben keine bedeutungsunterscheidende Funktion: Man kann ein Wort schnell oder langsam, laut oder leise, auf hohem oder tiefem Tonniveau aussprechen – die Wortbedeutung bleibt unverändert. Wie bereits erwähnt, kommt solchen parasprachlichen Phänomenen aber eine expressive Funktionexpressive Funktion zu, denn sie können Emotionen wie Verwunderung, Zweifel, Empörung, Begeisterung etc. ausdrücken. Hierbei handelt es sich oftmals um konventionalisierte Muster, die mit typisierten Emotionen verbunden in unserem Regelwissen inventarisiert sind.
Hinzu kommt die regulative Funktionregulative Funktion von Sprechtempo, Lautstärke, Pausensetzung und Intonation, die zusammen mit nichtsprachlichen Mitteln den Sprecherwechsel (engl. turn taking) in der Kommunikation regelt. Dass diese Funktion lautsprachlicher Phänomene lange Zeit wenig beachtet wurde, liegt u. a. am bis weit ins 20. Jahrhundert unangefochtenen Primat des Geschriebenen in der sprachwissenschaftlichen Forschung: In geschriebener Sprache stellt sich die Frage, wer als nächster das Wort ergreift, schlichtweg nicht; nur in der spontanen Interaktion muss der Sprecherwechsel im Gespräch selbst geregelt werden. Auch kann man spontane Gespräche erst analysieren, seit sie mithilfe akustischer Speicher- und Wiedergabemedien aufgezeichnet und unbeschränkt wiederholt werden können. Erst allmählich erkennt man, dass bestimmte Phänomene wie etwa das Verlangsamen oder Beschleunigen des Sprechtempos oder die Veränderungen der Lautstärke nicht nur sprecherindividuell und/oder zufällig sind, sondern auf sozial verbindliche Normen zurückgehen und als Verfahren der Gesprächsregulierung eingesetzt werden.
Die wichtigste Aufgabe unserer Fähigkeit, Schall zu manipulieren und zu verändern, ist es aber, eine Unzahl von diskreten, d. h. klar voneinander zu unterscheidenden lautlichen Zeichenaußenseiten als Basis sprachlicher Kommunikation zu erzeugen. Diese bedeutungsunterscheidende oder -differenzierendebedeutungsdifferenzierend Funktion ist ein zentraler Gegenstand phonologischer Forschung, v. a. in der strukturalistischen Phonologie, die die Suche nach solchen phonologisch distinktiven Merkmalen im Lautkontinuum zu ihrer Hauptaufgabe gemacht hat.
Unsere Fähigkeit zu artikulieren können wir dazu einsetzen, lautlich diskrete Zeichenformen zu schaffen. Die bedeutungsunterscheidende Funktion ist zentral für die sprachliche Kommunikation und steht im Mittelpunkt phonologischer Forschung; daneben können lautsprachliche Merkmale indexikalische, expressive und regulative Funktionen übernehmen. Für deren Analyse muss die kontextuelle Einbettung der Kommunikation berücksichtigt werden.
Wenn wir die Lautfolge [ʃtuːl] Stuhl äußern, wollen wir die Vorstellung eines bestimmten Sitzmöbels (mit Rückenlehne, für eine Person, meist ungepolstert) evozieren. Sagen wir dagegen [bɛt] Bett, meinen wir ein Möbelstück, das zum Schlafen gedacht ist, und produzieren wir die Lautkette [ʃtaːl] Stahl, beziehen wir uns auf etwas ganz anderes, nämlich eine metallische Legierung, die hauptsächlich aus Eisen besteht. Unsere Fähigkeit, verschiedene Sprachlaute zu äußern, nutzen wir, um unterschiedliche lautliche Zeichenaußenseiten (Signifikanten) zu produzieren, die es uns erlauben, etwas so zu bezeichnen, dass es als das Gemeinte erkennbar wird. Nun umfasst der Wortschatz einer Sprachgemeinschaft etwa 300.000 verschiedene Einheiten, ein gebildeter Sprecher kennt davon etwa 75.000 und benutzt regelmäßig etwa 30.000. Wie schaffen wir es, für die Vielfalt der zu unterscheidenden Konzepte hinreichend viele diskrete Zeichenaußenseiten zu finden?
Der Vergleich der drei zitierten Wörter zeigt, dass wir dabei unterschiedlich vorgehen. Im Falle von [ʃtuːl] und [bɛt] handelt es sich um Signifikanten, die keine lautliche Ähnlichkeit miteinander haben (außer dass es sich jeweils um einsilbige Wörter handelt, die mit einem Konsonanten beginnen und auch auf einen enden). Man sagt, dass sie, lautlich gesehen, maximal different sind. Dies ist ein ‘sicheres’ Verfahren zur Differenzierung, da kaum eine Verwechslungsmöglichkeit zwischen den beiden Signifikanten besteht. Die Gegenüberstellung von [ʃtuːl] und [ʃtaːl] zeigt jedoch, dass der lautliche Unterschied auch auf eine präzise Stelle beschränkt sein kann. In diesem Fall sagt man, dass die jeweiligen Wörter ein MinimalpaarMinimalpaar bilden und sich nur in einem bedeutungsdifferenzierenden Segment, hier dem Vokal u bzw. a, unterscheiden. Wie wir noch genauer erläutern werden (vgl. 3.1.1), nennt man die bedeutungsunterscheidenden Lautsegmente PhonemePhonem und setzt sie zwischen Schrägstriche: /u/vs. /a/. Den gleichen Kontrast finden wir auch in anderen Wortpaaren, z. B. bei [fuːʁə] Fuhre und [faːʁə] (ich) fahre. Dieses Minimalpaar können wir zum Ausgangspunkt nehmen, um an weiteren Stellen in der Lautkette nach bedeutungsdifferenzierenden Segmenten zu suchen und z. B. den Vokal in [fuːʁə] mit dem in [fiːʁə] viere zu kontrastieren, woraus sich das Phonempaar /u/vs. /i/ ableiten lässt. In einem nächsten Schritt kann man den Anlautkonsonanten von [fiːʁə] dem von [tiːʁə] Tiere gegenüberstellen, woraus der phonemische Kontrast /f/vs./t/ resultiert. Das schrittweise Überprüfen lautlicher Signifikanten zeigt uns, dass diese sich in eine Folge von PhonemenPhonem aufgliedern, die wiederum in vielfältigen Oppositionsbeziehungen zu anderen Phonemen stehen.
Wenn wir eine solche Suche im gesamten Wortschatz durchführen, stellen wir fest, dass in einer Einzelsprache nur eine begrenzte Anzahl von lautlichen Unterschieden genutzt wird. Im Falle des Deutschen führen derartige Vergleiche je nach Herangehensweise zu einer Anzahl von 36–46 Phonemen (Wiese 1996: 10f., Wiese 2011: 43–59, Pustka & Meisenburg 2016: 131); im Spanischen sind es, wie wir in 3.1.2 noch genauer sehen werden, ca. zwei Dutzend. In den einzelnen Sprachen wird also mithilfe einer begrenzten Zahl von Phonemen eine unendlich viel größere Menge von lautlichen Signifikanten erzeugt.1 Martinet (1960/2008) hat hier ein sprachliches Ökonomieprinzip formuliert, nämlich das der doppelten Gegliedertheit der Sprache (fr. double articulation du langage): Durch die Kombination einer begrenzten Zahl von bedeutungs- oder funktionstragenden Einheiten (Morphemen) lassen sich unendlich viele Sätze mit immer neuen Bedeutungen bilden (erste Gliederungsebene, fr. première articulation). Die lautlichen Signifikanten dieser Morpheme bilden wir wiederum durch die Kombination einer begrenzten Zahl von Phonemen (zweite Gliederungsebene, fr. deuxième articulation). Beide Ebenen folgen dem ökonomischen Prinzip, nur ein begrenztes Inventar von kleineren Einheiten zu unterscheiden, aus diesen aber durch immer neue Kombinationen eine Unmenge von größeren Einheiten zu bilden (vgl. Gabriel & Meisenburg 42021: 104ff.).
Das Prinzip der Gegliedertheit der lautlichen Signifikanten wurde schon früh erkannt, und in unserer AlphabetschriftAlphabetschrift machen wir uns diese Erkenntnis zunutze. Die Erfinder des Alphabets waren, so könnte man sagen, die ersten Phonologen, und zwar insofern als sie ein überschaubares Inventar von Buchstaben entwickelten, die einzeln oder in Kombination miteinander jeweils bestimmte lautliche Segmente symbolisieren. Auf diese Weise lässt sich ein lautlicher Signifikant als eine Folge von Buchstaben graphisch darstellen.2 Die lautliche Analyse ist grundlegend für die alphabetische Verschriftung einer Sprache. Die in den einzelnen Sprachen gültigen Regeln der Zuordnung von Graphemen (Buchstaben) zu Lauten werden aber auch von zahlreichen anderen Faktoren mitbestimmt, sodass es hier keine eindeutigen Entsprechungen gibt. Für die Beschäftigung mit der Lautsprache ist ein kurzer Seitenblick auf die Alphabetschriften vor allem deshalb interessant, weil die jahrtausendelange Prägung der europäischen Kultur durch diese Art der Verschriftung für die Suche nach den Organisationsprinzipien lautsprachlicher Signifikanten nicht folgenlos geblieben ist. Buchstaben sind diskrete graphische Einheiten, die sich beliebig aneinanderfügen lassen. Wenn man Buchstaben mit Lauten gleichsetzt, könnte man zur Auffassung gelangen, dies geschehe auch beim Sprechen, und zwar indem man diskrete Laute wie Perlen auf einer Schnur aneinanderreihe. Dies ist jedoch nicht der Fall: Zu den wichtigsten Erkenntnissen von Phonetik und Phonologie gehört, dass sich unsere Artikulation beim Sprechen kontinuierlich und in Bezug auf mehrere Dimensionen verändert. Auch akustisch gesehen ist ein Sprachsignal ein lautliches Kontinuum. Laute, im Sinne von zeitlich eindeutig abgegrenzten diskreten Segmenten, sind etwas, was wir in das artikulatorisch-akustische Kontinuum ‘hineinhören’. Phonetik und Phonologie haben auf diese Erkenntnisse reagiert und sich zunehmend auf die Untersuchung der artikulatorischen und akustischen Merkmale konzentriert, die sich im lautlichen Kontinuum parallel, aber nicht notwendigerweise zeitlich synchronisiert, verändern. Diese sog. subsegmentalensubsegmental Ansätze, die sich auf unterhalb der Segmentebene anzusetzende Phänomene konzentrieren, diskutieren wir in 3.3.
Noch in einer zweiten Hinsicht haben Phonetik und Phonologie lange gebraucht, um sich von der Prägung durch die Alphabetschrift zu lösen. Die segmentale Gliederung in Laute bzw. Lautklassen stand so eindeutig im Vordergrund des Forschungsinteresses, dass lautliche Phänomene, die suprasegmentalsuprasegmental, also oberhalb der Segmente anzusiedeln sind, nur wenig beachtet wurden. Das betrifft die Regeln, die man bei der Verknüpfung von Artikulationsbewegungen beobachten kann, ebenso wie Akzentuierung, Rhythmus und Intonation, also Eigenschaften, die nicht an einzelne Lautsegmente gekoppelt sind, sondern sich auf größere Einheiten wie Silben, Wörter oder Phrasen erstrecken. Zu den neueren Entwicklungen lautsprachlicher Forschung gehört, dass diesen suprasegmentalen oder prosodischen Phänomenen deutlich mehr Aufmerksamkeit geschenkt wird als zuvor.3
Auf der suprasegmentalen Gliederungsebene kommt zuerst der SilbeSilbe eine zentrale Funktion zu: Über Konzepte wie Reim, Versmaß und Silbentrennung ist sie den Sprechern meist intuitiv zugänglich; in Phonetik und Phonologie bildet sie die Basis für zahlreiche lautsprachliche Phänomene: Silben sind Träger des Wortakzents und stellen damit so etwas wie ‘Ankerpunkte’ für Tonkonturen dar; ihre Struktur hat Einfluss auf die Beschaffenheit konkret produzierter Segmente. So macht es z. B. im Deutschen einen Unterschied, ob der mit beiden Lippen produzierte stimmhafte Verschlusslaut [b] am Silbenanfang (auch: Anfangsrand oder OnsetOnset) oder im Endrand der Silbe, in der sog. CodaCoda, steht: Während man ihn in (ich) habe stimmhaft artikuliert ([ˈha.bə]), wird er regelhaft entstimmt, wenn er durch das Weglassen des Auslautvokals in die Codaposition der dann einzig verbleibenden Silbe rückt: (ich) hab [hap]. Die Silbe und ihre Struktur besprechen wir genauer in 4.2.
Die Strukturierung des lautlichen Kontinuums ist komplex und verläuft auf mehreren Gliederungsebenen. Die segmentale Ebene betrifft die Gliederung in Segmente und ihre Klassifizierung zu minimalen bedeutungsunterscheidenden Einheiten, den Phonemen (2.5, 3.1). Auf einer subsegmentalensubsegmental Ebene sind die artikulatorischen und akustischen Merkmale verortet, die zentral für das Verständnis des lautlichen Kontinuums sind, das wir beim Sprechen produzieren und beim Hören interpretieren (3.3). Silben, Wörter und Phrasen (4.1) sind Einheiten der suprasegmentalensuprasegmental Gliederungsebenen und Träger von prosodischen Merkmalen wie z. B. Akzent (4.3), Sprachrhythmus (4.4) und Intonation (4.5).
In den letzten Abschnitten haben wir die funktionale Analyse, d. h. die Frage nach dem wozu der lautsprachlichen Phänomene, und die strukturelle Analyse, also die Frage nach dem was und wie, als zwei wichtige Aufgaben lautsprachlicher Forschung herausgestellt. Auch haben wir bereits angedeutet, dass es durchaus verschiedene Antworten auf diese Fragestellungen geben kann, die nicht immer miteinander vereinbar sind. Dieses Nebeneinander unterschiedlicher Ansätze hängt zum einen mit der Herausbildung von Phonetik und Phonologie als zwei Teildisziplinen lautsprachlicher Forschung zusammen; zum anderen bestehen zwischen einzelnen theoretischen Herangehensweisen auch Unterschiede, die auf voneinander abweichende Vorstellungen von der Organisation des menschlichen Sprachwissens zurückgehen.
Die Anfänge der wissenschaftlichen Beschäftigung mit der Lautsprache im 19. Jahrhundert wurden maßgeblich durch neue Untersuchungsmethoden bestimmt (vgl. Meisenburg et al. 2022: 1–10): Die Beschäftigung mit der Lautseite der Sprache begann zunächst als ‘Lautphysiologie’, die mithilfe neuer Techniken eine physiologische bzw. physikalische Beschreibung der Artikulation bzw. der Übertragung von Sprachlauten leisten wollte, teils mit praktischen Zielsetzungen wie z. B. Verbesserungen in der Gehörlosendidaktik. Für die weitere Entwicklung war vor allem ein Misserfolg von entscheidender Bedeutung: Es gelang nämlich nicht, den Sprachlaut als diskrete Einheit nachzuweisen. Stattdessen stellte man fest, dass sich die Artikulation kontinuierlich, also ohne Grenzziehungen um die Einzellaute vollzieht und zudem variabel und keinesfalls bei allen Sprechern identisch ist. Spätestens in den 1930er Jahren zeigten neue Techniken, mit deren Hilfe Schallwellen aufgezeichnet und sichtbar gemacht wurden, dass Lautsprache auch in akustischer Hinsicht keine Abfolge diskreter Lauteinheiten darstellt.
Die Ergebnisse der ersten experimentalphonetischen Untersuchungen stellten damals gängige Vorstellungen von Lautsprache radikal in Frage. Die Problematik, dass die konkrete physische Existenz von kontextstabilen Einzellauten nicht nachgewiesen werden konnte, dass aber sowohl Sprechen als auch Hören offensichtlich auf solchen Einheiten beruhen, führte zur bereits erwähnten Trennung von Phonetik und Phonologie im StrukturalismusStrukturalismus (vgl. 1.1): Man unterschied nun zwischen einer naturwissenschaftlichen Beschäftigung mit Artikulation, Schallwellen und Hörvorgängen einerseits und einer am Systemhaften der Lautsprache und dessen Erfassung interessierten Forschung auf der Basis geisteswissenschaftlicher Methoden andererseits. Die Entwicklung der phonologischen Theoriebildung wurde nachhaltig von Trubetzkoys Erkenntnis bestimmt, dass Phoneme als Bündel distinktiver Merkmale aufzufassen sind. Verbunden hiermit ist die Vorstellung, dass unser phonologisches Wissen als System organisiert ist: Die Abgrenzung der Phoneme voneinander funktioniere wie in einem mathematischen System, in dem der Stellenwert einer Einheit nur durch den Unterschied zu anderen Einheiten, also durch Relationen innerhalb des Systems, bestimmt ist. Dieses Prinzip der negativen Definition von Phonemen – jedes Phonem ist das, was die anderen nicht sind – führte häufig dazu, dass die Frage der Systemorganisation quasi zum Selbstzweck wurde; Ziel war es, die phonemischen Oppositionen einer Sprache aus einer möglichst geringen Zahl von distinktiven Merkmalen abzuleiten.
Ab Ende der 1960er Jahren erhielt die strukturalistische Phonologie Konkurrenz von der generativen Phonologiegenerative Phonologie. In ihrer Anfangszeit ging diese (wie zuvor der Strukturalismus) von einer segmental bestimmten Strukturierung des lautsprachlichen Wissens aus und wollte lautliche Prozesse, wie sie in der Interaktion der einzelnen Lautsegmente miteinander zu verzeichnen sind, möglichst vollständig durch sog. phonologische Regelnphonologische Regel erfassen (vgl. 3.2). Um auch segmentübergreifende Erscheinungen wie tonale und dauerbasierte Merkmale berücksichtigen zu können (Sprachmelodie, Silbenlängung etc.), wurden in der Folgezeit Ansätze entwickelt, die zusätzlich zur segmentalen Schicht weitere, von den Einzellauten unabhängige Repräsentationsebenen annehmen. Diese sog. autosegmentalenautosegmental Ansätze stellen wir exemplarisch in 3.3 vor.
Die wesentlichen Neuerungen der generativen Phonologie beruhen v. a. auf den sprachtheoretischen Annahmen, die Noam Chomsky (*1928), der Begründer der generativen Sprachwissenschaft und einer der Autoren des grundlegenden Werks The sound pattern of English (SPE, Chomsky & Halle 1968), in bewusster Abgrenzung vom Strukturalismus formuliert hat. Im Gegensatz zu diesem verlagerte die generative Sprachwissenschaft das Interesse von der Saussureschen langue, der zufolge das Sprachsystem als die Gesamtheit des Sprachwissens aller Mitglieder einer Sprachgemeinschaft und damit als soziales Faktum aufzufassen ist, auf die kognitiven Fähigkeiten des Individuums und insbesondere auf dessen sprachliche Kompetenz. Als Folge dieses sog. cognitive turncognitive turn rückte die mentale Grammatik des Einzelnen ins Zentrum des Interesses. Seine sprachliche KompetenzKompetenz wurde verstanden als ein System von Einheiten und Verkettungsregeln, das die Erzeugung oder Generierung komplexer sprachlicher Einheiten wie Phrasen, Sätzen und Lautkombinationen etc. ermöglicht. Dabei ging es zunächst um die Kompetenz des sog. idealen Sprechers/Hörers, dessen Sprachwissen nicht durch Performanzbedingungen gestört ist. Diese Idealisierung sollte die vollständige Erfassung aller Potentialitäten des Sprachsystems ermöglichen. Die PerformanzPerformanz kann nach Chomsky nur eingeschränkt als Repräsentation der Kompetenz angesehen werden, da Faktoren wie Müdigkeit, begrenztes Gedächtnis etc. die konkrete Sprachrealisierung stören und ein vollständiges Ausschöpfen der von der Kompetenz gebotenen Möglichkeiten daher undenkbar ist.
Eine weitere Grundannahme des frühen generativen Modells bestand in der Auffassung, dass das Sprachwissen modular organisiert sei. Nach dieser Annahme bauen die unterschiedlichen sprachlichen Wissensbereiche zwar aufeinander auf, sind aber insofern autonom, als sie weitgehend unabhängig voneinander agieren: So wurde angenommen, dass bei der Produktion einer sprachlichen Äußerung eine von der syntaktischen Komponente erzeugte grammatische Struktur an eine Art ‘Lautgenerator’, die phonologische Komponente, weitergereicht werde, die dann die im mentalen Lexikon gespeicherten Repräsentationen der in der Konstruktion verwendeten Wörter in konkrete Lautformen überführt. Die Auffassung von der Modularität des Sprachwissens wird jedoch seit längerer Zeit in Frage gestellt, und es wurden Ansätze entwickelt, die eine enge Interaktion der einzelnen sprachlichen Wissensbereiche annehmen. Als ein Beispiel hierfür besprechen wir die sog. OptimalitätstheorieOptimalitätstheorie, die dezidiert von einem Zusammenspiel unterschiedlicher Komponenten wie Syntax, Morphologie, Phonologie, aber auch InformationsstrukturInformationsstruktur ausgeht (vgl. 3.4, 4.2.5, 4.5.5.3).
Die kognitive Verortung des Sprachlichen ist auch methodisch nicht folgenlos geblieben: Wenn es darum geht, das Sprachwissen des Individuums zu erfassen, erscheint es völlig ausreichend, bei der theoretischen Modellierung von den Sprachdaten und Grammatikalitätsurteilen eines einzigen kompetenten Muttersprachlers auszugehen. Verbunden damit ist der weitgehende Verzicht auf die Auswertung natürlich produzierter Sprachdaten mehrerer Sprecher (KorporaKorpus). Seit einiger Zeit ist hier jedoch eine Wende zu verzeichnen, und auch im Rahmen phonologischer Forschung, die auf generativen Konzepten aufbaut, werden theoretische Annahmen unter Rückgriff auf die Auswertung lautsprachlicher Korpora validiert. Zu nennen ist hier u. a. die Ausrichtung der sog. Laboratory PhonologyLaboratory Phonology (Cohn et al. 2012), ein Ensemble neuerer Forschungsaktivitäten, die zwar keine homogene theoretische Ausrichtung repräsentieren, doch von der Überzeugung geeint werden, die Weiterentwicklung phonologischer Theoriebildung müsse in stetiger Interaktion mit der Analyse natürlicher Sprachdaten und insbesondere durch die Auseinandersetzung mit der dort zu konstatierenden sprachlichen Variation vorangetrieben werden (vgl. u. a. Face 2004). Auch im Bereich der sich in den letzten Jahren zunehmend ausweitenden KorpusphonologieKorpusphonologie spielt die Rückbindung phonologischer Theoriebildung an konkretes sprachliches Material eine zentrale Rolle. Jedoch werden hier, anders als im laborphonologischen Rahmen, phonologische Hypothesen nicht mithilfe von Experimenten getestet, sondern mit den Ergebnissen der Auswertung größerer Sammlungen von lautsprachlichen Daten (sog. Korpora, Sg. das Korpus (n.)Korpus) abgeglichen (vgl. Durand et al. 2014, Durand 2017, Eychenne 2022; speziell zum Spanischen Pustka et al. 2018 und Pustka 2021). Die Berücksichtigung von sprachlichen Varianten in ihren konkreten Vorkommensfrequenzen im Sprachgebrauch ist auch ein zentrales Anliegen der sog. ExemplartheorieExemplartheorie, die wir in 3.5 kurz skizzieren.1 Ein knapper Überblick zur Entwicklung der phonologischen Theoriebildung mit Bezug auf die romanischen Sprachen findet sich in Meisenburg et al. (2022: 10–18).
Bereits mehrfach haben wir darauf hingewiesen, dass die Lautseite der Sprache nicht einheitlich ist, sondern in Abhängigkeit vom Sprecher und der kommunikativen Situation mehr oder minder stark variieren kann. Um die unterschiedlichen Dimensionen sprachlicher Variation zu erfassen, wurde eine Vielzahl von Termini geprägt, die wir zunächst kurz besprechen.
Dass Sprache nicht homogen ist, wird durch alltägliche Erfahrungen gestützt: Je nach Land und Region klingt das Spanische unterschiedlich, sprachliches Verhalten differiert beispielsweise je nach sozialem Status und Gruppenzugehörigkeit der Sprecher, und diese bedienen sich wiederum entsprechend der jeweiligen kommunikativen Situation (gezielt oder unbewusst) bestimmter Ausdrucksmittel, die ihnen ihre Sprache bereitstellt. Sprachliche Vielfalt, wie sie uns tagtäglich begegnet, ist also nicht beliebig verteilt, sondern vielmehr durch eine Vielfalt an innersprachlichen (d. h. dem System selbst inhärenten) und außersprachlichen (z. B. geographischen, sozialen, situativen) Faktoren geleitet. Jede Einzelsprache stellt damit eine Art Varietätengefüge dar. Um diese Architektur der Sprache zu erfassen, hat Coseriu (1980, 21992: 294ff.) die folgenden drei Dimensionen von Variation vorgeschlagen:
Die diatopische Variationdiatopische Variation betrifft die sprachliche Gliederung im Raum und bezieht sich auf Dialekte bzw. regionale Varianten.
Die diastratische Variationdiastratische Variation zielt ab auf die soziale Gliederung von Sprache und damit auf gruppen- oder schichtenspezifische Sprachverwendung; entsprechende Gruppensprachen oder Soziolekte lassen sich als sozial ‘hoch’ oder ‘niedrig’ konnotiert einstufen.
Die diaphasische Variationdiaphasische Variation bezieht sich auf die Sprachverwendung in unterschiedlichen kommunikativen Situationen. Auch die entsprechend verwendeten Register oder Sprechstile können zwischen den Polen ‘hoch’ und ‘niedrig’ eingeordnet werden.
Dieses dreidimensionale Modell wurde von Koch & Oesterreicher (1985, 22011) durch eine vierte Dimension erweitert. Angenommen wird hier ein Kontinuum zwischen konzeptioneller Mündlichkeit und Schriftlichkeit bzw. kommunikativer NäheNähe, kommunikative und DistanzDistanz, kommunikative, wobei die mediale Differenzierung ‘graphisch’ vs. ‘phonisch’ den jeweiligen Polen tendenziell entspricht. Dass das Medium der Phonie aber nicht zwangsläufig mit konzeptioneller Mündlichkeit korrelieren muss, kann man sich anhand eines Beispiels leicht verdeutlichen: So wird etwa eine feierliche Rede aus Anlass einer Bibliothekseröffnung mündlich, also im phonischen Medium vorgetragen, doch ist sie mit vermutlich hohem Planungsaufwand entstanden, damit distanzsprachlich konzipiert, und weist in der Verwendung komplexer Satzbaumuster und gehobenen Vokabulars eher die typischen Merkmale des Geschriebenen als die eines nähesprachlichen Alltagsgesprächs auf.
Die genannten Dimensionen sprachlicher Variation sind nicht isoliert zu betrachten, sondern sie können auf vielfältige Weise ineinandergreifen. So ist z. B. die sog. aspiración, d. h. die gehauchte Realisierung von /s/ im Silbenauslaut wie in [ˈmoh.ka] mosca ‘Fliege’, kein Bestandteil der kastilischen Normlautung; sie lässt sich vielmehr diatopischdiatopische Variation einordnen und damit als typisches Merkmal des in Andalusien oder auch in großen Teilen Lateinamerikas gesprochenen Spanisch charakterisieren (vgl. 2.5.1.2, 3.5). Auch das Ersetzen des Phonems /θ/ durch /s/ und die daraus resultierende Homophonie (< agr. ὅμος homos ‘gleich’ + φωνή phōnē ‘Laut, Stimme’), also die lautliche Gleichheit von Wörtern wie casa ‘Haus’ und caza ‘Jagd’ (jeweils [ˈkasa]), der sog. seseo (vgl. 3.1.2), ist kein Bestandteil der kastilischen Lautung. Die Zuordnung des seseo zu einer bestimmten Region gestaltet sich jedoch schwierig, da er fast den gesamten hispanischen Raum erfasst hat und allein das in Kastilien und Nordspanien gesprochene Spanisch durch die phonemische Unterscheidung zwischen /θ/ und /s/ und damit durch Differenzierung von caza [ˈkaθa] und casa [ˈkasa] gekennzeichnet ist.
Geographisch markierte Aussprachevarianten lassen sich auch im Rahmen der diaphasischen Variationdiaphasische Variation einsetzen, nämlich etwa dann, wenn ein andalusischer Sprecher neben seinem lokal gefärbten Sprechstil auch über ein standardnahes, am kastilischen Spanisch orientiertes Register verfügt und seine Aussprache situationsbezogen anpasst. Dies wiederum impliziert eine diastratische Komponente, denn die Fähigkeit zum Register- oder Stilwechsel setzt die Beherrschung mehrerer sprachlicher (Sub-)Systeme voraus. Ob ein Sprecher neben einem lokal gefärbten auch ein neutrales Register zur Verfügung hat, ist i. d. R. an soziale Faktoren und insbesondere an den Zugang zu Bildungsinstitutionen gebunden, da zusätzlich zum muttersprachlich erworbenen (geographisch markierten) System eine als neutral empfundene Varietät erlernt werden muss.
Welche VarietätVarietät als neutral und den verschiedenen Dialekten übergeordnet eingestuft wird, ist wiederum von Sprache zu Sprache unterschiedlich und wird von zahlreichen außersprachlichen Faktoren mitbestimmt. Für den europäischen Raum gilt das kastilische Spanisch, wie es in der Hauptstadt Madrid gesprochen wird, als prestigeträchtige Referenzvarietät; parallel hierzu haben sich in jüngerer Zeit in Lateinamerika eigene Standardvarietäten herausgebildet (s. u.).1 Doch auch wenn ein Sprecher bspw. das kastilische Spanisch als L1 erworben hat, muss er die distanzsprachlichen Merkmale der habla culta wie komplexe Satzbaumuster, besondere stilistische Figuren, gehobenes und gegebenenfalls fachspezifisches Vokabular etc., gezielt erlernen, um in entsprechenden Situationen angemessen kommunizieren zu können.
Bislang war bereits mehrfach von sprachlichen VarietätenVarietät die Rede. Wir verwenden diesen Terminus, da er, etwa im Gegensatz zum manchmal negativ konnotierten Begriff des Dialekts, explizit keine soziolinguistische Einordnung in einem Kontinuum zwischen ‘hoch’ und ‘niedrig’ vornimmt, sondern in neutraler Form auf ein wie auch immer beschaffenes Sprachsystem verweist. So lassen sich geographisch unterschiedlich gefärbte Sprachformen wie das in Andalusien, in Argentinien oder in Madrid gesprochene Spanisch gleichermaßen als Varietäten erfassen. Mit dem neutralen Terminus lässt sich auch die problematische Abgrenzung zwischen Sprache und Dialekt vermeiden, d. h., es muss keine Entscheidung getroffen werden, welchem Spanisch der Status einer überdachenden Sprache zugesprochen wird, der abweichende Formen als Dialekte unterzuordnen wären. Der Begriff der Varietät bezieht sich jedoch nicht nur auf die Dimension der diatopischen Variation. Man kann ihn gleichermaßen auf gruppen- und/oder berufsspezifische Sprachformen (sp. jergas) oder auf situationsbezogene, d. h. nähe- oder distanzsprachliche Register (sp. registros) anwenden und damit sowohl diastratische als auch diaphasische Aspekte mit einbeziehen.
Innerhalb einer Sprechergemeinschaft bestehen – zumindest im bildungssprachlichen Kontext – jedoch durchaus Vorstellungen von einer korrekten Sprachverwendung und damit auch von einer normgerechten AusspracheNormaussprache, die als Ergebnis historisch gewachsener Normierungsprozesse aufzufassen ist. Für das Spanische gilt, dass den kastilischen Varietäten aufgrund der politischen Schlüsselposition Kastiliens eine zentrale Rolle zukommt. So wurde bereits im 13. Jahrhundert unter Alfons X. (genannt der Weise, sp. El Sabio, 1221–1284) der Begriff vom castellano drecho, d. h. vom ‘richtigen Spanisch’ geprägt, was auf den als vorbildhaft geltenden Sprachgebrauch am Hof im kastilischen Toledo abzielte (sp. uso cortesano). Auch das anschließend entstandene Konzept des buen uso ist lokal gebunden und nimmt Bezug auf die Sprachverwendung in den habsburgischen Hauptstädten Valladolid und Madrid (vgl. Kabatek & Pusch 22011: 258ff.). Im Zuge der nach dem Vorbild der Académie française 1713 erfolgten Gründung der Real Academia trat die Vorbildfunktion gebildeter Sprecher in den Vordergrund, wobei in diatopischer Hinsicht weiterhin der kastilische Sprachraum maßgeblich war. Die Varietäten anderer Regionen spielten lange Zeit nur als der hauptstädtischen habla culta untergeordnete Dialekte eine Rolle; ihre lautlichen Besonderheiten wurden unter dem Gesichtspunkt der Abweichung von der kastilischen Norm betrachtet und entsprechend im Rahmen dialektologischer Studien behandelt. Dies gilt auch für die in Amerika gesprochenen Varietäten des Spanischen, auch wenn hier inzwischen verstärkt Tendenzen zur Etablierung eigener nationaler Standards und Aussprachenormen zu verzeichnen sind.
Als ein Beispiel sei die Situation der Rundfunkanstalten in Argentinienargentinisches Spanisch angeführt: Während in den 1930/40er Jahren dem Rundfunk eine der Schule gleichgestellte normgebende Kraft zugesprochen wurde und die Aussprache der Radiosprecher per Dekret auf die ‘gepflegte’ Lautung gemäß der kastilischen Norm festgelegt war, wurde dies 1957 dahingehend gelockert, dass umgangssprachliche Ausspracheformen explizit zugelassen wurden. In den entsprechenden Richtlinien von 1980 fand schließlich die Lautung keine Erwähnung mehr, was eine lokal gefärbte Aussprache im Rundfunk de facto ‘legalisierte’ (Vitale & Vázquez Villanueva 2004). Heutzutage werden für das argentinische Spanisch typische lautliche Merkmale wie die bereits erwähnten Phänomene aspiración und šeísmo auch in distanzsprachlichen Kontexten ostentativ verwendet. Damit hat sich ein lokaler StandardStandard, lokaler herausgebildet, der sich in Bezug auf seine Normen sowohl in lexikalisch-grammatischer2 als auch in lautlicher Hinsicht deutlich von anderen Varietäten und insbesondere vom kastilischen Spanisch abhebt.
Das hier angeführte argentinische Spanisch ist nur ein Beispiel unter vielen: Im gesamten spanischen Sprachraum haben sich divergierende Aussprachemuster herausgebildet, die wir exemplarisch in den Kapiteln zur segmentalen und prosodischen Phonologie besprechen werden. Welche der zahlreichen Aussprachevarianten sollten aber nun für eine Beschreibung der spanischen Lautung als Bezugspunkt aufgefasst werden, welche als Abweichungen hiervon gelten? Da sich neben dem kastilischen Spanisch eine Vielfalt an regionalen Normen entwickelt hat, erscheint es fragwürdig, die Aussprache einer dieser Varietäten als Referenzlautung anzusetzen und die übrigen als divergierende Unterformen zu charakterisieren. Da eine solche Entscheidung bestenfalls mit Blick auf die Geschichte zu begründen wäre, stellen wir unterschiedliche Varietäten wie kastilisches, andalusisches oder argentinisches Spanisch jeweils gleichberechtigt dar. Hieraus folgt, dass wir bei der Behandlung des spanischen Lautinventars z. B. das (nur in den kastilischen und nordspanischen Varietäten vorkommende) /θ/ als ein varietätenspezifisches Phonem verzeichnen, ebenso wie das Phonem /ʒ/, das speziell für das argentinische Spanisch (und darüber hinaus für den gesamten Río de la Plata-Raum) charakteristisch ist.
Im Folgenden geben wir einen knappen Überblick zum spanischen VarietätenraumVarietät (vgl. ausführlicher Hualde 2005: 19–35, 2022: 780–784). Das europäische Sprachgebieteuropäisches Spanisch ist grob zweigeteilt und lässt sich in eine nördlich-zentrale und eine südliche Zone aufteilen. Typisch für die Varietäten der ersteren ist neben der Beibehaltung der phonemischen Opposition /θ/ vs. /s/ vor allem die postvelare (d. h. weit hinten am Gaumen produzierte) Realisierung des Frikativphonems /x/ in Wörtern wie ajo [ˈaχo] ‘Knoblauch’ oder mujer [muˈχeɾ] ‘Frau’ (vgl. 2.5.1.2). Mit dem Katalanischen, dem Baskischen und dem Galicischen werden in Spanien neben Varietäten des Spanischen weitere Sprachen gesprochen, wobei jedoch nicht alle in den jeweiligen Gebieten lebenden Spanischsprecher bilingualBilinguismus sind. Die entsprechenden Gebiete sind in Abb. 1.5-1 farblich hervorgehoben.3 Die Varietäten der südlichen Zone zeichnen sich u. a. durch die Abwesenheit des Kontrasts /θ/ vs. /s/ (seseo), durch die aspiración von silbenfinalem /s/ sowie durch eine Abschwächung des /x/ zum Hauchlaut (wie in mu[h]er) aus. Das Spanische der kanarischen Inseln teilt die meisten dieser Merkmale mit der südlichen Zone, ist jedoch zusätzlich durch spezielle Eigenheiten charakterisiert (vgl. 2.5.1.2, 3.3).
Abb. 1.5-1: Varietäten des europäischen Spanischeuropäisches Spanisch (nach Hualde 2005: 19ff.).
Für das rein flächenmäßig weitaus größere Sprachgebiet in Mittel- und Südamerika lassen sich mit Hualde (2005: 25ff.) sieben Zonen unterscheiden.4 Das amerikanische Spanischamerikanisches Spanisch steht in unterschiedlich starkem Maße im Kontakt mit autochthonen Sprachen, wobei Paraguay den größten Anteil an bilingualen Sprechern aufweist (Spanisch – Guaraní, vgl. Gabriel et al. 2020b: 39–44). Zu nennen sind weiterhin u. a. Nahuatl für das mexikanische Spanisch sowie Quechua und Aymara für die andinen Varietäten (Peru, Ecuador). Eine weitere Kontaktsprache für das im Grenzgebiet zwischen USA und Mexiko gesprochene Spanisch ist das Englische. Infolge von Migration aus Lateinamerika sind auch in den USA große Hispanic communitiesUS-amerikanisches Spanisch entstanden, deren Sprecher neben dem Englischen das Spanische als Herkunftssprache verwenden. Einen Überblick zu den entsprechenden Aussprachebesonderheiten bieten Rao & Ronquest (2015), Ronquest & Rao (2018) und Rao & Amengual (2021); vgl. auch 5.2.1.
Für das mexikanische Spanischmexikanisches Spanisch, das auch die südlichen Grenzgebiete der USA umfasst, kann als typisches Merkmal die stabile silbenfinale /s/-Realisierung wie in [ˈestos] estos ‘diese’ angeführt werden, die auch in komplexen Konsonantenverbindungen auftritt ([konstɾuˈiɾ] construir ‘bauen, errichten’; vgl. Lewis & Boomershine 2015). Ein weiteres, durch den Kontakt mit mesoamerikanischen Sprachen wie dem Nahuatl bedingtes Merkmal ist die von anderen Varietäten des Spanischen abweichende Silbenaufteilung bei Wörtern wie a.tle.ta ‘Athlet/in’ (anstelle von at.le.ta); die zweite Silbe beginnt hier mit dem komplexen Onset [tl], ebenso wie der absolute Anlaut des mexikanischen Ortsnamens Tlaxcala (4.2.5, 5.1). In der zentralamerikanischenzentralamerikanisches Spanisch Zone werden Varietäten zusammengefasst, die sich einerseits vom mexikanischen und andererseits vom karibischen Spanisch abgrenzen (vgl. Quesada Pacheco 2015). Ein besonderes Charakteristikum der in Costa Rica gesprochenen Varietät ist die an das Englische erinnernde r-Realisierung. Die karibischenkaribisches Spanisch Varietäten zeichnen sich u. a. durch eine starke Tendenz zur Reduktion stimmhafter intervokalischer Verschlusslaute aus, die bis zur kompletten Tilgung gehen kann. In Kombination mit der aspiración von vorkonsonantischem /s/ ergeben sich hieraus Realisierungen wie [pehˈkao̯] pescado ‘Fisch(gericht)’. Dies kommt jedoch auch im andalusischen Spanisch vor.
Das andine SpanischAndenspanisch (Peru, Ecuador, Bolivien) ist teils durch Besonderheiten charakterisiert, die sich durch den Kontakt mit dem Quechua erklären lassen. So treten im Hochlandspanischen von Peru bei der Markierung von akzentuierten Silben Tonhöhenbewegungen auf, die denen des Quechua entsprechen (vgl. O’Rourke 2004, 2005). Auch das paraguayische Spanisch ist nachhaltig durch den Sprachkontakt geprägt. Ein vermutlich aus dem Guaraní übernommenes Merkmal, das in anderen Varietäten des Spanischen nicht regelmäßig auftritt, ist der am Wortanfang und auch zwischen Vokalen platzierte Glottisschlag [ʔ], der in ähnlicher Form auch im Deutschen auftritt. Im chilenischen Spanischchilenisches Spanisch ist die bereits für zahlreiche andere Varietäten (Andalusien, Argentinien, Karibik) angeführte /s/-Aspiration zu verzeichnen. Ein typisches Merkmal besteht zudem darin, dass /k ɡ x/ in der Position vor /e/ und /i/ weiter vorne am Gaumen artikuliert werden als in anderen Varietäten. Damit klingt in der chilenischen Aussprache von gente ‘Leute’ die erste Silbe eher so wie dt. -chen (vgl. Hualde 2005: 30). Das Gebiet des rioplatensischen Spanischargentinisches Spanisch umfasst die am Río de la Plata gelegenen Staaten Argentinien und Uruguay, wobei die nördlichen Provinzen Argentiniens (u. a. Corrientes, Misiones, Formosa) sprachlich eher dem paraguayischen Spanisch zuzuordnen sind. Die bereits erwähnten lautlichen Merkmale des argentinischen Spanisch, insbesondere der šeísmo und die starke Tendenz zur /s/-Aspiration treffen auch weitgehend für Uruguay zu.
Abb. 1.5-2: Die sieben Varietätenzonen des amerikanischen Spanischamerikanisches Spanisch in unterschiedlichen Farben (nach Hualde 2005: 25ff.).
Dieses Kapitel ist der Phonetik gewidmet, die in ihren Teilbereichen artikulatorische (2.2), akustische (2.3) und auditive bzw. perzeptive Phonetik (2.4) lautsprachliche Kommunikation vornehmlich von ihrer materiellen Seite her untersucht. Sie liefert damit wichtige Grundlagen für die Klassifikation der Sprachlaute, wie sie in 2.5 für das Spanische – kontrastiert mit dem Deutschen – vorgestellt wird. Wir wollen aber zunächst fragen, was tatsächlich passiert, wenn wir in Lautsprache kommunizieren, wenn wir also sprechen und Gesprochenes wahrnehmen. Wir versetzen uns dazu wieder in die Situation von Juan, der wissen will, ob es in einem ihm bislang unbekannten Laden Mandarinen gibt.
Ursprung, Ausgang und Steuerungszentrum für sämtliche Kommunikation und damit auch für unser sprachliches Handeln ist unser Gehirn, in dem unser gesamtes sprachliches Wissen gespeichert ist. Dabei können verschiedene Funktionen unterschieden werden, die während des Kommunikationsprozesses eng miteinander koordiniert sind (vgl. Abb. 2.1-1).
Im Rahmen der kreativen Funktion hat Juan seinen Entschluss zur Nutzung der Lautsprache für die Kommunikation mit der Verkäuferin getroffen. Auch innerhalb dieses Zeichensystems hat er nun mehrere Möglichkeiten: So kann er beispielsweise das, was er ausdrücken will, als Frage oder als AussagesatzDeklarativsatz (etwa mit einer indirekten Frage im Nebensatz) formulieren, er kann komplizierte Umschreibungen einbauen oder einen ganz einfachen Satz konstruieren etc. Derartige Entscheidungen werden meist sehr schnell und weitgehend unbewusst von der entsprechenden Gehirnfunktion getroffen.
Mit der kreativen Funktion eng verbunden ist die Sendefunktion. Zur Produktion einer mündlichen Äußerung werden über die Nerven Impulse vom Gehirn zu den Muskeln geschickt, die für den Betrieb der Sprechwerkzeuge zuständig sind, für Lunge, Kehlkopf,Larynx ZungeZunge usw. Die Impulse bewirken, dass diese Muskeln verschiedene Bewegungen durchführen: Die Lunge zieht sich zusammen, die Stimmbänder vibrieren, der Unterkiefer geht auf und nieder, Zunge und Lippen verändern laufend ihre Position. Durch all diese Aktivitäten, deren Koordinierung über ständige Rückmeldungen ans Gehirn erfolgt, wird der von der Lunge ausgehende Luftstrom bei seinem Gang durch Kehlkopf, Rachen, Nasen- und Mundraum auf vielfältige Weise gestaltet – unterbrochen, behindert, frei durchgelassen –, sodass er den Mund in Folgen von komplexen, akustisch als KlängeKlang und GeräuscheGeräusch wahrnehmbaren Druckwellen verlässt: Muskelbewegungen werden in Luftbewegungen – Schallwellen – umgesetzt.
Außerhalb des Mundes bewegen sich die Druckwellen in alle Richtungen fort; sie werden immer schwächer, je weiter sie gelangen, und verebben schließlich ganz, wenn ihre ursprüngliche Energie aufgebraucht ist. Doch werden sie für gewöhnlich produziert, um vor dem Verebben auf ein (oder mehrere) Paar Ohren zu treffen, in unserem Fall auf die Ohren der Verkäuferin.
Damit setzt beim Hörer die wiederum vom Gehirn gesteuerte Hörfunktion ein: Im Ohr bewegt sich das sehr empfindliche Trommelfell entsprechend den eintreffenden Druckwellen; diese Bewegungen werden auf Nerven übertragen, die vom inneren Ohr des Hörers zu seinem Gehirn laufen. Dort werden die vom Ohr kommenden Impulse als lautliches Geschehen aufgenommen, das sich in seiner Qualität, Länge, Höhe, LautstärkeLautstärke etc. laufend ändert. Die Verkäuferin hört Juans Frage.
HörenHören bedeutet jedoch noch nicht verstehen.1 Um zu einem Verständnis des lautlichen Geschehens zu gelangen, muss der Hörer es interpretieren, und zwar entsprechend seiner im Gehirn gespeicherten Sprachkenntnis. Die Verkäuferin stimmt also das, was sie hört, mit dem ab, was nach ihrem Wissen in ihrer Sprache möglich ist, und entschlüsselt bzw. interpretiert so Juans Äußerung,2 bevor sie selbst die Rolle der Sprecherin übernimmt.
In Abbildung 2.1-1 sind diese lautsprachlichen Produktions- und Rezeptionsprozesse skizziert. Durch die eckigen Klammern ist der Bereich angezeigt, der die Phonetik interessiert, die senkrechten Linien grenzen grob ihre drei klassischen Teilbereiche ab. Es folgt eine an Pompino-Marschall (32009: 2f.) angelehnte Definition von Phonetik.
Abb. 2.1-1: Gegenstand der Phonetik und ihre Teilbereiche.
Gegenstand der Phonetik sind die lautlichen Aspekte sprachlicher Kommunikation. Sie untersucht, wie Schallereignisse artikulatorisch zustandekommen (physikalische Prozesse bei der Sprachproduktion), wie sie akustisch zu messen und zu beschreiben sind (akustische Vorgänge der Schallproduktion und -übertragung) und wie sie auditiv wahrgenommen werden (perzeptive Vorgänge bei der Verarbeitung über das Gehör).
Die kleinsten Analyseeinheiten der Phonetik sind Laute (auch PhonePhon oder SegmenteSegment, sp. sonidos, fonos, segmentos), denen man sich ohrenphonetisch/auditiv beim bewussten Nachvollziehen der Artikulationsbewegungen annähern kann – so etwa beim zeitlichen Überdehnen der Aussprache. Diese Minimalereignisse sind jedoch reine Beschreibungskategorien, die nicht als kleinste Bausteine der menschlichen Rede missverstanden werden dürfen: Beim Sprechen werden nicht einzelne Laute aneinandergefügt, sondern ein ganzer Lautstrom wird durch kontinuierliche Bewegungsabläufe moduliert (Pompino-Marschall 32009: 178).
Bestimmte Eigenschaften sprachlicher Schallereignisse wie Akzent oder IntonationIntonation lassen sich nicht an einzelnen Lautsegmenten festmachen, sondern gehen über diese hinaus. Sie werden daher als suprasegmentalesuprasegmental MerkmaleMerkmale gefasst und der ProsodieProsodie zugerechnet (vgl. Kap. 4).
Eine wichtige Rolle als Trägerin prosodischer Eigenschaften (insbesondere des Akzents) spielt die der Wahrnehmung leicht zugängliche SilbeSilbe. Als kleinste suprasegmentale Komponente und elementare Produktionseinheit hat sie wesentlichen Anteil an verschiedenen lautlichen Prozessen sowie an der rhythmischen Strukturierung sprachlicher Äußerungen (vgl. 4.2).
Mit SymbolphonetikSymbolphonetik und MessphonetikMessphonetik werden zwei kategorial verschiedene, doch aufeinander beziehbare Herangehensweisen an den Gegenstandsbereich der Phonetik unterschieden: Während die Messphonetik sich mit den Vorgängen befasst, die bei der Produktion, Übertragung und Rezeption von Sprachsignalen unter Zuhilfenahme von Geräten gemessen und in einer physikalischen Sprache dargestellt werden können, ist die Symbolphonetik durch den Gegenstand ‘Laut’, wie er sich perzeptiv aus komplexen Schallereignissen herauslösen lässt, bestimmt. Mit Hilfe eines begrenzten Zeichenvorrats stellt sie diese Schallereignisse symbolisch dar, sodass die phonetische Information in einer Symbolkette repräsentiert wird (Kohler 21995: 17).3 Die Wiedergabe von Lauten durch (graphische) Symbole einer phonetischen Umschrift wird als TranskriptionTranskription bezeichnet.
Auch die uns vertrauten AlphabetschriftenAlphabetschrift zielen auf die Wiedergabe der Lautung ab, doch neben dem Lautbezug vermitteln sie dem Leser noch zahlreiche weitere Informationen, die nur einen mittelbaren oder gar keinen Bezug zur Lautseite aufweisen, während bestimmte lautliche Erscheinungen nicht oder nicht regelmäßig berücksichtigt werden. Zu letzteren gehört oft (so z. B. im Deutschen) die Kennzeichnung der Betonung, zu ersteren zählen Abstände zwischen Wörtern, Großschreibungen u. v. a. Auch werden häufig mehrere Schreibungen für ein und denselben Laut genutzt (vgl. im Deutschen <f>/<v> für [f] wie in Fee/Vieh oder im Spanischen <b>/<v> für [b] wie in baca ‘Dachgepäckträger’ /vaca ‘Kuh’, beide [ˈbaka]). Umgekehrt können verschiedene Laute durch ein einziges Schriftzeichen repräsentiert werden (vgl. [eː]/[ɛ] durch <e> in dt. Weg/weg oder [r]/[ɾ] durch <r> in sp. raro ‘selten’ [ˈraɾo]). In der Rechtschreibung zeichnen sich zudem immer wieder Tendenzen ab, das, was inhaltlich zusammengehört, graphisch auch dann einander anzugleichen, wenn die Lautung abweicht, und andererseits das unterschiedlich zu schreiben, was nur zufällig gleich lautet, inhaltlich aber nichts miteinander zu tun hat. So teilen dt. Maus [maʊ̯s] und Mäuse [ˈmɔɪ̯zə] in der Lautung nur den Anfangskonsonanten, während sie graphisch weitgehend identisch gehalten sind. Dt. Häute und heute lauten dagegen völlig gleich, nämlich [ˈhɔɪ̯tə], werden aber in der Schreibung deutlich voneinander geschieden.
Um die Lautseite einer Sprache genauer und eindeutiger repräsentieren zu können, sind für Phonetik und Phonologie eigene TranskriptionssystemeTranskription entwickelt worden. Das bekannteste unter ihnen, das auch wir hier benutzen, ist das International Phonetic AlphabetInternational Phonetic Alphabet (IPA) (IPA, sp. Alfabeto Fonético Internacional bzw. AFI, vgl. https://www.internationalphoneticassociation.org/IPAcharts/IPA_chart_orig/pdfs/IPA_Kiel_2020_full.pdf). Nach dem Prinzip, dass zumindest jeder Laut, der in einer der Sprachen der Welt zur Bedeutungsunterscheidung beiträgt, durch ein eigenes Transkriptionszeichen repräsentiert sein soll, kommen in ihm alle Buchstaben des lateinischen Alphabets (mit einer in vielen Sprachen verbreiteten lautlichen Entsprechung) zum Einsatz, aber es werden auch die Buchstaben des griechischen und weiterer AlphabeteAlphabetschrift genutzt. Gegebenenfalls werden die Zeichen durch sog. Diakritika (Unterscheidungszeichen) ergänzt.4 Als maschinenlesbare Lautschrift, die nur die Zeichen der grundlegenden Tastaturbelegung nutzt, ist in den letzten Jahrzehnten SAMPASAMPA (Speech Assessment Methods Phonetic Alphabet) entwickelt worden (vgl. https://en.wikipedia.org/wiki/SAMPA_chart). Für das Spanische wird gelegentlich noch der Zeichensatz der