Jede menschliche Kultur besitzt Sprache und Musik, und beide Phänomene vereinen Merkmale, die im Kommunikationsspektrum von Tieren selten anzutreffen sind, etwa in Struktur, kognitiver Verarbeitung und Bedeutung für zwischenmenschliche soziale Interaktion. Zugleich unterscheiden sich Musik und Sprache insbesondere in spektrotemporalen Merkmalen, wie vor allem in Gesang und gesprochener Sprache deutlich wird. In meiner Dissertation habe ich den Ursprung dieser Unterschiede in drei Studien untersucht, die drei Kapitel bilden. Basierend auf den Heuristiken von Marr und Tinbergen habe ich mich auf grundlegende Bestandteile von Sprache und Musik fokussiert: Designmerkmale (Kapitel 1 und 2) und spektrotemporale Modulationen (Kapitel 3). Ich habe kognitive Vorhersagbarkeit, Aufmerksamkeit und Gedächtnis in einer theoretischen Studie, einer Verhaltensstudie und einem fMRT-Experiment untersucht. Meine Arbeit legt den Schluss nahe, dass spektrotemporale Unterschiede durch Einschränkungen der kognitiven Vorhersagbarkeit erklärbar sind, die abhängig von unterschiedlichen Zielen sozialer Interaktion variieren. Daraus resultierende spektrotemporale Merkmale wie diskrete Töne ermöglichen dann verbesserte kognitive Verarbeitung, z.B. erhöhte Merkbarkeit von vokalen Phrasen. Die entstandenen spektrotemporalen Merkmale können für das kognitive System auch als probabilistische Hinweise fungieren, welche neuronale Konnektivität modulieren, um bestimmte aufgabenabhängige Interpretationen zu ermöglichen. Im Hinblick auf Theorien aktiver Inferenz und der Biosemiotik legt meine Arbeit nahe, dass spektrotemporale Unterschiede zwischen Gesang und Sprache Indizes für die prädiktiven Einschränkungen sind, durch die sie hervorgerufen wurden, und dass sie Affordanzen darstellen, die eine kulturelle Weitergabe ermöglichen. Die spezies- und modalitätsübergreifende Messung dieser Einschränkungen mit Methoden der evolutionären Systembiologie ermöglicht uns, die Wechselwirkungen von Kognition, Kommunikation und Evolution mechanistisch zu erklären.
Language and music are two of the most remarkable human phenomena, abundant across cultures and combining characteristics rare within the realm of animal communication. Although both music and language share certain characteristics in structure, cognitive processing and significance for human social interaction, they differ in others, particularly in spectrotemporal features apparent in their vocal forms as song and speech. In my thesis, I investigated the origin of these differences in three studies which form three Chapters. Following Marr's and Tinbergen's frameworks as guiding heuristics, I used an analytical decomposition approach based on design features (Chapters 1 and 2) and spectrotemporal modulations (Chapter 3). I investigated predictability, attention and memory in a theoretical framework, a behavioural study and an fMRI experiment. I conclude that spectrotemporal differences can be explained as emerging from constraints on predictability under different goals in social interaction. Resulting features such as discrete pitch then afford enhanced fulfilment of task goals such as remembering vocal phrases. They also provide probabilistic cues that differentially modulate functional connectivity networks for the sake of task-dependent interpretation. Drawing on the frameworks of active inference and biosemiotics, I suggest that spectrotemporal differences between song and speech are indices of the predictive constraints that brought them about, entailing affordances which enable cultural transmission. Measuring these constraints across species and modalities with methods from evolutionary systems biology can complement the analytical decomposition of music and language with a recomposition approach, enabling understanding of the interplay of cognition, communication, and evolution.
Jede menschliche Kultur besitzt Sprache und Musik, und beide Phänomene vereinen Merkmale, die im Kommunikationsspektrum von Tieren selten anzutreffen sind, etwa in Struktur, kognitiver Verarbeitung und Bedeutung für zwischenmenschliche soziale Interaktion. Zugleich unterscheiden sich Musik und Sprache insbesondere in spektrotemporalen Merkmalen, wie vor allem in Gesang und gesprochener Sprache deutlich wird. In meiner Dissertation habe ich den Ursprung dieser Unterschiede in drei Studien untersucht, die drei Kapitel bilden. Basierend auf den Heuristiken von Marr und Tinbergen habe ich mich auf grundlegende Bestandteile von Sprache und Musik fokussiert: Designmerkmale (Kapitel 1 und 2) und spektrotemporale Modulationen (Kapitel 3). Ich habe kognitive Vorhersagbarkeit, Aufmerksamkeit und Gedächtnis in einer theoretischen Studie, einer Verhaltensstudie und einem fMRT-Experiment untersucht. Meine Arbeit legt den Schluss nahe, dass spektrotemporale Unterschiede durch Einschränkungen der kognitiven Vorhersagbarkeit erklärbar sind, die abhängig von unterschiedlichen Zielen sozialer Interaktion variieren. Daraus resultierende spektrotemporale Merkmale wie diskrete Töne ermöglichen dann verbesserte kognitive Verarbeitung, z.B. erhöhte Merkbarkeit von vokalen Phrasen. Die entstandenen spektrotemporalen Merkmale können für das kognitive System auch als probabilistische Hinweise fungieren, welche neuronale Konnektivität modulieren, um bestimmte aufgabenabhängige Interpretationen zu ermöglichen. Im Hinblick auf Theorien aktiver Inferenz und der Biosemiotik legt meine Arbeit nahe, dass spektrotemporale Unterschiede zwischen Gesang und Sprache Indizes für die prädiktiven Einschränkungen sind, durch die sie hervorgerufen wurden, und dass sie Affordanzen darstellen, die eine kulturelle Weitergabe ermöglichen. Die spezies- und modalitätsübergreifende Messung dieser Einschränkungen mit Methoden der evolutionären Systembiologie ermöglicht uns, die Wechselwirkungen von Kognition, Kommunikation und Evolution mechanistisch zu erklären.
Language and music are two of the most remarkable human phenomena, abundant across cultures and combining characteristics rare within the realm of animal communication. Although both music and language share certain characteristics in structure, cognitive processing and significance for human social interaction, they differ in others, particularly in spectrotemporal features apparent in their vocal forms as song and speech. In my thesis, I investigated the origin of these differences in three studies which form three Chapters. Following Marr's and Tinbergen's frameworks as guiding heuristics, I used an analytical decomposition approach based on design features (Chapters 1 and 2) and spectrotemporal modulations (Chapter 3). I investigated predictability, attention and memory in a theoretical framework, a behavioural study and an fMRI experiment. I conclude that spectrotemporal differences can be explained as emerging from constraints on predictability under different goals in social interaction. Resulting features such as discrete pitch then afford enhanced fulfilment of task goals such as remembering vocal phrases. They also provide probabilistic cues that differentially modulate functional connectivity networks for the sake of task-dependent interpretation. Drawing on the frameworks of active inference and biosemiotics, I suggest that spectrotemporal differences between song and speech are indices of the predictive constraints that brought them about, entailing affordances which enable cultural transmission. Measuring these constraints across species and modalities with methods from evolutionary systems biology can complement the analytical decomposition of music and language with a recomposition approach, enabling understanding of the interplay of cognition, communication, and evolution.