De dag van de Fonetiek 2009

Over onderzoek naar
spraak en spraaktechnologie

(http://www.fon.hum.uva.nl/FonetischeVereniging/)

Vrijdag 18 december 2009 in de Sweelinckzaal, Drift 21 te Utrecht

Georganiseerd door de Nederlandse Vereniging voor Fonetische Wetenschappen

deelname gratis



Programma

9:30 Ontvangst met koffie

9:55 Welkom

10:00-11:00 Ochtendsessie I

10:00 Invloed en eigenschappen van herhaling op multilinguale spraakherkenning

Marijn Schraagen

10:20 Dialectverandering: Lexicon versus morfologie versus klankcomponenten

Wilbert Heeringa & Frans Hinskens

10:40 De structuur-prosodie interface van beperkende en uitbreidende relatieve bijzinnen in het Nederlands en Duits

Constantijn Kaland

11:00 Koffiepauze

11:30-12:30 Ochtendsessie II

11:30 CLARIN: wat is dat?

Arjan van Hessen

11:50 Spraakmakende publicaties. Het voorbeeld van Veteran Tapes VP

Henk van den Heuvel

12:10 Recent additions to Praat

David Weenink

12:30-12:45 Algemene Ledenvergadering

12:45-14:00 Lunch

14:00-15:00 Middagsessie I

14:00 Gefloten plosieven en andere articulatorische wetenswaardigheden

Luc van Buuren

14:20 Een akoestisch-articulatorisch model van medeklinkerinventarissen

Jan-Willem van Leussen

14:40 Brabbelen en het gehoor: Aspecten van fonatie en articulatie in het vocalisatiepatroon van doofgeboren baby's na cochleaire implantatie

Inge Molemans, Renate van den Berg, Lieve Van Severen, Paul Govaerts en Steven Gillis

15:00 Thee

15:30-16:30 Middagsessie II

15:30 Recognition of reduced words, context use, and age-related hearing loss

Esther Janse & Mirjam Ernestus

15:50 Luisteren naar glimlachen

Hugo Quené

16:10 De rol van semantische context in de herkenning van gereduceerde woorden

Marco van de Ven, Benjamin V. Tucker, Mirjam Ernestus

16:30 Afsluiting en borrel



Abstracts



10:00 Invloed en eigenschappen van herhaling op multilinguale spraakherkenning

Marijn Schraagen
UiL-OTS, Universiteit Utrecht

Herhaling speelt een belangrijke rol in gesproken communicatie. Het gaat hierbij zowel om herformulering (semantische verduidelijking) als om verbetering van uitspraak. Herhaling is vooral belangrijk bij weinig voorkomende woorden en formuleringen. Het Stevin-project Autonomata TOO richt zich op een domein met dit type taalgebruik: spraakherkenning van (commerciële) eigennamen met Nederlandse, Engelse en Franse elementen, uitgesproken door sprekers met een Nederlandse/Vlaamse, Franse, Engelse, Marokkaanse of Turkse achtergrond. Herhaling blijkt een positief effect te hebben op de prestaties van de spraakherkenner, met verbeteringen tot meer dan 10 procentpunt. Dit effect is onder gecontroleerde condities getest, wat mogelijk was door het direct toepassen van spraakherkenning tijdens de opname van het spraakcorpus. De presentatie behandelt naast de herkenningsresultaten ook de verschillende aspecten van herhalingen zoals articulatie, klankrealisatie of herstel van fouten.



10:20 Dialectverandering: Lexicon versus morfologie versus klankcomponenten

Wilbert Heeringa & Frans Hinskens
Meertens instituut

Op basis van fonetische transcripties van opnamen die gemaakt werden in 2008 en 2009 bestuderen we veranderingen in 20 lokale Nederlandse dialecten . In elke plaats werden twee oudere mannen (conservatieve sprekers) en twee jongere vrouwen (innovatieve sprekers) opgenomen. Op basis van dit materiaal (waarin lexicon, morfologie en klankcomponenten onderscheiden zijn) willen we de volgende vragen beantwoorden:
Veranderen de dialecten? Welke taalcomponent verandert het meest? Groeien dialecten naar elkaar toe? Convergeren dialecten naar het Standaardnederlands? Convergeren dialecten die sterk verschillen van het Standaardnederlands relatief sterker aan de standaardtaal dan dialecten die betrekkelijk verwant zijn aan het Standaardnederlands? Wat zijn de belangrijkste voorspellers voor dialectverandering?



10:40 De structuur-prosodie interface van beperkende en uitbreidende relatieve bijzinnen in het Nederlands en Duits

Constantijn Kaland
Universiteit Leiden (nu: Universiteit van Tilburg)

Hoe volgt prosodie de structuur van taal? Prosodie kan worden gezien als syntactisch gedreven, semantisch gedreven of gedreven door geen van beide (autonoom). Dit onderzoek belicht de structuur-prosodie interface van ingebedde beperkende (RRC) en uitbreidende (ARC) relative bijzinnen in het Nederlands en Duits. RRCs beperkend de klasse waarnaar het antecedent verwijst, terwijl ARCs een extra eigenschap van het antecedent aangeven. Hoe dit verschil in prosodie is gereflecteerd is onderwerp van onderzoek. Voor beide talen is een perceptie experiment uitgevoerd om het effect van toonhoogte en temporele signalen op de interpretatie van RRCs en ARCs te testen. Resultaten wijzen uit dat Nederlandse - en niet Duitse - luisteraars beide bijzinnen van elkaar kunnen onderscheiden op basis van deze signalen. In het algemeen zijn grotere effecten gevonden voor temporele dan voor toonhoogte signalen. Verder kan worden gezegd dat de prosodische realisatie van structurele cohesie (voor RRCs) anders is in het Nederlands dan in het Duits.



11:30 CLARIN: wat is dat?

Arjan van Hessen
CLARIN-NL, Universiteit Utrecht

CLARIN is een grootschalig Europees samenwerkingsprogramma dat erop gericht is, bestaande talige hulpbronnen en technologie op elkaar af te stemmen en ze via centrale servers voor alle onderzoekers beschikbaar te maken. Het idee achter CLARIN is dat de talige technologieŽn en data die de afgelopen decennia ontwikkeld zijn, nog te veel alleen door de TST-onderzoekers zelf worden gebruikt. Buiten de TST-community bestaat er nauwelijks besef van wat er allemaal mogelijk is. CLARIN richt zich daarom nadrukkelijk op alle wetenschappers uit de humaniora en de sociale wetenschappen om hen te overtuigen van de zegeningen die de verschillende bestaande talige hulpmiddelen en instrumenten kunnen bieden voor computerondersteunde taalverwerking. In onze voordracht zullen we proberen te laten zien wat de Nederlandse fonetische gemeenschap mogelijkerwijs aan CLARIN kan hebben, en omgekeerd.
Voorbeeldcase:
Iedere onderzoeker kent het: hij/zij heeft nog kasten/tapes/computerschijven vol prachtige data van veldwerk of experimenteel onderzoek, waar helaas niets meer mee gedaan wordt. Deels omdat de prioriteiten verschoven zijn, deels omdat de software/data niet meer compatibel zijn met de huidige standaarden. Door alles nu onder de CLARIN-vlag te brengen (CLARIN-compatibel te maken), wordt het weer mogelijk deze tools/data te gebruiken, waardoor wellicht de hoeveelheid dubbel werk vermindert en mooie collecties bewaard kunnen blijven.


11:50 Spraakmakende publicaties. Het voorbeeld van Veteran Tapes VP

Henk van den Heuvel
CLST, Radboud Universiteit Nijmegen

Belangrijke aspecten van het wetenschapsbedrijf zijn datacollectie, dataverwerking en publicatie. Nieuwe technologieen,en de alledaagse werkelijkheid van het internet maken allerlei vormen van hergebruik van data mogelijk in het kader van de zogenoemde eHumanities. Een m.i.onderbelicht aspect van eHumanities zijn nieuwe mogelijkheden van digitaal publiceren in de vorm van verrijkte publicaties. Ik zal een voorbeeld hiervan geven aan de hand van het Veteran Tapes VP project. De impact hiervan op datacollectie en dataverwerking komen daarbij vanzelf aan de orde.



12:10 Recent additions to Praat

David Weenink
Universiteit van Amsterdam

Recent additions in Praat are among others the VowelEditor and the KlattGrid. The VowelEditor demonstrates that by varying two formant frequencies only, one can create many different vowels and diphthongs. The KlattGrid is an acoustic speech synthesizer based on a source-filter model of speech production. It is modeled after the famous Klatt synthesizer. By varying parameters as a function of time you can create an infinite amount of speech sounds.



14:00 Gefloten plosieven en andere articulatorische wetenswaardigheden

Luc van Buuren
Linguavox

Bij mijn verhaal over Cardinal Vowels vorig jaar noemde ik al de nauwe relatie met fluiten. Bij mijn weten is daar nooit eerder op gewezen. Na nog wat experimenteren met het fluiten (hoorbaar en onhoorbaar) van Somewhere Over The Rainbow, etc., wil ik nu ook de relatie met palatale-velaire-uvulaire-faryngale consonanten daarbij betrekken. Uitgaande van een fluitbereik/beheersing van ± 3x12 halve tonen zou je wellicht een potentieel van ± 36 (tonglichaam) plosieven en fricatieven kunnen veronderstellen, en evenzovele klinkerplaatsingen in hetzelfde gebied. Articulatorisch fonetisch onderzoek als dit geniet (kennelijk!) niet veel belangstelling meer: de articulatorische fonetiek dreigt zelfs (ten tweede male) kopje onder te gaan. Maar. Van alle dieren heeft onze soort wel het meest fantastische, veelzijdige en (soms) buitengewoon fraaie en ontroerende vocale potentieel. Dus...?



14:20 Een akoestisch-articulatorisch model van medeklinkerinventarissen

Jan-Willem van Leussen
Universiteit van Amsterdam

De foneeminventarissen van gesproken talen verschillen onderling aanzienlijk. Toch zijn er ook opvallende overeenkomsten aan te wijzen: sommige klinkers en medeklinkers zijn in een grote meerderheid van de talen aanwezig, terwijl andere klanken slechts in een fractie van de talen van de wereld voorkomen. Onderzoek met behulp van computermodellen heeft uitgewezen dat vaak voorkomende klinkerinventarissen grotendeels verklaard kunnen worden als een gevolg van twee tendensen: het minimaliseren van articulatorische moeite, en het maximaliseren van perceptueel contrast tussen de klinkers. Ik beschrijf een computermodel om te onderzoeken of medeklinkerinventarissen op dezelfde manier verklaard kunnen worden. Dit model maakt gebruik van verschillende technieken uit de spraaktechnologie: een articulatorische synthesizer genereert de mogelijke klanken, en automatische spraakherkenning wordt gebruikt om de onderlinge perceptuele afstand tussen de klanken te bepalen, en om de resulterende inventarissen te vergelijken met natuurlijke taaldata. De resultaten van het model lijken erop te wijzen dat maximaal contrast en minimale moeite ook een bepalende rol spelen in het ontstaan van medeklinkersystemen, maar dat hiermee niet alle tendensen in medeklinkersystemen verklaard kunnen worden.



14:40 Brabbelen en het gehoor: Aspecten van fonatie en articulatie in het vocalisatiepatroon van doofgeboren baby´s na cochleaire implantatie

Inge Molemans¹, Renate van den Berg¹, Lieve Van Severen¹, Paul Govaerts¹ ² en Steven Gillis¹
¹ CLiPS research center, Departement Taalkunde, Universiteit Antwerpen; ² De Oorgroep, Deurne

Brabbels zijn prelexicale vocaliseringen waarin fonatie en articulatie vlot gecombineerd worden. Normaal beginnen baby's te brabbelen tussen de leeftijd van 6 en 10 maanden ([3], [4], [6], [8]). Bij doofgeboren kinderen ontwikkelt deze belangrijke vocale mijlpaal zich pas veel later of zelfs helemaal niet ([2], [5]). Recent onderzoek heeft aangetoond dat de auditieve stimulatie die zeer vroege cochleaire implantatie (CI) biedt, ervoor zorgt dat doofgeboren baby's gaan brabbelen zoals hun normaal horende leeftijdsgenoten ([1], [7]). Onze studie gaat na of de vocaliseringen van zulke vroeg-geïmplanteerde baby's zich tijdens de brabbelperiode volgens dezelfde patronen ontwikkelen als die van normaal horende kinderen. De resultaten tonen aan dat beide groepen kinderen met vergelijkbare frequenties gebruik maken van brabbeluitingen, maar dat kinderen met een CI relatief vaker uitingen met onderbroken fonatie produceren, terwijl normaal horende kinderen doorlopende fonatie prefereren. De verschillende auditieve ervaring van beide groepen lijkt dus een invloed te hebben op hun vocalisatiepatroon in de prelexicale periode.

Referentielijst
[1] Colletti, V., Carner, M., Miorelli, V., Guida, M., Colletti, L., & Fiorino, F. G. (2005). Cochlear Implantation at under 12 months: Report on 10 Patients. The Laryngoscope, 115(3), 445-449.
[2] Koopmans-van Beinum, F. J., Clement, C. J., & van den Dikkenberg-Pot, I. (2001). Babbling and the lack of auditory speech perception: A matter of coordination? Developmental Science, 4(1), 61-70.
[3] Koopmans-van Beinum, F. J., & van der Stelt, J. (1986). Early stages in the development of speech movements. In B. Lindblom & R. Zetterstrom (Eds.), Precursors of Early Speech (pp. 37-50). New York: Stockton.
[4] Oller, D. K. (1980). The emergence of the sounds of speech in infancy. In G. H. Yeni-Komshian, J. F. Kavanagh & C. A. Ferguson (Eds.), Child Phonology. Volume 1: production (pp. 93-112). New York: Academic Press.
[5] Oller, D. K., & Eilers, R. E. (1988). The role of audition in infant babbling. Child Development, 59, 441-449.
[6] Roug, L., Landberg, I., & Lundberg, L.-J. (1989). Phonetic development in early infancy: a study of four Swedish children during the first eighteen months of life. Journal of Child Language, 16, 19-40.
[7] Schauwers, K., Gillis, S., Daemers, K., De Beukelaer, C., & Govaerts, P. J. (2004). Cochlear implantation between 5 and 20 months of age: The onset of babbling and the audiologic outcome. Otology & Neurotology, 25, 263-270.
[8] Stark, R. E. (1980). Stages of Speech Development in the First Year of Life. In G. H. Yeni-Komshian, J. F. Kavanagh & C. A. Ferguson (Eds.), Child Phonology. Volume 1: production. New York: Academic Press.



15:30 Recognition of reduced words, context use, and age-related hearing loss

Esther Janse & Mirjam Ernestus
Max Planck Instituut voor Psycholinguïstiek & Radboud Universiteit Nijmegen , IFA, Universiteit van Amsterdam

Older adults are often claimed to rely more strongly on context effects and linguistic knowledge to compensate for their poorer hearing. As a test case of linguistic knowledge, we investigated recognition of acoustically reduced words that were followed by a word (such as 'hangende') with which it either formed a fixed expression ('hangende pootjes') or not ('hangende planten'). The two research questions were: a) whether older adults show a greater reliance on the following-word context than young adults, and b) whether simulation of hearing loss in young adults (by low-pass filtering the stimuli) would bring about a stronger reliance on the following context. Data analysis (accuracy and RTs) showed that words were better recognised when part of a fixed expression, and that older adults benefited more in RT than young adults (equal benefit in accuracy). The young adults with simulated hearing loss, however, benefited less than the other two groups (both in accuracy and RT). These results suggest that signal degradation does not immediately lead to greater reliance on following-word context.



15:50 Luisteren naar glimlachen

Hugo Quené
Utrechts instituut voor Linguïstiek OTS, Universiteit Utrecht

Een glimlach heeft waarneembare effecten op de tegelijkertijd geproduceerde spraak. Volgens sommige theorieën heeft de waargenomen glimlach effect op de luisteraar, zowel motorisch (spiegeling van glimlach-gebaar) als emotioneel (meer positieve attitude). Hieruit volgt dat de verwerking van bijpassende positieve woorden (bv "eerlijk") vlotter zal verlopen dan van negatieve woorden (bv "gemeen"). Deze voorspelling werd onderzocht in een proef waarbij een gesproken doelwoord moest worden geclassificeerd als semantisch positief of negatief. De gesproken woorden waren fonetisch bewerkt zodat ze klonken als gesproken met glimlach, neutraal, of met frons. De gevonden reactietijden bevestigen het voorspelde gunstige effect van fonetisch--semantische congruentie. De theoretische implicaties hiervan zijn echter nog onduidelijk.



16:10 De rol van semantische context in de herkenning van gereduceerde woorden

Marco van de Ven¹, Benjamin V. Tucker², Mirjam Ernestus¹ ³
¹ Max Planck Instituut voor Psycholinguïstiek, ² Universiteit van Alberta, ³ Radboud Universiteit Nijmegen

In spontane spraak worden woorden vaak verkort uitgesproken (Johnson, 2004). Luisteraars hebben context nodig om deze gereduceerde woorden te herkennen (Ernestus, Baayen, Schreuder, 2002). In deze studie rapporteren we drie auditieve-lexicale-decisie experimenten, met semantische priming, waarmee we onderzochten in hoeverre semantische context een rol speelt in de herkenning van ongereduceerde en gereduceerde woorden. Luisteraars kregen alleen ongereduceerde (Experiment 1), gereduceerde (Experiment 2), of zowel ongereduceerd als gereduceerd woorden te horen (Experiment 3).
De resultaten voor Experiment 1 laten zien dat het effect van semantische context afhankelijk is van woordfrequentie: Semantische context speelt een grote rol voor laagfrequente, maar niet voor hoogfrequente woorden. Experiment 2 laat zien dat semantische context een ondergeschikte rol speelt in het herkennen van gereduceerde woorden. Uit de resultaten van Experiment 3 blijkt dat de kleine rol van semantische context in Experiment 2 niet zozeer te wijten is aan de gereduceerde uitspraak van de targetwoorden, maar aan hun gereduceerde primes. Dit suggereert dat gereduceerde uitspraakvarianten minder goed contact maken met het lexicon.