De dag van de Fonetiek 2010

Over onderzoek naar
spraak en spraaktechnologie

(http://www.fon.hum.uva.nl/FonetischeVereniging/)

Donderdag 23 december 2010 in de Sweelinckzaal, Drift 21 te Utrecht

Georganiseerd door de Nederlandse Vereniging voor Fonetische Wetenschappen

deelname is gratis, iedereen is welkom

Een pdf-versie van het programma is ook beschikbaar

Eventueel kunt u de poster gebruiken om de Dag van de Fonetiek bij studenten en anderen onder de aandacht te brengen.

Programma

9:00 Ontvangst met koffie

9:25 Opening

9:30-10:30 Ochtendsessie I (voorzitter Bert Schouten)

9:30 De 'scherpe' /z/ en forensische relevantie van segmentele variatie

David van der Vloed

9:50 Uit de forensische spraakkeuken

Jos Vermeulen

10:10 Validiteit van herkomstbepaling op basis van spraak door de IND

Tina Cambier-Langeveld

10:30-11:00 Koffie- en theepauze

11:00-12:20 Ochtendsessie II (voorzitter Willemijn Heeren)

11:00 spraaksynthese met de eigen stem: 4 casestudy's met ALS-patiënten

Arthur Dirksen

11:20 Optimalisatie van tekst-to-speech door gebruik van metainformatie (documentstructuur)

Bouke Versteegh

11:40 De overgang

Ellen Ormel en Onno Crasborn

12:00 Over postura in het NL

Luc van Buuren

12:20-12:50 Algemene Ledenvergadering

12:50-14:00 Lunch

14:00-15:00 Middagsessie I (voorzitter Henk van den Heuvel)

14:00 Schwareductie in Nederlandse woordinitiële lettergrepen

Iris Hanique, Barbara Schuppler, en Mirjam Ernestus

14:20 Klinkerproductie en -perceptie in het Standaardnederlands

Jan-Willem van Leussen

14:40 Effect van luistertype op de perceptie en productie van spraak

Marie Nilsenová

15:00-15:30 Koffie- en theepauze

15:30-16:30 Middagsessie II (voorzitter Willemijn Heeren)

15:30 Een dynamisch perspectief op de ontwikkeling van T2-fonologie: productie en perceptie (afgelast)

Wander Lowie

15:50 Mutual intelligibility of English vowels by chinese dialect speakers

Rongjia CUI en Vincent J. van Heuven

16:10 Mutual intelligibility of Dutch and German cognates by humans and machines

Vincent J. van Heuven, Charlotte Gooskens en Renée van Bezooijen

16:30 Afsluiting en borrel

Abstracts

9:30: De 'scherpe' /z/ en forensische relevantie van segmentele variatie

David van der Vloed // Nederlands Forensisch Instituut, Den Haag

De 'scherpe' /z/ is een variant van de /z/ die geassocieerd wordt met etnolectische spraak en geldt als een van de stereotypes van spraak van jonge allochtonen. De variant is bijvoorbeeld opgemerkt door Dorleijn & Nortier in Turks- en Marokkaans-Nederlands in N. van der Sijs, Wereldnederlands. Oude en jonge variëteiten van het Nederlands (2005).

Deze /z/ is onderzocht in het corpus van het 'Roots of Ethnolectsproject', een samenwerkingsverband tussen het Meertens Instituut en de Radboud Universiteit Nijmegen. Dat corpus bestaat onder andere uit spraak van Amsterdamse en Nijmeegse 20-jarigen met Marokkaanse, Turkse of autochtoon Nederlandse achtergrond. Van 18 proefpersonen zijn 20 /z/'en geselecteerd en gescoord naar perceptieve scherpte van de /z/. Vervolgens is in deze tokens op verschillende akoestische variabelen gemeten, hetgeen een profiel opleverde van wat een scherpe /z/ een scherpe /z/ maakt.

In deze presentatie wordt verder ingegaan op hoe forensische toepassing van fonetiek werkt en hoe het type onderzoek zoals boven beschreven relevant kan zijn.

9.50: Uit de forensische spraakkeuken

Jos Vermeulen // Nederlands Forensisch Instituut, Den Haag

In 2009 is er een onderzoek verricht naar de werkwijze en rapportages van Amerikaanse forensische onderzoekers. In het verslag wordt de forensische wetenschap bekritiseerd en wordt de werkwijze zoals bij DNA-vergelijking als voorbeeld gesteld. Alhoewel forensisch spraakonderzoek er niet rechtstreeks in bekritiseerd wordt (waarschijnlijk is het een te kleine discipline), geeft het rapport een duidelijk signaal. Enerzijds dient er gewerkt te worden aan de validatie van de methoden en technieken en anderzijds moeten er op databases gebaseerde technieken ontwikkeld worden. Ook het onderzoek naar confirmation bias is een belangrijk punt.

In deze presentatie zal ik aangeven hoe er op verschillende fronten wordt gewerkt aan verbetering en objectivering van forensische sprekervergelijking. Er zijn nu verschillende stromingen, die in de presentatie kort uiteen zullen worden gezet. Verder is er een groep onderzoekers die de invloeden van contextinformatie en de daarbij behorende confirmation bias te lijf gaat.

10.10: Validiteit van herkomstbepaling op basis van spraak door de IND

Tina Cambier-Langeveld // Bureau Land en Taal, IND, Den Haag

Bij de IND worden zogeheten ‘taalanalyses’ uitgevoerd om de gestelde herkomst van ongedocumenteerde asielzoekers nader te onderzoeken. Ten behoeve van dit onderzoek worden spraakopnames gemaakt van interviews, waarin de asielzoeker de mogelijkheid krijgt zijn gestelde herkomst aannemelijk te maken door middel van een demonstratie van zijn actieve talenkennis. De IND stelt vervolgens vast of de gedemonstreerde taalbeheersing de gestelde herkomst ondersteunt of niet, en moet hiertoe vaak taalvarianten differentiëren.

Zowel de methode als de conclusies van de IND worden vaak zwaar bekritiseerd, en contra-experts komen regelmatig tot andere conclusies. Uit een onderzoek aan de hand van zaken waarin de daadwerkelijke identiteit achteraf is komen vast te staan, blijkt echter dat in gevallen waarin een contra-expert het niet eens was met de IND, de conclusie van de IND ten aanzien van de gestelde herkomst steeds juist was, en die van de contra-experts dus niet.

In deze presentatie komen de methodologische verschillen tussen de IND en contra-expertises aan bod, en worden de resultaten van bovengenoemd onderzoek gepresenteerd.

11.00: Spraaksynthese met de eigen stem: 4 casestudy's met ALS-patiënten

Arthur Dirksen // Fluency, Amsterdam

De spraaksynthese van Fluency maakt gebruik van een relatief klein corpus voor unitselectie, waardoor in korte tijd een nieuwe stem gemaakt kan worden. Voor sprekers die hun stem dreigen te verliezen, bijvoorbeeld als gevolg van de progressieve spierziekte ALS, kan het de moeite waard zijn het corpus (of een substantieel deel ervan) in te spreken, en hun stem te laten conserveren in de vorm van een spraakdatabase voor de synthesizer. In een later stadium kunnen zij dan hun "eigen stem" gebruiken in een communicatiehulpmiddel.

In deze lezing bespreek ik de resultaten met een viertal sprekers met ALS, en de kunstgrepen die toch wel nodig zijn om van enigszins weerbarstig audiomateriaal bruikbare spraaksynthese te maken.

11.20: Optimalisatie van tekst-to-speech door gebruik van metainformatie (documentstructuur)

Bouke Versteegh // ConsultancyHuis, Amsterdam

De huidige generatie algemeen beschikbare text-to-speech (TTS) systemen (links naar websites) leest tekstbestanden (bv Word-bestand, HTML, PDF) voor aan de gebruiker. Denk hierbij aan situaties waarin de gebruiker auditieve informatie beter tot zich kan nemen dan geschreven informatie, zoals bijvoorbeeld bij het beluisteren van vergaderstukken in de auto, of het beluisteren van collegestof in de sportschool. Echter, in geschreven documenten beperkt de boodschap zich niet slechts tot een rij woorden en zinnen, maar heeft de visuele opmaak een ondersteunende functie voor het begrijpen van de boodschap. Dik gedrukte woorden, lettergroottes, lijsten met bullets, genummerde opsommingen, inspringingen en dergelijke, maken het de lezer makkelijker de functie van elementen en hun onderlinge relaties te begrijpen. Als een TTS-systeem enkel de document-tekst uitspreekt, gaat al deze informatie verloren, en is de documentstructuur minder goed te begrijpen. Voor mijn bachelor-afstudeerstage Kunstmatige Intelligentie onderzoek ik hoe documentstructuur in combinatie met documentinhoud via audio gecommuniceerd kan worden met als doel de begrijpelijkheid te verbeteren. Het ultieme doel is dan vervolgens een applicatie te ontwikkelen waarin deze optimalisatie aan gebruikers kan worden aangeboden in een mobiele omgeving.

11.40:De overgang

Ellen Ormel en Onno Crasborn // Radboud Universiteit Nijmegen, Centre for Language Studies

De articulatie van woorden in gebarentalen bestaat meestal uit een eenvoudige beweging van de vingers door de ruimte. Om van het eind van een gebaar naar het begin van het volgende gebaar de komen, is vrijwel altijd ook een beweging nodig. We probeerden erachter te komen of er een verschil is in kinematische eigenschappen van lexicale gebaarbewegingen versus overgangsbewegingen. Twee vaardige sprekers van Nederlandse Gebarentaal produceerden eenhandige woordparen. Door middel van een Cyberglove en bijbehorende locatie- en oriëntatiesensor werd de beweging van de vingertop in drie dimensies gemeten. De lexicale en transitiebewegingen werden gesegmenteerd met behulp van de gemaakte video-opnames in ELAN, waarna de lengte van de padbeweging van de vingertop alsmede de duur, snelheid en versnelling werden berekend voor de drie segmenten. Allereerst maakte een vergelijking van het eerste en het tweede gebaar duidelijk dat in gebarentaal net als in gesproken taal een effect van finale verlenging optreedt, een bevestiging van een studie van Grosjean (1979) over Amerikaanse Gebarentaal. Verder bleek uit een vergelijking van de beweging tijdens de overgang met die van de lexicale gebaren een significant verschil in snelheid: de beweging tussen gebaren was langzamer dan die binnen gebaren.

12.00: Over postura in het NL

Luc van Buuren // Linguavox

Spreek uit: lontje-lor-lok-lot-Lon-lont-lol. Het schijnt dat (voor de meeste niet-Amsterdammers) de ‘tongue-posture’ steeds iets verder naar achteren helt. De helesyllabe klinkt dan ‘donkerder’. Luister vooral naar en voelook uw begin-lateralen.

Dit roept veel vragen op. Hoe specificeer en doceer je de lippen/tong -postura’s van het NL? Wat is ‘postura’? Waarom maken wij dergelijke niet-distinctieve onderscheidingen? Hoe regelt uw brein dat? Stellen Blondie&Co ook dit nu verplicht voor niet-Edelgermanen…?

In het hoofdstuk ‘Postura’ van mijn Engelse uitspraakcursus (gratis pdf-download op www.linguavox.nl) behandel ik het verschijnsel, met verwijzingen naar het NL en ‘exhaustive rules’ voor het GB Engels. Meer discussie in vBuuren (1995).

L. v. Buuren: English Phonetics Course (for Dutch-speaking students), (1969-)1993, chapter 11; Postura, Clear and Dark Consonants Etcetera, in: J. Windsor Lewis (ed.) Studies in English and General Phonetics, Londen, 1995, pp. 130-142.

14.00: Schwareductie in Nederlandse woordinitiële lettergrepen

Iris Hanique(1,2), Barbara Schuppler(2) en Mirjam Ernestus(1,2) // (1) Radboud University Nijmegen; (2) Max Planck Institute for Psycholinguistics, The Netherlands

In spontane spraak worden vaak niet alle klanken van een woord helemaal uitgesproken. Klanken kunnen erg kort zijn, maar ook compleet afwezig. Bijvoorbeeld, het woord geleden heeft de canonische vorm /xəledə/, maar de eerste schwa kan erg kort zijn en soms zelfs afwezig, zoals in [xledə]. Hoewel van een aantal factoren bekend is dat ze invloed hebben op reductie, is nog niet geheel duidelijk op welke manier ze dat hebben. Om hier meer inzicht in te krijgen, presenteren wij een corpusonderzoek, waarbij de invloed van zowel de voorspelbaarheid van een woord in de context als de morfologische structuur van het woord op de mate van schwareductie werd onderzocht. We hebben ons gericht op schwa in de Nederlandse woordinitiële lettergrepen ge-, be- en ver- en de mate van reductie gemeten als de af- versus aanwezigheid van schwa en de duur van schwa. De resultaten toonden aan dat schwa vaker gereduceerd wordt als de voorspelbaarheid gegeven het volgende woord groter is. Verder is schwa in ge- langer als de lettergreep een prefix is en als de stam vaker voorkomt dan het woord zelf. De resultaten suggereren dat de condities waaronder gereduceerde varianten geproduceerd worden, complexer zijn dan je zou verwachten op basis van de huidige literatuur.

14.20: Klinkerproductie en -perceptie in het Standaardnederlands

Jan-Willem van Leussen // Amsterdam Center for Language and Communication, University of Amsterdam

Voor twintig jonge moedertaalsprekers van het Nederlands hebben wij

(a) opnamen gemaakt van de productie van vijftien Nederlandse klinkers in zes verschillende medeklinkercontexten, en

(b) hun categorisering (in termen van dezelfde vijftien Nederlandse klinkers) van ruim 700 natuurlijke en synthetische klinkers getest.

De perceptiedata stellen ons in staat de Nederlandse perceptieve klinkerruimte nauwkeurig in kaart te brengen. De productiedata kunnen een waardevolle bijdrage leveren aan eerdere metingen van de Nederlandse klinkers, en daarnaast vergeleken worden met de perceptiedata om individuele verschillen in perceptie te relateren aan individuele verschillen in productie.

14.40: Effect van luistertype op de perceptie en productie van spraak

Marie Nilsenova // Tilburg Center For Cognition and Communication, Tilburg University

Aangetoond in psychoakoestische en neurologische onderzoeken is dat voor verschillende luisteraars, verschillende aspecten van een signaal dominanter overgebracht worden. Sommige luisteraars zijn gevoeliger voor informatie die gecodeerd is in fundamentele frequentie, anderen voor de algemene spectrale informatie. Effecten van luistertype zijn al eerder aangetoond voor perceptie van muziek en emoties. De resultaten van ons huidige experimentele onderzoek laten zien dat luisteraars (N=46, 20 mannen, allemaal moedertaalsprekes van het Nederlands) ook verschillen in de perceptie van de lengte van klanken /i/-/i:/, afhankelijk van de spectrale eigenschappen van de klinker in een perceptietaak met 36 varianten van de klinker (combinaties van F1(Hz)={357,326,295,265,236,207} en lengte(ms)={94.6,112,128,145,152,179}). Er is geen effect gevonden op productie van spraak.

15.30: Een dynamisch perspectief op de ontwikkeling van T2-fonologie: productie en perceptie (afgelast)

Wander Lowie // Afdeling Engels/Afdeling Toegepaste Taalwetenschap, Rijksuniversiteit Groningen

Een van de belangrijkste vragen op het gebied van de verwerving van een T2-klanksysteem is of de moeilijkheid van uitspraakproductie kan worden verklaard vanuit de perceptie. Veel onderzoek op dit gebied (bijvoorbeeld Flege, 1995; Wode, 1994) zoekt de verklaring van productieproblemen in (categorische) perceptie. Als er een volgorde effect zou zijn, waarbij productie volgt op perceptie, zou zich dit ook moeten manifesteren in longitudinaal onderzoek. In deze lezing zal ik verslag doen van een kleinschalig longitudinaal onderzoek naar de ontwikkeling van het T2-klanksysteem door Nederlandse leerders van het Engels. Het onderzoek concentreert zich op het VOT-continuüm van /p/ en /b/, variërend van “prevoicing” in Nederlandse stemhebbende plosief /b/ tot aspiratie in de Engelse stemloze variant /p/. Uit de resultaten van dit onderzoek lijkt naar voren te komen dat perceptie en productie elkaar niet op een eenduidige manier opvolgen, maar een patroon van precursor-interactie vertoont, die onder meer afhankelijk is van leeftijdgerelateerde factoren.

Flege, J. E. (1995). Second language speech learning. theory, findings and problems. In W. Strange (Ed.), Speech perception and linguistic experience (pp. 233-277). Timonium, MD: York Press.

Wode, H. (1994). Nature, nurture, and age in second language acquisition: The case of speech perception. SSLA, 16, 325-345.

15.50: Mutual intelligibility of English vowels by Chinese dialect speakers

Rongjia CUI, Vincent J. van Heuven // Phonetics Laboratory, Leiden University

This mutual intelligibility study contains two experiments: the production and the perception of English monophthongs. In the production experiment, 45 male and 45 female first-year Chinese college students were recorded. They hailed from nine different dialectal backgrounds (three supergroups), with five male and five female speakers per dialect group. The stimuli were [hid], [hɪd], [hed], [hæd], [huːd], [hʊd], [hɔːd], and [hɔd].Formants F1 and F2 as well as vowel durations were measured. Linear Discriminant Analyses showed that the speakers’ dialect backgrounds can be predicted better than chance only on the supergroup level. In the perception part, one representative male speaker was chosen for each dialect based on his Euclidian distance from a model American speaker. The representatives’ vowel tokens were then identified and rated for typicality by two 282 first-year undergraduates from the same dialect groups. A significant interlanguage benefit (i.e. better identification results when listener and speaker share the same language background) was found only on the dialect supergroup level.

16.10: Mutual intelligibility of Dutch and German cognates by humans and machines

Vincent J. van Heuven(1), Charlotte Gooskens(2) en Renée van Bezooijen(2) // (1)Phonetics Laboratory, Leiden University; (2)Scandinavian Linguistics, University of Groningen; (3)Department of General Linguistics, Radboud University Nijmegen

Many languages are so closely related that they are mutually intelligible to a certain extent. Mutual intelligibility between language pairs is sometimes asymmetric. For example, Danes understand Swedish better than Swedes understand Danish (Delsing & Lundin Åkesson, 2005; Gooskens et al., in press) and Brazilians understand (Argentinean) Spanish better than Argentineans understand (Brazilian) Portuguese (Jensen, 1989). These results are usually explained by extra-linguistic factors such as asymmetric attitudes towards the (speakers of the) languages involved and unequal experience with the languages. Additionally, linguistic differences can also be asymmetric and can also account for asymmetric mutual intelligibility.

This project aims to investigate factors determining intelligibility between Dutch and German. Dutch listeners (score: 87%) understand German better than Germans (score: 73%) understand Dutch (Ház, 2005). The most obvious explanation for this asymmetry is the fact that Dutch children learn German at school while Dutch is not a part of the curriculum for German children. The first aim of our investigation is to rule out the influence of education by testing mutual intelligibility of Dutch and German with children of 11 to 12 years who have not yet learnt the neighbouring language at school. We selected ca. 750 highly frequent Dutch-German cognate nouns (Celex corpora). These cognates were read aloud by a perfect bilingual speaker of German and Dutch and presented to the subjects in a translation task. Prior tothe intelligibility test, the German and Dutch subjects answered questions on their attitudes towards and experience with the neighbouring language and its speakers.

The second aim of our investigation is to model the mutual Dutch-German intelligibility through automatic speech recognition. Dutch cognates used in the intelligibility test (described above) were presented to a German speech recognizer and the German words to a Dutch speech recognizer of the same make (Dragon NaturallySpeaking Standard version 10). The speech recognizers had been trained by our bilingual speaker in exactly the same way in both languages. The percentage of correctly recognized words per language is our measure of intelligibility. If the German-Dutch intelligibility is asymmetric it can be assumed that non-linguistic factors do not play a decisive role and that the asymmetry can be explained at least partly by linguistic factors.

The results of the human-based experiment will be compared to the results of the computer-based experiment.

Delsing, L. & Lundin Åkesson, K. (2005). Håller språket ihop Norden?[Does language keep together the Nordic countries?] Copenhagen: Nordiska ministerrådet.

Gooskens, C., V.J. van Heuven, R. van Bezooijen & J.J.A. Pacilly (2010). Is spoken Danish less intelligible than Swedish? Speech Communication (in press).

Gooskens, C. & R. van Bezooijen (2006). Mutual comprehensibility of written Afrikaans and Dutch: symmetrical or asymmetrical?Literary and Linguistic Computing.

Ház, E. (2005). Deutsche und Niederländer. Untersuchungen zur Möglichkeit einer unmittelbaren Verständigung. Hamburg: Kovač (Philologia 68).

Jensen, J. B. 1989. On the mutual intelligibility of Spanish and Portuguese. Hispania 72, 848-852.

12.20 Algemene Ledenvergadering van de Nederlandse Vereniging voor Fonetische Wetenschappen

Donderdag 23 december 2010, 12:20 aan de Drift 21 the Utrecht

Tijdens de lunchpauze van de Dag van de Fonetiek organiseert de vereniging haar algemene ledenvergadering. De agenda kent twee agendapunten:

Bestuurssamenstelling

Henk van den Heuvel verlaat het bestuur per 1 januari.

Wilbert Heeringa verlaat het bestuur per 1 januari.

Toekomst van de Vereniging

Het is het bestuur opgevallen dat we de laatste jaren actiever hebben moeten lobbyen voor bijdragen op de Dag van de Fonetiek, en dat de zomerbijeenkomsten minder druk bezocht lijken. Wij zouden graag met de leden van gedachten wisselen over de mogelijke oorzaken van deze ogenschijnlijke terugloop in interesse voor de fonetische wetenschappen en onze vereniging, en over mogelijke aanpassingen voor de toekomst.

Het bestuur is van mening dat de NVFW fonetici in Nederland de kans geeft elkaar te ontmoeten en op de hoogte te blijven van elkaars werk. Daarom moet de Vereniging in elk geval jaarlijks de Dag van de Fonetiek blijven organiseren.

Aan de hand van de volgende onderwerpen zouden we graag verder willen discussiëren:

1. Hoeveel prijs stellen de leden op de themadagen in de zomer? Moeten we deze blijven organiseren in de huidige vorm? Zijn er eventueel voorstellen van onderwerpen die aan de orde zouden kunnen komen?

2. Momenteel komen alle bestuursleden van de universiteiten. Een substantieel deel van de leden is echter niet (primair) verbonden aan een universiteit. Zouden we ernaar moeten streven dat ook leden uit de overheid en het bedrijfsleden zitting nemen in het bestuur, en is hier interesse voor?

3. Op welke manier zouden we nieuwe leden kunnen interesseren voor de Vereniging?

4. Zijn er andere activiteiten of diensten dan het organiseren van bijeenkomsten die de leden op prijs zouden stellen?

Voorstellen voor agendapunten kunt u schriftelijk, of per email, indienen bij de secretaris. Voor informatie over kandidaatstelling en schriftelijk of bij volmacht stemmen voor de bestuursverkiezingen verwijzen wij u naar het Huishoudelijk Regelement (zie: http://www.fon.hum.uva.nl/FonetischeVereniging/Vereniging/Reglement.txt).

Met vriendelijke groet,

Titia Benders, Secretaris van de Nederlandse Vereniging voor Fonetische Wetenschappen