Correcties

Er kunnen zich problemen voordoen met de automatisch verkregen transcripties.

Correcties op de transcriptie en de oplijning

Er wordt gewerkt met een automatisch verkregen transcriptie. Alhoewel de transcriptie meestal een goede weergave zal zijn van de uitspraak zijn 'fouten' onvermijdelijk. De volgende fouten kunnen onderscheiden worden:

Bij het vergelijken van de transcriptie met de uiting moet er op gelet worden dat fonemen die geisoleerd van hun context beluisterd worden meestal anders klinken dat in het geheel. De /o/ in 'ook' kan als een /O/, /u/ of /@/ klinken als hij uit zijn context gehaald wordt terwijl het als een perfecte /o/ klinkt in de hele zin.

Soms is een foneem, b.v., een schwa (/@/), in zijn geheel niet terug te vinden in 'geisoleerde' vorm, en tegelijkertijd goed hoorbaar in het woord of de zin. Daarom is het noodzakelijk om de transcriptie altijd te beoordelen op woord of zinsnivo. Op zijn minst moeten de twee buurfonemen tegelijkertijd beluisterd worden.

De transcriptie is verkeerd

Als er duidelijk een andere klinker of medeklinker gezegd is dan er getranscribeerd is moet de transcriptie aangepast worden. Dit betekent dat in de Phoneme tier het symbool dat er staat vervangen wordt door het correcte symbool.

Een uitzondering wordt gemaakt voor de "gevulde pauzes", d.w.z., uitingen als 'uh', 'hm', 'enne'. Dit soort uitingen is erg variabel en een canonieke transcriptie is eigenlijk niet mogelijk. Ze moet alleen gecorrigeerd worden als er geen verband is tussen transcriptie en uiting. Een voorbeeld zou zijn dat de transcriptie zegt /@/ terwijl /Enn@/ hoorbaar is.

Fonemen zijn weg

Een veel voorkomend geval is het weglaten van de meervouds /n/ die soms wel en soms niet voorgelezen wordt. Maar er zijn ook allerlei 'versprekingen' mogelijk, b.v., [kun je] -> [kuje].

Niet uitgesproken fonemen moeten normaal met grens en al verwijderd worden. De tekst op de Syllable en Word tiers hoet niet aangepast te worden.

Niet uitgesproken fonemen kunnen ook blijven staan, maar dan wordt hun zo kort mogelijk gemaakt. Dit betekent dat de begingrens van het niet aanwezige foneem zo dicht mogelijk op zijn eindgrens gezet wordt. Dit vereist enige handigheid, maar het is mogelijk om de duur kleiner dan 1 ms te maken. Het is belangrijk om ervoor te zorgen dat het begin van het volgende foneem goed staat. Het is niet nodig om de transcriptie van de betrokken syllabe aan te passen, dat gebeurt later automatisch.

Fonemen zijn toegevoegd

Duidelijk hoorbare toevoegingen moeten met grenzen en al in de Phoneme tier toegevoegd worden. Bekende voorbeelden zijn de ingevoegde meervouds /n/ en 'film': | f | I | l | m | -> | f | I | l | @| m | type toevoegingen. Als er, zoals in het tweede voorbeeld, een nieuwe syllabe ontstaat, moet er ook een nieuwe syllabegrens gezet worden. De syllabetekst hoeft niet toegevoegd te worden, d.w.z., het syllabelabel kan leeg blijven.

De belangrijkste kategorie toegevoegde segmenten vormen de stiltes. Overal waar er een stilte van meer dan 10 miliseconden valt tussen twee fonemen moet een stilte toegevoegd worden. Er hoeft dan alleen een grens gezet te worden. Let erop dat stiltes ook als syllaben en woorden gelden en dus (bijna) altijd ook in de Syllabe en Word tiers toegevoegd moet worden. De stilte zelf hoeft niet 'getranscribeerd' te worden. Dit alles geldt natuurlijk niet voor de stilte voor een plosief!

Fonemen zijn onscheidbaar

Soms is het gewoon niet mogelijk om twee fonemen uit elkaar te halen. Soms komt dit omdat een foneem aan het woordeinde versmelt met die aan het begin van het volgende woord. Soms ook omdat een stemloze schwa versmelt met de daarvoor komende fricatief (zoals in 'gekomen'). Soms ook gewoon omdat twee fonemen naadloos in elkaar overgaan.

In principe moet er altijd een grens geplaatst worden tussen twee fonemen ook al is dat erg moeilijk. Als de golfvorm, Spectral Center of Gravity (CoG) noch het gehoor een positie voor de grens tussen twee fonemen aangeven, moeten de volgende kriteria gebruikt worden (in deze volgorde):

Wanneer twee identieke fonemen elkaar volgen, versmelten ze vaak en is het niet mogelijk een grens ertussen te vinden. Soms assimileerd een foneem ook met een volgend en "verdwijnt" dan, b.v., 'aanmaken': | a | n | m | a | k | @| -> | a | m-m | a | k | @| zonder een echte grens tussen de resten van de oude | n | en | m |. Zolang er twee verschillende fonemen hoorbaar zijn, moet er een grens gezet worden. Zo niet, dan 'versmelten' ook de labels, d.w.z, het foneem aan het einde van de lettergreep wordt verwijderd (dwz., zijn duur wordt zo klein mogelijk gemaakt) en alleen het foneem aan het begin van de lettergreep blijft staan. In het voorbeeld wordt de /n/ weggehaald, als ze niet meer hoorbaar is, en de /m/ blijft staan. Als de /m/ ambisyllabisch is (d.w.z., klinkt alsof hij zowel aan het einde van de eerste syllabe staat als aan het begin van de tweede) dan wordt ze geschreven als /m-m/. De grens blijft ook dan opgelijnd met het begin van de tweede syllabe.

Wanneer twee identieke, of geassimileerde, fonemen over een woordgrens heen versmelten, dan moet de grens ertussen weggehaald worden. De fonemen zelf worden dan aan elkaar gekoppeld met een '_'. B.v., 'een negen': | @| n | n | e | x | @| -> | @| n_n | e | x | @|.

Wanneer er meer dan twee verstaanbare fonemen echt niet gescheiden kunnen worden moeten alle grenzen ertussen weggehaald worden. De symbolen worden dan samengevoegd tot een enkel label. Als de fonemen in verschillende lettergrepen zitten, moet er een '-' tussen de symbolen gezet worden op de syllabegrens, b.v., in 'gegeven': |x|@|x|e|v|@| -> |x@-x|e|v|@|. Als er een woordgrens tussen zit, moet er een '_' tussen gezet worden. B.v., 'wat is 't': | w | A | t | I | s | @| t | -> | wAt_Is_@t|.

Wanneer fonemen uit verschillende woorden samengevoegd worden moeten de betrokken woordgrenzen halverwege de combinatie gezet worden.

Er is geen transcriptie

Van sommige woorden is geen transcriptie beschikbaar. Dat zijn meestal afgebroken woorden of woorden uit een vreemde taal. Het kan ook sporadisch voorkomen dat er nog een goed nederlands woord tussen zit waar geen transcriptie van is. In de Syllabe en Phoneme tiers staat dan de orthografische vorm gevolgd door een '*a' (afgebroken woorden), een '*v' (vreemde woorden) of een '*x' (onverstaanbaar geluid). Andere niet getranscribeerde woorden staan tussen twee '*'.

Woorden zonder transcriptie worden opgelijnd op hun grenzen en verder genegeerd. Dwz., als er staat | afgebr*a | dan hoort de begingrens bij de /A/ en de eindgrens bij het einde van het fragment (dat hoeft niet de /r/ te zijn).

Foneemklassen

Links to this page


© Rob van Son, October 11th, 2000