Inleiding

Handleiding voor het oplijnen van fonetische transcripties met spraak.

Algemene Inleiding

Dit is een handleiding voor het oplijnen van een fonetische transcriptie met een opgenomen spraakuiting. Het beschrijft hoe de grenzen tussen de fonemen bepaald moeten worden.

Het uitgangspunt van het oplijnen is dat in een spraakuiting de fonemen elkaar opvolgen als kralen aan een ketting. Dit is echter een idealisering die ver van de realiteit ligt. Een van de fundamentele eigenschappen van spraak is dat naburige fonemen elkaar juist 'overlappen'.

Bij het oplijnen is het de bedoeling dat de grenzen zo geplaatst worden dat ieder segment zo min mogelijk beinvloed (besmet) wordt door zijn buren. Dit lukt slecht als alleen de golfvorm en het gehoor worden gebruikt. Een of andere vorm van spectrale weergave van de spraak is nodig. Meestal wordt een spectrogram, met of zonder formanten, gebruikt (voor de betekenis van deze termen zie de Praat manual).

Het oplijnen van transcripties met spraak is tijdrovend, en dus duur. Er moeten dus afwegingen gemaakt worden tussen precisie en snelheid. Uit eerdere ervaringen is gebleken dat het gebruik van volledige spectrogrammen leidt tot een grote precisie, maar erg traag werkt. Daarom is hier besloten de spectrale informatie op ieder tijdstip te condenseren tot een enkel getal: De spectrale balans (eigenlijk het spectrale zwaartepunt), hier verder aangegeven met de Engelse afkorting CoG (Center of Gravity). Dit getal geeft de kantelfrequentie van het spectrum weer (in semitonen).

Uit eerder onderzoek is gebleken dat de CoG op een karakteristieke manier varieert met de articulatie. Samen met de golfvorm is een snelle en nauwkeurige opdeling van spraak mogelijk die sterk overeenkomt met wat 'hoorbaar' is.