Opdracht 5

Opdracht 5

Maak kennis met eSpeak Text-To-Speech

Het is de bedoeling om via deze opdracht enige ervaring op te doen met tekst-naar-spraaksynthese. We maken daartoe gebruik van een Open Source pakket, eSpeak. Deze software draait onder Windows en onder Linux. Op de eSpeak web-site staan instructies voor installatie en gebruik (http://espeak.sourceforge.net/commands.html).

eSpeak is beschikbaar voor verschillende talen, onder andere Nederlands. Synthetiseer zinnen en teksten in verschillende talen (zoek talen uit die je kent) en vergelijk de kwaliteit. Vergelijk ook "voice variants", dwz, synthetiseer teksten met verschillende stemmen.

Waar gaat het fout? Wat gaat er fout?

Met "espeak -x" kun je de foneemuitvoer zien die eSpeak gebruikt. Je kunt ook fonemen invoeren in eSpeak door ze te omgeven met [[ ]], bv:

espeak -v en "[[D,Is Iz sVm f@n'EtIk t'Ekst 'InpUt]]"

(let op de '-quotes om de klemtoon aan te geven).

Probeer van zinnetjes de kwaliteit te verbeteren door ze als fonemen in te voeren en de fonemen zo aan te passen dat ze beter klinker.

eSpeak kan ook aangestuurd worden met een Speech Synthesis Markup Language (SSML). Markeer een korte paragraaf uit een bestaande tekst zodanig dat het volgens jou goed klinkt.

Uitleg over de SSML tags kun je vinden onder http://espeak.sourceforge.net/ssml.html.

Een voorbeeld van SSML markup:

<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xml:lang="en-US">
<sentence>
Your order for <prosody pitch="+0.5st" rate="-20%">
<say-as type="number"> 8 </say-as> books </prosody>
will be shipped tomorrow.
</sentence>
<sentence>
From <emphasis level="strong">A Tutorial Introduction to SALT</emphasis> <break strength='medium' /> by Mark Huckvale
</sentence>
</speak>
 

Je kunt SSML files laten uitspreken met:

espeak -m -f example.ssml -w voorbeeld.wav

(-w bewaard de synthese in de opgegeven file)

eSpeak ondersteunt helaas de <emphasis> tag niet. Simuleer emphasis met <prosody>. Probeer verschillende instellingen van rate, pitch, pitch range en volume.

 

Bij alle onderdelen maak je een kort verslag (een paar zinnetjes) over hoe de synthese klinkt, in welke situaties het bruikbaar zou kunnen zijn, en welke niet. Verder opmerkingen over wat er goed en fout gaat in de synthese. Let vooral op de intonatie. Probeer niet alleen zelf zinnetjes te verzinnen, maar zoek teksten op uit kranten, teletekst en andere bronnen.

Lever je verslag (in PDF) electronisch in bij de docent via Blackboard (Student Drop Box) en vergeet niet je naam en datering.