Skip navigation links 20082009.SPRAAKHERKENNING EN -SYNTHESE (15.OWII.BAISHS6.1.20082009) > COURSE DOCUMENTS > SESSIE 3 EDIT VIEW
End navigation links

Sessie 3

Item Sessie 3
pdf-file CGN (49.374 Kb)

week 3 (donderdag 18 september)

Voorbereiding: lees artikel over 'Corpus Gesproken Nederlands' (klik op 'pdf-file' hierboven) en bezoek de zeer informatieve website van het CGN (zie External Links). Lees ook sectie 6.1 (Counting words in corpora, pag 194 ev) in Jurafsky & Martin.

spraakbestanden, CGN

taalbestanden

nut en noodzaak voor spraaktechnologie

Segmentatie en labeling

orthografische transcriptie, pos-tagging, lemmatisering, fonemische transcriptie, prosodische transcriptie, automatische woordsegmentatie via geforceerde herkenning

fonetische tekens (zie externe links)

zie Opdracht 4 (Segmenteren en labelen) (onder Assingments)

 
Item Corpus Gesproken Nederlands
Item IPA phonetic alphabet
Het officiele fonetische alfabet
Item WorldBet
Computer leesbare fonetische tekens
Item Phonetic Symbols in Praat
Het praat programma zelf bevat enkele symbolenkaarten.

OK