![]() |
|
![]() |
![]() |
Sessie 3 pdf-file CGN (49.374 Kb) week 3 (donderdag 18 september) Voorbereiding: lees artikel over 'Corpus Gesproken Nederlands' (klik op 'pdf-file' hierboven) en bezoek de zeer informatieve website van het CGN (zie External Links). Lees ook sectie 6.1 (Counting words in corpora, pag 194 ev) in Jurafsky & Martin. spraakbestanden, CGN taalbestanden nut en noodzaak voor spraaktechnologie Segmentatie en labeling orthografische transcriptie, pos-tagging, lemmatisering, fonemische transcriptie, prosodische transcriptie, automatische woordsegmentatie via geforceerde herkenning fonetische tekens (zie externe links) zie Opdracht 4 (Segmenteren en labelen) (onder Assingments) |
|
![]() |
Corpus Gesproken Nederlands |
|
![]() |
IPA phonetic alphabet Het officiele fonetische alfabet |
|
![]() |
WorldBet Computer leesbare fonetische tekens |
|
![]() |
Phonetic Symbols in Praat Het praat programma zelf bevat enkele symbolenkaarten. |