Jeg har lavet en udtaleordbog baseret på transskriptionerne i DanPASS-korpusset. Der er en del forbedringer i forhold til den eksisterende:
- Ordbogen er baseret på seneste udgave af DanPASS.
- Den er Unicode-baseret, så man kan kopiere fra den og sætte ind i dokumenter.
- Der er inkluderet fonemrepræsentation.
- Det er html-baseret, hvilket er hurtigere at åbne og søge i end den gamle pdf-udgave.
- Forekomsterne er sorteret efter hyppighed.
- Det samlede antal forekomster af hvert ord er noteret.
Jeg håber på et senere tidspunkt at kunne lave en funktion så man kan se hvor i korpusset pågældende udtale findes, så man kan se hvilken kontekst udtalen forekommer i, og måske endda mulighed for at koble lyd på.