Kategorier
Lydskrift

Ny side: udtaleordbog.dk

Jeg har i mange år drømt om, og stille og roligt arbejdet hen imod, at lave en udtaleordbog. Det er nu blevet konkretiseret på siden http://udtaleordbog.dk/.

Siden er ganske ny og spæd, og der mange funktioner der ikke er live endnu, og der er på første dag kun 2000 ord i ordbogen.

Men hold øje med siden. Der kommer meget mere fonetikguf i fremtiden.

Kategorier
Fonologi Lydskrift

Udtaleordbog med lydeksempler

Jeg har opdateret udtaleordbogen. Udtaleordbogen er baseret på data som jeg har trukket ud af DanPASS-korpusset. Som noget nyt har jeg tilføjet

  • fonologiske stavelsesgrænser
  • kanonisk udtale
  • lydeksempler

De fonologiske stavelsesgrænser har jeg genereret automatisk ud fra de anvisninger der er givet af Grønnum (2007).

Den kanoniske udtale er ligeledes (med ganske få undtagelser) autogenereret  ud fra de anvisninger der er givet af Grønnum (2005) plus mine egne regler for schwa-assimilation.

Lydeksemplerne er klippet ud af korpusset. Der er givet op til tre tilfældigt udvalgte eksempler for hver unik annotation. Da eksemplerne er udvalgt tilfældigt, er de ikke nødvendigvis de mest repræsentative eksempler på den pågældende udtale. Hvis man ønsker nærlytning, kan man downloade lydfilerne ved at højreklikke på linket og åbne dem i fx praat.

Kategorier
Lydskrift Udtale

Ny udtaleordbog baseret på DanPASS

Jeg har lavet en udtaleordbog baseret på transskriptionerne i DanPASS-korpusset. Der er en del forbedringer i forhold til den eksisterende:

  • Ordbogen er baseret på seneste udgave af DanPASS.
  • Den er Unicode-baseret, så man kan kopiere fra den og sætte ind i dokumenter.
  • Der er inkluderet fonemrepræsentation.
  • Det er html-baseret, hvilket er hurtigere at åbne og søge i end den gamle pdf-udgave.
  • Forekomsterne er sorteret efter hyppighed.
  • Det samlede antal forekomster af hvert ord er noteret.

Jeg håber på et senere tidspunkt at kunne lave en funktion så man kan se hvor i korpusset pågældende udtale findes, så man kan se hvilken kontekst udtalen forekommer i, og måske endda mulighed for at koble lyd på.