Ny udtaleordbog baseret på DanPASS

Jeg har lavet en udtaleordbog baseret på transskriptionerne i DanPASS-korpusset. Der er en del forbedringer i forhold til den eksisterende:

  • Ordbogen er baseret på seneste udgave af DanPASS.
  • Den er Unicode-baseret, så man kan kopiere fra den og sætte ind i dokumenter.
  • Der er inkluderet fonemrepræsentation.
  • Det er html-baseret, hvilket er hurtigere at åbne og søge i end den gamle pdf-udgave.
  • Forekomsterne er sorteret efter hyppighed.
  • Det samlede antal forekomster af hvert ord er noteret.

Jeg håber på et senere tidspunkt at kunne lave en funktion så man kan se hvor i korpusset pågældende udtale findes, så man kan se hvilken kontekst udtalen forekommer i, og måske endda mulighed for at koble lyd på.

Indsæt dania-lydskrift i dine dokumenter

Jeg har forbarmet mig over dem der benytter dania-lydskrift og lavet ikke bare en, men to tegnvælgere, ligesom jeg for nogle måneder siden lavede en IPA-tegnvælger, altså et lille værktøj hvor man kan klikke på lydskriftsymbolerne frem for at skulle lede efter dem i teksbehandlingsprogrammets tegnoversigt.

Grunden til at jeg har lavet to forskellige tegnvælgere, er at der ikke er nogen optimal løsning hvis man skal skrive dania-lydskrift.

  • Unicode-baseret dania-tegnvælger. Fordelen ved at bruge unicode er at det kan genkendes universelt. Man kan fx sende sit dokument til andre, og de kan læse lydskriften uden problemer, og man kan benytte skriften på internetsider. Desværre er der to væsentlige dania-symboler som ikke understøttes af unicode, nemlig et spejlvendt j (IPA: [ɪ̯]) og et oblikt å (IPA: [ɔ]) (oblik er en særlig type kursiv). Jeg foreslår at man bruger IPA-symbolerne i stedet.
  • Dania-tegnvælger baseret på dania-fonten: Denne tegnvælger kræver at man har en særlig font ved navn dania installeret på sin pc. Fonten er symbol encoded, dvs. de viste symboler svarer ikke til de taster man trykker på. Det betyder at lydskriften kun kan læses på pc’er der har fonten installeret. Denne metode frarådes generelt, men det kan være nødvendigt ift. at vise en lang række specielle dania-tegn som ikke understøttes af unicode.

Disse og mange andre problemer kan helt undgås hvis man går over til at bruge IPA i stedet for dania når man skriver lydskrift.

Jeg tager gerne imod forslag til forbedringer af disse tegnvælgere.

Opdatering af IPA-tegnvælgeren

Jeg er blevet en smule skrappere til at lave scripts, så nu har jeg lavet en opdatering af IPA-tegnvælgeren. Tidligere blev nye tegn altid tilføjet i slutningen af tekststrengen. Nu bliver tegnet tilføjet der hvor du placerer cursoren.

Der er stadig et problem med at få vist [ː] ordentligt i Internet Explorer. Det er ikke noget jeg kan gøre noget ved. Skriv til Microsoft og brok jer.

IPA-tegnvælger

Jeg har et par aftner brygget på en IPA character picker, altså et program hvor man kan klikke på en oversigt over IPA-symboler når man skal skrive lydskrift, i stedet for at famle sig igennem diverse tekstbehandlingsprogrammers ‘indsæt symbol’-funktion.

Jeg var lidt utilfreds med de andre tegnvælgere jeg kender til, og så har jeg i min tegnvælger tilføjet en oversigt over de almindeligste symboler til at lydskrive dansk.

Der er dog altid bøvl når man skal vise særlige symboler i forskellige browsere, så jeg vil gerne høre om den ser ordentlig ud hos andre, eller om der er noget jeg kan gøre for at rette den til. Tag et kig, og send en kommentar hvis det ser mærkeligt ud, så vil jeg prøve at rette op på det.

Indtil videre ser den fin ud i min browser (firefox 3).  Min Internet Explorer viser også siden ordentligt, bortset fra at længdetegn ser mærkelige ud, men det er kan vist ikke være anderledes.

Indsæt lydskrift i dine dokumenter

Her er nogle metoder til at indsætte IPA lydskrift i elektroniske dokumenter og tekstbehandlingsprogrammer. Alle metoder benytter unicode.

1. Online IPA-tegnvælger

Jeg har lavet en IPA-tegnvælger hvor man kan skrive IPA-lydskrift ved at klikke på symbolerne. Teksten kan kopieres og sættes ind i ethvert program der understøtter unicode (det gør de fleste). Hvis siden ikke virker ordentligt, kan du evt. prøve rishida.net.

2. Indsæt specialtegn

Dit tekstbehandlingsprogram har typisk en funktion til at indsætte specialtegn. I OpenOffice skal du trykke alt+i, s, enter. Så popper der en tegnvælger op. Her skal du vælge en skrifttype der understøtter unicode, fx Arial eller Lucida. Her er der en liste over almindelige og downloadbare IPA-fonte.

3. Søg og erstat

Hvis man skal skrive længere passager med lydskrift, kan det være tidsbesparende at skrive det i en quick-and-dirty lydskrift der er baseret på tegnene på dit tastatur. Derefter kan man lave en masse søg og erstat-kommandoer hvor man udskifter tegnene med tilsvarende IPA-symboler.

Problemløsninger

Hvis ovenstående metoder ikke virker for dig, er det måske fordi du sidder med et dårligt tekstbehandlingsprogram eller en dårlig browser. Prøv evt. de gode, gratis programmer OpenOffice (tekstbehandling) og Firefox (browser). Det virker for mig.

Advarsel

I gamle dage brugte man ofte et tilpasset ASCII-tegnsæt (fx SIL IPA93) til at skrive lydskrift. Man kan stadig støde på at det bliver anbefalet. Hold dig fra det. Brug i stedet unicode. Ulemperne ved ASCII-tegnsættene er mange, bl.a. at dit dokument typisk ikke kan læses af andre end dig selv.

[ˈgoːˀ fɐˈnʌjˀl̩sə]