Lær noget nyt på den sjove måde:

Næsehulen og stemmelæberne McGurk-effekten Overtonesang Kardinalvokalerne Hvorfor får man lys stemme når man inhalerer helium? Strubesang

Lydskrift

Ord der udtales som de staves

Dansk retskrivning er som bekendt ikke særlig lydret, men vi har dog ord, som fx nu, vi, møl og nevø, som kan udtales nøjagtig som var det lydskrift [nu vi møl nevø]. Jeg har bladret mine udtaleordbøger og min hjerne igennem for at finde de længste sådanne ortografonemiske ord (jep, det var et ord jeg selv har fundet på, og ja, det indeholder en haplologi).

Man er nødt til ikke at være for striks. Hvis man forlanger meget fin lydskrift, kommer man naturligvis ikke ret langt, for så skal der læsses en masse diakritika på. Men hvis man bruger almindelig grov IPA, går det lidt lettere.

Til at begynde med kan man udelukke alle ord med lang vokal eller stød – den slags ting markerer vi ikke i ortografien. Og vi har heller ikke noget schwa! Til gengæld vedtager jeg at alle ord kan udtales ubetonet, for så slipper jeg for at tage stilling til tryk, som heller ikke markeres ortografisk.

Umiddelbart kan jeg finde ortografonemiske ord på op til syv bogstavers længde:

  • antabus
  • husblas
  • syfilis

Der er også en del på seks bogstaver:

  • bikini
  • valuta
  • kalaha
  • plasma
  • kandis
  • sultan

Og på fem bogstaver har vi bl.a. antal, banjo, dildo, metal, salsa, halal, tyfus, mysli, panda, miljø, gebis.

Hvis vi nu siger at /p t k/ kan aspireres finalt – det kan de godt – så kan vi inkludere ord der slutter på p, t, k, herunder en masse afledninger der slutter på -isk eller -ist. Således kommer vi op på 10 bogstavers længde:

  • minimalist (10 bogstaver)
  • positivist (10)
  • violinist (9)
  • analytisk (9)
  • bandagist (9)
  • alkymist (8)
  • feminist (8)
  • basilisk (8)
  • humanist (8)
  • finalist (8)
  • nihilist (8)
  • metodist (8)
  • semantik (8)

Og ikke mindst:

Det kunne selvfølgelig være rart hvis man kunne udbygge det til fx positivistisk (13), men jeg kan ikke få mig selv til at aspirere det andet t – det bliver [positivisdisk].

Og så kan man naturligvis begynde at sætte ordene sammen til mere eller mindre rimelige ord. Her kan man drage nytte af at nogle vokaler taber stød og længde i sammensætninger:

  • miljøpolitik (12)
  • semifinalist (12)
  • halalhumanist (13)
  • fonologivolapyk (15)
  • kalahaminimalist (16)
  • osv.

Hvis man nu brugte dania i stedet for IPA – hvilket man selvfølgelig ikke gør – men alligevel, hvis man nu gjorde, så kunne man også finde ord med bogstaverne æ, å og r – å hjælper dog ikke stort, da det stort set altid er en lang vokal hvis den har å-kvalitet. Men af længere ord kan det nævnes at inkluderingen af æ giver os fx pædagogik (9), og r giver os fx problematik (11).

Jeg har garanteret langt fra fanget alle, så hvis du kommer på nogle gode ortografonemiske ord, så smid gerne en kommentar.

Korte, lange og ekstralange konsonanter

I dansk skelner man mellem korte og lange vokaler, fx i [kulə] kulde vs. [kuːlə] kugle. Vi er ikke vant til at tænke på at vi også har forskel på korte og lange konsonanter, men faktisk har vi en kontrast mellem mindst tre forskellige konsonantlængder: kort, lang og ekstralang med stavelsestop. Det fremgår fx af denne minimaltrio:

  • [bɔnə] bonde – kort n
  • [bɔnnə] bundne – langt n
  • [bɔnn̩nə] bundene – ekstra langt stavelsesbærende n

Lange og ekstralange konsonanter i dansk stammer altid fra at der er flere underliggende stavelser, og det er derfor vi traditionelt lydskriver dem med dobbelt- og tripelkonsonant. Der er fonologisk, morfologisk og sikkert også kognitivt tale om flere ens nabokonsonanter snarere en enkelt lang eller ekstralang konsonant.

Dobbeltkonsonanter findes oftest i sammensatte ord som

  • [issyːˀl] issyl
  • [gullʌg] Guldlok
  • [sdʌbbʌlˀd] stopbold

Vi kan også fakultativt have konsonantforlængelse hvor der underliggende er tale om et /r/, fx

  • [bɛððɐ] bedre
  • [hʌjjɐ] højre
  • [feŋŋɐ] fingre

Tripelkonsonant findes kun med [n] og [l] i ord som rindende, hundene, uudholdelig, adskillelig. Fakultativt kan det nok også findes i sammensatte ord som [ʌnn̩nøðˀ] åndenød, men fornemmelse er at vi foretrækker et distinkt schwa her [ʌnənøðˀ].

Når man lydskriver, kan man komme ud for at have brug for hele fem forskellige måder at annotere konsonantlængde på. De er dog ikke alle distinktive, men varierer alt efter den fonologiske kontekst de indgår i:

  1. Kort, fx [vɛn] ven. Defaultlængden.
  2. Kort syllabisk, fx [lɛːn̩] læne. Bruges ved schwa-assimilation i åben stavelse efter lang vokal.
  3. Lang ikke-syllabisk, fx [svɔnnə] svundne. Bruges når coda-konsonant møder ansats-konsonant.
  4. Lang syllabisk med final stavelsestop, fx [vɛnn̩ sɛːnn̩] vende, Seinen. Bruges ved schwa-assimilation efter kort vokal og/eller lukket stavelse.
  5. Lang syllabisk med initial stavelsestop, fx [liːn̩nə] lignende. Bruges ved schwa-assimilation efter lang vokal i proparoxytone ord.
  6. Ekstralang syllabisk, fx [sbɛnn̩nə] spændende. Bruges ved schwa-assimilation efter kort vokal i proparoxytone ord.

Hvis man virkelig skal gå i detaljer, er der vist statistisk set en forskel på varigheden af konsonanten i type 4 alt efter om schwa-stavelsen er åben eller lukket og om foranstående vokal er kort eller lang, dvs. [vɛnn̩ ɛnn̩ sɛːnn̩] vende, enden, Seinen har vistnok systematisk forskellig varighed selvom de annoteres ens. Og lur mig om ikke tilstedevær af stød også påvirker konsonantvarigheden i en eller anden grad.

Bevæggrunden for at man skelner mellem at skrive et, to eller tre konsonantsymboler og syllabicitetstegn på første/midterste/sidste konsonant, skal findes i dels den akustiske varighed, dels i at stavelsestoppen ligger enten centreret eller højre-/venstreforskudt alt efter den underliggende stavelsesstruktur.

Man skeler dog nok også til en symmetri med lignende ord med andre konsonanter. Man kan let være fristet til at droppe en af konsonanterne i [vʌll̩li sbɛnn̩nə] voldelig, spændende, men da disse ord er opbygget fonologisk og morfologisk som fx [ʌnn̩li kʌmm̩nə] åndelig, kommende hvor der er mindre tvivl om annotationen, er man på den sikreste side hvis man bevarer tripelkonsonanterne i de første ord.

Konsonantlængde i andre sprog

Mange sprog har som dansk en forskel på korte og lange konsonanter, men ligesom på dansk findes lange konsonanter typisk kun mellem to vokaler og kan således fortolkes som at der underliggende er to ens konsonanter der støder sammen.

Det er heller ikke ualmindeligt at konsonantvarighed varierer betydeligt betinget af den fonologiske kontekst de indgår i. I fx svensk og norsk er konsonanter typisk betydeligt længere efter korte vokaler end efter lange (vi har spor af dette i dansk ortografi hvor kort vokal signaleres med dobbeltkonsonant). I fx engelsk og fransk er sonore konsonanter typisk betydeligt længere foran stemte lukkelyde end foran ustemte.

Jeg har aldrig stødt på nogen sprog der har en klokkeklar fonologisk længdekontrast i konsonanter, da konsonantlængde således typisk kan kædes sammen med enten en tostavet struktur eller med sekundære faktorer. Jeg har heller aldrig stødt på nogen sprog andet end dansk, der skelner mellem mere end to konsonantlængder. Men det findes nok derude et sted.

Udtaleordbog med lydeksempler

Jeg har opdateret udtaleordbogen. Udtaleordbogen er baseret på data som jeg har trukket ud af DanPASS-korpusset. Som noget nyt har jeg tilføjet

  • fonologiske stavelsesgrænser
  • kanonisk udtale
  • lydeksempler

De fonologiske stavelsesgrænser har jeg genereret automatisk ud fra de anvisninger der er givet af Grønnum (2007).

Den kanoniske udtale er ligeledes (med ganske få undtagelser) autogenereret  ud fra de anvisninger der er givet af Grønnum (2005) plus mine egne regler for schwa-assimilation.

Lydeksemplerne er klippet ud af korpusset. Der er givet op til tre tilfældigt udvalgte eksempler for hver unik annotation. Da eksemplerne er udvalgt tilfældigt, er de ikke nødvendigvis de mest repræsentative eksempler på den pågældende udtale. Hvis man ønsker nærlytning, kan man downloade lydfilerne ved at højreklikke på linket og åbne dem i fx praat.

Konverter SIL IPA93 til Unicode

I gamle dage brugte man fonten SIL IPA93 når man skulle skrive lydskrift i tekstdokumenter. I dag bruger de fleste Unicode. Fordelen ved Unicode er at det kan læses på alle moderne pc’er og det kan findes af søgemaskiner, mens SIL IPA93 krævede at man havde fonten installeret for at man kunne læse det.

Hvis man vil konvertere dokumenter med lydskrift skrevet i SIL IPA93 til Unicode, er der en meget besværlig guide på SIL’s hjemmeside. Det kræver at man downloader software og tilføjelsespakker og hvad ved jeg. Dernæst skal programmet konfigureres, og der er særlige metoder alt efter hvilket tekstbehandlingsprogram man bruger. Meget besværligt, og jeg har endnu ikke fået det til at virke.

Derfor har jeg lavet et supernemt og hurtigt script som konverterer SIL IPA93 til Unicode. Det er online, og det kræver ingen download eller installering, bare et klik på en knap.

Et meget nyttigt værktøj (for formodentlig ganske få mennesker).

Ny udtaleordbog baseret på DanPASS

Jeg har lavet en udtaleordbog baseret på transskriptionerne i DanPASS-korpusset. Der er en del forbedringer i forhold til den eksisterende:

  • Ordbogen er baseret på seneste udgave af DanPASS.
  • Den er Unicode-baseret, så man kan kopiere fra den og sætte ind i dokumenter.
  • Der er inkluderet fonemrepræsentation.
  • Det er html-baseret, hvilket er hurtigere at åbne og søge i end den gamle pdf-udgave.
  • Forekomsterne er sorteret efter hyppighed.
  • Det samlede antal forekomster af hvert ord er noteret.

Jeg håber på et senere tidspunkt at kunne lave en funktion så man kan se hvor i korpusset pågældende udtale findes, så man kan se hvilken kontekst udtalen forekommer i, og måske endda mulighed for at koble lyd på.

Indsæt dania-lydskrift i dine dokumenter

Jeg har forbarmet mig over dem der benytter dania-lydskrift og lavet ikke bare en, men to tegnvælgere, ligesom jeg for nogle måneder siden lavede en IPA-tegnvælger, altså et lille værktøj hvor man kan klikke på lydskriftsymbolerne frem for at skulle lede efter dem i teksbehandlingsprogrammets tegnoversigt.

Grunden til at jeg har lavet to forskellige tegnvælgere, er at der ikke er nogen optimal løsning hvis man skal skrive dania-lydskrift.

  • Unicode-baseret dania-tegnvælger. Fordelen ved at bruge unicode er at det kan genkendes universelt. Man kan fx sende sit dokument til andre, og de kan læse lydskriften uden problemer, og man kan benytte skriften på internetsider. Desværre er der to væsentlige dania-symboler som ikke understøttes af unicode, nemlig et spejlvendt j (IPA: [ɪ̯]) og et oblikt å (IPA: [ɔ]) (oblik er en særlig type kursiv). Jeg foreslår at man bruger IPA-symbolerne i stedet.
  • Dania-tegnvælger baseret på dania-fonten: Denne tegnvælger kræver at man har en særlig font ved navn dania installeret på sin pc. Fonten er symbol encoded, dvs. de viste symboler svarer ikke til de taster man trykker på. Det betyder at lydskriften kun kan læses på pc’er der har fonten installeret. Denne metode frarådes generelt, men det kan være nødvendigt ift. at vise en lang række specielle dania-tegn som ikke understøttes af unicode.

Disse og mange andre problemer kan helt undgås hvis man går over til at bruge IPA i stedet for dania når man skriver lydskrift.

Jeg tager gerne imod forslag til forbedringer af disse tegnvælgere.

Opdatering af IPA-tegnvælgeren

Jeg er blevet en smule skrappere til at lave scripts, så nu har jeg lavet en opdatering af IPA-tegnvælgeren. Tidligere blev nye tegn altid tilføjet i slutningen af tekststrengen. Nu bliver tegnet tilføjet der hvor du placerer cursoren.

Der er stadig et problem med at få vist [ː] ordentligt i Internet Explorer. Det er ikke noget jeg kan gøre noget ved. Skriv til Microsoft og brok jer.

IPA-tegnvælger

Jeg har et par aftner brygget på en IPA character picker, altså et program hvor man kan klikke på en oversigt over IPA-symboler når man skal skrive lydskrift, i stedet for at famle sig igennem diverse tekstbehandlingsprogrammers ‘indsæt symbol’-funktion.

Jeg var lidt utilfreds med de andre tegnvælgere jeg kender til, og så har jeg i min tegnvælger tilføjet en oversigt over de almindeligste symboler til at lydskrive dansk.

Der er dog altid bøvl når man skal vise særlige symboler i forskellige browsere, så jeg vil gerne høre om den ser ordentlig ud hos andre, eller om der er noget jeg kan gøre for at rette den til. Tag et kig, og send en kommentar hvis det ser mærkeligt ud, så vil jeg prøve at rette op på det.

Indtil videre ser den fin ud i min browser (firefox 3).  Min Internet Explorer viser også siden ordentligt, bortset fra at længdetegn ser mærkelige ud, men det er kan vist ikke være anderledes.

Indsæt lydskrift i dine dokumenter

Her er nogle metoder til at indsætte IPA lydskrift i elektroniske dokumenter og tekstbehandlingsprogrammer. Alle metoder benytter unicode.

1. Online IPA-tegnvælger

Jeg har lavet en IPA-tegnvælger hvor man kan skrive IPA-lydskrift ved at klikke på symbolerne. Teksten kan kopieres og sættes ind i ethvert program der understøtter unicode (det gør de fleste). Hvis siden ikke virker ordentligt, kan du evt. prøve rishida.net.

2. Indsæt specialtegn

Dit tekstbehandlingsprogram har typisk en funktion til at indsætte specialtegn. I OpenOffice skal du trykke alt+i, s, enter. Så popper der en tegnvælger op. Her skal du vælge en skrifttype der understøtter unicode, fx Arial eller Lucida. Her er der en liste over almindelige og downloadbare IPA-fonte.

3. Søg og erstat

Hvis man skal skrive længere passager med lydskrift, kan det være tidsbesparende at skrive det i en quick-and-dirty lydskrift der er baseret på tegnene på dit tastatur. Derefter kan man lave en masse søg og erstat-kommandoer hvor man udskifter tegnene med tilsvarende IPA-symboler.

Problemløsninger

Hvis ovenstående metoder ikke virker for dig, er det måske fordi du sidder med et dårligt tekstbehandlingsprogram eller en dårlig browser. Prøv evt. de gode, gratis programmer OpenOffice (tekstbehandling) og Firefox (browser). Det virker for mig.

Advarsel

I gamle dage brugte man ofte et tilpasset ASCII-tegnsæt (fx SIL IPA93) til at skrive lydskrift. Man kan stadig støde på at det bliver anbefalet. Hold dig fra det. Brug i stedet unicode. Ulemperne ved ASCII-tegnsættene er mange, bl.a. at dit dokument typisk ikke kan læses af andre end dig selv.

[ˈgoːˀ fɐˈnʌjˀl̩sə]

Følg med

rss e-mail FB Twitter