Nye lydskriftværktøjer på schwa.dk

For nylig skrev jeg om et opgør med den traditionelle IPA-Dania-hybrid der er almindeligt udbredt i dansk og som jeg selv har benyttet i mange år. Nu har jeg opdateret mine lydskriftværktøjer så man lettere kan skrive ren IPA.

Hvis man finder fejl, eller har forslag til forbedringer, er man meget velkommen til at kontakte mig.

Hvis man foretrækker den traditionelle IPA-Dania-hybrid, kan man naturligvis stadig benytte de gamle værktøjer. Se alle mine lydskriftværktøjer her.

Opgør med en lydskrifttradition

(Dette indlæg er en opsummering af en længere redegørelse jeg skrev ifm. et foredrag for lingvistikstuderende på Københavns Universitet. Læs hele teksten her: https://docs.google.com/document/d/1Uj6AlIzalLZf4d0TLVu2vEFDvzuDxu8KdtyloqA0AX4/edit?usp=sharing)

I mange år har jeg benyttet mig af de lydskriftkonventioner som jeg lærte fra Nina Grønnums bøger da jeg studerede på universitetet, og som benyttes i forenklet udgave i DDO. Men inden for de sidste par år har jeg arbejdet på en nye lydskriftstandard, som både er mere præcis ift. IPA, enklere og mere intutiv, og mere velegnet til praktiske formål såsom sprogundervisning og sprogteknologi.

Herunder er en oversigt over de tegn i den traditionelle lydskriftstandard som Nina Grønnum (NG) benytter i sin seneste fonetikbog, og den som DDO benytter, som jeg mener bør ændres. I kolonnen schwa.dk ses min forslag til hvilke tegn der bør benyttes i stedet, og det hvordan den pågældende lyd skrives i mere præcis IPA. Mht. alle andre end de nævnte lyde er der overensstemmelse mellem alle fire standarder.

NG DDO schwa.dk IPA
p t k
b d g
pʰ tˢ kʰ
b̥ d̥ ɡ̊
p t k
b d g
pʰ ts kʰ
p t k
pʰ ts kʰ
p t k
tj tˢj tj
dræbe
abe
kat
æ
æ
a
ɛ
æ
a
æɛ̞~æ
ɛ̞~æ
æ
tak ɑ ɑ aä
Morten
måtten
ɒ
ʌ
ɒ
ʌ
ɒɒ
ɒ̜
ø ø
œ
œ̞
ɶ
ø
œ
ɶ
ø
œ
ɶ
ø
œ
ɶ̝
ej, av, er j/ɪ̯ w/ʊ̯ ɐ̯ j w ɐ̯ ɪ̯ ʊ̯ ɐ̯ ɪ̯ ʊ̯ ɐ̯
snedig, mødding i e i e ɪ ɪ

Se her for en samlet oversigt over alle almindelige lydskrifttegn i dansk

Nogle af de ting i de traditionelle standarder som jeg i tiltagende grad undrede mig over, og som igen og igen førte til faglige og pædagogiske problemer, var:

  • hvorfor bruger man de stemte lyde [b d g] når de nu er ustemte i dansk?
  • hvorfor skelner man den meget lille forskel i kort og lang vokal i [æːnə anə] Ane, Anne, og [mɒːdn̩ mʌdn̩] Morten, måtten, når man nu ikke skelner for andre vokalers vedkommende?
  • og hvorfor bruger man [ʌ] for en vokal der, om noget, er mere åben end [ɒ], når åbningsgraden for symbolerne i IPA er lige omvendt?
  • hvorfor skriver man [ɑ] for den vokal som ifølge IPA skal skrive [a], og [a] for den vokal der skal skrives [æ]?
  • hvorfor skriver man fx [sdɑɡ] for stak, når det ville være både mere præcist og helt intuitivt ift. skriftbilledet at skrive [stak]?
  • og hvorfor skal det trække ned i karakter hvis en student netop skriver [stak] , når det nu er ganske præcis IPA?
  • hvorfor skriver man [dʁɛːbə æːbə] dræbe, abe, med forskellige vokaler, når ordene rimer?
  • hvorfor skriver man [ɕad] sjat, men [tjad] chat, når chat egentlig bare er sjat med [t] foran, [tɕad]?
  • hvorfor skriver man forskellige vokaler i høne og rynke, når nu de er ens? Og hvorfor skriver man samme vokal i grynt og gøre når nu de er forskellige?
  • m.m.

Nogle af disse ting har at gøre med at sproget har forandret sig. Andre gange skal svar på disse spørgsmål findes i praktiske årsager; man vil fx gerne skelne de væsentligste lydkontraster i sproget med forskellige symboler, og visse steder i sproget har vi flere kontraster inden for et område end der er symboler i IPA.

Men der er formentlig også tale om et stort element tradition. Da danske sprogforskere begyndte at gå over til IPA, var det i et miljø med meget stærk tradition for at bruge det hjemlige Dania. Måske under indflydelse af Dania, måske pga. af diskussioner af (faglige, pædagogiske osv.) styrker og svagheder ved de forskellige systemer m.m., sneg der sig en del Dania-arv med ind i adaptionen af IPA blandt danske sprogfolk, så en del symboler ikke bruges i overensstemmelse med IPA.

Man har mao. aldrig gjort helt op med Dania, et lydskriftsystem der er velegnet til at beskrive dansk, men kun dansk, og som ikke forstås af udenlandske studerende og forskere. Man er aldrig rigtig gået med på den internationale standard IPA. Det giver både problemer når man skal studere fonetik på tværs af sprog, og nogle af Dania-traditionerne giver problemer ifm. sprogteknologi.

Hvorfor ændrer man det ikke bare? Det er lettere sagt end gjort. Traditioner er i sig selv træge, men det handler også om at skabe en sammenhængende konvention. For når man ændrer én ting i en lydskriftkonvention, skubber man til alle de andre ting. Hvis man ændrer [ɑ d g] til [a t k] i stak, så [sdɑɡ] bliver til [stak], hvad så med det [a t k] man i forvejen brugte i [kad tal] kat, tal? De skal så ændres til noget tredje så man stadig kan se forskel på lydene.

Det er også et spørgsmål om hvor mange og hvilke fonetiske detaljer man skal medtage i en almindelig, praktisk, bred transskription. Mange fonetiske detaljer er vanskelige at opfatte og spiller ingen praktisk rolle – måske er de endda direkte forstyrrende – i sprogbeskrivelse, undervisning, sprogteknologi, formidling osv.

Når man tilrettelægger en lydskriftstandard, er der således mange hensyn man kan tage:

  • præcist: tegnene skal benyttes i overensstemmelse med IPAs definitioner, ellers kan man ikke rimeligt kalde sine transskriptioner for IPA
  • sprogligt: man skal kunne skelne vigtige betydningsadskillende kontraster i sproget, lyde der opfattes forskelligt, skal skrives forskelligt, og lyde der opfattes ens, skal skrives ens
  • pædagogisk: det må gerne være nemt at lære, så man starter med de nødvendigste lyde og kan udbygge med mere subtile detaljer senere hen
  • tværfaglighed: det er smart hvis man bruger samme konventioner på tværs af fag, så der er en kontinuitet når man studerer andre sprog, og det er smart hvis folk der har lært IPA i udlandet, umiddelbart kan læse danske IPA-transskriptioner; det er hele grundtanken med IPA
  • praktisk og læsbart: det er en god ide så vidt muligt at undgå diakritiske tegn, som både tager tid at lære, skrive, læse, og let fører til fejl i transskriptioner, og det er smart hvis man i vid udstrækning kan bruge de symboler der er på tastaturet frem for alverdens specialtegn
  • gennemskuelighed: det er lettere at lære lydskrift hvis der er en vis sammenhæng mellem de bogstaver vi er vant til og de lydskriftsymboler man skal lære
  • systematik: der må godt være en slags systematik i symbolvalgene, så samme lydtyper skrives ensartet og man så vidt muligt er konsekvent med hvilke detaljer der skelnes og hvordan
  • tradition: det er hensigtsmæssigt at der er kontinuitet mellem gamle og nye værker, traditionerne kan være tunge og uhensigtsmæssige

Alle disse forhold kan stikke i forskellige retninger og tale for forskellige transskriptionsstandarder. Og en del er til diskussion; hvad er vigtigt at kunne skelne i et sprog, hvad er mest pædagogisk, hvad gør man i andre fag, og hvis de gør noget forskelligt, hvad skal man så prioritere

I de ændringer jeg foreslår ovenfor, har jeg gjort op med traditionen og i stedet forsøgt at balancere de øvrige forhold. Resultatet er at der alt i alt er:

  • bedre overensstemmelse med IPA
  • færre specialtegn, hvilket gør det nemmere at skrive, læse og lære
  • bedre overensstemmelse med praksis i andre sprogfag
  • bedre sproglig/pædagogisk sammenhæng og systematik i den forstand at de betydningsadskillende kontraster i moderne dansk vises tydeligt i symbolvalgene, mens der er mere subtile nuancer og dialektal/sociolektal ikke nødvendigvis vises i brede transskriptioner
  • på nogle punkter større sammenhæng mellem udtale og stavning, på andre punkter dårligere sammenhæng

Uddybende begrundelse for enkelte ændringer

plosiverne: Jeg foreslår at man bruger [pʰ ts kʰ p t k] i stedet for det traditionelle [p t k b d g]. Vi har en kontrast mellem aspireret/affrikeret [pʰ ts kʰ] og uaspireret [p t k]. Det er vigtigt at danske sprogstuderende forstår denne kontrast. Der er ikke en stemthedskontrast som [p t k] vs. [b d g] indikerer, og som mange fejlagtig opfatter det. Man kunne vælge skrive det affrikerede /t/ som [tˢ], hvilket giver en bedre visuel sammenhæng mellem [ pʰ tˢ kʰ ]. Men [ˢ] er strengt taget ikke et IPA-tegn, omend det er almindelig brugt og kendt af IPA-brugere, så jeg ser ikke noget problematisk i den notation. Jeg synes selv det er enkelt, præcist og tastaturvenligt at skrive [ts], og det skaber til gengæld en visuel sammenhæng med [tɕ], se nedenfor.

tj: Jeg foreslår at /tj/ skrives [tɕ] i stedet for [tj]. Dette er til dels en konsekvens af at ændre [t] til [ts]. Ligesom /sj/ smelter sammen til [ɕ], smelter [j] sammen med affrikationen i [ts] sammen til [tɕ]. Det kan man lige så godt notere, når [ɕ] bruges i forvejen. Det giver både en mere præcis og systematisk beskrivelse, og det er i overensstemmelse med hvordan man noterer affrikater på andre sprog.

a, o, å: Jeg foreslår at man reducerer den tredelte skelnen mellem [æ a ɑ] til blot [æ a], hvor [æ] bruges i fx mase/masse, og [a] i mange. De fleste nybegyndere i dansk fonetik opfatter en længdeforskel på vokalen i mase/masse og i Morten/måtten, men ikke en kvalitetsforskel. På begynderniveau og i formidlingssammenhænge er det tilstrækkeligt at skelne længdeforskellen. I sprogteknologiske sammenhænge er en tredelt skelnen direkte forstyrrende.

Dette er ikke en påstand om at der ikke er nogen forskel. Det er der ganske sikkert. Men det er ikke (længere) en fonologisk kontrast, og det gælder i øvrigt for alle vokaler at der er en lille åbningsgradsforskel på korte og lange varianter af sammen fonem, hvilket der ikke er nogen tradition for at notere. Det virker arbitrært at skelne lige præcis i de to vokaler og ingen andre.

I meget konservativ sprogbrug kan man finde en fonematisk kontrast efter /r/ i fx [ʁæst ʁæ̞st ʁast] rist, rest, rast, så tidligere var det nødvendigt at skelne tydeligt mellem disse, hvilket formentlig har ført til traditionen med at skelne kort og lang vokal også (når man har indført denne skelnen i sin konvention, er man nødt til at være konsekvent). Til undervisnings- og formidlingsformål synes det dog vilkårligt at indføre denne skelnen som noget primært i moderne dansk. Det kan vente til forløb om dialekter og sociolekter, hvor man kan markere forskellene med diakritika.

ø’erne: Dette handler mest om at sproget har ændret sig så vi i dag har færre forskelle i ø-varianterne.

halvvokaler: når man skriver diftonger, benytter man almindeligvis [ɪ̯ ʊ̯ ɐ̯] i andre sprogfag. Jeg kan desuden godt lide den visuelle sammenhæng mellem [ɪ̯ ʊ̯ ɐ̯] (pædagogisk: halvvokaler er dem med buen under), og sammenhængen mellem disse og når de indgår i schwa-assimilation, [ɪ ʊ ɐ].

ig, ing: den ikke-fuldvokaliske lyd i –ig, -ing skrives traditionelt med hhv. [i e], men jeg synes der er fordele ved at skelne mellem fuldvokal [i e] i tit, lidt, og ikke-fuldvokal i –ig, -ing, ligesom der traditionelt skelnes mellem mellem [œ] vs [ə], og mellem [ɒ/ʌ] vs [ɐ]. Argumenterne er dog lidt snirklede, så jeg vil springe over dem her, men det er bl.a. baseret på praktiske erfaringer med sprogteknologi, hvor den manglende skelnen mellem fuldvokal og ikke-fuldvokal er et væsentligt problem, så det vil være en fordel hvis fremtidige sprogteknologer har lært at skelne.

Reaktioner

Jeg har diskuteret disse konventioner med mange studenter og fagfolk. Generelt spænder reaktionerne fra positive til begejstrede. Jeg har tydeligvis ikke været alene om at undre mig over de eksisterende konventioner og ønsket forandring.

Jeg har selvfølgelig også mødt indvendinger. Det er især svært at sluge at skille sig af med [b d g] og vænne sig til at skrive [pilə tilə kilə] i stedet for [bilə dilə gilə] bille, dille, gilde, endda med risiko for uheldige fejllæsninger af fx [pætɐ tisə] batter, disse. Men det er svært at argumentere for at [b d g] hører hjemme i sprogundervisningen, når alle lærebøger nu beskriver aspiration, og ikke stemthed, som den afgørende kontrast i plosiverne. Det er især uheldigt hvis man har studeret eller kommer til at studere et andet sprog, hvor [b d g p t k] står for nogle andre lyde.

Et argument for brugen af [b d g] er at det er bedre i overensstemmelse med skriftbilledet i ord som bal, dal, gal. Det er dog ikke et holdbart argument, da [b d g] måske oftere ikke er i overensstemmelse med skriften, fx i stak, spæk, skrap, ud, leg. Det er ikke indlysende for mig at [p t k] skulle være mindre i overensstemmelse med skriften. Under alle omstændigheder må det i sidste ende være de fonetiske forhold der er afgørende.

Kill your darlings. Når man har brugt årevis på at terpe regler og skelne subtile kontraster, kan det være svært at lægge disse fra sig. Som så meget andet bliver konventioner til normer, som bliver til æstetik og følelser. Når man først har lært at skelne mellem mase/masse og Morten/måtten, kan det virke provokerende at andre skal slippe for at terpe det. I overgangen til den nye standard har jeg selv skulle vænne mig til at lave om på ting jeg har benyttet og forsøgt at banke ind i hovedet på studenter gennem mange år. Jeg var selv længe om at acceptere [p t k] i bal, dal, gal, og personligt (og samme reaktion har jeg fået fra andre) kunne jeg godt lide ’teltet’ [ʌ], som jeg nu har vinket farvel til. Men i sidste ende er jeg ikke i tvivl om at det det rigtige at gøre.

Den seneste årgang lingvister på KU har jeg (efter lidt børnesygdomme) undervist efter disse konventioner, og resultatet taler for sig selv. Det er mærkbart nemmere at lære lydskrift, og der er langt bedre sammenhæng mellem beskrivelsen af dansk og andre sprog. Før skulle man afsætte en del undervisningstid på igen og igen at forklare hvad forskellen er på de mange meget ens a-lyde og å-lyde, og hvorfor vi skriver [b d g] når vi skriver dansk lydskrift, men [p t k] i andre sprog (som så igen står for noget andet i dansk), og hvorfor den danske lærebog bruger [a] i kat og skriver [hɑj] for hej, når den engelske bruger [æ] i cat og skriver [haɪ] for high. Det var undervisningstid der blev brugt på at man blev klogere på hvorfor der opstår forskellige traditioner forskellige steder i verden, men det var ikke fordi man blev bedre til noget af det der stod i studieordningen. Jeg glæder mig derfor til at arbejde videre med denne standard og kommer ikke til at savne de gamle. Jeg håber andre vil tage pointerne til sig.

Tilføjelse: eksempel på transskription med traditionel og ny standard

Transskription med DDO-standard
ˈnoːɐnvenˀn̩ ʌ ˈsoːˀln̩ ˈsɡɛndəs eŋˈɡɑŋˀ ʌm ˈvɛmˀ ˈabm̩ dɑ vɑ ˈsdæɐ̯ɡəsd | iˈmɛnˀs kʌm en ˈvɑndʁeŋsmanˀ fʌˈbiːˀ ˈsvøbd iːn ˈvɑːˀm ˈkɑbə | di blew ˈeːnii ʌm ad ˈɑwɡɶːˀɐ ˈsdʁiðˀn̩ veð ad kʌŋɡuˈʁæːˀɐ ʌm ˈvɛmˀ dɑ ˈfɶɐ̯sd ku fɔ ˈkɑbm̩ ˈa hɑm

Transskription med ny standard
ˈnoːɐnvenˀn̩ ɒ ˈsoːˀln̩ ˈskɛntəs eŋˈkaŋˀ ɒm ˈvɛmˀ ˈæpm̩ ta va ˈstæɐ̯kəst | iˈmɛnˀs kʰɒm en ˈvantʁɪŋsmænˀ fɒˈpiːˀ ˈsvøpt iːn ˈvaːˀm ˈkʰapə | ti pleʊ̯ ˈeːnɪɪ ɒm æt ˈaʊ̯kɶːˀɐ ˈstʁiðˀn̩ veð æt kʰɒŋkuˈʁæːˀɐ ɒm ˈvɛmˀ ta ˈfɶɐ̯st kʰu fɔ ˈkʰapm̩ ˈæ ham

Nye og opdaterede lydskriftværktøjer

Jeg har opdateret et par af mine lydskriftværktøjer:

Jeg arbejder på flere opdateringer og værktøjer. Kom gerne med forslag til forbedringer.

Lydskrift – IPA vs. Dania

I litteratur om dansk udtale er der to konkurrende lydskriftsystemer, IPA og Dania. Som dansk fonetiker eller lydskriftbruger skal man derfor tage stilling til hvilket system man vil benytte. Her på siden, og i alle andre sammenhænge i øvrigt, bruger jeg IPA, og det er også det jeg anbefaler til andre. Men hvorfor egentlig det? Der er stadig sprogfolk der er uddannet med udgangspunkt i ældre litteratur som benytter Dania, og deriblandt er der nogen der er kritiske over for udskiftningen af af Dania med IPA. Her sammenligner jeg de to systemer på en række parametre, og så kan du selv tage stilling.

Udbredelse

Dania benyttes kun i Danmark. IPA er vidt udbredt i hele verden, herunder Danmark. Hvis man vil læse fagtekster fra ikke-danskere (og danskere der bruger IPA), eller selv vil skrive til og læses af andre end en snæver gruppe danskere, så er det kun IPA der kan bruges. Hvis man vil undervise i dansk for fremmedsprogede, så er der en vis sandsynlighed for at de kender til IPA, men ikke Dania, og hvis man vil undervise danskere i fremmedsprog, så er fremmedsproget garanteret beskrevet i IPA. IPA kan således på grund af sin udbredelse benyttes som udgangspunkt til sammenligning af forskellige sprog.

Vinder: IPA

Fleksibilitet

dania
De 100 oprindelige lydskrifttegn i Dania (Jespersen 1890)

Dania blev opfundet engang i 1890’erne til at beskrive de sproglyde man kendte til i det dansk der blev talt på det tidspunkt, inkl. de mange dialekter. Det var tilfældigvis lige præcis 100 forskellige symboler man havde brug for, hvilket ganske vist er noget mere fleksibelt end alfabetets 28 bogstaver, og en nybegynder i dansk fonetik har normalt ikke brug for mere end ca. 40 symboler, så umiddelbart er det rigeligt. Men hvis man vil beskrive andre lyde end dem der fandtes i 1890’ernes dansk, eller nuancer som man ikke lige var opmærksom på dengang, så kommer Dania til kort. Det sker jo at sprog forandrer sig og nye lyde kommer til, eller at sprogforskere indimellem bliver opmærksomme på nye nuancer som man ønsker at beskrive, eller at man vil beskrive indvandreres udtaleproblemer når de forsøger at lære dansk, eller at man vil sammenligne dansk med andre sprog der rummer andre lyde. Dania rummer ingen metode til at tilføje nye tegn eller kombinere eksisterende. Man må klare sig med dem der er eller selv opdigte nye symboler efter behov (eller låne nogen fra IPA).

ipa_chart_2005
IPA-skemaet, v. 2005

IPA er defineret ud fra taleorganernes muligheder, og derfor er man i princippet i stand til at beskrive alle de sproglyde der er fysisk mulige at artikulere. Der er en stor mængde diakritiske tegn som man kan modificere grundtegnene med, så man samlet set kan skelne mange tusinde nuancer. Man kan transskribere træk som fonation og tonegang hvilket er umuligt i Dania. Der er endda i IPA udviklet er en mængde symboler til at beskrive lyde der forekommer hos folk med læbe-gane-spalte eller andre stemmelidelser.

Vinder: IPA

Entydighed

Symbolerne i Dania er til dels defineret ud fra udtalen af eksempelord (som de udtaltes i 1890’erne). Hvis man ikke på forhånd kender til dansk udtale, kan det være vanskeligt at vide hvad lydene står for. Hvad vil det fx sige at j er den først lyd i jul? Er det en frikativ, approksimant, affrikat eller hvad? Sprogforskeren Lars Brink (Dania-bruger) demonstrerer på bedste vis, omend uintenderet, problemet i Mål & Mæle 35/4, hvor han beskriver ”a som i Ghita Nørbys udtale af Hansen” og ” som i Leif Sylvesters udtale af Hansen”. Hvis man ikke lige ved hvem de to skuespillere er, og hvad der er forskellen på deres Hansen-a’er, er den definition ikke til nogen hjælp. Desuden er det uklart hvilken forskel på a’erne der er i fokus her. Er det overhovedet muligt for andre end Ghita Nørby at udtale Hansen på samme måde som Ghita Nørby? Ikke ned i mindste detalje i hvert fald.

IPA er defineret ud fra hvordan vores taleorganer er indstillet, ikke hvilke ord eller sprog lydene forekommer i, eller hvem der udtaler dem. Vores taleorganer er isomorfe på tværs af køn, alder og race, så det er entydigt defineret hvilke lyde IPA-symboler svarer til.

Vinder: IPA

IT-understøttelse

Både IPA og Dania bruger symboler der ikke er umiddelbart tilgængelige på et almindeligt tastatur. Det er bl.a. derfor jeg har lavet op til flere tegnvælgere, så man har dem lige ved hånden. Dania har dog forskellige problemer, der er utilgængelige tegn, som spejlvendt j, og forskellen på vokalen i og får som udtrykkes med hhv. oblikt ‘å’ og kursiveret ‘å’ (svarende til forskellen på å/ɑ̊, men i skrå skrift), som ikke understøttes af nogen almindeligt tilgængelige skrifttyper. I Dania er kursiv/ikke-kursiv betydningsadskillende, men kursiv/ikke-kursiv er i IT-mæssig forstand blot stilinformation, ikke indholdsinformation (hvis du søger på [blus] får du samme søgeresultat som hvis du søger på [blus], som er Dania-lydskrift for ordene blus og plus). Det lyder måske som småting, men det gør at det er vanskeligt at indsætte Dania i elektroniske tekster, og det er uegnet til digitale ordbøger og generel databehandling.

IPA er understøttet i Unicode-formatet, og derfor kan alle nyere computere håndtere IPA nogenlunde uproblematisk, og man kan skrive det med den skrifttype og -stil man nu synes er kønnest.

Vinder: IPA

Fremtidssikring

Fremtiden bliver formentlig kun mere digital, og behovet for international kommunikation og formidling er stigende. Den manglende IT-integration og internationaliserbarhed i Dania gør at det vil blive brugt mindre og mindre. Digitale resurser som DDO og Wikipedia benytter IPA frem for Dania. I fremtiden vil mere og mere blive publiceret digital (lærebøger, tidsskrifter og andre resurser), og sprogstuderende skal besvare øvelser og eksamensopgaver elektronisk. Stort set al publiceret forskning i dansk udtale de sidste 10 år benytter IPA, så hvis man vil følge med i den nyeste viden og benytte de nyeste IT-resurser, er IPA det sikreste bud.

Vinder: IPA

Pædagogik

sammenligning ipa dania
Sammenligning af de almindeligste symboler i IPA og Dania på begynderniveau.

Dania-fortalere argumenterer med at Dania er nemmere for nybegyndere end IPA, fordi der er en vis sammenhæng mellem lydskrifttegnene og de tilsvarende bogstaver.. Men det ikke helt indlysende at der skulle være større overensstemelse mellem stavning og lydskrift i Dania, da danske bogstaver ikke bruges konsekvent for en bestemt lyd. Og det er ikke ubestrideligt en fordel hvis der skulle være sådan en sammenhæng. Erfaringsmæssigt er forveksling af bogstaver og lydskriftsymboler et af de største nybegynderproblemer, og det kan lige så vel tænkes at være en fordel at lydskriften adskiller sig i nogen grad fra skriften.

Hvis vi taler om de 40 mest basale (hyppigst forekommende i distinkt tale) lydtegn i grov begynderlydskrift, så er det kun 13 symboler der adskiller IPA og Dania. Begge bruger æ, men for forskellige vokaler, hhv. i bær (IPA) og hest (Dania). Derudover er det i Dania kun r og å der findes i det danske alfabet. Til gengæld bruger Dania å/ɑ̊ om forskellige lyde (IPA [ɔ ɒ]), som i hhv. ost og ordne, hvilket ikke er pædagogisk, da man let forveksler de to symboler. Apostrof benyttes som stødtegn, hvilket ligeledes er upædagogisk, da apostrof i skriftsproget har en anden fonetisk værdi, nemlig elision, som i sku’, hva’, ik’, se’fø’li‘ osv. Når Dania afviger fra almindelige bogstaver, er det oftere ved brug af diakritiske tegn (prikker, boller, streger osv. over og under grundsymbolerne) som ȧ ä å ɑ̊ ö ɔ̈ ɔ̇ w̩ ɹ̩ osv., hvilket erfaringsmæssigt er vanskeligere at få rede på og derfor mindre pædagogisk. IPA har i højere grad defineret grundsymboler for de basale lydlige forskelle, mens diakritiske tegn fortrinsvis benyttes i mere viderekomne sammenhænge.

Vinder: Uafgjort

Nostalgi

Dania-fortalere kan argumentere for at danskstuderende skal benytte Dania fordi der er tradition for det inden for danskfaget el. lign. Jovist, på samme måde kunne man forlange at matematikere skulle bruge kuglerammer frem for computere, fordi der var en tusindårig tradition for det før computerne kom til. Lydskrift er et værktøj, ikke et klenodie, og man lydskriver nu en gang bedst med det værktøj der er bedst udviklet til det. Man kunne slå på at Otto Jespersen, der udviklede Dania, en internationalt kendt lingvist, også havde en finger med i spillet i udviklingen af IPA, og det kunne vi være lige så stolte af, for så vidt som det giver mening at være stolt af en anden persons bedrifter blot fordi det er en landsmand. Men nu er nostalgi jo nostalgi, og det er historien om Otto Jespersen og Dania der er tradition for at fortælle, så …

Vinder: Dania

Resultat

IPA – 5
Dania – 1
Uafgjort – 1

IPA vinder ganske sikkert over Dania på næsten alle saglige punkter. IPA det mest udbredte, veldefinerede, fleksible og praktiske system. Men inden man forkaster Dania helt, skal man være opmærksom på at der er store mængder betydningsfuld ældre faglitteratur der benytter Dania. Værker som Den Store Danske Udtaleordbog og Dansk Rigsmål (Brink & Lund 1975) er vigtige kilder som er baseret på (tillempet) Dania. Det samme er flere ældre dialektordbøger og -værker. Hvis man vil studere det danske sprog, har man brug for at kunne orientere sig i både IPA og Dania, men som aktivt system, det system man selv benytter sig af, og det system man uddanner nye danskstuderende i at bruge, vil man være bedst tjent med IPA.

Nye lydskriftresurser på schwa.dk

Jeg har i den sidste tid lavet et par nye værktøjer til både nybegyndere og erfarne lydskrivere. Se menuen til højre under Resurser på schwa.dk for alle de værktøjer der er tilgængelige. De nye ting er:

1. Simpel IPA-tegnvælger

I denne simple tegnvælger får man en oversigt over de sproglyde der almindeligvis benyttes i grove IPA-transskriptioner af dansk. Der er pædagogiske eksempler på ord der indeholder de forskellige lyde (sådan som jeg udtaler dem). Hvis man fører musen hen over lydskriftsymbolerne, får man desuden en artikulatorisk beskrivelse af lyden og den fine IPA-notation. Gå til tegnvælgeren her.

2. Tastaturgenveje og lydskriftkonvertering (IPA/Dania)

I dette værktøj kan man bruge taster som er tilgængelige på et almindeligt dansk tastatur og få det konverteret til lydskrift, både grov-halvfin IPA og Dania. Det er tidsbesparende når man skriver længere passager med lydskrift. Man kan også indsætte IPA eller Dania (efter de standarder der er givet i den simple IPA-tegnvælger og Dania-tegnvælgeren) og få det konverteret til det andet format. Gå til converteren her.

3. Ny udtaleordbog

I kølvandet på min ph.d.-afhandling i foråret har jeg lavet en ny ordbog over udtalerne i DanPASS-korpusset. Nye features:

  • Sammentrukne ordforbindelser er nu klippet over så man under hvert opslag nu kan se alle forekomster af ordet og alle udtaler. Tidligere kunne man ikke slå klitiske udtaler op (fx ‘er’ der udtales som ingenting i en del ordforbindelser). De metodiske overvejelser i den forbindelse findes i min afhandling (s. 70-77). Desværre kan man så ikke længere se konteksten eller tilknyttede lydfiler – jeg har planer om et værktøj hvor det bliver muligt.
  • Der er angivet kanonisk udtale inkl. hvor mange gange den kanoniske udtale forekommer ud af det totale antal forekomster af ordet.
  • Ordklasseinformation er inkluderet, så man fx kan skelne mellem ‘taget’ som hhv. substantiv og verbum.
  • Reduktionstilbøjeligheder er inkluderet. Hver indgang har fået en R-værdi som angiver ordets tilbøjelighed til at blive udtalt reduceret. Værdien angiver hvor mange fonemer der falder bort eller udtales mindre distinkt pr. 100 fonemer. Se min afhandling (s. 77-84) for nærmere detaljer.
  • Vær opmærksom på at ord med flere fonologiske fortolkninger optræder som flere indgange, fx ‘tegninger’ m. og u. stød.

Forslag til forbedringer og rettelser af disse værktøj modtages gerne.

Ord der udtales som de staves

Dansk retskrivning er som bekendt ikke særlig lydret, men vi har dog ord, som fx nu, vi, møl og nevø, som kan udtales nøjagtig som var det lydskrift [nu vi møl nevø]. Jeg har bladret mine udtaleordbøger og min hjerne igennem for at finde de længste sådanne ortografonemiske ord (jep, det var et ord jeg selv har fundet på, og ja, det indeholder en haplologi).

Man er nødt til ikke at være for striks. Hvis man forlanger meget fin lydskrift, kommer man naturligvis ikke ret langt, for så skal der læsses en masse diakritika på. Men hvis man bruger almindelig grov IPA, går det lidt lettere.

Til at begynde med kan man udelukke alle ord med lang vokal eller stød – den slags ting markerer vi ikke i ortografien. Og vi har heller ikke noget schwa! Til gengæld vedtager jeg at alle ord kan udtales ubetonet, for så slipper jeg for at tage stilling til tryk, som heller ikke markeres ortografisk.

Umiddelbart kan jeg finde ortografonemiske ord på op til syv bogstavers længde:

  • antabus
  • husblas
  • syfilis

Der er også en del på seks bogstaver:

  • bikini
  • valuta
  • kalaha
  • plasma
  • kandis
  • sultan

Og på fem bogstaver har vi bl.a. antal, banjo, dildo, metal, salsa, halal, tyfus, mysli, panda, miljø, gebis.

Hvis vi nu siger at /p t k/ kan aspireres finalt – det kan de godt – så kan vi inkludere ord der slutter på p, t, k, herunder en masse afledninger der slutter på –isk eller –ist. Således kommer vi op på 10 bogstavers længde:

  • minimalist (10 bogstaver)
  • positivist (10)
  • violinist (9)
  • analytisk (9)
  • bandagist (9)
  • alkymist (8)
  • feminist (8)
  • basilisk (8)
  • humanist (8)
  • finalist (8)
  • nihilist (8)
  • metodist (8)
  • semantik (8)

Og ikke mindst:

  • fonetik (7)

Det kunne selvfølgelig være rart hvis man kunne udbygge det til fx positivistisk (13), men jeg kan ikke få mig selv til at aspirere det andet t – det bliver [positivisdisk].

Og så kan man naturligvis begynde at sætte ordene sammen til mere eller mindre rimelige ord. Her kan man drage nytte af at nogle vokaler taber stød og længde i sammensætninger:

  • miljøpolitik (12)
  • semifinalist (12)
  • halalhumanist (13)
  • fonologivolapyk (15)
  • kalahaminimalist (16)
  • osv.

Hvis man nu brugte dania i stedet for IPA – hvilket man selvfølgelig ikke gør – men alligevel, hvis man nu gjorde, så kunne man også finde ord med bogstaverne æ, å og r – å hjælper dog ikke stort, da det stort set altid er en lang vokal hvis den har å-kvalitet. Men af længere ord kan det nævnes at inkluderingen af æ giver os fx pædagogik (9), og r giver os fx problematik (11).

Jeg har garanteret langt fra fanget alle, så hvis du kommer på nogle gode ortografonemiske ord, så smid gerne en kommentar.

Korte, lange og ekstralange konsonanter

I dansk skelner man mellem korte og lange vokaler, fx i [kulə] kulde vs. [kuːlə] kugle. Vi er ikke vant til at tænke på at vi også har forskel på korte og lange konsonanter, men faktisk har vi en kontrast mellem mindst tre forskellige konsonantlængder: kort, lang og ekstralang med stavelsestop. Det fremgår fx af denne minimaltrio:

  • [bɔnə] bonde – kort n
  • [bɔnnə] bundne – langt n
  • [bɔnn̩nə] bundene – ekstra langt stavelsesbærende n

Lange og ekstralange konsonanter i dansk stammer altid fra at der er flere fonologiske stavelser, og det er derfor vi traditionelt lydskriver dem med dobbelt- og tripelkonsonant. Der er fonologisk, morfologisk og sikkert også kognitivt tale om flere ens nabokonsonanter snarere en enkelt lang eller ekstralang konsonant.

Dobbeltkonsonanter findes oftest i sammensatte ord som

  • [issyːˀl] issyl
  • [gullʌg] Guldlok
  • [sdʌbbʌlˀd] stopbold

Vi kan også fakultativt have konsonantforlængelse hvor der underliggende er tale om et /r/, fx

  • [bɛððɐ] bedre
  • [hʌjjɐ] højre
  • [feŋŋɐ] fingre

Tripelkonsonant findes kun med [n] og [l] i ord som rindende, hundene, uudholdelig, adskillelig. Fakultativt kan det nok også findes i sammensatte ord som [ʌnn̩nøðˀ] åndenød, men min fornemmelse er at vi foretrækker et distinkt schwa her [ʌnənøðˀ].

Når man lydskriver, kan man komme ud for at have brug for hele fem forskellige måder at annotere konsonantlængde på. De er dog ikke alle distinktive, men varierer alt efter den fonologiske kontekst de indgår i:

  1. Kort, fx [vɛn] ven. Defaultlængden.
  2. Kort syllabisk, fx [lɛːn̩] læne. Bruges ved schwa-assimilation efter lang vokal med schwa i åben stavelse.
  3. Lang ikke-syllabisk, fx [svɔnnə] svundne. Bruges når coda-konsonant møder ansats-konsonant.
  4. Lang syllabisk med final stavelsestop, fx [vɛnn̩ sɛːnn̩] vende, Seinen. Bruges ved schwa-assimilation efter kort vokal og/eller schwa i lukket stavelse.
  5. Lang syllabisk med initial stavelsestop, fx [liːn̩nə] lignende. Bruges ved schwa-assimilation efter lang vokal i proparoxytone ord.
  6. Ekstralang syllabisk, fx [sbɛnn̩nə] spændende. Bruges ved schwa-assimilation efter kort vokal i proparoxytone ord.

Hvis man virkelig skal gå i detaljer, er der vist statistisk set en forskel på varigheden af konsonanten i type 4 alt efter om schwa-stavelsen er åben eller lukket og om foranstående vokal er kort eller lang, dvs. [vɛnn̩ ɛnn̩ sɛːnn̩] vende, enden, Seinen har vistnok i gennemsnit forskellig varighed selvom de traditionelt annoteres ens. Og lur mig om ikke tilstedevær af stød også påvirker konsonantvarigheden i en eller anden grad.

Bevæggrunden for at man skelner mellem at skrive et, to eller tre konsonantsymboler og syllabicitetstegn på første/midterste/sidste konsonant, skal findes i dels den akustiske varighed, dels i at stavelsestoppen ligger enten centreret eller højre-/venstreforskudt alt efter den underliggende stavelsesstruktur.

Man skeler dog nok også til en symmetri med lignende ord med andre konsonanter. Man kan let være fristet til at droppe en af konsonanterne i [vʌll̩li sbɛnn̩nə] voldelig, spændende, men da disse ord er opbygget fonologisk og morfologisk som fx [ʌnn̩li kʌmm̩nə] åndelig, kommende hvor der er mindre tvivl om annotationen, er man på den sikreste side hvis man bevarer tripelkonsonanterne i de første ord.

Konsonantlængde i andre sprog

Mange sprog har som dansk en forskel på korte og lange konsonanter, men ligesom på dansk findes lange konsonanter typisk kun mellem to vokaler og kan således fortolkes som at der underliggende er to ens konsonanter der støder sammen.

Det er heller ikke ualmindeligt at konsonantvarighed varierer betydeligt betinget af den fonologiske kontekst de indgår i. I fx svensk og norsk er konsonanter typisk betydeligt længere efter korte vokaler end efter lange (vi har spor af dette i dansk ortografi hvor kort vokal signaleres med dobbeltkonsonant). I fx engelsk og fransk er sonore konsonanter typisk betydeligt længere foran stemte lukkelyde end foran ustemte.

Jeg har aldrig stødt på nogen sprog der har en klokkeklar fonologisk længdekontrast i konsonanter, da konsonantlængde således typisk kan kædes sammen med enten en tostavet struktur eller med sekundære faktorer. Jeg har heller aldrig stødt på nogen sprog, ud over dansk, der skelner mellem mere end to konsonantlængder. Men det findes nok derude et sted.

Udtaleordbog med lydeksempler

Jeg har opdateret udtaleordbogen. Udtaleordbogen er baseret på data som jeg har trukket ud af DanPASS-korpusset. Som noget nyt har jeg tilføjet

  • fonologiske stavelsesgrænser
  • kanonisk udtale
  • lydeksempler

De fonologiske stavelsesgrænser har jeg genereret automatisk ud fra de anvisninger der er givet af Grønnum (2007).

Den kanoniske udtale er ligeledes (med ganske få undtagelser) autogenereret  ud fra de anvisninger der er givet af Grønnum (2005) plus mine egne regler for schwa-assimilation.

Lydeksemplerne er klippet ud af korpusset. Der er givet op til tre tilfældigt udvalgte eksempler for hver unik annotation. Da eksemplerne er udvalgt tilfældigt, er de ikke nødvendigvis de mest repræsentative eksempler på den pågældende udtale. Hvis man ønsker nærlytning, kan man downloade lydfilerne ved at højreklikke på linket og åbne dem i fx praat.

Konverter SIL IPA93 til Unicode

I gamle dage brugte man fonten SIL IPA93 når man skulle skrive lydskrift i tekstdokumenter. I dag bruger de fleste Unicode. Fordelen ved Unicode er at det kan læses på alle moderne pc’er og det kan findes af søgemaskiner, mens SIL IPA93 krævede at man havde fonten installeret for at man kunne læse det.

Hvis man vil konvertere dokumenter med lydskrift skrevet i SIL IPA93 til Unicode, er der en meget besværlig guide på SIL’s hjemmeside. Det kræver at man downloader software og tilføjelsespakker og hvad ved jeg. Dernæst skal programmet konfigureres, og der er særlige metoder alt efter hvilket tekstbehandlingsprogram man bruger. Meget besværligt, og jeg har endnu ikke fået det til at virke.

Derfor har jeg lavet et supernemt og hurtigt script som konverterer SIL IPA93 til Unicode. Det er online, og det kræver ingen download eller installering, bare et klik på en knap.

Et meget nyttigt værktøj (for formodentlig ganske få mennesker).

Ny udtaleordbog baseret på DanPASS

Jeg har lavet en udtaleordbog baseret på transskriptionerne i DanPASS-korpusset. Der er en del forbedringer i forhold til den eksisterende:

  • Ordbogen er baseret på seneste udgave af DanPASS.
  • Den er Unicode-baseret, så man kan kopiere fra den og sætte ind i dokumenter.
  • Der er inkluderet fonemrepræsentation.
  • Det er html-baseret, hvilket er hurtigere at åbne og søge i end den gamle pdf-udgave.
  • Forekomsterne er sorteret efter hyppighed.
  • Det samlede antal forekomster af hvert ord er noteret.

Jeg håber på et senere tidspunkt at kunne lave en funktion så man kan se hvor i korpusset pågældende udtale findes, så man kan se hvilken kontekst udtalen forekommer i, og måske endda mulighed for at koble lyd på.