Kategorier
Lydskrift Vokaler

Utilpasset IPA: Hvor mange vokaler er der i dansk?

Update oktober 2023: Dette indlæg repræsenterer et tidligt stadie i mit forarbejde for artiklen Utilpasset IPA. Jeg anbefaler denne artikel i stedet. Indlægget herunder kan indeholder outdatede elementer eller synspunkter som ikke længere er repræsentative for mit ståsted i dag. ~~ Ruben

Hvis man ser i WALS-databasen over vokalinventaret i verdens sprog, så er det gennemsnitligt at have 5-6 vokaler, mens omtrent en tredjedel af verdens sprog har 7-14 vokaler. Der er ikke registreret nogen sprog med mere end 14 vokaler.

Dansk er ikke inkluderet i databasen, men dansk fremstilles ofte som ekstremt vokalrigt. Nogle forskere siger vi har mindst 20 vokaler eller 22 vokaler, og nogle forskere påstår at vi i dansk har op til 40 forskellige vokallyde, og samme forskere mener at de mange vokaler gør dansk til et af de sværeste sprog i verden. Dania-alfabetet skelner 33 forskellige vokaler. DanPASS-korpusset topper dem alle ved at skelne 57 forskellige vokaler.

Vi ved ikke om et højt antal vokaler gør det svært at lære et sprog, men vi kan i hvert fald se at det er svært for forskere at blive enige om hvor mange vokaler vi egentlig har. Og før vi ved det, er det spekulativt at udtale sig om hvilken effekt antallet af vokaler evt. har på sprogtilegnelse.

Mine sprogforskerkolleger der udtaler sig her, er vældig, vældig dygtige til mange ting, men ikke til at tælle vokaler. Og derfor gør de selvfølgelig som enhver ordentlig forsker: Tjekker faglitteraturen der er skrevet af folk med mere forstand på lige det emne. Problemet er man i traditionel dansk lydskrift skelner vokaler efter andre kriterier end man gør internationalt. I dansk lander man på et meget højt tal, men man glemmer at nævne at det ikke er sammenligneligt med andre sprog.

Der er ingen tvivl om at dansk ligger i den høje ende når det kommer til antallet af vokaler, uanset hvordan vi gør det op. Men IPA-skemaet har kun 28 vokalsymboler til rådighed, så kan det virkelig passe at dansk sprænger rammerne for hvad IPA kan kapere og har 2-3 gange flere vokaler end noget andet registreret sprog i verden? I så fald er dansk i sandhed et bemærkelsesværdigt sprog.

Nej, naturligvis er dansk ikke så spektakulært som som vi ynder at fremstille det. I en IPA-tilgang har vi 13 vokaler i dansk, hvilket jeg vil uddybe længere nede. Problemerne opstår fordi man i dansk tradition bruger en metode som er mere fintfølende end hvad man gør i andre sprog. Det gør tal i størrelsesorden 20-40 usammenlignelige med andre sprog. Lidt forenklet sagt svarer den danske metode til at regne gravhunde, rottweilere og pekingesere som forskellige dyr, mens de i andre optællingsmetoder regnes som samme dyr, forskellige varianter af hunde.

I den fysiske verden er alle vokaler i alle ord der nogensinde er udtalt, en lille smule forskellige fra hinanden. Alle de 50-100.000.000 vokaler du siger i løbet af dit liv er en lille smule forskellige hvis vi er tilstrækkeligt fintfølgende. Det kan vi ikke bruge til noget når vi tæller vokaler i et sprog. Vi har brug for en måde til at kategorisere de vokaler der ‘føles ens’. Men hvornår er noget ens eller forskelligt? Det kan man afgøre på forskellige måder.

Hvordan tælles vokaler traditionelt i dansk?

Lydskriftsystemet Dania er designet til at beskrive forskelle på danske dialekter. Mange af Danias 33 vokaler er fremkommet ved at dialektforskere har observeret at vokalen i et ord er systematisk forskellig i to dialekter, og derfor har man opfundet forskellige lydskrifttegn til de forskellige nuancer.

Man har også brugt det til at beskrive lydforandringer. Hvis en vokal, fx æ, i en eller anden kontekst er blevet mere åben, men ikke så åben at det bliver et a, så har man opfundet et tegn for en vokal mellem æ og a.

De mange nuancer er opstået ved et praktisk behov blandt sprogforskere til at notere og beskrive de forhold de nu fandt interessante at beskrive i forskellige varianter af dansk. Det er sådan set fuldstændig lødigt, men det adskiller sig fra hvordan man skelner vokaler i IPA.

33 vokaler er altså det man har haft brug for til at beskrive de væsentligste nuancer i alle danske dialekter. Men man behøver naturligvis ikke lære forskel på alle 33 vokaler for at kunne tale dansk. Alle danskere taler jo ikke alle dialekter. Og inden for den enkelte dialekt har man kun brug for at skelne 12-14 vokaler uanset hvilken dialekt man taler om.

I denne dialektale forstand er 33 et arbitrært tal. Det giver ingen mening at sammenligne sådan et tal på tværs af sprog. Det kommer fuldstændig an på hvor meget dialektforskning der er bedrevet på sproget. Jo mere man forsker, og jo flere varianter af sproget man undersøger, des finere nuancer kan man registrere. Sådan groft sagt.

I DanPASS-korpusset, som rummer transskriptioner af spontantale, skelnes der endnu finere. Der er i alt 57 forskellige vokaler, bl.a. fordi vokaler kan blive nasaleret og afstemt i mindre distinkt tale. Igen er det naturligvis fuldstændig lødigt til det formål korpusset er indrettet til, nemlig at studere processer i spontantale, at skelne så fint. Og igen er det kun et spørgsmål om hvor fintfølende man er og hvor stort ens materiale er. DanPASS rummer kun ca. 10 timers københavnsk tale. Man kunne let udvide det og finde mange flere vokalnuancer. Eller repræsentere alle vokaler med nogle talværdier for akustiske mål i stedet for lydskriftsymboler, og så ville alle de mange tusinde vokaler være forskellige.

Hvordan tælles vokaler i IPA?

I IPA er kravet at man skal skelne distinktive vokaler. Hvis man kan finde et ord hvor udskiftningen af en vokallyd med en anden fører til en betydningsændring, så er de to vokaler distinktive og skal noteres forskelligt. Hvis to forskellige vokaler ikke er distinktive, noteres de ens, og som udgangspunkt vælges her et passende IPA-grundtegn til at repræsentere vokalerne på tværs af de små nuancer.

Kort sagt, hvis vi fx udskifter vokalen i fest med vokalen fra fx mand, så får vi ordet fast, som betyder noget andet end fest, og derfor skal de to vokaler i IPA noteres forskelligt, fx /ɛ æ/, så vi får /fɛst fæst/ fest, fast. Hvis vi udskifter vokalen i prik med vokalen i fast, ændrer det derimod ikke betydningen (selvom vi sikkert kan måle mikroskopiske forskelle på de to vokaler), og derfor skal de noteres ens, fx /pʰʁæk fæst/ prik, fast.

I IPA er der altså en metode til at afgøre hvor mange vokaler man skal skelne i et sprog. Denne metode kan benyttes på alle sprog, og det tal der fremkommer, er, med visse forbehold, sammenligneligt på tværs af sprog. Og det er efter denne metode at man lander på 3-14 vokaler i andre sprog.

Hvis man vil bevise at der er 22 eller 33 eller 40 vokaler i dansk sammenlignet med andre sprogs 3-14 vokaler, skal man altså levere sådan nogle ordsæt der beviser at vokalerne distinktive, betydningsadskillende, ikke bare nuancer af samme fonem. Uden dette krav stikker man hånden i en hvepserede hvor der ikke er nogen grænse for hvor mange vokaler det er muligt at skelne.

Hvor mange vokaler er der så i dansk?

Tallet er 13. Mere specifikt 5 urundede fortungevokaler, 4 rundede fortungevokaler og 4 bagtungevokaler. /a/ er den eneste helt åbne vokal. Det passer heldigvis lige præcis til hvad man maksimalt kan skelne i IPA.

I IPA er der fem symboler til urundede fortungevokaler /i e ɛ æ a/, og vi kan skelne fem forskellige i dansk. Eksempler med lang vokal: /viːnə veːnə vɛːnə væːnə vaːmə/ vine, vene, væne, vane, varme. Eksempler med kort vokal: /tsik tsek tsɛk tsæk tsak/ tik, tig, tæk, tag (vb), tak. Jf. hvordan vokaler er defineret i IPA skal man ikke notere vokalerne mere præcist end dette selvom der måske er lidt forskel på de korte og lange vokaler, eller selvom de måske ikke lyder helt som på andre sprog. Det er den relative forskel på vokalerne man noterer i bred IPA, ikke deres absolutte værdi.

I IPA er der fire symboler til urundede fortungevokaler /y ø œ ɶ/. Det er lidt sværere at vise at de alle er distinktive i dansk. Men vi har /kʰyːlə kʰøːlə kʰœːlə/ kyle, køle, curle, og /fyːɐ føːɐ fɶːɐ/ fyre, føre, fyrre, og vokalen i fyrre er mere åben end i curle. At /œ ɶ/ er distinktive, kan man vist kun vist med ordparret /ʁœːʊ ʁɶːʊ/ røve (begå røveri), røve (pluralis af røv). Eksempler med kort vokal: /pytə pøte/ bytte, bøtte, /skø̰n skɶ̰n/ skynd, skøn, /kʁœ̰nt kʁɶ̰nt/ grynt, grønt. (Det er nok ikke alle der har kort /ɶ/ da den muligvis er ved at udvikle sig til bagtungevokal).

I bagtungevokalerne kan man skelne fire ‘åbningsgrader’. Eksempler med lang vokal /muːsə moːsə mɔːsə mɒːsə/ muse, mose, måse, morse. Eksempler med kort vokal: /ṵð fo̰ð ɔ̰ð ɒ̰ð/ ud, fod, åd, od.

(Jeg skriver ‘åbningsgrader’ i anførselstegn fordi vi traditionelt beskriver det sådan, men en undersøgelse af Juul, Pharao og Thøgersen fra 2016 indikerer at Åse-vokalen snarere er centraliseret frem for mere åben ift. /o/, så måske er vi på vej mod /muːsə moːsə mɵːsə mɔːsə/)

Vokalerne /ɶ ɒ/ angiver åbne vokaler, men i dansk er de klart mere lukkede end den åbne vokal /a/. De bliver brugt efter princippet om at der skal benyttes distinkte symboler for alle distinktive vokaler. Så /u o ɔ ɒ/ angiver altså fire forskellige åbningsgrader mellem lukket og halvåben. Dette bryder ikke med IPA’s definition af vokalerne eller praksis i andre sprog.

Vi har enkelte forhold der er på kanten af at være distinktive. Distinktionen /œ ɶ/ er meget marginal, og vi kunne måske nøjes med /y ø œ/. Mest problematisk er nok at enkelte talere følger en almindelig udvikling med at forkorte vokaler før /ð/, men uden at den lille nuanceforskel i kort og lang vokal ændres med. Det betyder at disse talere kan have en distinktion i fx bad i betydningen ‘jeg bad om noget’ vs. ‘bad barnet’. Jeg har ikke selv denne distinktion og kan ikke høre den når den bliver præsenteret for mig. Men for disse individer kan man muligvis argumentere for distinktion mellem 6 åbningsgrader som pt. ikke kan håndteres i IPA. Jf. det lidt ekstreme i sådan en påstand vil jeg kræve solidt bevis før jeg køber at åbningsgraden er eneste distinktive forskel på disse. Det er dog kun få individer der har den forskel, så overordnet er det ikke noget der rykker det danske vokalsystem fra hinanden.

Hvad med korte og lange vokaler?

I Juul, Pharao og Thøgersens undersøgelse af danske vokaler fra 2016, ses det at alle vores korte vokaler i gennemsnit er en lille smule mere åbne og centraliserede end tilsvarende lange vokaler. Der er vel at mærke tale om et gennemsnit; korte og lange varianter kan sagtens overlappe i kvalitet.

Dette er et meget almindeligt forhold i verdens sprog, og ofte fører det til at korte vokaler udvikler sig til andre fonemer. Det er sket mange gange i dansk, hvilket fremgår af vores ortografi, hvor vokalbogstaver ofte svarer til et mere åbent fonem i ord med kort vokal.

I IPA håndteres det i praksis forskelligt i forskellige sprog. Nogle noterer korte og lange allofoner ens, andre noterer dem forskelligt. Nogle skelner i nogle vokaler, nogle i ingen, nogle i alle. Det er i høj grad et fortolkningsspørgsmål, både af IPA og af de fonologiske forhold i det enkelte sprog. På engelsk noterer man fx /fit fɪt/ feet, fit, hvilket i danske ører snarere er et spørgsmål om lang og kort vokal. I sprog med få vokaler er der mere rum til at lave forskel på vokalerne, og det er lettere at skelne et sæt lange og korte varianter, fordi symbolerne er ledige. Men i sprog med mange vokaler er man mere begrænset, og her er det mere oplagt at lade forskellen ligge implicit i længdemarkeringen /◌ː/.

I dansk lydskrifttradition skelnes denne lille forskel for /æ/ og /ɒ/ (kun), så man bruger forskellige symboler i Ane/Anne, og orne/ånde. Det virker sjældent intuitivt for dem der skal lære lydskrift. Ane/Anne opfattes typisk som lang/kort variant af samme vokal. I udtale kan der være forskel på vokalerne, men der behøver ikke være det, og så længe der ikke behøver være forskel, skal de ikke noteres forskelligt eller opfattes som forskellige vokaler i IPA.

I snæver IPA kan man naturligvis bruge diakritika til at skelne, fx “vokalen i mene er mere lukket, [me̝ːnə], end vokalen i minde, [me̞nə].” og på den måde viser man at vokalerne i en vis forstand er den samme, men i en anden forstand forskellige (i stil med at rottweilere og gravhunde er forskellige varianter af hunde).

Er korte og lange vokaler forskellige vokaler?

Når nogle forskere siger vi har 20 vokaler og andre siger vi har 40, så har det altså også noget at gøre med om man tæller /i/ og /iː/ som to forskellige vokaler eller en kort og lang udgave af samme vokal. Tæller man dem som forskellige, ja så fordobler man pludselig antallet af vokaler i sproget. Når man sammenligner vokaler på tværs af sprog, skal man altså lige sikre at man regner på samme måde.

I en kontekst som handler om hvor svært det er at lære et sprog, er det lidt nonsensagtigt at tælle korte og lange varianter som vidt forskellige vokaler. Det er noget man gør for at imponere eller skræmme med høje tal. Et sprog der har 5 korte og lange varianter af samme vokal har på ingen måde samme vokalkompleksitet som et sprog der skelner 10 forskellige vokalkvaliteter. Hvis vi siger at dansk har 13 korte vokaler, så skal man ikke lære 13 helt nye vokaler når man skal lave lange udgaver af disse vokaler. Man skal lære en enkelt ekstra ting, nemlig at holde vokalen lidt længere i bestemte ord.

I IPA regnes vokallængde som et suprasegmentelt træk. Det er kort sagt ikke en egenskab ved vokalen med ved stavelsen. Rimeligheden i det kan man overbevise sig om hvis man fx beder folk om at bytte rundt på stavelserne i silo. Typisk svarer folk /loːsi/, hvor læberunding, åbningsgrad og fortunge/bagtunge-trækket flytter med vokalen, men længden blive stående fra det oprindelige /siːlo/. Hvis længden var en del af vokalens egenskaber, burde vi intuitivt flytte den med vokalen og sige /losiː/.

I de fleste (alle?) sprog der skelner vokallængde, herunder dansk, er der meget skrappe begrænsninger på hvilke stavelser der kan være lange og korte, som har noget at gøre med fonotaksen, dvs. hvor mange konsonanter der er, hvilken stavelse der er betonet m.m. Overordnet kan vi bytte de 13 hovedvokaler ud med hinanden og få velformede ord, men man kan kun i bestemte tilfælde bytte korte vokaler ud med lange og få et velformet ord. Der er normalt højst én lang vokal i et ord, men der kan være mange korte.

Det er stort set kun i betonede stavelser før en enkelt konsonant at vi skelner længde, ellers følger kort/lang styret af nogle bestemte regler. Det er altså typisk mere rimeligt at betragte længde som en egenskab ved ordets fonotaks end ved den enkelte vokal.

Men som nævnt er korte vokaler mere tilbøjelige til forandring. De bliver lettere mere åbne eller centraliserede, og med tiden kan de blive opfattet som et andet fonem. Man kan ikke sætte fingeren præcist på hvornår et fonem splitter sig op i to, ligesom vi ikke kan sige præcist hvornår primater blev til mennesker. Det er en glidende overgang hvor det kun er tydeligt at se forskellen når der er gået tilstrækkelig lang tid. Vi kan kun sige at for XXX år siden var lydene ikke distinktive, men nu er de distinktive. Der vil være overgangsperioder hvor der er to konkurrerende fortolkninger, og det kan forstyrre sammenligningen af antallet af vokaler i forskellige sprog. På et tidspunkt var der 5 vokaler i dansk, nu er der 13. Vi kan sige at udviklingerne er sket i det og det århundrede, men i den periode hvor udviklingen skete, ville datidens fonologer, hvis der havde været nogen, kunne slås om antallet af vokaler. Så i sidste ende giver det ikke nødvendigvis mening at tale om et bestemt antal, men mere et spænd som afhænger af hvordan man opfatter igangværende forandringer.

Summasummarum: Korte og lange varianter af samme vokal regnes typisk ikke som to forskellige vokaler når man opgør vokaler i sprog. Men der kan være udviklinger i gang i enkelte sprog, som man bør være opmærksom på, hvor korte og lange varianter er ved at splitte sig op i to forskellige fonemer.

Ubetonede vokaler

Danske ubetonede stavelser indeholder typisk en af vokalerne /ə ɐ ɪ ʊ/, fx /fætə fætɐ fætɪ faːɪ faːʊ/ fatte, fatter, fattig, feje, farve (/ə/ kan assimileres til en hvilken som helst vokal, fremmedord kan indeholde alle de andre vokaler i ubetonede stavelser).

Når man lærer lydskrift er der altså fire ekstra vokaler man skal lære at håndtere (trad. skelnes ikke mellem /ɪ i/, men jeg synes der er fornuft i at gøre det). Det tilfører naturligvis en ekstra kompleksitet og gør det vanskeligere at lære lydskrift.

Men det betyder ikke at man pludselig skal lære 17 vokaler frem for 13 vokaler når man skal lære at tale dansk. De fire vokaler /ə ɐ ɪ ʊ/ er ikke fire distinkt forskellige vokaler, men mere en slags jokertegn. Et ord som snakker kan udtales et sted mellem [snaka~snakɒ], så man kan godt nøjes med de eksisterende 13 vokaler, men det bliver så bare lidt tilfældigt hvad man så skal skrive i lydskriften. Derfor bruger vi /ə ɐ ɪ ʊ/ for at undgå at være mere specifik end hvad der er rimeligt.

En anden måde at anskue det på er at vi i ubetonede stavelser primært har fire distinktive vokaler, som vi vælger at notere /ə ɐ ɪ ʊ/, men disse angiver hver især et ret bredt spektrum af vokalkvaliteter, et bredere spektrum end hvis vi brugte /œ a i u/. Brugen af disse ‘jokertegn’ gør det også nemmere at formulere regler for fx betoning og andre ting, som ikke er relevant lige her, men smart når man skal lære noget om dansk lydstruktur på næste niveau.

Som en der skal lære dansk, er det mao. ikke vigtigt at om man udtaler huske som /huskɛ/ eller /huskœ/, fattig som /fæti/ eller /fate/ osv. Bare man rammer en vokal i det område og ikke forveksler den med en af de andre svage vokaler. Hvis man behersker de 13 primære vokaler, er man klædt rigeligt på til også at lave forskel på de ubetonede stavelser.

Det samme forhold gør sig gældende i andre sprog der skelner mellem stærke og svage vokaler, som engelsk, fransk, tysk mv. Det er typisk også sådanne sprog som generelt har mange vokaler. Det handler om at nogle sprog foretrækker en høj kompleksitet i stærke stavelser og lav kompleksitet i svage stavelser, mens andre foretrækker mere ensartede stavelser som er hverken er meget komplekse eller meget simple. Der kan således være en lidt selvforstærkende effekt; hvis man har høj vokalkompleksitet, bliver notationen lidt ekstra teknisk fordi man så typisk også skelner mellem stærke og svage stavelser. I sådanne sprog er det mest rimeligt kun at tælle forskellige vokaler i betonede stavelser.

Approksimanter og diftonger

Symbolerne /ɐ ɪ ʊ/ indgår også i notationen af diftonger, som /haɪ haʊ moɐ/ hej, hav, mor. I dansk tradition noterer man dem forskelligt fra ubetonede vokaler, idet man markerer dem med en bue, ɪ̯ ɐ̯ ʊ̯. Det bliver derfor i flere af de opgørelser der blev nævnt i indledningen, regnet som selvstændige vokaler, tre ekstra vokaler til samlingen.

Men der følger helt det samme forhold som for de ubetonede vokaler. Lydene /ɐ ɪ ʊ/, eller ɪ̯ ɐ̯ ʊ̯ er ikke helt nye ekstra vokaler som man skal lære og holde adskilt fra de andre. Det er blot en indikation af at hovedvokalen skal glide i retning af /i a u/, men man behøver ikke lande specifikt på disse. Diftonger er overordentligt almindelige i andre sprog, men jeg har ikke set noget andet sted end i dansk hvor man tæller den slags notationer som særskilte vokaler.

Notationen af diftonger tager jeg op i næste indlæg.

Opsamling

Danske forskere kan godt lide på den ene side at overdrive antallet af vokaler i dansk, og på den anden side problematisere at vi har så mange vokaler. Det påstås jævnligt at dansk har 20-40 vokaler, 2-3 gange flere vokaler end noget andet sprog. Men måden man tæller vokaler på for at nå op i det antal, er ikke sammenlignelig med hvordan vokaler opgøres i andre sprog.

De høje antal vokaler stammer fra registrerbare forskelle på forskellige dialekter og anden udtalevariation og lidt frie fortolkninger af hvad der tæller som vokaler og konsonanter, men uden hensyn til om de små forskelle egentlig betyder noget, og uden hensyn til hvordan vokaler tolkes i andre sprog.

Hvis vi tager udgangspunkt i at det er normalt at have 5-6 vokaler i et sprog, og sprog maksimalt har 14 vokaler, så er det påstande om 20-40 vokaler der stikker ud og bærer en temmelig tung bevisbyrde. Der skal altså rigtig stærke og overbevisende argumenter til, før man kan godtage at vi har over 14 vokaler i nogen international sammenlignelig og metodisk veldefineret forstand, og der er rigtig langt fra 14 til 40 i den kontekst.

Når man skal lære at udtale forskel på danske ord der for en dansker lyder forskelligt, skal man beherske 13 forskellige vokalkvaliteter, som vi kan notere /i e ɛ æ a y ø œ ɶ u o ɔ ɒ/ i bred IPA. Det er i den høje ende sammenlignet med andre sprog, men vi er langtfra alene om at ligge oppe i det antal vokaler.

Man skal også lære at lave forskel på korte og lange stavelser og stærke og svage stavelser, og diftonger og monoftonger. Det er naturligvis også en ekstra kompleksitet, men det betyder ikke at man skal lære op til 27 ekstra vokaler.

Hvis vi, modsat hvad man ville gøre på andre sprog, regner korte og lange allofoner, approksimanter og svagtryksstavelser osv. for distinkt forskellige vokaler og inkluderer dialektal, sociolektal, og spontantalevariation, ja så kan vi godt komme op på et uhyrligt antal vokaler, men det samme kan man i alle andre sprog. Hvis man først begynder at inkludere ikke-distinktiv variation, kan man i et hvilket som helst sprog komme op på et vilkårligt højt antal vokaler. Hvis man først siger at vi har mere end 13, kan man lige så vel argumentere for 50 eller 100 eller 1000 eller milliarder. Begrebet mister ganske enkelt sin betydning.

Man er også nødt til at skelne mellem annotationsmæssig kompleksitet og kompleksiteten i at lære et sprog. Et sprogs vokalkompleksitet er ikke bare et spørgsmål om hvor mange lydskriftsymboler man har brug for. I bred IPA har vi brug for måske 17 forskellige vokaltegn, men det er mere af lidt tekniske/akademiske årsager, fordi vi skelner mellem stærke og svage stavelser og diftonger. Og hvis man vil notere forskel på dialekter og anden udtalevariation, kan man let have brug for at skelne mange flere vokaler og konsonanter. Det kan man bekymre sig om når man skal lære lydskrift og videregående akademiske emner, men det er uvedkommende når man bare skal lære at tale sproget.


I næste indlæg ser jeg nærmere på diftonger i IPA. Og så er vi ved at være ved vejs ende i denne serie om utilpasset IPA. Vi skal dog også lige forbi det danske stød, som vi traditionelt noterer med et hjemmelavet tegn, ligesom termen stød ikke rigtig modsvarer terminologien i IPA. Hvad skal vi dog stille op med det?

Kategorier
Fonologi Lydskrift

Udtaleordbog med lydeksempler

Jeg har opdateret udtaleordbogen. Udtaleordbogen er baseret på data som jeg har trukket ud af DanPASS-korpusset. Som noget nyt har jeg tilføjet

  • fonologiske stavelsesgrænser
  • kanonisk udtale
  • lydeksempler

De fonologiske stavelsesgrænser har jeg genereret automatisk ud fra de anvisninger der er givet af Grønnum (2007).

Den kanoniske udtale er ligeledes (med ganske få undtagelser) autogenereret  ud fra de anvisninger der er givet af Grønnum (2005) plus mine egne regler for schwa-assimilation.

Lydeksemplerne er klippet ud af korpusset. Der er givet op til tre tilfældigt udvalgte eksempler for hver unik annotation. Da eksemplerne er udvalgt tilfældigt, er de ikke nødvendigvis de mest repræsentative eksempler på den pågældende udtale. Hvis man ønsker nærlytning, kan man downloade lydfilerne ved at højreklikke på linket og åbne dem i fx praat.

Kategorier
Fonologi

De hyppigste danske stavelser

Jeg har lavet et lille script der kan tælle hyppigheden af stavelser i en tekst. Der er godt nok tale om fonologiske stavelser, hvor stavelsesgrænsen går lidt anderledes end man er vant til ifølge retskrivningsprincipperne. Desuden kræves det at teksten er skrevet i fonemskrift, og det er der ikke mange tekster der.

Men DanPASS-korpusset er annoteret i fonemskrift, så det kan bruges til at give et billede af stavelsesfrekvensen i dansk. Og hvilken stavelse er så mon den hyppigste? Jeg kan med stor glæde afsløre at den hyppigste danske stavelse, med overvældende vægt er (trommehvirvel):

ə

Ja, et lille isoleret schwa (et tryksvagt e) er den hyppigste danske stavelse, og den er næsten 50 % mere hyppig end den næsthyppigste stavelse, som er meget beslægtet, nemlig /ər/.

Der er 1395 forskellige stavelser i korpusset. 354 af dem forekommer kun en enkelt gang (jeg ved ikke hvor mange mulige stavelser der er i dansk, men det kan beregnes). Bemærk at jeg ikke har skelnet mellem betonede og ubetonede stavelser. Her listen over de 20 hyppigste stavelser i korpusset:

(hele listen med alle 1395 stavelser findes her)

nummer. stavelse antal
1 ə 7093
2 ər 4796
3 4003
4 du 3955
5 ja 3545
6 ɔv 3142
7 de 2454
8 dɛnˀ 2015
9 ən 1943
10 deːˀr 1743
11 eːˀn 1651
12 jaj 1644
13 ɛr 1636
14 əd 1563
15 fɔr 1489
16 pɔːˀ 1444
17 tel 1317
18 haːˀr 1275
19 gɔːˀr 1190
20 skal 1062

Man kan se at listen både indeholder hyppige morfologiske dele, som /ə ər ən əd/, og hyppige enstavede funktionsord, som så, du, ja, og, det, den, der, en, jeg, er, for, på, til, har, skal. Bemærk at scriptet ikke skelner mellem om fx /ja/ er et isoleret ord eller fx første stavelser i januar, men det er klart at disse funktionsords hyppighed er den primære årsag til at stavelserne er så hyppige.

Mit bud er at listen ville se nogenlunde ud på samme måde i et tilfældigt andet korpus. Det eneste ord der er overrepræsenteret i top 20, er går. Frasen ‘så går du …‘ er langt hyppigere i DanPASS end i de fleste dagligdags samtaler, da en stor del af korpusset er samtaler hvor man skal guide hinanden rundt på et kort. Ligeledes er der uden for top 20 en overrepræsentation af retningsangivelser, /syd øst norˀd vɛst/ er fx på hhv. plads nr. 21, 26, 28 og 32.

Stavelsesdeling

Principperne for stavelsedeling er dem der er givet i Basbøll (2005). Principperne siger at:

  • Så mange konsonanter som muligt går til efterfølgende stavelse. Dvs. i et ord som /ekstra/, hvor både /ek.stra eks.tra ekst.ra/ giver mulige danske stavelser, så er det den første mulighed /ek.stra/, som giver flest muligt konsonanter til efterfølgende stavelse, der vælges.
  • Undtagelse: Foran /ə/ går mindst én konsonant til foranstående stavelse. Dvs. i fx lave går /v/ til første stavelse /la:v.ə/, mens det i lava går til den efterfølgende stavelse /la:.va/.

Disse principper adskiller sig fra retskrivningsprincipperne, men meningen er her at man skal give regler for hvordan ord udtales ud fra deres fonologiske form. Således redegør man på denne måde bl.a. for at /v/ udtales [w] i lave og [v] i lava. Retskrivningsprincipperne tager udelukkende typografisk æstetiske hensyn.

Bemærk også at deres er tale om fonemskrift og ikke almindelig ortografi, og ikke lydskrift. Fonemskrift er groft sagt den måde vi burde stave på, hvis udtalen skulle være (næsten) 100 % forudsigelig ud fra skriften, samtidig med at man skulle begrænse antallet af bogstaver i alfabetet så meget som muligt. Dvs. man dropper stumme bogstaver (fx hvad til /vad/), markerer vokallængde på vokalen (fx kølig til /kø:li/, markerer stød (fx gal til /ga:ˀl, retter vokaler (fx pille til /pelə/), retter konsonanter (fx chance til /sjangsə/) osv.