Kategorier
Fonologi

De hyppigste danske stavelser

Jeg har lavet et lille script der kan tælle hyppigheden af stavelser i en tekst. Der er godt nok tale om fonologiske stavelser, hvor stavelsesgrænsen går lidt anderledes end man er vant til ifølge retskrivningsprincipperne. Desuden kræves det at teksten er skrevet i fonemskrift, og det er der ikke mange tekster der.

Men DanPASS-korpusset er annoteret i fonemskrift, så det kan bruges til at give et billede af stavelsesfrekvensen i dansk. Og hvilken stavelse er så mon den hyppigste? Jeg kan med stor glæde afsløre at den hyppigste danske stavelse, med overvældende vægt er (trommehvirvel):

ə

Ja, et lille isoleret schwa (et tryksvagt e) er den hyppigste danske stavelse, og den er næsten 50 % mere hyppig end den næsthyppigste stavelse, som er meget beslægtet, nemlig /ər/.

Der er 1395 forskellige stavelser i korpusset. 354 af dem forekommer kun en enkelt gang (jeg ved ikke hvor mange mulige stavelser der er i dansk, men det kan beregnes). Bemærk at jeg ikke har skelnet mellem betonede og ubetonede stavelser. Her listen over de 20 hyppigste stavelser i korpusset:

(hele listen med alle 1395 stavelser findes her)

nummer. stavelse antal
1 ə 7093
2 ər 4796
3 4003
4 du 3955
5 ja 3545
6 ɔv 3142
7 de 2454
8 dɛnˀ 2015
9 ən 1943
10 deːˀr 1743
11 eːˀn 1651
12 jaj 1644
13 ɛr 1636
14 əd 1563
15 fɔr 1489
16 pɔːˀ 1444
17 tel 1317
18 haːˀr 1275
19 gɔːˀr 1190
20 skal 1062

Man kan se at listen både indeholder hyppige morfologiske dele, som /ə ər ən əd/, og hyppige enstavede funktionsord, som så, du, ja, og, det, den, der, en, jeg, er, for, på, til, har, skal. Bemærk at scriptet ikke skelner mellem om fx /ja/ er et isoleret ord eller fx første stavelser i januar, men det er klart at disse funktionsords hyppighed er den primære årsag til at stavelserne er så hyppige.

Mit bud er at listen ville se nogenlunde ud på samme måde i et tilfældigt andet korpus. Det eneste ord der er overrepræsenteret i top 20, er går. Frasen ‘så går du …‘ er langt hyppigere i DanPASS end i de fleste dagligdags samtaler, da en stor del af korpusset er samtaler hvor man skal guide hinanden rundt på et kort. Ligeledes er der uden for top 20 en overrepræsentation af retningsangivelser, /syd øst norˀd vɛst/ er fx på hhv. plads nr. 21, 26, 28 og 32.

Stavelsesdeling

Principperne for stavelsedeling er dem der er givet i Basbøll (2005). Principperne siger at:

  • Så mange konsonanter som muligt går til efterfølgende stavelse. Dvs. i et ord som /ekstra/, hvor både /ek.stra eks.tra ekst.ra/ giver mulige danske stavelser, så er det den første mulighed /ek.stra/, som giver flest muligt konsonanter til efterfølgende stavelse, der vælges.
  • Undtagelse: Foran /ə/ går mindst én konsonant til foranstående stavelse. Dvs. i fx lave går /v/ til første stavelse /la:v.ə/, mens det i lava går til den efterfølgende stavelse /la:.va/.

Disse principper adskiller sig fra retskrivningsprincipperne, men meningen er her at man skal give regler for hvordan ord udtales ud fra deres fonologiske form. Således redegør man på denne måde bl.a. for at /v/ udtales [w] i lave og [v] i lava. Retskrivningsprincipperne tager udelukkende typografisk æstetiske hensyn.

Bemærk også at deres er tale om fonemskrift og ikke almindelig ortografi, og ikke lydskrift. Fonemskrift er groft sagt den måde vi burde stave på, hvis udtalen skulle være (næsten) 100 % forudsigelig ud fra skriften, samtidig med at man skulle begrænse antallet af bogstaver i alfabetet så meget som muligt. Dvs. man dropper stumme bogstaver (fx hvad til /vad/), markerer vokallængde på vokalen (fx kølig til /kø:li/, markerer stød (fx gal til /ga:ˀl, retter vokaler (fx pille til /pelə/), retter konsonanter (fx chance til /sjangsə/) osv.

Kategorier
Udtale

Sprogminuttet om stavelsestab

I sprogminuttet på P1 i går snakkede Jørn Lund om stavelsestab i danske ord. Han fortalte at ord som Sørensen, Jørgensen, ærinde, værelse, måneder, elleve, køkkenet, hovedet og mennesker tidligere udtaltes med tre stavelser, men nu udtales med to stavelser: ‘Sørnsen, Jørnsen, ærne, værlse, månder, elve, køknet, hodet og mensker‘.

Det er jeg enig med Jørn Lund i. Der er dog nogle ting han ikke fik nævnt – fair nok, det er begrænset hvad man kan nå på de 90 sekunder et sprogminut varer.

Det er ikke tilfældigt hvilke stavelser der falder bort i de nævnte eksempler. Det er nemlig den midterste stavelse der falder bort; i fagtermer er det første posttoniske stavelse i proparoxytone ord (dvs. ord med tryk på tredjesidste stavelse). Bortset fra ærinde, som kan diskuteres, er der desuden i alle tilfælde tale om at det er et schwa der falder bort.

Med andre ord er der altså en stærk tendens til at schwa i næstsidste stavelse falder bort. Dette er helt i tråd med hvad jeg fandt da jeg skrev speciale om schwa i dansk.

En ting mere man kan lægge mærke til, er at schwa i mange af ordene er nabo til en vokallyd – undtagelserne er elleve, køkkenet og menneske. Det er sandsynligt at Jørn Lund synes han har en tydelig forskel på en trestavet hhv. tostavet udtale af de øvrige ord, men jeg synes det er meget vanskeligt at afgøre hvori forskellen ligger – jeg hører de fleste af hans udtaler som tostavede i begge tilfælde.

Dette er en generel egenskab ved vokaler. Hvis to vokaliske lyde ikke er adskilt af en konsonant, har vi meget svært ved at afgøre om der er tale om en eller to stavelsesbærende segmenter.

Det forklarer også hvorfor stavelserne forsvinder i de nævnte ord. Konsonanterne /r d v g/ der skulle holde vokalerne klart adskilt, er blevet vokaliseret, og dermed forsvinder indtrykket af at der overhovedet er tale om to vokaler. Hvis en skelnen i sproget ikke er helt klar, er den meget tilbøjelig til at forsvinde.

(Jørn Lund nævnte også familie som eksempel. Det falder lidt uden for de andre eksempler. Det har jeg diskuteret i mit indlæg om linie/linje.)

Kategorier
Eksotiske lyde Fonologi Konsonanter Vokaler

Slappe y'er og ustemte l'er – i islandsk og dansk

Der er vist ikke den sprogblog der i den sidste tid ikke har haft Eyjafjallajökull oppe at vende, lige bortset fra, indtil nu, denne blog. Jeg vil nøjes med en henvisning til Language Log og Sprogmuseets behandling af emnet – der er rigeligt med links til at surfe videre derfra. Der er naturligvis fokus, fra sproglig side, på hvordan mange udtaler Eyjafjallajökull, og hvordan det så udtales rigtigt af en rigtig islænder.

Nu er der jo ikke noget overraskende i at ikke-indfødte talere kan have svært ved at udtale nogle ting på så eksotiske sprog som fx islandsk, men er det nu så eksotisk igen?

Wikipedias IPA-transskription af Eyjafjallajökull er [ˈɛɪjaˌfjatlaˌjœːkʏtl̥]. De fra et dansk synspunkt mest usædvanlige lyde i denne sammenhæng er det slappe y [ʏ], som på sprogmuseet beskrives som en mellemting mellem y og u, og så det ustemte l [l̥]. Resten af lydene svarer nogenlunde til de danske lyde.

Men det slappe y og det ustemte l er ikke så fremmedartede igen. Vi har dem faktisk i dansk i forvejen, men kun som varianter af andre fonemer i meget specifikke lydlige sammenhænge. Det gør at vi ikke umiddelbart er bevidste om de findes som sproglyde, og medmindre vi bliver bevidstgjorte om det, har vi svært ved at udtale lydene i andre sammenhænge.

Slapt y

Det slappe y [ʏ] findes som en variantudtale af schwa efter et [y] i foranstående stavelse som i hygge, lytte, hylde [hygʏ lydʏ hylʏ]. Udtalen af schwa koordineres kraftig med vokalen i foranstående stavelse, og bliver altså tilnærmet [y] i denne kontekst, svarende til [ʏ].

Fremskydning og hævning af schwa fremmes i øvrigt hvis de omkringstående konsonanter har høj tungestilling, hvilket fx gælder /k/, så Pakistan og pakkestand (hvad det så end er) ofte udtales tilnærmelsesvis ens. Således kan ASCII-sky og askesky også blive homonymer.

I Eyjafjallajökull er det slappe [ʏ] netop efter et [k], men vokalen i foranstående stavelse er ikke [y] men [œ] som i høne. Hvis man dog lader som om at det var et [y], burde man ikke have problemer med det slappe [ʏ] der følger efter.

Ustemt l

Hvad så med det ustemte l i slutningen af ordet? Faktisk har vi masser af ustemte l‘er i dansk. De findes bare stort set kun efter [p] og [k] i fx plade og kladde. Vi tænker ikke på dem som ustemte l’er – vi tænker på det som en egenskab ved [p] og [k], men ustemtheden i l er faktisk det der primært adskiller plade og kladde fra hhv. blade og glade.

Mange danskere er også tilbøjelige til at udtale et ustemt l hvis de bliver tvunget til at udtale de besyndelige imperativformer af ord som cykle, hutle, kniple osv.: cykl! hutl! knipl! [sygl̥ hudl̥ knebl̥]. Det sker i øvrigt for at overholde sonoritetsprincippet som siger at en konsonant der er fjernere fra stavelsens kerne skal være mindre sonor end en konsonant der er tættere på stavelsens kerne.

Såå, det burde ikke være så svært at sige Æjafjatlajøketl, vel?