laveste pris for generiske piller http://1apotekonline.com/

Lær noget nyt på den sjove måde:

Næsehulen og stemmelæberne McGurk-effekten Overtonesang Kardinalvokalerne Hvorfor får man lys stemme når man inhalerer helium? Strubesang

DanPASS

Udtaleordbog med lydeksempler

Jeg har opdateret udtaleordbogen. Udtaleordbogen er baseret på data som jeg har trukket ud af DanPASS-korpusset. Som noget nyt har jeg tilføjet

  • fonologiske stavelsesgrænser
  • kanonisk udtale
  • lydeksempler

De fonologiske stavelsesgrænser har jeg genereret automatisk ud fra de anvisninger der er givet af Grønnum (2007).

Den kanoniske udtale er ligeledes (med ganske få undtagelser) autogenereret  ud fra de anvisninger der er givet af Grønnum (2005) plus mine egne regler for schwa-assimilation.

Lydeksemplerne er klippet ud af korpusset. Der er givet op til tre tilfældigt udvalgte eksempler for hver unik annotation. Da eksemplerne er udvalgt tilfældigt, er de ikke nødvendigvis de mest repræsentative eksempler på den pågældende udtale. Hvis man ønsker nærlytning, kan man downloade lydfilerne ved at højreklikke på linket og åbne dem i fx praat.

De hyppigste danske stavelser

Jeg har lavet et lille script der kan tælle hyppigheden af stavelser i en tekst. Der er godt nok tale om fonologiske stavelser, hvor stavelsesgrænsen går lidt anderledes end man er vant til ifølge retskrivningsprincipperne. Desuden kræves det at teksten er skrevet i fonemskrift, og det er der ikke mange tekster der.

Men DanPASS-korpusset er annoteret i fonemskrift, så det kan bruges til at give et billede af stavelsesfrekvensen i dansk. Og hvilken stavelse er så mon den hyppigste? Jeg kan med stor glæde afsløre at den hyppigste danske stavelse, med overvældende vægt er (trommehvirvel):

ə

Ja, et lille isoleret schwa (et tryksvagt e) er den hyppigste danske stavelse, og den er næsten 50 % mere hyppig end den næsthyppigste stavelse, som er meget beslægtet, nemlig /ər/.

Der er 1395 forskellige stavelser i korpusset. 354 af dem forekommer kun en enkelt gang (jeg ved ikke hvor mange mulige stavelser der er i dansk, men det kan beregnes). Bemærk at jeg ikke har skelnet mellem betonede og ubetonede stavelser. Her listen over de 20 hyppigste stavelser i korpusset:

(hele listen med alle 1395 stavelser findes her)

nummer. stavelse antal
1 ə 7093
2 ər 4796
3 4003
4 du 3955
5 ja 3545
6 ɔv 3142
7 de 2454
8 dɛnˀ 2015
9 ən 1943
10 deːˀr 1743
11 eːˀn 1651
12 jaj 1644
13 ɛr 1636
14 əd 1563
15 fɔr 1489
16 pɔːˀ 1444
17 tel 1317
18 haːˀr 1275
19 gɔːˀr 1190
20 skal 1062

Man kan se at listen både indeholder hyppige morfologiske dele, som /ə ər ən əd/, og hyppige enstavede funktionsord, som så, du, ja, og, det, den, der, en, jeg, er, for, på, til, har, skal. Bemærk at scriptet ikke skelner mellem om fx /ja/ er et isoleret ord eller fx første stavelser i januar, men det er klart at disse funktionsords hyppighed er den primære årsag til at stavelserne er så hyppige.

Mit bud er at listen ville se nogenlunde ud på samme måde i et tilfældigt andet korpus. Det eneste ord der er overrepræsenteret i top 20, er går. Frasen ‘så går du …‘ er langt hyppigere i DanPASS end i de fleste dagligdags samtaler, da en stor del af korpusset er samtaler hvor man skal guide hinanden rundt på et kort. Ligeledes er der uden for top 20 en overrepræsentation af retningsangivelser, /syd øst norˀd vɛst/ er fx på hhv. plads nr. 21, 26, 28 og 32.

Stavelsesdeling

Principperne for stavelsedeling er dem der er givet i Basbøll (2005). Principperne siger at:

  • Så mange konsonanter som muligt går til efterfølgende stavelse. Dvs. i et ord som /ekstra/, hvor både /ek.stra eks.tra ekst.ra/ giver mulige danske stavelser, så er det den første mulighed /ek.stra/, som giver flest muligt konsonanter til efterfølgende stavelse, der vælges.
  • Undtagelse: Foran /ə/ går mindst én konsonant til foranstående stavelse. Dvs. i fx lave går /v/ til første stavelse /la:v.ə/, mens det i lava går til den efterfølgende stavelse /la:.va/.

Disse principper adskiller sig fra retskrivningsprincipperne, men meningen er her at man skal give regler for hvordan ord udtales ud fra deres fonologiske form. Således redegør man på denne måde bl.a. for at /v/ udtales [w] i lave og [v] i lava. Retskrivningsprincipperne tager udelukkende typografisk æstetiske hensyn.

Bemærk også at deres er tale om fonemskrift og ikke almindelig ortografi, og ikke lydskrift. Fonemskrift er groft sagt den måde vi burde stave på, hvis udtalen skulle være (næsten) 100 % forudsigelig ud fra skriften, samtidig med at man skulle begrænse antallet af bogstaver i alfabetet så meget som muligt. Dvs. man dropper stumme bogstaver (fx hvad til /vad/), markerer vokallængde på vokalen (fx kølig til /kø:li/, markerer stød (fx gal til /ga:ˀl, retter vokaler (fx pille til /pelə/), retter konsonanter (fx chance til /sjangsə/) osv.

Ustemte frikativer og telefoner II

For lige at visualisere forskellen på [f] og [s] som de lyder hhv. gennem en telefon og ufiltreret, som jeg skrev om i går, har jeg taget et par billeder af ordet først, udtalt [fœ̞s] (fra DanPASS).

Det første billede viser den ufiltrerede udtale. Der er tydelig forskel på frikativen før og efter vokalen, navnlig i kraft af at den sidste frikativ [s] er mere sværtet, hvilket indikerer kraftigere støj.

Lydklip: Adobe Flash Player (version 9 eller højere) kræves for at afspille dette lydklip. Hent den seneste version her. Du skal også have JavaScript aktiveret i din browser.


(Billedet viser kun op til 5 kHz, men lyden går op til 44 kHz)

I det næste billede har jeg filtreret frekvenser under 300 Hz og over 3300 Hz væk, hvilket svarer nogenlunde til en telefon. Som man kan se, er forskellen på [f] og [s] noget mere udvisket, fordi forskellen på de to lyde primært ligger i den kraftigere støj i [s] i frekvenser over 3300 Hz.

Lydklip: Adobe Flash Player (version 9 eller højere) kræves for at afspille dette lydklip. Hent den seneste version her. Du skal også have JavaScript aktiveret i din browser.

Sjusker unge mere med udtalen end ældre?

Jeg har lige læst en lille artikel (Strik & al. 2008) som undersøger hvorvidt unge mennesker reducerer udtalen mere, dvs. om de svækker eller udelader flere lyde, end ældre mennesker.

Undersøgelsen er baseret på 563.380 ord fra en hollandsk database. Med et computerprogram har man aligneret den faktiske udtale af ordene med en kanonisk udtale i en udtaleordbog. Forskelle på den faktiske og den kanoniske udtale er registreret som enten substitutioner, dvs. en kanonisk lyd er erstattet med en anden (hvilket man fortolker som en reduktion), eller bortfald, dvs. at den kanoniske lyd slet ikke udtales i situationen.

Resultaterne viser at yngre mennesker oftere substituerer eller udelader lyde end ældre mennesker. Antallet af substitutioner falder fra omkring 39 % til 35 %, og antallet af bortfald falder fra omkring 20 % til 13 % fra 30-årige til 70-årige. Det er ikke en stærk effekt, men den er statistisk signifikant. Det ser også umiddelbart ud til at mænd har flere reduktioner end jævnaldrende kvinder, men denne effekt er ikke statistisk signifikant.

Problemer med undersøgelsen

Jeg synes der især er to store problemer med undersøgelsen, der gør at jeg ikke kan acceptere konklusionen.

For det første antages det at unge og ældre har samme kanoniske eller distinkte form, dvs. at hvis de talte ureduceret, ville de udtale ordene ens. Den antagelse er forkert.

Lad mig tage et eksempel fra dansk. Hvis jeg skal udtale ordet flyve maksimalt distinkt, vil jeg sige [flyːʊ] mens mere konservative talere vil sige [flyːvə] – med hårdt v. Konservative talere kan ligesom mig også sige [flyːʊ], men det er i deres norm en reduceret udtale.

Hvis man brugte den ovennævnte metode på dansk, ville min distinkte udtale blive regnet som reduceret, da man  tager udgangspunkt i en konservativ norm. At man finder flere reduktioner hos yngre talere, skyldes altså at man måler deres udtale efter en ældre norm i stedet for de unges egen norm.

For det andet andet regnes reduktion i undersøgelsen som et binært træk. Enten er udtalen reduceret eller også er den ikke. Dette er også en fejl, og den opstår fordi undersøgelsen er baseret på lydskrift, hvor et lydskrifttegn enten er der eller ej.

Men reduktion er ikke et binært træk. Det er et gradsspørgsmål. I det danske talesprogskorpus DanPASS er fx ordet blå transskriberet [blɔːˀ] 126 gange, men transskriptionen dækker over stor variation. Alene varigheden af udtalen varierer mellem 0,15 og 0,57 sekunder.

Det er klart at en udtale på 150 millisekunder er mere reduceret end en udtale på 570 millisekunder, selvom de begge udtales med både et [b], et [l] og et [ɔːˀ]. Men efter ovenstående metode ville alle forekomster blive behandlet som ureduceret.

(En interessant sidepointe ved dette er at det er temmelig vilkårligt hvorvidt en fonetisk reduktion udtrykkes i transskriptionen. Vores lydskrift er ganske enkelt mere fintfølende i nogle fonetiske kontekster end i andre.)

Unge og ældre reducerer lige meget

Alle mennesker reducerer deres udtale efter behov. Vi har forskellige normer for hvad der er den distinkte udtale af et ord, og det er forskelligt hvordan vi reducerer udtalen. Min tese er at reduktioner skyldes kommunikative hensyn. Vi reducerer de dele af sproget som er ude at fokus for at vise hvad der er i fokus i ytringen. Dvs. vi reducerer grammatiske ord og endelser, gammel eller forudsigelig information, ord vi har sagt 1000 gange før osv.

En typisk ytring har et eller to ord der er mere i fokus end de øvrige. Disse ord udtales distinkt, mens resten reduceres i større eller mindre grad. Dette gælder uanset hvor gammel man er. Derfor er der ikke forskel på hvor mange ord vi reducerer, men der er forskel på vores udgangspunkt og måden vi reducerer på.

Selvfølgelig er der også individuelle ting der kan gøre at vi kommer til at kludre i sproget. Træthed, nervøsitet, fuldskab, usikkerhed, stress osv. får os til at lave fejl, men det gælder ligeledes for alle (man kan dog forestille sig at unge mennesker er mere trætte, stressede, trætte og usikre end ældre mennesker), og det er antageligvis en forsvindende lille del af de registrerede reduktioner der skyldes disse eksterne faktorer. Langt de fleste reduktioner knytter sig systematisk til lingvistiske faktorer.

Henvisning

H. Strik, J. van Doremalen, and C. Cucchiarini (2008) Pronunciation reduction: how it relates to speech style, gender, and age. Proceedings of Interspeech-2008, pp. 1477-1480.

Jeg har lige læst en lille artikel (http://lands.let.ru.nl/~strik/publications/a143-PronVar-IS08.pdf) som undersøger om unge mennesker reducerer udtalen mere, dvs. om de svækker eller udelader flere lyde, end ældre mennesker.

Undersøgelsen er baseret på 563.380 ord fra en hollandsk database. Med et computerprogram har man aligneret den faktiske udtale af ordene med en kanonisk udtale fra en udtaleordbog. Forskelle på den faktiske og den kanoniske udtale er registreret som enten substitutioner, dvs. en kanonisk lyd er erstattet med en anden, eller bortfald, dvs. at den kanoniske lyd slet ikke udtales i situationen.

Resultaterne viser at yngre mennesker oftere udelader lyde eller bruger andre lyde (hvilket fortolkes som reduktioner) end ældre mennesker. Antallet af substitutioner falder fra omkring 39 % til 35 %, og antallet af bortfald falder fra omkring 20 % til 13 % fra 30-årige til 70-årige. Det er ikke en stærk effekt, men den er statistisk signifikant. Det ser også umiddelbart ud til at mænd har flere reduktioner end jævnaldrende kvinder, men denne effekt er ikke statistisk signifikant.

Problemer med undersøgelsen

Jeg synes der især er to store problemer med undersøgelsen, der gør at jeg ikke kan acceptere konklusionen.

For det første antages det at unge og ældre har samme kanoniske eller distinkte form, dvs. at hvis de talte ureduceret, ville de udtale ordene ens. Den antagelse er forkert.

Lad mig tage et eksempel fra dansk. Hvis jeg skal udtale ordet ‘flyve’ maksimalt distinkt, vil jeg sige [flyːʊ] mens mere konservative talere vil sige [flyːvə] – med hårdt v. Konservative talere kan ligesom mig også sige [flyːʊ], men det er fra deres perspektiv en reduceret udtale. Hvis man brugte den ovennævnte metode på dansk, ville min distinkte udtale blive regnet som reduceret, da man tager udgangspunkt i en konservativ norm.

At man finder flere reduktioner hos yngrere talere, skyldes altså at man måler deres udtale efter en ældre norm i stedet for de unges egen norm.

For det andet andet regnes reduktion i undersøgelsen som et binært træk. Enten er udtalen reduceret eller også er den ikke. Dette er også en fejl, og den opstår fordi undersøgelsen er baseret på lydskrift, hvor et lydskrifttegn enten er der eller ej.

Men reduktion er ikke et binært træk. Det er et gradsspørgsmål. I det danske talesprogskorpus DanPASS er fx ordet ‘blå’ transskriberet [blɔːˀ] 126 gange, men transskriptionen dækker over stor variation. Alene varigheden af udtalen varierer mellem 0,15 sekunder og 0,57, næsten fem gange så meget. Det er klart at en udtale på 150 millisekunder er mere reduceret end en udtale på 570 millisekunder, selvom de begge udtales med både et [b], et [l] og et [ɔːˀ]. Men efter ovenstående metode ville alle forekomster blive behandlet som ureduceret.

(En interessant sidepointe ved dette er at det er temmelig vilkårligt hvorvidt en fonetisk reduktion udtrykkes i transskriptionen. Vores lydskriftkonvention er ganske enkelt mere fintfølende i nogle fonetiske kontekster end i andre.)

Unge og ældre reducerer lige meget

Alle mennesker reducerer deres udtale efter behov. Vi har forskellige ideer om hvad der er den distinkte udtale af et ord, og det er forskelligt hvordan vi reducerer udtalen. Min tese er at reduktioner skyldes kommunikative hensyn. Vi reducerer de dele af sproget som er ude at fokus for at vise hvad der er i fokus i ytringen. Dvs. vi reducerer grammatiske ord og endelser, gammel eller forudsigelig information, ord vi har sagt 1000 gange før osv.

En typisk ytring har et eller to ord der er mere i fokus end de øvrige. Disse ord udtales distinkt, mens resten reduceres i større eller mindre grad. Dette gælder uanset hvor gammel man er. Derfor er der ikke forskel på hvor mange ord vi reducerer, men der er forskel på måden vi reducerer på.

Selvfølgelig er der også individuelle ting der kan gøre at vi kommer til at kludre i sproget. Træthed, nervøsitet, fuldskab, usikkerhed, stress osv. får os til at lave fejl, men det gælder ligeledes for alle (man kan dog forestille sig at unge mennesker er mere trætte, stressede, trætte og usikre end ældre mennesker), og det er antageligvis en forsvindende lille del af de registrerede reduktioner der skyldes disse eksterne faktorer. Langt de fleste reduktioner knytter sig systematisk til lingvistiske faktorer.

Ny udtaleordbog baseret på DanPASS

Jeg har lavet en udtaleordbog baseret på transskriptionerne i DanPASS-korpusset. Der er en del forbedringer i forhold til den eksisterende:

  • Ordbogen er baseret på seneste udgave af DanPASS.
  • Den er Unicode-baseret, så man kan kopiere fra den og sætte ind i dokumenter.
  • Der er inkluderet fonemrepræsentation.
  • Det er html-baseret, hvilket er hurtigere at åbne og søge i end den gamle pdf-udgave.
  • Forekomsterne er sorteret efter hyppighed.
  • Det samlede antal forekomster af hvert ord er noteret.

Jeg håber på et senere tidspunkt at kunne lave en funktion så man kan se hvor i korpusset pågældende udtale findes, så man kan se hvilken kontekst udtalen forekommer i, og måske endda mulighed for at koble lyd på.

Stavelsestab og ordfrekvens

Jeg har lovet at sige noget mere om stavelsestab i dansk. Det er noget jeg kommer til at sige mere om med tiden, men lige nu handler det om sammenhængen mellem stavelsestab og ordfrekvens: Er det mere almindeligt at stavelser droppes i hyppige ord end i sjældne ord?

Ordfrekvens spiller ofte en rolle for fonologiske reduktioner. I fx modalverber som kan, skal, vil som vi bruger hele tiden, bliver sidste konsonant ofte helt droppet: ka’, ska’, ve’. Ligeledes bliver hele sidste stavelse droppet i give, tage, lade, blive, skulle, kunne så det bliver til ha’, gi’, ta’, la’, bli’, sku’, ku’. Det sker ikke i sjældnere ord. Spise og sove, som er mere situationelle verber, bliver fx ikke til spi’ og so’.

At der er en sammenhæng mellem ordfrekvens og visse reduktionsfænomener, er vist i mange tilfælde, (se fx Bybee 2001). Spørgsmålet er om ordfrekvens spiller en rolle for stavelsestab i dansk spontantale.

Jeg har kigget i DanPASS-korpusset efter ord der er noteret med tab af en eller flere stavelser. Stavelsestab skal i denne sammenhæng forstås som at antallet af stavelser i ordet er reduceret ift. den fulde form. Det kan enten ske ved at en vokal bliver desyllabificeret, dvs. mister det stavelsesbærende træk og bliver en halvvokal, fx [kiˈʌsg] → [ˈkjʌsg] kiosk, eller ved at et stavelsesbærende segment (og evt. flere nabolyde) helt droppes, fx [ˈsʌdan ed] → [ˈsned] sådan et.

Her er de 20 ord der hyppigst er annoteret med stavelsestab (kun DanPASS-dialogerne er medregnet) med angivelse af hvor ofte de er annoteret med stavelsestab/hvor mange gange de i alt forekommer*, jeg har også givet en slags gennemsnitlig lydskrift så man kan se hvilken stavelse der droppes (alle udtalerne kan nu ses i udtaleordbogen):

Drop / total Ord Lydskrift
216 / 293 ikke eg̊ə ~ eg̊
200 / 392 lige liːi ~ liː
186 / 366 sådan sʌd̥n̩ ~ sʌn
93 / 162 sige siːi ~ siː
80 / 121 noget nɔːð̩ ~ nɔːð
77 / 86 nogle noːn̩ ~ noːn
63 / 78 jernbaneoverskæring ˈjæɐ̯nb̥æːnəɒʊ̯ɐsg̊æɐ̯ˀeŋ ~ ˈjæɐ̯nb̥æːnɒʊ̯ɐsg̊æɐ̯ˀeŋ
57 / 64 skulle sg̊ulə ~ sg̊u
40 / 56 også ʌsə ~ ʌs
39 / 70 være væːɐ ~ væɐ̯
35 / 55 bare b̥ɑːɑ ~ b̥ɑː
30 / 50 gået g̊ɔːð̩ ~ g̊ɔːð
30 / 57 længere lɛŋɐɐ ~ lɛŋɐ
29 / 70 jamen jamm̩ ~ jam
29 / 32 siger siːɐ ~ siɐ̯
29 / 61 stykke sd̥øg̊ə ~ sd̥øg̊
29 / 33 væltede vɛld̥ð̩ð̩ ~ vɛld̥ð̩
26 / 51 oppe ʌb̥ə ~ ʌb̥
25 / 25 parkerede pʰɑˈkʰeːˀɐð̩ ~ pʰɑˈkʰeːˀɐð
24 / 72 meget mɑːð̩ ~ mɑð

Som man kan se er der mange meget hyppigt forekommende ord i denne liste, såsom ikke, lige, sådan, nogle, men det skyldes selvfølgelig først og fremmest at de er hyppige, og derfor har mulighed for at blive talt med mange gange. Det man skal kigge på, er imidlertid tilbøjeligheden til reduktion sammenlignet med hyppighed. Her viser tallene ret tydeligt at højfrekvente ord ikke er mere tilbøjelige til stavelsestab end lavfrekvente.

Især ordet jernbaneoverskæringen er meget tilbøjeligt til at tabe nogle stavelser – der er selvfølgelig også mange at tage af – men det kan bestemt ikke siges at være et almindeligt ord. Det er et blot et ord der forekommer ofte i DanPASS-korpusset, fordi informanterne sidder og snakker om landskabsgenstande på nogle kort, hvor jernbaneoverskæringen er en af dem.

Ordene væltede og parkerede er også en del af landskabsgenstandene væltet stengærde og parkeret lastbil og altså generelt nogen meget situationelle ord. Alligevel smider de en stavelse  i 88-89 % af forekomsterne.

Hvilke stavelser droppes?

Groft sagt kan et hvilket som helst schwa droppes, men de fonetiske kontekster som er mest tilbøjelige til stavelsestab er der hvor vi har to stavelsesbærende vokoider i træk, fx [ð̩ð̩ ɐɐ ɐð̩ iːɐ æːʊ ɑːɪ] osv. uanset hvor hyppigt forekommende det ord de optræder i ellers er, og uanset om der er tale om underliggende schwa eller ej. Dette gælder også hen over ordgrænser. Stavelsestab er især almindeligt i kombinationer af ubetonede småord som du en, på et, skal jeg der bliver til [dun pɔd sgja].

Omvendt droppes stavelser sjældent hvis de er omgivet af kontoider. Vi kan ikke droppe schwa i katten, bussen, gammel osv. Således vil det er kun ofte udtales [de ˈkɔn] mens den er kun som regel udtales [dɛn a ˈkɔn], på trods af at den og det er omtrent lige hyppige. Det er mao. den fonologiske struktur der er afgørende for stavelsestab og ikke ordfrekvens. Dette er uligt fx engelsk hvor not og is bliver til -n’t og -’s uanset omgivelser, fx can’t, won’t, it’s, that’s.

Dermed er ikke sagt at den fonologiske struktur gør det alene. Hvis det var tilfældet, ville alle stavelser af denne struktur blive droppet, og det gør de ikke. Der må altså være andre faktorer der spiller en rolle for stavelsestab. Hvilke faktorer der er på spil, vil jeg forhåbentlig kunne sige meget mere om på et senere tidspunkt.

Universalier

Der er en meget stærk tendens i verdens sprog til at stavelser adskilles af konsonanter. Den vokoide struktur som er karakteristisk for moderne dansk, hvor vi kan have mange vokaler i træk, er altså meget usædvanlig. Når stavelser især droppes i disse vokoide omgivelser, kunne det tyde på at vi, hvad der så end er årsagen, er på vej mod en universelt set mere normal stavelsesstruktur.

Noter

* Jeg har kun talt forekomster hvor de optræder som segmenterede ord. Forekomster hvor man ikke akustisk kan sætte en grænse mellem ordene, er ikke talt med. Det gælder typisk tilfælde hvor et ord slutter på en vokal, og næste ord start på en vokal, fx til et [ted], her kan man ikke meningsfuldt afgøre om der er til eller et der mister en stavelse.

** Nogle udtales i (næsten) alle tilfælde som nogen. Læs mere om nogen og nogle.

216 / 293 ikke eg̊ə ~ eg̊
200 / 392 lige liːi ~ liː
186 / 366 sådan sʌd̥n̩ ~ sʌn
93 / 162 sige siːi ~ siː
80 / 121 noget nɔːð̩ ~ nɔːð
77 / 86 nogle noːn̩ ~ noːn
63 / 78 jernbaneoverskæring
57 / 64 skulle sg̊ulə ~ sg̊u
40 / 56 også ʌsə ~ ʌs
39 / 70 være væːɐ ~ væɐ̯
35 / 55 bare b̥ɑːɑ ~ b̥ɑː
30 / 50 gået g̊ɔːð̩ ~ g̊ɔːð
30 / 57 længere lɛŋɐɐ ~ lɛŋɐ
29 / 70 jamen jamm̩ ~ jam
29 / 32 siger siːɐ ~ siɐ̯
29 / 61 stykke sd̥øg̊ə ~ sd̥øg̊
29 / 33 væltede vɛld̥ð̩ð̩ ~ vɛld̥ð̩
26 / 51 oppe ʌb̥ə ~ ʌb̥
25 / 25 parkerede pʰɑˈkʰeːˀɐð̩ ~ pʰɑˈkʰeːˀɐð
24 / 72 meget mɑːð̩ ~ mɑð

Er der overhovedet nogen der siger ‘nogle’?

Hedder det nogen eller nogle?

For nogle dage siden sad jeg og lavede en fonologisk repræsentation af de 20 ord der hyppigst udsættes for stavelsestab i DanPASS-korpusset. Et af disse ord var nogle. Den fonologiske repræsentation der er givet af ordet i DanPASS er /noːlə/. Ordet forekommer 125 gange, men kun en enkelt gang er det transskriberet med [l], hvilket endda er noget tvivlsomt efter min mening (bedøm selv). De resterende 124 gange udtales det med en final nasal eller nasalvokal, svarende til udtalen af nogen. De hyppigste udtaler af nogle er [noŋ noːn noːŋ], ubetonede og enstavede. Se hvordan nogle udtales i DanPASS. Jeg endte naturligvis med at rette /noːlə/ til /noːən/.

Den Store Danske Udtaleordbog (1991) konstaterer da også om nogle at det er “lidet brugt i talesproget”. Det tør siges. Informanterne i DanPASS har vel at mærke for størstedelens vedkommende en sproglig akademisk baggrund, så det er ikke bare fordi de ikke kan finde ud af det. Når den sproglige korrekthed inkarneret i Dronning Margrethe siger nogen i stedet for nogle tør jeg godt konstatere at nogle er et ikke-eksisterende ord i dansk. I hvert fald indtil vi kommer i skole og får at vide at vi skam skal skrive nogle nogle gange hvor vi ellers tænker nogen.

Hvis man skal skrive pænt og dannet, skal man kunne skelne mellem hvornår man skal nogen og nogle. Reglerne findes her. Reglerne er ikke vanskelige, men omvendt gør de ikke rigtig noget for sproget, andet end at gøre skoleelever kede af det. Lad dog det sølle ord nogle få gravfred og lad os holde os til nogen som klarer to ords arbejde helt fint alene.

Haplologi

En haplologi er når den ene af to ens eller næsten ens stavelser elideres, som regel nabostavelser, fx latin nutritrix > nutrix (amme, sb.).  Det er ikke et særlig almindelig fænomen, men det forekommer dog ofte nok til at det har fået sin egen betegnelse.

Eksempler på haplologier i dansk

Et af de første eksempler man plejer at hive frem, er at haplologi selv kan gøres til genstand for en haplologi: haplogi.

Ikke-etablerede haplologier, som jeg har stødt på gennem tiden:

  • autenticitet > autencitet (meget udbredt ifølge google)
  • narcissisme > narcisme
  • kvantitativ > kvantitiv/kvantativ
  • initiativ > initiv
  • alkoholholdig > alkoholdig – tak til Marie
  • fænomenologi > fænomelogi
  • autorisation > autorition
  • testosteron > testeron/testoron
  • antropologi > antrologi
  • femininisere > feminisere
  • kakografofobi > kakografobi (frygt for stavefejl)
  • morfofonologi > morfonologi

Etablerede haplologier:

  • tragikomisk < tragikokomisk (af tragik + komik)
  • stipendium < stipipendium (af stips + pendere)
  • pacifist < pacificist (det hedder pacificere og ikke pacifere)
  • kamille < kamomille – tak til Adam
  • amfora < amfifora tak til Adam

I dansk spontantale kan man finde eksempler på noget der kan kaldes haplologier i forbindelse med schwa-reduktion. Her er nogle jeg har fundet i DanPASS-korpusset:

  • eneste sted > ene sted.
  • takkerne nedad > takker nedad.
  • så fortsætter du > så fortsættu.

Og så er der de spøgefulde haplologier:

  • Hvor skal du Henrik?
  • Ud og gi’raffen mad.
  • Husk at ta’lerknen med.

En slags haplologier?

Følgende eksempler er måske ikke helt rene haplologier, men det ligner lidt.

To ens konsonantgrupper reduceres ofte til en (men stavelsesantallet reduceres ikke):

  • faststoffysik > fastoffysik
  • tekststørrelse > tekstørrelse
  • poststempel > postempel
  • dansk skole > dan skole

To ens småord efter hinanden er vi ikke glade for:

  • Kurset varer til til sommer > kurset varer til sommer.
  • En besynderlig måde at tage tøj på på > en besynderlig måde at tage tøj på.
  • Gebyr for for sen betaling > gebyr for sen betaling
  • Hun spurgte om om jeg ville med > hun spurgte om jeg ville med.

Endelserne –rere og –dede falder i udtalen ofte sammen med -re og -de. Det ligner en haplologi, men der er nok tale om en generel proces i dansk hvor to stavelsesbærende trykløse lyde efter hinanden reduceres til en, og det har således ikke specifikt at gøre med at stavelserne ligner hinanden. Fx:

  • murere > mure
  • bærere > bære
  • kedede > kede
  • hadede > hade

Haplologier i andre sprog

Et udvalg af historiske haplologier i andre sprog:

  • Engelsk: England < Englalond – tak til Adam
  • Svensk: tiondel < tiondedel (men det hedder niondedel) – tak til Adam
  • Engelsk: Master debater buges indimellem som nedsættende udtryk pga. den haplologiske henvisning til masturbator.

Kender du andre eksempler, så skriv gerne en kommentar nedenfor.

Sammen satte ord – fra et fonetisk perspektiv

Retskrivningsordbogen har en enkelt regel hvor skrivemåden gøres afhængig af udtalen. Det drejer om § 18 – om hvorvidt en ordforbindelse skal skrives i et eller flere ord.

At lade en skrivemåde være afhængig af udtalen er problematisk, især fordi det forudsætter at forskellige sprogbrugere udtaler ordene ens, og det kræver at sprogbrugerne er bevidste om udtalen.

Den konkrete formulering i RO er:

Hvis en ordforbindelse udtales med ét hovedtryk (stærkt tryk) på det første led og bitryk (svagere tryk) på det andet, skrives forbindelsen i ét ord.

Hvis en ordforbindelse udtales med lige stærkt tryk på begge led, skrives den i to (eller flere) ord.

Problem 1: Trykbevidsthed

Vi er generelt ikke særligt bevidste om tryk, os danskere. Og det er ikke bare hr. og fru Danmark og Brian fra Valby der ikke kan finde ud af det. Som underviser i fonetik er min erfaring at trykforhold ikke altid er let at lære selv for lingvistikstuderende, som man må forvente er tilstrækkeligt sprogligt bevidste og i øvrigt motiverede for at lære det.

Selv erfarne fonetikere som er trænede i lydopfattelse, kan være uenige om hvorvidt en stavelse er betonet eller ej. Hvis man klipper en ordforbindelse ud af en kontekst i et stykke spontantale, kan det være overordentligt svært at afgøre om der er tale om et kompositum eller om en frase.

At bede folk om at fornemme om et ord har hovedtryk eller ej, kan altså være meget at forlange. At oven i købet at bede dem om at skelne mellem flere trykgrader – hovedtryk, bitryk, nultryk – og for meget for de fleste.

Det kan være svært at forstå hvis man selv har let ved at høre tryk, men man må nok sige at en pæn del af befolkningen simpelthen er trykdøve.

Problem 2: Dobbelttryk

Reglerne forudsætter at sprogbrugerne rent faktisk udtaler et kompositum med et hovedtryk og et bitryk, men det gør man ikke i alle tilfælde. Man kan, måske især i visse dialekter, støde på at komposita udtales med dobbelttryk. I DanPASS-korpusset kan man fx finde følgende (og mange andre) ord udtalt med hovedtryk på begge stammer:

  • ‘færdigbe’skrevet
  • ‘første’salen
  • gar’din’billede
  • ‘lys’krydset
  • ‘løve’park
  • ‘rullegar’din
  • ’start’punktet

Ifølge reglerne skal disse ord således skrives i to ord, for så vidt som de udtales med dobbelttryk, fx der ligger en løve park, et grønt rulle gardin, osv. Da Sprognævnet endnu ikke har beføjelser til at diktere udtalen, er man frit stillet mht. at skrive i ét eller to ord, bare man postulerer at det svarer til ens trykfordeling.

Ud over dette har vi en del ord som har en velatableret udtale med dobbelttryk, som ikke desto mindre skal skrives i ét ord, fx:

  • ‘øje’blik
  • ‘jule’aften
  • na’turlig’vis
  • ’simpelt’hen
  • ’stadig’væk

Ifølge § 18 skulle man skrive *naturlig vis er det simpelt hen stadig væk jule aften om et øje blik.

Det passer ikke lige godt ind i alles kram at ord udtales med dobbelttryk. Nogle taler endda om at danskere lider af trykkesyge. Men sådan forholder det sig nu en gang.

Problem 3: Dansk prosodi

Hvis en ordforbindelseudtales med éthovedtryk (stærkttryk) på det førsteled og bitryk (svageretryk) på det andet, skrives forbindelsen i étord.

Hvis jeg skulle læse § 18 op, ville min trykfordeling umiddelbart være sådan at ordene burde skrives sammen sådan som det er gjort ovenfor. Nu er jeg oven i købet en trænet fonetiker og kan finde ud af at skelne mellem mere end to trykgrader. Hvis jeg nu kun kunne skelne mellem stærkt tryk og svagere tryk, ville sætningen skulle skrives således:

Hvis en ordforbindelseudtalesmed éthovedtrykpådet førsteledog bitrykpådet andet, skrives forbindelseni étord.

Lige nu er jeg regelrytter og læser helt bevidst ikke intentionen i § 18. Men der er et problem i at trykforhold er tæt knyttet til hvilke ord man vil fremhæve, og dét kan variere en del.

Ord har det med at indgå i en kontekst, og ofte er konteksten afgørende for hvilke ord der skal have hoved-/bitryk. At fremhæve et ord prosodisk betyder ofte at man reducerer et hovedtryk i de omgivende ord til et bitryk, hvilket ifølge § 18 får konsekvenser for om ordene skal skrives sammen eller ej.

Ofte er det valgfrit om et ord skal udtales med hovedtryk eller bitryk. Skal denne valgfrihed afspejles i skrivemåden?

Der er ingen sprogbrugere der skriver på denne måde, heldigvis, men det viser at retskrivningsreglerne ikke er formuleret i overensstemmelse med deres intention. Hvad skal den kompositumudfordrede skribent stille op med de regler?

Dette problem også knyttet til det næste problem.

Problem 4: Hvad menes der med ‘ordforbindelse’?

Ovenfor viste jeg at der er masser af tilfælde hvor naboord ikke skal komponeres på trods af at de strengt taget opfylder kravene til det. Men hvilke ord skal så komponeres? § 18 henviser til ‘ordforbindelser’. Skal det forstås sådan et visse naboord indgår i en ordforbindelse, mens andre naboord ikke gør? Hvordan skal sprogbrugeren afgøre i eksemplet ovenfor at hoved+tryk er en ordforbindelse, men stærkt+tryk ikke er det, når trykfordelingen nu er ens?

Tja, det er muligt at grammatikerne har et svar på det. Jeg har ikke. Og Retskrivningsordbogen er tavs om det. Igen, hvad skal den kompositumudfordrede skribent stille op?

Problem 5: Det er slet ikke det der er problemet

Nu har jeg angrebet § 18 fra et fonetisk synspunkt. Det er blot for at vise at det er problematisk at bruge henvisninger til udtalen i forbindelse med retskrivningsreglerne. Hvis man gør det, må man acceptere at to sprogbrugere skriver samme ord forskelligt.

Men det er slet ikke det der er problemet ift. hvorfor så mange ikke kan finde ud af at skrive sammensatte ord.

Jeg vil vove at påstå at der findes to forskellige grammatiker i dansk: En der tillader andet end adjektiver på adjektivets plads, og én der ikke gør det (det er muligvis ikke den bedste beskrivelse – jeg er elendig til grammatik).

En meget forsimplet forklaring/et muligt scenarie

Man kan forestille sig at et dansk barn fx lærer ordene ringe og klokke at kende. Senere støder barnet på ordet ringeklokke. I talesproget er der ingen mellemrum, så barnet ved ikke som udgangspunkt om der er tale om et eller to ord. For barnet er der to muligheder: (1) Barnet opfatter det prosodiske cue hovedtryk+bitryk og lærer at de to ord er særligt integrerede – det er i virkeligheden kun ét ord, eller (2) barnet opfatter ikke det prosodiske cue (muligvis er det slet ikke til stede i de stimuli barnet får, jf. problem 2, muligvis tillægger barnet det en anden betydning, jf. problem 3).

På baggrund af barnets erfaringer danner det en grammatik. Barn 1 lærer at et ord kan bestå af flere stammer, og barn 2 lærer at substantiver og verber kan modificere et ord på samme måde som adjektiver kan. Begge børn har klaret en svær opgave, nemlig at udregne en grammatik på baggrund af begrænsede oplysninger.

I skolen lærer børnene at vi sætter mellemrum mellem to ord. “Det er fint”, tænker børnene. Barn 1 skriver ringeklokke i ét ord som de jo er i barn 1’s hoved, og barn 2 skriver ringe klokke i to ord, som det jo er i barn 2’s hoved.

Hvordan pokker lærer vi barn 2 at man kontraintuitivt skal undlade at lave mellemrum mellem to ord i særlige tilfælde? Eller skal vi måske i stedet lære barn 1 at den anden måde at gøre det på, også er i orden?

En bemærkning om indflydelse fra engelsk, stavekontroller og sms-ordbøger

Det bliver ofte fremført at orddelingsfejl skyldes påvirkning fra engelsk, stavekontroller eller sms-ordbøger, som ikke kan finde ud af at sammenskrive ord sådan som de skal være.

Børns tilegnelse af orddannelsesprocesser sker før de introduceres til disse tre ting. Så hvis de skulle have en indflydelse, må man altså forudsætte at barnet har lært at skrive sammensatte ord først, men at dette så ‘ulæres’ når barnet stifter bekendskab med engelsk og elektroniske ordbøger. Det finder jeg meget usandsynligt.

Der kan næppe heller påvises nogen sammenhæng mellem hvor meget man udsættes for engelsk, eller hvor meget man bruger elektroniske ordbøger, og så hvor mange orddelingsfejl man laver.

Følg med

rss e-mail FB Twitter