Kategorier
Sprogsyn

Dansk er det nemmeste sprog i verden

…ifølge amerikanske diplomater.

I forbindelse med diskussion om hvorvidt dansk er et særligt svært sprog, blev jeg opmærksom på den amerikanske statslige organisation Foreign Service Institute’s hjemmeside.

FSI har 70 års erfaring med at træne diplomater i alverdens sprog, og på deres hjemmeside oplyser de hvor lang tid det typisk tager amerikanere at opnå “Professional Working Proficiency” på sproget, dvs. en score på 3 (af maks. 5) på Interagency Language Roundtable scale, både mht. at læse og tale sproget.

De nemmeste sprog, målt i hvor lang tid det tager at lære, er:

Dansk, hollandsk, italiensk, norsk, portugisisk, rumænsk, spansk og svensk.

Disse sprog tager alle ca. 24 ugers træning. Fransk halter lidt efter med 30 uger, og herefter kommer tysk sammen med haitiansk, indonesisk, malayisk og swahili, som tager ca. 36 uger.

Derefter følger en lang liste med sprog som tager ca. 44 uger, herunder bulgarsk, finsk, græsk, russisk, serbokroatisk. De sværeste sprog på listen er arabisk, kinesisk, koreansk og japansk som tager ca. 88 uger.

Kort over sproglig sværhedsgrad, lavet af redditor Fummy

Hvad kan man bruge de data til?

Hvor svært det er at lære et fremmedsprog, afhænger naturligvis af ens sproglige udgangspunkt. Det er relativt. Det er meningsløst at tale om nemmeste og sværeste sprog i absolut forstand. For englændere (og danskere?) lader det til at sprog med mange kasus volder flere problemer end fx sprog med mange vokaler, men kasus er naturligvis ikke et problem for dem der er vokset op med det.

FLS’ data er baseret på hvor svært det er at lære for amerikanske diplomater. Og dansk har tilsyneladende tilstrækkeligt meget til fælles med engelsk til at det er et af de nemmeste sprog at lære for engelsktalende.

Som jeg skrev i mit tidligere indlæg, elsker danskere at fremstille deres sprog som særlig svært. Vi hæfter os ved detaljer og udsagn fra udlændinge om hvor svært det er, ikke så meget i udsagn om hvad der er nemt.

Det mest interessante er at disse data er derfor at de ikke giver os grund til at tro at dansk er sværere end fx hollandsk, italiensk, norsk, portugisisk, rumænsk, spansk og svensk uanset hvilket udgangspunkt man har. Det kan man selvfølgelig ikke vide 100 %, men vi har ikke anledning til at tro det.

Hvis man har en hypotese om at dansk er særlig svært i en eller anden forstand, burde man som minimum forvente at dansk tog længere tid at lære end beslægtede sprog som norsk, svensk og tysk, men det kan altså ikke bekræftes af disse data. Tværtimod lader dansk til at være nemmere end tysk, på trods af lidt flere vokaler, mindre indlysende ortografi og ringere eksponeringsmuligheder.

Kategorier
Fonologi Udtale

Hvad ved journalister om fonetik?

En af mine yndlingsaversioner er journalister der forsøger at formidle videnskabelige undersøgelser. De mest spektakulære overskrifter bliver til det mest fabelagtige nonsens når man dykker ned i artiklen.

Nu sker det heldigvis/desværre sjældent at fonetiske undersøgelser dukker op i mainstreamnyhederne, men i dag er der en artikel på Jyllandspostens forbrugerside fpn.dk som handler om at træthed påvirker udtalen af bestemte lyde. Måske ikke ligefrem spektakulært, men i det mindste fonetisk.

Det går dog galt for journalisten, for artiklen er idiotoversat fra engelsk. Den oprindelige artikel forklarer at /p t k/ kommer til at lyde som /b d g/ når man er træt, så fx police kommer til at lyde som bolice på engelsk. Dette er kluntet oversat til at politi kommer til at lyde som boliti, hvilket man for det første ikke kan konkludere – de engelske fonemer kan ikke uden videre ‘oversættes’ til danske – og for det andet, selv hvis man kunne, så har journalisten overset t’et i politi, som jo også burde blive oversat til d, altså bolidi.

/p t k/ og /b d g/ er ikke det samme på dansk og engelsk

Det er en almindelig fejl når danskere taler engelsk, at de udtaler lukkelydene /p t k b d g/ på samme måde som på dansk, men fonemerne dækker ikke over de samme lyde i de to sprog.

På engelsk er den primære forskel på lukkelydene at /p t k/ er ustemte, mens /b d g/ er stemte (opdatering 8/3/11: se Christians kommentar nedenfor). På dansk er alle lukkelyde imidlertid ustemte, og den primære forskel i dansk er at /b d g/ er uaspirerede = [b̥ d̥ g̊], mens /p t k/ er aspirerede = [pʰ tˢ kʰ], dvs. de ledsages af en smule friktionsstøj fra luft der slipper ud af munden.

Det er ganske almindeligt, også i dansk, at ustemte uaspirerede lukkelyde bliver stemte i mindre distinkt udtale. På engelsk betyder det at /p t k/ bliver lig /b d g/, men på dansk betyder det bare at [b̥ d̥ g̊] bliver til [b d g], men da vi ikke har nogen fonologisk stemthedskontrast, giver det ikke anledning til forveksling på dansk.

Til gengæld er de danske [pʰ tˢ kʰ] blandt de lyde der er allermest resistente over for reduktion. Man kan selv bladre igennem udtaleordbogen og se hvor sjældent ord der starter med p udtales med noget andet end [p], og ligeledes ord der starter med t og med k.

Når dansk [pʰ tˢ kʰ] reduceres, bliver de typisk til frikativer, dvs. man får ikke lukket helt i talekanalen så /p/ → [β ɸ], /t/ → [s z] og /k/ → [x ɣ]. Friktionsstøjen, som de har fordi de er aspirerede, er altså det træk der bevares bedst, og lydene bevarer således en distinkt forskel fra de uaffrikerede /b d g/.

Det er mao. det rene sludder at oversætte det at /p t k/ bliver til /b d g/ på engelsk, til det samme for dansk.

Kategorier
Fonologi Udtale

Stavelsestab og ordfrekvens

Jeg har lovet at sige noget mere om stavelsestab i dansk. Det er noget jeg kommer til at sige mere om med tiden, men lige nu handler det om sammenhængen mellem stavelsestab og ordfrekvens: Er det mere almindeligt at stavelser droppes i hyppige ord end i sjældne ord?

Ordfrekvens spiller ofte en rolle for fonologiske reduktioner. I fx modalverber som kan, skal, vil som vi bruger hele tiden, bliver sidste konsonant ofte helt droppet: ka’, ska’, ve’. Ligeledes bliver hele sidste stavelse droppet i give, tage, lade, blive, skulle, kunne så det bliver til ha’, gi’, ta’, la’, bli’, sku’, ku’. Det sker ikke i sjældnere ord. Spise og sove, som er mere situationelle verber, bliver fx ikke til spi’ og so’.

At der er en sammenhæng mellem ordfrekvens og visse reduktionsfænomener, er vist i mange tilfælde, (se fx Bybee 2001). Spørgsmålet er om ordfrekvens spiller en rolle for stavelsestab i dansk spontantale.

Jeg har kigget i DanPASS-korpusset efter ord der er noteret med tab af en eller flere stavelser. Stavelsestab skal i denne sammenhæng forstås som at antallet af stavelser i ordet er reduceret ift. den fulde form. Det kan enten ske ved at en vokal bliver desyllabificeret, dvs. mister det stavelsesbærende træk og bliver en halvvokal, fx [kiˈʌsg] → [ˈkjʌsg] kiosk, eller ved at et stavelsesbærende segment (og evt. flere nabolyde) helt droppes, fx [ˈsʌdan ed] → [ˈsned] sådan et.

Her er de 20 ord der hyppigst er annoteret med stavelsestab (kun DanPASS-dialogerne er medregnet) med angivelse af hvor ofte de er annoteret med stavelsestab/hvor mange gange de i alt forekommer*, jeg har også givet en slags gennemsnitlig lydskrift så man kan se hvilken stavelse der droppes (alle udtalerne kan nu ses i udtaleordbogen):

Drop / total Ord Lydskrift
216 / 293 ikke eg̊ə ~ eg̊
200 / 392 lige liːi ~ liː
186 / 366 sådan sʌd̥n̩ ~ sʌn
93 / 162 sige siːi ~ siː
80 / 121 noget nɔːð̩ ~ nɔːð
77 / 86 nogle noːn̩ ~ noːn
63 / 78 jernbaneoverskæring ˈjæɐ̯nb̥æːnəɒʊ̯ɐsg̊æɐ̯ˀeŋ ~ ˈjæɐ̯nb̥æːnɒʊ̯ɐsg̊æɐ̯ˀeŋ
57 / 64 skulle sg̊ulə ~ sg̊u
40 / 56 også ʌsə ~ ʌs
39 / 70 være væːɐ ~ væɐ̯
35 / 55 bare b̥ɑːɑ ~ b̥ɑː
30 / 50 gået g̊ɔːð̩ ~ g̊ɔːð
30 / 57 længere lɛŋɐɐ ~ lɛŋɐ
29 / 70 jamen jamm̩ ~ jam
29 / 32 siger siːɐ ~ siɐ̯
29 / 61 stykke sd̥øg̊ə ~ sd̥øg̊
29 / 33 væltede vɛld̥ð̩ð̩ ~ vɛld̥ð̩
26 / 51 oppe ʌb̥ə ~ ʌb̥
25 / 25 parkerede pʰɑˈkʰeːˀɐð̩ ~ pʰɑˈkʰeːˀɐð
24 / 72 meget mɑːð̩ ~ mɑð

Som man kan se er der mange meget hyppigt forekommende ord i denne liste, såsom ikke, lige, sådan, nogle, men det skyldes selvfølgelig først og fremmest at de er hyppige, og derfor har mulighed for at blive talt med mange gange. Det man skal kigge på, er imidlertid tilbøjeligheden til reduktion sammenlignet med hyppighed. Her viser tallene ret tydeligt at højfrekvente ord ikke er mere tilbøjelige til stavelsestab end lavfrekvente.

Især ordet jernbaneoverskæringen er meget tilbøjeligt til at tabe nogle stavelser – der er selvfølgelig også mange at tage af – men det kan bestemt ikke siges at være et almindeligt ord. Det er et blot et ord der forekommer ofte i DanPASS-korpusset, fordi informanterne sidder og snakker om landskabsgenstande på nogle kort, hvor jernbaneoverskæringen er en af dem.

Ordene væltede og parkerede er også en del af landskabsgenstandene væltet stengærde og parkeret lastbil og altså generelt nogen meget situationelle ord. Alligevel smider de en stavelse  i 88-89 % af forekomsterne.

Hvilke stavelser droppes?

Groft sagt kan et hvilket som helst schwa droppes, men de fonetiske kontekster som er mest tilbøjelige til stavelsestab er der hvor vi har to stavelsesbærende vokoider i træk, fx [ð̩ð̩ ɐɐ ɐð̩ iːɐ æːʊ ɑːɪ] osv. uanset hvor hyppigt forekommende det ord de optræder i ellers er, og uanset om der er tale om underliggende schwa eller ej. Dette gælder også hen over ordgrænser. Stavelsestab er især almindeligt i kombinationer af ubetonede småord som du en, på et, skal jeg der bliver til [dun pɔd sgja].

Omvendt droppes stavelser sjældent hvis de er omgivet af kontoider. Vi kan ikke droppe schwa i katten, bussen, gammel osv. Således vil det er kun ofte udtales [de ˈkɔn] mens den er kun som regel udtales [dɛn a ˈkɔn], på trods af at den og det er omtrent lige hyppige. Det er mao. den fonologiske struktur der er afgørende for stavelsestab og ikke ordfrekvens. Dette er uligt fx engelsk hvor not og is bliver til -n’t og -‘s uanset omgivelser, fx can’t, won’t, it’s, that’s.

Dermed er ikke sagt at den fonologiske struktur gør det alene. Hvis det var tilfældet, ville alle stavelser af denne struktur blive droppet, og det gør de ikke. Der må altså være andre faktorer der spiller en rolle for stavelsestab. Hvilke faktorer der er på spil, vil jeg forhåbentlig kunne sige meget mere om på et senere tidspunkt.

Universalier

Der er en meget stærk tendens i verdens sprog til at stavelser adskilles af konsonanter. Den vokoide struktur som er karakteristisk for moderne dansk, hvor vi kan have mange vokaler i træk, er altså meget usædvanlig. Når stavelser især droppes i disse vokoide omgivelser, kunne det tyde på at vi, hvad der så end er årsagen, er på vej mod en universelt set mere normal stavelsesstruktur.

Noter

* Jeg har kun talt forekomster hvor de optræder som segmenterede ord. Forekomster hvor man ikke akustisk kan sætte en grænse mellem ordene, er ikke talt med. Det gælder typisk tilfælde hvor et ord slutter på en vokal, og næste ord start på en vokal, fx til et [ted], her kan man ikke meningsfuldt afgøre om der er til eller et der mister en stavelse.

** Nogle udtales i (næsten) alle tilfælde som nogen. Læs mere om nogen og nogle.

216 / 293 ikke eg̊ə ~ eg̊
200 / 392 lige liːi ~ liː
186 / 366 sådan sʌd̥n̩ ~ sʌn
93 / 162 sige siːi ~ siː
80 / 121 noget nɔːð̩ ~ nɔːð
77 / 86 nogle noːn̩ ~ noːn
63 / 78 jernbaneoverskæring
57 / 64 skulle sg̊ulə ~ sg̊u
40 / 56 også ʌsə ~ ʌs
39 / 70 være væːɐ ~ væɐ̯
35 / 55 bare b̥ɑːɑ ~ b̥ɑː
30 / 50 gået g̊ɔːð̩ ~ g̊ɔːð
30 / 57 længere lɛŋɐɐ ~ lɛŋɐ
29 / 70 jamen jamm̩ ~ jam
29 / 32 siger siːɐ ~ siɐ̯
29 / 61 stykke sd̥øg̊ə ~ sd̥øg̊
29 / 33 væltede vɛld̥ð̩ð̩ ~ vɛld̥ð̩
26 / 51 oppe ʌb̥ə ~ ʌb̥
25 / 25 parkerede pʰɑˈkʰeːˀɐð̩ ~ pʰɑˈkʰeːˀɐð
24 / 72 meget mɑːð̩ ~ mɑð