Kategorier
Lydskrift

Udlændinge forstår ikke dansk lydskrifttradition

I NDF (og de sidste par år her på schwa.dk) gør jeg op med dansk lydskrifttradition. Det gør jeg ikke bare for sjov skyld og narrestreger, for at drille mine kolleger, eller for at være på tværs og lave mit eget lille fonetiske parallelsamfund. Det gør jeg fordi dansk lydskrifttradition spænder ben for både udlændinge der vil forstå dansk fonetik, og danskere der vil forstå fremmedsprogs fonetik. Det spænder ben for tilgængeligheden af fonetisk information, hvilket har konsekvenser for både forskning og sprogteknologi. Det er et reelt problem som er vigtigt at få gjort noget ved. Med en kombination af gulerod, tvang, nudging og gode argumenter presser jeg på at få lagt den danske tradition i graven.

Fonetikeren John Wells, tidligere formand for IPA, fremhævede engang dansk som et exceptionelt svært sprog at blive klog på som fonetiker. Det er ikke fordi dansk er svært som sådan. Problemerne er, ifølge John Wells, snarere at danskere ikke er enige om hvordan man skal beskrive dansk i IPA, og at man ofte bruger en ret fri fortolkning af lydskrifttegnene. Det gør det svært at finde hoved og hale i beskrivelserne af dansk fonetik.

Nogle af de problemer ved traditionen som afspejles i John Wells forvirring, er:

  • Vi kan ikke blive enige om hvor mange vokaler der er i dansk og hvordan de skal lydskrives i IPA. Vi bruger fx [a] for katte-a’et (på alle andre sprog bruges [a] for kappe-a’et)
  • Vi synes det giver mening at notere approksimanter som plosiver (vi noterer fx indimellem /d/ for en størrelse der både kan være [t] og [ɤ], men ikke [d])
  • Vi bruger [ð] for det bløde d, selvom det ikke er en dental frikativ og ikke er genkendeligt for englændere (som faktisk har dentale frikativer)
  • Vi bruger ad hoc-symbolet [ˀ] for noget vi kalder stød i stedet for notere/kalde det creaky voice

Det er ikke bare John Wells der er forvirret. Hvis man søger på nettet om information om dansk fonetik og fonologi, er det et kaos af velmenende vås og modstridende informationer, såsom dansk har 32 vokaler eller det danske stød er unikt, mystisk, ekstremt komplekst, og afgørende for at man kan begå sig på dansk. Den ellers fantastiske sprogsamling UCLA Phonetics Lab Archive har de mest horrible notationer når det kommer til dansk (se her og her). Wiktionary er en fremragende resurse som universel udtaleordbog for fremmedsprog, men de danske bidrag er miserable. Og ligesådan er Wikipedia en god resurse til at få overblik over sprogs fonologi eller andre fonetiske emner, men wikierne om dansk fonologi og IPA for dansk er noget rod.

Se fx opslaget glad i Wiktionary. Ordet er registreret i 11 forskellige sprog, hvor det er lydskrevet i bred IPA, engelsk /ɡlæd/, bretonsk /ɡlɑːt/, hollandsk /ɣlɑt/, norsk /ɡɽɑː/ eller /ɡlɑː/, serbokroatisk /ɡlâːd/, svensk /ɡlɑː(d)/ osv. Og så dansk: /ˈɡlað/, [ˈɡ̊læð], [ˈklæð̠˕ˠ].

Dansk skiller sig klart ud her. Der er tre forskellige udtaleangivelser, men er er ikke tale om tre forskellige udtaler, blot tre forskellige notationer efter forskellige standarder, og ingen af dem følger praksis i andre sprog (vi har ikke noget stemt /g/, vokalen er ikke et [a] (når vi faktisk har et [a], skriver vi det i stedet [ɑ]), vores bløde d er ikke en frikativ [ð], ingen andre sprog bruger [ɡ̊] for [k], ingen andre sprog bruger sådan et væld af diakritiske tegn, og ingen andre sprog har tre vidt forskellige notationer for samme udtale).

Det er ikke bare et enkeltstående tilfælde. Den afvigende danske notationspraksis går igen overalt i wiktionary. Se fx disse forvirrende opslag med ringe sammenhæng mellem bred og snæver IPA og inkonsekvent brug af tegnene både på tværs af danske opslag og andre sprogs opslag:

bog: /bɔːˀɣ/, [ˈb̥ɔ̝ːˀw], [ˈb̥ɔ̝ːwˀ], [ˈb̥ɔ̽wˀ]
klog: /klɔːʊ̯/, [kʰlɔːˀw]
fred: /freð/, [ˈfʁ̥æð]
slag: /slaːˀɣ/, [ˈsl̥æˀj], [ˈsl̥æˀ]
spor: /spoːr/, [sb̥oːˀɐ̯]
brod: /brɔd/, [b̥ʁʌð]
lang: /lanɡ/, [lɑŋˀ]
bjerg: /bjɛrɣ/, [b̥jɛɐ̯ˀw], [pjɛɒ̯̽ˀw]
…osv., søg selv videre

Med kendskab til dansk tradition kan man godt gennemskue hvordan notationerne er dannet og hvordan de skal læses, men de er hentet forskellige steder fra, hvor forskellige forfattere og redaktører har fulgt hver deres principper (og ikke IPA’s principper), og derfor er der ingen sammenhæng mellem de forskellige notationer. Notationerne i både / / og [ ] ovenfor er fortolket på vidt forskellige grundlag, og det er umuligt at navigere rundt i hvis man slår op på siden med almindeligt IPA-kendskab.

Wikiredaktører struggler tydeligvis, og ganske forståeligt, med at gennemskue de danske kilder. Når der i en kilde står IPA, og det er noteret med [ ], kan man rimeligvis forvente en meget præcis notation. Det er bare ikke sådan [ ] benyttes i dansk tradition. Og når man ser noget noteret med / / vil man normalt forvente en bred notation, som dog stadig er loyal over for IPAs definitioner. Det er bare heller ikke sådan / / traditionelt benyttes i dansk.

Problem for danskere

Dansk lydskrifttradition skaber ikke kun forvirring for udlændinge med også for os selv. Hvis man har lært fonetik efter dansk tradition, undrer man sig lige så snart man møder beskrivelser på andre sprog. Hvorfor lyder [a] og [ɑ] ikke som man har lært med udgangspunkt i dansk? Hvorfor tillader man på andre sprog at bruge [p t k] når deres b, d, g bliver ustemte, mens vi dansk skal bruge [b d g]? Hvorfor bruger de / / i stedet for [ ]? Hvorfor skriver man /sang/ på dansk, men /sɒŋ/ på engelsk? osv.

Forvirringerne skaber skepsis over for IPA, og det skaber skepsis over for lærebøgerne og underviserne der står og skal forsvare den danske tradition. Og en negativ indstilling giver et dårligt udgangspunkt for læring. Forvirringerne fører til at man spilder en masse undervisningstid på at forklare fagtraditioner og -historie i stedet for det stof som de studerende skal til eksamen i.

Der opstår også problemer når forskere vil lave sammenligninger på tværs af sprog. Hvis man ikke har et dybt kendskab til den danske tradition, men bare læser lærebogsbeskrivelser og DDO-lydskrift med almene IPA-øjne, konkluderer man let at dansk har 40 vokaler (ca. 25 vokaler mere end andre vokalrige sprog), eller at der er to stavelser i ord som kage, gade, sove, og så må danskerne være nogle frygtelige sjuskehoveder når de udtaler ord med samme antal stavelser op til 40 % hurtigere end svenskere. Udsagnene om dansk er ikke i sig selv forkerte; de er bare baseret på en anden fonetikforståelse end den der ligger i IPA og som benyttes i de andre sprog man sammenligner sig med, og det fører til konklusioner man ikke rigtig kan bruge til noget.

Problem for sprogteknologi

Jeg har gennem årene leveret lydskrift til mange forskellige producenter af sprogteknologi. De bruger hver deres notationssystem, men det er naturligvis baseret på lærebøgernes fonetiske notationer i et eller andet omfang, eller en eller anden danskkyndig lingvists forståelse af lærebøgernes notationer.

Her opstår der typisk problemer fordi de danske notationstraditioner ikke er hensigtsmæssige og ikke følger den gængse IPA-forståelse som sprogteknologi er baseret på og som fungerer glimrende i andre sprog. Stødtegnet bliver behandlet som et segment, der bliver skelnet unødige nuancer, hvilket bl.a. går ud over regnekraft og effektivitet, mens andre vigtige og distinktive nuancer ikke skelnes, fordi de i abstrakte analyser af dansk slås sammen til samme fonem, mm.

Et særligt dansk problem

Der findes formentlig uenigheder om transskriptionsstandarder i alle sprog. Sprog er altid i forandring, og det er deres fonologier også, og der vil naturligt være diskussioner om hvornår forandringer er etablerede nok til at blive inkluderet i en fonologisk beskrivelse.

Men det er ikke kun fordi jeg som dansk fonetiker kan gennemskue de internationale forvirringer mht. dansk fonetik og fonologi, og er mere naiv når det kommer til fremmedsprog. Jeg arbejder både med fremmedsprog i min fonetikundervisning og med beskrivelsen af dansk fonetik for udlændinge. De sidste 10 år har jeg bl.a. arbejdet med anvendelsen af IPA for klassiske sangere, både danske og internationale sangere og IPA-beskrivelser af dansk såvel som fremmedsprog, herunder især svensk, norsk, engelsk, tysk, fransk og italiensk. Da jeg startede med at anvende IPA på til dette formål, blev det tydeligt at IPA-trænede udlændinge ikke forstod dansk lydskriftpraksis, og samtidig blev det klart at mens andres sprogs anvendelse af IPA hang godt sammen på tværs af sprog, så havde vi i dansk tradition vores helt egen praksis som hang meget dårligt sammen med andre beskrivelser.

Jeg kender naturligvis ikke alle sprog i detaljer, men jeg har lavet en undersøgelser af internationale IPA-praksisser, og der er flere praksisser som dansk står helt alene med. Der er ingen andre der bruge [a] for et katte-a eller [ɑ] for kappe-a, der er ingen der bruger [p t k b d g] for ustemte plosiver der kontrasterer i aspiration. Vi er ikke alene om ikke at bruge bred IPA i overensstemmelse med IPAs principper, men vi er alene om at lave så radikale omfortolkninger af IPA-tegnene i vores [ ]-notation. Og vores praksisser er tydeligvis mere forvirrende for internationale brugere end andre landes praksisser.


Opsamling: Det er ikke ligegyldigt hvordan vi vælger at præsentere dansk fonetik og fonologi i lydskrift. Det er ikke uden konsekvenser når vi laver vores egne fortolkninger og tilpasninger af IPA og stadig kalder det IPA, og det er ikke ligegyldigt om man bruger den ene eller anden standard i fonetikbøgerne og fonetikundervisningen på universiteterne.

En af pointerne med at bruge internationale standarder, er at skabe transparens, forståelse og undgå forvirring på tværs af kulturer og nationer. Det synes vi som oftest er en glimrende ide, men når det kommer til dansk lydskrifttradition, har vi ikke været så flittige med standardiseringen, og det ses tydeligt i den mangelfulde forståelse af dansk fonetik i international kontekst.

Kategorier
Vokaler

Sprog med mange vokaler er nemmere end sprog med få vokaler

I sidste indlæg skrev jeg om hvilke sprog der er sværest (tager længst tid at lære) for amerikanere, baseret på data fra den amerikanske statslige organisation FSI, hvoraf det blandt andet fremgik at dansk regnes som et af de nemmeste sprog.

Sprogforskere har spekuleret i at mange vokaler i et sprog gør det vanskeligere at lære sproget. Jeg må indrømme at jeg aldrig har kunnet gennemskue argumentationen, men ikke desto mindre tænkte jeg at det ville være teste på baggrund af disse data fra FSI.

FSI deler sprogene op i fire kategorier, 1-4, hvor 1 er nemmest og 4 er sværest. Jeg har undersøgt sprogene i hver kategori for hvor mange vokalfonemer der er i sprogene, og det ser sådan ud:

Blandt de nemmeste sprog (kat. 1) findes nogle af de mest vokalrige sprog, som dansk, portugisisk og hollandsk. Sprog i kat. 1 har i snit 10,33 vokalfonemer pr. sprog. I de sværeste sprog er der i snit 5 vokalfonemer pr. sprog. Kategori 2-3 ligger mellem disse.

Hypotesen om at mange vokalfonemer gør sproget vanskeligere, kan ikke bekræftes af disse tal. Tværtimod, mange vokaler ser umiddelbart ud til give et nemmere sprog end få vokaler. Der må tydeligvis være andre forhold der har langt større betydning.

Grafen er vel at mærke baseret på hvor svært det er for amerikanske diplomater at lære sprogene. Engelsk er selv et vokalrigt sprog, og det kan meget vel tænkes at vokalrigdom ikke udgør samme problem for amerikanere som for talere fra vokalfattige sprog. Det forklarer dog ikke hvorfor færre vokaler tilsyneladende gør sprogene sværere.

Spekulation

Flere har peget på at kasusrige sprog til gengæld ser ud til at volde problemer. Engelsk er, ligesom dansk, kasusfattigt, så det giver mening at kasus volder problemer. Jeg har ikke lavet statistik over det, men det vækker genklang hos mig selv, som på trods af at kasustræning er omtrent det eneste jeg kan huske fra tyskundervisningen i folkeskolen, aldrig rigtig fattede hvad kasus var før jeg havde læst lingvistik nogle år på universitetet.

Dermed påstår jeg ikke at kasus i sig selv gør et sprog vanskeligt. Pointen er, som de fleste kan sige sig selv, at vanskelighederne ved at lære et bestemt sprog, ikke afhænger af en fast lingvistisk kategori, men af hvilke(t) sprog du taler som udgangspunkt.

Det skal også siges at påstandene om at mange vokaler gør det svært at lære et sprog, ikke drejer sig om voksnes fremmesdsprogstilegnelse, men småbørns førstesprogstilegnelse, hvilket denne lille undersøgelse ikke kan sige noget om. Hvis vokaler volder problemer for børn, kunne man dog også godt forvente at de gjorde det for voksne. Under alle omstændigheder er det ofte vokalerne der fremhæves som det vanskelige i dansk, også ifm. fremmedsprogstilegnelse.

Helt intuitivt burde det logisk set ikke være direkte nemmere at lære et sprog jo flere vokaler der er. Og det kan meget vel tænkes at mange bøvler med at få styr på vokalerne i dansk. Men igen, man kan så glæde sig over at det bare er vokalerne der kræver lidt træning, for alt i alt lader det ikke til at være en stor hindring, og meget andet i sproget er tilsvarende nemmere. Sidst kunne man også spekulere i hvilke fordele der er i at udtrykke sproglige kontraster via vokalnuancer frem for fx komplekse kasussystemer eller andet. Men det vil jeg ikke kaste mig ud i her.

Data og metode

Info om vokaler er hentet fra wikipedia. For vokaler har jeg ignoreret suprasegmentelle træk (længde, toner, stemmekvalitet) og diftonger; et sprog med fx 7 korte og 7 lange vokaler er således registreret med 7 vokaler. At indregne disse ville kun gøre tendensen stærkere, da bl.a. dansk (kat. 1) ville eksplodere mht. antallet af vokaler. Alle sprog har 3-14 vokalfonemer, hvor langt de fleste har 5-10.

Sværhedsgrader er hentet fra FSI’s hjemmeside. Kat. 2 indeholder flest sprog. Jeg medtog kun de 22 sprog fra A-K hvorefter det var klart at inklusion af flere sprog ikke ville ændre på noget. Der er således medtaget 9, 5, 22 og 5 sprog respektivt i kat. 1-4.

Kat 1
Danish 13
Dutch 13
Italian 7
Norwegian 10
Portuguese 14
Romanian 7
Spanish 5
Swedish 10
French 14

Kat 2
German 7
Haitian 7
Indonesian 8
Malay 6
Swahili 5

Kat 3
Albanian 7
Amharic 7
Armenian 6
Azerbaijani 9
Bengali 14
Bulgarian 6
Burmese 8
Czech 5
Dari 8
Estonian 9
Farsi 6
Finnish 8
Georgian 5
Greek 5
Hebrew 5
Hindi 10
Hungarian 7
Icelandic 8
Kazakh 9
Khmer 10
Kurdish 7
Kyrgyz 8

Kat 4
Arabic 3
Chinese – Cantonese 5
Chinese – Mandarin 5
Japanese 5
Korean 7

Kategorier
Sprogsyn

Dansk er det nemmeste sprog i verden

…ifølge amerikanske diplomater.

I forbindelse med diskussion om hvorvidt dansk er et særligt svært sprog, blev jeg opmærksom på den amerikanske statslige organisation Foreign Service Institute’s hjemmeside.

FSI har 70 års erfaring med at træne diplomater i alverdens sprog, og på deres hjemmeside oplyser de hvor lang tid det typisk tager amerikanere at opnå “Professional Working Proficiency” på sproget, dvs. en score på 3 (af maks. 5) på Interagency Language Roundtable scale, både mht. at læse og tale sproget.

De nemmeste sprog, målt i hvor lang tid det tager at lære, er:

Dansk, hollandsk, italiensk, norsk, portugisisk, rumænsk, spansk og svensk.

Disse sprog tager alle ca. 24 ugers træning. Fransk halter lidt efter med 30 uger, og herefter kommer tysk sammen med haitiansk, indonesisk, malayisk og swahili, som tager ca. 36 uger.

Derefter følger en lang liste med sprog som tager ca. 44 uger, herunder bulgarsk, finsk, græsk, russisk, serbokroatisk. De sværeste sprog på listen er arabisk, kinesisk, koreansk og japansk som tager ca. 88 uger.

Kort over sproglig sværhedsgrad, lavet af redditor Fummy

Hvad kan man bruge de data til?

Hvor svært det er at lære et fremmedsprog, afhænger naturligvis af ens sproglige udgangspunkt. Det er relativt. Det er meningsløst at tale om nemmeste og sværeste sprog i absolut forstand. For englændere (og danskere?) lader det til at sprog med mange kasus volder flere problemer end fx sprog med mange vokaler, men kasus er naturligvis ikke et problem for dem der er vokset op med det.

FLS’ data er baseret på hvor svært det er at lære for amerikanske diplomater. Og dansk har tilsyneladende tilstrækkeligt meget til fælles med engelsk til at det er et af de nemmeste sprog at lære for engelsktalende.

Som jeg skrev i mit tidligere indlæg, elsker danskere at fremstille deres sprog som særlig svært. Vi hæfter os ved detaljer og udsagn fra udlændinge om hvor svært det er, ikke så meget i udsagn om hvad der er nemt.

Det mest interessante er at disse data er derfor at de ikke giver os grund til at tro at dansk er sværere end fx hollandsk, italiensk, norsk, portugisisk, rumænsk, spansk og svensk uanset hvilket udgangspunkt man har. Det kan man selvfølgelig ikke vide 100 %, men vi har ikke anledning til at tro det.

Hvis man har en hypotese om at dansk er særlig svært i en eller anden forstand, burde man som minimum forvente at dansk tog længere tid at lære end beslægtede sprog som norsk, svensk og tysk, men det kan altså ikke bekræftes af disse data. Tværtimod lader dansk til at være nemmere end tysk, på trods af lidt flere vokaler, mindre indlysende ortografi og ringere eksponeringsmuligheder.