Kategorier
Lydskrift

Udlændinge forstår ikke dansk lydskrifttradition

I NDF (og de sidste par år her på schwa.dk) gør jeg op med dansk lydskrifttradition. Det gør jeg ikke bare for sjov skyld og narrestreger, for at drille mine kolleger, eller for at være på tværs og lave mit eget lille fonetiske parallelsamfund. Det gør jeg fordi dansk lydskrifttradition spænder ben for både udlændinge der vil forstå dansk fonetik, og danskere der vil forstå fremmedsprogs fonetik. Det spænder ben for tilgængeligheden af fonetisk information, hvilket har konsekvenser for både forskning og sprogteknologi. Det er et reelt problem som er vigtigt at få gjort noget ved. Med en kombination af gulerod, tvang, nudging og gode argumenter presser jeg på at få lagt den danske tradition i graven.

Fonetikeren John Wells, tidligere formand for IPA, fremhævede engang dansk som et exceptionelt svært sprog at blive klog på som fonetiker. Det er ikke fordi dansk er svært som sådan. Problemerne er, ifølge John Wells, snarere at danskere ikke er enige om hvordan man skal beskrive dansk i IPA, og at man ofte bruger en ret fri fortolkning af lydskrifttegnene. Det gør det svært at finde hoved og hale i beskrivelserne af dansk fonetik.

Nogle af de problemer ved traditionen som afspejles i John Wells forvirring, er:

  • Vi kan ikke blive enige om hvor mange vokaler der er i dansk og hvordan de skal lydskrives i IPA. Vi bruger fx [a] for katte-a’et (på alle andre sprog bruges [a] for kappe-a’et)
  • Vi synes det giver mening at notere approksimanter som plosiver (vi noterer fx indimellem /d/ for en størrelse der både kan være [t] og [ɤ], men ikke [d])
  • Vi bruger [ð] for det bløde d, selvom det ikke er en dental frikativ og ikke er genkendeligt for englændere (som faktisk har dentale frikativer)
  • Vi bruger ad hoc-symbolet [ˀ] for noget vi kalder stød i stedet for notere/kalde det creaky voice

Det er ikke bare John Wells der er forvirret. Hvis man søger på nettet om information om dansk fonetik og fonologi, er det et kaos af velmenende vås og modstridende informationer, såsom dansk har 32 vokaler eller det danske stød er unikt, mystisk, ekstremt komplekst, og afgørende for at man kan begå sig på dansk. Den ellers fantastiske sprogsamling UCLA Phonetics Lab Archive har de mest horrible notationer når det kommer til dansk (se her og her). Wiktionary er en fremragende resurse som universel udtaleordbog for fremmedsprog, men de danske bidrag er miserable. Og ligesådan er Wikipedia en god resurse til at få overblik over sprogs fonologi eller andre fonetiske emner, men wikierne om dansk fonologi og IPA for dansk er noget rod.

Se fx opslaget glad i Wiktionary. Ordet er registreret i 11 forskellige sprog, hvor det er lydskrevet i bred IPA, engelsk /ɡlæd/, bretonsk /ɡlɑːt/, hollandsk /ɣlɑt/, norsk /ɡɽɑː/ eller /ɡlɑː/, serbokroatisk /ɡlâːd/, svensk /ɡlɑː(d)/ osv. Og så dansk: /ˈɡlað/, [ˈɡ̊læð], [ˈklæð̠˕ˠ].

Dansk skiller sig klart ud her. Der er tre forskellige udtaleangivelser, men er er ikke tale om tre forskellige udtaler, blot tre forskellige notationer efter forskellige standarder, og ingen af dem følger praksis i andre sprog (vi har ikke noget stemt /g/, vokalen er ikke et [a] (når vi faktisk har et [a], skriver vi det i stedet [ɑ]), vores bløde d er ikke en frikativ [ð], ingen andre sprog bruger [ɡ̊] for [k], ingen andre sprog bruger sådan et væld af diakritiske tegn, og ingen andre sprog har tre vidt forskellige notationer for samme udtale).

Det er ikke bare et enkeltstående tilfælde. Den afvigende danske notationspraksis går igen overalt i wiktionary. Se fx disse forvirrende opslag med ringe sammenhæng mellem bred og snæver IPA og inkonsekvent brug af tegnene både på tværs af danske opslag og andre sprogs opslag:

bog: /bɔːˀɣ/, [ˈb̥ɔ̝ːˀw], [ˈb̥ɔ̝ːwˀ], [ˈb̥ɔ̽wˀ]
klog: /klɔːʊ̯/, [kʰlɔːˀw]
fred: /freð/, [ˈfʁ̥æð]
slag: /slaːˀɣ/, [ˈsl̥æˀj], [ˈsl̥æˀ]
spor: /spoːr/, [sb̥oːˀɐ̯]
brod: /brɔd/, [b̥ʁʌð]
lang: /lanɡ/, [lɑŋˀ]
bjerg: /bjɛrɣ/, [b̥jɛɐ̯ˀw], [pjɛɒ̯̽ˀw]
…osv., søg selv videre

Med kendskab til dansk tradition kan man godt gennemskue hvordan notationerne er dannet og hvordan de skal læses, men de er hentet forskellige steder fra, hvor forskellige forfattere og redaktører har fulgt hver deres principper (og ikke IPA’s principper), og derfor er der ingen sammenhæng mellem de forskellige notationer. Notationerne i både / / og [ ] ovenfor er fortolket på vidt forskellige grundlag, og det er umuligt at navigere rundt i hvis man slår op på siden med almindeligt IPA-kendskab.

Wikiredaktører struggler tydeligvis, og ganske forståeligt, med at gennemskue de danske kilder. Når der i en kilde står IPA, og det er noteret med [ ], kan man rimeligvis forvente en meget præcis notation. Det er bare ikke sådan [ ] benyttes i dansk tradition. Og når man ser noget noteret med / / vil man normalt forvente en bred notation, som dog stadig er loyal over for IPAs definitioner. Det er bare heller ikke sådan / / traditionelt benyttes i dansk.

Problem for danskere

Dansk lydskrifttradition skaber ikke kun forvirring for udlændinge med også for os selv. Hvis man har lært fonetik efter dansk tradition, undrer man sig lige så snart man møder beskrivelser på andre sprog. Hvorfor lyder [a] og [ɑ] ikke som man har lært med udgangspunkt i dansk? Hvorfor tillader man på andre sprog at bruge [p t k] når deres b, d, g bliver ustemte, mens vi dansk skal bruge [b d g]? Hvorfor bruger de / / i stedet for [ ]? Hvorfor skriver man /sang/ på dansk, men /sɒŋ/ på engelsk? osv.

Forvirringerne skaber skepsis over for IPA, og det skaber skepsis over for lærebøgerne og underviserne der står og skal forsvare den danske tradition. Og en negativ indstilling giver et dårligt udgangspunkt for læring. Forvirringerne fører til at man spilder en masse undervisningstid på at forklare fagtraditioner og -historie i stedet for det stof som de studerende skal til eksamen i.

Der opstår også problemer når forskere vil lave sammenligninger på tværs af sprog. Hvis man ikke har et dybt kendskab til den danske tradition, men bare læser lærebogsbeskrivelser og DDO-lydskrift med almene IPA-øjne, konkluderer man let at dansk har 40 vokaler (ca. 25 vokaler mere end andre vokalrige sprog), eller at der er to stavelser i ord som kage, gade, sove, og så må danskerne være nogle frygtelige sjuskehoveder når de udtaler ord med samme antal stavelser op til 40 % hurtigere end svenskere. Udsagnene om dansk er ikke i sig selv forkerte; de er bare baseret på en anden fonetikforståelse end den der ligger i IPA og som benyttes i de andre sprog man sammenligner sig med, og det fører til konklusioner man ikke rigtig kan bruge til noget.

Problem for sprogteknologi

Jeg har gennem årene leveret lydskrift til mange forskellige producenter af sprogteknologi. De bruger hver deres notationssystem, men det er naturligvis baseret på lærebøgernes fonetiske notationer i et eller andet omfang, eller en eller anden danskkyndig lingvists forståelse af lærebøgernes notationer.

Her opstår der typisk problemer fordi de danske notationstraditioner ikke er hensigtsmæssige og ikke følger den gængse IPA-forståelse som sprogteknologi er baseret på og som fungerer glimrende i andre sprog. Stødtegnet bliver behandlet som et segment, der bliver skelnet unødige nuancer, hvilket bl.a. går ud over regnekraft og effektivitet, mens andre vigtige og distinktive nuancer ikke skelnes, fordi de i abstrakte analyser af dansk slås sammen til samme fonem, mm.

Et særligt dansk problem

Der findes formentlig uenigheder om transskriptionsstandarder i alle sprog. Sprog er altid i forandring, og det er deres fonologier også, og der vil naturligt være diskussioner om hvornår forandringer er etablerede nok til at blive inkluderet i en fonologisk beskrivelse.

Men det er ikke kun fordi jeg som dansk fonetiker kan gennemskue de internationale forvirringer mht. dansk fonetik og fonologi, og er mere naiv når det kommer til fremmedsprog. Jeg arbejder både med fremmedsprog i min fonetikundervisning og med beskrivelsen af dansk fonetik for udlændinge. De sidste 10 år har jeg bl.a. arbejdet med anvendelsen af IPA for klassiske sangere, både danske og internationale sangere og IPA-beskrivelser af dansk såvel som fremmedsprog, herunder især svensk, norsk, engelsk, tysk, fransk og italiensk. Da jeg startede med at anvende IPA på til dette formål, blev det tydeligt at IPA-trænede udlændinge ikke forstod dansk lydskriftpraksis, og samtidig blev det klart at mens andres sprogs anvendelse af IPA hang godt sammen på tværs af sprog, så havde vi i dansk tradition vores helt egen praksis som hang meget dårligt sammen med andre beskrivelser.

Jeg kender naturligvis ikke alle sprog i detaljer, men jeg har lavet en undersøgelser af internationale IPA-praksisser, og der er flere praksisser som dansk står helt alene med. Der er ingen andre der bruge [a] for et katte-a eller [ɑ] for kappe-a, der er ingen der bruger [p t k b d g] for ustemte plosiver der kontrasterer i aspiration. Vi er ikke alene om ikke at bruge bred IPA i overensstemmelse med IPAs principper, men vi er alene om at lave så radikale omfortolkninger af IPA-tegnene i vores [ ]-notation. Og vores praksisser er tydeligvis mere forvirrende for internationale brugere end andre landes praksisser.


Opsamling: Det er ikke ligegyldigt hvordan vi vælger at præsentere dansk fonetik og fonologi i lydskrift. Det er ikke uden konsekvenser når vi laver vores egne fortolkninger og tilpasninger af IPA og stadig kalder det IPA, og det er ikke ligegyldigt om man bruger den ene eller anden standard i fonetikbøgerne og fonetikundervisningen på universiteterne.

En af pointerne med at bruge internationale standarder, er at skabe transparens, forståelse og undgå forvirring på tværs af kulturer og nationer. Det synes vi som oftest er en glimrende ide, men når det kommer til dansk lydskrifttradition, har vi ikke været så flittige med standardiseringen, og det ses tydeligt i den mangelfulde forståelse af dansk fonetik i international kontekst.

Kategorier
Sprogsyn

Alle synes deres eget sprog er sværest

I de sidste to indlæg (her og her) har jeg diskuteret nogle data om hvilke sprog amerikanere har nemmest ved at lære. Det er begrænset hvor meget generelt man kan sige på baggrund af disse data, men den vigtigste pointe er at disse data modsiger nogle af de fordomme vi har om hvor svært dansk er for andre at lære. Hypoteser om dansk og andre vokalrige sprog som særligt udfordrende bliver i hvert fald ikke bekræftet.

Jeg fandt opslaget via facebook-siden The Language Nerds, og i kommentarer til opslaget var der bl.a. to udsagn om at dansk er meget sværere end indikeret af disse data. Det spøjse er at begge disse udsagn kom fra danskere selv.

Det bekræfter mig lidt i min fornemmelse af at ideen om dansk som et særlig svært sprog primært er noget danskere selv har fundet på. Danskeres sproglige selvforståelse er ofte at dansk er svært, grimt og mumlet, og danskere som dårlige til både at tale og forstå deres eget sprog.

Men hvordan er det lige på andre sprog? Jeg satte mig for at undersøge de 250 kommentarer der kom til facebook-opslaget for at få en indikation af hvad folk generelt synes er nemme og svære sprog, og resultatet er spøjst. Og generelt var der mange der havde lyst til at påpege at et bestemt sprog var svært, men ikke meget konsensus om hvilke sprog de skal betragtes som svære:

Good luck with Polish I don’t believe those statistics at all

This is BS I’ve been learning Spanish for three years and I’m still at hola como estas

Arabic is easier than Urdu. I don’t trust this data.

Brah I’ll give you one million dollars if you learn Bulgarian in 44 weeks

Jeg fandt i alt 34 kommentarer der specifikt handlede om at bestemt sprog er nemmere eller sværere end hvad de omtalte data indikerede. Ud af disse 34 kommentarer var der 33 der talte et sprog op i sværhedsgrad, fx Yeah right, good luck trying to learn Greek in 44 weeks, og 10 talte et sprog ned i sværhedsgrad, fx German is really easy, even small children here are able to speak it, og altså 9 der både talte sprog op eller ned i sværhedsgrad, fx Arabic and Thai I won’t touch. Russian is easy. Korean is ok. Chinese and Japanese are OK, as well.

Jeg satte mig så for at se hvor folk der kom med disse udsagn, selv kom fra (og dermed formentlig hvilke sprog de selv taler). Af de 33 der italesatte et sprog som relativt svært, kom 21 netop fra det land hvor sproget tales. Der var tale om om sprogene bulgarsk (x2), cantonesisk, dansk (x2), georgisk, græsk (x2), hollandsk, norsk, polsk, portugisisk (x3), rumænsk, slaviske sprog, tysk (x2), ungarsk, urdu og vietnamesisk.

Til sammenligning var der to tyskere og en georgier der italesatte deres eget sprog som relativt nemmere.

Den stærkeste tendes er altså at folk der reagerede på opslaget, ville understrege at deres eget sprog altså var ret svært at lære.

De sprog der blev talt op i sværhedsgrad (som fremmedsprog) var: arabisk (x3), finsk (x2), fransk, polsk, russisk, spansk (x2), thai, ungarsk, litauisk. De sprog der blev talt ned i sværhedsgrad (som fremmedsprog) var: arabisk, finsk, fransk, japansk (x2), russisk, serbisk, spansk, ungarsk.

Hvad kan man bruge det til?

Der er tale om et ret tilfældigt nedslag i et opslag på de sociale medier. Kommentarerne er næppe repræsentative, men viser alligevel noget der kunne ligne en tendens: Overalt i verden er der folk som synes at deres eget sprog er temmelig svært at lære, både for indfødte og udlændinge. Det er ikke bare her i landet at vi har den opfattelse. Generelt er folk også mere tilbøjelige til at fremhæve det svære end det nemme i sprog.

Generelt har folk også mest travlt med at tale om deres eget sprog.

Det er selvfølgelig naturligt nok at folk kun udtaler sig om deres eget sprog, fordi det er et sprog de faktisk behersker og kan udtale sig om. Omvendt er det pudsigt at folk oftest opfatter deres eget sprog som svært frem for nemt, for folk har jo trods alt typisk lært deres eget sprog uden større problemer.

Den fortolkning jeg lægger op til, er at dette ikke handler så meget om hardcore facts – om hvad der faktuelt er nemt og svært – men om følelser og selvforståelse. Vi kan godt lide at forstå vores eget sprog som noget specielt på en eller anden måde; om det så er det smukkeste, sværeste, mest oprindelige eller andet. Og pågældende opslag lægger op til at man skal reagere på hvad der er svært. Et opslag om hvad der opfattes som det smukkeste sprog, ville sikkert også kalde på reaktioner overalt i verden.

Det er ikke nødvendigvis negativt at opfatte sit eget sprog som svært. En ungarer skriver Speaking Hungarian properly is a superpower. Dermed har alle ungarer en superpower, og det er vel ikke en dårlig ting. Det er ikke positivt hvis et sprog er så svært at ingen kan finde ud af, men omvendt er det forståeligt hvis man ikke vil have det siddende på at sig at det er så nemt at det bliver barnemad.


Har du en kommentar? Følg diskussionen på facebook.

Citater

(Emojis ikke inkluderet)

Good luck with Norwegian. You learn it in one place, then travel 2-3 hours in any direction and have a new accent to decipher xD We also have two official written languages, not counting the Sami onesnordmand
Georgia has it’s own unique alphabet and the letters, which are hardly to pronounce for foreigners, the easy part is, it pronounces the way it’s writtengeorgier
Romanian in the easy category? Who did this? English speakers can’t even pronounce all the letters in our alphabet. This was fun, but seems quite unrealistic towards many languages.rumæner
I would like to meet this English native speaker who can learn any Slavic language in 44 weeks. I dare You, I double dare You motherftaler af slavisk sprog
Vietnamese is tonal is very hardvietnameser
German is only category 3?? Enough to use it confidently? not a chance… A1 or A2 German, maybe…tysker
Yeah right, good luck trying to learn Greek in 44 weeksgræker
I welcome you all to just try bulgarian…bulgarer
Good luck with Polish I don’t believe those statistics at allpolak
I will like to see someone learning Danish in 24 weeks…dansker
Speaking Hungarian properly is a superpowerungarer
Master Greek in 44 weeks? Lol i’ve been speaking Greek for the last 31 years and i still make mistakesgræker
The person who wrote this article, clearly hasn’t learned portuguese… it’s harder than spanish and french… it has a lot of irregular verbs etc. not even native speakers speak it wellportugiser
Danish as easy as Spanish? Get out of heredansker
Cantonese is harder than Japanese, Korean and Mandarin…kineser
Learn Dutch in weeks? in your dreams. Make it months and months.hollænder
Arabic is easier than Urdu. I don’t trust this data.pakistaner
Brah I’ll give you one million dollars if you learn Bulgarian in 44 weeksbulgarer
German 30 weeks? Ahahaha! 300 weeks if you are germantysker
good luck with the conjugation of portuguese verbsportugiser
24 weeks to learn Portuguese… yeah, sure!portugiser
Kategorier
Vokaler

Sprog med mange vokaler er nemmere end sprog med få vokaler

I sidste indlæg skrev jeg om hvilke sprog der er sværest (tager længst tid at lære) for amerikanere, baseret på data fra den amerikanske statslige organisation FSI, hvoraf det blandt andet fremgik at dansk regnes som et af de nemmeste sprog.

Sprogforskere har spekuleret i at mange vokaler i et sprog gør det vanskeligere at lære sproget. Jeg må indrømme at jeg aldrig har kunnet gennemskue argumentationen, men ikke desto mindre tænkte jeg at det ville være teste på baggrund af disse data fra FSI.

FSI deler sprogene op i fire kategorier, 1-4, hvor 1 er nemmest og 4 er sværest. Jeg har undersøgt sprogene i hver kategori for hvor mange vokalfonemer der er i sprogene, og det ser sådan ud:

Blandt de nemmeste sprog (kat. 1) findes nogle af de mest vokalrige sprog, som dansk, portugisisk og hollandsk. Sprog i kat. 1 har i snit 10,33 vokalfonemer pr. sprog. I de sværeste sprog er der i snit 5 vokalfonemer pr. sprog. Kategori 2-3 ligger mellem disse.

Hypotesen om at mange vokalfonemer gør sproget vanskeligere, kan ikke bekræftes af disse tal. Tværtimod, mange vokaler ser umiddelbart ud til give et nemmere sprog end få vokaler. Der må tydeligvis være andre forhold der har langt større betydning.

Grafen er vel at mærke baseret på hvor svært det er for amerikanske diplomater at lære sprogene. Engelsk er selv et vokalrigt sprog, og det kan meget vel tænkes at vokalrigdom ikke udgør samme problem for amerikanere som for talere fra vokalfattige sprog. Det forklarer dog ikke hvorfor færre vokaler tilsyneladende gør sprogene sværere.

Spekulation

Flere har peget på at kasusrige sprog til gengæld ser ud til at volde problemer. Engelsk er, ligesom dansk, kasusfattigt, så det giver mening at kasus volder problemer. Jeg har ikke lavet statistik over det, men det vækker genklang hos mig selv, som på trods af at kasustræning er omtrent det eneste jeg kan huske fra tyskundervisningen i folkeskolen, aldrig rigtig fattede hvad kasus var før jeg havde læst lingvistik nogle år på universitetet.

Dermed påstår jeg ikke at kasus i sig selv gør et sprog vanskeligt. Pointen er, som de fleste kan sige sig selv, at vanskelighederne ved at lære et bestemt sprog, ikke afhænger af en fast lingvistisk kategori, men af hvilke(t) sprog du taler som udgangspunkt.

Det skal også siges at påstandene om at mange vokaler gør det svært at lære et sprog, ikke drejer sig om voksnes fremmesdsprogstilegnelse, men småbørns førstesprogstilegnelse, hvilket denne lille undersøgelse ikke kan sige noget om. Hvis vokaler volder problemer for børn, kunne man dog også godt forvente at de gjorde det for voksne. Under alle omstændigheder er det ofte vokalerne der fremhæves som det vanskelige i dansk, også ifm. fremmedsprogstilegnelse.

Helt intuitivt burde det logisk set ikke være direkte nemmere at lære et sprog jo flere vokaler der er. Og det kan meget vel tænkes at mange bøvler med at få styr på vokalerne i dansk. Men igen, man kan så glæde sig over at det bare er vokalerne der kræver lidt træning, for alt i alt lader det ikke til at være en stor hindring, og meget andet i sproget er tilsvarende nemmere. Sidst kunne man også spekulere i hvilke fordele der er i at udtrykke sproglige kontraster via vokalnuancer frem for fx komplekse kasussystemer eller andet. Men det vil jeg ikke kaste mig ud i her.

Data og metode

Info om vokaler er hentet fra wikipedia. For vokaler har jeg ignoreret suprasegmentelle træk (længde, toner, stemmekvalitet) og diftonger; et sprog med fx 7 korte og 7 lange vokaler er således registreret med 7 vokaler. At indregne disse ville kun gøre tendensen stærkere, da bl.a. dansk (kat. 1) ville eksplodere mht. antallet af vokaler. Alle sprog har 3-14 vokalfonemer, hvor langt de fleste har 5-10.

Sværhedsgrader er hentet fra FSI’s hjemmeside. Kat. 2 indeholder flest sprog. Jeg medtog kun de 22 sprog fra A-K hvorefter det var klart at inklusion af flere sprog ikke ville ændre på noget. Der er således medtaget 9, 5, 22 og 5 sprog respektivt i kat. 1-4.

Kat 1
Danish 13
Dutch 13
Italian 7
Norwegian 10
Portuguese 14
Romanian 7
Spanish 5
Swedish 10
French 14

Kat 2
German 7
Haitian 7
Indonesian 8
Malay 6
Swahili 5

Kat 3
Albanian 7
Amharic 7
Armenian 6
Azerbaijani 9
Bengali 14
Bulgarian 6
Burmese 8
Czech 5
Dari 8
Estonian 9
Farsi 6
Finnish 8
Georgian 5
Greek 5
Hebrew 5
Hindi 10
Hungarian 7
Icelandic 8
Kazakh 9
Khmer 10
Kurdish 7
Kyrgyz 8

Kat 4
Arabic 3
Chinese – Cantonese 5
Chinese – Mandarin 5
Japanese 5
Korean 7