Kategorier
Fonologi Konsonanter Lydskrift

Korte, lange og ekstralange konsonanter

I dansk skelner man mellem korte og lange vokaler, fx i [kulə] kulde vs. [kuːlə] kugle. Vi er ikke vant til at tænke på at vi også har forskel på korte og lange konsonanter, men faktisk har vi en kontrast mellem mindst tre forskellige konsonantlængder: kort, lang og ekstralang med stavelsestop. Det fremgår fx af denne minimaltrio:

  • [bɔnə] bonde – kort n
  • [bɔnnə] bundne – langt n
  • [bɔnn̩nə] bundene – ekstra langt stavelsesbærende n

Lange og ekstralange konsonanter i dansk stammer altid fra at der er flere fonologiske stavelser, og det er derfor vi traditionelt lydskriver dem med dobbelt- og tripelkonsonant. Der er fonologisk, morfologisk og sikkert også kognitivt tale om flere ens nabokonsonanter snarere en enkelt lang eller ekstralang konsonant.

Dobbeltkonsonanter findes oftest i sammensatte ord som

  • [issyːˀl] issyl
  • [gullʌg] Guldlok
  • [sdʌbbʌlˀd] stopbold

Vi kan også fakultativt have konsonantforlængelse hvor der underliggende er tale om et /r/, fx

  • [bɛððɐ] bedre
  • [hʌjjɐ] højre
  • [feŋŋɐ] fingre

Tripelkonsonant findes kun med [n] og [l] i ord som rindende, hundene, uudholdelig, adskillelig. Fakultativt kan det nok også findes i sammensatte ord som [ʌnn̩nøðˀ] åndenød, men min fornemmelse er at vi foretrækker et distinkt schwa her [ʌnənøðˀ].

Når man lydskriver, kan man komme ud for at have brug for hele fem forskellige måder at annotere konsonantlængde på. De er dog ikke alle distinktive, men varierer alt efter den fonologiske kontekst de indgår i:

  1. Kort, fx [vɛn] ven. Defaultlængden.
  2. Kort syllabisk, fx [lɛːn̩] læne. Bruges ved schwa-assimilation efter lang vokal med schwa i åben stavelse.
  3. Lang ikke-syllabisk, fx [svɔnnə] svundne. Bruges når coda-konsonant møder ansats-konsonant.
  4. Lang syllabisk med final stavelsestop, fx [vɛnn̩ sɛːnn̩] vende, Seinen. Bruges ved schwa-assimilation efter kort vokal og/eller schwa i lukket stavelse.
  5. Lang syllabisk med initial stavelsestop, fx [liːn̩nə] lignende. Bruges ved schwa-assimilation efter lang vokal i proparoxytone ord.
  6. Ekstralang syllabisk, fx [sbɛnn̩nə] spændende. Bruges ved schwa-assimilation efter kort vokal i proparoxytone ord.

Hvis man virkelig skal gå i detaljer, er der vist statistisk set en forskel på varigheden af konsonanten i type 4 alt efter om schwa-stavelsen er åben eller lukket og om foranstående vokal er kort eller lang, dvs. [vɛnn̩ ɛnn̩ sɛːnn̩] vende, enden, Seinen har vistnok i gennemsnit forskellig varighed selvom de traditionelt annoteres ens. Og lur mig om ikke tilstedevær af stød også påvirker konsonantvarigheden i en eller anden grad.

Bevæggrunden for at man skelner mellem at skrive et, to eller tre konsonantsymboler og syllabicitetstegn på første/midterste/sidste konsonant, skal findes i dels den akustiske varighed, dels i at stavelsestoppen ligger enten centreret eller højre-/venstreforskudt alt efter den underliggende stavelsesstruktur.

Man skeler dog nok også til en symmetri med lignende ord med andre konsonanter. Man kan let være fristet til at droppe en af konsonanterne i [vʌll̩li sbɛnn̩nə] voldelig, spændende, men da disse ord er opbygget fonologisk og morfologisk som fx [ʌnn̩li kʌmm̩nə] åndelig, kommende hvor der er mindre tvivl om annotationen, er man på den sikreste side hvis man bevarer tripelkonsonanterne i de første ord.

Konsonantlængde i andre sprog

Mange sprog har som dansk en forskel på korte og lange konsonanter, men ligesom på dansk findes lange konsonanter typisk kun mellem to vokaler og kan således fortolkes som at der underliggende er to ens konsonanter der støder sammen.

Det er heller ikke ualmindeligt at konsonantvarighed varierer betydeligt betinget af den fonologiske kontekst de indgår i. I fx svensk og norsk er konsonanter typisk betydeligt længere efter korte vokaler end efter lange (vi har spor af dette i dansk ortografi hvor kort vokal signaleres med dobbeltkonsonant). I fx engelsk og fransk er sonore konsonanter typisk betydeligt længere foran stemte lukkelyde end foran ustemte.

Jeg har aldrig stødt på nogen sprog der har en klokkeklar fonologisk længdekontrast i konsonanter, da konsonantlængde således typisk kan kædes sammen med enten en tostavet struktur eller med sekundære faktorer. Jeg har heller aldrig stødt på nogen sprog, ud over dansk, der skelner mellem mere end to konsonantlængder. Men det findes nok derude et sted.

Kategorier
Sprogsyn Udtale

Sjusker unge mere med udtalen end ældre?

Jeg har lige læst en lille artikel (Strik & al. 2008) som undersøger hvorvidt unge mennesker reducerer udtalen mere, dvs. om de svækker eller udelader flere lyde, end ældre mennesker.

Undersøgelsen er baseret på 563.380 ord fra en hollandsk database. Med et computerprogram har man aligneret den faktiske udtale af ordene med en kanonisk udtale i en udtaleordbog. Forskelle på den faktiske og den kanoniske udtale er registreret som enten substitutioner, dvs. en kanonisk lyd er erstattet med en anden (hvilket man fortolker som en reduktion), eller bortfald, dvs. at den kanoniske lyd slet ikke udtales i situationen.

Resultaterne viser at yngre mennesker oftere substituerer eller udelader lyde end ældre mennesker. Antallet af substitutioner falder fra omkring 39 % til 35 %, og antallet af bortfald falder fra omkring 20 % til 13 % fra 30-årige til 70-årige. Det er ikke en stærk effekt, men den er statistisk signifikant. Det ser også umiddelbart ud til at mænd har flere reduktioner end jævnaldrende kvinder, men denne effekt er ikke statistisk signifikant.

Problemer med undersøgelsen

Jeg synes der især er to store problemer med undersøgelsen, der gør at jeg ikke kan acceptere konklusionen.

For det første antages det at unge og ældre har samme kanoniske eller distinkte form, dvs. at hvis de talte ureduceret, ville de udtale ordene ens. Den antagelse er forkert.

Lad mig tage et eksempel fra dansk. Hvis jeg skal udtale ordet flyve maksimalt distinkt, vil jeg sige [flyːʊ] mens mere konservative talere vil sige [flyːvə] – med hårdt v. Konservative talere kan ligesom mig også sige [flyːʊ], men det er i deres norm en reduceret udtale.

Hvis man brugte den ovennævnte metode på dansk, ville min distinkte udtale blive regnet som reduceret, da man  tager udgangspunkt i en konservativ norm. At man finder flere reduktioner hos yngre talere, skyldes altså at man måler deres udtale efter en ældre norm i stedet for de unges egen norm.

For det andet andet regnes reduktion i undersøgelsen som et binært træk. Enten er udtalen reduceret eller også er den ikke. Dette er også en fejl, og den opstår fordi undersøgelsen er baseret på lydskrift, hvor et lydskrifttegn enten er der eller ej.

Men reduktion er ikke et binært træk. Det er et gradsspørgsmål. I det danske talesprogskorpus DanPASS er fx ordet blå transskriberet [blɔːˀ] 126 gange, men transskriptionen dækker over stor variation. Alene varigheden af udtalen varierer mellem 0,15 og 0,57 sekunder.

Det er klart at en udtale på 150 millisekunder er mere reduceret end en udtale på 570 millisekunder, selvom de begge udtales med både et [b], et [l] og et [ɔːˀ]. Men efter ovenstående metode ville alle forekomster blive behandlet som ureduceret.

(En interessant sidepointe ved dette er at det er temmelig vilkårligt hvorvidt en fonetisk reduktion udtrykkes i transskriptionen. Vores lydskrift er ganske enkelt mere fintfølende i nogle fonetiske kontekster end i andre.)

Unge og ældre reducerer lige meget

Alle mennesker reducerer deres udtale efter behov. Vi har forskellige normer for hvad der er den distinkte udtale af et ord, og det er forskelligt hvordan vi reducerer udtalen. Min tese er at reduktioner skyldes kommunikative hensyn. Vi reducerer de dele af sproget som er ude at fokus for at vise hvad der er i fokus i ytringen. Dvs. vi reducerer grammatiske ord og endelser, gammel eller forudsigelig information, ord vi har sagt 1000 gange før osv.

En typisk ytring har et eller to ord der er mere i fokus end de øvrige. Disse ord udtales distinkt, mens resten reduceres i større eller mindre grad. Dette gælder uanset hvor gammel man er. Derfor er der ikke forskel på hvor mange ord vi reducerer, men der er forskel på vores udgangspunkt og måden vi reducerer på.

Selvfølgelig er der også individuelle ting der kan gøre at vi kommer til at kludre i sproget. Træthed, nervøsitet, fuldskab, usikkerhed, stress osv. får os til at lave fejl, men det gælder ligeledes for alle (man kan dog forestille sig at unge mennesker er mere trætte, stressede, trætte og usikre end ældre mennesker), og det er antageligvis en forsvindende lille del af de registrerede reduktioner der skyldes disse eksterne faktorer. Langt de fleste reduktioner knytter sig systematisk til lingvistiske faktorer.

Henvisning

H. Strik, J. van Doremalen, and C. Cucchiarini (2008) Pronunciation reduction: how it relates to speech style, gender, and age. Proceedings of Interspeech-2008, pp. 1477-1480.

Jeg har lige læst en lille artikel (http://lands.let.ru.nl/~strik/publications/a143-PronVar-IS08.pdf) som undersøger om unge mennesker reducerer udtalen mere, dvs. om de svækker eller udelader flere lyde, end ældre mennesker.

Undersøgelsen er baseret på 563.380 ord fra en hollandsk database. Med et computerprogram har man aligneret den faktiske udtale af ordene med en kanonisk udtale fra en udtaleordbog. Forskelle på den faktiske og den kanoniske udtale er registreret som enten substitutioner, dvs. en kanonisk lyd er erstattet med en anden, eller bortfald, dvs. at den kanoniske lyd slet ikke udtales i situationen.

Resultaterne viser at yngre mennesker oftere udelader lyde eller bruger andre lyde (hvilket fortolkes som reduktioner) end ældre mennesker. Antallet af substitutioner falder fra omkring 39 % til 35 %, og antallet af bortfald falder fra omkring 20 % til 13 % fra 30-årige til 70-årige. Det er ikke en stærk effekt, men den er statistisk signifikant. Det ser også umiddelbart ud til at mænd har flere reduktioner end jævnaldrende kvinder, men denne effekt er ikke statistisk signifikant.

Problemer med undersøgelsen

Jeg synes der især er to store problemer med undersøgelsen, der gør at jeg ikke kan acceptere konklusionen.

For det første antages det at unge og ældre har samme kanoniske eller distinkte form, dvs. at hvis de talte ureduceret, ville de udtale ordene ens. Den antagelse er forkert.

Lad mig tage et eksempel fra dansk. Hvis jeg skal udtale ordet ‘flyve’ maksimalt distinkt, vil jeg sige [flyːʊ] mens mere konservative talere vil sige [flyːvə] – med hårdt v. Konservative talere kan ligesom mig også sige [flyːʊ], men det er fra deres perspektiv en reduceret udtale. Hvis man brugte den ovennævnte metode på dansk, ville min distinkte udtale blive regnet som reduceret, da man tager udgangspunkt i en konservativ norm.

At man finder flere reduktioner hos yngrere talere, skyldes altså at man måler deres udtale efter en ældre norm i stedet for de unges egen norm.

For det andet andet regnes reduktion i undersøgelsen som et binært træk. Enten er udtalen reduceret eller også er den ikke. Dette er også en fejl, og den opstår fordi undersøgelsen er baseret på lydskrift, hvor et lydskrifttegn enten er der eller ej.

Men reduktion er ikke et binært træk. Det er et gradsspørgsmål. I det danske talesprogskorpus DanPASS er fx ordet ‘blå’ transskriberet [blɔːˀ] 126 gange, men transskriptionen dækker over stor variation. Alene varigheden af udtalen varierer mellem 0,15 sekunder og 0,57, næsten fem gange så meget. Det er klart at en udtale på 150 millisekunder er mere reduceret end en udtale på 570 millisekunder, selvom de begge udtales med både et [b], et [l] og et [ɔːˀ]. Men efter ovenstående metode ville alle forekomster blive behandlet som ureduceret.

(En interessant sidepointe ved dette er at det er temmelig vilkårligt hvorvidt en fonetisk reduktion udtrykkes i transskriptionen. Vores lydskriftkonvention er ganske enkelt mere fintfølende i nogle fonetiske kontekster end i andre.)

Unge og ældre reducerer lige meget

Alle mennesker reducerer deres udtale efter behov. Vi har forskellige ideer om hvad der er den distinkte udtale af et ord, og det er forskelligt hvordan vi reducerer udtalen. Min tese er at reduktioner skyldes kommunikative hensyn. Vi reducerer de dele af sproget som er ude at fokus for at vise hvad der er i fokus i ytringen. Dvs. vi reducerer grammatiske ord og endelser, gammel eller forudsigelig information, ord vi har sagt 1000 gange før osv.

En typisk ytring har et eller to ord der er mere i fokus end de øvrige. Disse ord udtales distinkt, mens resten reduceres i større eller mindre grad. Dette gælder uanset hvor gammel man er. Derfor er der ikke forskel på hvor mange ord vi reducerer, men der er forskel på måden vi reducerer på.

Selvfølgelig er der også individuelle ting der kan gøre at vi kommer til at kludre i sproget. Træthed, nervøsitet, fuldskab, usikkerhed, stress osv. får os til at lave fejl, men det gælder ligeledes for alle (man kan dog forestille sig at unge mennesker er mere trætte, stressede, trætte og usikre end ældre mennesker), og det er antageligvis en forsvindende lille del af de registrerede reduktioner der skyldes disse eksterne faktorer. Langt de fleste reduktioner knytter sig systematisk til lingvistiske faktorer.

Kategorier
Lydskrift Scripts

Konverter SIL IPA93 til Unicode

I gamle dage brugte man fonten SIL IPA93 når man skulle skrive lydskrift i tekstdokumenter. I dag bruger de fleste Unicode. Fordelen ved Unicode er at det kan læses på alle moderne pc’er og det kan findes af søgemaskiner, mens SIL IPA93 krævede at man havde fonten installeret for at man kunne læse det.

Hvis man vil konvertere dokumenter med lydskrift skrevet i SIL IPA93 til Unicode, er der en meget besværlig guide på SIL’s hjemmeside. Det kræver at man downloader software og tilføjelsespakker og hvad ved jeg. Dernæst skal programmet konfigureres, og der er særlige metoder alt efter hvilket tekstbehandlingsprogram man bruger. Meget besværligt, og jeg har endnu ikke fået det til at virke.

Derfor har jeg lavet et supernemt og hurtigt script som konverterer SIL IPA93 til Unicode. Det er online, og det kræver ingen download eller installering, bare et klik på en knap.

Et meget nyttigt værktøj (for formodentlig ganske få mennesker).