Kategorier
Sprogsyn Udtale

Sjusker unge mere med udtalen end ældre?

Jeg har lige læst en lille artikel (Strik & al. 2008) som undersøger hvorvidt unge mennesker reducerer udtalen mere, dvs. om de svækker eller udelader flere lyde, end ældre mennesker.

Undersøgelsen er baseret på 563.380 ord fra en hollandsk database. Med et computerprogram har man aligneret den faktiske udtale af ordene med en kanonisk udtale i en udtaleordbog. Forskelle på den faktiske og den kanoniske udtale er registreret som enten substitutioner, dvs. en kanonisk lyd er erstattet med en anden (hvilket man fortolker som en reduktion), eller bortfald, dvs. at den kanoniske lyd slet ikke udtales i situationen.

Resultaterne viser at yngre mennesker oftere substituerer eller udelader lyde end ældre mennesker. Antallet af substitutioner falder fra omkring 39 % til 35 %, og antallet af bortfald falder fra omkring 20 % til 13 % fra 30-årige til 70-årige. Det er ikke en stærk effekt, men den er statistisk signifikant. Det ser også umiddelbart ud til at mænd har flere reduktioner end jævnaldrende kvinder, men denne effekt er ikke statistisk signifikant.

Problemer med undersøgelsen

Jeg synes der især er to store problemer med undersøgelsen, der gør at jeg ikke kan acceptere konklusionen.

For det første antages det at unge og ældre har samme kanoniske eller distinkte form, dvs. at hvis de talte ureduceret, ville de udtale ordene ens. Den antagelse er forkert.

Lad mig tage et eksempel fra dansk. Hvis jeg skal udtale ordet flyve maksimalt distinkt, vil jeg sige [flyːʊ] mens mere konservative talere vil sige [flyːvə] – med hårdt v. Konservative talere kan ligesom mig også sige [flyːʊ], men det er i deres norm en reduceret udtale.

Hvis man brugte den ovennævnte metode på dansk, ville min distinkte udtale blive regnet som reduceret, da man  tager udgangspunkt i en konservativ norm. At man finder flere reduktioner hos yngre talere, skyldes altså at man måler deres udtale efter en ældre norm i stedet for de unges egen norm.

For det andet andet regnes reduktion i undersøgelsen som et binært træk. Enten er udtalen reduceret eller også er den ikke. Dette er også en fejl, og den opstår fordi undersøgelsen er baseret på lydskrift, hvor et lydskrifttegn enten er der eller ej.

Men reduktion er ikke et binært træk. Det er et gradsspørgsmål. I det danske talesprogskorpus DanPASS er fx ordet blå transskriberet [blɔːˀ] 126 gange, men transskriptionen dækker over stor variation. Alene varigheden af udtalen varierer mellem 0,15 og 0,57 sekunder.

Det er klart at en udtale på 150 millisekunder er mere reduceret end en udtale på 570 millisekunder, selvom de begge udtales med både et [b], et [l] og et [ɔːˀ]. Men efter ovenstående metode ville alle forekomster blive behandlet som ureduceret.

(En interessant sidepointe ved dette er at det er temmelig vilkårligt hvorvidt en fonetisk reduktion udtrykkes i transskriptionen. Vores lydskrift er ganske enkelt mere fintfølende i nogle fonetiske kontekster end i andre.)

Unge og ældre reducerer lige meget

Alle mennesker reducerer deres udtale efter behov. Vi har forskellige normer for hvad der er den distinkte udtale af et ord, og det er forskelligt hvordan vi reducerer udtalen. Min tese er at reduktioner skyldes kommunikative hensyn. Vi reducerer de dele af sproget som er ude at fokus for at vise hvad der er i fokus i ytringen. Dvs. vi reducerer grammatiske ord og endelser, gammel eller forudsigelig information, ord vi har sagt 1000 gange før osv.

En typisk ytring har et eller to ord der er mere i fokus end de øvrige. Disse ord udtales distinkt, mens resten reduceres i større eller mindre grad. Dette gælder uanset hvor gammel man er. Derfor er der ikke forskel på hvor mange ord vi reducerer, men der er forskel på vores udgangspunkt og måden vi reducerer på.

Selvfølgelig er der også individuelle ting der kan gøre at vi kommer til at kludre i sproget. Træthed, nervøsitet, fuldskab, usikkerhed, stress osv. får os til at lave fejl, men det gælder ligeledes for alle (man kan dog forestille sig at unge mennesker er mere trætte, stressede, trætte og usikre end ældre mennesker), og det er antageligvis en forsvindende lille del af de registrerede reduktioner der skyldes disse eksterne faktorer. Langt de fleste reduktioner knytter sig systematisk til lingvistiske faktorer.

Henvisning

H. Strik, J. van Doremalen, and C. Cucchiarini (2008) Pronunciation reduction: how it relates to speech style, gender, and age. Proceedings of Interspeech-2008, pp. 1477-1480.

Jeg har lige læst en lille artikel (http://lands.let.ru.nl/~strik/publications/a143-PronVar-IS08.pdf) som undersøger om unge mennesker reducerer udtalen mere, dvs. om de svækker eller udelader flere lyde, end ældre mennesker.

Undersøgelsen er baseret på 563.380 ord fra en hollandsk database. Med et computerprogram har man aligneret den faktiske udtale af ordene med en kanonisk udtale fra en udtaleordbog. Forskelle på den faktiske og den kanoniske udtale er registreret som enten substitutioner, dvs. en kanonisk lyd er erstattet med en anden, eller bortfald, dvs. at den kanoniske lyd slet ikke udtales i situationen.

Resultaterne viser at yngre mennesker oftere udelader lyde eller bruger andre lyde (hvilket fortolkes som reduktioner) end ældre mennesker. Antallet af substitutioner falder fra omkring 39 % til 35 %, og antallet af bortfald falder fra omkring 20 % til 13 % fra 30-årige til 70-årige. Det er ikke en stærk effekt, men den er statistisk signifikant. Det ser også umiddelbart ud til at mænd har flere reduktioner end jævnaldrende kvinder, men denne effekt er ikke statistisk signifikant.

Problemer med undersøgelsen

Jeg synes der især er to store problemer med undersøgelsen, der gør at jeg ikke kan acceptere konklusionen.

For det første antages det at unge og ældre har samme kanoniske eller distinkte form, dvs. at hvis de talte ureduceret, ville de udtale ordene ens. Den antagelse er forkert.

Lad mig tage et eksempel fra dansk. Hvis jeg skal udtale ordet ‘flyve’ maksimalt distinkt, vil jeg sige [flyːʊ] mens mere konservative talere vil sige [flyːvə] – med hårdt v. Konservative talere kan ligesom mig også sige [flyːʊ], men det er fra deres perspektiv en reduceret udtale. Hvis man brugte den ovennævnte metode på dansk, ville min distinkte udtale blive regnet som reduceret, da man tager udgangspunkt i en konservativ norm.

At man finder flere reduktioner hos yngrere talere, skyldes altså at man måler deres udtale efter en ældre norm i stedet for de unges egen norm.

For det andet andet regnes reduktion i undersøgelsen som et binært træk. Enten er udtalen reduceret eller også er den ikke. Dette er også en fejl, og den opstår fordi undersøgelsen er baseret på lydskrift, hvor et lydskrifttegn enten er der eller ej.

Men reduktion er ikke et binært træk. Det er et gradsspørgsmål. I det danske talesprogskorpus DanPASS er fx ordet ‘blå’ transskriberet [blɔːˀ] 126 gange, men transskriptionen dækker over stor variation. Alene varigheden af udtalen varierer mellem 0,15 sekunder og 0,57, næsten fem gange så meget. Det er klart at en udtale på 150 millisekunder er mere reduceret end en udtale på 570 millisekunder, selvom de begge udtales med både et [b], et [l] og et [ɔːˀ]. Men efter ovenstående metode ville alle forekomster blive behandlet som ureduceret.

(En interessant sidepointe ved dette er at det er temmelig vilkårligt hvorvidt en fonetisk reduktion udtrykkes i transskriptionen. Vores lydskriftkonvention er ganske enkelt mere fintfølende i nogle fonetiske kontekster end i andre.)

Unge og ældre reducerer lige meget

Alle mennesker reducerer deres udtale efter behov. Vi har forskellige ideer om hvad der er den distinkte udtale af et ord, og det er forskelligt hvordan vi reducerer udtalen. Min tese er at reduktioner skyldes kommunikative hensyn. Vi reducerer de dele af sproget som er ude at fokus for at vise hvad der er i fokus i ytringen. Dvs. vi reducerer grammatiske ord og endelser, gammel eller forudsigelig information, ord vi har sagt 1000 gange før osv.

En typisk ytring har et eller to ord der er mere i fokus end de øvrige. Disse ord udtales distinkt, mens resten reduceres i større eller mindre grad. Dette gælder uanset hvor gammel man er. Derfor er der ikke forskel på hvor mange ord vi reducerer, men der er forskel på måden vi reducerer på.

Selvfølgelig er der også individuelle ting der kan gøre at vi kommer til at kludre i sproget. Træthed, nervøsitet, fuldskab, usikkerhed, stress osv. får os til at lave fejl, men det gælder ligeledes for alle (man kan dog forestille sig at unge mennesker er mere trætte, stressede, trætte og usikre end ældre mennesker), og det er antageligvis en forsvindende lille del af de registrerede reduktioner der skyldes disse eksterne faktorer. Langt de fleste reduktioner knytter sig systematisk til lingvistiske faktorer.

Kategorier
Lydskrift Udtale

Ny udtaleordbog baseret på DanPASS

Jeg har lavet en udtaleordbog baseret på transskriptionerne i DanPASS-korpusset. Der er en del forbedringer i forhold til den eksisterende:

  • Ordbogen er baseret på seneste udgave af DanPASS.
  • Den er Unicode-baseret, så man kan kopiere fra den og sætte ind i dokumenter.
  • Der er inkluderet fonemrepræsentation.
  • Det er html-baseret, hvilket er hurtigere at åbne og søge i end den gamle pdf-udgave.
  • Forekomsterne er sorteret efter hyppighed.
  • Det samlede antal forekomster af hvert ord er noteret.

Jeg håber på et senere tidspunkt at kunne lave en funktion så man kan se hvor i korpusset pågældende udtale findes, så man kan se hvilken kontekst udtalen forekommer i, og måske endda mulighed for at koble lyd på.

Kategorier
Fonologi Udtale

Stavelsestab og ordfrekvens

Jeg har lovet at sige noget mere om stavelsestab i dansk. Det er noget jeg kommer til at sige mere om med tiden, men lige nu handler det om sammenhængen mellem stavelsestab og ordfrekvens: Er det mere almindeligt at stavelser droppes i hyppige ord end i sjældne ord?

Ordfrekvens spiller ofte en rolle for fonologiske reduktioner. I fx modalverber som kan, skal, vil som vi bruger hele tiden, bliver sidste konsonant ofte helt droppet: ka’, ska’, ve’. Ligeledes bliver hele sidste stavelse droppet i give, tage, lade, blive, skulle, kunne så det bliver til ha’, gi’, ta’, la’, bli’, sku’, ku’. Det sker ikke i sjældnere ord. Spise og sove, som er mere situationelle verber, bliver fx ikke til spi’ og so’.

At der er en sammenhæng mellem ordfrekvens og visse reduktionsfænomener, er vist i mange tilfælde, (se fx Bybee 2001). Spørgsmålet er om ordfrekvens spiller en rolle for stavelsestab i dansk spontantale.

Jeg har kigget i DanPASS-korpusset efter ord der er noteret med tab af en eller flere stavelser. Stavelsestab skal i denne sammenhæng forstås som at antallet af stavelser i ordet er reduceret ift. den fulde form. Det kan enten ske ved at en vokal bliver desyllabificeret, dvs. mister det stavelsesbærende træk og bliver en halvvokal, fx [kiˈʌsg] → [ˈkjʌsg] kiosk, eller ved at et stavelsesbærende segment (og evt. flere nabolyde) helt droppes, fx [ˈsʌdan ed] → [ˈsned] sådan et.

Her er de 20 ord der hyppigst er annoteret med stavelsestab (kun DanPASS-dialogerne er medregnet) med angivelse af hvor ofte de er annoteret med stavelsestab/hvor mange gange de i alt forekommer*, jeg har også givet en slags gennemsnitlig lydskrift så man kan se hvilken stavelse der droppes (alle udtalerne kan nu ses i udtaleordbogen):

Drop / total Ord Lydskrift
216 / 293 ikke eg̊ə ~ eg̊
200 / 392 lige liːi ~ liː
186 / 366 sådan sʌd̥n̩ ~ sʌn
93 / 162 sige siːi ~ siː
80 / 121 noget nɔːð̩ ~ nɔːð
77 / 86 nogle noːn̩ ~ noːn
63 / 78 jernbaneoverskæring ˈjæɐ̯nb̥æːnəɒʊ̯ɐsg̊æɐ̯ˀeŋ ~ ˈjæɐ̯nb̥æːnɒʊ̯ɐsg̊æɐ̯ˀeŋ
57 / 64 skulle sg̊ulə ~ sg̊u
40 / 56 også ʌsə ~ ʌs
39 / 70 være væːɐ ~ væɐ̯
35 / 55 bare b̥ɑːɑ ~ b̥ɑː
30 / 50 gået g̊ɔːð̩ ~ g̊ɔːð
30 / 57 længere lɛŋɐɐ ~ lɛŋɐ
29 / 70 jamen jamm̩ ~ jam
29 / 32 siger siːɐ ~ siɐ̯
29 / 61 stykke sd̥øg̊ə ~ sd̥øg̊
29 / 33 væltede vɛld̥ð̩ð̩ ~ vɛld̥ð̩
26 / 51 oppe ʌb̥ə ~ ʌb̥
25 / 25 parkerede pʰɑˈkʰeːˀɐð̩ ~ pʰɑˈkʰeːˀɐð
24 / 72 meget mɑːð̩ ~ mɑð

Som man kan se er der mange meget hyppigt forekommende ord i denne liste, såsom ikke, lige, sådan, nogle, men det skyldes selvfølgelig først og fremmest at de er hyppige, og derfor har mulighed for at blive talt med mange gange. Det man skal kigge på, er imidlertid tilbøjeligheden til reduktion sammenlignet med hyppighed. Her viser tallene ret tydeligt at højfrekvente ord ikke er mere tilbøjelige til stavelsestab end lavfrekvente.

Især ordet jernbaneoverskæringen er meget tilbøjeligt til at tabe nogle stavelser – der er selvfølgelig også mange at tage af – men det kan bestemt ikke siges at være et almindeligt ord. Det er et blot et ord der forekommer ofte i DanPASS-korpusset, fordi informanterne sidder og snakker om landskabsgenstande på nogle kort, hvor jernbaneoverskæringen er en af dem.

Ordene væltede og parkerede er også en del af landskabsgenstandene væltet stengærde og parkeret lastbil og altså generelt nogen meget situationelle ord. Alligevel smider de en stavelse  i 88-89 % af forekomsterne.

Hvilke stavelser droppes?

Groft sagt kan et hvilket som helst schwa droppes, men de fonetiske kontekster som er mest tilbøjelige til stavelsestab er der hvor vi har to stavelsesbærende vokoider i træk, fx [ð̩ð̩ ɐɐ ɐð̩ iːɐ æːʊ ɑːɪ] osv. uanset hvor hyppigt forekommende det ord de optræder i ellers er, og uanset om der er tale om underliggende schwa eller ej. Dette gælder også hen over ordgrænser. Stavelsestab er især almindeligt i kombinationer af ubetonede småord som du en, på et, skal jeg der bliver til [dun pɔd sgja].

Omvendt droppes stavelser sjældent hvis de er omgivet af kontoider. Vi kan ikke droppe schwa i katten, bussen, gammel osv. Således vil det er kun ofte udtales [de ˈkɔn] mens den er kun som regel udtales [dɛn a ˈkɔn], på trods af at den og det er omtrent lige hyppige. Det er mao. den fonologiske struktur der er afgørende for stavelsestab og ikke ordfrekvens. Dette er uligt fx engelsk hvor not og is bliver til -n’t og -‘s uanset omgivelser, fx can’t, won’t, it’s, that’s.

Dermed er ikke sagt at den fonologiske struktur gør det alene. Hvis det var tilfældet, ville alle stavelser af denne struktur blive droppet, og det gør de ikke. Der må altså være andre faktorer der spiller en rolle for stavelsestab. Hvilke faktorer der er på spil, vil jeg forhåbentlig kunne sige meget mere om på et senere tidspunkt.

Universalier

Der er en meget stærk tendens i verdens sprog til at stavelser adskilles af konsonanter. Den vokoide struktur som er karakteristisk for moderne dansk, hvor vi kan have mange vokaler i træk, er altså meget usædvanlig. Når stavelser især droppes i disse vokoide omgivelser, kunne det tyde på at vi, hvad der så end er årsagen, er på vej mod en universelt set mere normal stavelsesstruktur.

Noter

* Jeg har kun talt forekomster hvor de optræder som segmenterede ord. Forekomster hvor man ikke akustisk kan sætte en grænse mellem ordene, er ikke talt med. Det gælder typisk tilfælde hvor et ord slutter på en vokal, og næste ord start på en vokal, fx til et [ted], her kan man ikke meningsfuldt afgøre om der er til eller et der mister en stavelse.

** Nogle udtales i (næsten) alle tilfælde som nogen. Læs mere om nogen og nogle.

216 / 293 ikke eg̊ə ~ eg̊
200 / 392 lige liːi ~ liː
186 / 366 sådan sʌd̥n̩ ~ sʌn
93 / 162 sige siːi ~ siː
80 / 121 noget nɔːð̩ ~ nɔːð
77 / 86 nogle noːn̩ ~ noːn
63 / 78 jernbaneoverskæring
57 / 64 skulle sg̊ulə ~ sg̊u
40 / 56 også ʌsə ~ ʌs
39 / 70 være væːɐ ~ væɐ̯
35 / 55 bare b̥ɑːɑ ~ b̥ɑː
30 / 50 gået g̊ɔːð̩ ~ g̊ɔːð
30 / 57 længere lɛŋɐɐ ~ lɛŋɐ
29 / 70 jamen jamm̩ ~ jam
29 / 32 siger siːɐ ~ siɐ̯
29 / 61 stykke sd̥øg̊ə ~ sd̥øg̊
29 / 33 væltede vɛld̥ð̩ð̩ ~ vɛld̥ð̩
26 / 51 oppe ʌb̥ə ~ ʌb̥
25 / 25 parkerede pʰɑˈkʰeːˀɐð̩ ~ pʰɑˈkʰeːˀɐð
24 / 72 meget mɑːð̩ ~ mɑð