juni 2010 – schwa.dk

Jeg havde for noget tid siden et indlæg om hvorfor man får lysere stemme af at inhalere helium. Årsagen er, som jeg skriver, at lyd bevæger sig hurtigere i helium, men det er ikke meget af en forklaring. Her er derfor en lidt mere teknisk forklaring.

Hvis vi regner med at talekanalen er et 17 cm langt jævnt rør, og tager udgangspunkt i en neutral talekanalkonfiguration, svarende til vokalen [ə], vil lydbølger med en amplitude ved 17 cm blive forstærket, dvs. bølger med bølgelængde (λ) på 68 cm, 22,7 cm, 13,6 cm osv. (17/((2*n-1)*0,25) cm). Det skyldes at luftmolekylerne i den luftsøjle der er i talekanalen, har mere bevægelsesfrihed ved rørets udmunding end i bunden af røret.

I almindelig atmosfærisk luft rejser lyden med ca. 340 meter i sekundet. Ved en tone på 340 Hz er λ = 1 meter. Hvis talekanalen er fyldt med atmosfærisk luft, vil en lydbølge med λ = 68 cm have en frekvens på 500 Hz (34.000/68 Hz). Overtoner omkring 500 Hz vil derfor blive forstærket (ligeledes frekvenser på 1500, 2500, 3500 Hz osv.)

I helium rejser lyden hurtigere, nemlig med ca. 1000 m/s. Hvis talekanalen er fyldt med helium, vil en lydbølge med λ = 68 cm således have en frekvens på 1500 Hz i stedet for 500 Hz. I helium er resonansfrekvenserne i en resonator således højere end i atmosfærisk luft. Det giver indtrykket af en lysere stemme.

Reelt fylder man dog ikke munden 100 % med helium, så effekten er noget mindre end dette. Et studie viser at resonanserne kun hæves i omegnen af 20-30 %. Det afhænger selvfølgelig af mængden af helium i talekanalen.

At lyden bevæger sig hurtigere har samme effekt på resonansfrekvenserne som hvis man forkortede talekanalen (om man løber dobbelt så hurtigt eller halvt så langt, har samme effekt på hvor hurtigt man gennemfører et løb). Børn har en kortere talekanal end voksne, så derfor lyder stemmen mere barnlig når man indånder helium.

I sulfurhexaflourid rejser lyden med 150 m/s. En lydbølge med en λ = 68 cm har i her således en frekvens på 220 Hz. I sulfurhexaflourid sænkes resonansfrekvenserne altså, hvilket giver indtryk af en stemme tilhørende et væsen med usædvanlig lang talekanal.

Grundtonen bestemmes af stemmelæbesvingningerne, som bestemmes af luftgennemstrømningen i glottis og muskelspændingen i stemmelæberne. Begge faktorer er upåvirkede af gasarten i lungerne (jeg antager at det subglottale tryk er det samme uanset om man indånder helium eller almindelig luft). Man kan naturligvis forstærke effekten af heliumstemme ved at hæve grundtonen.

At inhalering af helium giver en lysere stemme skyldes altså at lyd rejser hurtigere i helium, hvilket resulterer i højere resonansfrekvenser, uden at det i sig selv har en effekt på grundtonen.

Bemærkninger

Lydens hastighed og talekanalens længde varierer. Værdierne er valgt for at give nogle bekvemme runde tal. Talekanalen er også kun tilnærmelsesvis er et jævnt rør.

Lydens hastighed i tør luft er 331 m/s ved 0 °C. En hastighed på 340 m/s svarer til omkring 15 °C.
Lydens hastighed i helium er 972 m/s ved 0 °C.
Lydens hastighed i sulfurhexaflourid er 146 m/s ved 0 °C.
I fugtig luft og højere temperatur stiger hastigheden.

(Kilder: http://en.wikipedia.org/wiki/Sulfur_hexafluoride, http://hyperphysics.phy-astr.gsu.edu/hbase/sound/souspe.html)

Jeg har lige læst en lille artikel (Strik & al. 2008) som undersøger hvorvidt unge mennesker reducerer udtalen mere, dvs. om de svækker eller udelader flere lyde, end ældre mennesker.

Undersøgelsen er baseret på 563.380 ord fra en hollandsk database. Med et computerprogram har man aligneret den faktiske udtale af ordene med en kanonisk udtale i en udtaleordbog. Forskelle på den faktiske og den kanoniske udtale er registreret som enten substitutioner, dvs. en kanonisk lyd er erstattet med en anden (hvilket man fortolker som en reduktion), eller bortfald, dvs. at den kanoniske lyd slet ikke udtales i situationen.

Resultaterne viser at yngre mennesker oftere substituerer eller udelader lyde end ældre mennesker. Antallet af substitutioner falder fra omkring 39 % til 35 %, og antallet af bortfald falder fra omkring 20 % til 13 % fra 30-årige til 70-årige. Det er ikke en stærk effekt, men den er statistisk signifikant. Det ser også umiddelbart ud til at mænd har flere reduktioner end jævnaldrende kvinder, men denne effekt er ikke statistisk signifikant.

Problemer med undersøgelsen

Jeg synes der især er to store problemer med undersøgelsen, der gør at jeg ikke kan acceptere konklusionen.

For det første antages det at unge og ældre har samme kanoniske eller distinkte form, dvs. at hvis de talte ureduceret, ville de udtale ordene ens. Den antagelse er forkert.

Lad mig tage et eksempel fra dansk. Hvis jeg skal udtale ordet flyve maksimalt distinkt, vil jeg sige [flyːʊ] mens mere konservative talere vil sige [flyːvə] – med hårdt v. Konservative talere kan ligesom mig også sige [flyːʊ], men det er i deres norm en reduceret udtale.

Hvis man brugte den ovennævnte metode på dansk, ville min distinkte udtale blive regnet som reduceret, da man tager udgangspunkt i en konservativ norm. At man finder flere reduktioner hos yngre talere, skyldes altså at man måler deres udtale efter en ældre norm i stedet for de unges egen norm.

For det andet andet regnes reduktion i undersøgelsen som et binært træk. Enten er udtalen reduceret eller også er den ikke. Dette er også en fejl, og den opstår fordi undersøgelsen er baseret på lydskrift, hvor et lydskrifttegn enten er der eller ej.

Men reduktion er ikke et binært træk. Det er et gradsspørgsmål. I det danske talesprogskorpus DanPASS er fx ordet blå transskriberet [blɔːˀ] 126 gange, men transskriptionen dækker over stor variation. Alene varigheden af udtalen varierer mellem 0,15 og 0,57 sekunder.

Det er klart at en udtale på 150 millisekunder er mere reduceret end en udtale på 570 millisekunder, selvom de begge udtales med både et [b], et [l] og et [ɔːˀ]. Men efter ovenstående metode ville alle forekomster blive behandlet som ureduceret.

(En interessant sidepointe ved dette er at det er temmelig vilkårligt hvorvidt en fonetisk reduktion udtrykkes i transskriptionen. Vores lydskrift er ganske enkelt mere fintfølende i nogle fonetiske kontekster end i andre.)

Unge og ældre reducerer lige meget

Alle mennesker reducerer deres udtale efter behov. Vi har forskellige normer for hvad der er den distinkte udtale af et ord, og det er forskelligt hvordan vi reducerer udtalen. Min tese er at reduktioner skyldes kommunikative hensyn. Vi reducerer de dele af sproget som er ude at fokus for at vise hvad der er i fokus i ytringen. Dvs. vi reducerer grammatiske ord og endelser, gammel eller forudsigelig information, ord vi har sagt 1000 gange før osv.

En typisk ytring har et eller to ord der er mere i fokus end de øvrige. Disse ord udtales distinkt, mens resten reduceres i større eller mindre grad. Dette gælder uanset hvor gammel man er. Derfor er der ikke forskel på hvor mange ord vi reducerer, men der er forskel på vores udgangspunkt og måden vi reducerer på.

Selvfølgelig er der også individuelle ting der kan gøre at vi kommer til at kludre i sproget. Træthed, nervøsitet, fuldskab, usikkerhed, stress osv. får os til at lave fejl, men det gælder ligeledes for alle (man kan dog forestille sig at unge mennesker er mere trætte, stressede, trætte og usikre end ældre mennesker), og det er antageligvis en forsvindende lille del af de registrerede reduktioner der skyldes disse eksterne faktorer. Langt de fleste reduktioner knytter sig systematisk til lingvistiske faktorer.

Henvisning

H. Strik, J. van Doremalen, and C. Cucchiarini (2008) Pronunciation reduction: how it relates to speech style, gender, and age. Proceedings of Interspeech-2008, pp. 1477-1480.

Jeg har lige læst en lille artikel (http://lands.let.ru.nl/~strik/publications/a143-PronVar-IS08.pdf) som undersøger om unge mennesker reducerer udtalen mere, dvs. om de svækker eller udelader flere lyde, end ældre mennesker.

Undersøgelsen er baseret på 563.380 ord fra en hollandsk database. Med et computerprogram har man aligneret den faktiske udtale af ordene med en kanonisk udtale fra en udtaleordbog. Forskelle på den faktiske og den kanoniske udtale er registreret som enten substitutioner, dvs. en kanonisk lyd er erstattet med en anden, eller bortfald, dvs. at den kanoniske lyd slet ikke udtales i situationen.

Resultaterne viser at yngre mennesker oftere udelader lyde eller bruger andre lyde (hvilket fortolkes som reduktioner) end ældre mennesker. Antallet af substitutioner falder fra omkring 39 % til 35 %, og antallet af bortfald falder fra omkring 20 % til 13 % fra 30-årige til 70-årige. Det er ikke en stærk effekt, men den er statistisk signifikant. Det ser også umiddelbart ud til at mænd har flere reduktioner end jævnaldrende kvinder, men denne effekt er ikke statistisk signifikant.

Problemer med undersøgelsen

Jeg synes der især er to store problemer med undersøgelsen, der gør at jeg ikke kan acceptere konklusionen.

For det første antages det at unge og ældre har samme kanoniske eller distinkte form, dvs. at hvis de talte ureduceret, ville de udtale ordene ens. Den antagelse er forkert.

Lad mig tage et eksempel fra dansk. Hvis jeg skal udtale ordet ‘flyve’ maksimalt distinkt, vil jeg sige [flyːʊ] mens mere konservative talere vil sige [flyːvə] – med hårdt v. Konservative talere kan ligesom mig også sige [flyːʊ], men det er fra deres perspektiv en reduceret udtale. Hvis man brugte den ovennævnte metode på dansk, ville min distinkte udtale blive regnet som reduceret, da man tager udgangspunkt i en konservativ norm.

At man finder flere reduktioner hos yngrere talere, skyldes altså at man måler deres udtale efter en ældre norm i stedet for de unges egen norm.

Men reduktion er ikke et binært træk. Det er et gradsspørgsmål. I det danske talesprogskorpus DanPASS er fx ordet ‘blå’ transskriberet [blɔːˀ] 126 gange, men transskriptionen dækker over stor variation. Alene varigheden af udtalen varierer mellem 0,15 sekunder og 0,57, næsten fem gange så meget. Det er klart at en udtale på 150 millisekunder er mere reduceret end en udtale på 570 millisekunder, selvom de begge udtales med både et [b], et [l] og et [ɔːˀ]. Men efter ovenstående metode ville alle forekomster blive behandlet som ureduceret.

(En interessant sidepointe ved dette er at det er temmelig vilkårligt hvorvidt en fonetisk reduktion udtrykkes i transskriptionen. Vores lydskriftkonvention er ganske enkelt mere fintfølende i nogle fonetiske kontekster end i andre.)

Unge og ældre reducerer lige meget

Alle mennesker reducerer deres udtale efter behov. Vi har forskellige ideer om hvad der er den distinkte udtale af et ord, og det er forskelligt hvordan vi reducerer udtalen. Min tese er at reduktioner skyldes kommunikative hensyn. Vi reducerer de dele af sproget som er ude at fokus for at vise hvad der er i fokus i ytringen. Dvs. vi reducerer grammatiske ord og endelser, gammel eller forudsigelig information, ord vi har sagt 1000 gange før osv.