Nye lydskriftværktøjer på schwa.dk

For nylig skrev jeg om et opgør med den traditionelle IPA-Dania-hybrid der er almindeligt udbredt i dansk og som jeg selv har benyttet i mange år. Nu har jeg opdateret mine lydskriftværktøjer så man lettere kan skrive ren IPA.

Hvis man finder fejl, eller har forslag til forbedringer, er man meget velkommen til at kontakte mig.

Hvis man foretrækker den traditionelle IPA-Dania-hybrid, kan man naturligvis stadig benytte de gamle værktøjer. Se alle mine lydskriftværktøjer her.

Opgør med en lydskrifttradition

(Dette indlæg er en opsummering af en længere redegørelse jeg skrev ifm. et foredrag for lingvistikstuderende på Københavns Universitet. Læs hele teksten her: https://docs.google.com/document/d/1Uj6AlIzalLZf4d0TLVu2vEFDvzuDxu8KdtyloqA0AX4/edit?usp=sharing)

I mange år har jeg benyttet mig af de lydskriftkonventioner som jeg lærte fra Nina Grønnums bøger da jeg studerede på universitetet, og som benyttes i forenklet udgave i DDO. Men inden for de sidste par år har jeg arbejdet på en nye lydskriftstandard, som både er mere præcis ift. IPA, enklere og mere intutiv, og mere velegnet til praktiske formål såsom sprogundervisning og sprogteknologi.

Herunder er en oversigt over de tegn i den traditionelle lydskriftstandard som Nina Grønnum (NG) benytter i sin seneste fonetikbog, og den som DDO benytter, som jeg mener bør ændres. I kolonnen schwa.dk ses min forslag til hvilke tegn der bør benyttes i stedet, og det hvordan den pågældende lyd skrives i mere præcis IPA. Mht. alle andre end de nævnte lyde er der overensstemmelse mellem alle fire standarder.

NG DDO schwa.dk IPA
p t k
b d g
pʰ tˢ kʰ
b̥ d̥ ɡ̊
p t k
b d g
pʰ ts kʰ
p t k
pʰ ts kʰ
p t k
tj tˢj tj
dræbe
abe
kat
æ
æ
a
ɛ
æ
a
æɛ̞~æ
ɛ̞~æ
æ
tak ɑ ɑ aä
Morten
måtten
ɒ
ʌ
ɒ
ʌ
ɒɒ
ɒ̜
ø ø
œ
œ̞
ɶ
ø
œ
ɶ
ø
œ
ɶ
ø
œ
ɶ̝
ej, av, er j/ɪ̯ w/ʊ̯ ɐ̯ j w ɐ̯ ɪ̯ ʊ̯ ɐ̯ ɪ̯ ʊ̯ ɐ̯
snedig, mødding i e i e ɪ ɪ

Se her for en samlet oversigt over alle almindelige lydskrifttegn i dansk

Nogle af de ting i de traditionelle standarder som jeg i tiltagende grad undrede mig over, og som igen og igen førte til faglige og pædagogiske problemer, var:

  • hvorfor bruger man de stemte lyde [b d g] når de nu er ustemte i dansk?
  • hvorfor skelner man den meget lille forskel i kort og lang vokal i [æːnə anə] Ane, Anne, og [mɒːdn̩ mʌdn̩] Morten, måtten, når man nu ikke skelner for andre vokalers vedkommende?
  • og hvorfor bruger man [ʌ] for en vokal der, om noget, er mere åben end [ɒ], når åbningsgraden for symbolerne i IPA er lige omvendt?
  • hvorfor skriver man [ɑ] for den vokal som ifølge IPA skal skrive [a], og [a] for den vokal der skal skrives [æ]?
  • hvorfor skriver man fx [sdɑɡ] for stak, når det ville være både mere præcist og helt intuitivt ift. skriftbilledet at skrive [stak]?
  • og hvorfor skal det trække ned i karakter hvis en student netop skriver [stak] , når det nu er ganske præcis IPA?
  • hvorfor skriver man [dʁɛːbə æːbə] dræbe, abe, med forskellige vokaler, når ordene rimer?
  • hvorfor skriver man [ɕad] sjat, men [tjad] chat, når chat egentlig bare er sjat med [t] foran, [tɕad]?
  • hvorfor skriver man forskellige vokaler i høne og rynke, når nu de er ens? Og hvorfor skriver man samme vokal i grynt og gøre når nu de er forskellige?
  • m.m.

Nogle af disse ting har at gøre med at sproget har forandret sig. Andre gange skal svar på disse spørgsmål findes i praktiske årsager; man vil fx gerne skelne de væsentligste lydkontraster i sproget med forskellige symboler, og visse steder i sproget har vi flere kontraster inden for et område end der er symboler i IPA.

Men der er formentlig også tale om et stort element tradition. Da danske sprogforskere begyndte at gå over til IPA, var det i et miljø med meget stærk tradition for at bruge det hjemlige Dania. Måske under indflydelse af Dania, måske pga. af diskussioner af (faglige, pædagogiske osv.) styrker og svagheder ved de forskellige systemer m.m., sneg der sig en del Dania-arv med ind i adaptionen af IPA blandt danske sprogfolk, så en del symboler ikke bruges i overensstemmelse med IPA.

Man har mao. aldrig gjort helt op med Dania, et lydskriftsystem der er velegnet til at beskrive dansk, men kun dansk, og som ikke forstås af udenlandske studerende og forskere. Man er aldrig rigtig gået med på den internationale standard IPA. Det giver både problemer når man skal studere fonetik på tværs af sprog, og nogle af Dania-traditionerne giver problemer ifm. sprogteknologi.

Hvorfor ændrer man det ikke bare? Det er lettere sagt end gjort. Traditioner er i sig selv træge, men det handler også om at skabe en sammenhængende konvention. For når man ændrer én ting i en lydskriftkonvention, skubber man til alle de andre ting. Hvis man ændrer [ɑ d g] til [a t k] i stak, så [sdɑɡ] bliver til [stak], hvad så med det [a t k] man i forvejen brugte i [kad tal] kat, tal? De skal så ændres til noget tredje så man stadig kan se forskel på lydene.

Det er også et spørgsmål om hvor mange og hvilke fonetiske detaljer man skal medtage i en almindelig, praktisk, bred transskription. Mange fonetiske detaljer er vanskelige at opfatte og spiller ingen praktisk rolle – måske er de endda direkte forstyrrende – i sprogbeskrivelse, undervisning, sprogteknologi, formidling osv.

Når man tilrettelægger en lydskriftstandard, er der således mange hensyn man kan tage:

  • præcist: tegnene skal benyttes i overensstemmelse med IPAs definitioner, ellers kan man ikke rimeligt kalde sine transskriptioner for IPA
  • sprogligt: man skal kunne skelne vigtige betydningsadskillende kontraster i sproget, lyde der opfattes forskelligt, skal skrives forskelligt, og lyde der opfattes ens, skal skrives ens
  • pædagogisk: det må gerne være nemt at lære, så man starter med de nødvendigste lyde og kan udbygge med mere subtile detaljer senere hen
  • tværfaglighed: det er smart hvis man bruger samme konventioner på tværs af fag, så der er en kontinuitet når man studerer andre sprog, og det er smart hvis folk der har lært IPA i udlandet, umiddelbart kan læse danske IPA-transskriptioner; det er hele grundtanken med IPA
  • praktisk og læsbart: det er en god ide så vidt muligt at undgå diakritiske tegn, som både tager tid at lære, skrive, læse, og let fører til fejl i transskriptioner, og det er smart hvis man i vid udstrækning kan bruge de symboler der er på tastaturet frem for alverdens specialtegn
  • gennemskuelighed: det er lettere at lære lydskrift hvis der er en vis sammenhæng mellem de bogstaver vi er vant til og de lydskriftsymboler man skal lære
  • systematik: der må godt være en slags systematik i symbolvalgene, så samme lydtyper skrives ensartet og man så vidt muligt er konsekvent med hvilke detaljer der skelnes og hvordan
  • tradition: det er hensigtsmæssigt at der er kontinuitet mellem gamle og nye værker, traditionerne kan være tunge og uhensigtsmæssige

Alle disse forhold kan stikke i forskellige retninger og tale for forskellige transskriptionsstandarder. Og en del er til diskussion; hvad er vigtigt at kunne skelne i et sprog, hvad er mest pædagogisk, hvad gør man i andre fag, og hvis de gør noget forskelligt, hvad skal man så prioritere

I de ændringer jeg foreslår ovenfor, har jeg gjort op med traditionen og i stedet forsøgt at balancere de øvrige forhold. Resultatet er at der alt i alt er:

  • bedre overensstemmelse med IPA
  • færre specialtegn, hvilket gør det nemmere at skrive, læse og lære
  • bedre overensstemmelse med praksis i andre sprogfag
  • bedre sproglig/pædagogisk sammenhæng og systematik i den forstand at de betydningsadskillende kontraster i moderne dansk vises tydeligt i symbolvalgene, mens der er mere subtile nuancer og dialektal/sociolektal ikke nødvendigvis vises i brede transskriptioner
  • på nogle punkter større sammenhæng mellem udtale og stavning, på andre punkter dårligere sammenhæng

Uddybende begrundelse for enkelte ændringer

plosiverne: Jeg foreslår at man bruger [pʰ ts kʰ p t k] i stedet for det traditionelle [p t k b d g]. Vi har en kontrast mellem aspireret/affrikeret [pʰ ts kʰ] og uaspireret [p t k]. Det er vigtigt at danske sprogstuderende forstår denne kontrast. Der er ikke en stemthedskontrast som [p t k] vs. [b d g] indikerer, og som mange fejlagtig opfatter det. Man kunne vælge skrive det affrikerede /t/ som [tˢ], hvilket giver en bedre visuel sammenhæng mellem [ pʰ tˢ kʰ ]. Men [ˢ] er strengt taget ikke et IPA-tegn, omend det er almindelig brugt og kendt af IPA-brugere, så jeg ser ikke noget problematisk i den notation. Jeg synes selv det er enkelt, præcist og tastaturvenligt at skrive [ts], og det skaber til gengæld en visuel sammenhæng med [tɕ], se nedenfor.

tj: Jeg foreslår at /tj/ skrives [tɕ] i stedet for [tj]. Dette er til dels en konsekvens af at ændre [t] til [ts]. Ligesom /sj/ smelter sammen til [ɕ], smelter [j] sammen med affrikationen i [ts] sammen til [tɕ]. Det kan man lige så godt notere, når [ɕ] bruges i forvejen. Det giver både en mere præcis og systematisk beskrivelse, og det er i overensstemmelse med hvordan man noterer affrikater på andre sprog.

a, o, å: Jeg foreslår at man reducerer den tredelte skelnen mellem [æ a ɑ] til blot [æ a], hvor [æ] bruges i fx mase/masse, og [a] i mange. De fleste nybegyndere i dansk fonetik opfatter en længdeforskel på vokalen i mase/masse og i Morten/måtten, men ikke en kvalitetsforskel. På begynderniveau og i formidlingssammenhænge er det tilstrækkeligt at skelne længdeforskellen. I sprogteknologiske sammenhænge er en tredelt skelnen direkte forstyrrende.

Dette er ikke en påstand om at der ikke er nogen forskel. Det er der ganske sikkert. Men det er ikke (længere) en fonologisk kontrast, og det gælder i øvrigt for alle vokaler at der er en lille åbningsgradsforskel på korte og lange varianter af sammen fonem, hvilket der ikke er nogen tradition for at notere. Det virker arbitrært at skelne lige præcis i de to vokaler og ingen andre.

I meget konservativ sprogbrug kan man finde en fonematisk kontrast efter /r/ i fx [ʁæst ʁæ̞st ʁast] rist, rest, rast, så tidligere var det nødvendigt at skelne tydeligt mellem disse, hvilket formentlig har ført til traditionen med at skelne kort og lang vokal også (når man har indført denne skelnen i sin konvention, er man nødt til at være konsekvent). Til undervisnings- og formidlingsformål synes det dog vilkårligt at indføre denne skelnen som noget primært i moderne dansk. Det kan vente til forløb om dialekter og sociolekter, hvor man kan markere forskellene med diakritika.

ø’erne: Dette handler mest om at sproget har ændret sig så vi i dag har færre forskelle i ø-varianterne.

halvvokaler: når man skriver diftonger, benytter man almindeligvis [ɪ̯ ʊ̯ ɐ̯] i andre sprogfag. Jeg kan desuden godt lide den visuelle sammenhæng mellem [ɪ̯ ʊ̯ ɐ̯] (pædagogisk: halvvokaler er dem med buen under), og sammenhængen mellem disse og når de indgår i schwa-assimilation, [ɪ ʊ ɐ].

ig, ing: den ikke-fuldvokaliske lyd i –ig, -ing skrives traditionelt med hhv. [i e], men jeg synes der er fordele ved at skelne mellem fuldvokal [i e] i tit, lidt, og ikke-fuldvokal i –ig, -ing, ligesom der traditionelt skelnes mellem mellem [œ] vs [ə], og mellem [ɒ/ʌ] vs [ɐ]. Argumenterne er dog lidt snirklede, så jeg vil springe over dem her, men det er bl.a. baseret på praktiske erfaringer med sprogteknologi, hvor den manglende skelnen mellem fuldvokal og ikke-fuldvokal er et væsentligt problem, så det vil være en fordel hvis fremtidige sprogteknologer har lært at skelne.

Reaktioner

Jeg har diskuteret disse konventioner med mange studenter og fagfolk. Generelt spænder reaktionerne fra positive til begejstrede. Jeg har tydeligvis ikke været alene om at undre mig over de eksisterende konventioner og ønsket forandring.

Jeg har selvfølgelig også mødt indvendinger. Det er især svært at sluge at skille sig af med [b d g] og vænne sig til at skrive [pilə tilə kilə] i stedet for [bilə dilə gilə] bille, dille, gilde, endda med risiko for uheldige fejllæsninger af fx [pætɐ tisə] batter, disse. Men det er svært at argumentere for at [b d g] hører hjemme i sprogundervisningen, når alle lærebøger nu beskriver aspiration, og ikke stemthed, som den afgørende kontrast i plosiverne. Det er især uheldigt hvis man har studeret eller kommer til at studere et andet sprog, hvor [b d g p t k] står for nogle andre lyde.

Et argument for brugen af [b d g] er at det er bedre i overensstemmelse med skriftbilledet i ord som bal, dal, gal. Det er dog ikke et holdbart argument, da [b d g] måske oftere ikke er i overensstemmelse med skriften, fx i stak, spæk, skrap, ud, leg. Det er ikke indlysende for mig at [p t k] skulle være mindre i overensstemmelse med skriften. Under alle omstændigheder må det i sidste ende være de fonetiske forhold der er afgørende.

Kill your darlings. Når man har brugt årevis på at terpe regler og skelne subtile kontraster, kan det være svært at lægge disse fra sig. Som så meget andet bliver konventioner til normer, som bliver til æstetik og følelser. Når man først har lært at skelne mellem mase/masse og Morten/måtten, kan det virke provokerende at andre skal slippe for at terpe det. I overgangen til den nye standard har jeg selv skulle vænne mig til at lave om på ting jeg har benyttet og forsøgt at banke ind i hovedet på studenter gennem mange år. Jeg var selv længe om at acceptere [p t k] i bal, dal, gal, og personligt (og samme reaktion har jeg fået fra andre) kunne jeg godt lide ’teltet’ [ʌ], som jeg nu har vinket farvel til. Men i sidste ende er jeg ikke i tvivl om at det det rigtige at gøre.

Den seneste årgang lingvister på KU har jeg (efter lidt børnesygdomme) undervist efter disse konventioner, og resultatet taler for sig selv. Det er mærkbart nemmere at lære lydskrift, og der er langt bedre sammenhæng mellem beskrivelsen af dansk og andre sprog. Før skulle man afsætte en del undervisningstid på igen og igen at forklare hvad forskellen er på de mange meget ens a-lyde og å-lyde, og hvorfor vi skriver [b d g] når vi skriver dansk lydskrift, men [p t k] i andre sprog (som så igen står for noget andet i dansk), og hvorfor den danske lærebog bruger [a] i kat og skriver [hɑj] for hej, når den engelske bruger [æ] i cat og skriver [haɪ] for high. Det var undervisningstid der blev brugt på at man blev klogere på hvorfor der opstår forskellige traditioner forskellige steder i verden, men det var ikke fordi man blev bedre til noget af det der stod i studieordningen. Jeg glæder mig derfor til at arbejde videre med denne standard og kommer ikke til at savne de gamle. Jeg håber andre vil tage pointerne til sig.

Tilføjelse: eksempel på transskription med traditionel og ny standard

Transskription med DDO-standard
ˈnoːɐnvenˀn̩ ʌ ˈsoːˀln̩ ˈsɡɛndəs eŋˈɡɑŋˀ ʌm ˈvɛmˀ ˈabm̩ dɑ vɑ ˈsdæɐ̯ɡəsd | iˈmɛnˀs kʌm en ˈvɑndʁeŋsmanˀ fʌˈbiːˀ ˈsvøbd iːn ˈvɑːˀm ˈkɑbə | di blew ˈeːnii ʌm ad ˈɑwɡɶːˀɐ ˈsdʁiðˀn̩ veð ad kʌŋɡuˈʁæːˀɐ ʌm ˈvɛmˀ dɑ ˈfɶɐ̯sd ku fɔ ˈkɑbm̩ ˈa hɑm

Transskription med ny standard
ˈnoːɐnvenˀn̩ ɒ ˈsoːˀln̩ ˈskɛntəs eŋˈkaŋˀ ɒm ˈvɛmˀ ˈæpm̩ ta va ˈstæɐ̯kəst | iˈmɛnˀs kʰɒm en ˈvantʁɪŋsmænˀ fɒˈpiːˀ ˈsvøpt iːn ˈvaːˀm ˈkʰapə | ti pleʊ̯ ˈeːnɪɪ ɒm æt ˈaʊ̯kɶːˀɐ ˈstʁiðˀn̩ veð æt kʰɒŋkuˈʁæːˀɐ ɒm ˈvɛmˀ ta ˈfɶɐ̯st kʰu fɔ ˈkʰapm̩ ˈæ ham

Korte, lange og ekstralange konsonanter

I dansk skelner man mellem korte og lange vokaler, fx i [kulə] kulde vs. [kuːlə] kugle. Vi er ikke vant til at tænke på at vi også har forskel på korte og lange konsonanter, men faktisk har vi en kontrast mellem mindst tre forskellige konsonantlængder: kort, lang og ekstralang med stavelsestop. Det fremgår fx af denne minimaltrio:

  • [bɔnə] bonde – kort n
  • [bɔnnə] bundne – langt n
  • [bɔnn̩nə] bundene – ekstra langt stavelsesbærende n

Lange og ekstralange konsonanter i dansk stammer altid fra at der er flere fonologiske stavelser, og det er derfor vi traditionelt lydskriver dem med dobbelt- og tripelkonsonant. Der er fonologisk, morfologisk og sikkert også kognitivt tale om flere ens nabokonsonanter snarere en enkelt lang eller ekstralang konsonant.

Dobbeltkonsonanter findes oftest i sammensatte ord som

  • [issyːˀl] issyl
  • [gullʌg] Guldlok
  • [sdʌbbʌlˀd] stopbold

Vi kan også fakultativt have konsonantforlængelse hvor der underliggende er tale om et /r/, fx

  • [bɛððɐ] bedre
  • [hʌjjɐ] højre
  • [feŋŋɐ] fingre

Tripelkonsonant findes kun med [n] og [l] i ord som rindende, hundene, uudholdelig, adskillelig. Fakultativt kan det nok også findes i sammensatte ord som [ʌnn̩nøðˀ] åndenød, men min fornemmelse er at vi foretrækker et distinkt schwa her [ʌnənøðˀ].

Når man lydskriver, kan man komme ud for at have brug for hele fem forskellige måder at annotere konsonantlængde på. De er dog ikke alle distinktive, men varierer alt efter den fonologiske kontekst de indgår i:

  1. Kort, fx [vɛn] ven. Defaultlængden.
  2. Kort syllabisk, fx [lɛːn̩] læne. Bruges ved schwa-assimilation efter lang vokal med schwa i åben stavelse.
  3. Lang ikke-syllabisk, fx [svɔnnə] svundne. Bruges når coda-konsonant møder ansats-konsonant.
  4. Lang syllabisk med final stavelsestop, fx [vɛnn̩ sɛːnn̩] vende, Seinen. Bruges ved schwa-assimilation efter kort vokal og/eller schwa i lukket stavelse.
  5. Lang syllabisk med initial stavelsestop, fx [liːn̩nə] lignende. Bruges ved schwa-assimilation efter lang vokal i proparoxytone ord.
  6. Ekstralang syllabisk, fx [sbɛnn̩nə] spændende. Bruges ved schwa-assimilation efter kort vokal i proparoxytone ord.

Hvis man virkelig skal gå i detaljer, er der vist statistisk set en forskel på varigheden af konsonanten i type 4 alt efter om schwa-stavelsen er åben eller lukket og om foranstående vokal er kort eller lang, dvs. [vɛnn̩ ɛnn̩ sɛːnn̩] vende, enden, Seinen har vistnok i gennemsnit forskellig varighed selvom de traditionelt annoteres ens. Og lur mig om ikke tilstedevær af stød også påvirker konsonantvarigheden i en eller anden grad.

Bevæggrunden for at man skelner mellem at skrive et, to eller tre konsonantsymboler og syllabicitetstegn på første/midterste/sidste konsonant, skal findes i dels den akustiske varighed, dels i at stavelsestoppen ligger enten centreret eller højre-/venstreforskudt alt efter den underliggende stavelsesstruktur.

Man skeler dog nok også til en symmetri med lignende ord med andre konsonanter. Man kan let være fristet til at droppe en af konsonanterne i [vʌll̩li sbɛnn̩nə] voldelig, spændende, men da disse ord er opbygget fonologisk og morfologisk som fx [ʌnn̩li kʌmm̩nə] åndelig, kommende hvor der er mindre tvivl om annotationen, er man på den sikreste side hvis man bevarer tripelkonsonanterne i de første ord.

Konsonantlængde i andre sprog

Mange sprog har som dansk en forskel på korte og lange konsonanter, men ligesom på dansk findes lange konsonanter typisk kun mellem to vokaler og kan således fortolkes som at der underliggende er to ens konsonanter der støder sammen.

Det er heller ikke ualmindeligt at konsonantvarighed varierer betydeligt betinget af den fonologiske kontekst de indgår i. I fx svensk og norsk er konsonanter typisk betydeligt længere efter korte vokaler end efter lange (vi har spor af dette i dansk ortografi hvor kort vokal signaleres med dobbeltkonsonant). I fx engelsk og fransk er sonore konsonanter typisk betydeligt længere foran stemte lukkelyde end foran ustemte.

Jeg har aldrig stødt på nogen sprog der har en klokkeklar fonologisk længdekontrast i konsonanter, da konsonantlængde således typisk kan kædes sammen med enten en tostavet struktur eller med sekundære faktorer. Jeg har heller aldrig stødt på nogen sprog, ud over dansk, der skelner mellem mere end to konsonantlængder. Men det findes nok derude et sted.

Sjusker unge mere med udtalen end ældre?

Jeg har lige læst en lille artikel (Strik & al. 2008) som undersøger hvorvidt unge mennesker reducerer udtalen mere, dvs. om de svækker eller udelader flere lyde, end ældre mennesker.

Undersøgelsen er baseret på 563.380 ord fra en hollandsk database. Med et computerprogram har man aligneret den faktiske udtale af ordene med en kanonisk udtale i en udtaleordbog. Forskelle på den faktiske og den kanoniske udtale er registreret som enten substitutioner, dvs. en kanonisk lyd er erstattet med en anden (hvilket man fortolker som en reduktion), eller bortfald, dvs. at den kanoniske lyd slet ikke udtales i situationen.

Resultaterne viser at yngre mennesker oftere substituerer eller udelader lyde end ældre mennesker. Antallet af substitutioner falder fra omkring 39 % til 35 %, og antallet af bortfald falder fra omkring 20 % til 13 % fra 30-årige til 70-årige. Det er ikke en stærk effekt, men den er statistisk signifikant. Det ser også umiddelbart ud til at mænd har flere reduktioner end jævnaldrende kvinder, men denne effekt er ikke statistisk signifikant.

Problemer med undersøgelsen

Jeg synes der især er to store problemer med undersøgelsen, der gør at jeg ikke kan acceptere konklusionen.

For det første antages det at unge og ældre har samme kanoniske eller distinkte form, dvs. at hvis de talte ureduceret, ville de udtale ordene ens. Den antagelse er forkert.

Lad mig tage et eksempel fra dansk. Hvis jeg skal udtale ordet flyve maksimalt distinkt, vil jeg sige [flyːʊ] mens mere konservative talere vil sige [flyːvə] – med hårdt v. Konservative talere kan ligesom mig også sige [flyːʊ], men det er i deres norm en reduceret udtale.

Hvis man brugte den ovennævnte metode på dansk, ville min distinkte udtale blive regnet som reduceret, da man  tager udgangspunkt i en konservativ norm. At man finder flere reduktioner hos yngre talere, skyldes altså at man måler deres udtale efter en ældre norm i stedet for de unges egen norm.

For det andet andet regnes reduktion i undersøgelsen som et binært træk. Enten er udtalen reduceret eller også er den ikke. Dette er også en fejl, og den opstår fordi undersøgelsen er baseret på lydskrift, hvor et lydskrifttegn enten er der eller ej.

Men reduktion er ikke et binært træk. Det er et gradsspørgsmål. I det danske talesprogskorpus DanPASS er fx ordet blå transskriberet [blɔːˀ] 126 gange, men transskriptionen dækker over stor variation. Alene varigheden af udtalen varierer mellem 0,15 og 0,57 sekunder.

Det er klart at en udtale på 150 millisekunder er mere reduceret end en udtale på 570 millisekunder, selvom de begge udtales med både et [b], et [l] og et [ɔːˀ]. Men efter ovenstående metode ville alle forekomster blive behandlet som ureduceret.

(En interessant sidepointe ved dette er at det er temmelig vilkårligt hvorvidt en fonetisk reduktion udtrykkes i transskriptionen. Vores lydskrift er ganske enkelt mere fintfølende i nogle fonetiske kontekster end i andre.)

Unge og ældre reducerer lige meget

Alle mennesker reducerer deres udtale efter behov. Vi har forskellige normer for hvad der er den distinkte udtale af et ord, og det er forskelligt hvordan vi reducerer udtalen. Min tese er at reduktioner skyldes kommunikative hensyn. Vi reducerer de dele af sproget som er ude at fokus for at vise hvad der er i fokus i ytringen. Dvs. vi reducerer grammatiske ord og endelser, gammel eller forudsigelig information, ord vi har sagt 1000 gange før osv.

En typisk ytring har et eller to ord der er mere i fokus end de øvrige. Disse ord udtales distinkt, mens resten reduceres i større eller mindre grad. Dette gælder uanset hvor gammel man er. Derfor er der ikke forskel på hvor mange ord vi reducerer, men der er forskel på vores udgangspunkt og måden vi reducerer på.

Selvfølgelig er der også individuelle ting der kan gøre at vi kommer til at kludre i sproget. Træthed, nervøsitet, fuldskab, usikkerhed, stress osv. får os til at lave fejl, men det gælder ligeledes for alle (man kan dog forestille sig at unge mennesker er mere trætte, stressede, trætte og usikre end ældre mennesker), og det er antageligvis en forsvindende lille del af de registrerede reduktioner der skyldes disse eksterne faktorer. Langt de fleste reduktioner knytter sig systematisk til lingvistiske faktorer.

Henvisning

H. Strik, J. van Doremalen, and C. Cucchiarini (2008) Pronunciation reduction: how it relates to speech style, gender, and age. Proceedings of Interspeech-2008, pp. 1477-1480.

Jeg har lige læst en lille artikel (http://lands.let.ru.nl/~strik/publications/a143-PronVar-IS08.pdf) som undersøger om unge mennesker reducerer udtalen mere, dvs. om de svækker eller udelader flere lyde, end ældre mennesker.

Undersøgelsen er baseret på 563.380 ord fra en hollandsk database. Med et computerprogram har man aligneret den faktiske udtale af ordene med en kanonisk udtale fra en udtaleordbog. Forskelle på den faktiske og den kanoniske udtale er registreret som enten substitutioner, dvs. en kanonisk lyd er erstattet med en anden, eller bortfald, dvs. at den kanoniske lyd slet ikke udtales i situationen.

Resultaterne viser at yngre mennesker oftere udelader lyde eller bruger andre lyde (hvilket fortolkes som reduktioner) end ældre mennesker. Antallet af substitutioner falder fra omkring 39 % til 35 %, og antallet af bortfald falder fra omkring 20 % til 13 % fra 30-årige til 70-årige. Det er ikke en stærk effekt, men den er statistisk signifikant. Det ser også umiddelbart ud til at mænd har flere reduktioner end jævnaldrende kvinder, men denne effekt er ikke statistisk signifikant.

Problemer med undersøgelsen

Jeg synes der især er to store problemer med undersøgelsen, der gør at jeg ikke kan acceptere konklusionen.

For det første antages det at unge og ældre har samme kanoniske eller distinkte form, dvs. at hvis de talte ureduceret, ville de udtale ordene ens. Den antagelse er forkert.

Lad mig tage et eksempel fra dansk. Hvis jeg skal udtale ordet ‘flyve’ maksimalt distinkt, vil jeg sige [flyːʊ] mens mere konservative talere vil sige [flyːvə] – med hårdt v. Konservative talere kan ligesom mig også sige [flyːʊ], men det er fra deres perspektiv en reduceret udtale. Hvis man brugte den ovennævnte metode på dansk, ville min distinkte udtale blive regnet som reduceret, da man tager udgangspunkt i en konservativ norm.

At man finder flere reduktioner hos yngrere talere, skyldes altså at man måler deres udtale efter en ældre norm i stedet for de unges egen norm.

For det andet andet regnes reduktion i undersøgelsen som et binært træk. Enten er udtalen reduceret eller også er den ikke. Dette er også en fejl, og den opstår fordi undersøgelsen er baseret på lydskrift, hvor et lydskrifttegn enten er der eller ej.

Men reduktion er ikke et binært træk. Det er et gradsspørgsmål. I det danske talesprogskorpus DanPASS er fx ordet ‘blå’ transskriberet [blɔːˀ] 126 gange, men transskriptionen dækker over stor variation. Alene varigheden af udtalen varierer mellem 0,15 sekunder og 0,57, næsten fem gange så meget. Det er klart at en udtale på 150 millisekunder er mere reduceret end en udtale på 570 millisekunder, selvom de begge udtales med både et [b], et [l] og et [ɔːˀ]. Men efter ovenstående metode ville alle forekomster blive behandlet som ureduceret.

(En interessant sidepointe ved dette er at det er temmelig vilkårligt hvorvidt en fonetisk reduktion udtrykkes i transskriptionen. Vores lydskriftkonvention er ganske enkelt mere fintfølende i nogle fonetiske kontekster end i andre.)

Unge og ældre reducerer lige meget

Alle mennesker reducerer deres udtale efter behov. Vi har forskellige ideer om hvad der er den distinkte udtale af et ord, og det er forskelligt hvordan vi reducerer udtalen. Min tese er at reduktioner skyldes kommunikative hensyn. Vi reducerer de dele af sproget som er ude at fokus for at vise hvad der er i fokus i ytringen. Dvs. vi reducerer grammatiske ord og endelser, gammel eller forudsigelig information, ord vi har sagt 1000 gange før osv.

En typisk ytring har et eller to ord der er mere i fokus end de øvrige. Disse ord udtales distinkt, mens resten reduceres i større eller mindre grad. Dette gælder uanset hvor gammel man er. Derfor er der ikke forskel på hvor mange ord vi reducerer, men der er forskel på måden vi reducerer på.

Selvfølgelig er der også individuelle ting der kan gøre at vi kommer til at kludre i sproget. Træthed, nervøsitet, fuldskab, usikkerhed, stress osv. får os til at lave fejl, men det gælder ligeledes for alle (man kan dog forestille sig at unge mennesker er mere trætte, stressede, trætte og usikre end ældre mennesker), og det er antageligvis en forsvindende lille del af de registrerede reduktioner der skyldes disse eksterne faktorer. Langt de fleste reduktioner knytter sig systematisk til lingvistiske faktorer.

Konverter SIL IPA93 til Unicode

I gamle dage brugte man fonten SIL IPA93 når man skulle skrive lydskrift i tekstdokumenter. I dag bruger de fleste Unicode. Fordelen ved Unicode er at det kan læses på alle moderne pc’er og det kan findes af søgemaskiner, mens SIL IPA93 krævede at man havde fonten installeret for at man kunne læse det.

Hvis man vil konvertere dokumenter med lydskrift skrevet i SIL IPA93 til Unicode, er der en meget besværlig guide på SIL’s hjemmeside. Det kræver at man downloader software og tilføjelsespakker og hvad ved jeg. Dernæst skal programmet konfigureres, og der er særlige metoder alt efter hvilket tekstbehandlingsprogram man bruger. Meget besværligt, og jeg har endnu ikke fået det til at virke.

Derfor har jeg lavet et supernemt og hurtigt script som konverterer SIL IPA93 til Unicode. Det er online, og det kræver ingen download eller installering, bare et klik på en knap.

Et meget nyttigt værktøj (for formodentlig ganske få mennesker).

Ny udtaleordbog baseret på DanPASS

Jeg har lavet en udtaleordbog baseret på transskriptionerne i DanPASS-korpusset. Der er en del forbedringer i forhold til den eksisterende:

  • Ordbogen er baseret på seneste udgave af DanPASS.
  • Den er Unicode-baseret, så man kan kopiere fra den og sætte ind i dokumenter.
  • Der er inkluderet fonemrepræsentation.
  • Det er html-baseret, hvilket er hurtigere at åbne og søge i end den gamle pdf-udgave.
  • Forekomsterne er sorteret efter hyppighed.
  • Det samlede antal forekomster af hvert ord er noteret.

Jeg håber på et senere tidspunkt at kunne lave en funktion så man kan se hvor i korpusset pågældende udtale findes, så man kan se hvilken kontekst udtalen forekommer i, og måske endda mulighed for at koble lyd på.

Indsæt dania-lydskrift i dine dokumenter

Jeg har forbarmet mig over dem der benytter dania-lydskrift og lavet ikke bare en, men to tegnvælgere, ligesom jeg for nogle måneder siden lavede en IPA-tegnvælger, altså et lille værktøj hvor man kan klikke på lydskriftsymbolerne frem for at skulle lede efter dem i teksbehandlingsprogrammets tegnoversigt.

Grunden til at jeg har lavet to forskellige tegnvælgere, er at der ikke er nogen optimal løsning hvis man skal skrive dania-lydskrift.

  • Unicode-baseret dania-tegnvælger. Fordelen ved at bruge unicode er at det kan genkendes universelt. Man kan fx sende sit dokument til andre, og de kan læse lydskriften uden problemer, og man kan benytte skriften på internetsider. Desværre er der to væsentlige dania-symboler som ikke understøttes af unicode, nemlig et spejlvendt j (IPA: [ɪ̯]) og et oblikt å (IPA: [ɔ]) (oblik er en særlig type kursiv). Jeg foreslår at man bruger IPA-symbolerne i stedet.
  • Dania-tegnvælger baseret på dania-fonten: Denne tegnvælger kræver at man har en særlig font ved navn dania installeret på sin pc. Fonten er symbol encoded, dvs. de viste symboler svarer ikke til de taster man trykker på. Det betyder at lydskriften kun kan læses på pc’er der har fonten installeret. Denne metode frarådes generelt, men det kan være nødvendigt ift. at vise en lang række specielle dania-tegn som ikke understøttes af unicode.

Disse og mange andre problemer kan helt undgås hvis man går over til at bruge IPA i stedet for dania når man skriver lydskrift.

Jeg tager gerne imod forslag til forbedringer af disse tegnvælgere.

Skattelettelser og schwa-assimilation

I dagens P1 debat blev der diskuteret skattelettelser. Den almindeligste udtale af dette ord er [ˈsgadl̩ɛdl̩sɐ], som man kan forvisse sig om ved at lytte til programmet, altså med schwa-assimilation hvor /əl/ realiseres som et stavelsesbærende [l̩].

Som hovedregel assimileres schwa ikke til en lyd der står i onset, altså i starten af en stavelse. Vi siger vistnok hellere [ˈkadə.mað ˈkʌgə.læɐ̯leŋ ˈsgifdə.nʌjlə] med [ə] frem for [ˈkadm̩að ˈkʌgl̩æɐ̯leŋ ˈsgifdn̩ʌjlə] kattemad, kokkelærling, skiftenøgle med stavelsesbærende konsonant.

En undtagelse fra denne regel er lige netop mellem /t/ og /l/, altså i forbindelsen /-tə.l-/ som i  [ˈkadl̩ɛmˀ ˈʁɑdl̩ɑg ˈgɛdl̩ɑjˀ] kattelem, rettelak, gætteleg. Her opløses [d] med en lateral eksplosion [dˡ], dvs. i stedet for at tungen helt slipper kontakten med overmunden som normalt når lukkelyde opløses, er det kun tungens side(r) der slipper kontakten med kindtænderne. Således er tungen i stilling til det efterfølgende [l].

Hvis /l/ står initialt i en betonet stavelse, fx satellit, kotelet, får man et problem når man skal lydskrive det. Normalt sætter man tryksymbolet foran den betonede stavelse, men ved schwa-assimilation bliver den laterale konsonant både en stavelse i sig selv, samtidig med at den står i onset i den efterfølgende stavelse. Valget står altså mellem [sadl̩ˈid] og [sadˈl̩id] – i første tilfælde står tryktegnet ikke stavelsesinitialt (stavelsen starter jo med /l/), i andet tilfælde står tryktegnet foran [l̩]. Man kan selvfølgelig for syns skyld indføje et ekstra [l], [sadl̩ˈlid], men så ignorerer man at der kan være en kontrast mellem [l̩] og [l̩l], fx i [ˈsygl̩ ˈegə ˈsygl̩ ˈlegə ] (det skal min) cykel ikke, (der skal min) cykel ligge. Der er dog aldrig nogen der har undersøgt om denne kontrast er reel.

IPA-tegnvælger

Jeg har et par aftner brygget på en IPA character picker, altså et program hvor man kan klikke på en oversigt over IPA-symboler når man skal skrive lydskrift, i stedet for at famle sig igennem diverse tekstbehandlingsprogrammers ‘indsæt symbol’-funktion.

Jeg var lidt utilfreds med de andre tegnvælgere jeg kender til, og så har jeg i min tegnvælger tilføjet en oversigt over de almindeligste symboler til at lydskrive dansk.

Der er dog altid bøvl når man skal vise særlige symboler i forskellige browsere, så jeg vil gerne høre om den ser ordentlig ud hos andre, eller om der er noget jeg kan gøre for at rette den til. Tag et kig, og send en kommentar hvis det ser mærkeligt ud, så vil jeg prøve at rette op på det.

Indtil videre ser den fin ud i min browser (firefox 3).  Min Internet Explorer viser også siden ordentligt, bortset fra at længdetegn ser mærkelige ud, men det er kan vist ikke være anderledes.