Ustemte frikativer og telefoner II


For lige at visualisere forskellen på [f] og [s] som de lyder hhv. gennem en telefon og ufiltreret, som jeg skrev om i går, har jeg taget et par billeder af ordet først, udtalt [fœ̞s] (fra DanPASS).

Det første billede viser den ufiltrerede udtale. Der er tydelig forskel på frikativen før og efter vokalen, navnlig i kraft af at den sidste frikativ [s] er mere sværtet, hvilket indikerer kraftigere støj.

Lydklip: Adobe Flash Player (version 9 eller højere) kræves for at afspille dette lydklip. Hent den seneste version her. Du skal også have JavaScript aktiveret i din browser.


(Billedet viser kun op til 5 kHz, men lyden går op til 44 kHz)

I det næste billede har jeg filtreret frekvenser under 300 Hz og over 3300 Hz væk, hvilket svarer nogenlunde til en telefon. Som man kan se, er forskellen på [f] og [s] noget mere udvisket, fordi forskellen på de to lyde primært ligger i den kraftigere støj i [s] i frekvenser over 3300 Hz.

Lydklip: Adobe Flash Player (version 9 eller højere) kræves for at afspille dette lydklip. Hent den seneste version her. Du skal også have JavaScript aktiveret i din browser.

5 Replies to “Ustemte frikativer og telefoner II”

  1. Det er optaget i audio-CD-kvalitet, dvs. med en sampling rate på 44.100 Hz. Men den maksimale frekvens er vel kun halvdelen af sampling rate, så det skulle nok have været 22 kHz. Er det korrekt?

  2. Ja, men i virkeligheden kun 20 kHz. Der er et meget kraftigt lavpasfilter, kaldet “anti-aliasing filter”, som fjerner “alt” over 20 kHz og især 22,05 kHz for at undgå, at frekvenser over 22,05 kHz bliver “spejlet” ned i det hørbare område. F.eks ville 24,05 kHz blive til en 2 kHz tone.
    Der hører mere til CD-kvalitet end båndbredde, for at et signal skal være “lineært”, skal hver frekvenskomponent være repræsenteret med den styrke, den blev optaget i. Formater som mp3 og Atrac er fysiologisk datareducerede, dvs. man udnytter egenskaber ved øret til at reducere datamængden, f.eks. helt ned til 10% af det oprindelige. Øret maskerer, dvs. en stærk lyd overdøver en svag lyd i samme frekvensinterval — så er der ikke nogen grund til at repræsentere den svage lyd her. Øret fokuserer på den første lyd — så er der ikke nogen grund til at repræsentere lyde i det interval, der kommer bagefter. Alt ialt er det et tab af information, men øret er tilfreds, bare det får sin stimulans. DRs P2 sender på FM-nettet nu kun datareduceret lyd; det burde være 384 kb/sekund eller mere, men det er meget mindre. Så bliver der hørbare artefakter, forsinkede frikativer, og kvindestemmer og violin lyder anspændt.
    Man kunne tro, at de datareducerede formater umuliggjorde fonetisk brug, men overraskende er det ikke tilfældet. Se Winholtz + Titze: “Suitability of Minidisc (MD) Recordings for Voice Perturbation Analysis”, Journal of Voice, vol. 12, no. 2, pp138-142; konklusionen er, at for dette område er der ikke nogen problemer.

  3. Aha! Det giver god mening at filtrere de høje frekvenser fra. Ellers får man vel en effekt svarende til filmoptagelser hvor hjul kører baglæns mens vognen kører forlæns.

    Jeg måtte i øvrigt konvertere lyden til mp3 for at de kunne afspilles via de smarte afspilningsknapper i indlægget, men det ændrer vel ikke på at man stadig får frekvenser op til 20 kHz med.

Lukket for kommentarer.