FORMANTY DŹWIĘKÓW

ang. formants

Składowe częstotliwości dźwięków mowy, które uległy największemu wzmocnieniu w jamach nasady (gardłowej, ustnej i/lub nosowej) w wyniku zjawiska rezonansu akustycznego. Dźwięk powstający w krtani w wyniku drgań fałdów głosowych (ton krtaniowy) w strukturach ponadkrtaniowych ulega jeszcze dalszym przekształceniom, ponieważ kanał głosowy zachowuje się jak układ filtrów (rezonatorów) o określonych częstotliwościach rezonansowych. Zależą one od kształtu i długości toru głosowego. U dorosłego człowieka odległość pomiędzy wargami o obojętnym, niezaokrąglonym kształcie a fałdami głosowymi wynosi około 17 cm. Jeżeli w tej sytuacji masa języka przyjmie środkową (centralną) pozycję, a tor głosowy będzie przypominał rurę o względnie stałym przekroju na całej swej długości, wówczas pierwsza, a zarazem najniższa, wzmocniona częstotliwość będzie wynosiła 500 Hz, a kolejne będą odpowiadały jej nieparzystym wielokrotnościom (1500 Hz, 2500 Hz, 3500 Hz). Formant o najniższej częstotliwości nazywany jest pierwszym i oznaczany za pomocą symbolu F1, kolejna wzmocniona częstotliwość to formant drugi (F2), następne to formant trzeci (F3), czwarty (F4) itd. Częstotliwości formantowe o tak regularnym rozkładzie jak w wyżej opisanym przykładzie powstają w związku z charakterystyczną konfiguracją toru głosowego o stałym przekroju, wykorzystywaną na przykład w trakcie wymawiania tzw. samogłoski neutralnej. Podczas artykulacji większości dźwięków mowy tor głosowy przyjmuje bardziej nieregularne kształty, w związku z czym nie powstają wzmocnienia w tak równych odstępach. I tak, na przykład tor głosowy może ulegać wydłużeniu dzięki zaokrągleniu warg i poszerzeniu w przedniej części ze względu na przesunięcie masy języka ku tyłowi, tak jak podczas wymawiania polskiej samogłoski [u]. Może też ulegać skróceniu poprzez spłaszczenie warg i poszerzeniu w części tylnej z uwagi na przesunięcie języka ku przodowi jamy ustnej, tak jak podczas artykulacji polskiej samogłoski [i]. Pierwszy formant samogłoskowy występuje w średnim zakresie od 269 Hz do 821 Hz w przypadku mówców dorosłych i w zakresie od 388 Hz do 1112 Hz dla głosów dziecięcych. Jego średnie wartości dla poszczególnych samogłosek związane są z ruchami języka w pionie i wielkością szczeliny wargowej (wartość F1 rośnie wraz z obniżaniem się masy języka i powiększaniem się szczeliny wargowej). Zakres częstotliwości formantu drugiego obejmuje wartości od 899 Hz do 2752 Hz dla mówców dorosłych i od 1263 Hz do 3109 Hz dla dzieci i koreluje z ruchami języka w poziomie oraz kształtem warg (wartość F2 rośnie wraz z przesuwaniem się masy języka do przodu i towarzyszącemu spłaszczeniu warg). Omawiane zależności można zaobserwować, analizując tabelę 1.

Samogłoska Łobacz (1996) Gonet (1993)

Kleśta (1998)

dzieci dorośli kobiety mężczyźni
F1 F2 F1 F2 F1 F2 F1 F2

i

388 3109 269 2287 361 2752 282 2096

ɨ

469 2426 380 1799 484 2077 388 1742

ɛ

684 2467 494 1807 599 2140 474 1750

a

1112 2018 721 1406 821 1627 620 1315

ɔ

664 1518 518 1075 619 1194 491 1025

u

481 1263 345 899 418 963 354 918

Tabela. 1. Średnie wartości częstotliwości F1 i F2 samogłosek zrealizowanych przez dzieci (P. Łobacz: Polska fonologia dziecięca, Warszawa 1996) i mówców dorosłych (W. Gonet: Próba określenia normy wymowy polskich samogłosek ustnych, [w:] Opuscula logopaedica: in honorem Leonis Kaczmarek, red. S. Grabias, Lublin 1993, s. 232–253; J. Kleśta: . Lingwistyczne i paralingwistyczne zastosowania akustyczno-fonetycznej bazy danych samogłosek języka polskiego, „Technologia Mowy i Języka” 1998, Vol. 2, s. 47–64.)

Obraz akustyczny, na którym formanty dźwięków mowy są wyraźnie widoczne, to spektrogram. Pasma częstotliwości rezonansowych przyjmują postać poprzecznych pasm, które na rysunku 1 poniżej dodatkowo są oznaczone kolorowymi liniami: F1 – czerwoną, F2 – zieloną, F3 – niebieską i F4 – żółtą. Spektrogram służy ogólnej, wieloparametrowej ocenie dźwięku. Dokładnego pomiaru częstotliwości formantowych dokonuje się w oparciu o widmo. Formanty uwidaczniają się na nim w postaci pików o największej amplitudzie, które – zaczynając od lewej – oznaczane są symbolami F1, F2, F3 itd.

Formanty dźwięków - rys. 1

Formanty dźwięków - rys. 2

Rys. 1. Spektrogram i widmo FFT polskiej samogłoski [ɨ] Źródło: opracowanie własne.

Dwa pierwsze formanty są wystarczające w percepcyjnej identyfikacji dźwięków mowy, zwłaszcza samogłosek, stąd ich wartości powinny być uwzględniane w ocenie krzywej słyszenia i możliwości odbioru dźwięków mowy przez osoby z uszkodzeniami słuchu. Trzeci i czwarty formant związane są z indywidualnymi cechami głosu mówców.

Literatura:

W. Jassem: Podstawy fonetyki akustycznej, Warszawa 1973.

J.M. Pickett: The Acoustics of Speech Communication, Boston 1999.

B. Szczepankowski: Fonetyka akustyczna, audytywna i wizualna, Warszawa 1985.