ang. formants
Składowe częstotliwości dźwięków mowy, które uległy największemu wzmocnieniu w jamach nasady (gardłowej, ustnej i/lub nosowej) w wyniku zjawiska rezonansu akustycznego. Dźwięk powstający w krtani w wyniku drgań fałdów głosowych (ton krtaniowy) w strukturach ponadkrtaniowych ulega jeszcze dalszym przekształceniom, ponieważ kanał głosowy zachowuje się jak układ filtrów (rezonatorów) o określonych częstotliwościach rezonansowych. Zależą one od kształtu i długości toru głosowego. U dorosłego człowieka odległość pomiędzy wargami o obojętnym, niezaokrąglonym kształcie a fałdami głosowymi wynosi około 17 cm. Jeżeli w tej sytuacji masa języka przyjmie środkową (centralną) pozycję, a tor głosowy będzie przypominał rurę o względnie stałym przekroju na całej swej długości, wówczas pierwsza, a zarazem najniższa, wzmocniona częstotliwość będzie wynosiła 500 Hz, a kolejne będą odpowiadały jej nieparzystym wielokrotnościom (1500 Hz, 2500 Hz, 3500 Hz). Formant o najniższej częstotliwości nazywany jest pierwszym i oznaczany za pomocą symbolu F1, kolejna wzmocniona częstotliwość to formant drugi (F2), następne to formant trzeci (F3), czwarty (F4) itd. Częstotliwości formantowe o tak regularnym rozkładzie jak w wyżej opisanym przykładzie powstają w związku z charakterystyczną konfiguracją toru głosowego o stałym przekroju, wykorzystywaną na przykład w trakcie wymawiania tzw. samogłoski neutralnej. Podczas artykulacji większości dźwięków mowy tor głosowy przyjmuje bardziej nieregularne kształty, w związku z czym nie powstają wzmocnienia w tak równych odstępach. I tak, na przykład tor głosowy może ulegać wydłużeniu dzięki zaokrągleniu warg i poszerzeniu w przedniej części ze względu na przesunięcie masy języka ku tyłowi, tak jak podczas wymawiania polskiej samogłoski [u]. Może też ulegać skróceniu poprzez spłaszczenie warg i poszerzeniu w części tylnej z uwagi na przesunięcie języka ku przodowi jamy ustnej, tak jak podczas artykulacji polskiej samogłoski [i]. Pierwszy formant samogłoskowy występuje w średnim zakresie od 269 Hz do 821 Hz w przypadku mówców dorosłych i w zakresie od 388 Hz do 1112 Hz dla głosów dziecięcych. Jego średnie wartości dla poszczególnych samogłosek związane są z ruchami języka w pionie i wielkością szczeliny wargowej (wartość F1 rośnie wraz z obniżaniem się masy języka i powiększaniem się szczeliny wargowej). Zakres częstotliwości formantu drugiego obejmuje wartości od 899 Hz do 2752 Hz dla mówców dorosłych i od 1263 Hz do 3109 Hz dla dzieci i koreluje z ruchami języka w poziomie oraz kształtem warg (wartość F2 rośnie wraz z przesuwaniem się masy języka do przodu i towarzyszącemu spłaszczeniu warg). Omawiane zależności można zaobserwować, analizując tabelę 1.
Samogłoska | Łobacz (1996) | Gonet (1993) |
Kleśta (1998) |
|||||
dzieci | dorośli | kobiety | mężczyźni | |||||
F1 | F2 | F1 | F2 | F1 | F2 | F1 | F2 | |
i |
388 | 3109 | 269 | 2287 | 361 | 2752 | 282 | 2096 |
ɨ |
469 | 2426 | 380 | 1799 | 484 | 2077 | 388 | 1742 |
ɛ |
684 | 2467 | 494 | 1807 | 599 | 2140 | 474 | 1750 |
a |
1112 | 2018 | 721 | 1406 | 821 | 1627 | 620 | 1315 |
ɔ |
664 | 1518 | 518 | 1075 | 619 | 1194 | 491 | 1025 |
u |
481 | 1263 | 345 | 899 | 418 | 963 | 354 | 918 |
Tabela. 1. Średnie wartości częstotliwości F1 i F2 samogłosek zrealizowanych przez dzieci (P. Łobacz: Polska fonologia dziecięca, Warszawa 1996) i mówców dorosłych (W. Gonet: Próba określenia normy wymowy polskich samogłosek ustnych, [w:] Opuscula logopaedica: in honorem Leonis Kaczmarek, red. S. Grabias, Lublin 1993, s. 232–253; J. Kleśta: . Lingwistyczne i paralingwistyczne zastosowania akustyczno-fonetycznej bazy danych samogłosek języka polskiego, „Technologia Mowy i Języka” 1998, Vol. 2, s. 47–64.)
Obraz akustyczny, na którym formanty dźwięków mowy są wyraźnie widoczne, to spektrogram. Pasma częstotliwości rezonansowych przyjmują postać poprzecznych pasm, które na rysunku 1 poniżej dodatkowo są oznaczone kolorowymi liniami: F1 – czerwoną, F2 – zieloną, F3 – niebieską i F4 – żółtą. Spektrogram służy ogólnej, wieloparametrowej ocenie dźwięku. Dokładnego pomiaru częstotliwości formantowych dokonuje się w oparciu o widmo. Formanty uwidaczniają się na nim w postaci pików o największej amplitudzie, które – zaczynając od lewej – oznaczane są symbolami F1, F2, F3 itd.
Rys. 1. Spektrogram i widmo FFT polskiej samogłoski [ɨ] Źródło: opracowanie własne.
Dwa pierwsze formanty są wystarczające w percepcyjnej identyfikacji dźwięków mowy, zwłaszcza samogłosek, stąd ich wartości powinny być uwzględniane w ocenie krzywej słyszenia i możliwości odbioru dźwięków mowy przez osoby z uszkodzeniami słuchu. Trzeci i czwarty formant związane są z indywidualnymi cechami głosu mówców.
W. Jassem: Podstawy fonetyki akustycznej, Warszawa 1973.
J.M. Pickett: The Acoustics of Speech Communication, Boston 1999.
B. Szczepankowski: Fonetyka akustyczna, audytywna i wizualna, Warszawa 1985.