Professional Documents
Culture Documents
Resumo: Este artigo dedicado queles no-familiarizados com as cincias exatas, mas que tm interesse na acstica da voz e do canto. Ele faz uma breve introduo ao modelo Fonte-Filtro da produo de vogais e o utiliza no estudo de alguns aspectos do canto lrico feminino, do canto lrico masculino, do canto harmnico e do vibrato vocal. O texto foi escrito de forma sucinta, mas valendo-se de detalhamento nas figuras e em suas legendas.
- 70 -
Figura 1: Aparelho Fonador e o modelo Fonte-Filtro. Acima: Estrutura anatmica do trato vocal. A elevao do prtico velofarngeo (P) desacopla as cavidades nasais. Note a proximidade da entrada do esfago (E) com a regio das pregas vocais, situadas acima da traquia (T). Os pulsos gerados na fonao so filtrados pelas cavidades acsticas do trato vocal, e propagam-se pelo ar. Na irradiao, como sugere o desenho, parte do som (baixas freqncias) espalha-se enquanto outra parte (altas freqncias) propaga-se para frente. Abaixo (adaptado de Fant, 1970): modularizao introduzida pelo modelo Fonte-Filtro (em alguns espectros h divises em intervalos de 6 dB, no eixo vertical, e em oitavas, no horizontal). A fonte representada por uma srie harmnica, o filtro por formantes (F1, F2, etc.), e a irradiao pela sua caracterstica passa-altas. Comparandose o oscilograma do fluxo com o da presso sonora vm-se, de forma desordenada, as ondulaes introduzidas pelos formantes, mas, no espectro da presso irradiada, distingue-se cada um dos formantes.
O modelo Fonte-Filtro utiliza uma descrio dos fenmenos acsticos no domnio das freqncias. O filtro oral caracterizado por picos (F1, F2, F3 e F4, na Fig. 1) no espectro de freqncias. Estes picos, que correspondem aos modos normais dos tubos acsticos, so tradicionalmente chamados de formantes. Os trs primeiros formantes (F1, F2 e F3) tm menor dependncia com o locutor e prestam-se, principalmente, para diferenciar as vogais. Os formantes superiores (F4, F5, etc.), por outro lado, tm menor contedo lingstico e maior variao com o locutor. Acusticamente, os formantes amplificam seletivamente os harmnicos gerados pela vibrao larngea. Para compreender as caractersticas do espectro da fonte sonora importante discutir a vibrao das pregas vocais. Cada prega (Fig. 2) uma dobra de tecidos que, mecanicamente, comporta-se como um corpo (msculo e ligamento) relativamente rgido e pesado, revestido por uma cobertura (tecido conjuntivo e epitelial) flexvel (Hirano, 1981). O fluxo areo modulado medida que o espao entre as pregas vocais aberto e fechado ciclicamente, de acordo com a deformao da camada de cobertura (Fig. 3). A vibrao gltica d-se de forma aproximadamente peridica, mas a velocidade do fechamento de cada ciclo maior que a velocidade de abertura. Assim, o fluxo inclinado para a direita. Se os pulsos glticos fossem perfeitamente senoidais, haveria apenas uma - 71 -
Figura 2: Pregas vocais. Acima (de Sdersten & Lindestad, 1992): endoscopia oral (direita) e nasal (esquerda). Abaixo, esquerda: viso endoscpica das pregas vocais (PV). As linhas tracejadas indicam a posio das pregas sob a epiglote (E). Abaixo, direita: corte transversal de uma prega vocal, destacando as duas camadas mais relevantes para a fonao: o corpo e a cobertura.
fluxo
fluxo
Ajustes Prfonatrios
fechada
fluxo
abertura
fechamento fechada
(+ rpido)
t
1/F0
Figura 3: Ciclo fonatrio na voz modal (adaptado de Hirano, 1981). A partir da esquerda: as pregas vocais esto inicialmente fechadas e, dependendo da freqncia e intensidade do som a ser produzido, tm ajustes prfonatrios adequados de presso subgltica, tenso longitudinal, aproximao da parte posterior das pregas vocais e fora de compresso na parte medial. Com o esforo expiratrio e com a glote ainda fechada, a presso intragltica aumenta enquanto as bordas inferiores afastam-se, acumulando energia potencial elstica na camada de cobertura. Com o aumento da presso intragltica, as bordas superiores finalmente separam e o ar flui pela glote. O fluxo de ar leva a uma queda na presso intragltica (Efeito Bernoulli) que ocorre num momento em que as bordas inferiores esto muito comprimidas. Isto resulta numa fase de fechamento mais rpida que a de abertura, causando uma assimetria na forma dos pulsos glticos. O ciclo repete-se na freqncia fundamental F0. Os detalhes (a) e (b) mostram a oposio entre os sentidos dos movimentos das bordas superiores e inferiores. Est diferena de fase est associada a uma onda (onda mucosa) que se propaga pela cobertura das pregas vocais desde sua parte inferior at sua parte dorsal. Doenas que dificultam ou interrompem o deslocamento deste movimento muco-ondulatrio podem levar rouquido.
- 72 -
Modal
0 -12 -24 -36 0 1 2 3 4 5 6 7 8 9 (F0) Freqncia (n.F0) n
-12 dB/oitava
Cochicho Fry/Creak
Falsete
-18 dB/oitava
Fry (Crepitao)
0 -12 -24 -36 0 1 2 3 4 5 6 7 8 9 n
(F0)
Freqncia (n.F0)
(F0)
Freqncia (n.F0)
Figura 4: Ajustes larngeos e qualidade da voz. Acima, esquerda (baseado em Beck, 1988): formato da prega vocal em diversos ajustes larngeos. Tomando-se a voz modal como referncia e seguindo a descrio de Laver (1981), h, no falsete, grande aumento na tenso longitudinal (LT) e, conseqentemente, em F0; uma fenda gltica comum neste ajuste. No fry ou creak (denominado crepitao, pelos fonoaudilogos, ou voz rangida, por alguns lingistas), h grande reduo na tenso longitudinal e na presso subgltica, mas h aumento na compresso medial (MC), resultando num som mais grave, com aperiodicidade e subharmnicos. No cochicho, a falta de aproximao ou aduo (AD) na parte posterior da glote resulta numa fenda onde gerado um rudo de frico; neste ajuste, no h vibrao das pregas vocais. Demais grficos (baseados em Klatt & Klatt, 1990): principais caractersticas acsticas de ajustes larngeos, destacando as mudanas na freqncia fundamental e na envoltria dos termos da srie harmnica.
Figura 5: Sintonia F1-F0. Esquerda: aumento na amplitude do harmnico fundamental, F0, pelo deslocamento do primeiro formante, F1. Direita (adaptado de Rossing, 1990): representao de vogais no plano F1xF2; as elipses indicam valores mdios de formantes e a rea pontilhada a regio da freqncia fundamental de sopranos: d4 (C4) a d6 (C6), aproximadamente). As demais vogais, no representadas, ocupam regies intermedirias do plano, com superposies de reas.
Como descrito por Fant (1986), outro benefcio da sintonia F1-F0 uma diminuio no consumo de ar devido a um grande aumento na presso intraoral prximo ao instante de mxima abertura gltica. Este aumento de presso supragltica reduz o fluxo, mas no afeta a velocidade de fechamento. O preo que se paga pela sintonia F1-F0 uma perda na inteligibilidade das vogais. Segundo Di Carlo (1994), que estudou as vogais do Francs, somente as vogais nasais e as orais [e], [] e [o] so nitidamente individualizadas para notas emitidas entre o f3 e o l3 (350-440 Hz), que ela denomina zona de tolerncia; entre o l3 e o mi4 (440-659 Hz), zona de inteligibilidade eletiva, somente [i] e [a] so diferenciados; acima do mi4, zona de no-inteligibilidade absoluta, no se pode distinguir uma vogal das outras. No canto lrico, no apenas de sopranos, outras distores nos valores de formantes podem ocorrer. Os ajustes utilizados para alargar o trato vocal e diminuir a tenso da musculatura buco-facial no s alteram as ressonncias como tambm limitam a amplitude dos gestos articulatrios, reduzindo as excurses temporais dos formantes, particularmente F1, que so elementos importantes da inteligibilidade (Di Carlo, 1194). Esta autora lembra ainda que consoantes mal articuladas pelo prolongamento excessivo das vogais tambm colaboram para a reduzir a inteligibilidade.
- 74 -
orquestra fala
Freqncia (Hz)
Figura 6: Formante de cantor. Espectros mdios de longo prazo. Sem o recurso do formante do cantor (regio escura), os sons da fala so mascarados pela orquestra. Com o abaixamento da laringe e o alargamento da regio supragltica, o formante do cantor criado prximo a 3 kHz. Adaptado de Sundberg (1979).
Assim como na sintonia F1-F0 das sopranos, o formante do cantor propicia um aumento na audibilidade da voz sem aumento no esforo fonatrio. Alm disso, como lembra Sundberg (1979), h outras conseqncias favorveis. Primeiro, a regio de 3 kHz tambm coincide com a regio mais sensvel da percepo auditiva humana (onde ocorre uma ressonncia com a cavidade do meato acstico do ouvido), sendo amplificada ainda mais pelo processamento auditivo perifrico. Segundo, tendo-se em mente o comportamento passa-altas da irradiao sonora, os harmnicos de alta freqncia propagam-se mais eficientemente em linha reta, o que pode auxiliar a platia a discriminar melhor a voz do cantor no palco.
4. CANTO HARMNICO
O recurso de destacar harmnicos utilizado com maestria numa tcnica de canto de regies asiticas, incluindo a Monglia, o Tibet e a Sibria (Levin & Edgerton, 1999). Chamada de canto harmnico (harmonic chant/singing), este estilo possui outras denominaes que fazem aluso a sobretons (overtone singing) ou garganta (throat singing). A primeira sensao que se tem ao ouvir esta manifestao artstica de certo espanto, por tratar-se de algo extico, e vrios ouvintes custam a admitir tratar-se de um som produzido por uma nica pessoa. Neste estilo (Fig. 7), o cantor emite um som larngeo com uma freqncia fundamental baixa (70-100 Hz) que permanece praticamente constante. Porm, refinando os ajustes utilizados na produo de vogais, ele consegue criar uma pequena cavidade intraoral que atua como um superformante de elevada amplitude e largura de faixa to pequena que capaz de destacar um nico harmnico do espectro larngeo. O cantor altera com preciso a forma da cavidade, mudando a freqncia do formante e, literalmente, pina harmnicos no espectro, criando uma seqncia meldica aguda que evolui sobre uma base grave. Detalhes sobre alguns ajustes articulatrios, arquivos de vdeo e udio so disponveis nos suplementos de Levin & Edgerton (1999). A Fig. 7 mostra um exemplo de canto harmnio da regio de Tuva, na Sibria. No espectrograma de banda estreita, as linhas horizontais paralelas representam a evoluo temporal da srie harmnica; quanto mais escura a linha, mais intenso o harmnico. No incio do espectrograma, o cantor utiliza uma voz sem os recursos do canto harmnico, como mostra a seo espectral A, onde vrios formantes convencionais podem ser vistos. Assim que a tcnica do canto harmnico introduzida, um harmnico de alta freqncia (seta) passa a destacar-se no espectro. Os harmnicos o o utilizados esto entre o 6 e o 12 , mas, como a sintaxe musical da regio favorece melodias o o pentatnicas, o 7 e 11 harmnicos so evitados (Levin & Edgerton, 1999).
- 75 -
A
F3
dB
Hz A B C
Hz
12 10 8 6
2s
Canto normal
Canto Harmnico
tempo (s)
Figura 7: Canto harmnico. Na parte inicial, a tcnica do canto harmnico no utilizada. A seo espectral A mostra os formantes caractersticos da fala. Com o uso do canto harmnico, um harmnico (setas) destaca-se, o o como visto ao longo do espectrograma e na seo B. Os harmnicos selecionveis esto entre o 6 e o 12 , o o mas o 7 e o 11 no so utilizados devido s escalas pentatnicas. O detalhe C indica uma ocorrncia de vibrato. Elaborado com gravaes de Levin & Edgerton (1999).
Este estilo tambm utiliza recursos fonatrios especiais e por isso tambm denominada khoomii, palavra monglica para garganta. Os ajustes larngeos adotados tm semelhanas com o fry (Fig. 4). Com isso, alm do baixo valor de F0, consegue-se uma maior velocidade de fechamento (que amplifica os harmnicos superiores) e uma diminuio da fase aberta de cada ciclo gltico (que diminui o consumo de ar e evita perda de energia pelo acoplamento com o trato vocal subgltico); as falsas pregas tambm podem ser utilizadas vibrando numa freqncia sub-mltipla de F0 (Levin & Edgerton, 1999). No espectrograma da Fig. 7 v-se, no detalhe C, que as linhas horizontais no so retas, mas ondulam ao longo do tempo. Estas ondulaes so conseqncias do vibrato, que ser discutido a seguir.
5. VIBRATO VOCAL
O vibrato uma variao regular na freqncia de uma nota comumente utilizado na msica (Fig. 8). Perceptivamente, sua qualidade depende de trs parmetros mensurveis: a taxa, a profundidade e a regularidade. A taxa (F = 1/T) o nmero de ciclos por segundo; a profundidade, amplitude ou extenso (F0), o desvio da freqncia em torno de ser valor mdio, enquanto a regularidade carece de um parmetro para medio, mas, desejavelmente, deve ter um aspecto senoidal. No bel canto, a taxa aceitvel do vibrato varia de 5,5 Hz a 7,5 Hz e a profundidade vai de 6% a 12%, ou seja, de aproximadamente 1 a 2 semitons (Sundberg, 1987).
- 76 -
Frequncia (Hz)
1 kHz
16 14 12 10 8 6 4 2 F0
Fi
500 Hz
T T
0,2 s
tempo (s)
Figura 8: Vibrato. Espectrograma de banda estreita mostrando as ondulaes introduzidas em toda a srie harmnica devido ao vibrato. Os nmeros crescentes esquerda da figura (2, 4, 6, ...) so a ordem do o harmnico. O perodo do vibrato T 0,19 s e a taxa F = 1/0,19 s = 5,3 Hz. O 15 utilizado para medir a amplitude do vibrato: sua freqncia inferior Fi = 2080 Hz e a superior Fs = 2280 Hz. O valor mdio de F0 1/2 (2280 + 2080)/15 = 145,3 Hz e a amplitude do vibrato 1/2 (2280 2080)/15 = 6,67 Hz, ou seja, 4,6% de F0, que equivale a 0,8 semitons (vide texto principal).
A taxa e a profundidade do vibrado podem ser medidas em espectrogramas de banda estreita (Fig. 8) utilizando-se algum software que disponha de escalas e/ou cursores com resoluo adequada. A leitura da durao do ciclo (T) imediata, mas, para estimar profundidade, difcil obterse resoluo adequada medindo-se diretamente a freqncia do harmnico fundamental. Porm, para um harmnico de ordem elevada, podem-se obter valores de freqncia mxima e mnima com erros menores, e a profundidade do vibrato (valor de pico) pode ser expressa, em semitons, por: F0
onde Fs e Fi so, respectivamente, os valores superior e inferior da freqncia de um harmnico qualquer. No exemplo da Fig. 8, Fs 2280 Hz, Fi 2080, donde F0 0,8 semitons. Tendo-se em mente que o semitom da escala igualmente temperada equivale a uma relao entre freqncias de
12 2 = 1,059... 6%, a amplitude do vibrato pode ser calculada sem o uso de logaritmos, obtendo-se
F0 em valor percentual e obtendo-se a frao do semitom. No caso (vide legenda da Fig. 8), F0 = 6,7/145,3 = 4,6% e a amplitude do vibrato 4,6%/6% = 0,8 semitons. No canto, o vibrato produzido modulando-se a tenso da musculatura larngea responsvel pela tenso e enrijecimento das pregas vocais (msculos cricotireideos e tiroaritenideos, respectivamente); tambm fisiologicamente possvel produzir o vibrato variando-se a presso subgltica (que resulta em maior deslocamento lateral das pregas vocais e, conseqentemente, na elevao de sua tenso mdia), mas esta parece no ser a tcnica natural de cantores experientes (Sundberg, 1979; Titze, 1994). O vibrato produzido por variao da presso pulmonar revela um mecanismo de interdependncia entre a amplitude (causa) e a freqncia (efeito). Por outros motivos, ocorre uma situao reversa no vibrato larngeo, isto , variaes em F0 causam variaes na amplitude da presso sonora. Como ilustrado na Fig. 9, isto ocorre porque a amplitude dos harmnicos aumenta e diminui medida que suas freqncias oscilam em torno dos formantes, particularmente de F1, que o formante de maior amplitude (Sundberg, 1979). A regularidade do vibrato um aspecto que tem recebido ateno nos ltimos anos (e.g., Diaz & Rothman, 2002). A regularidade pode ser analisada fazendo-se uma anlise espectral da srie temporal de valores de F0, como ilustrado na Fig. 9. Este mtodo pode ser adaptado para criar um espectrograma do vibrato e avaliar a dinmica temporal dos ajustes.
- 77 -
Frequncia (Hz)
Fs
Figura 9: Espectro da regularidade do vibrato. Esquerda: voz com vibrato regular, taxa de aproximadamente 5,5 Hz e amplitude de 0,70 semitons. Direita: vibrato irregular e de baixa amplitude, apresentando dois picos maiores em 4,2 e 8,4 Hz. Os grficos foram obtidos rastreando-se F0 a cada 20 ms, extraindo-se a mdia da srie temporal, passando por um filtro passa-altas com corte em 3 Hz e calculando-se a Transformada Discreta de Fourier em 100 pontos.
6. CONCLUSO
Este artigo abordou, de forma introdutria, o modelo Fonte-Filtro da produo da voz e sua utilizao no estudo de alguns aspectos da voz cantada. A arte do canto tem estado frente da cincia, mas aos poucos, a acstica vem explicando fenmenos que professores de canto conhecem h sculos. Com o avano da tecnologia, o uso no s de registros acsticos, mas de sinais aerodinmicos (fluxo areo e presso sonora) e eletroglotogrficos, tende a tornar-se um forte aliado compreenso e evoluo das tcnicas de canto, como tem ocorrido na fonoaudiologia e na otorrinolaringologia (e.g., Hirano, 1981; Vieira, 1997; Vieira et al., 2002). Estas especialidades mdicas, alis, tm tido crescente interesse no estudo da voz cantada visando o aprimoramento do tratamento de problemas vocais em cantores profissionais. Cabe aqui uma palavra de precauo. A facilidade atual de acesso a equipamentos de gravao e a softwares para a anlise automtica da voz (com resultados no-necessariamente confiveis) no deve ocultar a necessidade de conhecimentos sobre os fenmenos bsicos da acstica, as tcnicas de gravao e os mtodos de anlise de sinais.
7. REFERNCIAS
Bartholomew, W. T. (1933). A physical definition of good voice-quality in the male voice. Journal of the Acoustical Society of America 6, pp. 25-33. Beck, J. M. (1988). Organic Variation and Voice Quality. Ph.D. Thesis (University of Edinburgh). Diaz, J. A. & Rothman, H. B. (2002). Acoustical comparison between samples of good and poor vibrato in singers. Journal of voice 17, pp. 179-184. Di Carlo, N. S. (1994). Lintelligibilit de la voix chante. Medicine des Art 10, pp. 2-15. Fant, G. (1970). Acoustic Theory of Speech Production. Mouton, The Haugue. Fant, G. (1986). Glottal flow: models and interaction. Journal of Phonetics 14, pp. 393-399. Hirano, M. (1981). Clinical Examination of Voice. Springer-Verlag, New York. Kent, R. D. & Read, C. (1992). The Acoustic Analysis of Speech. Singular, San Diego. Kinsler, L. E., Frey, A. R., Coppens, A. B. & Sanders, J. V. (1982). Fundamentals of Acoustics (Third Edition). John Wiley & Sons, New York. Klatt, D. H. & Klatt, L. C. (1990). Analysis, synthesis, and perception of voice quality variations among female and male talkers. Journal of the Acoustical Society of America 87, pp. 820-857. Laver, J. (1981). The Phonetic Description of Voice Quality. Cambridge University Press. Levin, T. C & Edgerton, M. E. (1999). The throat singers of Tuva. Scientific American 281(3), pp. 80-82 + s. Lindblom, B. E. F. & Sundberg, J. E. F. (1971). Acoustical consequences of lip, tongue, jaw, and larynx movements. Journal of the Acoustical Society of America 50, pp. 1166-1179. Rossing, T. (1990). The Science of Sound, 2 . Edition. Addison Wesley. Sdersten, M. & Lindestad, P. A. (1992). A comparison of vocal fold closure in rigid telescopic and flexible fiberoptic laryngostroboscopy. Acta Otolaryngologica (Stockholm) 112, pp. 144-150. Stevens, K. N. (1998). Acoustic Phonetics. The MIT Press, Cambridge.
nd
- 78 -
- 79 -