ACÚSTICA DE RESONADORES DE HELMHOLTZ

RESONADORES DE HELMHOLTZ

INTRODUCCIÓN TEÓRICA

Ya advierte la bibliografía especializada en temas de absorción de baja frecuencia, que la mayor ayuda para el tratamiento acústico con elementos resonadores es la propia experimentación.
Las expresiones teóricas informan acerca del comportamiento del conjunto resonador; y, ateniéndose a ciertas restricciones, la formulación acierta en la frecuencia de sintonía del sistema pero flaquea en las previsiones de absorción.
Recordemos las principales fórmulas que modelan el funcionamiento de un resonador de Helmholtz así como las limitaciones de cada una.

Se advierte del cambio en el ancho de banda y de la disminución de la eficacia del resonador con la introducción, en la cavidad de éste, de material aborbente poroso, pero, ¿en qué medida varían los parámetros antes mencionados? Poca bibliografía completa el caso de sistemas con pérdidas.

Absorción

La absorción de un resonador de Helmholtz es quizás el apartado más abandonado por la teoría y más necesitado en los casos prácticos. Si bien el ajuste de la frecuencia de resonancia es un hecho sin problemas, la predicción de la cantidad de absorción constituye un tema poco claro. Existe formulación para la absorción de un resonador individual en su frecuencia de resonancia y también para todo el margen, pero debemos remarcar su “validez” únicamente para el caso de un resonador aislado, cosa que en un tratamiento real no encontramos nunca. Así, la predicción de absorción para un conjunto de resonadores de Helmholtz (resonadores individuales no independientes), se hace casi imposible.

La fórmula que se encuentra para la absorción de un resonador es la siguiente:

La absorción máxima, Amax, usadada algunas veces en trabajos teóricos, responde a la expresión mostrada para los casos en que la resistencia de fricción del resonador se iguala a la resistencia de radiación del mismo; para resonadores totalmente adaptados al medio [Kutrruff].Muchas veces su usan aproximaciones de la fórmula cambiando el denominador por 3.5p o 4p.

CASOS PRÁCTICOS
Para estudiar el comportamiento de los resonadores de Helmholtz se han analizado en el laboratorio diferentes montajes realizando medidas en cámara anecoica y reverberante.

MEDIDAS EN CÁMARA ANECOICA
En la cámara anecoica se midió la frecuencia de resonancia, el ancho de banda de los resonadores construídos y la variación de ambos parámetros cuando se introducían pérdidas en el sitema.

Medida de la f0
La frecuencia de resonancia se obtuvo excitando con ruido rosa en el exterior del resonador y obteniendo el espectro de la excitación en el interior de su cavidad. Los resultados obtenidos convergen a una buena previsión teórica de la frecuencia de resonancia cuando las restricciones de dimensionado y proporcionalidad son respetadas.

En las figuras anteriores mostramos uno de los resonadores analizados y la medida de su frecuencia de resonancia. Para este caso, la frecuencia teórica predecía 59.42 Hz y la frecuencia real ha resultado de 62.2 Hz.
Las medidas realizadas en los 15 sistemas analizados han presentado variaciones relativas máximas del 5%.

Medida de un sistema con pérdidas

Para el caso del resonador presentado anteriormente, al añadir material absorbente en el volumen encerrado, la frecuencia de resonancia varía disminuyendo, hasta los 60.5 Hz para un 40% de fibra de vidrio en la cavidad y hasta 58.7Hz para un 70% de fibra en un segundo caso. El material absorbente también contribuye a reducir el nivel de las frecuencias propias de la cavidad del resonador así como a disminuir la energía del pico de la resonancia.
La variación del ancho de banda es visible pero éste se extiende, en muchos casos, por debajo del ancho definido a –3dB.

A continuación se muestran, para diferentes experimentos, las variaciones en la frecuencia de resonancia y en el ancho de banda relativo según el porcentaje de volumen ocupado por material absorbente.

Como se aprecia en la gráfica, la frecuencia de sintonía disminuye debido al material absorbente asociando el fenómeno a un aumento virtual del volumen del resonador. Los datos obtenidos coinciden con los resultados de Beranek llegando a una reducción máxima de la f0 de un 85%.

MEDIDAS EN CÁMARA REVERBERANTE
Medida de la absorción

Para los ensayos de coeficiente de absorción se midieron dos conjuntos de resonadores. Uno de ellos formado por botellas (f0 de 116 Hz) y realizando medidas con grupos de 25, 50 y 100 resonadores. Un segundo sistema se observa en lafotografía superior y se basa en un conjunto de 8 resonadores de madera sintonizados a 90.5Hz.
Los resultados obtenidos se muestran en los gráficos siguientes. Para la obtención del incremento de absorción se aplicó la Normativa ISO 354 para el cálculo del coeficiente de absorción en cámara reverberante.

Apreciamos en los la variación del incremento de absorción en función del número de resonadores y de la colocación de éstos. Este incremento, evidentemente, no es lineal con el número de elementos absorbentes y por tanto es imposible extrapolar un coeficiente de absorción para un único resonador. La absorción proporcionada por el conjunto de 100 botellas es considerable, rebajando el tiempo de reverberación de la sala de 15 segundos a 9.6 segundos en la banda de 125Hz.

Los datos conseguidos con el conjunto de 8 resonadors se muestran a continuación.

En el gráfico anterior se representa la curva tonal de la cámara reverberante vacía (línea rosa) y la curva tonal después de colocar en medio de la cámara el conjunto resonador en posición vertical (línea azul).

Estos dos gráficos representan la variación del TR60 y del incremento de absorción en función de la posición del conjunto de resonadores (posición horizontal y posición vertical) y el incremento de absorción provocado por sólo 4 resonadores del conjunto, invalidando los 4 restantes. Como se observa en los resultados obtenidos, el resonador colocado en posición vertical presenta el máximo incremento de absorción mientras que en posición horizontal la absorción disminuye acercándose al caso de los 4 resonadores.
Es interesante destacar que la cantidad de absorción que se obtuvo con estos 8 resonadores sintonizados a 90.5Hz, fue la misma que la obtenida por los 100 resonadores del experimento anterior, sintonizados a 116 Hz. Este resultado confirma, como anunciaba la formulación presentada en la introducción teórica, la dependencia de la absorción con la longitud de onda de la frecuencia de resonancia.

Efectos secundarios

Otros efectos previsibles medidos en algunos casos prácticos, son la actuación de estos elementos resonadores en el campo sonoro que los rodea. El sistema resonador, no sólo provoca una absorción determinada sino que puede contribuir a aumentar la difusión del campo acústico de su alrededor gracias a la reradiación de energía que se produce a través de la boca
del mismo.
En cámara reverberante y en ambiente anecoico se han medido estos efectos apareciendo en los espectros de la señal captada en la zona que envuelve el resonador, o en las gráficas de tiempo de reverberación. En este último caso, la actuación del resonador aparecía creando una doble pendiente en la caída de la energía o creando un pico energético que provocaba una discontinuidad en la curva.

CONCLUSIONES

La frecuencia de sintonía de los resonadores construídos se calcula con exactitud con la ayuda de la formulación existente. Se debe tener en cuenta la disminución de esta frecuencia, hasta un 85%, cuando se añade material absorbente en la cavidad del resonador y
la variación del comportamiento cuando no se respetan las condiciones de dimensionado.
La absorción de estos elementos puede llegar a ser elevada y aumenta con la longitud de onda de la frecuencia de resonancia. La fórmula de absorción para el caso de un resonador aislado no sirve en implementaciones reales.
La colocación en la sala del sistema resonante así como su posición, pueden influir de forma considerable en la absorción del sistema. Es máximamente eficaz la colocación de estos absorbentes en los lugares de máximos de presión.

BIBLIOGRAFÍA

[1] Room Acoustics, Heinrich Kuttruff
[2] Principles and Aplications of Room Acoustics Volume 1 y 2, L.Cremer, H. Müller
[3] Acústica de Recintes. Enginyeria La Salle. Robert Barti
[4] Master Handbook of Acoustics.

FFT_Medición de Función de Transferencia con sweeps 3

3 PRE-ÉNFASIS

En casi cualquier medición acústica, no es aconsejable usar una señal de excitación con contenido espectral blanco. En el caso de medición de altavoces en una cámara anecoica, se pueden presentar dos efectos para una gran pérdida de relación S/R en bajas frecuencias: La pérdida de sensibilidad (de 12 o 24 dB por octava) debajo de la resonancia de la caja de bajos (bass cabinet), y el aumento del ruido de fondo en esta región de frecuencias debido al deficiente aislamiento de las paredes al ruido de fondo.
Así pues, para seguir el roll-off de frecuencia baja de los altavoces (si es posible en todos, vea [30], [31]) sin los efectos de la degradación de bajo S/R, se requiere de un fuerte énfasis de más de 20 dB para establecer una certeza razonable en la medición.
Esto también da lugar a una mejor contribución de la energía que alimenta a un altavoz multivía. El woofer soporta mucha más potencia que un tweeter. Pero cuando usamos una señal de excitación con espectro blanco, el tweeter tendrá que soportar el golpe de la energía de la señal de excitación. Un domo de tweeter puede ser sobrecalentado y dañado con unos pocos Watts, y su límite puede ser fácilmente sobrepasado por cualquier amplificador de potencia. Desde este punto de vista, un énfasis en bajas frecuencias es altamente deseable.
Una tercera razón a mencionar, de naturaleza social es la siguiente: cuando se realizan mediciones “in situ” (salas de concierto, estadios), una señal de excitación con realce en bajos da calidez al sonido y es más agradable que el ruido blanco, y por lo tanto es más aceptable por otras personas presentes. Además, un fuerte incremento de potencia en la banda de bajos no da la impresión de mucha sonoridad debido a la mala sensibilidad del oído en esta región de frecuencias. Mientras esto puede sonar poco científico, todos los que hayan participado en sesiones de mediciones en público saben que el volumen máximo aplicable es estipulado por las personas que se juntan en el lugar, no por los altavoces ni por los amplificadores (ver [1]). Por ejemplo, los instaladores que suben en los soportes cerca de un cluster de altavoces aprecian definitivamente señales de excitación no molestas. En estos casos, usando ruido blanco como estimulo incluso lleva a un riesgo de salud y un problema potencial de seguridad. Un MLS que alimente accidentalmente con máximo nivel a un sistema potente puede causar daño auditivo o incluso conducir a los accidentes asustando al personal. Esto especialmente cerca de 2 los drivers horn-loaded 2”. Usar señales de excitación con énfasis en bajos relaja la situación a un cierto grado. Con sweeps largos, se puede interrumpir antes de alcanzar las frecuencias medias.

3.1 Ecualizando altavoces para mediciones acústicas de salas.
Obtener la IR es una de las tareas más recurrentes en acústica de salas y edificios. Todos los parámetros típicos que describen las propiedades acústicas de una sala (o para ser más precisos, el camino de transmisión acústica entre dos puntos, usando una fuente y receptor con distinta directividad) como reverberación, claridad, definición, tiempo central, STI y muchos otros pueden ser derivados de ella. Una mirada más cercana a la IR puede ayudar a identificar problemas como las reflexiones indeseadas o una proporción deficiente entre el sonido directo y la reverberación. Visualmente examinando la función de transferencia asociada a la sala (obtenida por la FFT) puede dar a conocer modos molestos de la sala o, por supuesto, desbalance tonal de un sistema de refuerzo sonoro.
Otra aplicación interesante es la creación de “realidad virtual” por la convolución de la capturación “seca” (anecoica) de audio con la IR binaural de una sala capturada por un dummy head. Posteriormente se demostrará que sólo los sweeps son capaces a realizar tareas con suficiente rango dinámico.
Hasta hoy, la capturación de la RIR para mediciones de tiempo de reverberación es ocasionalmente hecha usando fuentes impulsivas no electroacústicas. Las maneras más comunes son disparando una pistola (acción delicada especialmente en iglesias) o explosiones de globos. Mientras se obtiene altos niveles en algunas bandas de frecuencia, estos métodos tienen una baja repetibilidad y producen espectros impredecibles. La energía de baja frecuencia contenida es usualmente baja, especialmente para pistolas debido a sus pequeñas dimensiones. Incluso la omnidireccionalidad no está garantizada [1].
La única forma de evitar estos severos inconvenientes es usar un sistema electroacústico, y por lo tanto el uso de un altavoz.
Obviamente, cuando usamos un altavoz sin ninguna precaución, la función de transferencia obtenida de la sala será “coloreada” por la respuesta de frecuencia del altavoz. Este es un problema cuando la RIR será usada para auralización. Para empeorar
las cosas, la respuesta de frecuencia es dependiente de la dirección. Para mediciones de acústica de salas, la norma ISO 3382 describe el uso de un altavoz “lo más omnidireccional” posible (condición que en la practica difícilmente puede ser satisfecha sobre 2 kHz).
Ningún altavoz será capaz de producir una salida independiente de la frecuencia. Este no es un gran problema en mediciones de tiempo de reverberación en octavas o tercio de octavas, mientras que la desviación dentro de estas bandas no sea muy alta. La coloración del RTF por la respuesta de frecuencia del altavoz es muy indeseable con la intención de auralizar señales. En estos casos, es obligatorio usar un pre-énfasis para remover la coloración. Por supuesto, esta ecualización podría ser hecha post-procesando la RTF con la inversa de la respuesta del altavoz, pero esto no podría mejorar la pobre relación S/R en las regiones de frecuencia donde la salida acústica del altavoz es baja.
Es por esto que es favorable pre-filtrar la señal de excitación independientemente de la frecuencia y potencia de salida.
Una ecualización del altavoz es el pre-énfasis que debe ser aplicado en mediciones de acústica de salas. Además, la medición puede ser mejorada para un mejor alcance, adaptando el espectro de potencia emitido al espectro del ruido ambiente. Y en el mejor de los casos, el ruido de fondo tiende a ser mucho mayor en la región de bajas frecuencias. Así, en orden de obtener una relación S/R que sea casi independiente de la frecuencia, se debe aplicar un pre-énfasis adicional que siga el espectro del ruido de fondo.
Mientras es deseable tener la relación S/R independiente de la frecuencia para análisis de acústica de salas (especialmente para la obtención de tiempo de reverberación en bandas filtradas), podría ser discutible el orden para minimizar el ruido audible, la RIR adquirida para propósitos de auralización tiene un ruido de fondo que es aproximadamente lo contrario de nuestra sensibilidad de la audición en niveles bajos. El uso de noise shaping para reducir el ruido percibido en grabaciones con cuantización fija (por ejemplo los 16 bits de un CD) busca la misma meta. Una buena introducción a esta área se da en [32]. Para conseguir el nivel de ruido que sea particularmente bajo en regiones espectrales de alta sensibilidad del oído, se debe aplicar un énfasis igual a la curva de sensibilidad (por ejemplo E-curve) a la señal de excitación. Por otro lado, dando un aumento extra en la región de frecuencias medias de mayor sensibilidad del oído podría llevar a señales de excitación bastante molestas. De todas formas, la pregunta de cual énfasis satisface lo mejor posible es un problema multifacético y se puede contestar diferentemente para cada medición.

Una interrogante es como manejar las mediciones de la ecualización de la potencia acústica de los altavoces. Usualmente, la respuesta de potencia acústica del altavoz es obtenida por promedio de la magnitud de muchas funciones de transferencia medidas en campo difuso en una cámara reverberante. La corrección con la inversa de los tiempos de reverberación con 10*log{1/T(f)} convierte el espectro de presión del campo difuso en un espectro proporcional a la potencia acústica.
Después de esto, es indispensable un suavizado de 1/6 o 1/3 de octava para no obtener una curva corrugada. Pero esta suavización no es suficiente para bajas frecuencias, como puede ser visto en la fig.14 en la curva superior derecha. En este rango, la función de transferencia de la cámara consiste en solo en algunos modos con alto Q. Es una buena idea reemplazar estos nodos por un declive con la disminución teórica de la sensibilidad del altavoz (12 dB/oct para caja cerrada o 24 dB/oct para sistemas vented).

El problema ahora es como tratar la fase y el retardo de grupo asociado. Evidentemente, la fase de la función de transferencia de la cámara reverberante no puede ser usada. Un compromiso factible es combinar la magnitud de la respuesta de potencia acústica (obtenida en la cámara reverberante) con una respuesta de fase en campo libre (obtenida de la medición de sensibilidad en el eje del altavoz). Obviamente, combinando la amplitud de una medición con la fase de la otra entrega un espectro artificial que también corresponde a una IR artificial. Sin embargo, esto parece ser una vía realizable para minimizar la distorsión en amplitud y fase de mediciones en acústica de salas.
Es interesante advertir que si se creará un sweep, sólo la magnitud de la respuesta objetivo influenciará la señal de excitación. No teniendo ninguna influencia en la creación del barrido, la medición de la fase del altavoz puede ser ecualizada solamente por el post-proceso (es decir, aplicando lo contrario de esta fase al archivo de la referencia). Así, en general para las mediciones de acústica de salas, el proceso de la señal siempre consiste en una combinación de pre y post-procesamiento.

4 SÍNTESIS DE SWEEPS

Los sweeps pueden ser creados directamente en el dominio del tiempo o indirectamente en el dominio de la frecuencia. En este último caso, su magnitud y retardo de grupo son sintetizados y el sweeps es obtenido mediante la IFFT de este espectro artificial. Las formulas dadas aquí no se apegan a los estándar matemáticos típicos, pero son aceptables para su implementación en software.
Los dos tipos más comúnmente conocidos son los sweeps lineales y logarítmicos. Los sweep lineales tienen un espectro blanco y aumentan con una razón fija [Hz] por unidad de tiempo.

Algunos científicos japoneses [35], [36], se refieren al sweep lineal como “pulso expandido en el tiempo” (time stretched pulse, TSP), pero por supuesto cualquier señal de excitación de banda ancha, como un sweep o un ruido, puede ser considerado como un pulso cuya energía ha sido expandida en el tiempo.
El sweep logarítmico tiene un espectro rosado, lo que significa que la amplitud desminuye 3 dB/oct. Eso también significa que todas las octavas contienen la misma energía. La frecuencia aumenta con una fracción fija de una octava por unidad de tiempo:

4.1 Construcción en el dominio del tiempo
Los sweeps pueden ser sintetizados fácilmente en el dominio del tiempo mediante el incremento del paso de la fase que es sumado al argumento de una expresión sinusoidal después de cada cálculo de una muestra de salida. Un sweep lineal como los utilizados en TDS tiene un reajuste del valor sumado al incremento de la fase:

El factor incj usado para la generación del sweep lineal depende de la frecuencia de inicio y de término, la frecuencia de muestreo fs y el número de muestras N a ser generados:

Mientras los sweep generados en el dominio del tiempo tienen una perfecta envolvente y de esta manera un factor cresta ideal (3.02 dB), su espectro no es exactamente el esperado. El abrupto comienzo al iniciar del sweep y el abrupto final al terminar el sweep son responsables del indeseable ripple en los extremos del espectro de excitación, como se ve en la fig. 15. Ventanas half pueden ser utilizadas para disminuir el impacto del inicio y término del sweep, pero no los elimina completamente.
Normalmente, no tendrán efecto en la respuesta de frecuencia recuperada cuando se corrige con un espectro de referencia derivado de la inversión del espectro de la señal de excitación (la cual es obtenida por una medición de referencia conectando la salida a la entrada). Sin embargo, si la deconvolución es simplemente hecha con la inversión del tiempo y la forma de la amplitud del estímulo, como es propuesto en [2], o si la corrección no es factible, como con TDS, entonces pueden ser esperados errores en las
cercanías del comienzo y término del sweep.

4.2 Construcción en el dominio de la frecuencia
La construcción de sweeps en el dominio de la frecuencia evita estos problemas. La síntesis puede ser hecha definiendo la magnitud y el retardo de grupo de un espectro FFT, calculando la parte real y la parte imaginaria de ella y finalmente transformando el espectro del sweep artificial al dominio del tiempo aplicando la IFFT. El retardo de grupo no es fácilmente interpretable para señales compleja, pero es muy bien definido para los sweep sinusoidales, describiendo exactamente en que tiempo ocurre cada
frecuencia. Para los sweeps, el retardo de grupo se asemeja a la distribución tiempofrecuencia con los ejes vertical y horizontal intercambiados (a pesar de carecer de la tercera dimensión, contienen la información de la magnitud).
Si se desea un sweep con una envolvente temporal constante (garantizado naturalmente por la construcción en el dominio del tiempo), la magnitud y el retardo de grupo tienen que estar relacionado el uno con el otro. En el caso de un sweep lineal, la magnitud del espectro tiene que ser blanco y en el caso del sweep logarítmico debe ser rosado, con una pendiente de –3 dB por octava. El retardo de grupo asociado para el sweep lineal puede ser entonces simplemente:

Normalmente START f será la primera frecuencia del espectro discreto de la FFT, mientras que END f será fs / 2 . Por supuesto, ( fstart) G t y ( fend) G t deben estar restringidos a valores que se ajusten dentro de intervalo de tiempo obtenido después de la IFFT. La fase es calculada mediante la integración del retardo de grupo. La fase y la magnitud pueden ser convertidas a la parte real y imaginaria por las usuales expresiones sin/cos.
Como se estableció antes, la creación de sweeps en el dominio del tiempo causarán algunos efectos de suciedad en el dominio espectral. Igualmente, los sweeps sintetizados en el dominio espectral causarán algunas rarezas en la señal resultante en el dominio del tiempo. Primero que todo, es importante que la fase resultante de la integración del retardo de grupo alcance exactamente 0° o 180° en fs. Esta condición generalmente tiene que ser cumplida por cada espectro de una señal real. Esto puede ser realizado fácilmente restando los valores del espectro de la fase que disminuyen linealmente con la frecuencia hasta exactamente la compensación de la fase anterior del final:

Esto es equivalente a añadir un retardo de grupo menor de ± 0,5 muestras sobre todo el rango de frecuencias. Aún satisfaciendo esta condición, los sweep no estarán confinados exactamente a los valores dados por ( fstart) G t y ( fend) G t , pero estas se dispersan más allá en ambas¡ direcciones. Esto es una consecuencia directa de la magnitud del espectro deseado, el
cual no presenta las ondulaciones debidas al abrupto comienzo y término de los sweeps (creados en el dominio del tiempo). La ampliación se debe a que, el retardo de grupo para bajas frecuencias no debe ser cero, solo un poco mayor. De esta manera, la primera mitad de la onda del sweep tiene más tiempo para desarrollarse. Sin embargo, este siempre comenzará con un valor mayor a cero, mientras la parte restante izquierda del punto de comienzo se plegara hacia atrás, hacia los “tiempos negativos” en el final del período. Allí, este puede “ensuciar” la parte final de alta frecuencia del sweep si el retardo de grupo escogido para fs / 2 es demasiado cercano a la longitud del intervalo de tiempo de la FFT. Una manera segura de evitar la contaminación en la parte final debido a las componentes de bajas frecuencias es simplemente escogiendo la longitud del bloque de la FFT por lo menos el doble de la longitud del sweep deseado.
Para forzar el deseado comienzo y final del sweep al punto cero, son indispensables las operaciones de fade para evitar el ruido switching. Haciendo esto, es claro que ocurre una desviación de la deseada magnitud del espectro. Pero ésta puede ser insignificante al escoger partes suficientemente estrechas al comienzo y final del sweep. El espectro y las señales en el tiempo resultantes para los sweeps lineales y logarítmicos son presentados en la fig. 16.
La plataforma horizontal bajo los 20 Hz para el sweep logarítmico ha sido introducida deliberadamente para evitar demasiada energía
subsónica. Ambos sweep cubren el rango completo de frecuencias desde el DC (incluido) a fs / 2.

El ripple introducido por las operaciones de fading (ventanas half-cosine muy adecuadas) puede ser mantenido fácilmente bajo 0.1 dB y no debe causar ninguna preocupación, ya que este impacto en la medición resultante es cancelado al desarrollar
y aplicar la medición de referencia.

Sin embargo, en los casos donde una compensación exacta de la amplitud no es posible o deseado (por ejemplo, en un dispositivo TDS), el método iterativo mostrado en la figura 17 permite rechazar completamente el ripple, estableciendo la magnitud exacta del espectro deseado mientras se mantiene la longitud deseada del sweep. La iteración consiste del desarrollo consecutivo de operaciones fade in/out, transformando la señal del tiempo al dominio espectral, reemplazando la ligera corrugación de la magnitud
espectral por la magnitud deseada, manteniendo las fases, y eventualmente volver a transformar la magnitud del espectro manipulada al dominio del tiempo. Antes de aplicar la ventana fade in/out nuevamente, los residuos fuera del intervalo del sweep son
examinados. Si su valor máximo es menor que el LSB de la cuantización final del sweep deseado, la ventana es omitida y la iteración finaliza. Usualmente, el proceso converge rápidamente y aún un sweep con cuantización de 24 bit es disponible solo después de 15 iteraciones. Sin embargo, la respuesta de magnitud perfecta es cambiada por una ligera distorsión de la fase del espectro. Por lo tanto, el retardo de grupo derivado estará ligeramente distorsionado, pero el efecto es casi imperceptible y restringido bandas muy estrechas alrededor de DC y fs / 2 . La iteración trabaja mejor con sweep de un ancho de banda que cubre el rango completo entre 0 Hz y fs / 2 Hz.

4.3 Sweep con magnitud espectral arbitraria y envolvente temporal constante.

Hasta ahora hemos estado restringidos a sweeps lineales y logarítmicos. Si su magnitud espectral fue alterada de la contribución de energía blanca o rosada a algo diferente, es claro que su envolvente temporal podría ya no ser constante. Esto puede implicar un incremento del factor cresta y por lo tanto una pérdida de energía, dando un clavado valor peak como máxima amplitud. No obstante, podría ser muy atractivo el uso de sweeps con una arbitraria contribución de energía sin perder la ventaja del bajo factor de cresta. Esto puede ser realizado de manera sorprendentemente fácil simplemente haciendo que el retardo de grupo crezca proporcionalmente a la potencia del espectro de excitación deseado. Generalmente, la energía de un sweep en una región particular de frecuencia puede ser controlada por la amplitud del sweep o la razón del sweep en esa frecuencia. Un incremento con pendiente del retardo de grupo significa que la correspondiente región de frecuencia es emitida en un tiempo considerable, con solo la frecuencia instantánea emergiendo lentamente. De esta forma, mucha energía esta almacenada en la respectiva sección espectral.
El retardo de grupo para el sweep de magnitud arbitraria y envolvente constate puede ser construido comenzando con tG ( fstart) para la primera frecuencia y entonces incrementando:

El proceso es ilustrado por un ejemplo en la figura 18. El sweep bajo construcción servirá para ecualizar un altavoz y presentar un adicional énfasis de baja frecuencia. El espectro deseado de la señal de excitación se origina de la inversión de la respuesta del
altavoz. Este es adicionalmente enfatizado con un filtro de primer orden low-shelf con 10 dB de ganancia y un filtro pasa altos en 30 Hz para evitar que un exceso de energía infrasónica alimente al altavoz por la nueva ecualización de la señal de excitación.
El grupo de retardo construido muestra una relativa inclinación pronunciado hasta 0,5 segundos, y la señal resultante en el tiempo revela que en este rango incrementa solo gradualmente desde el valor inicial. De esta manera el sweep contendrá una gran cantidad de energía en esa región de frecuencia. Desde los 80 Hz a los 6 kHz, el retardo de grupo incrementa solamente en 200 ms, así todo el rango de frecuencias medias pasa a través de este corto tiempo. Sobre los 6 kHz, el retardo de grupo nuevamente se inclina debido al incremento de la magnitud deseada y la frecuencia aumenta moderadamente, extendiendo consecuentemente la parte de HF del sweep.
Se debe observar que la amplitud del sweep no es completamente constante, como podría ser deseado para lograr el factor de cresta ideal. En el comienzo y en aproximadamente 650 ms, un leve resalto no se puede negar. Esta es otra imperfección causada por la formulación del sweep sintético en el dominio de la frecuencia. Para mantener esta alteración pequeña, una leve suavización de la magnitud del espectro ayuda. Haciendo esto, el factor de cresta del sweep puede mantenerse normalmente bajo los 4 dB, llevando a una perdida de energía menor a 1 dB. Por supuesto, el método iterativo descrito en 4.2 puede ser combinado con este algoritmo para reducir las desviaciones de la deseada respuesta de magnitud espectral cerca de las bandas límites.
Haciendo esto, el factor cresta decrece levemente.

4.4 Sweep con espectro de magnitud arbitraria y envolvente establecida.

¿Es el sweep con envolvente constante y magnitud espectral arbitraria la señal de excitación óptima para mediciones acústicas? Bien, si el amplificador de potencia debe ser la restricción límite del equipamiento de medición, uno debe decir si. La casi constante envolvente de la señal de excitación permite obtener la máxima potencia del amplificador para todo el rango de frecuencias de la medición, por esta razón drenar la máxima energía posible hacia el RUT (room under test) en los distintos intervalos de tiempo. Sin embargo, la falta de potencia es raramente un punto de preocupación hoy en día (quedando solo los equipos portátiles alimentados con batería). Es mucho más común que tenga que ser considerada cuidadosamente la capacidad de manipulación de potencia de los altavoces para evitar dañarlos. En el caso de sistemas multivía, por ejemplo, un dodecaedro compuesto de altavoces coaxiales, posiblemente soportado por un potente subwoofer, cada vía tiene su propia potencia límite. Un sweep con envolvente constante debe tener esta potencia ajustada al enlace más débil del equipamiento, muchas veces los tweeters. Esto podría dejar a las capacidades de manipulación de potencia del woofer (que exceden a los tweeters frecuentemente por un factor de 10 o más) la mayoría de las veces sin uso. Por otro parte, un aumento extra es frecuentemente deseable precisamente en la región de bajas frecuencia para sobreponerse al incremento del ruido de fondo ambiental.
Queda claro que en el caso de los altavoces, la potencia instantánea del sweep debe ser controlable de acuerdo a la frecuencia por la que está pasando el sweep. Esto puede ser logrado por el control de la amplitud del sweep en un modelo dependencia-frecuencia.
Para hacer esto, solo es necesario hacer una modificación menor al proceso de creación de sweep revelado en la sección 4.3. Como se muestra en la figura 19, el truco es primero dividir el espectro “objetivo” por la envolvente espectral deseada. El espectro resultante es la base para la síntesis del retardo de grupo. Después, creando la parte real e imaginaria, el espectro del sweep ahora será multiplicado con la envolvente del espectro deseado, reestableciendo la magnitud de respuesta deseada. La IFFT producirá ahora un sweep que ya no tiene una envolvente constante, pero finalmente diseñando la amplitud dependiente de la frecuencia impuesta por el espectro de la envolvente deseada.
Dos grados de libertad se ofrecen aquí: Una arbitraria distribución espectral junto con una arbitraria definición de la envolvente dependiente de la frecuencia, la cual es transformada en un una barrido senoidal desformado convenientemente en amplitud y
tiempo.

Se debe admitir que ésta aproximación no es la solución completa para el peligro del sobrecalentamiento de tweeter sensibles. Comparado a un sweep con envolvente constante de idéntico contenido de energía, un sweep con la envolvente deseada solo
conduce al estiramiento en el tiempo la misma energía que alimenta al tweeter, resultándole mismo calentamiento si la longitud del tiempo es más pequeña que la constante de capacidad térmica de la bobina. Mediciones acústicas de salas con largos
sweeps (muchos segundos) son también una ventaja si el tweeter no sólo es amenazado por sobrecalentamiento, también por daño mecánico causado (por ejemplo, fuerzas excesivas en la compresión de los drivers). La distorsión reducida debido al nivel
inferior puede también ser una motivación, aunque esta es la gran ventaja de medición con sweeps donde la distorsión producida puede ser separada de la actual respuesta impulsiva.
Otra aplicación de los sweeps con decremento controlado de la envolvente en altas frecuencias es la medición de grabadoras de cinta análoga. La envolvente puede ser adaptada a la curva de saturación que depende de la frecuencia en la cinta analógica de
la grabadora, permitiendo así el uso óptimo del rango dinámico de la cinta en todas las frecuencias. De ésta manera, una aparente caída de la respuesta de frecuencia donde el nivel obtenidos cercanos al límite de saturación son obviados. En grabadores de cintas de casetes compactos con su estrecho y muy lento avance, el decremento necesario de la envolvente puede alcanzar 20 dB o más, dependiendo del material de la cinta. La curva de saturación de ésta misma puede ser determinada por la deliberada alimentación con
un sweep de excesivo nivel que cause saturación en todas las frecuencias. La distorsión producida es removida de la respuesta impulsiva y el espectro que queda de esta respuesta impulsiva es una buena estimación de la dependencia de la frecuencia a
máximo nivel de entrada para mediciones y grabaciones.

4.5 Sweep de dos canales con ecualización de altavoz y funcionalidad de crossover

En muchas mediciones acústicas, son empleados altavoces multivía para cubrir lo más posible el rango audible. Por ejemplo, un dodecaedro omnidireccional usualmente exhibirá una pobre respuesta bajo 200 Hz aproximadamente, dependiendo de su tamaño.
De esta manera, es una ventaja apoyarlo con un subwoofer para evitar la necesidad de excesivo pre-énfasis. Un diseño normal de caja cerrada o vented con un chasis será lo suficientemente omnidireccional en este rango de frecuencias. Como todas las tarjetas de sonido y algunos sistemas de medición están equipados con conversores estéreo, vale la pena hacer uso de dos canales para incluir una activa funcionalidad de crossover en la señal de excitación. Esto puede ser realizado con algunas extensiones del método de generación de sweep descrito en la sección 4.3 y 4.4.
Primero que todo, como en cualquier tarea de ecualización, es necesario medir ambos altavoces en la misma posición para establecer la magnitud, fase y relación de retardo válida. Teniendo en mente las capacidades de manipulación de la potencia del altavoz y acorde a su magnitud de respuesta, un punto apropiado de crossover puede ser seleccionado. En esta frecuencia la diferencia de la fase y del retardo de grupo entre ambos espectros es leída y almacenada. Ellas serán necesarias más tarde. Ahora, después de una suavización opcional, ambos espectros son invertidos y tratados con un filtro pasa banda para confinarlos a ellos al deseado rango de frecuencia a ser barrido (ver figura 20). En este punto, un énfasis deseado adicional es también aplicado al espectro estéreo. Debe ser diseñada ahora la envolvente de frecuencia controlada. Tiene que ser ejecutado ahora una división por la envolvente del espectro deseado. Después de estos pasos de preparación, la función crossover debe ser traída al juego mediante la multiplicación del primer canal con un filtro pasa bajos y el segundo con el correspondiente filtro pasa altos.

Un opcional efecto de suavización (con ancho constante en escala lineal de frecuencia) puede ser obtenido por la aplicación de una ventana a la respuesta impulsiva de ambos espectros. Para este propósito, ambos son transformados al dominio del tiempo después de suprimir su fase. La ventana deseada es aplicada y la respuesta al impulso confinada es transformada devuelta al dominio de la frecuencia (ver figura 21). La ventana no debe ser demasiado estrecha para evitar enturbiar o nublar el detalle de baja frecuencia.
Ahora el sweep de dos canales puede ser creado por la formulación de la ya conocida relación entre la magnitud ajustada y el incremento del retardo de grupo. Pero en vez de usar solo un canal, la magnitud ajustada de ambos canales tiene que ser añadida aquí para permitir el crecimiento del valor del retardo de grupo:

Como la frecuencia instantánea deberá ser la misma para ambos canales, la síntesis del retardo de grupo tiene que ser desarrollado solo una vez y la fase resultante puede ser copiada en el segundo canal. Si se diseñara la señal de excitación con una envolvente
controlada por la frecuencia, este espectro de dos canales tiene que ser multiplicado por la envolvente del espectro después de convertir la magnitud y el sintetizado retardo de grupo a su normal representación real/imaginaria.
La IFFT arrojara un sweep de dos canales que primero se deslizara a través de las bajas frecuencias en un canal y entonces las frecuencias restantes en el otro canal, La suma de ambos canales tendrá la deseada envolvente, mientras la relación de sus amplitudes en cada frecuencia instantánea corresponde a la relación establecida en el dominio espectral.
En la región de cruce, que no puede ser hecha indefinidamente estrecha debido a la norepetitiva naturaleza del sweep, ambos canales interfieren. Mientras ellos están en fase en la síntesis de la señal de excitación de dos canales, ellos usualmente no pueden llegar en fase al micrófono cuando son emitidos sobre dos altavoces. Así una corrección retardo/fase es necesaria para evitar perdidas de nivel de presión sonora en la región de cruce. Este es el por qué la relación de la fase y el retardo de grupo de la respuesta de los altavoces debe ser almacenada previamente. Esta información puede ahora ser utilizada para desplazar la señal para el altavoz con el menor retardo de grupo al derecho por la diferencia en los tiempos de llegada. Esto puede ser logrado mejor aún en el dominio espectral por la suma del apropiado retardo de grupo. Las fases recibidas en el punto de cruce pueden ser traídas en acuerdo mediante la suma o resta de pequeños adicionales retardos de grupo a uno de los canales.
Es discutible que podría ser más ventajoso, si ruidos de dos canales o sweeps con “dos voces” cubriendo independientemente ambos rangos de frecuencia al mismo tiempo, como estos permiten drenar la energía a ambos altavoces sobre el período entero de la
medición. Sin embargo, solo un sweep de “una voz” permite descartar adecuadamente los productos de la distorsión de la IR recuperada. Por otra parte la señal estereo puede alimentar con mucho mayor nivel, lo que compensa la desventaja del tiempo de emisión restringido en vías individuales.
Obviamente, el espectro de referencia necesario para deconvoluir la señal de excitación recibida no puede ser creado realizando la usual referencia eléctrica de medición.
Haciendo esto, la ecualización del altavoz cuidadosamente introducida podría desaparecer en el resultado final. La única manera viable es construir el espectro de referencia por una simulación descrita en la fig.22. Primero, la excitación de dos canales anteriormente generada es transformada al dominio espectral. Allí es multiplicada con la respuesta del altavoz y la respuesta del sistema de medición. Esta última puede incluir la respuesta del camino eléctrico de la señal (conversores, amplificador de potencia,
preamplificador de micrófono) y la respuesta del micrófono, que podría no ser suficientemente plana. Después de estas operaciones, ambos canales son sumados produciendo una simulación del espectro del nivel de presión en la posición del micrófono (coloreado por la respuesta del camino de recepción). Este espectro es ahora invertido para negar el retardo de grupo y neutralizar el pre-énfasis escogido, si es que fue aplicado. Al invertir el espectro podría producir un énfasis excesivo en frecuencias fuera del rango seleccionado de transmisión, es indispensable una multiplicación con un filtro pasa banda de aproximadamente la misma frecuencia usada en las etapas de preprocesamiento (fig.20).
Para silenciar el ruido efectivo fuera de las bandas, el orden del filtro pasa banda debe ser un tanto mayor que el usado en el pre-procesamiento. La aplicación de este inevitable filtro pasa banda es un paso crítico, lo que significa que son los resultados acústicos de la medición convoluida con su respuesta del impulso. Los efectos resultantes pueden ser un poco inquietantes. Por ejemplo, usando un filtro pasa banda con fase lineal obviamente produciremos un pre-ringing de la IR recuperada de la sala. Para efectos de auralización esto es indeseado. En este caso, es más aconsejable usar un filtro IIR de fase mínima. Por otro lado, un filtro pasa banda de fase lineal puede inducir menos errores en las clásicas evaluaciones de parámetros acústicos de sala. En cualquier caso, el orden del filtro debe ser lo más moderado posible, para mantener la IR del filtro lo suficientemente estrecha.
Generalmente, estas consideraciones se aplican a cualquier medición de acústica de salas de banda ancha. Al menos, la técnica de pre-ecualización activa presentada aquí permite obtener la IR de la sala libre de coloración por mediciones de altavoces y presenta una alta relación S/R independiente de la frecuencia.

5 MEDICIÓN DE DISTORSIÓN

Anteriormente se ha mostrado que los productos de la distorsión armónica pueden ser eliminados completamente de la IR obtenida cuando la medición es hecha usando sweeps. En mediciones de acústica de salas, usualmente estas son removidas si el altavoz no es el objeto de medición. Sin embargo, en mediciones de altavoces, es muy interesante asociarlas con la fundamental para evaluar el porcentaje de distorsión dependiente de la frecuencia. Esto puede ser hecho separadamente para cada armónico, como propone Farina [2]. Para describir la técnica, la fig. 23 muestra el retardo de grupo de un sweep logarítmico y sus primeros cuatro armónicos y la figura 24 muestra la distribución tiempo-frecuencia de la energía de una señal con similar distorsión.

Obviamente, para una determinada frecuencia de la fundamental, todos sus correspondientes armónicos tienen el mismo retardo de grupo. En el ejemplo, la fundamental del sweep llega a 400 Hz después de 2 segundos. Por lo tanto, el armónico de 2° orden intersecta la línea de 2 segundos en 800 Hz, el 3° en 1.2 kHz sucesivamente. Concentrándonos en una frecuencia específica en el diagrama, los armónicos que intersectan esta línea vertical tienen un retardo de grupo menor que la fundamental del sweep, como por supuesto ellos pertenecen a fundamentales con menores frecuencias que han sido “sweepeados” anteriormente. Multiplicando las curvas con el espectro de referencia (que es, restar el retardo de grupo de la fundamental) conduce a removerlos a tiempos negativos mientras la fundamental queda en t = 0 s, como se desea.
Sólo en el caso de sweeps logarítmicos, los armónicos presentarán un retardo de grupo constante independiente de la frecuencia después de la aplicación del espectro de referencia. Podrían ser usados otros retardos de grupo, pero requeriría el uso de un espectro de referencia separado de cada armónico para convertirlas en líneas rectas. Sin embargo, la distancia entre los componentes de los armónicos individuales podría no ser independiente de la frecuencia. Así un sweep logarítmico es preferible como señal de excitación, ecualizando el que ya ha sido usado desde hace mucho tiempo en el antiguo sistema grabador de nivel (1.1).
Una IFFT del espectro deconvoluido produce la actual IR en el borde izquierdo y un par de “armónicos de la IR” (harmonic impulse response, HIR) en tiempo negativos cerca del borde derecho, con la HIR de 2° orden situado en a la derecha y las HIR de mayor orden siguiendo de derecha a izquierda. Esta distancia entre ellos puede ser calculada por:

Para evaluar la fracción de distorsión dependiente de la frecuencia, la señal en el tiempo es separada en la fundamental de la IR y cada HIR mediante ventanas. Cada uno de la HIR aislada es enviado a FFT por separado. El largo del bloque de FFT usado puede ser mucho menor que el usado para la deconvolución inicial de la respuesta del sweep, por esta razón se aumenta la velocidad de todo el proceso. Para relacionar los contenidos de frecuencia de un espectro de HIR con la fundamental, se realiza una operación de cambio acorde al orden del armónico específico. Por ejemplo los componentes espectrales de la HIR de 5° orden son cambiados horizontalmente a un quinto de su frecuencia original. Después de esta operación, el espectro cambiado puede ser dividido en la fundamental produciendo la fracción de distorsión dependiente de la frecuencia (ver fig. 25).
Podría ser aplicada una corrección de -10log(orden del armónico) para compensar el énfasis de las frecuencias altas impuesto por el espectro de referencia. Sorprendentemente, como han expuesto muchos experimentos, esta operación ha de ser omitida para permitir corregir los resultados.

Comparado el estándar de excitación de un tono (single tone) y el análisis con incrementos de frecuencia fija, este método es mucho mas rápido y usualmente establece una mayor resolución de frecuencia, a menos en el rango de medias y altas frecuencias. Sin embargo, no se pueden negar algunas desventajas. Primero que todo, la medición es restringida a ambientes anecoicos, a menos que se usen sweeps muy largos.
Mucha reverberación en el sitio de medición podría conducir a ensuciar los distintos armónicos de la IR por componentes retrasados, impidiendo así su separación. Esto ciertamente es un defecto esencial, como el fuerte de las mediciones de IR es
precisamente la habilidad de rechazar reverberación, con tal que el desfase entre sonido directo y la primera reflexión sea suficientemente largo.
Existen otros problemas relacionados con el uso de ventanas para separar la HIR individualmente. Por supuesto, todos los problemas usuales asociados con el uso de ventanas aplicadas [33]. En particular, la elección del tipo de ventana constituye un compromiso entre el ancho del lóbulo principal, mainlobe width (equivalente a la resolución espectral) y la supresión del lóbulo lateral, sidelobe suppression. Para evitar una pérdida de energía y una subsiguiente subestimación de los componentes de distorsión que no están exactamente situados bajo la parte superior de la ventana, se usa una ventana Tukey-style [33]. Sin embargo este tipo de ventana presenta una pobre sidelobe supresión, de ventana rectangular de sólo 21 dB.
Esto puede llevar a rellenar con señal artificial aquellas regiones de frecuencias en cuales la distorsión cae a valores muy bajos. El suavizado espectral causado por cualquier ventana es constante en una escala lineal de frecuencia. En la usual visualización logarítmica, esto significa que la resolución espectral llega a ser extremadamente alta en altas frecuencias, mientras posiblemente existan detalles deficientes en el final bajo del espectro de distorsión. Si se desea una mayor resolución, el sweep debe ser hecho mas largo para espaciar la HIR, así permitiendo el uso de ventanas anchas.
El ancho de ventana disminuye según la ecuación (15) para separar las HIR de alto orden. Esto conlleva a reducir la resolución del correspondiente espectro de distorsión.
Sin embargo, cuando se comprime a la derecha para relacionar con su fundamental, la resolución queda mayor que la HIR de menor orden. En la práctica, la resolución deseada para armónicos de 2° orden al final del rango de transmisión del altavoz determina la razón del sweep y por lo tanto el largo de la señal de excitación.

Otro problema de la detección rápida de la distorsión es la falta de relación S/R, especialmente para armónicos de mayor orden que usualmente tienen bajos niveles.
Mientras que el método de tonos puros resulta en bastante energía en la fundamental y sus armónicos, la técnica de sweeps dispersa la energía continuamente sobre todo el rango de frecuencias. Este es el porque la distorsión del espectro para armónicos de alto orden tiende a ser bastante ruidoso, esencialmente en altas frecuencias. Para aliviar este problema, es bueno extender el sweep a un largo incluso mayor del necesario para obtener la resolución espectral deseada. Las ventanas pueden ser más angostas de lo necesario para aislar la HIR, de este modo rechazando el ruido de fondo que queda entre ellas.
Finalmente, incluso cuando se toman todas las precauciones para garantizar una alta precisión en la medición, es innegable que a veces, pueden ocurrir diferencias inexplicables entre el método de steady tone y el sweep en algunas regiones de frecuencia. La fig 26 muestra un ejemplo de tal diferencia. Entre 1.3 y 1.7 kHz, el armónico de 2° orden obtenido con ambos métodos es bastante diferente. Las razones para estas diferencias no son obvias, quizás diferentes temperaturas de la bobina del altavoz pueden jugar un papel importante. Después de todo, el método de stepped tone toma mucho más tiempo y por lo tanto produce un aumento de temperatura en la bobina.
A pesar de estas incertezas, las pruebas de distorsión basadas en sweep son muy atractivas, ya que estas son mucho más rápidas que las convencionales con tonos puros.
En pruebas de producción esto no solo permite un chequeo rápido, además permite comprobar el 100% de la producción, incluso si la mercadería es una producción masiva económica.

6 CONCLUSIONES

Las técnicas de FFT usando sweeps como señal de excitación es la opción más ventajosa para casi todas las situaciones de medición de función de transferencia.
Permite alimentar el DUT con mayor potencia con un factor de cresta un poco mayor de 3 dB y son bastante tolerantes contra las variaciones de tiempo y distorsión. Escogiendo un largo de sweep adecuado permite eliminar todos los productos de distorsión.
Además, estos se pueden clasificar en armónicos dependientes de la frecuencia, permitiendo un análisis completo y bastante rápido para todo el rango de frecuencia conjuntamente con la evaluación de la función de transferencia. Cuando el propósito es capturar respuestas impulsivas para auralización, no hay alternativa a los sweeps: El alto rango de 90 dB requerido para este propósito no puede ser obtenido con MLS o mediciones de ruido. Pero incluso en las mediciones RT estándar que no requieren un gran rango dinámico, los sweeps son favorables ya que ayudan a aumentar el rango dinámico hasta 15 dB comparado con mediciones basadas en MLS, usando el mismo amplificador, altavoz y largo de medición. Así existen pocos puntos favorables mediante el uso de MLS. Incluso su característica de ahorrar memoria y tiempo de procesamiento ha perdido completamente relevancia con la tecnología
computacional actual.
Desde el punto de vista de un programador, no incluir la generación de MLS y la transformada de Hadamard, es un ahorro de tiempo de desarrollo de un software de medición.
Aunque obtener funciones de transferencia con MLS puede ser matemáticamente elegante, los autores piensan que el uso de sweeps es elegante desde un punto de vista de la teoría del sistema y señales. Además midiendo con sweeps es más natural.
Después de todo, los murciélagos no emiten MLS para hacer su perfil acústico.

FFT_Medición de Función de Transferencia con sweeps 2

COMPARACIÓN ENTRE SWEEPS Y MEDICIONES MLS

2.1 Duración de la medición

En todas las mediciones, el periodo de captura AD debe ser por lo menos del largo de la respuesta impulsiva (en la practica: el tiempo antes de que la respuesta llegue al ruido de fondo) para evitar errores. Esto es obvio para una medición con pulsos no periódicos.
Toda su energía es emitida al principio, y el conversor DA simplemente muestrea hasta que la respuesta impulsiva decae. En el caso que sean usados sweep no periódicos como señales de excitación, el período de captura debe ser un poco mayor, pero en
general no mucho. Esto gracias a que los sweep comienzan en frecuencias bajas. Con DUTs normales, como altavoces, el mayor retardo de la señal ocurrirá en baja frecuencias. Así, mientras se produce el barrido a través de las altas frecuencias, el
tiempo debe ser suficiente para obtener los componentes retrazados de baja frecuencia.
Para mediciones de altavoces el decaimiento en frecuencias altas es usualmente tan corto que la captación AD puede ser detenida inmediatamente después que la señal de excitación pasa a través de él (siempre que el sweep sea considerablemente más largo que el retardo en bajas frecuencias y por supuesto, observando el tiempo de llegada entre el altavoz y el micrófono). En mediciones de salas acústicas el trozo de silencio siguiente a la emisión del sweep usualmente debe ser mayor que el tiempo de reverberación en altas frecuencias.
En el caso de excitaciones periódicas, el largo del período y el tiempo de captura AD deben ser mayores que el largo de la respuesta impulsiva. Utilizar un largo menor podría provocar time aliasing, que consiste en el pliegue de la parte final de la IR que cruza el periodo con el principio del siguiente, sumando ésta al principio de la IR.
Dependiendo de la cantidad de energía plegada hacia atrás, aparecerán errores más o menos tolerables. Comparado con mediciones de pulsos no periódicos o mediciones con sweeps, la necesidad de emitir la señal de excitación dos veces significa que se requiere
mayor tiempo para la medición. Por otra parte, solo la mitad de la energía total que alimenta al DUT es usada para el análisis.

2.2 Factor de Cresta

El factor de cresta es la relación del voltaje Peak-RMS de una señal expresado en dB. Asumiendo que la medición del sistema o el DUT están limitados por un nivel distinto de voltaje, el valor peak de cualquier señal de excitación considerada, tiene que ser
normalizado a este valor para extraer la máxima energía posible en una medición. El nivel RMS entonces será bajo de acuerdo al factor de cresta. Así, el factor de cresta indica cuanta energía se pierde cuando hay una cierta señal de excitación, comparada con el caso ideal de estimulo cuyo voltaje RMS es igual al voltaje peak (cresta = 0 dB).
Por esta razón, el diseñar señales con un factor de cresta lo más bajo posible se ha convertido en una especie de deporte para los desarrolladores teóricos de análisis de señales.
La suposición que un nivel de voltaje está definiendo el límite superior de una medición, muchas veces es verdadero en mediciones puramente eléctricas (por ejemplo, ecualizadores, mezcladores, etc.). En mediciones acústicas esto es válido sólo cuando el amplificador es el eslabón más débil de la cadena. Aún, muchos amplificadores equipados de una fuente de alimentación basada en una transformación lineal pueden reproducir sobretensiones peaks de 2 o 3 dB más altos que la potencia continua.
La primera restricción es el daño por el sobrecalentamiento de la bobina del altavoz, para este caso la energía total emergente del altavoz es más importante que el factor de cresta. Sin embargo, factores de cresta muy grandes deben ser evitados siempre, ya que
un único peak de nivel puede causar distorsión.
Como primera observación, un MLS mantiene la salida semejante a la señal de excitación ideal. En el sentido de máxima extracción de energía. El valor Peak es igual al valor RMS. Sin embargo, el ideal factor de cresta resultante de 0 dB no puede ser explotado en la práctica. Tan pronto como el MLS salga al mundo real y pase a través de un filtro, la forma de onda rectangular puede cambiar considerablemente.
Especialmente los filtros anti-aliasing abruptos usados en la etapa de oversampling de un conversor DA causan dramáticos overshoot (distorsión). Para evitar esta drástica distorsión causada por los clip en las etapas del filtro, el MLS debe alimentar el conversor DA con un nivel de al menos 5 a 8 dB bajo la escala total, dependiendo de las características del filtro anti-aliasing. Esto quiere decir que el MLS no puede ser emitido libre de distorsión con la misma energía de una señal senoidal con un factor cresta de 3.01 dB.
Pero aún si el MLS es producido por un hardware generador, este no retendrá el favorable factor de cresta por un gran tiempo. Los amplificadores de potencias siempre equipados con un filtro pasa bajos de entrada que rechaza la interferencia de radio, y evita trancientes de intermodulación inducida por altas slew rate de la señal de audio precisamente que prevalecen en abundancia en un MLS no filtrado. Un típico filtro de entrada puede ser un Butterworth pasa bajos de 2° orden con un frecuencia de corte de quizás 40 kHz. El overshoot producido por este filtro es mucho más moderado que el de un filtro anti-aliasing abrupto (fig. 7) pero aún merece consideración.

Existen casos en que algunos nodos internos del DUT restringen el driving level y no los voltajes de la salida del sistema de medición. Por ejemplo, si una resonancia con alta ganancia se encuentra en una etapa de ecualización de la cadena, la señal de excitación debería distorsionar a la salida de esa etapa. En esos casos, los sweeps tienen que alimentar con un nivel más bajo determinado por la ganancia en la frecuencia de resonancia de ese filtro específico. En contraste a esto, el MLS filtrado tiende a tomar una amplitud de distribución gausiana, con un 1% de las amplitudes alcanzando un nivel mayor a 11 dB sobre el valor RMS [13]. En muchas mediciones de altavoces y salas acústicas, aun con la presencia de resonancias moderadas, un sweep puede alimentar con un mayor nivel RMS que un MLS. En la práctica la distorsión ocurre gradualmente, con MLS mucho antes que el nivel de clip del amplificador sea alcanzado. Como será examinado en la sección 2.5

2.3 Rechazo de Ruido

Cualquier principio de medición usando señales de excitación con igual longitud, distribución espectral y energía total conducirá exactamente a la misma cantidad de rechazo de ruido, si es considerado el período entero de la respuesta al impulso sin ventana. Para cada frecuencia la relación S/R solamente depende de la relación de energía de la respuesta del DUT a ese extraño ruido capturado en el período de medición. Las diferencias entre varios métodos de medición simplemente engañan en la manera de cómo el ruido se distribuye sobre el periodo de la IR recobrada. Claramente usando la misma distribución espectral en una señal de excitación requiere la misma coloración invertida en el proceso de deconvolución. Esto explica el porque la magnitud de la fuente de ruido no varía cuando se cambia el tipo de estimulo. Las fases sin embargo serán muy diferentes. Aún, algunos tipos de fuentes de ruido aparecerán similarmente en todas las mediciones, ya que su característica general no es alterada por la manipulación de la fase. Como por ejemplo un ruido de mono frecuencias (hum).
Igualmente el ruido no correlacionado (por ejemplo aire acondicionado) aún aparecerá como ruido.
Sin embargo, cualquier otro disturbio será reproducido bastante diferente, dependiendo del tipo de estímulo. Fuentes de ruido impulsivas, como clicks y pops, serán nuevamente transformados en ruido cuando usamos un ruido como estímulo. En contraste en una medición con sweep ellos llegarán a ser audibles como un sweep invertido en el tiempo. Usualmente ruidos estables son considerados más discretos que otras señales de error. Generalmente, si cualquier ruido aparece inesperadamente, la medición simplemente debe ser repetida, o, si se está promediando eliminar el periodo específico del proceso.

2.4 Variación de Tiempo

Las variaciones de tiempo tienden a aparecer en las mediciones siempre que se realicen sobre una larga distancia exterior, cuando el promedio sincronizado es realizado sobre largo periodos de tiempo, o cuando el DUT en si mismo no es invariante en el tiempo.
El primer caso ocurre en mediciones en estadios, o sitios al aire libre bajo condiciones metereológicas con viento. El segundo se da cuando la relación S/R es muy baja forzando a utilizar muchos cientos o incluso miles de promedios sincrónicos. En
periodos de medición largos, una leve variación de temperatura o movimiento puede frustrar el proceso de promediado. Un tipo de DUT que no sea invariante en el tiempo como cualquier tipo de grabadora análoga.
Es bien sabido que las secuencias de ruido periódicas en general, y en especial los MLS son extremadamente vulnerables a leves variaciones de tiempo. Una considerable cantidad de trabajos teóricos explican estos efectos en detalle [27-29]. Aunque las ecuaciones allí presentadas se ven amenazadoras, en la práctica es fácil comparar los efectos de variaciones de tiempo, estos tienden a tener una errática e impredecible naturaleza. Es probable que dos mediciones al aire libre realizadas en serie estén afectadas por diferentes ráfagas del viento. Sólo una simulación permite evadir esta “variación del tiempo de la variación del tiempo”. La fig. 8 da un pequeño ejemplo.
Una secuencia de ruido y un sweep, ambos con espectro blanco plano, han sido sometidos a una suave variación del tiempo sinusoidal de ±0.5 muestras.  Para simular un jitter, las señales han sido sobre muestreadas por un factor de 256 (sin filtrar, simplemente insertando 255 ceros consecutivos después de cada muestra). Entonces el tiempo exacto de llegada de las muestras ha sido desplazada en un rango de ±128 de acuerdo a la curva sinusoidal de jitter. La alteración resultante del espectro de banda base es insignificante en baja frecuencia, pero este aumenta extremadamente para el espectro de ruido con jitter. Por el contrario el espectro del sweep con jitter sólo muestra una mayor corrugación al final de altas frecuencias, y esto puede ser removido con una suave ventana de suavización.

Otra prueba expresiva es la respuesta de frecuencia de la medición de un grabador análogo, un tipo de maquinas que siempre sufre wow and flutter en alguna proporción.
Como el material de cinta magnética tiende a saturarse mucho antes en altas frecuencias, ha sido aplicado un énfasis de 24 dB en baja frecuencia al MLS y al sweep usados en este experimento. Adicionalmente la envolvente del sweep ha sido hecha a la medida para que decrezca 12 dB sobre los 5 kHz, pero manteniendo la coloración inicial. La sección 4.4 nos revelara como esto es realizado. Ambos estímulos fueron normalizados para que contengan la misma energía y fueron grabados con el mismo nivel de entrada. Como los resultados de la fig. 9 muestran, la respuesta de frecuencia medida usando MLS como excitación es tremendamente ruidosa sobre los 500 Hz.
En la que se utilizó el sweep como estimulo, también se observa la variación de tiempo inducida por la contaminación pero mucho menos extendida. Además de los efectos de deterioración de la variación de tiempo, la distorsión también juega un papel importante en la contaminación de respuesta recobrada de la grabadora análoga. Para minimizar la ínter-modulación producida, el nivel de grabación ha sido ajustado 20 dB bajo la saturación límite en este experimento.
Aun cuando el sistema de medición es virtualmente libre de variaciones de tiempo, el uso de señales de excitación pseudo-ruidosas es desventajoso cuando se realizan ajusten dentro del período de medición (volumen, EQ, otros). En este caso ocurren grandes errores en la visualización de la IR. Los sweep y la medición del impulso no muestran esta molesta reacción a la variación del tiempo y estas son además más agradables de usar para ajustes en mediciones repetitivas.

2.5 Distorsión

Los ingenieros de Hardware de audio se empeñan en optimizar el rango dinámico de sus circuitos que idealmente debe corresponder a nuestro sistema auditivo con valores sobre 130 dB. La relación S/R en mediciones acústicas parece haber sido descuidada por los acústicos en el pasado.
En sitios de relativa calma, es menor el ruido de fondo que limita la calidad de las respuestas de las IR obtenidas, pero muy frecuentemente la distorsión es producida por el altavoz empleado. En cualquier medición usando ruido como señal de excitación, estos productos de excitación serán distribuidos como ruido sobre todo el período de la IR. La razón de esto, es que la distorsión de un estímulo con fase pseudo- aleatoria también tiene mayor o menor fase aleatoria, y también el proceso de deconvolución involucra fases aleatorias que eventualmente producen un espectro erróneo con fases aleatorias, correspondientes a una señal de ruido aleatoriamente distribuida. Como esta señal errónea es correlacionada con la señal de excitación, promedios sincrónicos no mejoran esta situación.
Mientras es verdad que los niveles de ruido dañan relativamente al valor peak de la IR cuando escogemos una secuencia mayor, esto puede ser reducido difícilmente a un valor aceptable. Mediciones de acústica de salas involucran secuencias largas. Por ejemplo, aumentando el largo de un MLS de grado 18 por un factor de 128 podríamos teóricamente reducir el nivel de ruido de un típico valor de –65 dB a –86 dB. Mientras esto puede ser factible en procesos MLS de grado 25 (largo 12min, 42s con 44,1 kHz de frecuencia de muestreo) en un computador equipado con bastante memoria, podría no funcionar bajar el nivel de ruido a este nivel, porque cuando usamos una secuencia tan larga, la vulnerabilidad contra la variación de tiempo es predominante.
En vez de reducir la influencia de la distorsión por un incremento del período de medición, es más beneficioso simplemente excluirla totalmente de la IR recuperada.
Esto puede ser logrado fácilmente por el uso de sweeps como señal de excitación, como se explico en la sección 1.8. La mayor mejora que puede ser realizada en mediciones de acústica de salas por el reemplazo de MLS con sweep es demostrada en la fig. 10.
Ha sido medida la IR de una cámara reverberante usando MLS y sweeps de grado 20, ambos con la misma energía y el mismo pre-énfasis de 20 dB en baja frecuencia. Para la medición con MLS, el volumen ha sido cuidadosamente ajustado para producir una
mínima contaminación a la IR. De hecho, esta búsqueda del óptimo nivel mediante prueba y error es crucial en mediciones con MLS [34], ya que mucha energía produce distorsión excesiva visible por un aumento del ruido de fondo con una estructura abultada, mientras que en bajo nivel conduce al que el ruido de fondo estropee la mayoría de las veces la medición.

Después de este ajuste se pueden realizar 1, 10, 100 promedios sincrónicos con ambas señales de excitación. Es claramente visible en la fig. 10, que cuando no se usan promedios, la IR decae al ruido de fondo que es 5 dB menor en mediciones con sweeps.
La distorsión acumulada queda al final del período de medición. Como el largo de la señal de excitación ha sido escogida al menos 8 veces mayor que el tiempo de reverberación, esta puede ser separada de la actual IR. Realizando 10 promedios sincrónicos, el ruido de fondo se reduce 10 dB cuando se utilizan sweeps. Por el contrario, cundo se usa MLS como señal de excitación, sólo se observa una pequeña disminución del ruido de fondo, demostrando que el producto de intermodulación correlacionada prevalece en la IR recuperada. Realizando 100 promedios sincrónicos no sucede ninguna mejora en una medición con MLS, mientras que en la medición con sweeps se aprecia una disminución, a pesar de que no alcanza los 10 dB esperados. La variación de tiempo debido a la variación de la temperatura podría explicar esto, ya que la medición de 100 promedios toma alrededor de 40 minutos.
En este experimento el nivel de salida ha sido optimizado para el uso con MLS. El nivel del sweep emitido podría haber sido aumentado 15 dB causando una distorsión en el amplificador, y con esto disminuir el nivel del ruido de fondo esta misma cantidad. Así, la relación señal ruido podría haber alcanzado un valor de 100 dB con sólo 10 promedios de sweeps. Por el contrario es imposible conseguir esta calidad con mediciones MLS, independientemente del nivel y del número de promedios.
El altavoz utilizado en el experimento fue una combinación woofer/tweeter para PA de 12 pulgadas optimizado para una mayor eficiencia. Este tipo de parlantes claramente produce mayor distorsión que un sistema de alta fidelidad con suspensiones más suaves
y mejores bobinas, pero incluso con este último, una relación de señal ruido de 90 dB se puede lograr, algo que es inalcanzable con mediciones MLS.
Esto es mostrado con un experimento similar usando un altavoz coaxial de 5’’ con suspensión suave medido en una cámara anecoica con señales de excitación muy pequeñas (fig. 10b). Nuevamente el nivel fue ajustado para alcanzar la óptima relación S/R con el MLS rosado. Alimentado con la misma energía, el sweep rosado produce una mejor relación S/R con sólo una medición. Este nivel ajustado a favor del MLS fue tan bajo que fue posible aumentar 20 dB sin causar saturación en el amplificador de potencia empleado. Haciendo esto, los productos de la distorsión al final del período aumentan considerablemente, pero la relación S/R aumentó aproximadamente a la ganancia adicional del amplificador. Con sólo 10 promedios (largo total de la medición de 3,5 segundos), se alcanzan exitosamente 100 dB.

Además de mediciones acústicas, existen más situaciones de medición en que se requiere linealidad que las mediciones con MLS no satisfacen, como por ejemplo codificadores psico-acústicos. Un ejemplo obvio son los teléfonos celulares que usan una muy alta compresión para obtener bajos bit rate. Experimentos preliminares muestran que señales cortas de excitación producen errores impredecibles y erráticos, independientemente si se usa MLS o sweeps. Aumentando el largo del grado 18 a 44.1 kHz de frecuencia de muestreo entregan resultados más o menos confiables con un sweep (lineal entre 100 Hz y 7 kHz), mientras que la medición con MLS del mismo largo y coloración produce una curva muy rugosa que difícilmente permite reconocer la función de transferencia (fig. 11). Sin embargo, hay que admitir que estos resultados son cuando la respuesta impulsiva es transformada al dominio espectral sin un proceso previo. Aplicando una ventana estrecha con un ancho de sólo 80 ms alrededor del peak mayor alivia la situación bastante (fig.12). Aún así, aparecen sorprendentes diferencias sobre los 2kHz entre las mediciones con MLS y sweeps. El codificador parece producir diferentes resultados para ruido de banda ancha y aparecen señales mono frecuenciales en un corto periodo de análisis.
Otro ejemplo que es más frecuente en aplicaciones de audio que la codificación de baja fidelidad telefónica es la popular compresión MPEG 1 / layer 3. La fig.13 muestra la función de transferencia de codificador para la común razón de 128 Kbit/s, con medición de MLS y sweep. La ventaja del sweep es arrolladora en esta aplicación. De hecho, el ruido de banda ancha que el codificador tiene que tratar cuando un MLS se utiliza como señal de excitación presenta el caso peor para la codificación psicoacústica.
Todas las bandas de frecuencia contienen energía, así ninguna cae debajo del nivel de enmascaramiento que podría permitir omitirla. Consecuentemente, todas las bandas tienen que ser sometidas a una cuantización para obtener el bit rate requerido, resultando en distorsión que perturba significantemente la medición con MLS. Por el contrario, los sweeps se deslizan solo un par de bandas por intervalo de análisis, permitiendo cuantizar con alta resolución mientras se descartan otras que no contienen energía.

Para resumir, cuando medimos la compresión de datos de los codificadores, los sweeps tienen la considerable ventaja de reducir la complejidad de la señal comparado con las secuencias de ruido. Esto convierte la codificación en una tarea sencilla. Mientras que en mediciones “naturales” usando sweeps, la distorsión puede ser aislada y eliminada por el uso de ventanas, la ventaja en mediciones que involucren codificadores parece mentir más en el hecho que la generación de distorsión es simplemente prevenida.

FFT_Medición de Función de Transferencia con sweeps

Medición de Función de Transferencia con sweeps

Comparado a usar señales pseudo-aleatorias, las mediciones de función de transferencia usando sweeps como señal de excitación muestran significativamente mayor inmunidad contra la distorsión y varianza de tiempo. Capturar respuestas impulsivas binaurales de salas con propósitos de auralización de alta calidad requiere una relación señal-ruido mayor a 90 dB que no es factible lograr con mediciones con MLS debido a la no linealidad del altavoz, pero fácilmente alcanzables con sweeps debido a la posibilidad de remover completamente la distorsión armónica. Antes de investigar las diferencias y problemas prácticos con mediciones con MLS y sweeps y discutir porque los sweeps son una mejor opción para la mayoría de las mediciones, serán revisados los métodos existentes para obtener la función de transferencia. Será dirigida la necesidad de usar señales de excitación pre-enfatizadas en mediciones acústicas. Es presentado un método para crear sweeps con contenidos espectrales arbitrarios, pero con envolvente temporal con dependencia de frecuencia constante o prescrita. Es investigada la posibilidad de analizar simultáneamente función de transferencia y armónicos.

– INTRODUCCIÓN

La medición de funciones de transferencia y sus respuestas impulsivas asociadas es una de las tareas más importantes en todas las áreas de la acústica. Está técnica prácticamente es necesaria en todo. Un desarrollador de altavoces chequeara la respuesta de frecuencia de un nuevo prototipo muchas veces antes de la entrega para la producción. Como la respuesta en el eje central no es suficiente para caracterizar un altavoz, es necesario un completo conjunto de mediciones polares de los datos. En acústica de salas, la respuesta impulsiva juega un rol central, ya que una gran cantidad de parámetros acústicos relacionados con la calidad de la percepción pueden ser derivados de ésta. En acústica de locales, el aislamiento del ruido depende de la frecuencia. En vibro-acústica, la propagación de las ondas de sonido en los materiales y la radiación desde su superficie tiene un vasto campo de simulación y verificación de las mediciones con vibradores. También es usada para la detección de reflexiones (sonar, radar) y otras áreas relacionadas a la medición de respuestas impulsivas.
Mientras muchas de estas tareas de mediciones no requieren un excesivo rango dinámico, es diferente cuando se trata de adquirir la respuesta impulsiva de una sala (RIR) para usarla en la convolución de audio en condiciones de campo libre. Debido al amplio rango dinámico de los sistemas de los auditorios y la relación logarítmica entre el SPL y la sonoridad percibida, cualquier anomalía en la parte final del tiempo de reverberación de una RIR es fácilmente reconocible. Esto se siente especialmente cuando pronunciaciones con largas pausas intermedias son usadas para la convolución y cuando los resultados de la auralización son monitoreados con audífonos, como se requiere para “realidad virtual” basada en respuestas binaurales. Con la tecnología digital de hoy, la relación S/R supera los 110 dB, por lo que no parece ser muy osado atreverse a pedir una relación S/R para la adquisición de RIRs que sea como mínimo equivalente a los 16 bit del CD estándar.
Este trabajo ha sido motivado por la constante decepción de las mediciones RIRs basadas en MLS. Bajo condiciones óptimas, con la suposición de ausencia de varianza del tiempo, muy poco ruido de fondo, apropiado pre-énfasis y un número de promedios sincrónicos arbitrarios, parece imposible lograr un rango dinámico superior a ese, supongamos, en un grabador de cinta análogo. En cualquier medición que se utilice ruido como señal de excitación, distorsión (muchas veces inducido por el altavoz) se reparte en todo el período de medición de la respuesta impulsiva, el nivel de ruido resultante puede ser reducido utilizando largas señales de excitación, pero nunca será excluido enteramente. La distorsión puede ser reducida usando un nivel bajo, pero esto conduce a que el ruido de fondo contamine el resultado. Por lo tanto, el nivel comprometido debe ser ajustado arduamente para cada lugar de medición [34], frecuentemente dejando las capacidades del amplificador de potencia y del altavoz poco explotadas.
En contraste, el uso de sweeps como señales de excitación muestra un mejor alcance de esas limitaciones. Usando sweeps algo mayores que la RIR a ser recobrada permite excluir toda la distorsión armónica producida, prácticamente dejando solo el ruido de fondo como limitación para alcanzar la relación S/R. De esta manera los sweeps pueden ser alimentados con una potencia considerablemente mayor en el altavoz sin introducir señales artificiales en la RIR adquirida. Además en condiciones anecóicas la distorsión puede ser clasificada como únicos armónicos asociados a la fundamental, permitiendo la medición simultanea de al función de transferencia y la distorsión en función de la frecuencia. Esta posibilidad es anticipada por Griesinger [1] y descrita por Farina [2] y
será examinada en la sección 5.
Las mediciones basadas en sweeps son considerablemente menos vulnerables a las nocivas varianzas de tiempo. Por esta razón a veces son la única opción para mediciones exteriores de larga distancia bajo condiciones ambientales adversas o mediciones con
grabación analógica.

1 MÉTODOS EXISTENTES

En el siglo pasado se utilizaron diferentes formas de medición de la Respuesta Impulsiva. El punto en común de todas ellas es que existe una señal de excitación (estímulo) que contiene todas las frecuencias de interés para el dispositivo bajo prueba (device under test, DUT). La respuesta del DUT es capturada y de alguna forma comparada con la señal original. Por supuesto siempre existe una cantidad de ruido que reduce la certeza de la medición. Sin embargo, es deseable usar señales de excitación con alta energía para obtener una buena relación señal-ruido en todo el rango de frecuencias de interés. Usando técnicas gating o compuertas para reducir ruido y reflexiones no deseadas, se puede mejorar la relación Señal-Ruido, pero esto produce variaciones no lineales y varianza de tiempo, como comúnmente se observa en mediciones acústicas. Se realizará una breve descripción del comportamiento de los diferentes métodos de medición.

1.1 Grabador de Nivel (Level Recorder)

Uno de los métodos de medición más antiguos de llevar la función de transferencia a un papel ya involucraba sweeps como señal de excitación. La respuesta del DUT a un sweep creado por un generador análogo es rectificada y suavizada por un filtro pasabajo.
El voltaje resultante es llevado a un amplificador diferencial cuya otra entrada es el voltaje derivado por un potenciómetro de precisión que es mecánicamente acoplado a un lápiz de escribir. La salida del amplificador diferencial controla el lápiz que pasa sobre un papel que contiene una escala apropiada. El potenciómetro puede ser lineal o logarítmico, para producir lecturas en el papel de dB. Obviamente este método no necesita circuitos digitales y fue usado como estándar de medición de respuesta de frecuencia por muchos años. La señal de excitación usada es un sweep logarítmico, esto quiere decir que la frecuencia aumenta por un factor fijo por unidad de tiempo. El papel se mueve con velocidad constante, la escala de frecuencia en el papel es correspondientemente logarítmica. El espectro de un sweep logarítmico decae 3dB/oct. Cada octava comparte la misma energía, pero esta energía debe ser repartida sobre un ancho de banda mayor, por lo tanto la magnitud de cada componente de frecuencia disminuye. Una de las ventajas es que la distribución espectral tiene una buena adaptación con el ruido ambiental, resultando una buena relación señal ruido incluso en bajas frecuencias. A pesar que el método de grabador de nivel no puede suprimir el ruido o reflexiones, se
puede suavizar la respuesta reduciendo la velocidad del lápiz. El ripple en una respuesta de frecuencia causado por una reflexión es convertido en un movimiento irregular del lápiz, que puede ser “alisado” de esta simple manera. Si los detalles espectrales son muy confusos por la reducción de sensibilidad del lápiz, se puede corregir reduciendo la razón del sweep para obtener la resolución requerida. De esta manera existe un compromiso entre el largo y la certeza de la medición, al igual que en los métodos
modernos basados en proceso digital de señales.
La deficiencia del método Grabador de Nivel (level recorder) es que no entrega información de la fase y el espectro es almacenado en una hoja de papel, en vez de ser almacenado en un disco duro como otros métodos. Claramente la exactitud horizontal de las frecuencias no es comparable con las de procesos digitales como los basados en clock de cuarzo de los conversores AD-DA. En la escala vertical, la resolución de las lecturas de amplitud en dB están restringidas por la naturaleza discreta de los servopotenciómetros que está compuesto por un número discreto de resistencias de precisión.

1.2 Espectrometría por retardo de tiempo (TDS)

TDS (time delay spectrometry) es otro método para encontrar las funciones de transferencia con ayuda de sweeps, diseñado por Heyser [3-6] especialmente para la medición de altavoces, también es aplicable para las mediciones de acústica de salas o cualquier otro sistema LTI en general. La principal funcionalidad de un analizador TDS se muestra en la fig.1

El analizador muestra un generador que produce dos señales sinusoidales simultáneamente en fase. El seno es llevado al altavoz bajo prueba (LUT, loudspeaker under test) y la respuesta capturada es multiplicada separadamente por ambas señales originales, el seno (para obtener la parte real de la función de transferencia) y el coseno (que tiene un desfase de 90 grados respecto al seno), para obtener la parte imaginaria.
La salida del multiplicador es filtrada por un filtro pasa bajos con frecuencia de corte fija. El multiplicador actúa similar a los mixers usados en etapas de frecuencia intermedia de receivers HF (principio superhet), produciendo la suma y diferencia de las frecuencias de entrada. La suma de los términos de ambas salidas de los multiplicadores es rechazada por el filtro pasa bajos, mientras que los términos de la diferencia pueden pasar dependiendo de su frecuencia. Si ambas frecuencias, la generada y la capturada, son iguales, la frecuencia de salida de la diferencia será mucho menor y de ésta manera no será atenuado por el filtro pasa bajos.
Como el sonido que viaja desde el LUT al micrófono llega con un retardo, su frecuencia momentáneamente será menor que la del generador de señales. Esto causa una diferencia de frecuencia mayor a la salida del mixer que, dependiendo de su frecuencia de corte, será atenuado por el filtro pasa bajos. Por esta razón la señal generada debe tener un “retardo de tiempo” por una cantidad equivalente a la distancia entre el alto parlante y el micrófono antes que sea multiplicada por la respuesta del LUT. De esta manera, la diferencia de frecuencia será cercana a una señal DC. Como sabemos, las reflexiones siempre tendrán un camino mayor que el sonido directo, de esta manera llegaran con una frecuencia instantánea menor, causando mayores componentes de frecuencia en la salida del multiplicador por lo que serán atenuados por el filtro pasa bajos.
Con una selección apropiada de la razón del sweep y la frecuencia de corte del filtro pasa bajos, al utilizar TDS es posible simular mediciones casi en campo abierto. No solo las reflexiones molestas serán atenuadas, también serán atenuados las distorsiones (que llegan con una frecuencia instantánea mayor y producen una frecuencia mayor a la salida del mixer, por lo tanto serán suprimidas por los filtros) y ruidos (gran parte del rango de frecuencias sobre la frecuencia de corte del filtro pasa bajos). La cancelación controlada de las reflexiones es la causa por la cual los analizadores TDS utilizan sweep lineal (df dt = cte como señal de excitación). La diferencia de frecuencia entre el sonido directo entrante y las reflexiones quedarán en su totalidad sobre el rango del sweep, manteniendo la atenuación de cada reflexión independiente de la frecuencia.
Si se utiliza un sweep logarítmico el filtro pasa bajo podría incrementar su frecuencia de corte por un factor constante por tiempo para evitar el estrechamiento de la ventana de tiempo impuesta (el impacto del filtro pasa bajos en realidad es similar a la ventana de
una respuesta impulsiva en los métodos de la FFT). Por otra parte las componentes de altas frecuencias de la típica respuesta de impulso de un altavoz decaerán mucho más rápido que las de baja frecuencia. Así un estrechamiento de la ventana en altas frecuencias (correspondiente a “ventanas adaptativas” propuesto por Rife para los procesos de respuesta impulsiva) serán deseables para muchos escenarios de medición.
Esto podría incrementar la relación señal ruido en altas frecuencias, sin dañar la respuesta impulsiva más que en las bajas frecuencias.
Existen un sinnúmero de inconvenientes asociado con la medición de TDS. El más serio es el hecho de que TDS la utiliza sweep lineales y por lo tanto tiene un espectro de excitación blanco. En muchas configuraciones de medición, esto dejara una pobre relación señal ruido en baja frecuencia. Si todo el rango de audición de 20 – 20 kHz es barrido en 1 segundo, entonces el rango hasta los 100 Hz sólo recibirá energía durante 4 ms. Esto muchas veces es insuficiente en una región de frecuencias donde la salida del
altavoz disminuye mientras el ruido ambiente se incrementa. Para mejorar esta mala distribución de energía espectral los sweeps son hechos muy largos, o las mediciones separadas en dos rangos, por ejemplo bajo y sobre los 500 Hz. Ambos métodos extienden el tiempo de medición mucho más de lo que sería necesario físicamente para el desarrollo de una medición de una resolución espectral particular.
Otro problema es el ripple que ocurre en baja frecuencia. Como previamente se mencionó el multiplicador produce los términos de la suma y diferencia de la señal de excitación “retardada en el tiempo” y la respuesta en camino. En frecuencias altas, la suma es suficientemente grande para ser atenuada por el filtro pasa bajos de salida. Pero en el rango bajo del sweep, donde la suma se aproxima o es menor que la frecuencia de corte del pasa bajos, aparecerá un “golpe” (beating) en la magnitud de la respuesta obtenida. Para remediar esto los sweep pueden ser hechos muy largos y la frecuencia de corte del filtro pasa bajos disminuirá por este mismo factor. Sin embargo el mejor método es repetir la medición con una configuración espejo, que consiste en excitar el
DUT con un coseno en vez de un seno y tratar de capturar la señal como se muestra con las líneas punteadas en la fig.1b. La parte real del resultado complejo de esta segunda medición es añadida a la parte real obtenida en la medición anterior, mientras la parte
maginaria es restada. El efecto de esta operación es que la suma de los términos a la salida del mixer será cancelada, como se muestra en [7-9]. Como una consecuencia, gracias a la ausencia de la interferencia de los términos sumados sobre todo el rango del sweep, las etapas del filtro pasa bajos siguientes del multiplicador pueden ser omitidas. De hecho ellas tienen que ser omitidas si es recuperada una respuesta al impulso completa, un caso en que obviamente el impacto de la atenuación de las reflexiones causado por el filtro pasa bajos no es deseada Ciertamente las mediciones de salas acústicas, en las que siempre implica obtener largas respuestas impulsivas, son solo realizables con el método de excitación doble. Si sin embargo el objeto de interés es un altavoz, se requiere mantener el filtro pasa bajos insertado en orden para rechazar las reflexiones, ruido y armónicos.

Igual que la cancelación de los términos sumados en el método de doble excitación, algún ripple podría aparecer al comienzo y al final del rango de frecuencias del sweep debido al abrupto principio del sweep lineal. Por la teoría de sistemas el comienzo de una señal sinusoidal corresponde a un espectro corrugado cerca de la frecuencia inicial ver fig.15.
Una manera común de enfrentar este problema es permitir que el comienzo del sweep de excitación este muy por debajo de la frecuencia de interés, esto podría implicar comenzar el sweep en frecuencias negativas que en la práctica quiere decir se
comenzará en la correspondiente frecuencia positiva, bajando a 0Hz y después incrementando la frecuencia normalmente [8]. Una mejor posibilidad podría ser formular un sweep de excitación en el dominio espectral para crear una señal que no sufra pérdida espectral (ver fig.16), como se demostrará en el capitulo 4.2.
Por supuesto, es necesario el uso del método de excitación doble para recobrar un completa IR que se extienda más allá del tiempo necesario para completar la medición del TDS. Por otra parte los métodos de FFT o MLS que utilizan estímulos periódicos en la practica requieren una señal de excitación que se emita dos veces para recobrar la respuesta impulsiva periódica. Con estos métodos la respuesta periódica del DUT es capturada sólo en la segunda emisión después de la estabilización. Por el contrario el método de la doble excitación TDS utiliza ambas, lo que atribuye la ventaja de aumentar 3 dB de relación señal ruido sobre MLS, con la misma longitud de excitación (ambos tienen espectro blanco). Con la ausencia del filtro pasa bajos la resolución espectral de la medición TDS es tan alta como con una excitación periódica de una misma longitud de periodo. Así una medición de doble excitación TDS requiere el mismo tiempo que una edición MLS para conseguir la misma resolución espectral, esto contrasta de algunas comparaciones entre TDS y MLS en la literatura [13] en donde se asume un cierto filtro pasa bajo y se calcula una correspondiente resolución de frecuencia, en un intento por demostrar que se necesita un largo sweep para obtener la resolución de una medición MLS sin ventana. Pero por supuesto el impacto del filtro pasa bajo TDS es equivalente a aplicar una ventana para recuperar la IR, y cualquier ventana reduce la resolución espectral. La posibilidad de realizar mediciones simulando campo libre y el efecto de suavizado de las reflexiones es muy bien recibido en las mediciones de altavoces con ambos métodos (al menos en las octavas superiores).
Sin embargo, la relación entre la razón del sweep TDS, la frecuencia de corte del filtro pasa bajos y la atenuación conseguida por las reflexiones tardías no es evidente inmediatamente, a pesar de que no es muy difícil de calcular [10]. Pero es más intuitivo analizar la IR completa derivada por mediciones MLS y FFT (o excitación dual TDS) y posicionar una ventana cuyo lóbulo derecho termina justo antes de la primera reflexión molesta. De esta manera, todas las reflexiones siguientes son eliminadas. En contraste, después de varios ajustes de la frecuencia de corte, TDS no es capaz de suprimir las reflexiones debido a la pendiente limitada de los filtros pasa bajos (permitiendo solo el uso de una versión digital FIR de alto orden). El efecto de suavizado en las funciones de transferencia recuperadas no es muy definido, mientras que el uso de ventanas [33] ofrece un buen y claro compromiso entre el ensanchamiento del lóbulo principal y la supresión del lóbulo lateral.
Usando solamente sweeps en conjunto con análisis FFT, sin multiplicadores produce resultados inmediatos, obviamente muchos problemas inherentes a TDS, especialmente la insuficiencia de energía en bajas frecuencias y los largos ciclos de medición. Sin embargo no pueden ser ignoradas muchas ventajas de las mediciones TDS sobre MLS.
El mencionado aumento de la relación señal ruido en una medición de doble excitación TDS puede ser aumentada aun más tomando ventaja del bajo factor de cresta de solo 3 dB inherente al barrido senoidal. En la práctica, MLS tiene un factor de cresta de cresta de al menos 8 dB como se dará a conocer posteriormente. La medición TDS también ofrece alta tolerancia contra la varianza del tiempo y mejor rechazo a la distorsión armónica que puede ser filtrada junto con el ruido y las reflexiones.

1.3 Análisis FFT de dos canales

El principio básico del análisis FFT de dos canales (dual-channel) consiste en dividir el espectro de salida el DUT con el de la señal de entrada, como en todos los métodos de medición de la función de transferencia basados en FFT. Sin embargo, la fuente de ruido tradicional de los analizadores de dos canales es no determinístico y por lo tanto su espectro no puede ser conocido previamente. Esto influye en capturar y procesar la entrada y la salida simultáneamente.
Aunque esto parece una desventaja en comparación con otras técnicas que solo requieren un canal, el principal inconveniente la FFT tradicional de dos canales es la naturaleza de la señal de entrada comúnmente empleada. Esta usualmente tiene un espectro blanco (o rosado) cuando es promediada por un largo tiempo, pero una foto instantánea del ruido de la señal tiene un espectro corrugado que sufre profundas depresiones de magnitud. Así, un analizador de dos canales debe promediar varias mediciones antes de presentar un resultado confiable. Como en algunos intervalos del análisis, la relación señal ruido es deficiente en algunas frecuencias, estas deben ser eliminadas del proceso de promediado debido a la división de ambos canales, ya que ésta podría provocar un gran error que impedirá mostrar la respuesta de frecuencia.
La detección de la deficiencia de la relación señal ruido comúnmente es realizada por la función de coherencia [12], [13]. Debido a la necesidad de promediar muchos bloques de datos para obtener un resultado consistente, la sensibilidad del análisis de dos canales
es bastante deficiente y la hace poco atractiva para propósitos de ajuste.

En mediciones acústicas tiene que ser conocido el retardo preciso del camino de transmisión acústica, pues la señal directa será retrazada en ésta cantidad de tiempo para analizar los correspondientes trozos de la señal de excitación (ver fig. 12). Además, con el fin de evitar los efectos de pérdida, los bloques de señal considerados en el análisis de FFT deben ser pasados por una ventana. Esta es una importante fuente de error, ya que las componentes retrasadas son atenuadas más que el sonido directo.
El análisis de dos canales puede ser mejorado considerablemente, generando la IR de cada medición mediante la IFFT. El uso de ventanas en la IR ofrece una libertad importante para controlar la cantidad de reflexiones consideradas en el resultado y para eliminar el ruido fuera del intervalo de la ventana, así mejora el proceso de convergencia. No todos los analizadores de dos canales ocupan esta útil característica que no es incluida en la fig.2.
Hay una aplicación bien conocida para el análisis de dos canales que ninguna otra tecnología de medición ofrece: La posibilidad para medir sistemas de sonidos discretamente durante un espectáculo, usando el mismo material del programa como señal de la excitación. Sin embargo, música con distribución espectral impredecible es usualmente una peor señal de excitación que lo ruidos no correlacionados y requiere periodos de promediado incluso mayores para obtener resultados confiables. De este modo, cuando no se necesita ser discreto, es aconsejable usar un generador de ruido como fuente. Se pueden obtener resultados mejores en un tiempo más corto usando señales determinísticas hechas a la medida con técnicas FFT.

1.4 Senos paso a paso (Stepped Sine)

Probablemente el método que ocupa la mayor cantidad de tiempo para obtener la función de transferencia del DUT es la excitación paso a paso (stepped sine) con tonos puros incrementando su frecuencia. La respuesta del DUT a la estabilidad de la excitación puede ser analizada filtrando y rectificando la fundamental, o realizando la FFT y recuperando la fundamental del espectro. El método anterior requiere el uso de un seno que es exactamente periódico dentro de las fronteras de una longitud del bloque de la FFT para evitar una pérdida espectral (leakage). En la práctica, esto solo puede ser realizado generando un seno digital, y emitiéndolo vía el conversor DA que es sincronizado con el conversor AD. Además el método de la FFT permite la completa eliminación de todas las otras frecuencias, por lo que este método es preferido sobre el análisis del dominio del tiempo que involucra filtros pasa banda, con una restringida selectividad y precisión.
Después de cada medición la frecuencia del sweep de excitación es elevada al valor acorde a la resolución espectral deseada. En mediciones acústicas la frecuencia será incrementada por la multiplicación al valor previo por un factor para obtener el espaciamiento logarítmico. Claramente la resolución espectral en las mediciones de stepped sine es baja en altas frecuencias comparada con la obtenida usando una señal de excitación de banda ancha con análisis FFT. Pero no necesariamente es una desventaja ya que la resolución fina es poco usada en altas frecuencias mientras que la pérdida de información en bajas frecuencias, proveída por la FFT en el mismo intervalo de tiempo usado, es más pequeña.
La mayor ventaja del método stepped sine es la enorme relación señal ruido que puede ser obtenida para una medición. Toda la energía es concentrada en una única frecuencia, y la onda senoidal de alimentación tiene un factor de cresta de solo 3dB, permitiendo la estabilidad en un alto nivel continuo. De esta manera, la certeza y repetibilidad para una frecuencia puede ser mucho mayor comparado con una excitación de banda ancha, especialmente cuando usamos la técnica de sincronización de FFT.
Es por esto que a pesar de la considerable cantidad de tiempo para completar la evaluación de la función de transferencia, este método es aun popular para mediciones de precisión y calibración de equipamiento electrónico, o transductores acústicos como
micrófonos. Este método también es estable cuando se requiere precisión para medir la distorsión. Cada armónico puede ser escogido con una alta precisión del espectro de la FFT.
Sin embargo, cuando solamente la función de transferencia es de interés, el método de stepped sine no es bueno. Sólo parte de la energía emitida por el DUT puede ser usada para el análisis, ya que después de cada cambio a una nueva frecuencia, debe ser esperado un cierto tiempo antes que el DUT quede en estado estable. Especialmente cuando existen resonancias de alto Q (correspondiente a largas IR), este tiempo debe ser muy largo para reducir errores a niveles insignificantes. Por otro lado, cuando el sistema es muy ruidoso y deben ser realizados muchos promedios sincrónicos para obtener una mejor certeza en la medición, el tiempo juega un rol menor [14].
En mediciones acústicas con tonos puros, solo es posible eliminar las reflexiones cuando la diferencia de tiempo entre el sonido directo y reflejado es mayor que el intervalo del análisis. Esta es una clara desventaja comparada con los métodos que
recuperan la respuesta impulsiva.
La precisión alcanzable con la medición de un tono (single tone) también debe ser puesta en duda. Debe quedar claro que la misma precisión puede ser obtenida con una medición de banda ancha en un tiempo menor. Mientras las mediciones stepped sine
entregan magnitudes de una única frecuencia con una muy alta relación señal ruido, una medición de banda ancha entrega muchos valores en un intervalo particular de frecuencias. Claramente cada uno de ellos tiene menor certeza, pero realizando una
suavización espectral sobre un ancho correspondiente al incremento de frecuencia usado en la medición de tonos puros, el ruido aleatorio debe disminuir a valores comparables.
Esto, sin embargo, asume que la distorsión armónica producida puede ser totalmente eliminada de la medición de banda ancha, una condición que sólo puede ser realizada por mediciones con sweep, como se dará a conocer posteriormente.

1.5 Impulsos

Usar un impulso como señal de excitación es la manera natural de obtener la IR y también la más sencilla aproximación para el desarrollo de la medición de función de transferencia basada en la FFT. El impulso puede ser creado por medios análogos o preferentemente enviándola por un conversor DA y amplificándola. Este alimenta al DUT cuya respuesta es capturada por el micrófono, amplificada y digitalizada por un conversor AD (Fig. 3). Como el nombre lo indica, esta respuesta capturada ya es la IR deseada, siempre que el estilo del pulso Dirac utilizado tenga una respuesta de frecuencia lineal. Para aumentar la relación Señal-Ruido el pulso puede ser repetido periódicamente, y las respuestas de cada periodo sumadas. Esto permite que la respuesta periódica al impulso (PIR) sea prácticamente igual a la no periódica (IR) si es que esta es más corta que la medición periódica (en la práctica: si la IR se desaparece con el ruido de fondo antes del fin del período). Como es sabido tales promedios sincronizados permiten una reducción de ruido de 3dB cuando el ruido es no correlacionado, relativo a la IR por cada duplicación del número de promedios.

La IR opcionalmente puede ser desplazada a la izquierda (o la PIR desplazada de manera cíclica) para compensar el retardo producido por el tiempo de llegada entre el altavoz y el micrófono de la medición acústica. La aplicación de ventanas elimina
reflexiones indeseadas y aumenta la relación S/R.
La IR puede entonces ser transformada en una función de transferencia por la FFT. Para aumentar considerablemente la precisión de la medición, el resultado debe ser multiplicado por un espectro de referencia. Este espectro de referencia es obtenido por la conexión de la entrada y la salida del sistema de medición e invirtiendo la función de transferencia medida. Aplicando esta técnica (independientemente del tipo de la señal de excitación) ofrece la libertad de realizar un pre-énfasis de la señal de excitación para adaptarla a las contribuciones espectrales del ruido de fondo. Este pre-énfasis será automáticamente eliminado del resultado de la función de transferencia aplicando el espectro de referencia obtenido en todas las mediciones subsiguientes.
Los impulsos son una simple y no tan mala manera de medición cuando es puramente eléctrica (cuando no hay un camino acústico en la cadena de medición) y la medición debe ser lo más rápida posible. Sin embargo, ellos requieren un bajo nivel de ruido de fondo del DUT para obtener certeza razonable de la medición. Cuando se miden equipos de audio con bajo nivel de ruido, este requerimiento es fácilmente obtenido. A pesar de que se encuentra lejos de la opima relación S/R los impulsos igualmente pueden ser usados en acústica. En una cámara anecoica donde el ruido ambiente es bajo en altas frecuencias, los tweeters pueden ser medidos con una razonable relación S/R.
Debido a su brusquedad, los pulsos, pueden alimentar con un alto voltaje el cono del altavoz, sin considerar el posible daño de sobrecalentamiento. Se debe tener consideración de no causar una excursión en el rango no lineal del altavoz (aunque esto puede ser provocado con un pulso muy estrecho [15]), esto causará que la amplitud sea más pequeña que la esperada y por lo tanto conducirá una aparente pérdida de sensibilidad [16].
Generalmente toda la distorsión en una medición por pulso ocurre simultáneamente con la IR y por lo tanto no puede ser separada de esta. Para aumentar la relación S/R de la medición de un tweeter los impulsos pueden ser repetidos y promediados en intervalos pequeños, cuando la IR recuperada es muy corta y requiere una resolución de frecuencia lineal bastante baja.
Las pruebas impulsivas no permiten identificar la distorsión pero son bastante inmunes contra los efectos perjudiciales de la variación del tiempo, no como las mediciones MLS o basadas en ruidos para ambientes exteriores. Esto es simple, no requieren un sofisticado procesamiento de señal y trabajan muy bien para ciertos tipos de medición.
Es por esto que han sido un método muy popular [15], [17]. Cuando se disponen de bastantes amplificadores de potencia, el aumento de la relación S/R usando señales de excitación extendidas en el tiempo comparadas con la medición de un pulso, no es tan grande como se esperaba, ya que el altavoz generalmente puede ser alimentado con pulsos de alto voltaje. La ganancia de relación señal ruido disminuye favoreciendo a las mediciones con pulsos, cuando se considera la distorsión en la IR obtenida por
mediciones con ruido, como MLS.

1.6 Secuencias de máxima longitud (MLS)

Las señales MLS (maximum length sequences) son secuencias binarias que pueden ser generadas de una manera muy fácil con un N-staged shift register y una compuerta XOR (con hasta 4 entradas) conectada con un shift register (alternador de registro) de
tal manera que todos los 2N estados son posibles, menos el caso de “todos 0” [18]. Esto puede ser logrado con un hardware con pocos y simples TTL-IC o por un software con menos de 20 líneas de código assembler.

En los tiempos en que el código MLS fue popular, la posibilidad de crear secuencias por hardware estaba restringida por la memoria. En los ’80 la memoria máxima en un PC IBM 8088 era de 640 KB. Claramente el tener que almacenar largos arreglos de datos para capturar y procesar la respuesta del DUT era un gran inconveniente. Hoy en día esta desventaja no es tal, ya que con la tecnología existente es mucho más fácil crear secuencias MLS por software y sacar la señal de salida desde la memoria a través de un conversor DA del sistema de medición.
Como el caso “todos cero” de la secuencia está excluido, la longitud de la secuencia MLS es 2N-1. Aunque se pierde un valor para tener un bloque de longitud exacto para una FFT, MLS tiene propiedades únicas que los hacen convenientes para la medición de la función de transferencia. Su autocorrelación, es muy cercana de un pulso Dirac, indicando un espectro blanco. Reiterado periódicamente como un tren de pulsos, todas las componentes de frecuencia efectivamente tienen la misma amplitud, por lo que su espectro es perfectamente blanco. Comparado a un pulso de la misma amplitud, mucha más energía puede alimentar al DUT ya que la señal de excitación es alargada sobre el periodo entero de medición. De esta manera aumenta la relación S/R.
Normalmente, un MLS no se hace salir como tren de pulso, pues éste significaría la alimentación de energía muy pequeña al DUT subsiguiente. En vez de esto, la salida del hardware generador MLS generalmente se mantiene constante entre dos pulsos de clock. En el caso del hardware generador de MLS, existe una pérdida de apertura sin(x)/x en fs/2 de al menos 4dB que debe ser compensada posteriormente. Cuando se emite MLS por un conversor DA usando oversampling, el cual es el estándar de hoy, el espectro será plano hasta le frecuencia de corte de filtro digital. En el caso de conversores más baratos, se puede introducir un notable ripple sobre toda la banda de paso. Estas ondulaciones de frecuencia lineal están siempre presentes hasta cierto punto en el oversampling de los conversores de audio. Estás se originan de la fase lineal del filtro FIR anti-alias. Estos son fabricados por medio del algoritmo Parks-McClellan [19], viendo el ripple de banda contra la banda de detención. Además ellos son prácticamente
siempre diseñados como filtros de media banda que dividen en dos el cálculo de potencia requerida, pero exhiben una atenuación de solamente 6,02 dB en fs/2. Es por esto que siempre existe una pequeña región de aliasing inválida en las cercanías a la frecuencia de Nyquist cuando la medición esta hecha con conversores de audio. El filtro anti-alias también induce a un fuerte salida de MLS por lo que no pueden ser usados con todo el nivel. En el capitulo 2.2 se clarificara este tema.
Señales de excitación con espectro blanco permiten el uso de la correlación cruzada para recuperar la respuesta impulsiva del sistema. Mientras normalmente, una correlación de cruce se desarrolla más eficientemente en el dominio espectral por una multiplicación complejo-conjugado, la conocida transformada de Hadamard (FHT, fast Hadamard transformation) puede desarrollar esta tarea para señales MLS sin dejar el dominio del tiempo. Nosotros omitiremos la teoría que existe detrás de esto ya que ha sido desarrollada y explicada muchas veces, por ejemplo en [18], [20-23].
El algoritmo Butterfly que ha sido empleado en la FHT solo usa sumas y restas y puede operar con los datos enteros entregados por el conversor AD. Anteriormente esto significaba que el desarrollo de estos cálculos era mucho más corto que el de una FFT de similar longitud.
Pero hoy día esta diferencia ha disminuido considerablemente. Los procesadores modernos como la familia de Pentium II pueden desarrollar adiciones, multiplicaciones y sustracciones de punto flotante tan rápido como las respectivas operaciones de
números enteros.
En década de los 80 la propiedad time-saving de la trasformada de Hadamard fue muy bien recibida, a pesar de que los cálculos de la respuesta al impulso en una sala de un gran ancho de banda aun consumían muchos segundos. La ventaja llegó a ser especialmente prominente sólo cuando la IR era de interés, y no la función de transferencia asociada. Esto, por ejemplo, mantiene la evaluación del tiempo de reverberación por la integración hacia atrás de la respuesta impulsiva [24]. En estos casos sólo se requiere de una FHT para transformar la respuesta MLS capturada por el micrófono en la deseada PIR. Esta FHT es más rápida que una FFT. Por el contrario usando una señal de ruido arbitrario, o un sweep como estimulo, requiere al menos una FFT y una IFFT para obtener la IR. Sin embargo, el tiempo de procesamiento ya no es una preocupación debido a los poderosos procesadores de hoy en día, las
transformaciones pueden ser desarrolladas más rápidas que en tiempo real.

Por ejemplo el procesamiento de un MLS de grado 18 (longitud del periodo de 6 segundos a 44,1 kHz de frecuencia de muestreo, una típica longitud para mediciones de ancho de banda en ambientes reverberantes) se completa en sólo 138 ms en un Pentium III/500, usando un 32-Bit-integer Radix-4 MMX-FHT particionado en sub chunks acomodados en los tamaños de 1° y 2° nivel caché. Esto abarca la permutación necesaria antes y después del algoritmo Butterfly y una búsqueda de peak. Una FFT calculada con números reales [11] para la misma longitud, también usando sub chunks anidados, que puede ser procesado enteramente en el caché termina en el doble del tiempo (280 ms), esto es aún mucho menor que el periodo de la medición.
Independientemente del principio de la medición hoy día es posible transmitir la señal de excitación continuamente y completar los cálculos y mostrarlos actualizados dentro de cada periodo, incluso para dos canales de entrada. Para mediciones de cortos períodos se obtiene buenos resultados de una medición en tiempo real, ya que pueden ser manipuladas enteramente en el caché. Por supuesto el número de operaciones por cada muestra de salida también disminuye levemente según la razón del grado (por ejemplo una FFT de grado 12 solo necesita dos tercios de las operaciones por cada muestra de salida que en una de grado 18).
En una medición basada en MLS la FHT es el primer paso de procesamiento de la señal, después de la digitalización por el conversor AD (fig. 4).
La respuesta al impulso obtenida puede ser desplazada de forma cíclica y se puede aplicar una ventana como
con una simple prueba impulsiva. Si la función de transferencia es la que se desea observar, se debe realizar una FFT adicional. Pero como los MLS tienen una longitud de 2N-1 una muestra tiene que ser insertada a la respuesta al impulso para que la longitud
sea de 2N. Mientras que computacionalmente esto es una acción trivial, hay que tener cuidado con el lugar donde se pone esta muestra. Esto debe ser una región en donde la Ir haya decaído cercano a cero para evitar grandes errores.
Cuando usamos una ventana, la muestra puede ser localizada en el área silenciada. La función de transferencia obtenida nuevamente puede y debe ser corregida por la multiplicación con un espectro de referencia obtenido previamente por una medición de
respuesta del sistema.

La medición MLS es bastante popular en mediciones acústicas, pero tiene bastantes desventajas. Tiene una alta vulnerabilidad contra la distorsión y la variación del tiempo (estas serán comparadas directamente a las mediciones con sweep en el capitulo 2), pero la más lamentable propiedad del MLS es su espectro blanco. Como será demostrado en el capitulo 3, un espectro no blanco es deseable en casi todas las mediciones acústicas.
Este requerimiento puede ser obtenido por la coloración del MLS con un énfasis apropiado. Claramente el MLS perderá su característica binaria por el prefiltrado. Así que esta técnica es viable si el prefiltrado del MLS se hace a la salida por un verdadero
conversor DA, no solo una etapa de conmutación de un bit, como utilizan algunos antiguos hardware-analizadores basados de MLS. Estos últimos son confinados al postfiltro análogo para enfatizar el MLS, pero estos no ofrecen la versatilidad de los filtros
FIR como una fase lineal, o compensación de la propia respuesta del sistema de medición [25].
La creación del MLS enfatizado puede ser hecha eficientemente por medio de la transformada inversa de Hadamard (IFHT) [25], [26]. La IFHT simplemente es la inversión en el tiempo de la respuesta al impulso del filtro de énfasis deseado (reducido a 2N-1 muestras), aplicando una FHT normal en la IR invertida y entonces nuevamente invertimos el resultado anterior. Esto produce una MLS periódica convolucionada con el filtro de énfasis. Debido a la periodicidad, cada componente discreta de frecuencia de la anterior MLS puede ser influenciada independientemente tanto en amplitud y fase.
Cuando usamos como estimulo un MLS enfatizado, en vez de MLS puro, obviamente la respuesta al impulso obtenida por la FHT consistirá en la IR del DUT convolucionada con la IR del filtro de énfasis. Para mediciones acústicas esto es significativo pues dará a la señal de excitación un fuerte estimulo en frecuencias bajas probablemente de unos 20 o 30 dB, como será demostrado mas tarde. En este caso la respuesta al impulso obtenida puede ser más ancha que la medición solamente con el DUT. Este ensanchamiento frecuentemente restringe la realización de la ventana, especialmente cuando las reflexiones que serán silenciadas están cerca del peak principal. En estos casos aplicando una ventana “pre-comp” (pre compensación) a la respuesta impulsiva no ecualizada atenuará la energía de bajas frecuencias extendida en el tiempo. Así que es mejor la aplicación de una ventana “post-comp” (post compensación), lo que significa una posterior transformación de la IR no corregida al dominio espectral, multiplicándola con la respuesta inversa de un filtro de énfasis, y eventualmente trasformándola al dominio del tiempo. Esto producirá la respuesta al impulso sólo del DUT a la cual se le puede aplicar ahora ventanas con menos pérdidas de energía en bajas frecuencias.

Si la función de transferencia es el resultado deseado de la medición, otra FFT será desarrollada después de la aplicación de la ventana de la respuesta al impulso compensada (fig. 5). Así que el número de las transformaciones es en total una FHT y tres FFT cuando se realiza la medición de la función de transferencia con MLS preenfatizado y aplicando ventanas post-comp de la respuesta impulsiva.

1.7 Señales periódicas de longitud 2N

Examinando a fondo la configuración de la medición MLS en la fig. 5, revela que actualmente el uso de MLS y la aplicación de la FHT son bastante innecesarios. Si sólo la señal de excitación tiene 2N muestras en vez de 2N-1 como las MLS, la respuesta del DUT puede ser transformada directamente al dominio espectral, omitiendo la FHT, y esto puede ser implemente multiplicando con el espectro de referencia (la multiplicación de la inversa del espectro de la señal de excitación por la respuesta de frecuencia del sistema de medición). Como esta multiplicación es una operación compleja, no sólo la magnitud, sino también la fase son corregidas para producir la verdadera función de transferencia compleja del DUT, independientemente de la naturaleza de la señal de excitación. Al desarrollar una IFFT en este espectro compensado, se producirá la verdadera respuesta al impulso del DUT (fig. 6).
Cuando comparamos esta técnica (FFT, compensación, IFFT) a la FHT queda claro que esta es lejos más poderosa y flexible, permitiendo el uso de señales arbitrarias de longitud 2N. La única restricción es que la señal de excitación debe tener la suficiente cantidad de energía en todo el rango de frecuencias de interés.
La FHT, siendo un algoritmo de la correlación cruzada, puede modificar simplemente las fases de una clase especial de señal de excitación, particularmente MLS. Esta operación es la “compresión de pulso” al MLS por medio de una convolución con el correspondiente “filtro acoplado” (matched filter). En contraste, la aproximación de la FFT compensa la fase y la magnitud de cualquier señal de excitación ya sea ruido, sweeps o cortos fragmentos musicales. Esta operación es algunas veces referida como el “filtraje mal acoplado” (mismatched filtering). Aunque en contraste con el matched filter, este no está restringido a señales de excitación con espectro blanco. La única restricción obvia es que la señal de excitación debe tener la suficiente energía sobre todo el rango de frecuencias de interés para evitar ruidos en la función de transferencia obtenida.

Claramente el desarrollo de 2 FFT consumen más tiempo de procesamiento que una única FHT, pero con los poderosos microprocesadores de hoy en día, esta desventaja es insignificante. Como nosotros hemos visto, usando MLS pre-enfatizados, y la
aplicación de ventanas post-comp (fig. 5) conduce, incluso, a tiempos levemente más largos de cálculo que usando señales arbitrarias de longitud 2N.
La técnica se asemeja al viejo análisis FFT de dos canales, pero se diferencia de esta en que la señal de la excitación es conocida por adelantado. Por lo tanto, su espectronecesita ser calculado solo una vez y se puede utilizar en todas las mediciones siguientes. Esto evita la necesidad de un segundo canal, o si esta presente de todos modos, permite analizar dos entradas simultáneamente. Una ventaja adicional es el hecho de que la precisión obtenida de un analizador de FFT de un canal supera a cualquier analizador de dos canales. Con lo último, cualquier diferencia de la respuesta de frecuencia en la entrada de los dos canales, se reflejara en la respuesta de frecuencia medida del DUT. Por supuesto los fabricantes de analizador de dos canales se esfuerzan
por hacer que estas diferencias sean lo más pequeñas posibles. Sin embargo, creando un archivo de referencia, por el reemplazo del DUT con un cable, hace que la señal de excitación pase exactamente por las mismas etapas, lo que garantiza una alta precisión.
Incluso con cualquier equipamiento, puede ser obtenida una certeza de 1/1000 dB o mejor en una medición eléctrica pura. El voltaje de referencia de la fuente, incluidos los modernos conversores AD y DA, son lo suficientemente estables para permitir esta certeza (cuando ocurre una tendencia de calentamiento, la medición de la referencia puede ser rápidamente repetida). Sin embargo, puede haber errores de la fuente debido a las impedancias de las etapas análogas de entrada y de salida. La salida de impedancia del DA debe ser lo suficientemente baja para prevenir una perdida del voltaje generado cuando lo conectamos al voltaje de salida del DUT. Estas condiciones rara vez se dan cuando usamos simples tarjetas de sonido sin amplificadores de salida.

Aún, la gran característica de un análisis de un canal, es el uso de una señal determinística en contraste a la fuente de ruido no correlacionada, normalmente usada en el analizador de FFT de dos canales. Como establecimos antes, el anterior tiene un espectro estable cuando es promediado a lo largo del tiempo, pero en un único snapshot la señal de ruido sufre pérdidas en la magnitud. De esta manera el analizador de dos canales tiene que ser promediado durante muchas mediciones antes de entregar un correcto resultado. Por el contrario, los estímulos determinísticos usados en los métodos de la fig. 6 pueden ser creados a la medida definiendo una magnitud arbitraria del espectro libre de caídas, adaptándola al ruido de fondo predominante, para lograr una independencia de la frecuencia en la relación S/R. De acuerdo al tipo de señal deseada,la correspondiente fase del espectro puede ser construida de muchos modos diferentes.
Una señal ruidosa puede ser generada fácilmente por la configuración de sus fases como valores aleatorios. La señal de excitación es obtenida por la IFFT. Repetida periódicamente esta tendrá exactamente la magnitud del espectro previamente definido (por ejemplo plano o rosado). Señales ruidosas tienen propiedades similares a las MLS, especialmente lo que consiste en su vulnerabilidad contra la distorsión y la variación del tiempo. Algunas personas se refieren a las señales ruidosas como “señales sinusoidales múltiples”, pero por supuesto cualquier señal que no sea pura es una señal de múltiples senos.

Como el espectro predefinido de una señal de ruido es sólo valido para una repetición periódica, la medición o puede ser comenzada inmediatamente después de encender el estimulo, al menos tiene que ser esperado un tiempo correspondiente a la longitud de una respuesta al impulso para que la respuesta del DUT se estabilice. Como la longitud de la IR no siempre es conocida de antemano, resulta práctico ejecutar simplemente dos periodos de la señal de excitación. La adquisición de la señal sólo comienza en la
segunda partida, al igual que las mediciones MLS. Similarmente, solo la mitad de la energía emitida es usada para el análisis en una sola medición (single shot). Por otra parte, la periodicidad nuevamente permite la manipulación completamente independiente de cada componente de frecuencia. Por ejemplo, podemos seleccionar una única frecuencia para realzar o atenuar reduciendo o mejorando la energía de la señal en la banda particular de frecuencias.

1.8 Sweeps no periódicos

En vez de aleatorizar las fases para obtener una señal de ruido con la forma espectral deseada, la fase del espectro también puede ser ajustada para producir un incremento en el retardo de grupo. La IFFT revelará un sweep en vez de una señal ruidosa. Por varias razones los sweep son una bastante mejor elección para la medición de la función de transferencia que una secuencia de ruido. Primero que todo, en contraste a lo último, el espectro de un único sweep no repetido es idéntico comparado a su repetición periódica.
Los sweeps tienen que ser enviados a la salida solo una vez y la respuesta del DUT puede ser inmediatamente capturada y procesada. Así que la duración de la medición se reduce a la mitad, manteniendo en la misma resolución espectral y la relación S/R como un estimulo periódicamente repetido. Las diferencias restantes de menor importancia en el espectro del sweep repetido y no-repetido no son importantes, pues son reflejadas y canceladas más adelante por la medición de referencia que también utiliza el barrido norepetido.
La otra enorme ventaja de la medición con sweep es el hecho de que las componentes de la distorsión armónica, pueden ser completamente eliminadas de la IR obtenida.
Estas aparecen en los tiempos negativos donde ellas pueden ser separadas completamente de la IR actual. De esta manera la respuesta al impulso queda intacta de la energía de la distorsión. Por el contrario, mediciones que utilizan ruido como estímulos inevitablemente tendrán una distribución de la distorsión producida sobre todo el período.
La razón por la que la distorsión es rechazada puede ser explicada con el siguiente ejemplo:
Consideremos un sweep que recorre desde los 100 Hz después de 100 ms y llega a 200 Hz en 200 ms. Para comprimir esta señal de excitación en un pulso Dirac, el espectro de referencia necesita tener un correspondiente retardo de grupo de –100 ms en
100 Hz y –200 ms en 200 Hz. Cuando una frecuencia momentánea es 100 Hz y el DUT produce armónicos de segundo orden, una componente de 200 Hz con el mismo retardo de la fundamental de 100 Hz estará presente en la respuesta del DUT, ésta componente
de 200 Hz será tratada con el retardo de grupo de –200 ms del espectro de referencia a 200 Hz y por lo tanto aparece –100 ms después del proceso de deconvolución, así los armónicos de alto orden aparecerán en “tiempos negativos mayores”.
Para colocar realmente los productos de la distorsión en los tiempos negativos de la respuesta impulsiva obtenida, sería conveniente realizar una deconvolución lineal para señales no periódicas. En vez de esto, también es posible mantener la operación de FFT
normal y la multiplicación de referencia como es usada en las mediciones con estímulo periódico, con la condición de que el sweep de la excitación sea considerablemente más largo que la respuesta al impulso del DUT o sean insertados ceros para rellenar la
respuesta al sweep del DUT para doblar la longitud (fig. 6b). En ambos casos, la distorsión producida aparecerá al final de la respuesta impulsiva obtenida, donde ellos pueden ser interpretados como portador de tiempos negativos. Estos pueden ser removidos sin afectar la actual respuesta al impulso, como en el primer caso, se encontrará en la última parte del ruido de fondo, y en el segundo caso, cualquier información causal no se puede encontrar en está región.

Sin embargo, en ambos casos significa que como primer paso de procesamiento de señales se requerirá un largo de bloque de FFT mayor para la resolución espectral empleada. Para lograr capturar la respuesta al impulso de alta calidad en salas, es recomendable la utilización de sweeps que sean considerablemente mayores que la IR, está es la mejor manera de aumentar la relación S/R y disminuir la influencia de la variación de tiempo.
Hay una importante diferencia que concierne al ruido de fonde de la IR obtenida por una deconvolución lineal y circular. Usando una deconvolución circular resulta un ruido de donde que es básicamente constante en distribución de amplitud y frecuencia, sobre
el punto donde aparece el primer efecto de distorsión. Sin embargo, la deconvolución lineal produce un decaimiento del ruido que es progresivamente filtrada en bajas frecuencias hacia el final. Esto se debe al hecho de que la última parte del resultado de la deconvolución originada del ruido estable convolucionada con un sweep en orden inverso (por ejemplo desde altas a bajas frecuencias). El usuario debe tener conciencia de este efecto y no confundir la disminución del ruido de fondo con la parte final del
tiempo de reverberación de la sala.
El periodo de adquisición de datos en mediciones no periódicas debe ser lo suficientemente largo para capturar todos los componentes retardados. Esto significa que el sweep siempre debe ser más corto que el período de captura y el largo de FFT siguiente. En mediciones acústicas de salas, es muy beneficioso que el tiempo de reverberación para altas frecuencias sea usualmente mucho mas corto que el de baja frecuencia. Así el sweep debe ser cortado solo el tiempo correspondiente a la reverberación de alta frecuencia, permitiendo que longitud del sweep sea suficiente para que la reverberación de bajas frecuencias quede atrás de las componentes de alta frecuencia.

Resonadores de Helmholtz

Resonadores de Helmholtz

Se describe un experimento que permite medir la velocidad del sonido con un error inferior al 5%. El dispositivo consiste en un resonador de Helmholtz con simetría cilíndrica, en este caso se utiliza una botella. El sistema es análogo a una masa vibrando en un resorte: la frecuencia de resonancia está relacionada con la masa del tapón de aire situado en el cuello de la botella y sus proximidades, y con la constante del resorte, asociada a la elasticidad del aire que llena el resto de la botella. Se detalla un procedimiento simple y una discusión de las aproximaciones que en éste están involucradas. Además, se analiza el comportamiento general del resonador más allá de la frecuencia fundamental.

I. INTRODUCCIÓN

Al excitar la masa de aire en el interior de una botella, puede obtenerse una nota musical. Este fenómeno ocurre en botellas de forma arbitraria y corresponde a una oscilación forzada diferente a la que presenta un simple tubo, se trata en este caso de un resonador de Helmholtz. En estos dispositivos, la oscilación del aire que se encuentra en el cuello de la botella provoca la compresión y descompresión del aire del cuerpo. Si las dimensiones del resonador son pequeñas comparadas con la longitud de onda del sonido , el gradiente de presión en el cuerpo de la botella es cercano a cero. Los cambios de presión en la botella se deben a las propiedades elásticas del gas en su interior y proveen la fuerza restauradora que actúa sobre el tapón de aire (análogamente a una masa y un resorte).
A continuación se describe un experimento que permite medir la velocidad del sonido usando como resonador una botella parcialmente llena de agua. Se detallan las aproximaciones utilizadas en el mismo y se exhiben los principales resultados obtenidos. Se realiza, además, un estudio del resonador más allá de su frecuencia fundamental.

II. DESCRIPCIÓN TEÓRICA DEL OSCILADOR

Por simplicidad consideraremos que la botella está formada por dos cilindros rectos de sección circular y diferente diámetro, como se indica en la Figura 1. La frecuencia angular de una masa vibrando en un resorte es:
ω² = k/m (1)
donde k es la constante del resorte (en este caso, relacionada con las propiedades elásticas del gas en el cuerpo de la botella) y m es la masa del tapón de aire.
Si la densidad del gas es ρ y el volumen del tapón es v, su masa es m=v.ρ. La constante del resorte puede ser determinada por el cambio de presión que sufre el tapón debido al resto del gas. La fuerza que siente el tapón es F=a.Δp, donde a es el área del cuello de la botella y Δp es la diferencia de presiones entre el interior y el exterior de la botella. Este cambio de presión se puede
referir a un cambio en el volumen del gas a través de la compresibilidad del mismo:

Κ= -(1/V)(ΔV/Δp) (2)
V y ΔV se refieren al cuerpo de la botella. Si el aire en el el cuerpo cambia en una cantidad ΔV=a.Δx y la fuerza resultante en el tapón es:

F= -(a²/KV) Δx = -kΔx (3)
Como la velocidad del sonido se puede escribir en términos de la compresibilidad del gas,

c²= 1/(Κρ) (4)
resulta ω² = a²c²/(vV) = (a/A).(c²/ l.L) (5)

donde se utilizó v=a.l y V=A.L. (el reemplazo de v y V por l y L simplifica el análisis).
La ecuación (5) no está restringida a secciones circulares. La aproximación de separar el problema en una parte completamente inercial (cuello) y otra completamente elástica (cuerpo) puede ser testeada con este experimento. Trabajando con la ecuación (5) se obtiene:

L’=L+ l = ac²/(4π²lA).1/f² + l (6a)

siendo f la frecuencia fundamental. Análogamente, en términos de volúmenes, queda:

V’=V+v = a²c²/(4π²v).1/f² + v (6b)
La ecuación (6a) indica que la profundidad de la superficie de agua en la botella varía linealmente con f²

La pendiente de dicha recta determina la velocidad del sonido y la longitud de l está dada por la ordenada al origen. Se espera que la longitud del tapón de aire sea superior a la del cuello de la botella. Esto se debe a que la botella tiene el extremo superior abierto y por lo tanto hay una contribución del aire situado sobre y debajo del cuello, al tapón vibrante. En otras palabras, un volumen adicional de aire de longitud Δl y sección a se extiende por encima y por debajo de los límites físicos del cuello de la botella y contribuye al tapón de aire.
Al medir L’desde la boca de la botella, parece que se estuviera ignorando una de estas longitudes adicionales la correspondiente al aire por encima de la botella.
Puede verse que esto no es cierto de la siguiente forma. Supóngase que se ignora una pequeña parte del volumen de la botella. Entonces, se subestima la energía total del sistema. Como en un ciclo de oscilación las energías cinética y potencial del sistema son iguales, se espera que en ese ciclo la subestimación de esas cantidades sea
también igual. Los promedios de las energías son:

= (1/2)mv² = (1/4)ρvω²uo²

= (1/2)Kx² = (1/4)(ρac²/V).uo²donde la uo es la amplitud. Puede suponerse que el efecto de esta subestimación aparece como un cambio en el volumen del tapón de aire, v, o en el volumen del cuerpo, V. Dejando constante la frecuencia de oscilación y utilizando la ecuación (5), sale que:

1 = (Δ)/(Δ
) = (Δv/v)/(ΔV/V)

Luego, las subestimaciones en el volumen del tapón y en el volumen del cuerpo de la botella deben ser iguales. Como Δv + ΔV = a Δl (el volumen ignorado), resulta Δv = aΔl /(1+V/v) y ΔV = aΔl /(1+v/V) . Como V es generalmente mucho mayor que v, ΔV tiende a aΔl y Δv tiende a cero.
Ignorar el volumen aΔl sobre el cuello de la botella significa que el volumen del cuerpo de la botella fue subestimado en una cantidad mayor que la cantidad en que fue subestimado el volumen del tapón de aire.
El método de resonador de Helmholtz determina la longitud efectiva del tapón de aire, incluyendo prácticamente todo el aire adicional en ambos extremos. Como la subestimación de Δv se vuelve insignificante al crecer V, este modelo funciona mejor para los L’ más grandes dentro del cuerpo de la botella.

III. DESCRIPCIÓN DEL ARREGLO EXPERIMENTAL
Se utilizó una botella parcialmente llena de agua (el nivel de agua es el que determina la longitud L’). En la boca de la botella se colocaron un parlante y un micrófono, tal como se indica en la Figura2.El parlante fue conectado a un generador de funciones que enviaba una onda senoidal al interior de la botella. Se utilizó un osciloscopio de dos canales para recibir la señal del generador de funciones y la señal captada por el micrófono.
Fijada una cierta amplitud para la onda senoidal, se varió su frecuencia . De esta forma, para una cierta longitud L’, es posible hallar las frecuencias de resonancia de la botella. Se trabajó en un rango de frecuencias de 10 a 6.000 Hz, confeccionando la curva de resonancia correspondiente a un dado L’. Se realizaron mediciones tanto en el cuerpo como en el cuello de la botella. Las áreas del cuello y del cuerpo (a y A) fueron calculadas colocando un volumen de agua conocido y midiendo el incremento en el nivel del líquido.

IV. RESULTADOS
-Parte A: Modelo de ‘resonador de Helmholtz’ (frecuencia fundamental)
Parámetros característicos de la botella:
.área del cuerpo A=(19.3 ± 0.3)cm²
.área del cuello a=(2.5 ± 0.1)cm²
.longitud del cuello l=(9.00 ± 0.05)cm

El gráfico 2 muestra cuán apropiado resulta aproximar la botella por dos cilindros. Se grafica el volumen efectivo de la botella (V’) en función de la distancia desde su boca hasta la superficie de agua (L’).
La recta A está dada por V’= a.L’ y la recta B por
V’=AL’- π(R²-r²).l.
Del gráfico se obtiene
a = (2.60 ± 0.07)cm² y A= (19.1 ± 0.2)cm².

Para las mediciones realizadas en el cuello de la botella, es decir cuando L’< l , es aplicable el modelo de un tubo con un extremo abierto y uno cerrado en la superficie del agua.
Teniendo en cuenta que la longitud efectiva L*= L’+ Δl del tubo es superior en un cierto Δl a la longitud medida, dado que el antinodo de desplazamiento se encuentra desplazado en dicho Δl del extremo abierto, y obteniendo ese Δl de la parte A, resulta:

-Parte C: Otras frecuencias de resonancia.
Trabajando en el cuerpo de la botella, las frecuencias de resonancia halladas mantienen una relación lineal con el n° de modo n. A continuación se grafican ,para cada L’, todas las frecuencias de resonancia medidas. Este gráfico será tratado con más detalle en la “Discusión de resultados”.

La fórmula (7) puede reescribirse de la forma
fn (L’) = (2n+1)/4 . c/L* (8)
o sea, que para n fijo f es una función lineal de c/L*.
Realizando estos gráficos para cada n entre 1 y 4, no se obtienen rectas en ningún caso sino polinomios de grado 5.

V. DISCUSIÓN DE RESULTADOS

La velocidad del sonido obtenida en cada caso está dentro del valor esperado (para ambas botellas y trabajando en el cuello de la primera de ellas). La longitud del tapón de aire (l arrojado por los gráficos 1 y 3) es superior a la longitud del cuello, de acuerdo a
lo previsto por el modelo teórico.
Con estos datos se pudo averiguar el valor de Dl para cada una de las botellas para ser luego utilizado en el resto del trabajo,
pues sólo es válido utilizar L’sin corrección para el modelo de resonador de Helmholtz según fue explicado en la Descripción teórica del resonador.
El gráfico 2 (V’vs L’) muestra cuán apropiado resulta aproximar la botella por dos cilindros. Las curvas A y B representan los volúmenes de cada uno de ellos. El volumen de la botella es lineal con L’, para niveles de agua por debajo del cuello. Por esta razón, al trabajar en el modelo de resonador de Helmholtz, sólo se utilizó L’>l (siendo l la longitud del tapón de aire).
La frecuencia angular de resonancia está dada por ω²=k/m. De acuerdo a lo expuesto en la Descripción teórica, m es la masa del tapón de aire y k está relacionado con el volumen V del cuerpo de la botella. Por esto, en el gráfico 4, para un volumen V fijo, la frecuencia de resonancia es mayor para la botella de cuello más corto pues en ella -dado que los cuellos de ambas botellas tienen la misma área a- la masa m que oscila es menor.
Lo que importa es el volumen del resonador, y no su forma (para una determinada área del cuello). Esto fue comprobado experimentalmente ladeando la botella en resonancia. De este modo se cambió la forma del volumen pero no éste en sí; y el sistema no se apartó de la condición de resonancia.
En cuanto al estudio de las frecuencias siguientes a la fundamental para L’ en el cuerpo de la botella, se probaron dos modelos que no funcionaron. Ellos son:

1- Suponer que la onda sonora sólo se propaga en el cuello de la botella, donde tiene ambos extremos abiertos. Esto implica fn=n.(c/2l), pero las rectas f(n) no tienen ordenadas nulas

2-Suponer que la onda se propaga primero en un tubo con ambos extremos abiertos (cuello), y luego en un tubo de extremos abierto y cerrado (cuerpo).
Esto implica f1n = n.(c/2l) para el primer tubo y f2n = (2n+1).(c/4L) para el segundo.
Tampoco funciona, pues para cada L’debería verse el conjunto completo de las f1n, que no dependen de L’, y esto no sucede.
De acuerdo a al bibliografía consultada, las frecuencias superiores a la fundamental son relativamente altas y los correspondientes modos de vibración no son independientes de la inercia del aire en el interior de la cavidad (cuerpo de la botella). Por lo tanto, se propuso un modelo que tuviera en cuenta a la botella como un todo: tubo con un extremo abierto y otro cerrado. Como se ve en la Parte C, este modelo tampoco ajusta a los valores medidos.
Es importante destacar dos hechos llamativos en dicha parte del trabajo:

-el gráfico 6 muestra un comportamiento complejo para las frecuencias, lo cual también se aprecia en las curvas de resonancia. Hay un cierto doblete, es decir, las frecuencias f2 y f3 están muy próximas entre sí, y lo mismo ocurre con f4-f5 y con f6-f7, pero sin seguir un patrón evidente. Dicho comportamiento se hace más notorio en los L’ más grandes, y se va perdiendo a medida que éste disminuye. Para los niveles de agua más cercanos al cuello, las fn se van equiespaciando.

-al graficar f(L*)para n fijo, no se obtuvieron rectas como predice el modelo de tubo abierto, sino que las curvas son muy bien ajustadas por polinomios de orden 5 y no por ningún otro polinomio de orden menor. Esto implicaría que, dado n, f es un polinomio de orden 5 en c/L*.

VI. CONCLUSIONES
La velocidad del sonido fue hallada por dos métodos diferentes: mediante el modelo de resonador de Helmholtz aplicado al cuerpo de la botella y con el modelo de tubo abierto aplicado al cuello de la botella. El porcentaje del error obtenido con cada método es
aproximadamente igual (3.7% para el cuerpo y 3.1% para el cuello). Con respecto a la medición, los métodos son idénticos: se usa el mismo dispositivo y se procede de la misma forma. Cada uno de los métodos tiene ciertas ventajas respecto del otro:

-el método del cuello permite obtener c a partir de la recta L* (1/fo) en una forma más inmediata que la que da c de la recta L’(1/fo²) en el cuerpo.

-para el modelo de Helmholtz sólo es posible usar la frecuencia fundamental mientras que para el modelo de tubo abierto, c se puede
obtener trabajando con cualquiera de las frecuencias.

-para un mismo esfuerzo de medición, el modelo del cuerpo arroja más información que el del cuello pues, además de c, da la longitud del tapón de aire, de donde saca Δl, mientras que en el modelo del cuello, hay que estimar Δl para poder hallar c.

-si bien el procedimiento experimental es el mismo en ambos casos, el método del cuerpo requiere medir las áreas del cuello y el cuerpo, mientras que en el otro método, estos datos no son necesarios. Se puede concluir que si el único objetivo es medir c, convendría utilizar un tubo (teniendo en cuenta el cálculo de Δl), pero si además se busca conocer en forma precisa dicho Δl, entonces convendría trabajar con un resonador.

Por otro lado, los resultados correspondientes al modelo de resonador de Helmholtz (velocidad del sonido, longitud del tapón de aire, estudio comparativo de dos resonadores diferentes) se ajustan perfectamente a éste.
Esto, sumado a gráficos y mediciones ya mencionadas, destinadas a evaluar la validez de las aproximaciones ( gráfico 2, medición con la botella ladeada), indican que dichas aproximaciones son suficientes dentro de los objetivos del trabajo. Por esta razón, efectos de borde -boca de la botella y transición entre el cuerpo y el cuello- pueden ser ignorados trabajando bajo las aproximaciones mencionadas.
Queda sin resolver el problema de hallar un modelo que prediga los resultados experimentales hallados para las
frecuencias del resonador superiores a la fundamental.
Este trabajo puede servir de base para un estudio profundo en la búsqueda de dicho modelo, pues contiene los datos experimentales necesarios, descarta algunas posibilidades y muestra funciones que -aún sin explicar la relación entre los distintos modos- logran
ajustarlos individualmente.

VII. APÉNDICE
*nota: todos los ajustes lineales fueron realizados con el método de cuadrados mínimos mediante el soft Origin 3.5

Acústica Capítulo 5 Efectos del ruido en el hombre

Efectos del ruido en el hombre

5.1. Introducción
El excesivo nivel sonoro, ya sea éste el resultado del ruido molesto de una maquinaria industrial o de la música más excelsa, tiene efectos nocivos para el hombre que han sido detalladamente estudiados por investigadores de todas partes del mundo. Es importante recalcar que tanto la música como el ruido de una fábrica tienen similares efectos nocivos cuando sus niveles sonoros son elevados. El cerebro los discrimina, pero el oído, que es quien sufre el daño, no.
Una cualidad del mundo moderno es, precisamente, la de que a causa del vertiginoso crecimiento de la tecnología, se ha incrementado el nivel sonoro ambiental, que hoy se reconoce como un contaminante más. Una consecuencia indirecta de esto es la tendencia a escuchar música con niveles excesivos, lo cual trae aparejados diversos problemas, como afecciones nerviosas, somáticas y auditivas.

5.2. Efectos no clínicos
El primer efecto es la molestia. A modo de criterio general, puede afirmarse que el nivel de confort auditivo se da hasta los 70 a 80 dBA, dependiendo del tipo de sonido, la motivación para escucharlo, y las características personales de quien lo escucha. Por
encima de 120 dBA se percibe dolor además de un sonido ensordecedor.
En relación con la eficiencia en el trabajo, se observa que la misma se reduce ante un ruido repentino o inusual, pero al volverse éste repetitivo el individuo se acostumbra y recupera la eficiencia. Esto es especialmente cierto para el caso de los trabajos manuales o que no requieren una gran elaboración intelectual. Las tareas intelectuales se ven más afectadas por el ruido que las físicas.
Uno de los efectos más notorios del ruido o los sonidos intensos es la interferencia a la palabra, lo cual crea dificultades para la comunicación oral. Esto a su vez lleva a las personas a elevar la voz, forzando sus cuerdas vocales.

Por otra parte, por encima de los 90 dBA desaparece la alta fidelidad, ya que las propias distorsiones del oído impiden una escucha fiel de la música. Dichas distorsiones son, en parte, resultado de una contracción muscular refleja dentro del oído medio que actúa como mecanismo de protección del sistema auditivo. Otra razón es que los sonidos de nivel tan elevado enmascaran mucho más a los sonidos más débiles, con lo cual desaparece toda sutileza. Esto muestra lo inútil de llevar el nivel sonoro muy por encima de este valor.

5.3. Efectos clínicos no auditivos
Se han descripto numerosos efectos clínicos (efectos que se manifiestan a través de síntomas o patologías) no auditivos del ruido. Entre ellos pueden citarse la hipertensión arterial pasajera, las taquicardias, las cefaleas, el nerviosismo, el estrés, la reducción del rendimiento físico y la pérdida de la concentración y de la atención. También hay variaciones del ritmo respiratorio, disminución de la secreción salival y del tiempo de tránsito intestinal. Por último, se producen afecciones de la garganta como resultado de forzar la voz.
A partir de estudios epidemiológicos se han comprobado incrementos significativos en la incidencia de ataques cardiacos, neurológicos, digestivos y endócrinos, los cuales llegan a ser hasta 4 veces más frecuentes en la población expuesta a ruidos muy intensos, como sucede en las zonas aledañas de los aeropuertos.
Los sonidos intensos inciden también en el sentido del equilibrio, a través de dos mecanismos. El primero son las vibraciones intensas que se producen en el órgano sensor del equilibrio, que está muy próximo al oído interno y comunicado con él. El segundo es la interferencia entre las señales nerviosas de los dos sistemas, dado que los respectivos nervios están muy próximos. Esto repercute en el control del equilibrio, llegando a producirse mareos e inestabilidades ante la exposición prolongada a sonidos muy intensos (por ejemplo ante la escucha de música excesivamente fuerte, lo cual suele suceder en las discotecas y otros locales bailables).

5.4. Efectos auditivos
El efecto sobre la audición humana ha sido una de las primeras consecuencias de los niveles sonoros excesivos que se estudiaron. Las investigaciones se realizaron aprovechando datos obtenidos en ambientes laborales. La consecuencia más notoria es la pérdida de audición. Esta dolencia, conocida como hipoacusia, sobreviene ante la exposición a ruidos extremadamente fuertes aún cuando sea durante poco tiempo, o ante la exposición reiterada a lo largo del tiempo a ruidos no tan intensos. Ejemplos del primer caso son las explosiones, bombas de estruendo, o disparos de armas de fuego sucedidas cerca de una persona, sin mediar ningún tipo de protección auditiva. El segundo caso se da por lo general en ambientes laborales, aunque también se puede dar en el interior de vehículos, en ambientes con música muy fuerte, y ante el uso del walkman, discman o de radios portátiles con auriculares, ya que en general el usuario ajustará el volumen de modo de contrarrestar el ruido ambiente (ya bastante elevado), enmascarándolo.
La pérdida auditiva se determina midiendo, por medio de una audiometría, cuánto sube el umbral auditivo en cada frecuencia respecto al considerado normal (ver capítulo 2, sección 2.4), teniendo en cuenta que el aumento del umbral significa que hace falta más nivel de presión sonora para percibir la presencia de un sonido. Luego se promedian los valores a 500 Hz, 1 kHz y 2 kHz, obteniéndose la pérdida auditiva promedio,
PAP. Se considera que hay hipoacusia, o incapacidad auditiva, cuando la PAP supera los 25 dB, ya que se ha comprobado que a partir de esta cifra comienzan las dificultades para la comprensión de la palabra.
Se define el riesgo de la exposición a determinado nivel de ruido de origen laboral durante un tiempo dado como el porcentaje de las personas expuestas que adquieren algún grado de incapacidad auditiva menos el porcentaje de las personas no expuestas que adquieren el mismo grado de incapacidad. Se toma esta diferencia para eliminar los casos de presbiacusia (es decir la pérdida gradual de la audición con la edad), y conservar sólo aquellos atribuibles exclusivamente a la exposición al ruido.
En la Tabla 5.1 se indican los porcentajes de personas no expuestas a ruidos importantes que adquieren incapacidad de acuerdo al criterio anterior, en función de la edad, es decir, la distribución estadística de presbiacúsicos.

La Organización Internacional de Normalización (ISO, International Organization for Standardization) ha emitido una norma, la ISO 1999, que proporciona los riesgos (según la definición anterior) en función del nivel sonoro laboral promedio en dBA, y los años de exposición, como se indica en la Tabla 5.2 (los datos consignados corresponden a la primera edición de la ISO 1999). A los efectos de calcular el riesgo de acuerdo con la definición dada, se considera que la vida laboral comienza a los 20 años
de edad.

El nivel sonoro promedio se calcula sobre 8 horas diarias y 6 días por semana. Si la jornada laboral es de menos horas, se resta al nivel real 3 dBA por cada reducción a la mitad, y lo mismo para cada reducción a la mitad de la semana laboral. Por ejemplo, si un disc jockey trabaja 4 horas por día y 3 días por semana (es decir, la mitad de horas y la mitad de días) sometido a 106 dBA, equivale a 106 – 3 – 3 = 100 dBA para la tabla anterior, y por lo tanto después de 10 años de actividad el riesgo de sufrir daño auditivo
irreversible es de un 29%. Vemos, entonces, que para los 100 a 110 dBA que en promedio hay en las discotecas, salones de fiestas, conciertos de rock, etc., el riesgo de sufrir hipoacusia en pocos años es muy alto. Por esta razón el técnico de sonido (en especial el disc jockey y quien hace sonido en salas o exteriores) está expuesto a ver deteriorado uno de sus sentidos más preciados y laboralmente más imprescindibles: el oído. Esto implica la necesidad de trabajar siempre con protectores auditivos, ya sean del tipo de los tapones (de siliconas, de lana mineral, etc.) o del tipo de copa (auriculares, orejeras, etc.), los que utilizados
sistemáticamente reducen los riesgos considerablemente.
Los valores de la tabla anterior han llevado a la mayoría de los países a promulgar reglamentaciones por las cuales se exige que en ambientes laborales no se exceda un nivel promedio de 90 dBA (lo cual en realidad brinda una protección relativa, porque hasta un 21% de los sometidos a este nivel sonoro puede desarrollar hipoacusia). En la República Argentina, la ley que se aplica es la Ley de Higiene y Seguridad en el Trabajo,
Nº 19.587. En general cada país cuenta con legislación propia que regula la máxima exposición a ruido laboral admisible, pero en general los límites para una jornada de 8 horas oscilan entre 85 dBA y 90 dBA. La tabla muestra que cuando el nivel de ruido es inferior a los 80 dBA el porcentaje de personas afectadas más allá de lo atribuible a la presbiacusia no es significativo.
Por otra parte, la Agencia de Protección Ambiental (EPA, Environmental Protection Agency) de los Estados Unidos, ha concluido que una exposición permanente (24 horas diarias) a un nivel de ruido de 70 dBA o bien una exposición de carácter laboral (8 horas diarias) a 75 dBA aseguran que un 96% de la población no sufrirá mayores daños auditivos que los correspondientes a la propia presbiacusia.

5.5. Evolución de la sordera profesional
La sordera profesional, inducida por ruido o sonidos de nivel muy alto, comienza perjudicando la audición de las altas frecuencias. El sonido pierde brillo, y más adelante empiezan a perderse las frecuencias imprescindibles para comprender la palabra. Es de notar que la percepción de la música se ve afectada mucho más tarde, ya que la comprensión de la música es mucho menos crítica que la de la palabra. Después de una exposición no muy larga a niveles muy altos, por ejemplo durante 2 horas a 100 dBA, se produce una hipoacusia temporaria, es decir que después de unas horas de descanso auditivo desaparece, volviendo la audición a niveles normales.
Sin embargo, la calidad de la audición poco después de la exposición es un fiel reflejo de lo que será la audición después de unos años de someter reiteradamente el oído a estos niveles. En otras palabras, la hipoacusia sigue, a largo plazo y de forma irreversible,
evolución similar que al principio se da temporariamente.

Acústica Capítulo 4 Acústica Arquitectónica

Acústica Arquitectónica

4.1. Introducción

La Acústica Arquitectónica estudia los fenómenos vinculados con una propagación adecuada, fiel y funcional del sonido en un recinto, ya sea una sala de concierto o un estudio de grabación. Esto involucra también el problema de la aislación acústica.
Las habitaciones o salas dedicadas a una aplicación determinada (por ejemplo para la grabación de música, para conferencias o para conciertos) deben tener cualidades acústicas adecuadas para dicha aplicación. Por cualidades acústicas de un recinto entendemos una serie de propiedades relacionadas con el comportamiento del sonido en el recinto, entre las cuales se encuentran las reflexiones tempranas, la reverberación, la existencia o no de ecos y resonancias, la cobertura sonora de las fuentes, etc.

4.2. Ecos

El fenómeno más sencillo que tiene lugar en un ambiente con superficies reflectantes del sonido es el eco, consistente en una única reflexión que retorna al punto donde se encuentra la fuente unos 100 ms (o más) después de emitido el sonido. Se produce después de un tiempo t relacionado con la distancia d a la superficie más próxima por la expresión:

donde c es la velocidad del sonido, es decir 345 m/s. El factor 2 se debe a que el sonido mrecorre de ida y de vuelta la distancia entre la fuente sonora y la superficie. De esta fórmula se deduce que para tener un eco la superficie más próxima debe estar a unos 17 m. Cuando hay dos paredes paralelas algo distantes se puede producir un eco repetitivo.

4.3. Reflexiones tempranas

Cuando la fuente sonora está rodeada por varias superficies (piso, paredes, techo) un oyente recibirá el sonido directo, y además el sonido reflejado en cada pared. Las primeras reflexiones recibidas, que se encuentran bastante separadas en el tiempo, se
denominan reflexiones tempranas. Esta situación se ilustra en la Figura 4.1.

En salas no demasiado grandes, las primeras reflexiones están bastante cerca en el tiempo unas de otras, de manera que no se llegan a percibir como eco.

4.4. Ambiencia

La distribución en el tiempo de las reflexiones tempranas crea la sensación de ambiencia, es decir la sensación que permite al oyente identificar auditivamente el espacio en el que se encuentra. Las personas no videntes desarrollan una especial habilidad
para interpretar la información espacial contenida en la ambiencia. Arquitectónicamente, el control de la ambiencia se puede lograr mediante un cuidadoso diseño que involucra trazar, sobre un plano de la sala, “rayos” acústicos similares a los de la Figura 4.1, medir cuidadosamente sus recorridos, y de allí determinar los tiempos de llegada de las correspondientes reflexiones. Hoy en día este trabajo se realiza con el auxilio de computadoras digitales y programas adecuados.

4.5. Absorción sonora

Las superficies de un recinto reflejan sólo parcialmente el sonido que incide sobre ellas; el resto es absorbido. Según el tipo de material o recubrimiento de una pared, ésta podrá absorber más o menos el sonido, lo cual lleva a definir el coeficiente de absorción sonora, abreviado con la letra griega a (alfa), como el cociente entre la energía absorbida y la energía incidente:

El coeficiente de absorción tiene una gran importancia para el comportamiento acústico de un ambiente, y por esa razón se han medido y tabulado los coeficientes de absorción para varios materiales y objetos. En general, los materiales duros, como el hormigón o el mármol, son muy reflectores y por lo tanto poco absorbentes del sonido, y en cambio los materiales blandos y porosos, como la lana de vidrio, son poco reflectores y por consiguiente muy absorbentes.
En la Tabla 4.1 se dan los valores de a para varios materiales típicos de construcción, objetos y personas (ya que las personas también absorben el sonido). Se proporcionan para varias frecuencias, ya que a depende bastante de la frecuencia. En general la absorción aumenta con la frecuencia, debido a que para frecuencias altas la longitud de onda es pequeña y entonces las irregularidades de la superficie o el propio espesor del material son más comparables con la longitud de onda. En algunos casos, sin embargo, algún fenómeno de resonancia entre el material y la pared puede mejorar la absorción en bajas frecuencias.

4.6. Tiempo de reverberación

Después del periodo de las reflexiones tempranas, comienzan a aparecer las reflexiones de las reflexiones, y las reflexiones de las reflexiones de las reflexiones, y así sucesivamente, dando origen a una situación muy compleja en la cual las reflexiones se densifican cada vez más. Esta permanencia del sonido aún después de interrumpida la fuente se denomina reverberación. Ahora bien; en cada reflexión, una parte del sonido es absorbido por la superficie, y otra parte es reflejada. La parte absorbida puede transformarse en minúsculas cantidades de calor, o propagarse a otra habitación vecina, o ambas cosas. La parte reflejada mantiene su carácter de sonido, y viajará dentro del recinto hasta encontrarse con otra superficie, en la cual nuevamente una parte se absorberá y otra parte se reflejará. El proceso continúa así hasta que la mayor parte del sonido sea absorbido, y el sonido reflejado sea ya demasiado débil para ser audible, es decir, se extinga. Para medir cuánto demora este proceso de extinción del sonido se introduce el concepto de tiempo de reverberación, T, técnicamente definido como el tiempo que demora el sonido en bajar 60 dB por debajo de su nivel inicial (se ha elegido 60 dB porque con esa caída se tiene la sensación de que el sonido se ha extinguido completamente).
En algunas publicaciones se suele representar también este valor con el símbolo RT60, formado por la sigla en inglés de reverberation time (tiempo de reverberación), seguida por la referencia a los 60 dB. Otra abreviatura es T60.
Como ejemplo, si al interrumpir un sonido de 90 dB éste se reduce a 30 dB en 3 s, entonces será T = 3 s. Salvo para sonidos inicialmente muy intensos, antes de caer 60 dB el sonido se vuelve inaudible por quedar enmascarado por el ruido de fondo oruido ambiente.
El tiempo de reverberación depende de cuán absorbentes sean las superficies de la sala. Así, si las paredes son muy reflectoras (es decir que reflejan la mayor parte del sonido que llega a ellas), se necesitarán muchas reflexiones para que se extinga el sonido, y entonces T será grande. Si, en cambio, son muy absorbentes, en cada reflexión se absorberá una proporción muy alta del sonido, por lo tanto en unas pocas reflexiones el sonido será prácticamente inaudible, por lo cual T será pequeño. Dado que los materiales
duros, como el hormigón o los azulejos, son poco absorbentes del sonido, un ambiente con paredes de este tipo tendrá un tiempo de reverberación largo. Una sala cubierta con materiales absorbentes como cortinados, alfombras, etc., por el contrario,tendrá un tiempo de reverberación corto.

Tabla 4.1. Coeficientes de absorción de diversos materiales en función de la frecuencia (según varias fuentes).Los valores no suministrados no estaban disponibles.

La propiedad anterior se puede expresar por medio de una fórmula, denominada fórmula de Sabine, en honor al físico norteamericano que la obtuvo a principios de este siglo. Según dicha fórmula el tiempo de reverberación T puede calcularse como:

Dado que, según vimos, los coeficientes de absorción a dependen de la frecuencia, resulta también que el tiempo de reverberación depende de la frecuencia.En general, los recintos están formados por diversos materiales, cuyos coeficientes de absorción no tienen por qué ser iguales. Si una sala tiene una parte S1 de su superficie con coeficiente a1, otra parte S2 con coeficiente a2, … y por último una parte Sn con coeficiente an, entonces:

4.7. Tiempo de reverberación óptimo

Varias investigaciones realizadas evaluando las acústicas de las mejores salas del mundo (según la opinión de las audiencias o usuarios y de expertos) han revelado que para cada finalidad existe un tiempo de reverberación óptimo, que aumenta al aumentar
el volumen en m3 de la sala. En la Figura 4.2 se muestra el resultado de uno de estos estudios. Debe aclararse que no hay coincidencia entre los resultados presentados por diversos investigadores, aunque cualitativamente son similares.

En general, se observa que la palabra requiere menores tiempos de reverberación que la música, debido a que la parte más significativa de la palabra son las consonantes, que son a la vez débiles y más cortas que las vocales. En consecuencia, con un tiempo de reverberación alto las vocales se prolongan demasiado, enmascarando a las consonantes que les siguen, lo que reduce la inteligibilidad de la palabra. La música, por el contrario, se beneficia con un tiempo de reverberación considerable, ya que éste permiteempalmar mejor los sonidos y disimular pequeñas imperfecciones de ejecución, a la vez que aporta una espacialidad que es deseable en la música. Como ejemplo de aplicación, supongamos un pequeño teatro de 10 m de ancho por 12 m de fondo por 6 m de altura, que va a ser utilizado para obras de teatro. El volumen de la sala será:

lo cual significa, eligiendo la curva b de la Figura 4.2, que el tiempo de reverberación óptimo será de 0,45 s. De la fórmula del tiempo de reverberación es posible calcular el valor de a necesario para obtener este tiempo óptimo:

Este valor es bastante elevado, lo cual significa que el tratamiento acústico resultarácostoso, situación bastante común en la arquitectura acústica. El tratamiento acústico suele ser casi tan costoso como la construcción del edificio.

4.8. Campo sonoro directo y reverberante

Un segundo elemento que interviene en la acústica de un ambiente es cómo se distribuye en él el campo sonoro. Por campo sonoro se entiende el valor que adquiere la presión sonora en cada punto del espacio. A los efectos del análisis, el campo sonoro se divide en dos componentes: el campo directo y el campo reverberante. El campo directo contiene la parte del sonido que acaba de ser emitido por la fuente, y que por lo tanto aún no experimentó ninguna reflexión, y el campo reverberante, en cambio, incluye el sonido después de la primera reflexión. Estas dos componentes tienen comportamientos muy diferentes. El campo directo disminuye con la distancia a la fuente, y lo hace a razón de 6 dB por cada duplicación de la distancia. Así, si a 1 m de una fuente sonora se mide un nivel de presión sonora de 80 dB, a 2 m (el doble de 1 m) tendremos 74 dB; a 4 m (el doble de 2 m) habrá 68 dB; a 8 m (el doble de 4 m) existirá un campo directo de 62 dB, y así sucesivamente.
El campo reverberante, en cambio, es constante en los ambientes cerrados, como habitaciones, salas y otros recintos. Esto se debe a que el sonido sufre multitud de reflexiones, y todas ellas se superponen entre sí, resultando una distribución prácticamente uniforme del sonido.
En el descampado, donde el sonido puede propagarse libremente sin que se produzcan reflexiones, sólo existe la componente de campo directo. Por esta razón, el nivel de presión sonora disminuye rápidamente con la distancia. Así, una persona hablando normalmente a 50 m se escuchará sólo muy débilmente. En un ambiente cerrado, en cambio, si bien muy cerca de la fuente predomina el campo directo, a cierta distancia predomina el campo reverberante.
En la Figura 4.3 se ilustran ambas componentes de la presión sonora y el campo sonoro resultante de la superposición de ambas. Existe una distancia denominada distancia crítica que limita las regiones en las que predomina uno u otro campo. Para distancias menores que la distancia crítica, predomina el campo directo, y para distancias mayores, predomina el campo reverberante. Por esta razón se suele denominar también campo cercano y campo lejano a las componentes directa y reverberante.
Una característica del campo directo es que es bastante direccional, mientras que el campo reverberante es difuso, es decir adireccional. Por esta razón, en un teatro, cerca del escenario se percibe claramente la procedencia de los sonidos, pero más lejos no tanto (aunque por efecto Haas, el sonido directo, que llega siempre primero, permite percibir la dirección del sonido aún con un importante campo reverberante).

El campo reverberante permite explicar por qué dentro de una habitación los sonidos se perciben con mayor sonoridad que en un ámbito abierto. En éste último sólo existe el campo directo. En una habitación el sonido se ve reforzado por el campo reverberante, que acumula la energía sonora que no es absorbida en las reflexiones. En el descampado, al no haber reflexiones, la energía sonora simplemente se aleja continuamente de la fuente, sin posibilidad de acumularse.

De la discusión anterior se desprende que el campo reverberante será tanto mayor cuanto más reflectoras del sonido sean las superficies de un ambiente (o, lo que es lo mismo, cuanto menor sea el coeficiente de absorción), ya que en ese caso será mayor la energía acumulada. Como también el tiempo de reverberación aumenta cuando aumenta la reflexión, resulta que a mayor tiempo de reverberación, mayor campo reverberante.
Esto explica por qué en los ambientes con paredes duras, como los gimnasios, a igualdad de la fuente el nivel sonoro es tan alto. A esto se agrega el hecho de que el campo reverberante tiende a enmascarar el habla, por lo que la gente inconscientemente sube la voz para aumentar el campo directo, y poder comunicarse por lo menos con las personas más próximas. Esto a su vez incrementa el campo reverberante, pues significa más energía sonora para acumular en el ambiente.

4.9. Resonancias

En las salas pequeñas, aparece un tercer elemento que incide en la calidad acústica, que son las resonancias o modos normales de vibración. Esto sucede como consecuencia de las reflexiones sucesivas en paredes opuestas. Si en una habitación se genera una onda sonora que viaja perpendicularmente a dos paredes enfrentadas, al reflejarse en una de ellas lo hará también perpendicularmente, de modo que volverá sobre sí misma y posteriormente se reflejará en la pared opuesta. Así, se generará lo que se denomina una onda estacionaria, es decir una onda que va y vuelve una y otra vez entre las dos paredes. Esta onda es, de hecho, una onda sonora que se escuchará precisamente como un sonido. Si la distancia entre las dos paredes es L, la longitud de tal onda es 2·L, y por consiguiente deberá cumplirse (según lo visto en la sección 1.1) que:

que corresponde al si bemol casi 3 octavas por debajo del la central (LA 440 Hz).
Esta es sólo una de las muchas frecuencias de resonancia que puede tener esta sala. Otras corresponden a los armónicos de esa nota (es decir los múltiplos de 57,5 Hz, como 115 Hz, 172,5 Hz, etc.).
¿Qué consecuencias tiene esto para las condiciones acústicas del recinto? Las resonancias se ponen de manifiesto cuando aparece un sonido de igual o similar frecuencia.
Por ejemplo, si un bajo ejecuta esta nota, la acústica de la habitación parecerá amplificar dicho sonido, en desmedro de los otros sonidos. A esto se agrega que para las frecuencias de resonancia el tiempo de reverberación es mucho más prolongado, por lo cual dicha nota se prolongará más que las otras. Esto se considera un defecto acústico importante. Entre las posibles soluciones, están:

a) evitar las superficies paralelas, que favorecen las resonancias,
b) agregar absorción acústica que reduzca el tiempo de reverberación,
c) ecualizar el sistema de sonido de modo de atenuar las frecuencias próximas a la resonancia o resaltar las otras frecuencias.

Las resonancias rellenan el espectro musical, lo cual favorece el canto solista, es decir las melodías sencillas y no demasiado rápidas. Por ese motivo resulta agradable cantar en el baño (especialmente para la voz masculina). Es un ambiente pequeño, y por lo tanto con resonancias notorias. Sin embargo, desde el punto de vista de la escucha de la música, no resulta tan agradable, porque distorsiona lo que se quiere escuchar. Otra consecuencia de las resonancias es que la difusión del sonido no es satisfactoria, es decir que la distribución espacial del mismo no es uniforme: en algunos puntos el nivel sonoro es mucho mayor que en otros, siendo la diferencia mayor que la atribuible al campo directo.
A medida que crece el tamaño de una habitación, las resonancias tienden a estar cada vez más próximas entre sí, y se transforman en reverberación, mejorando también la difusión. Lo mismo sucede cuando la forma de la sala es irregular.
En el diseño de pequeñas salas o estudios de grabación o ensayo es primordial prestar atención a los problemas de difusión y de resonancias. Las siguientes son algunas recomendaciones:

1) Evitar las simetrías. Si la habitación tiene forma rectangular, las aristas deberían ser todas de diferente longitud (la forma cúbica de algunas habitaciones es particularmente deficiente desde el punto de vista acústico).Algunas proporciones satisfactorias son 1 : 1,14 : 1,39, 1 : 1,28 : 1,54 y 1 : 1,6 : 2,23.

2) Si es posible, evitar los paralelismos. Esto puede lograrse inclinando una o dos paredes, e inclusive el cielorraso.

3) En casos severos, recubrir con material absorbente una de cada par de paredes paralelas, o mejor aún (aunque es una solución más costosa), colocar algunas baldosas difusoras disponibles comercialmente (por ejemplo las RPG).

4.10. Materiales absorbentes acústicos

Los materiales de construcción y los revestimientos tienen propiedades absorbentes muy variables. A menudo es necesario, tanto en salas de espectáculo como en estudios de grabación y monitoreo realizar tratamientos específicos para optimizar las condiciones acústicas. Ello se logra con materiales absorbentes acústicos, es decir materiales especialmente formulados para tener una elevada absorción sonora.
Existen varios tipos de materiales de esta clase. El más económico es la lana de vidrio, que se presenta en dos formas: como fieltro, y como panel rígido. La absorción aumenta con el espesor, y también con la densidad. Permite absorciones sonoras muy altas. El inconveniente es que debe ser separada del ambiente acústico mediante paneles protectores cuya finalidad es doble: proteger la lana de vidrio de las personas, y a las personas de la lana de vidrio (ya que las partículas que se podrían desprender no sólo lastiman la piel sino que al ser respiradas se acumulan irreversiblemente en los pulmones, con el consecuente peligro para la salud). Los protectores son en general planchas perforadas de Eucatex u otros materiales celulósicos. Es de destacar que salvo las planchas perforadas de gran espesor, no tienen efecto propio en la absorción, por lo tanto las planchas perforadas aplicadas directamente sobre la pared son poco efectivas. Otro tipo de material son las espumas de poliuretano (poliéster uretano, y poliéter uretano) o de melamina. Son materiales que se fabrican facetados en forma de cuñas anecoicas (Figura 4.4a). Esta estructura superficial se comporta como una trampa de sonido, ya que el sonido que incide sobre la superficie de una cuña se refleja varias veces en esa cuña y en la contigua. El resultado es un aumento de la superficie efectiva de tres veces o más (Figura 4.4b).

Para tratamiento acústico de cielorrasos se pueden emplear plafones fonoabsorbentes basados en fibras minerales (basalto), fibra de vidrio, fibras celulósicas, corcho, etc. con diversas terminaciones superficiales de fantasía. En general se instalan suspendidas
por medio de bastidores a cierta distancia de la losa. Cuanto mayor es la separación, mejor es la absorción resultante, sobre todo si se intercala algo de lana de vidrio.
Es necesario efectuar aquí dos advertencias. La primera se refiere al poliestireno expandido (telgopor). Si bien es un excelente aislante térmico, sus características acústicas son muy pobres, contrariamente a lo que mucha gente supone, y por lo tanto no debería utilizarse en aplicaciones en las que la absorción o la aislación acústica sean críticas. La segunda advertencia es con respecto a la costumbre de recubrir los cielorrasos con cajas de huevos, bajo la creencia de que son buenos absorbentes del sonido. En realidad no son efectivas para esta aplicación, debido a que carecen de la porosidad y el volumen necesarios. Tal vez la confusión se origene en la semejanza que presentan con las cuñas anecoicas. No son recomendables para ninguna aplicación acústica seria.
El tratamiento de pisos se realiza normalmente con alfombras, las cuales son más efectivas si se colocan sobre bajoalfombras porosos de fibra vegetal (arpillera, yute) o poliéster. El efecto de las alfombras no se reduce a absorber el sonido, sino que atenúan los ruidos de pisadas u objetos que caen o rozan el suelo (por ejemplo, cables de micrófonos).
A igual estructura, la absorción de una alfombra aumenta con el espesor. El tipo de fibra constitutiva de una alfombra (lana, nylon) no afecta significativamente a su coeficiente de absorción.
Por último, los cortinados también pueden aprovecharse como absorbentes sonoros, especialmente cuando forman parte del diseño arquitectónico con algún fin estético o funcional. Hay que tener en cuenta que a mayor separación de la pared, mayor efectividad
en la absorción. También es importante la porosidad, ya que una cortina plástica impermeable no tiene propiedades absorbentes. Por el contrario, una cortina de tela gruesa, de terciopelo, etc., será bastante absorbente. La absorción también aumenta con el plegado, fruncido o drapeado, es decir la relación entre el área efectivamente ocupada por la cortina y el área de la cortina estirada. Una cortina fruncida al 50% puede llegar casi a duplicar su coeficiente de absorción.
Una aplicación interesante de las cortinas es la obtención de una acústica variable. Para ello se coloca una cortina frente a una pared relativamente reflectora. Al correr la cortina se va descubriendo la pared, y el conjunto se vuelve menos absorbente.

4.11. Aislamiento acústico

Aislar acústicamente un recinto significa impedir que los sonidos generados dentro del mismo trasciendan hacia el exterior y, recíprocamente, que los ruidos externos se perciban desde su interior. La aislación acústica (o aislación sonora) es muy importante en todo lo que tenga que ver con sonido profesional. Si el recinto es una sala de concierto o de espectáculos en la cual se ejecuta o propala música a alto nivel sonoro, es preciso evitar que los sonidos trasciendan convirtiéndose en ruidos molestos al vecindario. Si se trata de una sala de grabación o un estudio radiofónico, cualquier ruido proveniente del exterior contaminará el sonido que se desea difundir o grabar, en desmedro de su calidad, lo cual también debe evitarse.

En una primera aproximación al problema, podemos observar que la aislación sonora se logra interponiendo una pared o tabique entre la fuente sonora y el receptor. La aislación es tanto mayor cuanto mayor sea la densidad superficial (kg/m2) del tabique y
cuanto mayor sea la frecuencia del sonido. Esta es la razón por la cual las paredes gruesas (y por lo tanto pesadas) ofrecen mayor aislación que las delgadas. También explica por qué de la música del vecino se escucha mucho más la base rítmica de la percusión grave (baja frecuencia) que las melodías, por lo general más agudas (alta frecuencia). Un análisis más detallado indica que es posible obtener una mayor aislación acústica por medio de tabiques dobles, o, más generalmente, múltiples. En otras palabras, dada una cantidad de material (por ejemplo 20 cm de espesor de hormigón) podemos sacarle mayor provecho si lo dividimos en dos partes (en este caso dos paredes de 10 cm cada una) y lo separamos con un espacio de aire. Si el espacio de aire se rellena con algún material absorbente (típicamente, lana de vidrio), el resultado es una aislación todavía mayor.
Este tipo de estructura se utiliza mucho con placas de roca de yeso (Durlock, Placo, Pladur). Estas placas están formadas por yeso recubierto a ambos lados por celulosa (cartón). El espesor es, normalmente, unos 12 mm, y se suelen usar de a 2 separadas 50, 70 ó 90 mm mediante perfiles de chapa. El espacio entre ambas placas se rellena con lana de vidrio (Figura 4.5a). La aislación que se logra es sorprendente para el espesor y el peso total. Se puede obtener mayor aislación aún utilizando dos placas de roca de yeso de cada lado, y montándolas sobre perfiles independientes para evitar las conexiones rígidas propensas a transmitir las vibraciones (estructura alternada, Figura 4.5b).

También se utiliza el concepto de tabique doble para construir ventanas de gran aislamiento sonoro, como las “peceras” que separan la sala de control de la sala de grabación de los estudios. En este caso se utilizan dos hojas de vidrio grueso de distintos espesores (por ejemplo 6 mm y 8 mm), fijados al marco mediante masillas no endurecibles de silicona. En los bordes interiores (en forma más o menos oculta) se coloca material absorbente, como lana de vidrio o espuma de poliuretano. Para evitar que por diferencias de temperatura se produzcan condensaciones por dentro, lo cual empañaría los vidrios, se colocan gránulos de sílica gel, un poderoso deshumectante.
En la Figura 4.6 se muestra la estructura de una ventana de este tipo.

Para catalogar la aislación sonora de diferentes materiales y estructuras se usan dos parámetros: la pérdida de transmisión, PT, y la clase de transmisión sonora, STC (Estados Unidos), o el índice de reducción acústica, RW (Europa).
La pérdida de transmisión, PT, es un parámetro expresado en dB que depende de la frecuencia e indica en cuánto se atenúa la energía sonora incidente al atravesar el tabique. Así, una pérdida de transmisión de 40 dB significa que la energía sonora que pasa al otro lado es 40 dB menor que la incidente.
Obsérvese que se está hablando de la energía sonora, que no es lo mismo que la presión sonora. Si un tabique tiene PT = 40 dB, y del lado de la fuente hay un nivel de presión sonora de 90 dB, no es válido afirmar que del otro lado hay 90 dB – 40 dB, es decir 50 dB. Puede haber menos o más de 50 dB, según las circunstancias. Por ejemplo, si el lado receptor es muy reverberante, habrá más de 50 dB; y si el tabique es muy pequeño, por ejemplo una pequeña ventanilla en el medio de una pared muy gruesa, entonces del lado receptor habrá probablemente menos de 50 dB. Si bien el análisis detallado no es muy complejo, escapa al objeto de este libro.
La clase de transmisión sonora (en inglés, sound transmission class), STC, es una especie de valor promedio de la pérdida de transmisión a varias frecuencias. Es un valor único que permite evaluar rápidamente la calidad de la aislación sonora que ofrece un tabique, especialmente en lo referido a la privacidad de la palabra. Así, un valor de STC inferior a 25 implica que la voz normal se entiende perfectamente, y un valor superior a 45 implica que la voz alta casi no se percibe. El índice de reducción sonora Rw es la versión europea, también usada en la Argentina (puede diferir hasta en 1 dB). En la Tabla 4.2 se detallan los valores de PT a varias frecuencias y de STC, correspondientes a varios materiales y estructuras.  Se han considerado los materiales y estructuras actuando en condiciones casi ideales. No se ha tenido en cuenta, por consiguiente, la denominada transmisión por flancos, es decir el sonido que se filtra a través de fisuras, intersticios o juntas mal selladas, o que se propaga por la estructura en forma de vibraciones, o que se transmite por tuberías de ventilación o aire acondicionado, o por los caños de distribución de energía eléctrica. En todo proyecto de aislación acústica deben tenerse en cuenta todos estos detalles, ya que de lo contrario se corre el riesgo de invertir grandes sumas de dinero sin lograr los resultados esperados. Es importante saber que el intersticio debajo de una puerta puede llegar a empeorar la atenuación de una pared en 20 dB ó más. Pueden utilizarse burletes perimetrales en las puertas y masilla con silicona (es decir, no endurecible) en toda fisura, grieta o junta.
Por último, debe advertirse que la información brindada en este capítulo se ha incluidoa título informativo, siendo conveniente obtener una opinión especializada antes de encarar un proyecto que involucre grandes inversiones, ya que es muy fácil cometer errores que luego se pagarán, a la larga o a la corta, muy caro.

Acústica Capítulo 3 Acústica Musical

Acústica Musical

3.1. Introducción

La Acústica Musical estudia no sólo el comportamiento de los instrumentos musicales (tanto acústicos como electroacústicos), sino también las relaciones entre los distintos sonidos para dar origen a sensaciones musicalmente significativas, como la percepción de una escala musical, la sensación de consonancia y disonancia, los diferenciación tímbrica, etc.

3.2. Consonancia y disonancia
Al superponer dos sonidos de frecuencias muy próximas entre sí tiene lugar un fenómeno de batido (batimento) o pulsaciones entre ambos, consistente en una fluctuación periódica de la amplitud. Por ejemplo, si superponemos dos tonos puros de 700 Hz y 800 Hz e igual amplitud, se tiene la situación ilustrada en la Figura 3.1. Al sumarlos, dado que en el instante inicial (t = 0) están en fase (es decir que los cruces por cero coinciden en el tiempo), la amplitud se duplica. A medida que transcurre el tiempo, debido a la diferencia de frecuencia, las dos senoides se van desfasando, y hacia los 5 ms, el octavo semiperiodo de la senoide de 800 Hz y el séptimo de la de 700 Hz están prácticamente en contrafase, razón por la cual el resultado es casi nulo. Hacia los 10 ms vuelven a estar en fase, y por lo tanto la amplitud vuelve a ser doble. Se obtiene así un sonido modulado por una envolvente que se repite cada 10 ms, es decir que tiene una frecuencia de 100 Hz. Obsérvese que esta frecuencia es la diferencia entre las dos frecuencias superpuestas:

100 Hz = 800 Hz – 700 Hz

El resultado anterior se puede generalizar. Si se superponen (suman) dos sonidos de frecuencias f1 y f2, (f1 mayor que f2), entonces aparecen pulsaciones de frecuencia f1 – f2. Si la diferencia de frecuencias es muy pequeña, entonces las pulsaciones serán
muy lentas, y no se percibirán como una pulsación sino como una suave envolvente. Por ejemplo, si las frecuencias son 440,1 Hz y 440 Hz, la diferencia es 0,1 Hz, es decir una pulsación cada 10 s. En este caso, dado que la gran mayoría de las notas usadas en música son mucho más cortas que eso, no llegará a completarse una pulsación, produciéndose más bien la sensación de un sonido más cantado, más expresivo. Si las pulsaciones son un poco más rápidas, por ejemplo 1 ó 2 Hz, se percibe un efecto llamado trémolo, semejante a notas repetidas. Si son bastante más rápidas, por ejemplo 5 ó 10 Hz hasta unos 50 Hz, el resultado produce una sensación de agitación comúnmente denominada disonancia.

El efecto de batido analizado anteriormente suponía que los sonidos eran tonos puros, es decir ondas senoidales. Si en lugar de ello se tienen dos sonidos de los más frecuentemente utilizados en la música, es decir sonidos formados por cierta cantidad de armónicos, es posible que se produzcan batidos entre los armónicos de ambos sonidos. Supongamos, por ejemplo, un acorde formado por dos sonidos de 220 Hz y 311 Hz (un LA y un RE# respectivamente). Es sabido en música que dicho acorde resulta disonante. Si efectuamos la resta entre ambas frecuencias obtenemos:

311 Hz – 220 Hz = 91 Hz

que es un batido demasiado rápido para provocar sensación de disonancia. Pero si tenemos en cuenta los armónicos de ambos, que son respectivamente 220 Hz, 440 Hz, 660 Hz, … y 311 Hz, 622 Hz, 933 Hz, …, resulta que el tercer armónico de 220 Hz, es decir 660 Hz, interfiere con el segundo armónico de 311 Hz, es decir 622 Hz, causando pulsaciones de frecuencia:

660 Hz – 622 Hz = 38 Hz

El resultado es una sensación de disonancia. Si los sonidos hubieran sido senoidales, si bien la combinación sonaría algo extraña, no se percibiría casi agitación alguna. Nos preguntamos ahora cuándo dos sonidos forman un acorde consonante. La condición para esto es que no exista interferencia entre armónicos importantes, es decir intensos, de uno y otro sonido. Así, tenemos que la consonancia más perfecta es el unísono (frecuencias exactamente iguales, ya que en ese caso no hay en absoluto pulsaciones. Luego sigue la octava, es decir cuando los sonidos están en una relación de frecuencias 2:1 (un sonido tiene el doble de frecuencia que el otro). Aquí tampoco hay posibilidad de “choques” entre armónicos, porque todos los armónicos del más agudo coinciden exactamente con armónicos del más grave. Luego sigue la quinta, que corresponde a una relación de frecuencias de 3:2 (uno de los sonidos tiene frecuencia 1,5 veces la del otro). Tomemos por ejemplo la quinta formada por el LA de 220 Hz y el MI de 330 Hz. En este caso los armónicos sucesivos, mostrados en la Figura 3.2, difieren en 110 Hz ó más.

3.3. Escalas musicales
Las escalas musicales surgen históricamente de la necesidad de satisfacer tres principios: economía, reproducibilidad, y funcionalidad.

3.3.1. Economía
De todos los sonidos disponibles (es decir audibles) deben seleccionarse la menor cantidad posible. Una razón es que la mayoría de los instrumentos permiten realizar sólo una cantidad relativamente pequeña de sonidos. Algunas excepciones son la voz humana, los instrumentos de arco (violín, viola, etc.) y el trombón a vara. En el caso de la música grupal (orquestas, bandas), el hecho de que algunos instrumentos posean una cantidad limitada de sonidos condiciona fuertemente los sonidos utilizables por los instrumentos de afinación continua. Otra razón es la necesidad de lograr la máxima variedad con la mayor simplicidad.

3.3.2. Reproducibilidad
Los sonidos seleccionados deben ser fácilmente reproducibles, tanto vocal como instrumentalmente. Cuando se habla de “reproducibles” significa que debe ser fácil de lograr una afinación suficientemente precisa como para no alterar de modo apreciable el sentido de lo que se ejecuta o canta.

3.3.3. Funcionalidad
La escala adoptada debe satisfacer los criterios estéticos correspondientes al uso que se le va a dar. Por ejemplo, si el uso será armónico (es decir que se emplearán combinaciones simultáneas de sonidos), entonces la mayor cantidad posible de superposiciones entre sonidos de la escala deberán resultar aceptables o “agradables” de acuerdo al estilo armónico que se va a practicar. Esto implica que al adoptar una escala se deben tener en cuenta cuestiones como el gusto y otros aspectos.

3.3.4. Escalas para uso monofónico
En este caso, que corresponde a las músicas más primitivas, sólo aparece un sonido por vez. Corresponde al canto o a los instrumentos monofónicos como la flauta, etc. El principio de funcionalidad en este caso no implica ninguna restricción. El principio
de reproducibilidad requiere casi exclusivamente la memoria, ya que los sonidos sucesivos deben ser fácilmente memorizables.
El criterio básico será que existan armónicos comunes entre los sonidos más importantes de la escala, ya que de esa manera éstos actuarán como “pivotes” entre ambos, permitiendo una transición segura, es decir con buena afinación, entre ellos.
El intervalo más fácil de memorizar es el unísono (igual frecuencia), ya que corresponde a una repetición exacta de la altura anterior. Luego sigue la octava, ya que la octava de un sonido equivale a su segundo armónico. Después sigue la quinta, cuyo segundo armónico coincide con el tercero de la nota original. Podríamos seguir investigando los intervalos básicos, pero dado que los armónicos superiores al tercero son en general poco intensos, no resulta muy seguro basarse en la memoria de armónicos difíciles
de escuchar.
Se utiliza en realidad otro criterio, que es el encadenamiento de quintas y de octavas, es decir que partiendo de un sonido, se toma primero su quinta, luego la quinta de la quinta, y así sucesivamente hasta completar un número deseado de sonidos. Para la
escala más simple, se toman siete sonidos, que en notación musical son:

Luego se sube o baja la cantidad de octavas que haga falta para que todos los sonidos se encuentren dentro de una misma octava. Así, el fa se sube una octava, el do y el sol no se modifican, el re y el la se bajan una octava, y el mi y el si se bajan dos octavas. Se
obtiene la escala recuadrada en línea de puntos:

El último paso sería reordenar las notas de modo que sus frecuencias vayan en aumento. La escala así obtenida se llama escala de Pitágoras, o escala pitagórica, ya que el célebre filósofo y matemático griego fue quien la sistematizó.

3.3.5. Escalas para uso armónico o polifónico
En un estadio más avanzado de la evolución de la música surge la necesidad de combinar sonidos simultáneos, al intentar varias personas cantar una misma melodía. Entre cantantes de igual tesitura vocal era posible cantar al unísono (igual altura). Pero, por ejemplo, entre las voces masculinas y las femeninas hay una diferencia promedio de una octava, de modo que el primer intervalo de uso simultáneo (además del caso trivial del unísono) fue la octava (relación de frecuencias 2:1). Luego fueron surgiendo otros
intervalos, como la quinta (3:2) y la cuarta (4:3), y posteriormente surgió la polifonía, en la cual se superponían diferentes melodías, formando en cada instante diversos intervalos simultáneos.
El principio de funcionalidad válido para esta aplicación requiere que la mayor cantidad posible de superposiciones de sonidos de la escala que se adopte resulte “agradable”, concepto desde luego muy relativo. En la época en que se consolidaron las escalas sobre las que se basan las hoy en uso, el criterio era el de la consonancia. Las consonancias disponibles son, en orden decreciente de perfección, las ya indicadas en la Tabla 3.1 (dicho orden coincide aproximadamente con el orden histórico en
que fueron siendo aceptadas en la evolución de la música). En una música polifónica desarrollada, es de esperar que cada una de estas consonancias aparezca con cierta frecuencia, por lo que es preciso elegir los sonidos de la escala de manera de lograr la mayor
cantidad posible de superposiciones consonantes. En la escala de Pitágoras, las octavas, las quintas y las cuartas son acústicamente perfectas, pero las terceras y sextas no. Si tomamos por ejemplo, el intervalo entre un DO y un MI pitagóricos, que parecería ser una tercera mayor, resulta la siguiente relación de frecuencias:

donde los cuatro primeros factores 3/2 corresponden al encadenamiento de cuatro quintas desde el do hasta el mi agudo, y los factores 1/2 corresponden a bajar dos octavas.

Vemos que el resultado difiere de una tercera mayor acústicamente perfecta, a la cual correspondería una relación de 5/4 , es decir:

La diferencia, correspondiente a una relación 81/80, se denomina coma pitagórica, y es un pequeño intervalo de alrededor de 1/10 de tono. Esta diferencia es claramente perceptible, produciendo una consonancia no tan perfecta como el intervalo perfecto.
Este inconveniente aparece porque al construir la escala pitagórica no se utilizaron terceras perfectas. Para subsanarlo, en lugar de generar la escala por encadenamiento de 6 quintas, se utilizan sólo 3 quintas, lo cual origina 4 notas. Las tres notas que faltan se
logran tomando las terceras mayores perfectas sobre las tres primeras notas:

Luego se procede igual que en la escala de Pitágoras, subiendo o bajando la cantidad de octavas que haga falta para que todos los sonidos se encuadren dentro de una misma octava. Así, el fa y el la se suben una octava, y el re se baja una octava. Finalmente se
reordenan. Esta escala se denomina escala natural, escala perfecta o escala de Aristógenes.

3.3.6. Escala temperada
Tanto la escala pitagórica como la natural poseen 7 notas en cada octava. Al ir evolucionando la música, ya no fue suficiente con estas 7 notas. Así, la denominada música ficta fue introduciendo algunas notas falsas (“ficta” significa “fingida” o “falsa”)
no pertenecientes a la escala. Hay varias razones por las cuales resulta interesante agregar algunas notas más.
La primera es la necesidad de la transposición, es decir subir o bajar una melodía para adaptarla a la tesitura de una voz o instrumento diferente de aquel para el que fue concebida. La transposición más simple es la transposición a la octava superior o inferior según el caso, pero a veces tal transposición resulta excesiva, ya que quizás era suficiente con transportar una quinta o una cuarta. El problema es que para realizar una transposición con esos intervalos hace falta agregar un sonido nuevo en la escala de
Pitágoras y dos en la natural.
La segunda razón es la necesidad de realizar modulaciones. En música, modular equivale a realizar un cambio de tonalidad, es decir de escala, dentro de una misma pieza, de manera que algunos pasajes de la pieza utilizan una escala, y otros, otra escala.

Ambas situaciones requieren, entonces, el agregado de nuevos sonidos a la escala. Esto tiene el inconveniente de que si se quiere conservar el carácter acústicamente perfecto de los intervalos de la escala, se haría necesario agregar una cantidad enormemente
grande de nuevos sonidos, lo cual no sólo no es práctico sino que además va en contra del concepto mismo de escala planteado al principio.
Después de diversas pruebas durante varios siglos se propuso una escala con 12 sonidos en cada octava, en la cual los intervalos elegidos, pese a no ser perfectos, resultan bastante aceptables. Esta escala se denomina escala temperada. En realidad se han propuesto y utilizado históricamente varias escalas temperadas. La actualmente en uso es la que utiliza el temperamento uniforme. En ella se divide la octava en 12 intervalos exactamente iguales, denominados semitonos, cuyas frecuencias sucesivas están
relacionadas por la expresión:

Con esta ecuación se pueden calcular, a partir de una frecuencia estándar, como la del LA 440 Hz, las frecuencias de todos los otros sonidos de la escala. Los valores correspondientes a la octava central se incluyeron en el capítulo 2.

3.4. Instrumentos musicales acústicos
Haremos aquí una breve descripción de los mecanismos básicos de producción de sonido de los instrumentos musicales. Los instrumentos musicales se clasifican según el medio productor de sonido en instrumentos de cuerda, de viento y de percusión.

3.4.1. Instrumentos de cuerda
Los instrumentos de cuerda producen sus sonidos por medio de una cuerda vibrante. Los métodos para poner la cuerda en vibración son de tres tipos: la percusión, el punteo, y el frotado. La percusión consiste en golpear la cuerda, como sucede en el piano. El punteo, en separar la cuerda de su posición de reposo y soltarla, mecanismo característico de la guitarra. Finalmente, el frotado consiste en rozar la cuerda con un material de gran adherencia como ciertas fibras naturales y sintéticas, procedimiento
utilizado en los instrumentos como el violín.
De estos tres mecanismos, el de frotado es el único que permite entregar energía en forma permanente, y así reponer la que se va disipando. En los otros casos el sonido se extingue más o menos rápidamente.
Cuando la cuerda vibra, transmite en forma directa al aire algo de energía sonora. Sin embargo, el mecanismo principal de emisión de sonido no es éste. La mayor parte de la energía de la cuerda pasa a través del puente (apoyo de la cuerda) a una tabla delgada
de gran superficie denominada placa armónica, tabla armónica o caja armónica, y al vibrar ésta se produce una importante emisión sonora.
Se puede verificar lo anterior comparando una guitarra eléctrica sin amplificación con una guitarra acústica. La guitarra acústica posee caja armónica, y en cambio la guitarra eléctrica no. El sonido de esta última es prácticamente inaudible. La frecuencia de vibración de una cuerda depende de la tensión que soportan, de su masa (o peso) por unidad de longitud, y de su longitud. Si T es la tensión en kgf (kilogramos fuerza), m es la densidad lineal (masa por unidad de longitud), en g/m (gramos por metro), y L es la longitud en cm, entonces la frecuencia f viene dada por la fórmula:

que corresponde a un si grave, una octava y un semitono por debajo del do central. La fórmula revela varias cosas. En primer lugar, al tensar más la cuerda (es decir al aumentar T), aumenta la frecuencia. Este es el método clásico para afinar un instrumento
de cuerda: al ajustar las clavijas se modifica precisamente la tensión. En segundo lugar, al aumentar la densidad baja la frecuencia. Por ese motivo siempre las cuerdas graves son más gruesas. En la guitarra, por ejemplo, dado que una cuerda de nylon con la masa suficiente para las cuerdas más graves sería imprácticamente gruesa, se las recarga con un entorchado (arrollamiento) de cobre. En tercer lugar, la frecuencia es inversamente proporcional a la longitud L. Este principio se utiliza en los instrumentos de
mástil como la guitarra, el violín, el contrabajo, etc. para obtener muchos sonidos diferentes de cada cuerda (en el piano y en el arpa esto no es necesario). Otra aplicación de esta propiedad es que al reducir la longitud de la cuerda a la mitad, su frecuencia aumenta
al doble, es decir sube una octava. Este fue uno de los primeros descubrimientos de la acústica antigua, realizada por los griegos utilizando el monocordio, un instrumento de una sola cuerda. Otro descubrimiento vinculado con esta propiedad es que si se divide la cuerda en partes iguales, se obtiene la serie de armónicos. Al dividirla por 2, se obtiene el segundo armónico, al dividirla por 3, el tercero, y así sucesivamente. Esto es utilizado por los guitarristas, para obtener el efecto denominado armónico.

3.4.2. Instrumentos de viento
Los instrumentos de viento producen sonido por vibración de una así denominada columna de aire. La columna de aire es simplemente el aire dentro de un tubo, y el mecanismo de vibración consiste en que la onda sonora se refleja una y otra vez en los extremos del tubo, siendo un hecho de lo más notable que la reflexión se produce lo mismo esté el extremo abierto o cerrado (aunque con diferentes características). Hay dos mecanismos de producción de sonido en una columna de aire. El primero es el de un obstáculo que provoca remolinos o turbulencias que luego son acentuadas por la resonancia del tubo. Es el caso de la flauta. El segundo es el de la lengüeta, es decir una lámina elástica de metal, caña o plástico que obstruye el pasaje del aire. Esto implica un aumento de presión hasta que finalmente se vence su resistencia. Esto produce una descompresión que vuelve a obstruir el pasaje de aire, repitiéndose el ciclo. A esta categoría pertenece la mayoría de los instrumentos (oboe, clarinete, fagot, etc.). Inclusive los instrumentos denominados metales, como el trombón o la trompeta, utilizan este mecanismo, donde la lengüeta está formada por los labios presionados.

La frecuencia de los instrumentos de viento depende de la velocidad del sonido c y de la longitud del tubo L, según la fórmula aproximada, válida para tubos abiertos en ambos extremos, como la flauta, el oboe, la trompeta, etc.:

En este caso sólo aparecen los armónicos impares. Esto da un timbre muy particular, del cual el ejemplo más representativo es el clarinete.
La primera observación está referida a la dependencia de la velocidad del sonido. Como ésta aumenta con la temperatura, resulta que la frecuencia producida por un instrumento de viento aumenta con la temperatura. Esto justifica por qué los vientistas deben
“calentar” el instrumento, y también por qué al variar la temperatura durante un espectáculo los vientos se desafinan.
La segunda observación se refiere a la variación inversa con la longitud del tubo. Esto es similar a lo que sucedía en las cuerdas. En este caso hay tres formas de variar la longitud. Una forma es mediante orificios, como en la flauta. Al cerrar todos los orificios,
la longitud es máxima, y el tono producido, grave. A medida que se van destapando orificios, la longitud efectiva del tubo se va achicando, y el tono se va haciendo más agudo. Otra forma es mediante unas válvulas que intercalan trozos adicionales de tubo,
como en la trompeta. La última forma, es mediante un tubo deslizante (tipo telescopio), que al introducirse o extraerse del tubo principal reduce o aumenta la longitud total.
La tercera observación es que mediante el procedimiento anterior no se puede obtener mucho más de una octava, ya que cuando la longitud del tubo se vuelve demasiado pequeña, la calidad del sonido empeora. Por otra parte, a diferencia de la guitarra o el violín, donde hay varias cuerdas, en una flauta no es posible tener varios tubos (salvo en la denominada flauta de Pan). Entonces se recurre a la producción de armónicos.
Soplando de una forma particular, es posible seleccionar qué armónico se producirá (o lo que es lo mismo, se inhiben los otros). Combinando los armónicos con la variación de la longitud por cualquiera de los procedimientos detallados, se consigue cubrir varias octavas.

3.4.3. Instrumentos de percusión
Los instrumentos de percusión son aquéllos que producen sonido al golpear objetos. Los hay de altura determinada, como los xilófonos (placas de madera), los metalófonos (placas de metal) y las campanillas (varillas de metal), y los de altura indeterminada,
como los parches (tambores, bombos) en general (salvo los timbales), los platillos, etc. A diferencia de los instrumentos de cuerda y de viento, los instrumentos de percusión crean sonidos con espectro no armónico, por lo cual siempre aparecen parciales o
sobretonos no armónicos. Cuando éstos son débiles, la altura es determinada, pero cuando son intensos (como en los tom-tom) o muy abundantes (como en los platillos), la altura es indeterminada. En muchos instrumentos se crea además una resonancia con
una columna de aire, por ejemplo en la marimba, o el vibrafón, lo cual acentúa el sonido y ayuda a filtrar los parciales inarmónicos.
Dentro de la percusión existen efectos especiales, como el uso de un arco de contrabajo sobre el borde de un platillo, o el efecto de las escobillas, o el de los resortes en el redoblante.
La percusión provee una gran riqueza de posibilidades, aunque en mucha música se la relega al papel de una simple base rítmica.

3.5. Instrumentos musicales electrónicos
Los instrumentos musicales electrónicos surgieron prácticamente con la electrónica, pero recién alcanzaron difusión masiva con el advenimiento de la tecnología digital.
Antes de eso, los sintetizadores analógicos eran, o bien muy rudimentarios, o bien excesivamente costosos e inaccesibles, y, en cualquier caso, reservados para los especialistas, debido a las dificultades para obtener los sonidos deseados. En esta sección haremos un descripción muy sucinta de algunas de las características más importantes de estos instrumentos.

3.5.1. Osciladores
El elemento fundamental de todo sintetizador es el oscilador, es decir el dispositivo encargado de generar la señal eléctrica que luego se transformará en onda sonora. La salida de un oscilador puede controlarse por medio de varios parámetros. En primer lugar, puede controlarse la frecuencia, que determinará la altura del sonido producido.
Luego está la amplitud, que determina la sonoridad. Después, podemos seleccionar la forma de onda. En los sintetizadores analógicos existían pocas formas de onda posibles:
ondas senoidal, cuadrada y triangular, trenes de pulsos, y en algunos casos ruido blanco.
En los sintetizadores digitales actuales, es posible seleccionar cientos y hasta miles de formas de onda diferentes. Ello se debe a que se utilizan sonidos muestreados, es decir sonidos reales (o sintéticos) grabados y almacenados en bancos de memoria. Luego,
cada vez que se requiere producir un sonido, el oscilador simplemente reproduce el sonido durante el tiempo que haga falta (según la duración de la nota a ejecutar).

3.5.2. Control de envolventes
Hay muchos parámetros que pueden controlarse por medio de envolventes. Originalmente la envolvente surge como modelo físico para describir cómo varía en el tiempo de la amplitud de una forma de onda (capítulo 1), tal como sucede en todos los instrumentos acústicos. En un contexto más general, una envolvente es la evolución en el tiempo de cualquier parámetro imaginable asociado a un generador de sonido. Así, pueden variar en el tiempo la altura, el contenido armónico, etc.

3.5.3. Envolvente de altura
La envolvente de altura (o de fercuencia fundamental) permite simular efectos de los instrumentos reales, los cuales varían inicialmente un poco su frecuencia. También pueden generar sonidos nuevos, o que imitan sonidos naturales, como los ladridos.

3.5.4. Envolvente de filtrado
Uno de los procedimientos dilectos de la época de los sintetizadores analógicos era generar una forma de onda con un gran contenido armónico (por ejemplo un tren de pulsos muy angostos y muy altos), y luego aplicarles diversos filtros que eliminaban o atenuaban algunos de los armónicos, o bien enfatizaban otros. La envolvente aplicada a estos filtros, permitía ir cambiando en el tiempo a qué armónicos se daba preferencia. En los sintetizadores actuales, la envolvente de filtrado permite, por ejemplo, simular
electrónicamente el hecho general de que los armónicos de alta frecuencia se atenúan más rápido que los de baja frecuencia. Entonces si se tiene un filtro que deja pasar sólo las frecuencias hasta cierta frecuencia fc, reduciendo paulatinamente esa frecuencia se logra ir eliminando primero los armónicos de mayor frecuencia.

3.5.5. Moduladores
Otra característica habitual en los instrumentos acústicos es el control de la expresión a través de pequeñas fluctuaciones periódicas de algunos parámetros, por ejemplo la altura (vibrato) o la amplitud (trémolo). Si en lugar de las envolventes (o si además de ellas) se agrega una modulación en los correspondientes parámetros de control del oscilador, se consigue simular dicha expresividad. La aplicación de moduladores se estudiará más detenidamente en el capítulo 18 para el caso de los efectos.

3.5.6. Seguimiento de altura (key tracking)
En los instrumentos acústicos, gran parte de las propiedades de los sonidos varían según qué nota se esté ejecutando. Por ejemplo, las notas más graves suelen tener un contenido armónico mayor que las más agudas. También sus envolventes (ya sea la primaria, es decir la de amplitud, como cualquier otra que esté actuando sobre diversas características del sonido) pueden tener velocidades distintas según la altura. Por ejemplo, un sonido agudo se extingue más rápidamente, por lo cual su envolvente decaerá
más rápido que la de los sonidos graves.

3.5.7. Controladores
Los osciladores, con todas las características descriptas, pueden ser controlados por medio de una interfaz. Una interfaz es un dispositivo que permite la comunicación entre entes de naturaleza diversa, por ejemplo entre un sintetizador y un ser humano. El
controlador más clásico es un teclado, que simula el teclado de órgano, piano o clave. Existen otros controladores, como por ejemplo guitarras, vientos o percusión, que permiten también enviar órdenes al sintetizador sobre qué sonidos debe producir. En todos
los casos, la idea es que el músico ejecute un instrumento que le sea técnicamente familiar.

Los controladores pueden enviar información de varias clases. Lo más básico es, por supuesto, enviar información sobre qué altura generar. Pero a través de sensores en las teclas, permiten enviar información sobre la fuerza con que se tocó la tecla, que el
sintetizador normalmente transformará en un valor de amplitud. El parámetro enviado realmente no es la fuerza, sino la velocidad con que se bajó la tecla, razón por la cual dicho parámetro recibe el nombre de velocidad (en inglés, velocity).
Aún cuando la velocidad se utilice con mayor frecuencia para controlar la amplitud del sonido, muchas veces se puede utilizar para controlar otros parámetros o funciones.
Por ejemplo, se puede emplear para simular el hecho característico de los instrumentos acústicos de que los sonidos más fuertes tienen mayor contenido armónico.
Entonces se puede controlar, mediante la velocidad, la apertura o cierre de un filtro. Así, cuando se oprime la tecla rápidamente (con fuerza), el filtro deja pasar todos los armónicos. Cuando se oprime lentamente (con suavidad), en cambio, bloquea los armónicos
superiores, lográndose un sonido no sólo más suave sino también más opaco.
Algunos teclados están equipados a su vez de celdas de carga (es decir sensores de presión) debajo de las teclas, cuya finalidad sí es medir la fuerza que se ejerce sobre la tecla, pero no durante su bajada sino después. El objeto es lograr influir sobre el sonido después de iniciado, algo que en el teclado de piano no es posible pero que en cambio es muy común en instrumentos como el violín, la guitarra o la trompeta. Este parámetro se denomina postpulsación (en inglés aftertouch). La postpulsación puede
utilizarse para alterar características de la modulación, y así darle control al intérprete del tipo de vibrato, por ejemplo, que produce. También puede usarse para variar la sonoridad de un sonido que ya empezó, y así simular una nota sostenida y crescendo en las cuerdas o los vientos, por ejemplo.
Por último existen controles de afinación, modulación y volumen, a través de palancas, pedales o diales (ruedas). Estos controles permiten modificar en tiempo real la afinación, la modulación o el volumen en forma totalmente personal, lo cual permite crear el efecto expresivo exacto que busca el intérprete.

3.5.8. Efectos
Una posibilidad muy interesante que poseen ahora cada vez más frecuentemente los sintetizadores (aún los muy económicos) es la posibilidad de agregar efectos al sonido.
Por efectos se entiende modificaciones que le dan mayor expresividad, o mayor realismo, o mayor espacialidad, etc. Por ejemplo, es posible agregar reverberación, o simular mayor cantidad de instrumentos (coro), o mejorar el sonido o su percepción
(resaltadores), etc.

3.5.9. Posibilidades adicionales
La discusión anterior sugiere el hecho sumamente interesante de que con los mismos recursos introducidos para imitar con mayor fidelidad los instrumentos conocidos, es posible crear sonidos totalmente nuevos. De hecho, uno de los métodos de síntesis
más poderosos que se conocen, la síntesis por modulación de frecuencia, fue descubierto haciendo experimentos con el vibrato en los cuales se llevaban los parámetros totalmente fuera de contexto, acercando la frecuencia de la modulación a la frecuencia
fundamental del sonido.

3.5.10. Interconexión MIDI
Las posibilidades de aplicación de los sintetizadores se multiplicaron al introducirse la norma de comunicaciones MIDI (Musical Instrument Digital Interface, Interfaz digital para instrumentos musicales). Esta norma establece un código de
comunicación entre instrumentos musicales, y entre instrumentos musicales y computadoras.
Esto permite varias cosas. En primer lugar, mediante programas de computadora denominados secuenciadores (sequencers) es posible controlar el instrumento por computadora, lo cual implica entre otras cosas, ejecutar automáticamente música previamente
programada. También permite ejecutar un acompañamiento orquestal mientras el músico toca en tiempo real la parte solista en su teclado. También es posible seleccionar los instrumentos, o modificarlos (editarlos) para lograr personalizarlos al gusto del intérprete. Es posible cambiar virtualmente todos los parámetros de cualquier sonido, así como parámetros globales como la afinación, mediante
órdenes adecuadas enviadas en forma de códigos MIDI.
Por último, también es posible realizar una “grabación” de una interpretación. Esta grabación se diferencia de una grabación tradicional en que lo que se graba no son señales de audio sino las señales MIDI que permiten al sintetizador repetir en forma
idéntica la ejecución. Esto no quiere decir que no pueda luego modificarse la ejecución. A diferencia de una grabación convencional, en la cual si se cometió un error no hay mucho que pueda hacerse para corregirlo decorosamente, en una grabación MIDI es
posible eliminar y reemplazar notas equivocadas, se puede mejorar la expresividad de un pasaje, se pueden agregar voces imposibles de tocar, cambiar de timbre, etc. Las posibilidades son casi ilimitadas. En el caso de instrumentos de gran jerarquía, es posible
lograr interpretaciones magistrales, debido a la cantidad de posibilidades de control que se ofrecen al ejecutante. Sin embargo, el dominio de la totalidad de tales posibilidades requiere una práctica y condiciones personales comparables a las necesarias para la
interpretación de cualquier instrumento tradicional.

Acústica:Psicoacústica Capítulo 2

Psicoacústica

2.1. Introducción
Brevemente, la Psicoacústica se dedica a estudiar la percepción del sonido, es decir, cómo el oído y el cerebro procesan la información que nos llega en forma de sonido.

2.2. Sensaciones psicoacústicas
Cuando escuchamos un sonido, percibimos sensaciones que pueden ser clasificadas en tres tipos: la altura, la sonoridad y el timbre. La altura es la sensación que nos permite distinguir los sonidos graves de los agudos, y, más específicamente, diferenciar los sonidos de una escala musical. La sonoridad, en cambio, es la sensación por la cual distinguimos un sonido fuerte de uno débil. El timbre agrupa una serie de cualidades por las cuales es posible distinguir los sonidos de los diversos instrumentos y voces. En una primera aproximación, cada parámetro físico del sonido se corresponde de manera más o menos directa con un tipo de sensación psicoacústica específica. Así, la frecuencia está relacionada con la sensación de altura, la amplitud con la sonoridad, y el espectro (incluyendo las posibles envolventes) con el timbre. Veremos, sin embargo, que la cuestión no es tan sencilla, existiendo en general una importante dependencia entre cada sensación y todos los parámetros del sonido.

2.3. Altura
La relación entre frecuencia y altura es bastante directa, correspondiendo las bajas frecuencias a sonidos graves y las altas frecuencias a sonidos agudos (Figura 2.1). En realidad, la altura como parámetro psicofísico varía un poco, además, con la intensidad
del sonido, es decir que un sonido débil y otro fuerte de la misma frecuencia parecen tener alturas ligeramente distintas. También varía un poco con el timbre. Un timbre muy brillante parece ser más agudo que uno más opaco, aún cuando la frecuencia y la intensidad sean iguales. La relación matemática entre la altura y la frecuencia es la siguiente. Si se conoce la frecuencia de una nota de la escala, por ejemplo fLA, la frecuencia de la nota ubicada un semitono más arriba (es decir, en un teclado, la tecla blanca o negra inmediatamente.

En la Tabla 2.1 se dan las frecuencias correspondientes a la octava central (la que contiene el LA 440), obtenidas por este procedimiento. Para determinar las frecuencias de las notas de otras octavas, podría continuarse con el procedimiento anterior o bien utilizar otra relación matemática que indica que para obtener la frecuencia de una nota una octava más alta, simplemente se multiplica por 2. Por ejemplo el LA ubicado una octava por encima del LA central tiene una frecuencia de 2 ´ 440 Hz, es decir 880 Hz.
Análogamente, para determinar la frecuencia de una nota una octava más baja, se divide por 2.

2.4. Sonoridad
La sensación de sonoridad, es decir de fuerza, volumen o intensidad de un sonido, está, en principio, relacionada con su amplitud. Sin embargo la relación no es tan directa como la que existe entre la frecuencia y la altura. De hecho, la sonoridad resulta en realidad fuertemente dependiente no sólo de la amplitud sino también de la frecuencia. Así, a igualdad de frecuencias podemos afirmar que un sonido de mayor amplitud es más sonoro. En la Figura 2.2 se muestra el ejemplo de dos sonidos de 200 Hz, de los cuales el de mayor amplitud es más sonoro. Pero si aumentamos la frecuencia del sonido de menor amplitud, éste puede llegar a percibirse como más sonoro. En el ejemplo de la Figura 2.3, el sonido de menor amplitud se lleva a 600 Hz, percibiéndose ahora con mayor sonoridad.

Los resultados anteriores obedecen al hecho de que el oído es más sensible en las frecuencias centrales, es decir entre 500 Hz y 5 kHz, que en las muy bajas o muy altas. Se han realizado investigaciones para demostrar este hecho, la primera de las cuales data de 1933, y fue llevada a cabo por los investigadores norteamericanos Fletcher y Munson. El experimento consistía en lo siguiente. Se hacía escuchar a personas de buena audición un tono puro (es decir senoidal) de 1 kHz y de un nivel de presión sonora conocido, por ejemplo 40 dB. Luego se les presentaba un tono de otra frecuencia (por ejemplo 200 Hz) y se les pedía que ajustaran el volumen hasta que les pareciera igualmente sonoro que el tono de 1 kHz. Por último se medía el nivel de presión sonora. Repitiendo este experimento con diversas frecuencias y niveles de presión sonora se obtuvieron las curvas de igual nivel de sonoridad, o curvas de Fletcher y Munson, que se adjuntan en la Figura 2.4. Estas curvas permitieron definir el nivel de sonoridad, NS, de un tono como el nivel de presión sonora de un tono de 1 kHz igualmente sonoro que dicho tono.

Para diferenciar el nivel sonoro del nivel de presión sonora, se lo expresa en fon. En la Figura 2.4 se muestra el ejemplo de un tono de 200 Hz y 40 dB, el cual se escucha igualmente sonoro que uno de 1000 Hz y 20 dB, de donde el primero tiene NS = 20 fon. Las curvas extremas son los límites de la audición humana.
La correspondiente a 0 fon es el umbral de audición, por debajo del cual una vibración del aire no es perceptible. Conviene aclarar que el umbral de audición depende realmente de la persona y del estado de su oído. La curva de 0 fon es el umbral para personas de buena audición. Una pérdida de 10 a 20 dB respecto a este umbral se considera normal. Por encima de los 25 dB de pérdida, comienzan las dificultades para la comprensión oral. La curva de 120 fon corresponde al umbral de dolor. De allí para arriba, en lugar de sonido como tal comienza a percibirse un dolor intenso, además de empezar de inmediato el daño irreversible del oído interno.
Las curvas de Fletcher y Munson permiten explicar diversos fenómenos y hechos que se observan en audiotécnica, por ejemplo por qué se requiere mayor potencia de un equipo de sonido para tener buenos graves que para lograr una adecuada respuesta en frecuencias medias. Son también la razón de los filtros de sonoridad de los equipos de sonido, que aumentan la proporción de graves cuando se escucha a bajo volumen. También explican por qué un equipo de baja potencia y mala calidad puede así y todo sonar “fuerte”: al distorsionar el sonido, agrega armónicos de alta frecuencia que se escuchan más que las bajas frecuencias originales.
Una vez conocida esta característica de la audición, se pretendió construir un instrumento de medición capaz de indicar no la variable física asociada (por ejemplo el nivel de presión sonora), sino precisamente el nivel sonoro. Si bien ninguno de los intentos
resolvió el problema por completo, se logró una solución aceptable agregando a un decibelímetro un filtro que tuviera una respuesta similar a la del oído. Para ello, antes de realizar la medición simplemente se atenúan los graves, que es justamente lo que hace el oído. El resultado fue una nueva escala de decibeles: los decibeles A (dBA), que se popularizó a tal punto que la mayoría de las mediciones de sonido o ruido hoy en día se expresan en dBA. Las excepciones son los casos en que se requiere valores objetivos con carácter experimental. El instrumento utilizado para medir dBA es el medidor de nivel sonoro (no debe confundirse nivel sonoro con nivel de sonoridad, ya que el primero es el resultado de aplicar el filtro antedicho, mientras que el segundo es el parámetro psicoacústico definido por las curvas de Fletcher y Munson). En la Tabla 2.2 se resumen algunos niveles sonoros de fuentes y ambientes típicos, que puede ser de utilidad para estimar un nivel sonoro cuando no se dispone de un medidor de nivel sonoro.

2.5. Timbre
El timbre de un sonido es una cualidad compleja, que depende de varias características físicas. El estudio de los diversos aspectos del timbre fue muy motivado por el deseo de reproducir artificialmente los sonidos de los instrumentos naturales, así como de crear timbres completamente nuevos, dando origen a diversas técnicas de síntesis de sonidos. Si bien hoy en día los sintetizadores electrónicos son los de mayor difusión y expansión, la síntesis de sonidos cuenta con varios siglos de historia. En efecto, el órgano de tubos puede atestiguar los esfuerzos del ingenio humano en este sentido. Hay dos enfoques para el análisis del timbre. El primero estudia los sonidos aislados, y se propone identificar todos los elementos que los distinguen de otros sonidos. El segundo enfoque, clasifica los sonidos según la fuente (por ejemplo un instrumento), y asocia una cualidad tímbrica con cada fuente.

El primer enfoque distingue un sonido grave de un clarinete, por ejemplo, de otro sonido agudo del mismo instrumento. De hecho, quien no conoce el clarinete, al escuchar separadamente ambos registros (grave y agudo) puede pensar que se trata de instrumentos diferentes. Aquí intervienen dos elementos: el espectro y las envolventes. Hay una envolvente primaria, que es la que determina la forma en que varía en el tiempo la amplitud general, y una serie de envolventes secundarias, que corresponden a las variaciones temporales relativas de los armónicos o de los parciales (según que el espectro sea armónico o inarmónico respectivamente). La envolvente primaria está fuertemente relacionada con la forma en que se produce el sonido, y caracteriza a familias completas de instrumentos. Las envolventes secundarias dependen de la manera en que se amortiguan las diferentes frecuencias del espectro. En los sintetizadores electrónicos de sonidos se ha procurado desde el principio proveer recursos para controlar estas envolventes. Al principio se trabajaba con una envolvente primaria de 4 tramos, denominada ADSR (siglas de Attack-Decay-Sustain- Release, es decir Ataque-Caída-Sostén-Relevo), que se muestra en la Figura 2.5. Los sintetizadores actuales permiten, según su complejidad (lo cual en general está en proporción al costo), definir las envolventes con mayor precisión, es decir con mayor cantidad de tramos. Las envolventes secundarias se han implementado con una multitud detécnicas, por ejemplo la utilización de filtros variables con el tiempo, la modulación de frecuencia, y la síntesis aditiva. Las envolventes mencionadas varían con la altura del sonido, es decir con su frecuencia, y también pueden variar con la intensidad, es decir con la amplitud del sonido. En el primer caso, resulta natural que en los sonidos de mayor frecuencia los tiempos se reduzcan, ya que a mayor frecuencia las cosas suceden más rápido. En el segundo caso, los sonidos más intensos producen un efecto equivalente a una distorsión, lo cual agrega más frecuencias al espectro o refuerza las ya presentes, modificando de hecho las envolventes secundarias.

2.6. Formantes
El segundo enfoque de análisis del timbre, en cambio, busca las características comunes a todos los sonidos de un instrumento o de una voz, y las que los distinguen de los sonidos de otros instrumentos o voces. El elemento fundamental de este análisis es la existencia de resonancias en los componentes accesorios al mecanismo propiamente dicho de producción del sonido, resonancias que filtran el sonido, favoreciendo determinadas frecuencias más que otras.
Para ilustrar este concepto, tomemos por ejemplo la voz humana. El mecanismo que produce el sonido son las denominadas cuerdas vocales, ubicadas en la laringe, detrás de la nuez de Adán (protuberancia notoria en los varones a la mitad del cuello). Dicho sonido es filtrado por las diversas cavidades del conducto vocal: la laringe, la cavidad oral (boca) y la cavidad nasal (interior de la nariz). Estas cavidades actúan como tubos, y es sabido que al escuchar a través de un tubo, el sonido se “colorea”, es decir que adquiere una cualidad diferente de la original, debido precisamente a su acción filtrante, que privilegia algunas frecuencias sobre otras. Cada una de las cavidades agrega una “coloración” propia, que se combinan para originar no sólo el timbre particular de cada voz, sino el que corresponde, dentro de una misma voz, a cada vocal.

Las frecuencias de las resonancias se denominan formantes. En la Figura 2.6 se muestra, mediante un ejemplo, la forma en que actúan los formantes. Por simplicidad se ha supuesto que el sonido original tiene un espectro compuesto por varios armónicos de igual amplitud. Luego de atravesar el filtro, aquellos armónicos cuyas frecuencias son cercanas a los formantes F1, F2 y F3 predominan frente a las otras.
El cerebro es capaz de realizar (inconscientemente) un análisis tan elaborado de los sonidos que percibe el oído como para detectar los formantes característicos de un instrumento o fuente sonora, y así asociar como pertenecientes a un único timbre sonidos
con espectros bastante diversos. Por esta razón, el timbre puede reconocerse aún cuando debido a una deficiencia de un sistema de sonido el espectro se altere. Esto sucede, por ejemplo, en los equipos de mala calidad, que atenúan las frecuencias bajas (graves) así como las altas (agudos).
Sin embargo, los formantes, que habitualmente están en la región central del espectro, es decir entre los 200 Hz y los 4000 Hz, no son tan severamente afectados y por lo tanto “sobreviven” a la distorsión, permitiendo reconocer el timbre. Un ejemplo son las
radios de bolsillo. Otro es el teléfono; en este caso, la fundamental (primer armónico) de las voces masculinas (y de gran parte de las femeninas) es virtualmente eliminada, lo que no impide que sigamos reconociendo ni los fonemas ni los timbres de voz. No obstante, conviene aclarar que la mera identidad tímbrica no es equivalente a la fidelidad del sonido, aunque en muchos casos, como en el sistema telefónico, es suficiente con la primera para lograr una buena inteligibilidad del mensaje.

Para concluir con esta breve descripción del timbre, es interesante observar que ni los formantes, ni las envolventes ni el espectro tomados aisladamente permiten explicar el timbre, que es más bien resultado de la interacción de todos estos factores. Se han realizado experimentos en los cuales se priva al sonido de un instrumento de su ataque (es decir se altera severamente su envolvente), y el sonido se vuelve prácticamente irreconocible, aunque sus formantes y su espectro no varíen. Por ejemplo, quitando el ataque al piano se obtiene un sonido que más bien parecerá ser de algún instrumento de viento. Del mismo modo, si conservamos la envolvente original pero cambiamos los formantes, se escuchará un sonido algo percusivo como el del piano, pero indudablemente
diferenciado de aquél. Se han realizado multitud de experimentos que muestran fenómenos de este tipo y que ponen de manifiesto la complejidad del timbre.

2.7. Direccionalidad del sonido
Hasta el momento hemos estudiado el sonido como una onda de presión que pasaba por un lugar, sin prestar atención a su procedencia. Pero los sonidos reales se originan en fuentes que están ubicadas en algún lugar del espacio circundante, dando origen
a dos tipos de sensaciones: la direccionalidad y la espacialidad. La direccionalidad se refiere a la capacidad de localizar la dirección de donde proviene el sonido. Esta sensación es la que nos permite ubicar visualmente una fuente sonora luego de escucharla. La
espacialidad, en cambio nos permite asociar un sonido con el ambiente en el cual éste se propaga, y estimar por ejemplo las dimensiones de una habitación o una sala sin necesidad de recurrir a la vista.
La direccionalidad está vinculada con dos fenómenos. El primero es la pequeña diferencia de tiempos que hay entre la percepción de un sonido con el oído derecho y con el oído izquierdo, debido a que el recorrido de la onda sonora desde a la fuente (un
instrumento, por ejemplo) hasta cada oído es diferente (Figura 2.7). Así, un sonido proveniente de la izquierda llegará antes al oído izquierdo, simplemente porque éste está más cerca de la fuente sonora. Esta diferencia es siempre menor que 0,6 ms. El otro fenómeno es la diferencia de presiones sonoras (o intensidades), también causada por la diferencia entre las distancias. En el ejemplo del sonido que viene de la izquierda, la presión sonora es mayor en el oído izquierdo, no sólo por estar más cerca de la fuente, sino porque además la cabeza actúa como barrera para el sonido.

2.8. Efecto Haas (de precedencia)
Un experimento interesante consiste en alimentar unos auriculares estereofónicos con dos señales iguales, una de las cuales se encuentra ligeramente retardada respecto a la otra (Figura 2.8). Si se va aumentando el retardo desde 0 a 0,6 ms, se crea la sensación de una fuente virtual (es decir aparente) que parece desplazarse desde el frente hacia el lado que no experimenta retardo. Después de los 0,6 ms y hasta los 35 ms de retardo, la fuente virtual permanece más o menos fija, pero parece ensancharse cada vez más. Para retardos mayores de 35 ms la fuente virtual se divide en dos, percibiéndose separadamente ambos canales, como provenientes de fuentes diferentes. A medida que el retardo se hace mayor, el segundo sonido aparece como un eco del primero. Este experimento ilustra el denominado efecto de precedencia, o también efecto Haas (en honor al investigador que estudió sus consecuencias para la inteligibilidad de la palabra), que puede utilizarse para controlar de un modo más realista la ubicación aparente de una fuente en la imagen estereofónica.

2.9. Espacialidad
La espacialidad del sonido depende de varios factores. El primero es la distancia entre la fuente y el oído. Esto está vinculado a la familiaridad que se tenga con una fuente sonora específica (o un tipo de fuente). A mayor distancia, la presión sonora es menor, lo que hace que si se conoce la fuente, se pueda tener una idea de la distancia. Por ejemplo, si escuchamos a alguien hablar normalmente, podemos saber si se encuentra cerca o lejos. Si se trata de una fuente desconocida, el cerebro la asociará inconscientemente con alguna fuente que resulte más familiar. El segundo factor lo constituyen las reflexiones tempranas. En el descampado, la onda sonora generada por una fuente se aleja indefinidamente atenuándose hasta volverse inaudible (Figura 2.9a). En un ambiente cerrado, en cambio, la onda sonora se reflejaen las paredes múltiples veces (Figura 2.9b). Las primeras reflexiones se denominan reflexiones tempranas. Las reflexiones tempranas proveen al sistema auditivo una clave temporal que se relaciona con la distancia entre las paredes, lo cual a su vez se vincula al tamaño del ambiente. Esto crea la sensación de ambiencia. El tercer factor que hace a la espacialidad del sonido es la reverberación. El fenómeno de la reverberación se produce como consecuencia de las numerosas reflexiones tardías del sonido. Mientras que las primeras reflexiones (las reflexiones tempranas) están distanciadas considerablemente, las subsiguientes comienzan a superponerse entre sí, debido a que aparecen las reflexiones de las reflexiones, y luego las reflexiones de las reflexiones de las reflexiones, y así sucesivamente. Esto lleva a que al cabo de unos pocos instantes se combinen miles de reflexiones que dan origen a la reverberación (Figura 2.10).

El efecto más conocido de la reverberación es el hecho de que el sonido se prolonga aún después de interrumpida la fuente. Por ejemplo si golpeamos las manos, aunque el sonido generado es muy corto, “permanece” en el ambiente durante algunos instantes. El tiempo de permanencia, o tiempo de reverberación, depende de las características acústicas del ambiente, y nos da una clara sensación de espacialidad que puede y debe ser aprovechada en audiotécnica para evocar ambientes de gran realismo.

El último factor que interviene en la sensación de espacialidad es el movimiento de la fuente. Muchas fuentes son fijas, pero otras son móviles, y la movilidad es percibida a través no solo del desplazamiento evocado por la dirección de procedencia del sonido, sino por el denominado efecto Doppler, por el cual la frecuencia de una fuente móvil parece cambiar. Así, cuando una ambulancia se acerca a nosotros, la altura (frecuencia) del sonido emitido por la sirena es mayor (más agudo) que cuando la ambulancia se detiene. Cuando, contrariamente, ésta se aleja, la altura baja, (más grave). Este efecto sólo rara vez se utiliza en música, ya que normalmente se supone que los instrumentos musicales se mantienen en una posición determinada, o los eventuales desplazamientos
se producen con lentitud, siendo el cambio de frecuencia imperceptible.

Tiene aplicación, sin embargo, en las bandas de sonido de películas o videos, ya que permite simular con mayor realismo una fuente móvil (típicamente un vehículo).

2.10. Enmascaramiento
Dentro de las cualidades del oído hay una que tiene consecuencias de gran importancia para la audición, y es el hecho de que los sonidos son capaces de enmascarar a otros sonidos. Enmascarar a un sonido significa ocultarlo o hacerlo imperceptible. El enmascaramiento es un fenómeno bastante familiar para todos. Sucede, por ejemplo, cuando intentamos escuchar a alguien que habla en medio de un ruido muy intenso: no podemos discriminar lo que dice porque su voz es enmascarada por el ruido.
Es interesante observar que el enmascaramiento es una propiedad del oído, no del sonido. En un buen equipo de audio, si mezclamos un sonido muy intenso (por ejemplo 90 dB) con otro muy débil (por ejemplo 20 dB), la salida de los parlantes contendrá ambos sonidos en sus proporciones originales. Esto puede comprobarse aislando sucesivamente, mediante filtros adecuados, uno u otro sonido. Sin embargo el oído no percibirá el de 20 dB.
Se ha estudiado con gran detalle el efecto enmascarador de los sonidos sobre otros sonidos. Para ello se determinó cómo cambia la curva del umbral de audición ante la presencia de un sonido dado (denominado sonido máscara, o sonido enmascarante). Esta determinación se repitió para diversos sonidos máscara, de distintas frecuencias, amplitudes y contenidos espectrales. A modo de ejemplo, en la Figura 2.11 se muestra el efecto de un tono máscara de 400 Hz para varios niveles sonoros (40 dB, 60 dB y 80 dB). Se puede apreciar que a medida que aumenta el nivel de presión sonora del tono máscara, mayor resulta el incremento del umbral, lo cual significa que los otros tonos deberán ser cada vez más intensos para no ser enmascarados. Por otra parte, la región enmascarada se ensancha, vale decir que la zona de influencia de la máscara crece. En otras palabras, al aumentar el nivel del tono máscara, se produce un incremento cuantitativo (mayor nivel) y cualitativo (más frecuencias) del umbral. El enmascaramiento es, en cierto sentido, un defecto del oído, pero también es una virtud, ya que nos permite desembarazarnos de una cantidad de información inútil o difícil de procesar por el cerebro. Una interesante aplicación del enmascaramiento es la compresión de los datos de audio digital, de manera de reducir la cantidad de espacio requerido para almacenar un tiempo dado de música. La técnica se basa en aprovechar que mucha información que aparece en una grabación de alta calidad no aporta nada a la audición, ya que es enmascarada por otros tonos presentes, de modo que puede eliminarse, con ahorro de espacio. Por ejemplo, si se detecta que existe un tono de 400 Hz de 80 dB, de acuerdo a lo indicado por la curva de 80 dB de la Figura 2.11 un tono de 1 kHz y 30 dB será inaudible, y por consiguiente se puede eliminar sin perjuicio alguno para la calidad de la reproducción. Esta idea se aplica en los DCC (Digital Compact Cassette, o cassette compacto digital) y en los MD (Minidisc), así como en el formato comprimido MP3 usado en Internet. Últimamente también se está utilizando para mejorar la calidad de los CD (Compact Disc) del estándar de 16 bits a 19 ó 20 bits. La música funcional de los locales comerciales, los bares y algunas salas de espera de consultorios médicos, también aprovecha el fenómeno de enmascaramiento, posibilitando cierta “privacidad pública”, al impedir que las conversaciones ajenas puedan ser escuchadas por terceras personas.

Por último, también se apela al enmascaramiento en forma inconsciente cuando se incrementa el volumen de un equipo de música o del walkman ante la existencia de ruidos ambientes. En este caso, al elevar el nivel sonoro de la música, ésta enmascara al
ruido ambiente, permitiendo escuchar la música en mejores condiciones. En el mundo moderno el ruido ambiente es considerable, lo que ha llevado a la sociedad al acostumbramiento, y aún a la predilección por la música “a todo volumen”. Esto es potencialmente
peligroso para la salud auditiva (ver capítulo 5), ya que para enmascarar el ruido con la música se requiere que el nivel de ésta se encuentre entre 20 y 30 dB por arriba del ruido. Así, si el ruido ambiente es de 75 dB, es probable que el usuario del walkman
esté escuchando a un nivel cercano a los 100 dB.

Acústica Física

1.1. Introducción
La Acústica es la disciplina que se ocupa de estudiar el sonido en sus diversos aspectos. Se puede dividir en una gran cantidad de subdisciplinas, algunas de las cuales se listan en la Tabla 1.1. Nosotros nos ocuparemos brevemente de sólo de las cuatro primeras
de éstas, a saber: la acústica física, la psicoacústica, la acústica musical y la acústica arquitectónica. En este primer capítulo nos dedicaremos a los rudimentos de la acústica física, es decir el estudio de los fenómenos sonoros por medio de modelos físicos
y matemáticos.

1.2. El sonido: un fenómeno ondulatorio
El sonido consiste en la propagación de una perturbación en el aire. Para comprender mejor este concepto imaginemos un tubo muy largo lleno de aire, con un pistón en un extremo. El aire está formado por una cantidad muy grande de pequeñas partículas
o moléculas. Inicialmente, el aire dentro del tubo está en reposo, o, más técnicamente, en equilibrio (Figura 1.1a). Este equilibrio es dinámico, lo cual significa que las moléculas no están quietas, sino que se mueven caóticamente en todas las direcciones
debido a la agitación térmica, pero con la particularidad de que están homogéneamente repartidas en el interior del tubo. En otras palabras, en cada centímetro cúbico (cm3) de aire, ya sea cerca del pistón o lejos de él, hay aproximadamente la misma cantidad de
moléculas (una cantidad muy grande: unos 25 trillones).

Supongamos ahora que se desplaza rápidamente el pistón hacia el interior del tubo (Figura 1.1b). Las moléculas que se encuentran junto al pistón serán empujadas por éste, mientras que las que se encuentran muy alejadas no. Esto implica que en la zona
del pistón el aire se encontrará más comprimido que lejos de él, es decir que la misma cantidad de aire ahora ocupa menos espacio. En otras palabras, habrá ahora más moléculas por centímetro cúbico cerca del pistón que lejos de él. Al igual que lo que sucede
cuando se abre la válvula de un neumático, el aire comprimido tiende a descomprimirse, desplazándose hacia la derecha, y comprimiendo a su vez el aire que se encuentra próximo a él (Figura 1.1c). Esta nueva compresión implica, otra vez, una tendencia a descomprimirse, que se efectiviza a costa de comprimir el aire contiguo (Figura 1.1d). El proceso se repite así en forma permanente, con lo cual la perturbación original (la compresión del aire cercano al pistón) se propaga a lo largo del tubo alejándose de la fuente
de la perturbación (el pistón). Este proceso se denomina también propagación de una onda sonora, y es similar a lo que sucede cuando en una pileta en calma se deja caer una piedra. En el instante en que la piedra golpea el agua, se produce una perturbación, que se propaga en forma de una circunferencia cuyo radio va en aumento, como se aprecia en la Figura 1.2.

Al aire libre, es decir sin la restricción de un tubo (y en ausencia de superficies que reflejen el sonido), la perturbación se propaga, similarmente, en forma de una onda esférica cuyo radio va aumentando a medida que transcurre el tiempo.
1.3. Velocidad del sonido
Ahora nos preguntamos qué tan rápido se aleja la onda de la fuente. La respuesta es que el sonido se propaga con una velocidad c que en el aire a 23 ºC vale:
c = 345 m/s ,o bien c = 1242 km/h .
Esta velocidad varía algo con la temperatura (un 0,17 %/ºC), por eso en diversos textos pueden encontrarse valores ligeramente diferentes. Una observación importante es que la velocidad del sonido es independiente de la intensidad de la perturbación.

Veamos algunos ejemplos. Si una persona se encuentra a 100 m de distancia de otra (aproximadamente una cuadra), un grito de la primera demorará, a causa de esta velocidad, 29 centésimas de segundo en llegar a donde se encuentra la segunda. Otro ejemplo es el de los relámpagos y los truenos. Un relámpago es una enorme chispa que se produce por una descarga eléctrica entre distintas capas de aire con cargas opuestas. Esta chispa produce a la vez luz y sonido. Sin embargo, la luz viaja a una velocidad mucho más alta, y alcanza nuestra vista casi instantáneamente, mientras que el sonido demora un tiempo apreciable en llegar a nosotros. Así, si cronómetro en mano comprobamos que el trueno se escucha 5 s después de ver un relámpago, conociendo la velocidad del sonido podemos calcular que el relámpago se produjo a una distancia:
d = 345 m/s ´ 5 s = 1725 m = 1,725 km.
Otro ejemplo interesante es el eco. Si gritamos frente a una superficie vertical un tanto alejada (por ejemplo una barranca o un acantilado), el sonido tardará un tiempo en llegar a la superficie, se reflejará en ella, y volverá demorando otro tiempo adicional. El
resultado será que se escucha, unos instantes después, que la pared “repite” el grito. Más adelante veremos ejemplos correspondientes a los sistemas de sonido, en los cuales a causa de la distancia entre los parlantes y el público se producen retardos que es preciso corregir.

1.4. Sonidos periódicos
El fenómeno sonoro que analizamos anteriormente (Figura 1.1) consistía en una única perturbación del aire. La mayor parte de los sonidos de la naturaleza son, en realidad, el resultado no de una sino de múltiples perturbaciones sucesivas. Estos sonidos se denominan periódicos, y pueden dividirse en ciclos, donde cada ciclo abarca todo lo que sucede entre dos perturbaciones sucesivas del aire.
En la Figura 1.3 se muestra un ejemplo de un sonido de este tipo.
En (a) todavía no se ha producido ninguna perturbación.
En (b) se produce la primera perturbación, que se propaga con una velocidad c alejándose del pistón.
En (c), después de que la perturbación ha recorrido cierta distancia, el pistón se mueve nuevamente provocando una segunda perturbación. Mientras la primera perturbación sigue desplazándose con velocidad c, la segunda comienza a hacerlo también con velocidad c. En (d) y (e), se agregan nuevas perturbaciones, las cuales a su vez se propagarán con idéntica velocidad, y así sigue el proceso hasta que en algún momento cesa el sonido. Siguiendo con la analogía de la piedra que cae en la pileta, podemos pensar en
una sucesión de guijarros que caen sobre la superficie del agua, lo cual dará lugar a una serie de círculos concéntricos que van agrandándose a medida que van surgiendo nuevos círculos. Análogamente, al aire libre, y lejos de toda superficie capaz de reflejar el
sonido, las sucesivas perturbaciones se propagarán como esferas concéntricas crecientes que se alejan de la fuente. En presencia de superficies reflectoras, la onda deja de ser esférica para volverse sumamente compleja. Muchas veces se habla de campo sonoro para referirse a la forma en que se distribuye el sonido en los diversos puntos de un determinado espacio, por ejemplo dentro de una sala o al aire libre.

1.5. Longitud de onda
Vamos ahora a definir algunos parámetros muy importantes relacionados con los sonidos periódicos. El primero es la longitud de onda, que se representa con la letra griega lambda, l, y es la distancia entre dos perturbaciones sucesivas en el espacio (Figura 1.3). Se mide en metros (m) o en centímetros (cm), y para los sonidos audibles está comprendida entre los 2 cm (sonidos muy agudos) y los 17 m (sonidos muy graves). La longitud de onda es importante en varias situaciones. En primer lugar, un objeto grande comparado con la longitud de onda es capaz de alterar significativamente la propagación del sonido cuando se interpone entre la fuente sonora y el oyente. Así, por ejemplo, los sonidos graves pueden “doblar la esquina” fácilmente porque su longitud de onda es grande. Los agudos, en cambio, cuya longitud de onda puede ser de apenas algunos cm, se ven considerablemente atenuados.

Otra situación en la cual la longitud de onda juega un papel importante es en la eficiencia de los altavoces. Cuando la longitud de onda l emitida por un parlante es mucho más pequeña que su propio tamaño, la potencia emitida se reduce considerablemente.
Por esa razón, los tweeters (altavoces de agudos) son mucho más pequeños que los woofers (altavoces de graves).
Por último, veremos más adelante que la respuesta de los micrófonos se altera para aquellos sonidos de longitud de onda l comparable con el tamaño del micrófono.

1.6. Periodo
Un segundo parámetro es el periodo, T, que se define como el tiempo transcurrido entre una perturbación y la siguiente. Se mide en segundos (s) o milisegundos (ms), es decir la milésima parte de un segundo. El periodo de los sonidos audibles para el ser humano varía entre los 0,05 ms (sonidos muy agudos) y los 50 ms (sonidos muy graves). Cabe destacar que son tiempos muy cortos que impiden en general que los ciclos puedan percibirse como fenómenos separados. El cerebro tiende a integrarlos en una única sensación, la sensación sonora.

1.7. Frecuencia
El tercer parámetro, uno de los más fundamentales en Acústica, es la frecuencia, f. Se define como la cantidad de ciclos por segundo, o lo que es lo mismo, la cantidad de perturbaciones por segundo. Se expresa en hertz (Hz), unidad llamada así en honor Heinrich Hertz, científico del siglo XIX que descubrió las ondas de radio. Esta unidad es equivalente al ciclo por segundo (cps), aunque la unidad Hz se encuentra más frecuentemente en los textos y en las especificaciones técnicas de los diversos equipos. La frecuencia de los sonidos audibles está comprendida entre los 20 Hz (sonidos graves) y los 20.000 Hz (sonidos agudos) ó 20 kHz (kilohertz, es decir 1.000 Hz). Existen algunas relaciones matemáticas importantes entre estos parámetros. Así, el periodo T y la frecuencia f están relacionados por las ecuaciones n las cuales si T se expresa en s, entonces f se expresa en Hz, y si T se expresa en ms, f se expresa en kHz. Por ejemplo, si sabemos que el periodo de cierto sonido es de 0,01 s, es decir 1/100 s, entonces la frecuencia será, aplicando la primera relación, 100 Hz. Si, en cambio conocemos que la frecuencia es de 1.000 Hz, aplicando la segunda relación se llega a que el periodo es de 0,001 s, es decir 1 ms.

La otra relación importante es la que vincula la longitud de onda con la frecuencia, y es la siguiente:

Como segundo ejemplo, la voz masculina (al hablar normalmente) tiene una frecuencia de unos 120 Hz, lo cual corresponde, según la fórmula anterior, a una longitud de onda de 2,88 m.

1.8. Presión sonora
Según hemos visto, el sonido puede considerarse como una sucesión de ondas de compresión seguidas por ondas de descompresión que se propagan por el aire a una velocidad de 345 m/s. Sin embargo, si nos ubicamos en una posición fija, veremos que la presión atmosférica aumenta y disminuye periódicamente, conforme pasan por el lugar las sucesivas perturbaciones. Dado que nos referiremos bastante seguido a valores de presión, conviene aclarar que la unidad adoptada internacionalmente para la presión
es el Pascal, abreviada Pa. Expresada en esta unidad, la presión atmosférica es del orden de 100.000 Pa (o, como se suele anunciar en los informes meteorológicos, alrededor de 1.000 hPa, donde hPa es la abreviatura de hectopascal, es decir 100 Pa). Ahora
bien. Los aumentos y las disminuciones de presión debidas a las ondas sonoras son realmente muy pequeños comparados con este valor de presión atmosférica. Los sonidos más intensos que se perciben como tales (después de eso se perciben como dolor)
implican un aumento de unos 20 Pa. Para distinguir este incremento de la presión atmosférica en ausencia de sonido, se lo denomina presión sonora, abreviada p. Así, la presión sonora es lo que se debe agregar a la presión atmosférica en reposo para obtener
el valor real de presión atmosférica. Por ejemplo, si la presión en reposo es de 100.000 Pa y la presión en presencia de un sonido es de 100.008 Pa, entonces la presión sonora es:
p = 100.008 Pa – 100.000 Pa = 8 Pa .

El trabajar con la presión sonora en lugar de la presión total, nos ahorra tener que arrastrar números con gran cantidad de cifras.
Las presiones sonoras audibles varían entre 0,00002 Pa y 20 Pa. El valor más pequeño, también expresado como 20 mPa (donde mPa es la abreviatura de micropascal, es decir una millonésima de Pa), se denomina umbral auditivo.

1.9. Representación gráfica del sonido
Hasta ahora no habíamos tenido en cuenta la manera en que se aplican las perturbaciones sucesivas. Así, podría ocurrir que éstas fueran el resultado de un suave vaivén del pistón, o que por el contrario cada perturbación consistiera en una brusca sacudida
del mismo. La realidad es que aún manteniéndose la frecuencia, ambos sonidos sonarán muy diferentes, lo cual muestra la importancia de conocer la forma de la perturbación.Para ello se utiliza un tipo de representación gráfica denominada oscilograma, que consiste en mostrar la evolución en el tiempo de la perturbación (Figura 1.4) en un par de ejes correspondientes al tiempo (eje horizontal) y a la presión sonora (eje vertical).

El significado de este gráfico es que para cada instante t, representado como un punto o posición en el eje horizontal, corresponde una presión sonora p, representada por una altura medida en la escala del eje vertical. Los valores positivos (arriba del eje t) representan compresiones y los valores negativos (debajo del eje t), descompresiones. Es interesante explorar el significado del periodo T y de la frecuencia f en un oscilograma. En la Figura 1.4 se puede apreciar que T es la duración de cada ciclo o porción repetitiva de la onda. En la Figura 1.5, se ha dibujado la onda durante un tiempo de 1 s (en otra escala). Dado que hay 12 ciclos en dicho tiempo, la frecuencia es de 12 Hz.

1.10. Amplitud
El oscilograma nos permite interpretar fácilmente un parámetro del sonido vinculado a la fuerza o intensidad del mismo: la amplitud. La amplitud se define como el máximo valor que alcanza una oscilación en un ciclo. La amplitud se denomina también valor de pico o valor pico.
En la Figura 1.6 vemos la misma forma de onda con dos amplitudes diferentes.

1.11. Envolvente
La amplitud de un sonido no es necesariamente constante, sino que puede variar en el tiempo. De hecho, la mayor parte de los sonidos reales tienen amplitud variable. Se define la envolvente de un sonido como la forma que se obtiene uniendo las amplitudes de los ciclos sucesivos. En la Figura 1.7 se puede apreciar una onda cuya amplitud varía en el tiempo. En línea de trazos se muestra la envolvente respectiva.

Veremos que la envolvente es uno de los factores decisivos en la determinación del timbre de una voz o instrumento. El otro factor es el espectro, que veremos también oportunamente.

1.12. Nivel de presión sonora
Para el rango de los sonidos audibles, la presión sonora varía entre valores extremadamente pequeños (0,00002 Pa = 20 ´ 10-6 Pa) hasta valores que si bien todavía pequeños, son un millón de veces más grandes que los anteriores (20 Pa). Estas cifras son poco prácticas de manejar, por lo cual se ha introducido otra escala que comprime este rango: la escala de decibeles. Para expresar una presión sonora en decibeles, se define primero una presión de referencia Pref que es la mínima presión sonora audible (correspondiente al sonido más suave que se puede escuchar):

en realidad importante desde el punto de vista práctico, ya que el instrumento con el que se mide NPS, es decir el decibelímetro, no está graduado en valores de presión, sino precisamente en dB, por lo cual en la práctica no hace falta calcular el valor de NPS a partir del correspondiente valor de presión.

En la Tabla 1.2 se indican algunos valores de conversión entre presión sonora y nivel de presión sonora.

1.13. Algunas formas de onda
Podemos afirmar que virtualmente cada sonido implica una forma de onda diferente. Existen sin embargo algunas formas de onda que reciben especial atención, ya sea por su simplicidad o por su utilidad práctica o teórica. La primera de ellas es la onda cuadrada, que consiste en dos niveles (generalmente uno positivo y el otro negativo) que se van alternando en el tiempo. Cada uno de ellos permanece un tiempo T/2, donde T es el periodo. En la Figura 1.8 se muestra un ejemplo. Esta onda es importante por su simplicidad geométrica. No existe en la Naturaleza, pero es muy fácil de sintetizar electrónicamente.

Una variante de la onda cuadrada es el tren de pulsos, en el cual el tiempo de permanencia en cada uno de los dos niveles no es el mismo. Se suele especificar un porcentaje que corresponde a la proporción del periodo en el nivel alto. En la Figura 1.9 se muestra un tren de pulsos al 25%.

La onda diente de sierra (Figura 1.11) tiene una subida rápida y una bajada en forma de rampa o viceversa. Si bien tampoco es una forma de onda natural, la forma de onda del sonido del violín guarda cierta similitud con la diente de sierra. También tienen esta forma de onda los sonidos que se generan al rozar dos objetos, por ejemplo el chirrido cuando se frota rápidamente una tiza en una pizarra.

1.14. Onda senoidal
Finalmente, tenemos la onda más importante, no sólo en Acústica sino en toda la Física y gran parte de la Matemática: la onda senoidal (Figura 1.12), también denominada senoide o sinusoide. Si bien matemáticamente tiene cierta complicación (está representada por la función trigonométrica seno), físicamente esta forma de onda corresponde a las oscilaciones más sencillas posibles. Pocos sistemas son tan simples como para oscilar senoidalmente. El más conocido es el péndulo: la oscilación de un peso suspendido de un hilo sigue una ley senoidal. En el campo de la música, el diapasón de horquilla (no confundir con el corista o afinador de banda) produce un sonido casi puramente senoidal. El silbido es también casi senoidal, y lo mismo ocurre con una flauta ejecutada piano (suave). Una cuerda de guitarra punteada muy suavemente en su punto medio también produce un sonido aproximadamente senoidal.

1.15. Espectro del sonido
Vimos que cualquier sonido periódico puede representarse como la suma de una serie de armónicos, es decir de sonidos senoidales cuyas frecuencias son f, 2f, 3f, 4f, 5f, etc. Por ejemplo, el LA central del piano, cuya frecuencia es de 440 Hz, contiene armónicos de frecuencias 440 Hz, 880 Hz, 1320 Hz, 1760 Hz, 2200 Hz, etc. Cada uno de estos armónicos puede tener su propia amplitud. En la Figura 1.13a se muestran los primeros armónicos de una onda cuadrada, y en la Figura 1.13b se ha obtenido su suma, que según se aprecia se va aproximando a la onda cuadrada.

La información sobre las frecuencias que contiene un determinado sonido y sus respectivas amplitudes constituyen lo que se denomina el espectro del sonido. El espectro se puede especificar en forma de tabla, o se puede representar gráficamente mediante un espectrograma, que es un gráfico con dos ejes: el horizontal, graduado en frecuencia, y el vertical, en amplitud. En la Tabla 1.3 se indican los primeros armónicos para las ondas cuadrada, triangular y diente de sierra, suponiendo que la amplitud es, en los tres casos, 1. En la Figura 1.14 se ha representado el espectrograma para una onda cuadrada de amplitud 1 y frecuencia 100 Hz, incluyendo hasta el armónico 7.

Así como la amplitud de un sonido puede variar en el tiempo de acuerdo con su envolvente, también es posible que los diversos armónicos que integran determinada forma de onda posean sus correspondientes envolventes, que no tienen por qué ser iguales. De hecho, esto es lo que sucede en la mayoría de los sonidos naturales. Un caso bastante común es que los armónicos superiores (los de frecuencias más altas) se extingan antes que los de menor frecuencia, quedando al cabo de unos segundos un sonido prácticamente senoidal. Esto sucede por ejemplo en el piano, cuyos sonidos comienzan con un gran contenido armónico (en cantidad y amplitud), lo cual se manifiesta como una sonoridad brillante e incisiva. A medida que transcurre el tiempo, los armónicos de
mayor frecuencia van desapareciendo, y el sonido se vuelve más opaco. Agregando un tercer eje para representar el tiempo (lo cual obliga a una representación tridimensional, a menudo hecha sobre el papel o la pantalla recurriendo a la perspectiva), es posible representar gráficamente la variación temporal de cada armónico, como se muestra en la Figura 1.15.

1.16. Espectros inarmónicos
Hasta ahora hemos analizado el caso de espectros armónicos, es decir en los cuales las frecuencias presentes eran múltiplos de cierta frecuencia, denominada frecuencia fundamental. No hay impedimento, sin embargo, para que los “armónicos” sean de frecuencias cualesquiera, por ejemplo 100 Hz, 235 Hz y 357 Hz. De hecho, muchos sonidos naturales son de esta última clase, por ejemplo el sonido de las campanas, o el correspondiente a los diversos tipos de tambores. En estos casos las ondas senoidales
que constituyen el sonido en cuestión se denominan sonidos parciales en lugar de armónicos. Este tipo de sonidos no es periódico, a pesar de lo cual también pueden representarse gráficamente en un oscilograma. Sin embargo, lógicamente, no podrá identificarse una frecuencia ni un periodo. El espectro correspondiente a estos sonidos se denomina espectro inarmónico.

También puede representarse un espectrograma de estos sonidos. A diferencia de lo que ocurre en los espectros armónicos, las líneas espectrales no están equiespaciadas.

En el caso de los espectros inarmónicos también puede existir una variación en el tiempo, pudiendo en este caso inclusive variar no sólo la amplitud de los sonidos parciales sino también la frecuencia. En los sonidos reales esta variación existe, aunque normalmente es pequeña. Se debe a que la frecuencia con que vibran algunos cuerpos físicos varía ligeramente con la amplitud de vibración, por lo cual al ir disminuyendo esta amplitud, su frecuencia varía con ella.

1.17. Espectros continuos
Existe aún otro tipo de sonidos, formados por una cantidad muy grande de parciales muy próximos entre sí, que se denominan genéricamente ruido. Algunos ejemplos de esto son el sonido del mar, el ruido de fondo de un cassette y el sonido que se
emite al pronunciar las consonantes f, j, s, z o simplemente al soplar. Debido a la gran cantidad de parciales, y al hecho de que cada uno es de amplitud muy pequeña, lo más conveniente es representar el espectro no mediante líneas espectrales individuales, sino
como una curva continua (Figura 1.16) denominada densidad espectral, p2.

Existen dos tipos de ruido que tienen importancia específica en Acústica: el ruido blanco y el ruido rosa. También se menciona a veces el ruido browniano. El ruido blanco (Figura 1.17a) se caracteriza por tener una densidad espectral constante, es decir
igual para todas las frecuencias. Esto significa que contiene parciales de todas las frecuencias con igual amplitud. El nombre de ruido “blanco” proviene de realizar una analogía con la luz blanca, que contiene todos los colores del espectro con la misma intensidad. El ruido rosa (Figura 1.17b) contiene mayor proporción de bajas frecuencias (de allí el nombre de “rosa”, ya que contiene todas las frecuencias pero más las bajas frecuencias, que en la luz corresponderían al color rojo). Tiene la particularidad de que en cada octava (es decir el intervalo de frecuencias desde un do al siguiente, o desde un re al siguiente, etc.) tiene la misma energía sonora. El ruido rosa tiene aplicación en la ecualización de sistemas de sonido mediante ecualizadores por octavas o por tercios de octava. Es también una señal útil para la prueba de equipos de sonido, ya que es un tipo de ruido que suena natural al oído.