Difusores Acústicos

Difusores Acústicos

En este trabajo sobre Difusores Acústicos se presentan dos líneas de investigación:
Una visión microscópica sobre su funcionamiento temporal presentando una nueva visión sobre el fenómeno, del cual su propiedad más importante es la memoria.
Y una visión pragmática, muy útil para el proceso de control de proyectos, donde se establece un coeficiente de difusión, Sound Field Diffusivity (SFD) para poder evaluar cuantitativamente campos difusos reales.
Se incorporan sugerencias para futuras investigaciones en ambas líneas: sobre la primera continuar la búsqueda de un coeficiente de difusión más completo, que incorpore el desparramo temporal de la energía, y sobre la segunda darle resolución en frecuencias al SFD para poder efectuar diseños más precisos.

Acoustic diffusers II

Introducción:
Hoy es innegable que la difusión es una herramienta acústica indispensable en todo diseño obteniéndose por medio de las superficies difusoras tipo QRD, PR, etc., o simplemente mediante la implementación de gradientes de impedancia acústica superficial.
Toda investigación nace de ciertos cuestionamientos y en este caso algunos fueron:
· ¿Puede un solo número, el “coeficiente de difusión” obtenido del desparramo espacial de la energía, caracterizar completamente el funcionamiento de una superficie, siendo éste tan complejo?.
· ¿Cuánta superficie difusora es necesaria para conformar un campo difuso?.
· ¿Cuántos tipos de campos difusos se pueden conformar?.
· ¿Es medible la difusión de un campo difuso como para poder repetir valores obtenidos en proyectos ya realizados?.
· ¿Qué superficie difusora es necesaria en un control y en una sala de un estudio de grabación?.
· ¿Es perfectible un campo difuso?.
· ¿Es estudiable un campo difuso?, ¿Cómo?.
· ¿Qué diferencia hay entre conformar un campo difuso con superfic ies aleatorias respecto de superficies devenidas de teorías numéricas y softwares de optimización? Etc.
En el presente trabajo de investigación se trató de orientar las respuestas a las anteriores preguntas analizando las causas y los efectos de los difusores. En una primera instancia analizando el funcionamiento de la superficie difusora, y en una segunda estudiando el campo difuso.
Según lo descrito en “Análisis Teórico y Experimental de Difusores Acústicos Numéricos” (Memorias del Congreso Mexicano de Acústica, año 1999) se obtiene difusión en el campo lejano de una superficie de reacción local cuando en la misma existen gradientes de impedancia acústica.
O sea que tanto las irregularidades como diferentes coeficientes de absorción conviviendo en partes de una superficie funcionan como difusores. Ahora, ¿qué los diferencia? Sabiendo que la transformada de Fourier de la forma de una superficie revela la distribución de energía en el campo lejano, podemos presuponer que un difusor numérico posee una optimización en la distribución energética espacial respecto de uno que no lo es (sólo conformado por aleatoriedades o por diferencias de impedancias acústicas adyacentes, o gradientes de impedancia superficial).
Al respecto de los difusores numéricos podemos enumerar un breve resumen de los problemas que presentan:
· Diagramas polares de difusión no uniformes en el tiempo.
· Difusión en sólo una dimensión.
· Ancho de Banda discretizado.
· Lobulación de su desparramo espacial al concatenar secuencias.
· Absorción en bajas frecuencias
· La realización práctica con materiales livianos incrementa la frecuencia mínima real.
· La complejidad de la realización práctica los encarece.
· El método tradicional de medición es complejo. Algunos de estos problemas se ven resueltos mediante:
· Modulación de la secuencia: Mejoramiento del Ancho de Banda (y de la lobulación).
· Difusión en dos dimensiones aplicando el teorema del resto chino.
· Optimización de la radiación de los difusores.
La principal conclusión de este trabajo, luego de un último experimento de audición (donde se logró aislar el sonido directo monofónico de sus correspondientes reflexiones difusas) es que uno de las principales propiedades de las superficies difusoras, conjuntamente con el desparramo espacial, es el desparramo temporal de la energía.
Otras conclusiones indican que las superficies difusoras:
• Desparraman la energía acústica en el tiempo.
• Desparraman la energía acústica espacialmente.
· El correspondiente patrón polar de radiación cambia en función del tiempo dada una excitación transitoria.
· Idealmente mantienen la energía acústica dentro del recinto: Acústica Ecológica.
Un campo difuso tenderá a ser ideal espectralmente si la cantidad de “comb filters” tiende a infinito, y la profundidad de los “nulls” tiende a cero. Por lo tanto la respuesta al impulso entre dos puntos interiores a dicho campo presentará un bajo valor de Correlación Cruzada.

Difusión:
Propiedad de las superficies por la que desparraman la energía acústica en el espacio en forma no especular y en el tiempo.

Campo Difuso:
Espacio físico donde existe similar decorrelación binaural de la energía acústica. En las anteriores definiciones se hacen tres afirmaciones a ser demostradas en el siguiente trabajo:
1. Los difusores desparraman la energía acústica en el tiempo.
2. El método de medición de los campos difusos es intrínsecamente binaural.
3. Los campos difusos poseen un valor medio de difusividad y un desvío estándard que demuestra (o no) su homogeneidad.

Difusores Acústicos II: la Superficie Difusora.

El objetivo de este capítulo es la comprobación del desparramo temporal y de la decorrelación de las reflexiones emanadas de la superficie difusora.
Dispositivos bajo prueba:
En esta primera parte de los ensayos se midieron dos difusores del mismo tipo pero de diferentes frecuencias mínimas teóricas, un panel plano de igual superficie (proyectada) y un difusor cilíndrico.
Muestras evaluadas:
· Un difusor en 2 dimensiones tipo QRD de 10cm de profundidad máxima de 0,5m x 0,5m.
· Un difusor en 2 dimensiones tipo QRD de 20cm de profundidad máxima de o,5m x 0,5m.
· Un panel plano de 0,5m x 0,5m.
· Un difusor cilíndrico de 0,6m de ancho por 1,2m de alto.

Equipo de Medición:
Con objeto de obtener respuestas al impulso (para su posterior análisis) de cada dispositivo el set de medición constituía de:
· Una cámara anecoica de un volumen aproximado de 200m3.
· La fuente sonora utilizada fue ruido rosa (al utilizar ruido la única correlación entre señales posible es la dada por el sistema).
· El post procesamiento fue realizado mediante 2 canales de FFT utilizando una ventana tipo Hanning, analizadores de espectro y de oscilogramas, Plug ins de correlación y procesadores de integral reversa de Schroeder.
· Un reproductor de CD.
· 2 Micrófonos Eartworks M30.
· 2 Micrófonos Shure SM81.
· Un medidor de Nivel de presión sonora TES 1350 con calibrador correspondiente.
· Un grabador de DAT de 2 canales.
· Un amplificador de Audio de 2 canales.
· Un altavoz marca Auratone modelo “The Cube”.
· Transportador y cinta métrica.

Resultados de las mediciones:

Los primeros resultados (figuras 1, 2, 3 y4) muestran tanto la señal directa como el desparramo en tiempo de la energía reflejada. Las figuras fueron obtenidas excitando cada DUT a 35o de entrada y captando su salida tamb ién a 35o. Se tomó esta combinación de ángulos de entrada y de salida porque bajo estas condiciones no se cumple la ley de Snell. Podemos observar en la figura 2 aproximadamente cuatro reflexiones discretas de energía las cuales se deben a la “difusión de borde” (“edge scattering”). Veremos en
el siguiente punto que estas reflexiones no tienen un contenido energético considerable.
Tras procesar estas respuestas al impulso por la Integral reversa de Schroeder1 de los primeros 40ms de las mismas podemos cuantificar la energía involucrada en las IR (impulse response) de cada DUT en los primeros milisegundos de la mismas. Esto se observa en las figuras 5, 6, 7 y 8. En las figuras 9 y 10 se observan claramente las diferentes pendientes de la
integración reversa para el panel plano y para el difusor. En el caso del difusor aparecen reflexiones (más de una) con importantes valores de energía en la salida las cuales generan una zona de mayor pendiente (no un instante) de duración
4,22ms presentando un ÄdB= 8,43dB. Según estas condiciones de entrada y salida de la información (respecto del DUT)
vemos que el panel plano no refleja energía apreciable mientras que los difusores sí.

Estas visualizaciones justifican relacionar este comportamiento de las superficies difusoras con la característica de los sistemas denominada “memoria”.
Memoria:
“Propiedad por la cual el valor actual en la salida depende del valor actual de la entrada y de valores pasados.”
En un paso posterior del procesamiento se evaluó la entrada y la salida mediante la envolvente2 de la función correlación cruzada (equivalente a la convolución entre entrada y salida de un sistema). De esta herramienta matemática se pueden extraer ciertas conclusiones sobre los difusores (ver Figura 11 y 12, un zoom de la anterior):
· Existen multiplicidad de trayectos desde un punto de entrada hasta un punto de salida. Esto indica diferentes retrasos de la misma señal.
· Cada pico de la función resultante indica similaridad entre ambas señales. Esto confirma la propiedad de “memoria” del difusor.
· La no coincidencia temporal entre picos indica que se está decorrelando la señal en el tiempo entre cada par de puntos in – out.
· La correlación cruzada de las anteriores correlaciones tiene muy bajo grado de correlación.

Nota: La envolvente (módulo) se obtuvo mediante la transformada de Hilbert de la correlación cruzada original (o sea la parte real).
Por lo tanto podemos afirmar que los difusores desparraman la energía acústica en el tiempo. Ver modelos clásico y moderno (propuesto por el autor) en las Figuras 13 y14.

Difusores Acústicos II: El campo Difuso.

El motivo de este capítulo es poder cuantificar la difusividad3 de un punto en el espacio dentro de un recinto. Con esto se pueden graficar (o especificar) líneas o zonas con idénticos (o similares) valores delimitándose campos difusos reales. Así se estaría independizando efectivamente el campo reverberante del campo difuso.
Sólo cuantificando, tabulando y ponderando subjetivamente una serie de valores medidos en diferentes ámbitos acústicos servirá de guía para todo diseño y como valores de corrección u objetivos de una reforma acústica.

Casos de Aplicación:
· Diseño de una Sala de Ópera y/o de Conciertos: Mediante la permanente auditoría de los campos sonoros formados en el proceso de construcción o remodelación se pueden detectar prematuramente problemas o deficiencias en la predicción y poder solucionarlos.
· Diseño de Controles de Estudios de grabación tipo LEDE: Cuantificando la difusividad provista por los difusores traseros en las zonas del Técnico y del Productor (tratando de que sean similares) se puede acotar y dimensionar la superficie de los difusores traseros.
· Diseño de superficies difusoras por el método de prueba y error: Mediante el intercambio del tipo de superficie lograr ciertos valores de difusividad en un punto interior del campo de reflexiones generado.
· Especificación de superficies difusoras: Comparando los valores de difusividad obtenidos con distintos difusores bajo las mismas condiciones de entorno y de medición.

Dispositivos bajo prueba:
Campo difusos generados en:
· Control de un estudio de grabación.
· Sala de un estudio de grabación.
· Teatro Colón.
Equipo de Medición:

Con objeto de obtener respuestas al impulso (para su posterior análisis) y captaciones binaurales de cada dispositivo el set de medición constituía de:
· Un par de micrófonos PZM en configuración binaural (llamado “Wood Head”).
· La fuente sonora utilizada fue ruido rosa (al utilizar ruido la única correlación entre señales posible es la dada por el sistema).
· El post procesamiento fue realizado mediante 2 canales de FFT utilizando una ventana tipo Hanning, analizadores de espectro y de oscilogramas, Plug ins de correlación y procesadores de integral reversa de Schroeder.
· 2 Micrófonos Eartworks M30.
· 2 Micrófonos Shure SM81.
· Un medidor de Nivel de presión sonora TES 1350 con calibrador correspondiente.
· 2 Pares de micrófonos binaurales Senheiser (“in ear”).
· Un reproductor de CD.
· Un grabador de ADAT de 8 canales.
· Una consola Soundcraft de 16 canales de entrada.
· Un amplificador de Audio de 2 canales.
· Un altavoz marca JBL modelo 4425.

Resultados de las mediciones:
En busca de un parámetro que refleje la difusión de un punto en el espacio, definimos el SFD, Sound Field Difusivity.
Definición:
SFD:
“Es un índice de Espacialidad Subjetiva que indica el grado de decorrelación de reflexiones entre el oído izquierdo y derecho (binaural)”

· Teatro Colón:

Inicialmente se midieron las respuestas al impulso monoaurales en 7 ubicaciones en el interior de la sala. Se realizaron también diferentes captaciones binaurales y una toma estereofónica tipo “omnis espaciados” en la posición 2. Ver figuras15 y 16.
La respuesta al impulso (monoaural) medida en la posición 2 se puede observar en la figura 17.
Se destacan el I.T.D.G. y la S/N dentro de él. Esta última brinda una aproximación rápida de la inteligibilidad existente dentro del recinto. La transferencia medida en esta posición se observa en la figura 18.
· Estudio de Grabación, Sala y Control tipo Lede:
Se realizaron captaciones binaurales, 2 en la Sala y 3 en el Control; en este último en las zonas del técnico, del productor y muy cerca del difusor trasero.
Post procesado de las mediciones binaurales:
Sabiendo que existe una correlación entre el IACC y la sensación subjetiva de difusión, a partir de los valores del primero se llegó a los valores del segundo por medio de una ecuación fruto de una regresión matemática entre resultados obtenidos en anteriores estudios.

Se trabajó con distintos softwares para obtener la correlación cruzada entre las señales correspondientes al oído derecho e izquierdo, su ponderación tipo “A” y su máximo valor normalizado.
Los resultados obtenidos fueron:

Podemos destacar:
· La gran similitud de valores obtenidos de SFD entre las posiciones del Técnico y el Productor, lo cual debería ser un objetivo primordial en todo diseño.
· El alto valor de SFD de las captaciones cercanas a los Difusores (Toma “Difusor” en el Control y “Omnis Espaciados” en la Sala). Esto se debe a que los micrófonos se encuentran en una zona de impedancia acústica de radiación reactiva de las fuentes fantasma que se generan dentro de las celdas de los difusores.

Podemos destacar:
· La gran similitud de los valores resultado de la captación con Binaural Wood y Binaural Hô, lo cual valida el modelo microfónico binaural compuesto por 2 micrófonos PZM separados por una madera a modo de “cabeza”.
· La reducción del valor de difusividad, SFD, (o sea mayor correlación entre ambas informaciones) encontrado en la captación Spaced Omnis. El mismo se produce debido a que no existe un material aislante entre un micrófono y otro, función que cumple la cabeza entre nuestros dos oídos.

Conclusiones:
· El ETS existe y es cuantificable. Sugerimos tomar en cuenta la duración (D de tiempo) y la magnitud del conjunto de reflexiones salientes.
· La superficie difusora decorrela en el tiempo las reflexiones salientes (respecto de sí mismas y de la señal original).
· La difusividad de un campo sonoro es mensurable en forma objetiva y a partir de ello es posible tomar decisiones correctivas.

Trabajo a futuro:
· Análisis de la memoria de los difusores mediante la Autocorrelación de su salida.
· Relevar valores relativos y absolutos de S.F.D..
· Realizar pruebas subjetivas de S.F.D. en Controles de estudios de grabación.
· Distribuir el SFD en frecuencias para una mayor comprensión de los campos sonoros dentro de los recintos.
· Incorporar al coeficiente de difusión una magnitud del E.T.S..

ACÚSTICA DE RESONADORES DE HELMHOLTZ

RESONADORES DE HELMHOLTZ

INTRODUCCIÓN TEÓRICA

Ya advierte la bibliografía especializada en temas de absorción de baja frecuencia, que la mayor ayuda para el tratamiento acústico con elementos resonadores es la propia experimentación.
Las expresiones teóricas informan acerca del comportamiento del conjunto resonador; y, ateniéndose a ciertas restricciones, la formulación acierta en la frecuencia de sintonía del sistema pero flaquea en las previsiones de absorción.
Recordemos las principales fórmulas que modelan el funcionamiento de un resonador de Helmholtz así como las limitaciones de cada una.

Se advierte del cambio en el ancho de banda y de la disminución de la eficacia del resonador con la introducción, en la cavidad de éste, de material aborbente poroso, pero, ¿en qué medida varían los parámetros antes mencionados? Poca bibliografía completa el caso de sistemas con pérdidas.

Absorción

La absorción de un resonador de Helmholtz es quizás el apartado más abandonado por la teoría y más necesitado en los casos prácticos. Si bien el ajuste de la frecuencia de resonancia es un hecho sin problemas, la predicción de la cantidad de absorción constituye un tema poco claro. Existe formulación para la absorción de un resonador individual en su frecuencia de resonancia y también para todo el margen, pero debemos remarcar su “validez” únicamente para el caso de un resonador aislado, cosa que en un tratamiento real no encontramos nunca. Así, la predicción de absorción para un conjunto de resonadores de Helmholtz (resonadores individuales no independientes), se hace casi imposible.

La fórmula que se encuentra para la absorción de un resonador es la siguiente:

La absorción máxima, Amax, usadada algunas veces en trabajos teóricos, responde a la expresión mostrada para los casos en que la resistencia de fricción del resonador se iguala a la resistencia de radiación del mismo; para resonadores totalmente adaptados al medio [Kutrruff].Muchas veces su usan aproximaciones de la fórmula cambiando el denominador por 3.5p o 4p.

CASOS PRÁCTICOS
Para estudiar el comportamiento de los resonadores de Helmholtz se han analizado en el laboratorio diferentes montajes realizando medidas en cámara anecoica y reverberante.

MEDIDAS EN CÁMARA ANECOICA
En la cámara anecoica se midió la frecuencia de resonancia, el ancho de banda de los resonadores construídos y la variación de ambos parámetros cuando se introducían pérdidas en el sitema.

Medida de la f0
La frecuencia de resonancia se obtuvo excitando con ruido rosa en el exterior del resonador y obteniendo el espectro de la excitación en el interior de su cavidad. Los resultados obtenidos convergen a una buena previsión teórica de la frecuencia de resonancia cuando las restricciones de dimensionado y proporcionalidad son respetadas.

En las figuras anteriores mostramos uno de los resonadores analizados y la medida de su frecuencia de resonancia. Para este caso, la frecuencia teórica predecía 59.42 Hz y la frecuencia real ha resultado de 62.2 Hz.
Las medidas realizadas en los 15 sistemas analizados han presentado variaciones relativas máximas del 5%.

Medida de un sistema con pérdidas

Para el caso del resonador presentado anteriormente, al añadir material absorbente en el volumen encerrado, la frecuencia de resonancia varía disminuyendo, hasta los 60.5 Hz para un 40% de fibra de vidrio en la cavidad y hasta 58.7Hz para un 70% de fibra en un segundo caso. El material absorbente también contribuye a reducir el nivel de las frecuencias propias de la cavidad del resonador así como a disminuir la energía del pico de la resonancia.
La variación del ancho de banda es visible pero éste se extiende, en muchos casos, por debajo del ancho definido a –3dB.

A continuación se muestran, para diferentes experimentos, las variaciones en la frecuencia de resonancia y en el ancho de banda relativo según el porcentaje de volumen ocupado por material absorbente.

Como se aprecia en la gráfica, la frecuencia de sintonía disminuye debido al material absorbente asociando el fenómeno a un aumento virtual del volumen del resonador. Los datos obtenidos coinciden con los resultados de Beranek llegando a una reducción máxima de la f0 de un 85%.

MEDIDAS EN CÁMARA REVERBERANTE
Medida de la absorción

Para los ensayos de coeficiente de absorción se midieron dos conjuntos de resonadores. Uno de ellos formado por botellas (f0 de 116 Hz) y realizando medidas con grupos de 25, 50 y 100 resonadores. Un segundo sistema se observa en lafotografía superior y se basa en un conjunto de 8 resonadores de madera sintonizados a 90.5Hz.
Los resultados obtenidos se muestran en los gráficos siguientes. Para la obtención del incremento de absorción se aplicó la Normativa ISO 354 para el cálculo del coeficiente de absorción en cámara reverberante.

Apreciamos en los la variación del incremento de absorción en función del número de resonadores y de la colocación de éstos. Este incremento, evidentemente, no es lineal con el número de elementos absorbentes y por tanto es imposible extrapolar un coeficiente de absorción para un único resonador. La absorción proporcionada por el conjunto de 100 botellas es considerable, rebajando el tiempo de reverberación de la sala de 15 segundos a 9.6 segundos en la banda de 125Hz.

Los datos conseguidos con el conjunto de 8 resonadors se muestran a continuación.

En el gráfico anterior se representa la curva tonal de la cámara reverberante vacía (línea rosa) y la curva tonal después de colocar en medio de la cámara el conjunto resonador en posición vertical (línea azul).

Estos dos gráficos representan la variación del TR60 y del incremento de absorción en función de la posición del conjunto de resonadores (posición horizontal y posición vertical) y el incremento de absorción provocado por sólo 4 resonadores del conjunto, invalidando los 4 restantes. Como se observa en los resultados obtenidos, el resonador colocado en posición vertical presenta el máximo incremento de absorción mientras que en posición horizontal la absorción disminuye acercándose al caso de los 4 resonadores.
Es interesante destacar que la cantidad de absorción que se obtuvo con estos 8 resonadores sintonizados a 90.5Hz, fue la misma que la obtenida por los 100 resonadores del experimento anterior, sintonizados a 116 Hz. Este resultado confirma, como anunciaba la formulación presentada en la introducción teórica, la dependencia de la absorción con la longitud de onda de la frecuencia de resonancia.

Efectos secundarios

Otros efectos previsibles medidos en algunos casos prácticos, son la actuación de estos elementos resonadores en el campo sonoro que los rodea. El sistema resonador, no sólo provoca una absorción determinada sino que puede contribuir a aumentar la difusión del campo acústico de su alrededor gracias a la reradiación de energía que se produce a través de la boca
del mismo.
En cámara reverberante y en ambiente anecoico se han medido estos efectos apareciendo en los espectros de la señal captada en la zona que envuelve el resonador, o en las gráficas de tiempo de reverberación. En este último caso, la actuación del resonador aparecía creando una doble pendiente en la caída de la energía o creando un pico energético que provocaba una discontinuidad en la curva.

CONCLUSIONES

La frecuencia de sintonía de los resonadores construídos se calcula con exactitud con la ayuda de la formulación existente. Se debe tener en cuenta la disminución de esta frecuencia, hasta un 85%, cuando se añade material absorbente en la cavidad del resonador y
la variación del comportamiento cuando no se respetan las condiciones de dimensionado.
La absorción de estos elementos puede llegar a ser elevada y aumenta con la longitud de onda de la frecuencia de resonancia. La fórmula de absorción para el caso de un resonador aislado no sirve en implementaciones reales.
La colocación en la sala del sistema resonante así como su posición, pueden influir de forma considerable en la absorción del sistema. Es máximamente eficaz la colocación de estos absorbentes en los lugares de máximos de presión.

BIBLIOGRAFÍA

[1] Room Acoustics, Heinrich Kuttruff
[2] Principles and Aplications of Room Acoustics Volume 1 y 2, L.Cremer, H. Müller
[3] Acústica de Recintes. Enginyeria La Salle. Robert Barti
[4] Master Handbook of Acoustics.

FFT_Medición de Función de Transferencia con sweeps 3

3 PRE-ÉNFASIS

En casi cualquier medición acústica, no es aconsejable usar una señal de excitación con contenido espectral blanco. En el caso de medición de altavoces en una cámara anecoica, se pueden presentar dos efectos para una gran pérdida de relación S/R en bajas frecuencias: La pérdida de sensibilidad (de 12 o 24 dB por octava) debajo de la resonancia de la caja de bajos (bass cabinet), y el aumento del ruido de fondo en esta región de frecuencias debido al deficiente aislamiento de las paredes al ruido de fondo.
Así pues, para seguir el roll-off de frecuencia baja de los altavoces (si es posible en todos, vea [30], [31]) sin los efectos de la degradación de bajo S/R, se requiere de un fuerte énfasis de más de 20 dB para establecer una certeza razonable en la medición.
Esto también da lugar a una mejor contribución de la energía que alimenta a un altavoz multivía. El woofer soporta mucha más potencia que un tweeter. Pero cuando usamos una señal de excitación con espectro blanco, el tweeter tendrá que soportar el golpe de la energía de la señal de excitación. Un domo de tweeter puede ser sobrecalentado y dañado con unos pocos Watts, y su límite puede ser fácilmente sobrepasado por cualquier amplificador de potencia. Desde este punto de vista, un énfasis en bajas frecuencias es altamente deseable.
Una tercera razón a mencionar, de naturaleza social es la siguiente: cuando se realizan mediciones “in situ” (salas de concierto, estadios), una señal de excitación con realce en bajos da calidez al sonido y es más agradable que el ruido blanco, y por lo tanto es más aceptable por otras personas presentes. Además, un fuerte incremento de potencia en la banda de bajos no da la impresión de mucha sonoridad debido a la mala sensibilidad del oído en esta región de frecuencias. Mientras esto puede sonar poco científico, todos los que hayan participado en sesiones de mediciones en público saben que el volumen máximo aplicable es estipulado por las personas que se juntan en el lugar, no por los altavoces ni por los amplificadores (ver [1]). Por ejemplo, los instaladores que suben en los soportes cerca de un cluster de altavoces aprecian definitivamente señales de excitación no molestas. En estos casos, usando ruido blanco como estimulo incluso lleva a un riesgo de salud y un problema potencial de seguridad. Un MLS que alimente accidentalmente con máximo nivel a un sistema potente puede causar daño auditivo o incluso conducir a los accidentes asustando al personal. Esto especialmente cerca de 2 los drivers horn-loaded 2”. Usar señales de excitación con énfasis en bajos relaja la situación a un cierto grado. Con sweeps largos, se puede interrumpir antes de alcanzar las frecuencias medias.

3.1 Ecualizando altavoces para mediciones acústicas de salas.
Obtener la IR es una de las tareas más recurrentes en acústica de salas y edificios. Todos los parámetros típicos que describen las propiedades acústicas de una sala (o para ser más precisos, el camino de transmisión acústica entre dos puntos, usando una fuente y receptor con distinta directividad) como reverberación, claridad, definición, tiempo central, STI y muchos otros pueden ser derivados de ella. Una mirada más cercana a la IR puede ayudar a identificar problemas como las reflexiones indeseadas o una proporción deficiente entre el sonido directo y la reverberación. Visualmente examinando la función de transferencia asociada a la sala (obtenida por la FFT) puede dar a conocer modos molestos de la sala o, por supuesto, desbalance tonal de un sistema de refuerzo sonoro.
Otra aplicación interesante es la creación de “realidad virtual” por la convolución de la capturación “seca” (anecoica) de audio con la IR binaural de una sala capturada por un dummy head. Posteriormente se demostrará que sólo los sweeps son capaces a realizar tareas con suficiente rango dinámico.
Hasta hoy, la capturación de la RIR para mediciones de tiempo de reverberación es ocasionalmente hecha usando fuentes impulsivas no electroacústicas. Las maneras más comunes son disparando una pistola (acción delicada especialmente en iglesias) o explosiones de globos. Mientras se obtiene altos niveles en algunas bandas de frecuencia, estos métodos tienen una baja repetibilidad y producen espectros impredecibles. La energía de baja frecuencia contenida es usualmente baja, especialmente para pistolas debido a sus pequeñas dimensiones. Incluso la omnidireccionalidad no está garantizada [1].
La única forma de evitar estos severos inconvenientes es usar un sistema electroacústico, y por lo tanto el uso de un altavoz.
Obviamente, cuando usamos un altavoz sin ninguna precaución, la función de transferencia obtenida de la sala será “coloreada” por la respuesta de frecuencia del altavoz. Este es un problema cuando la RIR será usada para auralización. Para empeorar
las cosas, la respuesta de frecuencia es dependiente de la dirección. Para mediciones de acústica de salas, la norma ISO 3382 describe el uso de un altavoz “lo más omnidireccional” posible (condición que en la practica difícilmente puede ser satisfecha sobre 2 kHz).
Ningún altavoz será capaz de producir una salida independiente de la frecuencia. Este no es un gran problema en mediciones de tiempo de reverberación en octavas o tercio de octavas, mientras que la desviación dentro de estas bandas no sea muy alta. La coloración del RTF por la respuesta de frecuencia del altavoz es muy indeseable con la intención de auralizar señales. En estos casos, es obligatorio usar un pre-énfasis para remover la coloración. Por supuesto, esta ecualización podría ser hecha post-procesando la RTF con la inversa de la respuesta del altavoz, pero esto no podría mejorar la pobre relación S/R en las regiones de frecuencia donde la salida acústica del altavoz es baja.
Es por esto que es favorable pre-filtrar la señal de excitación independientemente de la frecuencia y potencia de salida.
Una ecualización del altavoz es el pre-énfasis que debe ser aplicado en mediciones de acústica de salas. Además, la medición puede ser mejorada para un mejor alcance, adaptando el espectro de potencia emitido al espectro del ruido ambiente. Y en el mejor de los casos, el ruido de fondo tiende a ser mucho mayor en la región de bajas frecuencias. Así, en orden de obtener una relación S/R que sea casi independiente de la frecuencia, se debe aplicar un pre-énfasis adicional que siga el espectro del ruido de fondo.
Mientras es deseable tener la relación S/R independiente de la frecuencia para análisis de acústica de salas (especialmente para la obtención de tiempo de reverberación en bandas filtradas), podría ser discutible el orden para minimizar el ruido audible, la RIR adquirida para propósitos de auralización tiene un ruido de fondo que es aproximadamente lo contrario de nuestra sensibilidad de la audición en niveles bajos. El uso de noise shaping para reducir el ruido percibido en grabaciones con cuantización fija (por ejemplo los 16 bits de un CD) busca la misma meta. Una buena introducción a esta área se da en [32]. Para conseguir el nivel de ruido que sea particularmente bajo en regiones espectrales de alta sensibilidad del oído, se debe aplicar un énfasis igual a la curva de sensibilidad (por ejemplo E-curve) a la señal de excitación. Por otro lado, dando un aumento extra en la región de frecuencias medias de mayor sensibilidad del oído podría llevar a señales de excitación bastante molestas. De todas formas, la pregunta de cual énfasis satisface lo mejor posible es un problema multifacético y se puede contestar diferentemente para cada medición.

Una interrogante es como manejar las mediciones de la ecualización de la potencia acústica de los altavoces. Usualmente, la respuesta de potencia acústica del altavoz es obtenida por promedio de la magnitud de muchas funciones de transferencia medidas en campo difuso en una cámara reverberante. La corrección con la inversa de los tiempos de reverberación con 10*log{1/T(f)} convierte el espectro de presión del campo difuso en un espectro proporcional a la potencia acústica.
Después de esto, es indispensable un suavizado de 1/6 o 1/3 de octava para no obtener una curva corrugada. Pero esta suavización no es suficiente para bajas frecuencias, como puede ser visto en la fig.14 en la curva superior derecha. En este rango, la función de transferencia de la cámara consiste en solo en algunos modos con alto Q. Es una buena idea reemplazar estos nodos por un declive con la disminución teórica de la sensibilidad del altavoz (12 dB/oct para caja cerrada o 24 dB/oct para sistemas vented).

El problema ahora es como tratar la fase y el retardo de grupo asociado. Evidentemente, la fase de la función de transferencia de la cámara reverberante no puede ser usada. Un compromiso factible es combinar la magnitud de la respuesta de potencia acústica (obtenida en la cámara reverberante) con una respuesta de fase en campo libre (obtenida de la medición de sensibilidad en el eje del altavoz). Obviamente, combinando la amplitud de una medición con la fase de la otra entrega un espectro artificial que también corresponde a una IR artificial. Sin embargo, esto parece ser una vía realizable para minimizar la distorsión en amplitud y fase de mediciones en acústica de salas.
Es interesante advertir que si se creará un sweep, sólo la magnitud de la respuesta objetivo influenciará la señal de excitación. No teniendo ninguna influencia en la creación del barrido, la medición de la fase del altavoz puede ser ecualizada solamente por el post-proceso (es decir, aplicando lo contrario de esta fase al archivo de la referencia). Así, en general para las mediciones de acústica de salas, el proceso de la señal siempre consiste en una combinación de pre y post-procesamiento.

4 SÍNTESIS DE SWEEPS

Los sweeps pueden ser creados directamente en el dominio del tiempo o indirectamente en el dominio de la frecuencia. En este último caso, su magnitud y retardo de grupo son sintetizados y el sweeps es obtenido mediante la IFFT de este espectro artificial. Las formulas dadas aquí no se apegan a los estándar matemáticos típicos, pero son aceptables para su implementación en software.
Los dos tipos más comúnmente conocidos son los sweeps lineales y logarítmicos. Los sweep lineales tienen un espectro blanco y aumentan con una razón fija [Hz] por unidad de tiempo.

Algunos científicos japoneses [35], [36], se refieren al sweep lineal como “pulso expandido en el tiempo” (time stretched pulse, TSP), pero por supuesto cualquier señal de excitación de banda ancha, como un sweep o un ruido, puede ser considerado como un pulso cuya energía ha sido expandida en el tiempo.
El sweep logarítmico tiene un espectro rosado, lo que significa que la amplitud desminuye 3 dB/oct. Eso también significa que todas las octavas contienen la misma energía. La frecuencia aumenta con una fracción fija de una octava por unidad de tiempo:

4.1 Construcción en el dominio del tiempo
Los sweeps pueden ser sintetizados fácilmente en el dominio del tiempo mediante el incremento del paso de la fase que es sumado al argumento de una expresión sinusoidal después de cada cálculo de una muestra de salida. Un sweep lineal como los utilizados en TDS tiene un reajuste del valor sumado al incremento de la fase:

El factor incj usado para la generación del sweep lineal depende de la frecuencia de inicio y de término, la frecuencia de muestreo fs y el número de muestras N a ser generados:

Mientras los sweep generados en el dominio del tiempo tienen una perfecta envolvente y de esta manera un factor cresta ideal (3.02 dB), su espectro no es exactamente el esperado. El abrupto comienzo al iniciar del sweep y el abrupto final al terminar el sweep son responsables del indeseable ripple en los extremos del espectro de excitación, como se ve en la fig. 15. Ventanas half pueden ser utilizadas para disminuir el impacto del inicio y término del sweep, pero no los elimina completamente.
Normalmente, no tendrán efecto en la respuesta de frecuencia recuperada cuando se corrige con un espectro de referencia derivado de la inversión del espectro de la señal de excitación (la cual es obtenida por una medición de referencia conectando la salida a la entrada). Sin embargo, si la deconvolución es simplemente hecha con la inversión del tiempo y la forma de la amplitud del estímulo, como es propuesto en [2], o si la corrección no es factible, como con TDS, entonces pueden ser esperados errores en las
cercanías del comienzo y término del sweep.

4.2 Construcción en el dominio de la frecuencia
La construcción de sweeps en el dominio de la frecuencia evita estos problemas. La síntesis puede ser hecha definiendo la magnitud y el retardo de grupo de un espectro FFT, calculando la parte real y la parte imaginaria de ella y finalmente transformando el espectro del sweep artificial al dominio del tiempo aplicando la IFFT. El retardo de grupo no es fácilmente interpretable para señales compleja, pero es muy bien definido para los sweep sinusoidales, describiendo exactamente en que tiempo ocurre cada
frecuencia. Para los sweeps, el retardo de grupo se asemeja a la distribución tiempofrecuencia con los ejes vertical y horizontal intercambiados (a pesar de carecer de la tercera dimensión, contienen la información de la magnitud).
Si se desea un sweep con una envolvente temporal constante (garantizado naturalmente por la construcción en el dominio del tiempo), la magnitud y el retardo de grupo tienen que estar relacionado el uno con el otro. En el caso de un sweep lineal, la magnitud del espectro tiene que ser blanco y en el caso del sweep logarítmico debe ser rosado, con una pendiente de –3 dB por octava. El retardo de grupo asociado para el sweep lineal puede ser entonces simplemente:

Normalmente START f será la primera frecuencia del espectro discreto de la FFT, mientras que END f será fs / 2 . Por supuesto, ( fstart) G t y ( fend) G t deben estar restringidos a valores que se ajusten dentro de intervalo de tiempo obtenido después de la IFFT. La fase es calculada mediante la integración del retardo de grupo. La fase y la magnitud pueden ser convertidas a la parte real y imaginaria por las usuales expresiones sin/cos.
Como se estableció antes, la creación de sweeps en el dominio del tiempo causarán algunos efectos de suciedad en el dominio espectral. Igualmente, los sweeps sintetizados en el dominio espectral causarán algunas rarezas en la señal resultante en el dominio del tiempo. Primero que todo, es importante que la fase resultante de la integración del retardo de grupo alcance exactamente 0° o 180° en fs. Esta condición generalmente tiene que ser cumplida por cada espectro de una señal real. Esto puede ser realizado fácilmente restando los valores del espectro de la fase que disminuyen linealmente con la frecuencia hasta exactamente la compensación de la fase anterior del final:

Esto es equivalente a añadir un retardo de grupo menor de ± 0,5 muestras sobre todo el rango de frecuencias. Aún satisfaciendo esta condición, los sweep no estarán confinados exactamente a los valores dados por ( fstart) G t y ( fend) G t , pero estas se dispersan más allá en ambas¡ direcciones. Esto es una consecuencia directa de la magnitud del espectro deseado, el
cual no presenta las ondulaciones debidas al abrupto comienzo y término de los sweeps (creados en el dominio del tiempo). La ampliación se debe a que, el retardo de grupo para bajas frecuencias no debe ser cero, solo un poco mayor. De esta manera, la primera mitad de la onda del sweep tiene más tiempo para desarrollarse. Sin embargo, este siempre comenzará con un valor mayor a cero, mientras la parte restante izquierda del punto de comienzo se plegara hacia atrás, hacia los “tiempos negativos” en el final del período. Allí, este puede “ensuciar” la parte final de alta frecuencia del sweep si el retardo de grupo escogido para fs / 2 es demasiado cercano a la longitud del intervalo de tiempo de la FFT. Una manera segura de evitar la contaminación en la parte final debido a las componentes de bajas frecuencias es simplemente escogiendo la longitud del bloque de la FFT por lo menos el doble de la longitud del sweep deseado.
Para forzar el deseado comienzo y final del sweep al punto cero, son indispensables las operaciones de fade para evitar el ruido switching. Haciendo esto, es claro que ocurre una desviación de la deseada magnitud del espectro. Pero ésta puede ser insignificante al escoger partes suficientemente estrechas al comienzo y final del sweep. El espectro y las señales en el tiempo resultantes para los sweeps lineales y logarítmicos son presentados en la fig. 16.
La plataforma horizontal bajo los 20 Hz para el sweep logarítmico ha sido introducida deliberadamente para evitar demasiada energía
subsónica. Ambos sweep cubren el rango completo de frecuencias desde el DC (incluido) a fs / 2.

El ripple introducido por las operaciones de fading (ventanas half-cosine muy adecuadas) puede ser mantenido fácilmente bajo 0.1 dB y no debe causar ninguna preocupación, ya que este impacto en la medición resultante es cancelado al desarrollar
y aplicar la medición de referencia.

Sin embargo, en los casos donde una compensación exacta de la amplitud no es posible o deseado (por ejemplo, en un dispositivo TDS), el método iterativo mostrado en la figura 17 permite rechazar completamente el ripple, estableciendo la magnitud exacta del espectro deseado mientras se mantiene la longitud deseada del sweep. La iteración consiste del desarrollo consecutivo de operaciones fade in/out, transformando la señal del tiempo al dominio espectral, reemplazando la ligera corrugación de la magnitud
espectral por la magnitud deseada, manteniendo las fases, y eventualmente volver a transformar la magnitud del espectro manipulada al dominio del tiempo. Antes de aplicar la ventana fade in/out nuevamente, los residuos fuera del intervalo del sweep son
examinados. Si su valor máximo es menor que el LSB de la cuantización final del sweep deseado, la ventana es omitida y la iteración finaliza. Usualmente, el proceso converge rápidamente y aún un sweep con cuantización de 24 bit es disponible solo después de 15 iteraciones. Sin embargo, la respuesta de magnitud perfecta es cambiada por una ligera distorsión de la fase del espectro. Por lo tanto, el retardo de grupo derivado estará ligeramente distorsionado, pero el efecto es casi imperceptible y restringido bandas muy estrechas alrededor de DC y fs / 2 . La iteración trabaja mejor con sweep de un ancho de banda que cubre el rango completo entre 0 Hz y fs / 2 Hz.

4.3 Sweep con magnitud espectral arbitraria y envolvente temporal constante.

Hasta ahora hemos estado restringidos a sweeps lineales y logarítmicos. Si su magnitud espectral fue alterada de la contribución de energía blanca o rosada a algo diferente, es claro que su envolvente temporal podría ya no ser constante. Esto puede implicar un incremento del factor cresta y por lo tanto una pérdida de energía, dando un clavado valor peak como máxima amplitud. No obstante, podría ser muy atractivo el uso de sweeps con una arbitraria contribución de energía sin perder la ventaja del bajo factor de cresta. Esto puede ser realizado de manera sorprendentemente fácil simplemente haciendo que el retardo de grupo crezca proporcionalmente a la potencia del espectro de excitación deseado. Generalmente, la energía de un sweep en una región particular de frecuencia puede ser controlada por la amplitud del sweep o la razón del sweep en esa frecuencia. Un incremento con pendiente del retardo de grupo significa que la correspondiente región de frecuencia es emitida en un tiempo considerable, con solo la frecuencia instantánea emergiendo lentamente. De esta forma, mucha energía esta almacenada en la respectiva sección espectral.
El retardo de grupo para el sweep de magnitud arbitraria y envolvente constate puede ser construido comenzando con tG ( fstart) para la primera frecuencia y entonces incrementando:

El proceso es ilustrado por un ejemplo en la figura 18. El sweep bajo construcción servirá para ecualizar un altavoz y presentar un adicional énfasis de baja frecuencia. El espectro deseado de la señal de excitación se origina de la inversión de la respuesta del
altavoz. Este es adicionalmente enfatizado con un filtro de primer orden low-shelf con 10 dB de ganancia y un filtro pasa altos en 30 Hz para evitar que un exceso de energía infrasónica alimente al altavoz por la nueva ecualización de la señal de excitación.
El grupo de retardo construido muestra una relativa inclinación pronunciado hasta 0,5 segundos, y la señal resultante en el tiempo revela que en este rango incrementa solo gradualmente desde el valor inicial. De esta manera el sweep contendrá una gran cantidad de energía en esa región de frecuencia. Desde los 80 Hz a los 6 kHz, el retardo de grupo incrementa solamente en 200 ms, así todo el rango de frecuencias medias pasa a través de este corto tiempo. Sobre los 6 kHz, el retardo de grupo nuevamente se inclina debido al incremento de la magnitud deseada y la frecuencia aumenta moderadamente, extendiendo consecuentemente la parte de HF del sweep.
Se debe observar que la amplitud del sweep no es completamente constante, como podría ser deseado para lograr el factor de cresta ideal. En el comienzo y en aproximadamente 650 ms, un leve resalto no se puede negar. Esta es otra imperfección causada por la formulación del sweep sintético en el dominio de la frecuencia. Para mantener esta alteración pequeña, una leve suavización de la magnitud del espectro ayuda. Haciendo esto, el factor de cresta del sweep puede mantenerse normalmente bajo los 4 dB, llevando a una perdida de energía menor a 1 dB. Por supuesto, el método iterativo descrito en 4.2 puede ser combinado con este algoritmo para reducir las desviaciones de la deseada respuesta de magnitud espectral cerca de las bandas límites.
Haciendo esto, el factor cresta decrece levemente.

4.4 Sweep con espectro de magnitud arbitraria y envolvente establecida.

¿Es el sweep con envolvente constante y magnitud espectral arbitraria la señal de excitación óptima para mediciones acústicas? Bien, si el amplificador de potencia debe ser la restricción límite del equipamiento de medición, uno debe decir si. La casi constante envolvente de la señal de excitación permite obtener la máxima potencia del amplificador para todo el rango de frecuencias de la medición, por esta razón drenar la máxima energía posible hacia el RUT (room under test) en los distintos intervalos de tiempo. Sin embargo, la falta de potencia es raramente un punto de preocupación hoy en día (quedando solo los equipos portátiles alimentados con batería). Es mucho más común que tenga que ser considerada cuidadosamente la capacidad de manipulación de potencia de los altavoces para evitar dañarlos. En el caso de sistemas multivía, por ejemplo, un dodecaedro compuesto de altavoces coaxiales, posiblemente soportado por un potente subwoofer, cada vía tiene su propia potencia límite. Un sweep con envolvente constante debe tener esta potencia ajustada al enlace más débil del equipamiento, muchas veces los tweeters. Esto podría dejar a las capacidades de manipulación de potencia del woofer (que exceden a los tweeters frecuentemente por un factor de 10 o más) la mayoría de las veces sin uso. Por otro parte, un aumento extra es frecuentemente deseable precisamente en la región de bajas frecuencia para sobreponerse al incremento del ruido de fondo ambiental.
Queda claro que en el caso de los altavoces, la potencia instantánea del sweep debe ser controlable de acuerdo a la frecuencia por la que está pasando el sweep. Esto puede ser logrado por el control de la amplitud del sweep en un modelo dependencia-frecuencia.
Para hacer esto, solo es necesario hacer una modificación menor al proceso de creación de sweep revelado en la sección 4.3. Como se muestra en la figura 19, el truco es primero dividir el espectro “objetivo” por la envolvente espectral deseada. El espectro resultante es la base para la síntesis del retardo de grupo. Después, creando la parte real e imaginaria, el espectro del sweep ahora será multiplicado con la envolvente del espectro deseado, reestableciendo la magnitud de respuesta deseada. La IFFT producirá ahora un sweep que ya no tiene una envolvente constante, pero finalmente diseñando la amplitud dependiente de la frecuencia impuesta por el espectro de la envolvente deseada.
Dos grados de libertad se ofrecen aquí: Una arbitraria distribución espectral junto con una arbitraria definición de la envolvente dependiente de la frecuencia, la cual es transformada en un una barrido senoidal desformado convenientemente en amplitud y
tiempo.

Se debe admitir que ésta aproximación no es la solución completa para el peligro del sobrecalentamiento de tweeter sensibles. Comparado a un sweep con envolvente constante de idéntico contenido de energía, un sweep con la envolvente deseada solo
conduce al estiramiento en el tiempo la misma energía que alimenta al tweeter, resultándole mismo calentamiento si la longitud del tiempo es más pequeña que la constante de capacidad térmica de la bobina. Mediciones acústicas de salas con largos
sweeps (muchos segundos) son también una ventaja si el tweeter no sólo es amenazado por sobrecalentamiento, también por daño mecánico causado (por ejemplo, fuerzas excesivas en la compresión de los drivers). La distorsión reducida debido al nivel
inferior puede también ser una motivación, aunque esta es la gran ventaja de medición con sweeps donde la distorsión producida puede ser separada de la actual respuesta impulsiva.
Otra aplicación de los sweeps con decremento controlado de la envolvente en altas frecuencias es la medición de grabadoras de cinta análoga. La envolvente puede ser adaptada a la curva de saturación que depende de la frecuencia en la cinta analógica de
la grabadora, permitiendo así el uso óptimo del rango dinámico de la cinta en todas las frecuencias. De ésta manera, una aparente caída de la respuesta de frecuencia donde el nivel obtenidos cercanos al límite de saturación son obviados. En grabadores de cintas de casetes compactos con su estrecho y muy lento avance, el decremento necesario de la envolvente puede alcanzar 20 dB o más, dependiendo del material de la cinta. La curva de saturación de ésta misma puede ser determinada por la deliberada alimentación con
un sweep de excesivo nivel que cause saturación en todas las frecuencias. La distorsión producida es removida de la respuesta impulsiva y el espectro que queda de esta respuesta impulsiva es una buena estimación de la dependencia de la frecuencia a
máximo nivel de entrada para mediciones y grabaciones.

4.5 Sweep de dos canales con ecualización de altavoz y funcionalidad de crossover

En muchas mediciones acústicas, son empleados altavoces multivía para cubrir lo más posible el rango audible. Por ejemplo, un dodecaedro omnidireccional usualmente exhibirá una pobre respuesta bajo 200 Hz aproximadamente, dependiendo de su tamaño.
De esta manera, es una ventaja apoyarlo con un subwoofer para evitar la necesidad de excesivo pre-énfasis. Un diseño normal de caja cerrada o vented con un chasis será lo suficientemente omnidireccional en este rango de frecuencias. Como todas las tarjetas de sonido y algunos sistemas de medición están equipados con conversores estéreo, vale la pena hacer uso de dos canales para incluir una activa funcionalidad de crossover en la señal de excitación. Esto puede ser realizado con algunas extensiones del método de generación de sweep descrito en la sección 4.3 y 4.4.
Primero que todo, como en cualquier tarea de ecualización, es necesario medir ambos altavoces en la misma posición para establecer la magnitud, fase y relación de retardo válida. Teniendo en mente las capacidades de manipulación de la potencia del altavoz y acorde a su magnitud de respuesta, un punto apropiado de crossover puede ser seleccionado. En esta frecuencia la diferencia de la fase y del retardo de grupo entre ambos espectros es leída y almacenada. Ellas serán necesarias más tarde. Ahora, después de una suavización opcional, ambos espectros son invertidos y tratados con un filtro pasa banda para confinarlos a ellos al deseado rango de frecuencia a ser barrido (ver figura 20). En este punto, un énfasis deseado adicional es también aplicado al espectro estéreo. Debe ser diseñada ahora la envolvente de frecuencia controlada. Tiene que ser ejecutado ahora una división por la envolvente del espectro deseado. Después de estos pasos de preparación, la función crossover debe ser traída al juego mediante la multiplicación del primer canal con un filtro pasa bajos y el segundo con el correspondiente filtro pasa altos.

Un opcional efecto de suavización (con ancho constante en escala lineal de frecuencia) puede ser obtenido por la aplicación de una ventana a la respuesta impulsiva de ambos espectros. Para este propósito, ambos son transformados al dominio del tiempo después de suprimir su fase. La ventana deseada es aplicada y la respuesta al impulso confinada es transformada devuelta al dominio de la frecuencia (ver figura 21). La ventana no debe ser demasiado estrecha para evitar enturbiar o nublar el detalle de baja frecuencia.
Ahora el sweep de dos canales puede ser creado por la formulación de la ya conocida relación entre la magnitud ajustada y el incremento del retardo de grupo. Pero en vez de usar solo un canal, la magnitud ajustada de ambos canales tiene que ser añadida aquí para permitir el crecimiento del valor del retardo de grupo:

Como la frecuencia instantánea deberá ser la misma para ambos canales, la síntesis del retardo de grupo tiene que ser desarrollado solo una vez y la fase resultante puede ser copiada en el segundo canal. Si se diseñara la señal de excitación con una envolvente
controlada por la frecuencia, este espectro de dos canales tiene que ser multiplicado por la envolvente del espectro después de convertir la magnitud y el sintetizado retardo de grupo a su normal representación real/imaginaria.
La IFFT arrojara un sweep de dos canales que primero se deslizara a través de las bajas frecuencias en un canal y entonces las frecuencias restantes en el otro canal, La suma de ambos canales tendrá la deseada envolvente, mientras la relación de sus amplitudes en cada frecuencia instantánea corresponde a la relación establecida en el dominio espectral.
En la región de cruce, que no puede ser hecha indefinidamente estrecha debido a la norepetitiva naturaleza del sweep, ambos canales interfieren. Mientras ellos están en fase en la síntesis de la señal de excitación de dos canales, ellos usualmente no pueden llegar en fase al micrófono cuando son emitidos sobre dos altavoces. Así una corrección retardo/fase es necesaria para evitar perdidas de nivel de presión sonora en la región de cruce. Este es el por qué la relación de la fase y el retardo de grupo de la respuesta de los altavoces debe ser almacenada previamente. Esta información puede ahora ser utilizada para desplazar la señal para el altavoz con el menor retardo de grupo al derecho por la diferencia en los tiempos de llegada. Esto puede ser logrado mejor aún en el dominio espectral por la suma del apropiado retardo de grupo. Las fases recibidas en el punto de cruce pueden ser traídas en acuerdo mediante la suma o resta de pequeños adicionales retardos de grupo a uno de los canales.
Es discutible que podría ser más ventajoso, si ruidos de dos canales o sweeps con “dos voces” cubriendo independientemente ambos rangos de frecuencia al mismo tiempo, como estos permiten drenar la energía a ambos altavoces sobre el período entero de la
medición. Sin embargo, solo un sweep de “una voz” permite descartar adecuadamente los productos de la distorsión de la IR recuperada. Por otra parte la señal estereo puede alimentar con mucho mayor nivel, lo que compensa la desventaja del tiempo de emisión restringido en vías individuales.
Obviamente, el espectro de referencia necesario para deconvoluir la señal de excitación recibida no puede ser creado realizando la usual referencia eléctrica de medición.
Haciendo esto, la ecualización del altavoz cuidadosamente introducida podría desaparecer en el resultado final. La única manera viable es construir el espectro de referencia por una simulación descrita en la fig.22. Primero, la excitación de dos canales anteriormente generada es transformada al dominio espectral. Allí es multiplicada con la respuesta del altavoz y la respuesta del sistema de medición. Esta última puede incluir la respuesta del camino eléctrico de la señal (conversores, amplificador de potencia,
preamplificador de micrófono) y la respuesta del micrófono, que podría no ser suficientemente plana. Después de estas operaciones, ambos canales son sumados produciendo una simulación del espectro del nivel de presión en la posición del micrófono (coloreado por la respuesta del camino de recepción). Este espectro es ahora invertido para negar el retardo de grupo y neutralizar el pre-énfasis escogido, si es que fue aplicado. Al invertir el espectro podría producir un énfasis excesivo en frecuencias fuera del rango seleccionado de transmisión, es indispensable una multiplicación con un filtro pasa banda de aproximadamente la misma frecuencia usada en las etapas de preprocesamiento (fig.20).
Para silenciar el ruido efectivo fuera de las bandas, el orden del filtro pasa banda debe ser un tanto mayor que el usado en el pre-procesamiento. La aplicación de este inevitable filtro pasa banda es un paso crítico, lo que significa que son los resultados acústicos de la medición convoluida con su respuesta del impulso. Los efectos resultantes pueden ser un poco inquietantes. Por ejemplo, usando un filtro pasa banda con fase lineal obviamente produciremos un pre-ringing de la IR recuperada de la sala. Para efectos de auralización esto es indeseado. En este caso, es más aconsejable usar un filtro IIR de fase mínima. Por otro lado, un filtro pasa banda de fase lineal puede inducir menos errores en las clásicas evaluaciones de parámetros acústicos de sala. En cualquier caso, el orden del filtro debe ser lo más moderado posible, para mantener la IR del filtro lo suficientemente estrecha.
Generalmente, estas consideraciones se aplican a cualquier medición de acústica de salas de banda ancha. Al menos, la técnica de pre-ecualización activa presentada aquí permite obtener la IR de la sala libre de coloración por mediciones de altavoces y presenta una alta relación S/R independiente de la frecuencia.

5 MEDICIÓN DE DISTORSIÓN

Anteriormente se ha mostrado que los productos de la distorsión armónica pueden ser eliminados completamente de la IR obtenida cuando la medición es hecha usando sweeps. En mediciones de acústica de salas, usualmente estas son removidas si el altavoz no es el objeto de medición. Sin embargo, en mediciones de altavoces, es muy interesante asociarlas con la fundamental para evaluar el porcentaje de distorsión dependiente de la frecuencia. Esto puede ser hecho separadamente para cada armónico, como propone Farina [2]. Para describir la técnica, la fig. 23 muestra el retardo de grupo de un sweep logarítmico y sus primeros cuatro armónicos y la figura 24 muestra la distribución tiempo-frecuencia de la energía de una señal con similar distorsión.

Obviamente, para una determinada frecuencia de la fundamental, todos sus correspondientes armónicos tienen el mismo retardo de grupo. En el ejemplo, la fundamental del sweep llega a 400 Hz después de 2 segundos. Por lo tanto, el armónico de 2° orden intersecta la línea de 2 segundos en 800 Hz, el 3° en 1.2 kHz sucesivamente. Concentrándonos en una frecuencia específica en el diagrama, los armónicos que intersectan esta línea vertical tienen un retardo de grupo menor que la fundamental del sweep, como por supuesto ellos pertenecen a fundamentales con menores frecuencias que han sido “sweepeados” anteriormente. Multiplicando las curvas con el espectro de referencia (que es, restar el retardo de grupo de la fundamental) conduce a removerlos a tiempos negativos mientras la fundamental queda en t = 0 s, como se desea.
Sólo en el caso de sweeps logarítmicos, los armónicos presentarán un retardo de grupo constante independiente de la frecuencia después de la aplicación del espectro de referencia. Podrían ser usados otros retardos de grupo, pero requeriría el uso de un espectro de referencia separado de cada armónico para convertirlas en líneas rectas. Sin embargo, la distancia entre los componentes de los armónicos individuales podría no ser independiente de la frecuencia. Así un sweep logarítmico es preferible como señal de excitación, ecualizando el que ya ha sido usado desde hace mucho tiempo en el antiguo sistema grabador de nivel (1.1).
Una IFFT del espectro deconvoluido produce la actual IR en el borde izquierdo y un par de “armónicos de la IR” (harmonic impulse response, HIR) en tiempo negativos cerca del borde derecho, con la HIR de 2° orden situado en a la derecha y las HIR de mayor orden siguiendo de derecha a izquierda. Esta distancia entre ellos puede ser calculada por:

Para evaluar la fracción de distorsión dependiente de la frecuencia, la señal en el tiempo es separada en la fundamental de la IR y cada HIR mediante ventanas. Cada uno de la HIR aislada es enviado a FFT por separado. El largo del bloque de FFT usado puede ser mucho menor que el usado para la deconvolución inicial de la respuesta del sweep, por esta razón se aumenta la velocidad de todo el proceso. Para relacionar los contenidos de frecuencia de un espectro de HIR con la fundamental, se realiza una operación de cambio acorde al orden del armónico específico. Por ejemplo los componentes espectrales de la HIR de 5° orden son cambiados horizontalmente a un quinto de su frecuencia original. Después de esta operación, el espectro cambiado puede ser dividido en la fundamental produciendo la fracción de distorsión dependiente de la frecuencia (ver fig. 25).
Podría ser aplicada una corrección de -10log(orden del armónico) para compensar el énfasis de las frecuencias altas impuesto por el espectro de referencia. Sorprendentemente, como han expuesto muchos experimentos, esta operación ha de ser omitida para permitir corregir los resultados.

Comparado el estándar de excitación de un tono (single tone) y el análisis con incrementos de frecuencia fija, este método es mucho mas rápido y usualmente establece una mayor resolución de frecuencia, a menos en el rango de medias y altas frecuencias. Sin embargo, no se pueden negar algunas desventajas. Primero que todo, la medición es restringida a ambientes anecoicos, a menos que se usen sweeps muy largos.
Mucha reverberación en el sitio de medición podría conducir a ensuciar los distintos armónicos de la IR por componentes retrasados, impidiendo así su separación. Esto ciertamente es un defecto esencial, como el fuerte de las mediciones de IR es
precisamente la habilidad de rechazar reverberación, con tal que el desfase entre sonido directo y la primera reflexión sea suficientemente largo.
Existen otros problemas relacionados con el uso de ventanas para separar la HIR individualmente. Por supuesto, todos los problemas usuales asociados con el uso de ventanas aplicadas [33]. En particular, la elección del tipo de ventana constituye un compromiso entre el ancho del lóbulo principal, mainlobe width (equivalente a la resolución espectral) y la supresión del lóbulo lateral, sidelobe suppression. Para evitar una pérdida de energía y una subsiguiente subestimación de los componentes de distorsión que no están exactamente situados bajo la parte superior de la ventana, se usa una ventana Tukey-style [33]. Sin embargo este tipo de ventana presenta una pobre sidelobe supresión, de ventana rectangular de sólo 21 dB.
Esto puede llevar a rellenar con señal artificial aquellas regiones de frecuencias en cuales la distorsión cae a valores muy bajos. El suavizado espectral causado por cualquier ventana es constante en una escala lineal de frecuencia. En la usual visualización logarítmica, esto significa que la resolución espectral llega a ser extremadamente alta en altas frecuencias, mientras posiblemente existan detalles deficientes en el final bajo del espectro de distorsión. Si se desea una mayor resolución, el sweep debe ser hecho mas largo para espaciar la HIR, así permitiendo el uso de ventanas anchas.
El ancho de ventana disminuye según la ecuación (15) para separar las HIR de alto orden. Esto conlleva a reducir la resolución del correspondiente espectro de distorsión.
Sin embargo, cuando se comprime a la derecha para relacionar con su fundamental, la resolución queda mayor que la HIR de menor orden. En la práctica, la resolución deseada para armónicos de 2° orden al final del rango de transmisión del altavoz determina la razón del sweep y por lo tanto el largo de la señal de excitación.

Otro problema de la detección rápida de la distorsión es la falta de relación S/R, especialmente para armónicos de mayor orden que usualmente tienen bajos niveles.
Mientras que el método de tonos puros resulta en bastante energía en la fundamental y sus armónicos, la técnica de sweeps dispersa la energía continuamente sobre todo el rango de frecuencias. Este es el porque la distorsión del espectro para armónicos de alto orden tiende a ser bastante ruidoso, esencialmente en altas frecuencias. Para aliviar este problema, es bueno extender el sweep a un largo incluso mayor del necesario para obtener la resolución espectral deseada. Las ventanas pueden ser más angostas de lo necesario para aislar la HIR, de este modo rechazando el ruido de fondo que queda entre ellas.
Finalmente, incluso cuando se toman todas las precauciones para garantizar una alta precisión en la medición, es innegable que a veces, pueden ocurrir diferencias inexplicables entre el método de steady tone y el sweep en algunas regiones de frecuencia. La fig 26 muestra un ejemplo de tal diferencia. Entre 1.3 y 1.7 kHz, el armónico de 2° orden obtenido con ambos métodos es bastante diferente. Las razones para estas diferencias no son obvias, quizás diferentes temperaturas de la bobina del altavoz pueden jugar un papel importante. Después de todo, el método de stepped tone toma mucho más tiempo y por lo tanto produce un aumento de temperatura en la bobina.
A pesar de estas incertezas, las pruebas de distorsión basadas en sweep son muy atractivas, ya que estas son mucho más rápidas que las convencionales con tonos puros.
En pruebas de producción esto no solo permite un chequeo rápido, además permite comprobar el 100% de la producción, incluso si la mercadería es una producción masiva económica.

6 CONCLUSIONES

Las técnicas de FFT usando sweeps como señal de excitación es la opción más ventajosa para casi todas las situaciones de medición de función de transferencia.
Permite alimentar el DUT con mayor potencia con un factor de cresta un poco mayor de 3 dB y son bastante tolerantes contra las variaciones de tiempo y distorsión. Escogiendo un largo de sweep adecuado permite eliminar todos los productos de distorsión.
Además, estos se pueden clasificar en armónicos dependientes de la frecuencia, permitiendo un análisis completo y bastante rápido para todo el rango de frecuencia conjuntamente con la evaluación de la función de transferencia. Cuando el propósito es capturar respuestas impulsivas para auralización, no hay alternativa a los sweeps: El alto rango de 90 dB requerido para este propósito no puede ser obtenido con MLS o mediciones de ruido. Pero incluso en las mediciones RT estándar que no requieren un gran rango dinámico, los sweeps son favorables ya que ayudan a aumentar el rango dinámico hasta 15 dB comparado con mediciones basadas en MLS, usando el mismo amplificador, altavoz y largo de medición. Así existen pocos puntos favorables mediante el uso de MLS. Incluso su característica de ahorrar memoria y tiempo de procesamiento ha perdido completamente relevancia con la tecnología
computacional actual.
Desde el punto de vista de un programador, no incluir la generación de MLS y la transformada de Hadamard, es un ahorro de tiempo de desarrollo de un software de medición.
Aunque obtener funciones de transferencia con MLS puede ser matemáticamente elegante, los autores piensan que el uso de sweeps es elegante desde un punto de vista de la teoría del sistema y señales. Además midiendo con sweeps es más natural.
Después de todo, los murciélagos no emiten MLS para hacer su perfil acústico.

FFT_Medición de Función de Transferencia con sweeps 2

COMPARACIÓN ENTRE SWEEPS Y MEDICIONES MLS

2.1 Duración de la medición

En todas las mediciones, el periodo de captura AD debe ser por lo menos del largo de la respuesta impulsiva (en la practica: el tiempo antes de que la respuesta llegue al ruido de fondo) para evitar errores. Esto es obvio para una medición con pulsos no periódicos.
Toda su energía es emitida al principio, y el conversor DA simplemente muestrea hasta que la respuesta impulsiva decae. En el caso que sean usados sweep no periódicos como señales de excitación, el período de captura debe ser un poco mayor, pero en
general no mucho. Esto gracias a que los sweep comienzan en frecuencias bajas. Con DUTs normales, como altavoces, el mayor retardo de la señal ocurrirá en baja frecuencias. Así, mientras se produce el barrido a través de las altas frecuencias, el
tiempo debe ser suficiente para obtener los componentes retrazados de baja frecuencia.
Para mediciones de altavoces el decaimiento en frecuencias altas es usualmente tan corto que la captación AD puede ser detenida inmediatamente después que la señal de excitación pasa a través de él (siempre que el sweep sea considerablemente más largo que el retardo en bajas frecuencias y por supuesto, observando el tiempo de llegada entre el altavoz y el micrófono). En mediciones de salas acústicas el trozo de silencio siguiente a la emisión del sweep usualmente debe ser mayor que el tiempo de reverberación en altas frecuencias.
En el caso de excitaciones periódicas, el largo del período y el tiempo de captura AD deben ser mayores que el largo de la respuesta impulsiva. Utilizar un largo menor podría provocar time aliasing, que consiste en el pliegue de la parte final de la IR que cruza el periodo con el principio del siguiente, sumando ésta al principio de la IR.
Dependiendo de la cantidad de energía plegada hacia atrás, aparecerán errores más o menos tolerables. Comparado con mediciones de pulsos no periódicos o mediciones con sweeps, la necesidad de emitir la señal de excitación dos veces significa que se requiere
mayor tiempo para la medición. Por otra parte, solo la mitad de la energía total que alimenta al DUT es usada para el análisis.

2.2 Factor de Cresta

El factor de cresta es la relación del voltaje Peak-RMS de una señal expresado en dB. Asumiendo que la medición del sistema o el DUT están limitados por un nivel distinto de voltaje, el valor peak de cualquier señal de excitación considerada, tiene que ser
normalizado a este valor para extraer la máxima energía posible en una medición. El nivel RMS entonces será bajo de acuerdo al factor de cresta. Así, el factor de cresta indica cuanta energía se pierde cuando hay una cierta señal de excitación, comparada con el caso ideal de estimulo cuyo voltaje RMS es igual al voltaje peak (cresta = 0 dB).
Por esta razón, el diseñar señales con un factor de cresta lo más bajo posible se ha convertido en una especie de deporte para los desarrolladores teóricos de análisis de señales.
La suposición que un nivel de voltaje está definiendo el límite superior de una medición, muchas veces es verdadero en mediciones puramente eléctricas (por ejemplo, ecualizadores, mezcladores, etc.). En mediciones acústicas esto es válido sólo cuando el amplificador es el eslabón más débil de la cadena. Aún, muchos amplificadores equipados de una fuente de alimentación basada en una transformación lineal pueden reproducir sobretensiones peaks de 2 o 3 dB más altos que la potencia continua.
La primera restricción es el daño por el sobrecalentamiento de la bobina del altavoz, para este caso la energía total emergente del altavoz es más importante que el factor de cresta. Sin embargo, factores de cresta muy grandes deben ser evitados siempre, ya que
un único peak de nivel puede causar distorsión.
Como primera observación, un MLS mantiene la salida semejante a la señal de excitación ideal. En el sentido de máxima extracción de energía. El valor Peak es igual al valor RMS. Sin embargo, el ideal factor de cresta resultante de 0 dB no puede ser explotado en la práctica. Tan pronto como el MLS salga al mundo real y pase a través de un filtro, la forma de onda rectangular puede cambiar considerablemente.
Especialmente los filtros anti-aliasing abruptos usados en la etapa de oversampling de un conversor DA causan dramáticos overshoot (distorsión). Para evitar esta drástica distorsión causada por los clip en las etapas del filtro, el MLS debe alimentar el conversor DA con un nivel de al menos 5 a 8 dB bajo la escala total, dependiendo de las características del filtro anti-aliasing. Esto quiere decir que el MLS no puede ser emitido libre de distorsión con la misma energía de una señal senoidal con un factor cresta de 3.01 dB.
Pero aún si el MLS es producido por un hardware generador, este no retendrá el favorable factor de cresta por un gran tiempo. Los amplificadores de potencias siempre equipados con un filtro pasa bajos de entrada que rechaza la interferencia de radio, y evita trancientes de intermodulación inducida por altas slew rate de la señal de audio precisamente que prevalecen en abundancia en un MLS no filtrado. Un típico filtro de entrada puede ser un Butterworth pasa bajos de 2° orden con un frecuencia de corte de quizás 40 kHz. El overshoot producido por este filtro es mucho más moderado que el de un filtro anti-aliasing abrupto (fig. 7) pero aún merece consideración.

Existen casos en que algunos nodos internos del DUT restringen el driving level y no los voltajes de la salida del sistema de medición. Por ejemplo, si una resonancia con alta ganancia se encuentra en una etapa de ecualización de la cadena, la señal de excitación debería distorsionar a la salida de esa etapa. En esos casos, los sweeps tienen que alimentar con un nivel más bajo determinado por la ganancia en la frecuencia de resonancia de ese filtro específico. En contraste a esto, el MLS filtrado tiende a tomar una amplitud de distribución gausiana, con un 1% de las amplitudes alcanzando un nivel mayor a 11 dB sobre el valor RMS [13]. En muchas mediciones de altavoces y salas acústicas, aun con la presencia de resonancias moderadas, un sweep puede alimentar con un mayor nivel RMS que un MLS. En la práctica la distorsión ocurre gradualmente, con MLS mucho antes que el nivel de clip del amplificador sea alcanzado. Como será examinado en la sección 2.5

2.3 Rechazo de Ruido

Cualquier principio de medición usando señales de excitación con igual longitud, distribución espectral y energía total conducirá exactamente a la misma cantidad de rechazo de ruido, si es considerado el período entero de la respuesta al impulso sin ventana. Para cada frecuencia la relación S/R solamente depende de la relación de energía de la respuesta del DUT a ese extraño ruido capturado en el período de medición. Las diferencias entre varios métodos de medición simplemente engañan en la manera de cómo el ruido se distribuye sobre el periodo de la IR recobrada. Claramente usando la misma distribución espectral en una señal de excitación requiere la misma coloración invertida en el proceso de deconvolución. Esto explica el porque la magnitud de la fuente de ruido no varía cuando se cambia el tipo de estimulo. Las fases sin embargo serán muy diferentes. Aún, algunos tipos de fuentes de ruido aparecerán similarmente en todas las mediciones, ya que su característica general no es alterada por la manipulación de la fase. Como por ejemplo un ruido de mono frecuencias (hum).
Igualmente el ruido no correlacionado (por ejemplo aire acondicionado) aún aparecerá como ruido.
Sin embargo, cualquier otro disturbio será reproducido bastante diferente, dependiendo del tipo de estímulo. Fuentes de ruido impulsivas, como clicks y pops, serán nuevamente transformados en ruido cuando usamos un ruido como estímulo. En contraste en una medición con sweep ellos llegarán a ser audibles como un sweep invertido en el tiempo. Usualmente ruidos estables son considerados más discretos que otras señales de error. Generalmente, si cualquier ruido aparece inesperadamente, la medición simplemente debe ser repetida, o, si se está promediando eliminar el periodo específico del proceso.

2.4 Variación de Tiempo

Las variaciones de tiempo tienden a aparecer en las mediciones siempre que se realicen sobre una larga distancia exterior, cuando el promedio sincronizado es realizado sobre largo periodos de tiempo, o cuando el DUT en si mismo no es invariante en el tiempo.
El primer caso ocurre en mediciones en estadios, o sitios al aire libre bajo condiciones metereológicas con viento. El segundo se da cuando la relación S/R es muy baja forzando a utilizar muchos cientos o incluso miles de promedios sincrónicos. En
periodos de medición largos, una leve variación de temperatura o movimiento puede frustrar el proceso de promediado. Un tipo de DUT que no sea invariante en el tiempo como cualquier tipo de grabadora análoga.
Es bien sabido que las secuencias de ruido periódicas en general, y en especial los MLS son extremadamente vulnerables a leves variaciones de tiempo. Una considerable cantidad de trabajos teóricos explican estos efectos en detalle [27-29]. Aunque las ecuaciones allí presentadas se ven amenazadoras, en la práctica es fácil comparar los efectos de variaciones de tiempo, estos tienden a tener una errática e impredecible naturaleza. Es probable que dos mediciones al aire libre realizadas en serie estén afectadas por diferentes ráfagas del viento. Sólo una simulación permite evadir esta “variación del tiempo de la variación del tiempo”. La fig. 8 da un pequeño ejemplo.
Una secuencia de ruido y un sweep, ambos con espectro blanco plano, han sido sometidos a una suave variación del tiempo sinusoidal de ±0.5 muestras.  Para simular un jitter, las señales han sido sobre muestreadas por un factor de 256 (sin filtrar, simplemente insertando 255 ceros consecutivos después de cada muestra). Entonces el tiempo exacto de llegada de las muestras ha sido desplazada en un rango de ±128 de acuerdo a la curva sinusoidal de jitter. La alteración resultante del espectro de banda base es insignificante en baja frecuencia, pero este aumenta extremadamente para el espectro de ruido con jitter. Por el contrario el espectro del sweep con jitter sólo muestra una mayor corrugación al final de altas frecuencias, y esto puede ser removido con una suave ventana de suavización.

Otra prueba expresiva es la respuesta de frecuencia de la medición de un grabador análogo, un tipo de maquinas que siempre sufre wow and flutter en alguna proporción.
Como el material de cinta magnética tiende a saturarse mucho antes en altas frecuencias, ha sido aplicado un énfasis de 24 dB en baja frecuencia al MLS y al sweep usados en este experimento. Adicionalmente la envolvente del sweep ha sido hecha a la medida para que decrezca 12 dB sobre los 5 kHz, pero manteniendo la coloración inicial. La sección 4.4 nos revelara como esto es realizado. Ambos estímulos fueron normalizados para que contengan la misma energía y fueron grabados con el mismo nivel de entrada. Como los resultados de la fig. 9 muestran, la respuesta de frecuencia medida usando MLS como excitación es tremendamente ruidosa sobre los 500 Hz.
En la que se utilizó el sweep como estimulo, también se observa la variación de tiempo inducida por la contaminación pero mucho menos extendida. Además de los efectos de deterioración de la variación de tiempo, la distorsión también juega un papel importante en la contaminación de respuesta recobrada de la grabadora análoga. Para minimizar la ínter-modulación producida, el nivel de grabación ha sido ajustado 20 dB bajo la saturación límite en este experimento.
Aun cuando el sistema de medición es virtualmente libre de variaciones de tiempo, el uso de señales de excitación pseudo-ruidosas es desventajoso cuando se realizan ajusten dentro del período de medición (volumen, EQ, otros). En este caso ocurren grandes errores en la visualización de la IR. Los sweep y la medición del impulso no muestran esta molesta reacción a la variación del tiempo y estas son además más agradables de usar para ajustes en mediciones repetitivas.

2.5 Distorsión

Los ingenieros de Hardware de audio se empeñan en optimizar el rango dinámico de sus circuitos que idealmente debe corresponder a nuestro sistema auditivo con valores sobre 130 dB. La relación S/R en mediciones acústicas parece haber sido descuidada por los acústicos en el pasado.
En sitios de relativa calma, es menor el ruido de fondo que limita la calidad de las respuestas de las IR obtenidas, pero muy frecuentemente la distorsión es producida por el altavoz empleado. En cualquier medición usando ruido como señal de excitación, estos productos de excitación serán distribuidos como ruido sobre todo el período de la IR. La razón de esto, es que la distorsión de un estímulo con fase pseudo- aleatoria también tiene mayor o menor fase aleatoria, y también el proceso de deconvolución involucra fases aleatorias que eventualmente producen un espectro erróneo con fases aleatorias, correspondientes a una señal de ruido aleatoriamente distribuida. Como esta señal errónea es correlacionada con la señal de excitación, promedios sincrónicos no mejoran esta situación.
Mientras es verdad que los niveles de ruido dañan relativamente al valor peak de la IR cuando escogemos una secuencia mayor, esto puede ser reducido difícilmente a un valor aceptable. Mediciones de acústica de salas involucran secuencias largas. Por ejemplo, aumentando el largo de un MLS de grado 18 por un factor de 128 podríamos teóricamente reducir el nivel de ruido de un típico valor de –65 dB a –86 dB. Mientras esto puede ser factible en procesos MLS de grado 25 (largo 12min, 42s con 44,1 kHz de frecuencia de muestreo) en un computador equipado con bastante memoria, podría no funcionar bajar el nivel de ruido a este nivel, porque cuando usamos una secuencia tan larga, la vulnerabilidad contra la variación de tiempo es predominante.
En vez de reducir la influencia de la distorsión por un incremento del período de medición, es más beneficioso simplemente excluirla totalmente de la IR recuperada.
Esto puede ser logrado fácilmente por el uso de sweeps como señal de excitación, como se explico en la sección 1.8. La mayor mejora que puede ser realizada en mediciones de acústica de salas por el reemplazo de MLS con sweep es demostrada en la fig. 10.
Ha sido medida la IR de una cámara reverberante usando MLS y sweeps de grado 20, ambos con la misma energía y el mismo pre-énfasis de 20 dB en baja frecuencia. Para la medición con MLS, el volumen ha sido cuidadosamente ajustado para producir una
mínima contaminación a la IR. De hecho, esta búsqueda del óptimo nivel mediante prueba y error es crucial en mediciones con MLS [34], ya que mucha energía produce distorsión excesiva visible por un aumento del ruido de fondo con una estructura abultada, mientras que en bajo nivel conduce al que el ruido de fondo estropee la mayoría de las veces la medición.

Después de este ajuste se pueden realizar 1, 10, 100 promedios sincrónicos con ambas señales de excitación. Es claramente visible en la fig. 10, que cuando no se usan promedios, la IR decae al ruido de fondo que es 5 dB menor en mediciones con sweeps.
La distorsión acumulada queda al final del período de medición. Como el largo de la señal de excitación ha sido escogida al menos 8 veces mayor que el tiempo de reverberación, esta puede ser separada de la actual IR. Realizando 10 promedios sincrónicos, el ruido de fondo se reduce 10 dB cuando se utilizan sweeps. Por el contrario, cundo se usa MLS como señal de excitación, sólo se observa una pequeña disminución del ruido de fondo, demostrando que el producto de intermodulación correlacionada prevalece en la IR recuperada. Realizando 100 promedios sincrónicos no sucede ninguna mejora en una medición con MLS, mientras que en la medición con sweeps se aprecia una disminución, a pesar de que no alcanza los 10 dB esperados. La variación de tiempo debido a la variación de la temperatura podría explicar esto, ya que la medición de 100 promedios toma alrededor de 40 minutos.
En este experimento el nivel de salida ha sido optimizado para el uso con MLS. El nivel del sweep emitido podría haber sido aumentado 15 dB causando una distorsión en el amplificador, y con esto disminuir el nivel del ruido de fondo esta misma cantidad. Así, la relación señal ruido podría haber alcanzado un valor de 100 dB con sólo 10 promedios de sweeps. Por el contrario es imposible conseguir esta calidad con mediciones MLS, independientemente del nivel y del número de promedios.
El altavoz utilizado en el experimento fue una combinación woofer/tweeter para PA de 12 pulgadas optimizado para una mayor eficiencia. Este tipo de parlantes claramente produce mayor distorsión que un sistema de alta fidelidad con suspensiones más suaves
y mejores bobinas, pero incluso con este último, una relación de señal ruido de 90 dB se puede lograr, algo que es inalcanzable con mediciones MLS.
Esto es mostrado con un experimento similar usando un altavoz coaxial de 5’’ con suspensión suave medido en una cámara anecoica con señales de excitación muy pequeñas (fig. 10b). Nuevamente el nivel fue ajustado para alcanzar la óptima relación S/R con el MLS rosado. Alimentado con la misma energía, el sweep rosado produce una mejor relación S/R con sólo una medición. Este nivel ajustado a favor del MLS fue tan bajo que fue posible aumentar 20 dB sin causar saturación en el amplificador de potencia empleado. Haciendo esto, los productos de la distorsión al final del período aumentan considerablemente, pero la relación S/R aumentó aproximadamente a la ganancia adicional del amplificador. Con sólo 10 promedios (largo total de la medición de 3,5 segundos), se alcanzan exitosamente 100 dB.

Además de mediciones acústicas, existen más situaciones de medición en que se requiere linealidad que las mediciones con MLS no satisfacen, como por ejemplo codificadores psico-acústicos. Un ejemplo obvio son los teléfonos celulares que usan una muy alta compresión para obtener bajos bit rate. Experimentos preliminares muestran que señales cortas de excitación producen errores impredecibles y erráticos, independientemente si se usa MLS o sweeps. Aumentando el largo del grado 18 a 44.1 kHz de frecuencia de muestreo entregan resultados más o menos confiables con un sweep (lineal entre 100 Hz y 7 kHz), mientras que la medición con MLS del mismo largo y coloración produce una curva muy rugosa que difícilmente permite reconocer la función de transferencia (fig. 11). Sin embargo, hay que admitir que estos resultados son cuando la respuesta impulsiva es transformada al dominio espectral sin un proceso previo. Aplicando una ventana estrecha con un ancho de sólo 80 ms alrededor del peak mayor alivia la situación bastante (fig.12). Aún así, aparecen sorprendentes diferencias sobre los 2kHz entre las mediciones con MLS y sweeps. El codificador parece producir diferentes resultados para ruido de banda ancha y aparecen señales mono frecuenciales en un corto periodo de análisis.
Otro ejemplo que es más frecuente en aplicaciones de audio que la codificación de baja fidelidad telefónica es la popular compresión MPEG 1 / layer 3. La fig.13 muestra la función de transferencia de codificador para la común razón de 128 Kbit/s, con medición de MLS y sweep. La ventaja del sweep es arrolladora en esta aplicación. De hecho, el ruido de banda ancha que el codificador tiene que tratar cuando un MLS se utiliza como señal de excitación presenta el caso peor para la codificación psicoacústica.
Todas las bandas de frecuencia contienen energía, así ninguna cae debajo del nivel de enmascaramiento que podría permitir omitirla. Consecuentemente, todas las bandas tienen que ser sometidas a una cuantización para obtener el bit rate requerido, resultando en distorsión que perturba significantemente la medición con MLS. Por el contrario, los sweeps se deslizan solo un par de bandas por intervalo de análisis, permitiendo cuantizar con alta resolución mientras se descartan otras que no contienen energía.

Para resumir, cuando medimos la compresión de datos de los codificadores, los sweeps tienen la considerable ventaja de reducir la complejidad de la señal comparado con las secuencias de ruido. Esto convierte la codificación en una tarea sencilla. Mientras que en mediciones “naturales” usando sweeps, la distorsión puede ser aislada y eliminada por el uso de ventanas, la ventaja en mediciones que involucren codificadores parece mentir más en el hecho que la generación de distorsión es simplemente prevenida.

Resonadores de Helmholtz

Resonadores de Helmholtz

Se describe un experimento que permite medir la velocidad del sonido con un error inferior al 5%. El dispositivo consiste en un resonador de Helmholtz con simetría cilíndrica, en este caso se utiliza una botella. El sistema es análogo a una masa vibrando en un resorte: la frecuencia de resonancia está relacionada con la masa del tapón de aire situado en el cuello de la botella y sus proximidades, y con la constante del resorte, asociada a la elasticidad del aire que llena el resto de la botella. Se detalla un procedimiento simple y una discusión de las aproximaciones que en éste están involucradas. Además, se analiza el comportamiento general del resonador más allá de la frecuencia fundamental.

I. INTRODUCCIÓN

Al excitar la masa de aire en el interior de una botella, puede obtenerse una nota musical. Este fenómeno ocurre en botellas de forma arbitraria y corresponde a una oscilación forzada diferente a la que presenta un simple tubo, se trata en este caso de un resonador de Helmholtz. En estos dispositivos, la oscilación del aire que se encuentra en el cuello de la botella provoca la compresión y descompresión del aire del cuerpo. Si las dimensiones del resonador son pequeñas comparadas con la longitud de onda del sonido , el gradiente de presión en el cuerpo de la botella es cercano a cero. Los cambios de presión en la botella se deben a las propiedades elásticas del gas en su interior y proveen la fuerza restauradora que actúa sobre el tapón de aire (análogamente a una masa y un resorte).
A continuación se describe un experimento que permite medir la velocidad del sonido usando como resonador una botella parcialmente llena de agua. Se detallan las aproximaciones utilizadas en el mismo y se exhiben los principales resultados obtenidos. Se realiza, además, un estudio del resonador más allá de su frecuencia fundamental.

II. DESCRIPCIÓN TEÓRICA DEL OSCILADOR

Por simplicidad consideraremos que la botella está formada por dos cilindros rectos de sección circular y diferente diámetro, como se indica en la Figura 1. La frecuencia angular de una masa vibrando en un resorte es:
ω² = k/m (1)
donde k es la constante del resorte (en este caso, relacionada con las propiedades elásticas del gas en el cuerpo de la botella) y m es la masa del tapón de aire.
Si la densidad del gas es ρ y el volumen del tapón es v, su masa es m=v.ρ. La constante del resorte puede ser determinada por el cambio de presión que sufre el tapón debido al resto del gas. La fuerza que siente el tapón es F=a.Δp, donde a es el área del cuello de la botella y Δp es la diferencia de presiones entre el interior y el exterior de la botella. Este cambio de presión se puede
referir a un cambio en el volumen del gas a través de la compresibilidad del mismo:

Κ= -(1/V)(ΔV/Δp) (2)
V y ΔV se refieren al cuerpo de la botella. Si el aire en el el cuerpo cambia en una cantidad ΔV=a.Δx y la fuerza resultante en el tapón es:

F= -(a²/KV) Δx = -kΔx (3)
Como la velocidad del sonido se puede escribir en términos de la compresibilidad del gas,

c²= 1/(Κρ) (4)
resulta ω² = a²c²/(vV) = (a/A).(c²/ l.L) (5)

donde se utilizó v=a.l y V=A.L. (el reemplazo de v y V por l y L simplifica el análisis).
La ecuación (5) no está restringida a secciones circulares. La aproximación de separar el problema en una parte completamente inercial (cuello) y otra completamente elástica (cuerpo) puede ser testeada con este experimento. Trabajando con la ecuación (5) se obtiene:

L’=L+ l = ac²/(4π²lA).1/f² + l (6a)

siendo f la frecuencia fundamental. Análogamente, en términos de volúmenes, queda:

V’=V+v = a²c²/(4π²v).1/f² + v (6b)
La ecuación (6a) indica que la profundidad de la superficie de agua en la botella varía linealmente con f²

La pendiente de dicha recta determina la velocidad del sonido y la longitud de l está dada por la ordenada al origen. Se espera que la longitud del tapón de aire sea superior a la del cuello de la botella. Esto se debe a que la botella tiene el extremo superior abierto y por lo tanto hay una contribución del aire situado sobre y debajo del cuello, al tapón vibrante. En otras palabras, un volumen adicional de aire de longitud Δl y sección a se extiende por encima y por debajo de los límites físicos del cuello de la botella y contribuye al tapón de aire.
Al medir L’desde la boca de la botella, parece que se estuviera ignorando una de estas longitudes adicionales la correspondiente al aire por encima de la botella.
Puede verse que esto no es cierto de la siguiente forma. Supóngase que se ignora una pequeña parte del volumen de la botella. Entonces, se subestima la energía total del sistema. Como en un ciclo de oscilación las energías cinética y potencial del sistema son iguales, se espera que en ese ciclo la subestimación de esas cantidades sea
también igual. Los promedios de las energías son:

= (1/2)mv² = (1/4)ρvω²uo²

= (1/2)Kx² = (1/4)(ρac²/V).uo²donde la uo es la amplitud. Puede suponerse que el efecto de esta subestimación aparece como un cambio en el volumen del tapón de aire, v, o en el volumen del cuerpo, V. Dejando constante la frecuencia de oscilación y utilizando la ecuación (5), sale que:

1 = (Δ)/(Δ
) = (Δv/v)/(ΔV/V)

Luego, las subestimaciones en el volumen del tapón y en el volumen del cuerpo de la botella deben ser iguales. Como Δv + ΔV = a Δl (el volumen ignorado), resulta Δv = aΔl /(1+V/v) y ΔV = aΔl /(1+v/V) . Como V es generalmente mucho mayor que v, ΔV tiende a aΔl y Δv tiende a cero.
Ignorar el volumen aΔl sobre el cuello de la botella significa que el volumen del cuerpo de la botella fue subestimado en una cantidad mayor que la cantidad en que fue subestimado el volumen del tapón de aire.
El método de resonador de Helmholtz determina la longitud efectiva del tapón de aire, incluyendo prácticamente todo el aire adicional en ambos extremos. Como la subestimación de Δv se vuelve insignificante al crecer V, este modelo funciona mejor para los L’ más grandes dentro del cuerpo de la botella.

III. DESCRIPCIÓN DEL ARREGLO EXPERIMENTAL
Se utilizó una botella parcialmente llena de agua (el nivel de agua es el que determina la longitud L’). En la boca de la botella se colocaron un parlante y un micrófono, tal como se indica en la Figura2.El parlante fue conectado a un generador de funciones que enviaba una onda senoidal al interior de la botella. Se utilizó un osciloscopio de dos canales para recibir la señal del generador de funciones y la señal captada por el micrófono.
Fijada una cierta amplitud para la onda senoidal, se varió su frecuencia . De esta forma, para una cierta longitud L’, es posible hallar las frecuencias de resonancia de la botella. Se trabajó en un rango de frecuencias de 10 a 6.000 Hz, confeccionando la curva de resonancia correspondiente a un dado L’. Se realizaron mediciones tanto en el cuerpo como en el cuello de la botella. Las áreas del cuello y del cuerpo (a y A) fueron calculadas colocando un volumen de agua conocido y midiendo el incremento en el nivel del líquido.

IV. RESULTADOS
-Parte A: Modelo de ‘resonador de Helmholtz’ (frecuencia fundamental)
Parámetros característicos de la botella:
.área del cuerpo A=(19.3 ± 0.3)cm²
.área del cuello a=(2.5 ± 0.1)cm²
.longitud del cuello l=(9.00 ± 0.05)cm

El gráfico 2 muestra cuán apropiado resulta aproximar la botella por dos cilindros. Se grafica el volumen efectivo de la botella (V’) en función de la distancia desde su boca hasta la superficie de agua (L’).
La recta A está dada por V’= a.L’ y la recta B por
V’=AL’- π(R²-r²).l.
Del gráfico se obtiene
a = (2.60 ± 0.07)cm² y A= (19.1 ± 0.2)cm².

Para las mediciones realizadas en el cuello de la botella, es decir cuando L’< l , es aplicable el modelo de un tubo con un extremo abierto y uno cerrado en la superficie del agua.
Teniendo en cuenta que la longitud efectiva L*= L’+ Δl del tubo es superior en un cierto Δl a la longitud medida, dado que el antinodo de desplazamiento se encuentra desplazado en dicho Δl del extremo abierto, y obteniendo ese Δl de la parte A, resulta:

-Parte C: Otras frecuencias de resonancia.
Trabajando en el cuerpo de la botella, las frecuencias de resonancia halladas mantienen una relación lineal con el n° de modo n. A continuación se grafican ,para cada L’, todas las frecuencias de resonancia medidas. Este gráfico será tratado con más detalle en la “Discusión de resultados”.

La fórmula (7) puede reescribirse de la forma
fn (L’) = (2n+1)/4 . c/L* (8)
o sea, que para n fijo f es una función lineal de c/L*.
Realizando estos gráficos para cada n entre 1 y 4, no se obtienen rectas en ningún caso sino polinomios de grado 5.

V. DISCUSIÓN DE RESULTADOS

La velocidad del sonido obtenida en cada caso está dentro del valor esperado (para ambas botellas y trabajando en el cuello de la primera de ellas). La longitud del tapón de aire (l arrojado por los gráficos 1 y 3) es superior a la longitud del cuello, de acuerdo a
lo previsto por el modelo teórico.
Con estos datos se pudo averiguar el valor de Dl para cada una de las botellas para ser luego utilizado en el resto del trabajo,
pues sólo es válido utilizar L’sin corrección para el modelo de resonador de Helmholtz según fue explicado en la Descripción teórica del resonador.
El gráfico 2 (V’vs L’) muestra cuán apropiado resulta aproximar la botella por dos cilindros. Las curvas A y B representan los volúmenes de cada uno de ellos. El volumen de la botella es lineal con L’, para niveles de agua por debajo del cuello. Por esta razón, al trabajar en el modelo de resonador de Helmholtz, sólo se utilizó L’>l (siendo l la longitud del tapón de aire).
La frecuencia angular de resonancia está dada por ω²=k/m. De acuerdo a lo expuesto en la Descripción teórica, m es la masa del tapón de aire y k está relacionado con el volumen V del cuerpo de la botella. Por esto, en el gráfico 4, para un volumen V fijo, la frecuencia de resonancia es mayor para la botella de cuello más corto pues en ella -dado que los cuellos de ambas botellas tienen la misma área a- la masa m que oscila es menor.
Lo que importa es el volumen del resonador, y no su forma (para una determinada área del cuello). Esto fue comprobado experimentalmente ladeando la botella en resonancia. De este modo se cambió la forma del volumen pero no éste en sí; y el sistema no se apartó de la condición de resonancia.
En cuanto al estudio de las frecuencias siguientes a la fundamental para L’ en el cuerpo de la botella, se probaron dos modelos que no funcionaron. Ellos son:

1- Suponer que la onda sonora sólo se propaga en el cuello de la botella, donde tiene ambos extremos abiertos. Esto implica fn=n.(c/2l), pero las rectas f(n) no tienen ordenadas nulas

2-Suponer que la onda se propaga primero en un tubo con ambos extremos abiertos (cuello), y luego en un tubo de extremos abierto y cerrado (cuerpo).
Esto implica f1n = n.(c/2l) para el primer tubo y f2n = (2n+1).(c/4L) para el segundo.
Tampoco funciona, pues para cada L’debería verse el conjunto completo de las f1n, que no dependen de L’, y esto no sucede.
De acuerdo a al bibliografía consultada, las frecuencias superiores a la fundamental son relativamente altas y los correspondientes modos de vibración no son independientes de la inercia del aire en el interior de la cavidad (cuerpo de la botella). Por lo tanto, se propuso un modelo que tuviera en cuenta a la botella como un todo: tubo con un extremo abierto y otro cerrado. Como se ve en la Parte C, este modelo tampoco ajusta a los valores medidos.
Es importante destacar dos hechos llamativos en dicha parte del trabajo:

-el gráfico 6 muestra un comportamiento complejo para las frecuencias, lo cual también se aprecia en las curvas de resonancia. Hay un cierto doblete, es decir, las frecuencias f2 y f3 están muy próximas entre sí, y lo mismo ocurre con f4-f5 y con f6-f7, pero sin seguir un patrón evidente. Dicho comportamiento se hace más notorio en los L’ más grandes, y se va perdiendo a medida que éste disminuye. Para los niveles de agua más cercanos al cuello, las fn se van equiespaciando.

-al graficar f(L*)para n fijo, no se obtuvieron rectas como predice el modelo de tubo abierto, sino que las curvas son muy bien ajustadas por polinomios de orden 5 y no por ningún otro polinomio de orden menor. Esto implicaría que, dado n, f es un polinomio de orden 5 en c/L*.

VI. CONCLUSIONES
La velocidad del sonido fue hallada por dos métodos diferentes: mediante el modelo de resonador de Helmholtz aplicado al cuerpo de la botella y con el modelo de tubo abierto aplicado al cuello de la botella. El porcentaje del error obtenido con cada método es
aproximadamente igual (3.7% para el cuerpo y 3.1% para el cuello). Con respecto a la medición, los métodos son idénticos: se usa el mismo dispositivo y se procede de la misma forma. Cada uno de los métodos tiene ciertas ventajas respecto del otro:

-el método del cuello permite obtener c a partir de la recta L* (1/fo) en una forma más inmediata que la que da c de la recta L’(1/fo²) en el cuerpo.

-para el modelo de Helmholtz sólo es posible usar la frecuencia fundamental mientras que para el modelo de tubo abierto, c se puede
obtener trabajando con cualquiera de las frecuencias.

-para un mismo esfuerzo de medición, el modelo del cuerpo arroja más información que el del cuello pues, además de c, da la longitud del tapón de aire, de donde saca Δl, mientras que en el modelo del cuello, hay que estimar Δl para poder hallar c.

-si bien el procedimiento experimental es el mismo en ambos casos, el método del cuerpo requiere medir las áreas del cuello y el cuerpo, mientras que en el otro método, estos datos no son necesarios. Se puede concluir que si el único objetivo es medir c, convendría utilizar un tubo (teniendo en cuenta el cálculo de Δl), pero si además se busca conocer en forma precisa dicho Δl, entonces convendría trabajar con un resonador.

Por otro lado, los resultados correspondientes al modelo de resonador de Helmholtz (velocidad del sonido, longitud del tapón de aire, estudio comparativo de dos resonadores diferentes) se ajustan perfectamente a éste.
Esto, sumado a gráficos y mediciones ya mencionadas, destinadas a evaluar la validez de las aproximaciones ( gráfico 2, medición con la botella ladeada), indican que dichas aproximaciones son suficientes dentro de los objetivos del trabajo. Por esta razón, efectos de borde -boca de la botella y transición entre el cuerpo y el cuello- pueden ser ignorados trabajando bajo las aproximaciones mencionadas.
Queda sin resolver el problema de hallar un modelo que prediga los resultados experimentales hallados para las
frecuencias del resonador superiores a la fundamental.
Este trabajo puede servir de base para un estudio profundo en la búsqueda de dicho modelo, pues contiene los datos experimentales necesarios, descarta algunas posibilidades y muestra funciones que -aún sin explicar la relación entre los distintos modos- logran
ajustarlos individualmente.

VII. APÉNDICE
*nota: todos los ajustes lineales fueron realizados con el método de cuadrados mínimos mediante el soft Origin 3.5

Acústica para Diseño de Estudios de Grabación

Hoy en día el éxito de una producción musical o cinematográfica depende en gran medida de la buena acústica de la sala donde se realice así como del equipo utilizado. En este trabajo se diseñó un estudio de grabación el cual está en proceso de construcción. Se tomaron en cuenta los siguientes aspectos de la acústica: Absorción, Reverberación, Aislamiento Sonoro así como el Control de ruido y vibraciones [1], todo esto tomando en cuenta una de las dos principales tendencias actuales en el diseño de estudios de grabación (LEDE)[8]. Con el fin de reducir los costos y llevar a la práctica todos estos conceptos, paralelamente se está construyendo una pequeña sala en donde se experimenta con diferentes alternativas de materiales de construcción y acondicionamiento acústico. Los valores fueron tomados de algunas normas de acústica como NBE[2], UNE[3] e ISO, relativas al comportamiento frente al ruido de distintos materiales de construcción, aislamiento y absorción acústica. Ya que este tema es tan extenso, es un poco dificil incluir todos los detalles a fondo, pero se desglozaran los mas importantes para comprender bien este trabajo.

I. INTRODUCCIÓN

Un estudio de grabación se divide en dos secciones: Sala de Grabación y Sala de Control. Además del equipo adecuado se requiere de un tiempo determinado de reverberación (reverberation time –RT), una adecuada difusión del sonido, un aislamiento del ruido externo y un aislamiento entre las salas. En el proceso de diseño se hizo un recorrido por diferentes estudios de grabación en el país, encontrándose que un alto porcentaje, no tiene bases científicas ni cumplen los requerimientos acústicos, sino que enfocan su diseño en alguno ya construido. Muchos de los estudios de grabación son diseñados por músicos, dando las características acústicas que ellos creen agradables a sus oídos. Las salas de grabación de empresas importantes, cuentan con el diseño adecuado. Con el buen diseño acústico de este estudio de grabación, se busca obtener los mejores resultados a la hora de la grabación, edición y mezclas de cualquier producción musical.

II. MODELO

El diseño del estudio de grabación está basado en la necesidad de dar una calidad competitiva a las grabaciones, así mismo, ofrecer una excelente imagen y ambiente, la cual forma parte también fundamental para el desarrollo del ejecutante durante su grabación. Se va a construir en un terreno con una superficie de 30m de largo por 16m de ancho. Consiste de una sala de control compartida para tres salas de grabación. La sala de control tiene basado su diseño en la tendencia LEDE[8] e incluye difusores RPG (Reflection Phase Grating) del tipo QRD

(“Quadratic Residue Diffusor”)[1], ésto para crear un campo sonoro más difuso.

Aproximadamente, la primer sala de grabación de aprox. 20m2, está enfocada a percusiones específicamente, debido a que, una percusión emite frecuencias de resonancia diferentes a las de una voz humana o instrumentos de aire y cuerdas, por lo tanto, es necesario una mayor absorción y tiempo de reverberación RT más controlado. La segunda, de 52m2 es una sala general con un grado de absorción y tiempo de reverberación RT medio, tanto para voces como para instrumentos.

Una tercera sala específicamente solo para voz con un RT corto mide 20m2.

En la tabla I, se muestran los tiempos de reverberación deseados para cada sala[1].

TABLA I

TIEMPOS DE REVERBERACIÓN DESEADOS

Tipo de Sala RTmid en seg.
Sala 1 (Percusión) 0,4 – 0,6
Sala 2 (General) 0,7 – 1,0
Sala 3 (Voz) 0,2 – 0,4

Sala de Control 0,2 – 0,4

Los muros tanto externos como internos, son dobles con un espacio de aire entre estos de 2cm., revistiéndolos con fibra de vidrio de 1 ½”, el cual nos servirá como aislante. [1,2,3]

III. ANÁLISIS DE PARÁMETROS.

En esta sección se presenta la técnica de análisis para la obtención de parámetros.

A. Reverberación

El tiempo de reverberación (RT) es el tiempo que transcurre (en segundos) desde que el foco emisor se detiene hasta el momento en que el nivel de presión sonora (SPL) cae 60 dB con respecto a su valor inicial (Figura 2).
Para controlar el tiempo de reverberación aumentamos la absorción, ademas, nos basamos en la siguiente formula para determinar dicho tiempo:

B. Absorción

Podemos definir la absorción como la energía que incide en un obstáculo y no es devuelta al medio de transmisión, sino que se transforma en calor. El grado de absorción se puede especificar como el cociente entre la energía absorbida y la

incidente:

C. Aislamiento.

Las pérdidas por transmisión indican la capacidad de una pared para no transmitir las ondas sonoras. Estas pérdidas dependen sobre todo de su masa por unidad de área, su rigidez y el amortiguamiento en el material. En las construcciones típicas, estas pérdidas varían entre 30 y 70 dB de tal manera que el aislamiento sonoro, consiste básicamente en dividir mediante barreras físicas preferentemente con cierres totales, el sector que contiene a la(s) fuente(s) sonora(s) del que se desea proteger. Se mide el aislamiento acústico en diferentes frecuencias, normalmente 100-3150 Hz. en normas ISO con la siguiente relación:

Se precisará un aislamiento mayor al recomendado en la norma NBE-CA88, donde el nivel de emisión de ruido recomendado es de 40 dBA durante el día, y 30 dBA durante la noche.

D. Difusores.
Consisten en una serie de ranuras paralelas de forma rectangular, de igual anchura y diferente profundidad. Cuando una onda sonora con una dirección cualquiera incide sobre una de sus ranuras, ésta se propaga por su interior siguiendo un camino paralelo a las paredes de la ranura hasta alcanzar el fondo de la misma.

Para el diseño de los difusores se siguió el sistema descrito por Peter D´Antonio (Journal of the Audio Engieneering Society, JAES, Vol. 32, n°4, de abril de 1984)[9]. Se utilizarán difusores RPG del tipo QRD, los que nos ayudaran a tener buena difusión sonora, desde 344 Hz hasta 8.6 Khz. Las configuraciones se muestran en la Tabla III.

TABLA III.

CONFIGURACIÓN Y GRADOS DE FRECUENCIA DE LOS DIFUSORES QRD UTILIZADOS

Modulo o Periodo:
fmax (Hz) fmin (Hz)
QRD 11 688 344
QRD 41 4300 430
QRD 19 7233 506
QRD 31 8600 1228

La secuencia de profundidades necesaria para conseguir que dicha distribución de energía reflejada
sea lo más uniforme posible (en todas las direcciones del espacio y por tanto, que el difusor QRD
actúe efectivamente como tal), se obtiene de la siguiente expresión:

Sn=n2 mod p (5)

donde:
p=numero primo (3, 5, 7, 11…)
n=numero entero que va desde 0 hasta p-1
mod=operación matemática módulo.

IV. EXPERIMENTO

Se construyó una sala de dimensiones mucho más pequeñas que el propuesto (26.4m3) construido
de ladrillo y con piso de madera. Está ubicada en una avenida muy conflictiva en cuanto a transito
vehicular, donde el nivel de SPL llega a tener hasta 81dB. El tiempo de reverberación medido en el
recinto vacío después de hacer 10 veces la medición, apoyados de un sonómetro y promediando fue:
RT  2.2 seg. Matemáticamente se obtuvo un resultado de RT = 2.0 seg. Esta diferencia entre
resultados es dada por el grado de absorción de los materiales que citan algunos autores, que no
siempre será igual, debido a que no siempre son construidos de igual forma y con las mismas
características de densidad y masa. Entonces, podemos saber que la absorción total del recinto, dado
por la fórmula de Absorción total, teniendo 4 muros de ladrillo, piso de madera y techo de cemento.
fue de Atot=2.124 (ver Tabla 3)
TABLA IV. RESULTADOS DE ABSORCIÓN DE LA SALA ANTES DEL AISLAMIENTO

Dada la mala ubicación de este local, buscamos tener un aislamiento con un nivel máximo de 30dBA. Usamos la solución del tipo masa-resorte-masa, que no es otra cosa que combinar estructuras rígidas con absorbentes en medio, de forma que con mucho menos espesor y peso, mejora el grado de aislamiento (ver Figura 3). Se construyó un muro con madera de 3cm., seguida de una cámara de aire. Para evitar que en el interior de la cámara aparezcan ondas estacionarias que tiendan a acoplar los dos elementos simples, colocamos fibra de vidrio de 1 ½” con coeficiente de absorción de 0.8 como resorte, y que a su vez tiene excelentes características de amortiguamiento acústico. De esta forma, el sonido se disminuye hasta casi su desaparición. La pared de ladrillo va cubierta por una capa de poliuretano de 4cm seguida de una capa de fibra de vidrio también de 1 ½ “.

Los resultados obtenidos antes y después del aislamiento fueron los siguientes:

Antes del Aislamiento
SPLmax exterior= 89dB
SPLmax interior= 64 dB
Aislamiento total= 26dB
Pérdida de transmisión TL= -14.149 dB

Después del Aislamiento
SPLmax exterior= 89dB
SPLmax interior= 34 dB
Aislamiento total= 55dB
Pérdida de transmisión TL= -17.40 dB

Una vez llevado a cabo el aislamiento se midio 10 veces el tiempo de reverberación y su media fue: RT 0.4 seg
Matemáticamente ya obtenida la absorción total dentro de la sala (ver Tabla V), que es de Atot= 73.85 obtuvimos un tiempo de reverberación RT= 0.353 seg.

Medicion y Vibracion

vibracion

Why use an Accelerometer

Preamplifier?
Direct loading of a piezoelectric accelerometer’s output,
even by relatively high impedance loads, can greatly re-
duce the accelerometer’s sensitivity as well as limit its
frequency response. To minimise these effects the accel-
erometer output signal is fed through a preamplifier
which converts to a much lower impedance, suitable for1
connection to the relatively low input impedance of mea-
suring and analyzing instrumentation (1).
With measuring amplifiers, analyzers, and voltmeters a
separate accelerometer preamplifier is used while vibra-
tion meters intended for use with piezoelectric acceler-
ometers normally have the preamplifier built-in.
In addition to the function of impedance conversion,
most preamplifiers offer additional facilities for condition-
ing the signal. For example (2) A calibrated variable gain
facility to amplify the signal to a suitable level for input
to, for example a tape recorder; (3) A secondary gain ad-
justment to “normalize” awkward” transducer sensitivi-
ties; (4) Integrators to convert the acceleration propor-
tional output from accelerometers to either velocity or
displacement signals; (5) Various filters to limit the up-
per and lower frequency response to avoid interference
from electrical noise, or signals outside the linear por-
tion of the accelerometer frequency range; (6) Other facil-
ities, such as overload indicator, reference oscillator,
and battery condition indicator are also often included.

The Vibration Meter2

suitable for displaying on a meter or chart recorder. The
The block diagram shows how a typical modern vibration
detector can either average the RMS level of the signal
meter is built-up. The accelerometer is connected to a
or register the peak to peak level, and if required can re-
charge amplifier input stage with an input impedance of
tain the maximum value occurring. This is a particularly
several G
so that a separate preamplifier is not neces-
useful feature for measuring mechanical shocks and
sary. With a charge amplifier input, long input cables
short duration (transient) vibrations.
from the accelerometer, (up to several hundred meters),
can be used without any appreciable loss in sensitivity.
After passing through a linear to logarithmic converter
the signal is displayed on a logarithmic meter scale
An integrator stage allows velocity and diplacement par-
covering two decades.
ameters, as well as acceleration, to be measured.
An external bandpass filter can be connected to the vibra-
The high-pass and low-pass filters can be adjusted so as
tion meter so that frequency analysis can be performed.
to limit the frequency range of the instrument to the
Output sockets are provided so that the rectified and un-
range of interest only, thus reducing the possibility of in-
rectified vibration signal can be fed to an oscilloscope,
terference from high and low frequency noise. After
tape recorder, or level recorder.
proper amplification the signal is rectified to a DC signal

3

What is Frequency Analysis?

The vibration meter will give us a single vibration level
measured over a wide frequency band. In order to reveal
the individual frequency components making up the wide-
band signal we perform a frequency analysis.
For this purpose we use a filter which only passes those
parts of the vibration signal which are contained in a nar-
row frequency band. The pass band of the filter is moved
sequentially over the whole frequency range of interest
so that we obtain a separate vibration level reading for
each band.
The filter can consist of a number of individual, conti-
guous, fixed-frequency filters which are frequency
scanned sequentially by switching,
or alternatively, continuous coverage of the frequency
range can be achieved with a single tunable filter.

Constant Bandwidth or Constant Percentage Bandwidth Frequency Analysis?

There are two basic types of filter used for the frequency4
analysis of vibration signals. The constant bandwidth
type filter, where the filter is a constant absolute band-
width, for example 3 Hz, 10 Hz etc. and the constant per-
centage bandwidth filter where the filter bandwidth is a
constant percentage of the tuned centre frequency, for
example 3%, 10% etc. The two drawings show graphi-
cally the difference in these two filter types as a function
of frequency. Note that the constant percentage band-
width filter appears to maintain a constant bandwidth,
this is because it is plotted on a logarithmic frequency
scale which is ideal where a wide frequency range is to
be covered. On the other hand, if we show the two types
of filter on a linear frequency scale, it is the constant
bandwidth filter which shows constant resolution. The
constant percentage bandwidth filter plotted on a linear
frequency scale shows an increasing bandwidth with in-
creasing frequency which is not really practical.
There is no concise answer to the question of which
type of frequency analysis to use. Constant percentage
bandwidth analysis tends to match the natural response
of mechanical systems to forced vibrations, and allows a
wide frequency range to be plotted on a compact chart.
It is subsequently the analysis method which is most
generally used in vibration measurements.
Constant bandwidth analysis gives better frequency reso-
lution at high frequencies and when plotted on a linear
frequency scale is particularly valuable for sorting out
harmonic patterns etc.

Filter Bandwidth Considerations5

The selectivity of the filter, that is the narrowness of the
passband, governs the resolution of the frequency analy-
sis obtained. Vibration spectra from a gearbox are shown
in the drawing to the right. The upper spectrum was re-
corded using a 23% constant percentage bandwidth fil-
ter, while the lower spectrum, of the same signal, was
recorded using a 3% bandwidth filter. It can be seen that
by using a narrower bandwidth filter more detail is ob-
tained so that individual peaks in the vibration spectrum
can be isolated.
The disadvantage with narrow bandwidth analysis is that
the time required to obtain a particular accuracy gets
considerably longer as the filter bandwidth gets nar-
rower.
Because of the long time needed to cover a wide fre-
quency range with narrow bandwidth analyzers a prelimi-
nary analysis is often made with a wide filter bandwidth
in order to reveal particularly interesting parts of the fre-
quency spectrum. The analyzer is then switched to a nar-
row bandwidth to make a detailed analysis of the part of
interest. At higher frequencies a constant bandwidth an-
alyzer switched to. for example, 3 Hz bandwidth enables
extremely detailed analysis to be performed.
To sum up. the best selection of bandwidth and analysis
method is in most cases that which gives adequate reso-
lution over the whole frequency range and which allows
the analysis to be carried out. in the shortest time.

Defining the Filter Bandwidth6

An ideal filter would pass all frequency components oc-
curing within its bandwidth and reject completely all oth-
ers. In practice, electronic filters have sloping skirts so
they do not completely eliminate frequency components
lying outside their specified bandwidth. This promotes
the important question, how do we specify the filter
bandwidth?
Two methods of measuring the filter bandwidth are com-
monly used. The most often used, defines the bandwidth
as the width of the ideal straight sided filter which
passes the same amount of power from a white noise
source as the filter described. The second definition is
the width of the filter characteristic where the filter at-
tenuation is 3 dB lower than the normal transmission le-
vel. Only filters with a relatively poor selectivity will have
a 3 dB bandwidth substantially different from the effec-
tive noise bandwidth.

Measuring Instrumentation

A portable, general purpose vibration meter as described7
on p. 27 will usually be the most convenient measuring
instrument to use but vibration measurements can also
be made in the field with a suitable B & K sound level
meter. The microphone is substituted by an integrator
adaptor and accelerometer to enable the meter to mea-
sure the RMS level of acceleration, velocity and displace-
ment. However these meters do not have the conveni-
ence of a charge amplifier input and need to be cali-
brated separately for each measuring parameter. Battery
operated filters can be added to enable octave, third-oc-
tave, and narrow bandwidth analysis to be performed.
Mains-operated laboratory oriented instrumentation of-
fers greater versatility, especially in the detailed analysis
and data reduction spheres. A basic measuring chain
would consist of accelerometer, preamplifier, and a mea-
suring amplifier, possibly with an external filter. The
measuring amplifier and filter are often combined into
one instrument which is called a Frequency Analyzer or
Spectrometer.
The ultimate in operating convenience and analysis
speed is obtained with a real-time analyzer, where a
targe number of parallel frequency bands are evaluated
almost instantaneously and shown on a continuously up-
dated display screen. Real-time analyzers are usually
equipped with a digital output and remote control facili-
ties so that they can be connected to a tape punch, com-
puter etc., to make fully automatic analysis systems.

Recording Results

Where more than a few vibration measurements are8
made, or frequency analyses are performed, it is a se-
vere drawback to have to manually plot results on a re-
cord sheet. The use of a level recorder will facilitate the
automatic recording of time and frequency spectra on a
precalibrated paper chart. Here again we can choose be-
tween small battery operated instruments intended for
use with portable vibration analysis equipment, or mains
operated recorders which have the additional facilities re-
quired to take full advantage of laboratory oriented analy-
sis equipment.
Tape recorders are widely used in vibration measure-
ments to collect data in the field for later analysis in the
laboratory. By replaying the tape at a higher speed, very
low frequency signals can be brought into the frequency
range of ordinary frequency analyzers. Speeding up the
tape replay is also used to reduce frequency analysis
time.
Where the signal recorded is rather short in duration, for
example mechanical shocks, or the vibration signal re-
corded when a train passes over a bridge, normal se-
quential analysis is not possible due to the short sample
of signal available. In this case, the piece of recording
tape bearing the signal is made into a continuous loop
so that on replay it appears as a periodic signal, which
can be analyzed in the normal way.
A digital recorder is also available which will capture
short duration signals and reproduce them when desired
in almost any speed transformation ratio.

Using Vibration Measurements

Single, wide frequency band vibration measurements are9
a useful quick-look vibration indicator, which can be
used for example when evaluating the general condition
of a machine or the effectiveness of vibration isolation
measures. The actual level measured will be judged
more or less severe by comparison with previously or
subsequently measured levels or with published severity
criteria. An example of the latter is shown in the draw-
ing, extracted from standards and recommendations for
judging the vibration severity of rotating machinery. (ISO
2372 & 2373, German VDI 2056: 1964; British BS
4675: 1971, and German DIN 45 665: 1968).
For diagnostic purposes, for example in the course of pro-
duct development, frequency analysis is necessary.
Some frequency components in the vibration frequency
spectrum can be immediately related to particular forcing
functions, for example, shaft rotation speeds, gear tooth
meshing frequencies etc. We will almost always find ad-
ditional significant frequency components in the spec-
frequency and harmonics, due to periodic variations
trum which are also related to the fundamental motions.
such as eccentricity. The first upper and lower sidebands
The most significant are usually harmonics (a multiple) of
will appear at the tooth mesh frequency (ft) plus and mi-
one of the fundamental frequencies. Harmonics often
nus the gear rotation frequency (fg), the second side-
arise because of distortion of the fundamental frequen-
bands at ft ± 2fg, and so on. Around the tooth mesh har-
cies or because the original periodic motion is not purely
monics a similar pattern may be present (i.e. 2ft ±fg
sinusoidal. If they coincide with the resonant frequen-
cies of other machine elements, then possibly consider-
It is often impracticable to alter forcing frequencies
able vibration levels can result, which can become a ma-
(shaft speeds, gear ratios etc.) so other methods of redu-
jor noise source or result in the transmission of high for-
cing undersirable vibration levels are used. For example.
ces to other machine parts.
detuning the machine element (altering its resonant fre-
With gear wheels, tooth form deflection under load and
quency) by changing its mass or stiffness; by attenuating
tooth wear will give rise to a tooth meshing frequency
the transmission of vibration with isolation materials, or
component and harmonics. Furthermore, side band com-
by adding damping materials to reduce the vibration am-
ponents are often generated around the tooth meshing
plitude.

Vibration as a Machine Condition Indicator

Machines seldom break down without warning, the
signs of impending failure are usually present long be-
fore breakdown makes the machine unusable. Machine
troubles are almost always characterised by an increase
in vibration level which can be measured on some exter-
nal surface of the machine and thus act as an indicator.101
The bathtub curve shown is a typical plot of vibration le-
vel against time that demonstrates this effect. With nor-
mal preventive maintenance, repairs are carried out at
fixed intervals based on minimum life expectancy for
wearing parts. By delaying repair until vibration levels in-
dicate the need, but before breakdown, unnecessary
strip-down (which often promotes further faults) and de-
lays in production are avoided.
This “on condition” maintenance of machinery has
proven to give appreciable economic advantage by increa-
sing the mean time between shutdown while still preven-
ting the surprise and damaging effects of catastrophic fai-
lure during service. These techniques are now widely
used especially in the continuous process industries.
The vibration level which may be allowed before under-
can therefore be used as a reference “signature” for
taking a repair is best determined through experience. At
that machine. Subsequent analyses can be compared to
present, general opinion suggests that the “action level”
this reference so that not only the need for action is indi-
should be set at two to three times (6 to 10 dB above)
cated but also the source of the fault is diagnosed.
the vibration level considered normal.
The diagnostic chart on the following two pages will help
We have already seen that with frequency analysis of vi-
isolate the cause of excess vibration when the offending
bration signals we are able to locate the source of many
frequencies can be discovered through frequency analy-
of the frequency components present.

Vibration and the Human Body

It has long been recognized that the effects of direct vi-11
bration on the human body can be serious. Workers can
be affected by blurred vision, loss of balance, loss of con-
centration etc. In some cases, certain frequencies and le-
vels of vibration can permanently damage internal body
organs.
Researchers have been compiling data over the last 30
years on the physiological effects of vibrating, hand-held
power tools. The “white finger” syndrome is well known
among forest workers handling chain saws. A gradual de-
generation of the vascular and nervous tissue takes
place so that the worker loses manipulative ability and
feeling in the hands.
Standards are at present under preparation which will
recommend maximum allowable vibration spectra at the
handles of hand-held power tools.

Acústica en espacios cerrados

cattmain

En los espacios cerrados, el fenómeno preponderante que se ha de tener en cuenta es la reflexión. Al público le va a llegar tanto el sonido directo como el reflejado, que si van en diferentes fases pueden producir refuerzos y en caso extremos falta de sonido. A la hora de acondicionar un local, se ha de tener en cuenta, tanto que no entre el sonido del exterior (Aislamiento acústico).

Además, en el interior se ha de lograr la calidad óptima del sonido, controlando la reverberación y el tiempo de reverberación, a través, de la colocación de materiales absorbentes y reflectores acústicos.