Funcionamiento del Phase Vocoder

Published On Mar-13-2017

Transcripción

El phase vocoder se basa en la Transformada de Fourier de Tiempo Corto o Short-Time Fourier Transform, abreviada STFT. A diferencia de otras técnicas de transformadas de Fourier, la STFT considera únicamente una pequeña porción de tiempo de la señal de entrada para realizar su análisis. Cada porción se denomina frame o window, lo cual se traduce como marco y ventana, respectivamente. De esta manera, se obtiene una especie de foto instantánea del contenido espectral de la señal de entrada en un momento específico. Es posible aplicar STFT a señales de entrada continuas o discretas.

Al combinar múltiples windows y aplicar la STFT a cada una, es posible observar cómo el contenido espectral de la señal de audio varía a lo largo del tiempo. Asimismo, al modificar el contenido espectral de cada window, es posible lograr efectos difícilmente reproducibles con procesamiento en función del tiempo.

Estudiemos el funcionamiento general de un phase vocoder digital. Este proceso es el mismo para todos los efectos que se pueden lograr con un phase vocoder. Se cuenta con una señal de entrada de una longitud cualquiera. En primer lugar, se debe escoger el tamaño de cada window, el cual corresponde a N muestras o samples de la señal digital. La cantidad N de muestras en cada window es el window size o frame size.

Nótese que cada window se superpone con otra, en lugar de tener un único límite claramente definido. La amplitud de la señal se mantiene igual en el centro de la window y se atenúa, conforme se aleja del centro, de manera que se forme una especie de crossfade entre cada window. Esto se logra a través de una window function o función de ventana. Se define que la window function tendrá valores diferentes a 0 durante N muestras. Asimismo, para cualquier otro punto en el tiempo fuera de las N muestras consecutivas, se define que su valor será 0.

De esta manera, al multiplicar la señal de entrada por la window function, únicamente se conservarán los valores dentro del rango de N muestras. El resto de valores será 0. Podríamos visualizar una window function como un tipo de filtro band-pass. Cada window tiene su propia función, por lo que se debe multiplicar la señal por cada una. Luego de hacerlo, decimos que la señal ha sido windowed o pasada por ventanas.

En este punto, se debe aplicar una Transformada Rápida de Fourier, Fast Fourier Transform o FFT a cada window. Ahora bien, ¿qué es una FFT? Pues bien, primero debemos conocer el concepto de Transformada de Fourier Discreta, Discrete Fourier Transform o DFT.

Una DFT consiste, al igual que la STFT, en la transformación de una función de tiempo en una función de frecuencia con números complejos. Lo que define a la DFT es que requiere que la función original sea una serie discreta de muestras uniformemente distribuidas a lo largo del tiempo, es decir, que haya el mismo espacio entre cada muestra. Un ejemplo de una serie de este tipo, es una señal de audio digital. La función de salida de la DFT es una serie discreta de muestras distribuidas uniformemente de una función de frecuencia con números complejos, la cual tendrá la misma longitud que la señal de entrada.

Una FFT es un algoritmo que permite reducir considerablemente la complejidad de los cálculos necesarios para realizar una DFT. De esta manera, permite obtener los valores con mayor rapidez y facilidad.

Debido a que cada window posee una cantidad N de muestras, se debe aplicar una FFT que considere una cantidad de muestras M igual o mayor a N. Normalmente, la cantidad M es igual a la N. Sin embargo, en ciertos casos, la FFT considera una cantidad M mayor de muestras. Asimismo, por motivos de practicidad en el mundo digital, la cantidad M de muestras suele ser una potencia de 2. La combinación de cada window function con una Fast Fourier Transform constituye una Short-Time Fourier Transform.

Figura 13.5. Proceso general de un phase vocoder

La información de salida de cada FFT es un conjunto de un número M de bins. Este es el término utilizado para designar las muestras luego de aplicarles FFT. Cada bin contiene información de la amplitud y fase de cada una de las frecuencias presentes en la señal de audio original. Es en este punto donde cada uno de los tipos de phase vocoder aplica un procesamiento diferente en el dominio de la frecuencia, según su objetivo.

Posteriormente, se aplica una Transformada Inversa Rápida de Fourier, Inverse Fast Fourier Transform o IFFT, a cada una de las señales de salida del procesamiento aplicado a las bins. De esta manera, se producen M cantidad de muestras en función del tiempo para cada window. Esta serie de muestras tiene una distribución uniforme y no contiene números complejos. Resulta nuevamente, una señal convencional de audio discreta o digital, pero dividida en múltiples windows.

Antes de estudiar cómo se obtiene la señal de audio final, recapitulemos el proceso. Inicialmente se selecciona arbitrariamente una cantidad N de muestras que conformarán el tamaño de cada frame o window. Luego, se multiplica la señal de entrada por una window function que únicamente conserva los valores dentro de la ventana. Posteriormente, estos valores se someten a una FFT, un procesamiento en el dominio de la frecuencia y luego una IFFT.

Finalmente, las M muestras de la window reconstruida por la IFFT se suman al búfer de salida. El proceso completo inicia de nuevo, pero esta vez con una window cuyo centro se encuentra una cantidad H de muestras más adelante del centro de la window previa. La magnitud H se denomina hop size o tamaño del salto. En ocasiones, el hop size es igual al tamaño de la window. Sin embargo, es más común que el hop size sea una fracción del tamaño de una window, como por ejemplo la mitad o un cuarto.

El búfer de salida almacena temporalmente el conjunto de muestras de cada window conforme estas llegan y se suman en el proceso llamado overlapp-add, en referencia a los traslapes entre las diferentes windows. Durante este proceso de suma, se analizan las windows originales de la señal de entrada y cómo se traslapan; se comparan con cada window de salida después del procesamiento; y se alinean de manera que pueda conformarse la señal de salida.

Aplicar para una beca

Me interesa graduarme de una
carrera en VonKelemen

Vonkelemen Master Instructors

Related Videos
	Planifica detalladamente el evento: seis etapas de planeamiento y desarrollo de estrategias Published On Jul-17-2019 -Planeamiento y gestión creativa ¿Cuáles son las razones por las que debemos planificar d
	Conserva el control manual al crear automatizaciones: función Virgin Territory Published On Nov-30-2020 -Técnicas de postproducción Al agregar automatización en una pista, esto deshabilita
	Envíos y Retornos Auxiliares Published On Mar-31-2017 TM-Operación de Consolas de Mezcla Transcripción Todas las consolas de mezcla cuentan
	Diferencia correctamente los tipos de ilustración: formatos de imágenes Published On Jan-31-2019 Introducción al Diseño Web Por desconocimiento de las extensiones de imágenes y la c
	Interpreta las influencias socioculturales: factores interpersonales del cliente Published On Nov-15-2019 -Factores Influyentes en el Comportamiento del Consumidor Las diferencias culturales en el mundo son muy variadas, s
	Labores en la elaboración de los presupuestos, parte I Published On May-16-2017 Presupuestos y Calendarios Transcripción La confección de los presupuestos al igual
	Conceptos básicos (Parte II) Published On Dec-27-2017 -Fundamentos para la Configuración de Sistemas de PA I Transcripción Ángulo de cobertura El ángulo de cobertu
	Introducción Published On Mar-24-2017 Edición de Audio Transcripción Al hablar de herramientas de afinación, gen
	Introducción Published On Jan-08-2018 Procesadores de Frecuencia y Rango Dinámico Transcripción Al preguntarle a distintos ingenieros de gra
	Generalizar la memoria del consumidor: la influencia del aprendizaje Published On May-24-2020 -Estrategias de Marketing basadas en el Consumidor La memoria tiene una gran influencia en el comportamiento d
	Compartiendo contenidos Published On Oct-30-2017 Steinberg Cubase Operator Certificate Program Transcripción La tecnología VST, desarrollada por Steinbe
	El bordoneo Published On Mar-17-2017 -Géneros Musicales del Mundo Transcripción A continuación, estudiaremos dos recursos
	Aplica valores de especificación de tamaños para estilos: unidades de medidas CSS Published On Jan-29-2019 Introducción al Diseño Web Con la finalidad de aplicar con excelencia valores de espec
	Afinación manual o automática Published On Mar-27-2017 Edición de Audio Transcripción ¿Afinación manual o automática? En la may
	Introducción Published On Mar-13-2017 Arreglos para Banda I: Bajo, Piano, Guitarra y Batería Transcripción Estudiaremos importantes técnicas de arr
	Interfaces Expandibles: Conexiones Digitales Published On Nov-24-2016 Curso de Prueba Importacion Transcripción. Hemos analizado todas las conexiones anal
	Filtros HPF pasivos Published On Sep-07-2018 -Diseño de Filtros de Ecualización Transcripción Probablemente, los filtros high-pass son aú
	Transmisión de la señal: cables multinúcleo y stageboxes Published On Nov-21-2016 -Configuraciones de Grabación con Sistemas Digitales TranscripciónLos eventos en vivo incluyen todo tipo de equ
	Lo que define a un Profesional del Music Business Management I Parte. Published On Apr-28-2017 Introducción al Music Business Management Transcripción Habilidades y Rasgos Personales:Como ya lo
	Refracción por diferencias de temperatura en el aire Published On Mar-07-2017 -Fundamentos para la Configuración de Sistemas de PA I Transcripción En venues grandes, especialmente aquellos al
	Superposición de ondas Published On Nov-27-2017 -Fundamentos de Acústica Transcripción¿Cómo se comporta el sonido en la vida real
	Batería: Posiciones para grabación un solo micrófono Published On Dec-13-2017 Microfoneo Directo y Grabación Estéreo Transcripción Cuando se piensa en grabación de batería,
	Cómo inferir las aplicaciones y limitaciones de una consola? Published On Dec-28-2017 Consolas de Mezcla Transcripción. Con el advenimiento de las tecnologí
	Modulación contrapuntística en una suite Published On Jul-02-2018 Arreglos Orquestales I Transcripción La armonía es uno de los recursos más usad
	¿La creatividad es racional o irracional? Parte I Published On Mar-15-2017 Desarrollo de la Creatividad Transcripción Las intenciones pueden ser importantes para
	Listas de verificación: pregrabación Published On Dec-31-2017 Producción Musical Avanzada Transcripción Analicemos algunos aspectos que el producto
	Encuentra el equipo perfecto: consideraciones para la contratación de músicos Published On Apr-02-2019 Artist Management Sea que se trate de un artista en solitario o de una agrupa
	Edita L o R selectivamente: selección, zoom y edición correctiva de nivel Published On Dec-23-2020 Steinberg Wavelab Expert Supongamos que estamos masterizando una canción y notamos
	Fades: curva S Published On Mar-10-2017 -Edición Correctiva Transcripción La curva en forma de “S” es un poco difí
	Blackface (parte I) Published On Mar-25-2017 -Géneros Musicales Comunes para una Banda de Rock Transcripción Como se ha enseñado anteriormente, el Blues

Únete a VonKelemen

Así aparecerán tu nombre y tu apellido en tus certificados

Tu email debe ser válido para el envío de tus certificados

Hombre Mujer

Cumpleaños

Día

Para verificación de identidad y envío de tus diplomas

Quiero tener acceso ilimitado a cursos gratuitos

Quiero recibir ofertas y productos gratuitos

Quiero verificar por Whatsapp

vonkelemen premium

Miles de vídeos HD con los secretos mejor guardados de los VonKelemen Master Instructors.

Aprende con los profesionales más importantes y relevantes del mundo,
granadores de múltiples premios Grammy y Billbord

más info

Moogie Canazio

Nathan East, Ray Charles, Sarah Vaughan, Dionne Warwick, Luis Miguel, Caetano Veloso, Eric Clapton, Diana Ross, Selena, Tom Jobim, João Gilberto, Maria Bethânia, Ivan Lins...
más info

Rafa Sardina

Stevie Wonder, D'Angelo, Lady Gaga, Celine Dion, Cristian Castro, Michael Jackson, Alejandro Fernandez, Mariah Carey, Plácido Domingo, Illya Kuriaki & The Valderramas, Shakira...
más info

Sebastian Krys

Sergio Dalma, Eros Ramazzotti, Sandy e Junior, Gloria Estefan, Carlos Vives, Shakira, Alejandro Sanz, Luis Fonsi, Vega, Kinky, Los Rabanes, Obie Bermúdez, Ricky Martin...
más info

Benny Faccone

Santana, Sting, Michael Jackson, Stevie Wonder, Dizzy Gillespie, Whitney Houston, Luis Miguel, Ricky Martin, Los Fabulosos Cadillacs, Maná, Barbra Streisand, Patti LaBelle...
más info

Peter Doell

Toto, War, Elton John, The Beach Boys, Celine Dion, Hans Zimmer, Ray Charles, Miles Davis, Marilyn Manson, R.E.M., Ben Harper, Tom Jones, Adam Lambert, Chuck Berry, Lynyrd...
más info

Colin Liebich

Brian Vibberts (ganador de múltiples premios Grammy), CJ Vanston (Productor de Toto, Chic Corea, Spinal Tap), Billy Sheehan...
más info

Brent Fischer

Usher, Paul McCartney, Robert Palmer, D’Angelo, Joao Gilberto, Carlos Santana, Raphael Saadiq, Michael Jackson, Prince, Al Jarreau, Toni Braxton, Eric Benet...

Me interesa

Selecciona tu membresía

Mensual	Anual
$29/mes	$290/año
Acceso ilimitado a todo el contenido PREMIUM	Acceso ilimitado a todo el contenido PREMIUM
Contrato anual, facturado mensualmente	Contrato anual, prepagaso
Suscribirme	Suscribirme
$29/mes	$290/año