×
 

Funcionamiento del Phase Vocoder

Published On Mar-13-2017

Transcripción

El phase vocoder se basa en la Transformada de Fourier de Tiempo Corto o Short-Time Fourier Transform, abreviada STFT. A diferencia de otras técnicas de transformadas de Fourier, la STFT considera únicamente una pequeña porción de tiempo de la señal de entrada para realizar su análisis. Cada porción se denomina frame o window, lo cual se traduce como marco y ventana, respectivamente. De esta manera, se obtiene una especie de foto instantánea del contenido espectral de la señal de entrada en un momento específico. Es posible aplicar STFT a señales de entrada continuas o discretas.

Al combinar múltiples windows y aplicar la STFT a cada una, es posible observar cómo el contenido espectral de la señal de audio varía a lo largo del tiempo. Asimismo, al modificar el contenido espectral de cada window, es posible lograr efectos difícilmente reproducibles con procesamiento en función del tiempo.

Estudiemos el funcionamiento general de un phase vocoder digital. Este proceso es el mismo para todos los efectos que se pueden lograr con un phase vocoder. Se cuenta con una señal de entrada de una longitud cualquiera. En primer lugar, se debe escoger el tamaño de cada window, el cual corresponde a N muestras o samples de la señal digital. La cantidad N de muestras en cada window es el window size o frame size.

Nótese que cada window se superpone con otra, en lugar de tener un único límite claramente definido. La amplitud de la señal se mantiene igual en el centro de la window y se atenúa, conforme se aleja del centro, de manera que se forme una especie de crossfade entre cada window. Esto se logra a través de una window function o función de ventana. Se define que la window function tendrá valores diferentes a 0 durante N muestras. Asimismo, para cualquier otro punto en el tiempo fuera de las N muestras consecutivas, se define que su valor será 0.

De esta manera, al multiplicar la señal de entrada por la window function, únicamente se conservarán los valores dentro del rango de N muestras. El resto de valores será 0. Podríamos visualizar una window function como un tipo de filtro band-pass. Cada window tiene su propia función, por lo que se debe multiplicar la señal por cada una. Luego de hacerlo, decimos que la señal ha sido windowed o pasada por ventanas.

En este punto, se debe aplicar una Transformada Rápida de Fourier, Fast Fourier Transform o FFT a cada window. Ahora bien, ¿qué es una FFT? Pues bien, primero debemos conocer el concepto de Transformada de Fourier Discreta, Discrete Fourier Transform o DFT.

Una DFT consiste, al igual que la STFT, en la transformación de una función de tiempo en una función de frecuencia con números complejos. Lo que define a la DFT es que requiere que la función original sea una serie discreta de muestras uniformemente distribuidas a lo largo del tiempo, es decir, que haya el mismo espacio entre cada muestra. Un ejemplo de una serie de este tipo, es una señal de audio digital. La función de salida de la DFT es una serie discreta de muestras distribuidas uniformemente de una función de frecuencia con números complejos, la cual tendrá la misma longitud que la señal de entrada.

Una FFT es un algoritmo que permite reducir considerablemente la complejidad de los cálculos necesarios para realizar una DFT. De esta manera, permite obtener los valores con mayor rapidez y facilidad.

Debido a que cada window posee una cantidad N de muestras, se debe aplicar una FFT que considere una cantidad de muestras M igual o mayor a N. Normalmente, la cantidad M es igual a la N. Sin embargo, en ciertos casos, la FFT considera una cantidad M mayor de muestras. Asimismo, por motivos de practicidad en el mundo digital, la cantidad M de muestras suele ser una potencia de 2. La combinación de cada window function con una Fast Fourier Transform constituye una Short-Time Fourier Transform.

Figura 13.5. Proceso general de un phase vocoder


La información de salida de cada FFT es un conjunto de un número M de bins. Este es el término utilizado para designar las muestras luego de aplicarles FFT. Cada bin contiene información de la amplitud y fase de cada una de las frecuencias presentes en la señal de audio original. Es en este punto donde cada uno de los tipos de phase vocoder aplica un procesamiento diferente en el dominio de la frecuencia, según su objetivo.

Posteriormente, se aplica una Transformada Inversa Rápida de Fourier, Inverse Fast Fourier Transform o IFFT, a cada una de las señales de salida del procesamiento aplicado a las bins. De esta manera, se producen M cantidad de muestras en función del tiempo para cada window. Esta serie de muestras tiene una distribución uniforme y no contiene números complejos. Resulta nuevamente, una señal convencional de audio discreta o digital, pero dividida en múltiples windows.

Antes de estudiar cómo se obtiene la señal de audio final, recapitulemos el proceso. Inicialmente se selecciona arbitrariamente una cantidad N de muestras que conformarán el tamaño de cada frame o window. Luego, se multiplica la señal de entrada por una window function que únicamente conserva los valores dentro de la ventana. Posteriormente, estos valores se someten a una FFT, un procesamiento en el dominio de la frecuencia y luego una IFFT.

Finalmente, las M muestras de la window reconstruida por la IFFT se suman al búfer de salida. El proceso completo inicia de nuevo, pero esta vez con una window cuyo centro se encuentra una cantidad H de muestras más adelante del centro de la window previa. La magnitud H se denomina hop size o tamaño del salto. En ocasiones, el hop size es igual al tamaño de la window. Sin embargo, es más común que el hop size sea una fracción del tamaño de una window, como por ejemplo la mitad o un cuarto.

El búfer de salida almacena temporalmente el conjunto de muestras de cada window conforme estas llegan y se suman en el proceso llamado overlapp-add, en referencia a los traslapes entre las diferentes windows. Durante este proceso de suma, se analizan las windows originales de la señal de entrada y cómo se traslapan; se comparan con cada window de salida después del procesamiento; y se alinean de manera que pueda conformarse la señal de salida.


Aplicar para una beca

Me interesa graduarme de una
carrera en VonKelemen

Vonkelemen Master Instructors

Related Videos
Transmisión de señales binarias: paralela y secuencial

Published On Dec-06-2017

Audio Digital y Psicoacústica

Transcripción Existen dos formas de utilizar señales bina

Guitarra eléctrica (solo)

Published On Apr-05-2017

TM-Técnicas de Postproducción II

Transcripción Veamos ahora el procesamiento que se a

Aplicación armonía tradicional mejorada

Published On May-10-2018

Arreglos Orquestales I

Transcripción Como arreglistas, debemos decidir qué tipo

Reducción del masking (Parte II)

Published On Mar-13-2017

Efectos de Tiempo y Efectos de Fase

Transcripción Como ha sido demostrado un sinfín de veces

Posicionamiento de los parlantes (en el estudio)

Published On Oct-05-2017

Audio Digital y Psicoacústica

Transcripción La Unión Internacional de Telecomunicacione

Modulación selectiva en la mezcla: Vibrato

Published On Mar-30-2018

Técnicas de Mezcla

Transcripción Usualmente, los efectos de modulación son u

Desarrolla nuevos productos: creación de ideas

Published On Jun-25-2020

-Factores Influyentes en el Comportamiento del Consumidor

Las innovaciones en el mercado brindan nuevas oportunidade

Beats

Published On Dec-13-2017

Teoría del Sonido

Transcripción. Probablemente hemos visto bajistas y gu

Introducción

Published On Mar-03-2017

Participantes de la Industria

Transcripción La figura del productor musical es fund

Escalas parte I

Published On Nov-09-2017

TM-Introducción a la Composición Musical

Transcripción A continuación, estudiaremos el concep

Siete falacias que retrasan los proyectos

Published On Mar-15-2017

Introducción a la Administración de Proyectos

Transcripción Las falacias que afectan la madurez de u

Descripción rítmica de Chick On The Grill

Published On Jul-13-2017

Arreglos de Percusión

Transcripción Los ritmos derivados de la métrica 6/8 son

Enfócate en tu música: cambio de nombres y adición de ensambles

Published On Apr-08-2021

-Creación de Partituras con Software

Para el compositor y arreglista moderno, el flujo de trabaj

¿Cómo funciona una grabadora de multipista? Parte II

Published On Oct-18-2017

Consolas de Mezcla

Transcripción.Ensamblaje de cabezasEn la zona central

Tresillos

Published On Apr-17-2017

TM-Introducción a la Armonía

TranscripciónEstudiaremos ahora una de las herramientas rí

Cómo crear Leitmotivs: duración, distinción y consistencia

Published On May-29-2018

Producción y Diseño de Sonido para Audiovisuales

Transcripción Leitmotiv: Características El objetivo

Contrapunto moderno: Ejercicio a dos voces

Published On Aug-07-2017

Armonía Avanzada I

Transcripción Luego de la creación de una melodía contra

Efecto del ruido sobre la salud física del ser humano

Published On Jul-13-2017

Acústica Conceptual

Transcripción El ruido se ha convertido en un factor de

El internet versus la Web

Published On Mar-10-2017

Introducción a la Producción Gráfica

Transcripción Es muy común que, cuando dos cosas están r

El Bedroom Studio

Published On Mar-12-2018

TM-Introducción a la Configuración de Estudios de Grabación

Transcripción Muy probablemente, el lugar en el qu

Reverse FX

Published On Oct-27-2017

Steinberg Cubase Operator Certificate Program

Transcripción En este video aprenderemos a crear un efecto

Atmósfera

Published On Mar-16-2017

-Conceptos Básicos de Técnica e Interpretación

Transcripción Pese a todos los elementos que se han menci

Conclusión

Published On Jun-30-2017

Arreglos de Percusión

TranscripciónTanto la Columbia como la Conga son gén

La Anatomía del Oído

Published On Mar-31-2017

Transcripción To understand in depth the various psycho

Concepto de acumulado o devengo

Published On Aug-21-2017

Presupuestos y Calendarios

Transcripción El concepto de acumulado o devengo, está l

Aspectos fundamentales de la técnica de dirección (parte II)

Published On Mar-15-2017

-Conceptos Básicos de Técnica e Interpretación

Transcripción En esta ocasión, continuaremos aprendiendo

Estructura

Published On Sep-13-2018

-Conceptos Básicos de Arreglo

Transcripción Una canción no es solo un conjunto de secc

Masterización con audífonos y monitores de baja resolución

Published On May-16-2018

Técnicas de Mastering

Transcripción ¿Es posible masterizar con audífonos, o con

Bases Instantáneas con Loopmash

Published On Oct-30-2017

Steinberg Cubase Operator Certificate Program

Transcripción En el video anterior, creamos una base de ba

Determinación de las actividades del proyecto: ampliación de planta

Published On Aug-21-2017

Presupuestos y Calendarios

TranscripciónAhora que conocemos cual será el proyec

X

vonkelemen premium

Miles de vídeos HD con los secretos mejor guardados de los VonKelemen Master Instructors.

Aprende con los profesionales más importantes y relevantes del mundo,
granadores de múltiples premios Grammy y Billbord

  • más info

    Moogie Canazio

    Nathan East, Ray Charles, Sarah Vaughan, Dionne Warwick, Luis Miguel, Caetano Veloso, Eric Clapton, Diana Ross, Selena, Tom Jobim, João Gilberto, Maria Bethânia, Ivan Lins...

  • más info

    Rafa Sardina

    Stevie Wonder, D'Angelo, Lady Gaga, Celine Dion, Cristian Castro, Michael Jackson, Alejandro Fernandez, Mariah Carey, Plácido Domingo, Illya Kuriaki & The Valderramas, Shakira...

  • más info

    Sebastian Krys

    Sergio Dalma, Eros Ramazzotti, Sandy e Junior, Gloria Estefan, Carlos Vives, Shakira, Alejandro Sanz, Luis Fonsi, Vega, Kinky, Los Rabanes, Obie Bermúdez, Ricky Martin...

  • más info

    Benny Faccone

    Santana, Sting, Michael Jackson, Stevie Wonder, Dizzy Gillespie, Whitney Houston, Luis Miguel, Ricky Martin, Los Fabulosos Cadillacs, Maná, Barbra Streisand, Patti LaBelle...

  • más info

    Peter Doell

    Toto, War, Elton John, The Beach Boys, Celine Dion, Hans Zimmer, Ray Charles, Miles Davis, Marilyn Manson, R.E.M., Ben Harper, Tom Jones, Adam Lambert, Chuck Berry, Lynyrd...

  • más info

    Colin Liebich

    Brian Vibberts (ganador de múltiples premios Grammy), CJ Vanston (Productor de Toto, Chic Corea, Spinal Tap), Billy Sheehan...

  • más info

    Brent Fischer

    Usher, Paul McCartney, Robert Palmer, D’Angelo, Joao Gilberto, Carlos Santana, Raphael Saadiq, Michael Jackson, Prince, Al Jarreau, Toni Braxton, Eric Benet...

Selecciona tu membresía
MensualAnual
$29/mes $290/año
Acceso ilimitado a todo el
contenido PREMIUM
Acceso ilimitado a todo el
contenido PREMIUM
Contrato anual,
facturado mensualmente
Contrato anual,
prepagaso
Suscribirme Suscribirme
$29/mes $290/año