×
 

Funcionamiento del Phase Vocoder

Published On Mar-13-2017

Transcripción

El phase vocoder se basa en la Transformada de Fourier de Tiempo Corto o Short-Time Fourier Transform, abreviada STFT. A diferencia de otras técnicas de transformadas de Fourier, la STFT considera únicamente una pequeña porción de tiempo de la señal de entrada para realizar su análisis. Cada porción se denomina frame o window, lo cual se traduce como marco y ventana, respectivamente. De esta manera, se obtiene una especie de foto instantánea del contenido espectral de la señal de entrada en un momento específico. Es posible aplicar STFT a señales de entrada continuas o discretas.

Al combinar múltiples windows y aplicar la STFT a cada una, es posible observar cómo el contenido espectral de la señal de audio varía a lo largo del tiempo. Asimismo, al modificar el contenido espectral de cada window, es posible lograr efectos difícilmente reproducibles con procesamiento en función del tiempo.

Estudiemos el funcionamiento general de un phase vocoder digital. Este proceso es el mismo para todos los efectos que se pueden lograr con un phase vocoder. Se cuenta con una señal de entrada de una longitud cualquiera. En primer lugar, se debe escoger el tamaño de cada window, el cual corresponde a N muestras o samples de la señal digital. La cantidad N de muestras en cada window es el window size o frame size.

Nótese que cada window se superpone con otra, en lugar de tener un único límite claramente definido. La amplitud de la señal se mantiene igual en el centro de la window y se atenúa, conforme se aleja del centro, de manera que se forme una especie de crossfade entre cada window. Esto se logra a través de una window function o función de ventana. Se define que la window function tendrá valores diferentes a 0 durante N muestras. Asimismo, para cualquier otro punto en el tiempo fuera de las N muestras consecutivas, se define que su valor será 0.

De esta manera, al multiplicar la señal de entrada por la window function, únicamente se conservarán los valores dentro del rango de N muestras. El resto de valores será 0. Podríamos visualizar una window function como un tipo de filtro band-pass. Cada window tiene su propia función, por lo que se debe multiplicar la señal por cada una. Luego de hacerlo, decimos que la señal ha sido windowed o pasada por ventanas.

En este punto, se debe aplicar una Transformada Rápida de Fourier, Fast Fourier Transform o FFT a cada window. Ahora bien, ¿qué es una FFT? Pues bien, primero debemos conocer el concepto de Transformada de Fourier Discreta, Discrete Fourier Transform o DFT.

Una DFT consiste, al igual que la STFT, en la transformación de una función de tiempo en una función de frecuencia con números complejos. Lo que define a la DFT es que requiere que la función original sea una serie discreta de muestras uniformemente distribuidas a lo largo del tiempo, es decir, que haya el mismo espacio entre cada muestra. Un ejemplo de una serie de este tipo, es una señal de audio digital. La función de salida de la DFT es una serie discreta de muestras distribuidas uniformemente de una función de frecuencia con números complejos, la cual tendrá la misma longitud que la señal de entrada.

Una FFT es un algoritmo que permite reducir considerablemente la complejidad de los cálculos necesarios para realizar una DFT. De esta manera, permite obtener los valores con mayor rapidez y facilidad.

Debido a que cada window posee una cantidad N de muestras, se debe aplicar una FFT que considere una cantidad de muestras M igual o mayor a N. Normalmente, la cantidad M es igual a la N. Sin embargo, en ciertos casos, la FFT considera una cantidad M mayor de muestras. Asimismo, por motivos de practicidad en el mundo digital, la cantidad M de muestras suele ser una potencia de 2. La combinación de cada window function con una Fast Fourier Transform constituye una Short-Time Fourier Transform.

Figura 13.5. Proceso general de un phase vocoder


La información de salida de cada FFT es un conjunto de un número M de bins. Este es el término utilizado para designar las muestras luego de aplicarles FFT. Cada bin contiene información de la amplitud y fase de cada una de las frecuencias presentes en la señal de audio original. Es en este punto donde cada uno de los tipos de phase vocoder aplica un procesamiento diferente en el dominio de la frecuencia, según su objetivo.

Posteriormente, se aplica una Transformada Inversa Rápida de Fourier, Inverse Fast Fourier Transform o IFFT, a cada una de las señales de salida del procesamiento aplicado a las bins. De esta manera, se producen M cantidad de muestras en función del tiempo para cada window. Esta serie de muestras tiene una distribución uniforme y no contiene números complejos. Resulta nuevamente, una señal convencional de audio discreta o digital, pero dividida en múltiples windows.

Antes de estudiar cómo se obtiene la señal de audio final, recapitulemos el proceso. Inicialmente se selecciona arbitrariamente una cantidad N de muestras que conformarán el tamaño de cada frame o window. Luego, se multiplica la señal de entrada por una window function que únicamente conserva los valores dentro de la ventana. Posteriormente, estos valores se someten a una FFT, un procesamiento en el dominio de la frecuencia y luego una IFFT.

Finalmente, las M muestras de la window reconstruida por la IFFT se suman al búfer de salida. El proceso completo inicia de nuevo, pero esta vez con una window cuyo centro se encuentra una cantidad H de muestras más adelante del centro de la window previa. La magnitud H se denomina hop size o tamaño del salto. En ocasiones, el hop size es igual al tamaño de la window. Sin embargo, es más común que el hop size sea una fracción del tamaño de una window, como por ejemplo la mitad o un cuarto.

El búfer de salida almacena temporalmente el conjunto de muestras de cada window conforme estas llegan y se suman en el proceso llamado overlapp-add, en referencia a los traslapes entre las diferentes windows. Durante este proceso de suma, se analizan las windows originales de la señal de entrada y cómo se traslapan; se comparan con cada window de salida después del procesamiento; y se alinean de manera que pueda conformarse la señal de salida.


Aplicar para una beca

Me interesa graduarme de una
carrera en VonKelemen

Vonkelemen Master Instructors

Related Videos
Planifica detalladamente el evento: seis etapas de planeamiento y desarrollo de estrategias

Published On Jul-17-2019

-Planeamiento y gestión creativa

¿Cuáles son las razones por las que debemos planificar d

Conserva el control manual al crear automatizaciones: función Virgin Territory

Published On Nov-30-2020

-Técnicas de postproducción

Al agregar automatización en una pista, esto deshabilita

Envíos y Retornos Auxiliares

Published On Mar-31-2017

TM-Operación de Consolas de Mezcla

Transcripción Todas las consolas de mezcla cuentan

Diferencia correctamente los tipos de ilustración: formatos de imágenes

Published On Jan-31-2019

Introducción al Diseño Web

Por desconocimiento de las extensiones de imágenes y la c

Interpreta las influencias socioculturales: factores interpersonales del cliente

Published On Nov-15-2019

-Factores Influyentes en el Comportamiento del Consumidor

Las diferencias culturales en el mundo son muy variadas, s

Labores en la elaboración de los presupuestos, parte I

Published On May-16-2017

Presupuestos y Calendarios

Transcripción La confección de los presupuestos al igual

Conceptos básicos (Parte II)

Published On Dec-27-2017

-Fundamentos para la Configuración de Sistemas de PA I

Transcripción Ángulo de cobertura El ángulo de cobertu

Introducción

Published On Mar-24-2017

Edición de Audio

Transcripción Al hablar de herramientas de afinación, gen

Introducción

Published On Jan-08-2018

Procesadores de Frecuencia y Rango Dinámico

Transcripción Al preguntarle a distintos ingenieros de gra

Generalizar la memoria del consumidor: la influencia del aprendizaje

Published On May-24-2020

-Estrategias de Marketing basadas en el Consumidor

La memoria tiene una gran influencia en el comportamiento d

Compartiendo contenidos

Published On Oct-30-2017

Steinberg Cubase Operator Certificate Program

Transcripción La tecnología VST, desarrollada por Steinbe

El bordoneo

Published On Mar-17-2017

-Géneros Musicales del Mundo

Transcripción A continuación, estudiaremos dos recursos

Aplica valores de especificación de tamaños para estilos: unidades de medidas CSS

Published On Jan-29-2019

Introducción al Diseño Web

Con la finalidad de aplicar con excelencia valores de espec

Afinación manual o automática

Published On Mar-27-2017

Edición de Audio

Transcripción ¿Afinación manual o automática? En la may

Introducción

Published On Mar-13-2017

Arreglos para Banda I: Bajo, Piano, Guitarra y Batería

Transcripción Estudiaremos importantes técnicas de arr

Interfaces Expandibles: Conexiones Digitales

Published On Nov-24-2016

Curso de Prueba Importacion

Transcripción. Hemos analizado todas las conexiones anal

Filtros HPF pasivos

Published On Sep-07-2018

-Diseño de Filtros de Ecualización

Transcripción Probablemente, los filtros high-pass son aú

Transmisión de la señal: cables multinúcleo y stageboxes

Published On Nov-21-2016

-Configuraciones de Grabación con Sistemas Digitales

TranscripciónLos eventos en vivo incluyen todo tipo de equ

Lo que define a un Profesional del Music Business Management I Parte.

Published On Apr-28-2017

Introducción al Music Business Management

Transcripción Habilidades y Rasgos Personales:Como ya lo

Refracción por diferencias de temperatura en el aire

Published On Mar-07-2017

-Fundamentos para la Configuración de Sistemas de PA I

Transcripción En venues grandes, especialmente aquellos al

Superposición de ondas

Published On Nov-27-2017

-Fundamentos de Acústica

Transcripción¿Cómo se comporta el sonido en la vida real

Batería: Posiciones para grabación un solo micrófono

Published On Dec-13-2017

Microfoneo Directo y Grabación Estéreo

Transcripción Cuando se piensa en grabación de batería,

Cómo inferir las aplicaciones y limitaciones de una consola?

Published On Dec-28-2017

Consolas de Mezcla

Transcripción. Con el advenimiento de las tecnologí

Modulación contrapuntística en una suite

Published On Jul-02-2018

Arreglos Orquestales I

Transcripción La armonía es uno de los recursos más usad

¿La creatividad es racional o irracional? Parte I

Published On Mar-15-2017

Desarrollo de la Creatividad

Transcripción Las intenciones pueden ser importantes para

Listas de verificación: pregrabación

Published On Dec-31-2017

Producción Musical Avanzada

Transcripción Analicemos algunos aspectos que el producto

Encuentra el equipo perfecto: consideraciones para la contratación de músicos

Published On Apr-02-2019

Artist Management

Sea que se trate de un artista en solitario o de una agrupa

Edita L o R selectivamente: selección, zoom y edición correctiva de nivel

Published On Dec-23-2020

Steinberg Wavelab Expert

Supongamos que estamos masterizando una canción y notamos

Fades: curva S

Published On Mar-10-2017

-Edición Correctiva

Transcripción La curva en forma de “S” es un poco difí

Blackface (parte I)

Published On Mar-25-2017

-Géneros Musicales Comunes para una Banda de Rock

Transcripción Como se ha enseñado anteriormente, el Blues

X

vonkelemen premium

Miles de vídeos HD con los secretos mejor guardados de los VonKelemen Master Instructors.

Aprende con los profesionales más importantes y relevantes del mundo,
granadores de múltiples premios Grammy y Billbord

  • más info

    Moogie Canazio

    Nathan East, Ray Charles, Sarah Vaughan, Dionne Warwick, Luis Miguel, Caetano Veloso, Eric Clapton, Diana Ross, Selena, Tom Jobim, João Gilberto, Maria Bethânia, Ivan Lins...

  • más info

    Rafa Sardina

    Stevie Wonder, D'Angelo, Lady Gaga, Celine Dion, Cristian Castro, Michael Jackson, Alejandro Fernandez, Mariah Carey, Plácido Domingo, Illya Kuriaki & The Valderramas, Shakira...

  • más info

    Sebastian Krys

    Sergio Dalma, Eros Ramazzotti, Sandy e Junior, Gloria Estefan, Carlos Vives, Shakira, Alejandro Sanz, Luis Fonsi, Vega, Kinky, Los Rabanes, Obie Bermúdez, Ricky Martin...

  • más info

    Benny Faccone

    Santana, Sting, Michael Jackson, Stevie Wonder, Dizzy Gillespie, Whitney Houston, Luis Miguel, Ricky Martin, Los Fabulosos Cadillacs, Maná, Barbra Streisand, Patti LaBelle...

  • más info

    Peter Doell

    Toto, War, Elton John, The Beach Boys, Celine Dion, Hans Zimmer, Ray Charles, Miles Davis, Marilyn Manson, R.E.M., Ben Harper, Tom Jones, Adam Lambert, Chuck Berry, Lynyrd...

  • más info

    Colin Liebich

    Brian Vibberts (ganador de múltiples premios Grammy), CJ Vanston (Productor de Toto, Chic Corea, Spinal Tap), Billy Sheehan...

  • más info

    Brent Fischer

    Usher, Paul McCartney, Robert Palmer, D’Angelo, Joao Gilberto, Carlos Santana, Raphael Saadiq, Michael Jackson, Prince, Al Jarreau, Toni Braxton, Eric Benet...

Selecciona tu membresía
MensualAnual
$29/mes $290/año
Acceso ilimitado a todo el
contenido PREMIUM
Acceso ilimitado a todo el
contenido PREMIUM
Contrato anual,
facturado mensualmente
Contrato anual,
prepagaso
Suscribirme Suscribirme
$29/mes $290/año