×
 

Funcionamiento del Phase Vocoder

Published On Mar-13-2017

Transcripción

El phase vocoder se basa en la Transformada de Fourier de Tiempo Corto o Short-Time Fourier Transform, abreviada STFT. A diferencia de otras técnicas de transformadas de Fourier, la STFT considera únicamente una pequeña porción de tiempo de la señal de entrada para realizar su análisis. Cada porción se denomina frame o window, lo cual se traduce como marco y ventana, respectivamente. De esta manera, se obtiene una especie de foto instantánea del contenido espectral de la señal de entrada en un momento específico. Es posible aplicar STFT a señales de entrada continuas o discretas.

Al combinar múltiples windows y aplicar la STFT a cada una, es posible observar cómo el contenido espectral de la señal de audio varía a lo largo del tiempo. Asimismo, al modificar el contenido espectral de cada window, es posible lograr efectos difícilmente reproducibles con procesamiento en función del tiempo.

Estudiemos el funcionamiento general de un phase vocoder digital. Este proceso es el mismo para todos los efectos que se pueden lograr con un phase vocoder. Se cuenta con una señal de entrada de una longitud cualquiera. En primer lugar, se debe escoger el tamaño de cada window, el cual corresponde a N muestras o samples de la señal digital. La cantidad N de muestras en cada window es el window size o frame size.

Nótese que cada window se superpone con otra, en lugar de tener un único límite claramente definido. La amplitud de la señal se mantiene igual en el centro de la window y se atenúa, conforme se aleja del centro, de manera que se forme una especie de crossfade entre cada window. Esto se logra a través de una window function o función de ventana. Se define que la window function tendrá valores diferentes a 0 durante N muestras. Asimismo, para cualquier otro punto en el tiempo fuera de las N muestras consecutivas, se define que su valor será 0.

De esta manera, al multiplicar la señal de entrada por la window function, únicamente se conservarán los valores dentro del rango de N muestras. El resto de valores será 0. Podríamos visualizar una window function como un tipo de filtro band-pass. Cada window tiene su propia función, por lo que se debe multiplicar la señal por cada una. Luego de hacerlo, decimos que la señal ha sido windowed o pasada por ventanas.

En este punto, se debe aplicar una Transformada Rápida de Fourier, Fast Fourier Transform o FFT a cada window. Ahora bien, ¿qué es una FFT? Pues bien, primero debemos conocer el concepto de Transformada de Fourier Discreta, Discrete Fourier Transform o DFT.

Una DFT consiste, al igual que la STFT, en la transformación de una función de tiempo en una función de frecuencia con números complejos. Lo que define a la DFT es que requiere que la función original sea una serie discreta de muestras uniformemente distribuidas a lo largo del tiempo, es decir, que haya el mismo espacio entre cada muestra. Un ejemplo de una serie de este tipo, es una señal de audio digital. La función de salida de la DFT es una serie discreta de muestras distribuidas uniformemente de una función de frecuencia con números complejos, la cual tendrá la misma longitud que la señal de entrada.

Una FFT es un algoritmo que permite reducir considerablemente la complejidad de los cálculos necesarios para realizar una DFT. De esta manera, permite obtener los valores con mayor rapidez y facilidad.

Debido a que cada window posee una cantidad N de muestras, se debe aplicar una FFT que considere una cantidad de muestras M igual o mayor a N. Normalmente, la cantidad M es igual a la N. Sin embargo, en ciertos casos, la FFT considera una cantidad M mayor de muestras. Asimismo, por motivos de practicidad en el mundo digital, la cantidad M de muestras suele ser una potencia de 2. La combinación de cada window function con una Fast Fourier Transform constituye una Short-Time Fourier Transform.

Figura 13.5. Proceso general de un phase vocoder


La información de salida de cada FFT es un conjunto de un número M de bins. Este es el término utilizado para designar las muestras luego de aplicarles FFT. Cada bin contiene información de la amplitud y fase de cada una de las frecuencias presentes en la señal de audio original. Es en este punto donde cada uno de los tipos de phase vocoder aplica un procesamiento diferente en el dominio de la frecuencia, según su objetivo.

Posteriormente, se aplica una Transformada Inversa Rápida de Fourier, Inverse Fast Fourier Transform o IFFT, a cada una de las señales de salida del procesamiento aplicado a las bins. De esta manera, se producen M cantidad de muestras en función del tiempo para cada window. Esta serie de muestras tiene una distribución uniforme y no contiene números complejos. Resulta nuevamente, una señal convencional de audio discreta o digital, pero dividida en múltiples windows.

Antes de estudiar cómo se obtiene la señal de audio final, recapitulemos el proceso. Inicialmente se selecciona arbitrariamente una cantidad N de muestras que conformarán el tamaño de cada frame o window. Luego, se multiplica la señal de entrada por una window function que únicamente conserva los valores dentro de la ventana. Posteriormente, estos valores se someten a una FFT, un procesamiento en el dominio de la frecuencia y luego una IFFT.

Finalmente, las M muestras de la window reconstruida por la IFFT se suman al búfer de salida. El proceso completo inicia de nuevo, pero esta vez con una window cuyo centro se encuentra una cantidad H de muestras más adelante del centro de la window previa. La magnitud H se denomina hop size o tamaño del salto. En ocasiones, el hop size es igual al tamaño de la window. Sin embargo, es más común que el hop size sea una fracción del tamaño de una window, como por ejemplo la mitad o un cuarto.

El búfer de salida almacena temporalmente el conjunto de muestras de cada window conforme estas llegan y se suman en el proceso llamado overlapp-add, en referencia a los traslapes entre las diferentes windows. Durante este proceso de suma, se analizan las windows originales de la señal de entrada y cómo se traslapan; se comparan con cada window de salida después del procesamiento; y se alinean de manera que pueda conformarse la señal de salida.


Aplicar para una beca

Me interesa graduarme de una
carrera en VonKelemen

Vonkelemen Master Instructors

Related Videos
Alcanza soluciones satisfactorias: el panel Properties

Published On Apr-09-2021

-Creación de Partituras con Software

La notación musical con Dorico permite una edición sumame

Introducción

Published On Mar-09-2017

Introducción al Manejo de Presupuestos

Transcripción   Como lo hemos visto en las últim

Introducción

Published On Mar-03-2017

-Planeamiento y Grabación de un Proyecto Musical

Transcripción La etapa de producción musical inicia co

Impedancia: Importancia en el Estudio

Published On Dec-12-2017

Teoría del Sonido

Transcripción. Empleemos una analogía para introducir

HD18507_L8_11

Published On Jun-23-2017

Media Planning

La banda de conciertos

Published On Mar-16-2017

Dirección Musical

Transcripción Anteriormente, se aprendieron algunos prin

Utilizando material pregrabado

Published On Mar-25-2017

-Operación de Sistemas de PA

Transcripción Los álbumes de estudio de muchos artistas c

Interés Compuesto

Published On Mar-09-2017

Introducción al Manejo de Presupuestos

Transcripción   El interés compuesto, o tambi

Personaliza tu estación de trabajo: creación de plantillas

Published On Dec-23-2020

Steinberg Wavelab Expert

En el ámbito profesional, una estación de Wavelab se uti

Limpieza de frecuencias indeseadas

Published On Jan-22-2018

-Creación de Balance

Transcripción Una de las tareas más frecuentes que se rea

Categorización funcional del sonido

Published On May-08-2017

-Diseño de sonido y postproducción para audiovisuales

Transcripción La producción de proyectos audiovisual

Principios de afinación

Published On Nov-29-2017

Técnicas de Microfoneo Multicanal

Transcripción La afinación de tambores requiere de un oí

Aumenta la calidad de tu trabajo: inserción de casillas de repetición, codas y tablaturas

Published On Apr-01-2021

-Edición de Partituras con Software

Aunque la transcripción de una canción popular pueda par

Benny Faccone | Maneja el presupuesto: organizando y planificando correctamente las distintas etapas de un proyecto.

Published On Feb-11-2022

-Gestión Administrativa, Creativa, de Negocio y Preproducción

Transcripción Bueno, el presupuesto… el presupuesto y lo

Tipos de fuentes

Published On Nov-27-2017

-Fundamentos de Acústica

TranscripciónAnteriormente, visualizamos el sonido como un

Controversias en la publicidad: los niños

Published On Jul-08-2017

Ética Profesional

Transcripción La controversia es el “conflicto” genera

Conclusión

Published On Apr-04-2018

Producción Musical Básica

Transcripción La preproducción representa una etapa

Cálculo de presupuestos: Alquileres

Published On Mar-14-2017

Producción Musical Avanzada

Transcripción Continuemos explorando las otras 2 categor

Rango de Frecuencias Audible

Published On Mar-31-2017

TM-Conceptos Físicos Básicos para el Ingeniero de Sonido

Transcripción En el video anterior, introdujimos el

Bajo Jazz, parte II

Published On Mar-13-2017

-Conceptos Básicos de Jazz y Rock

Transcripción Continuaremos nuestro estudio del walking

Sustitución de acordes

Published On Mar-15-2017

-Técnicas de Variación Melódica y Armónica de Frases y Motivos

Transcripción La sustitución de acordes siempre ha sido

Evaluaciones

Published On Jan-08-2019

Teoría Musical Avanzada

Cautiva la atención de tu audiencia: elementos clave de los smartphones como lovemarks

Published On Apr-19-2020

-Introducción al Marketing Digital

Los celulares inteligentes, o smartphones, se encuentran ca

Acordes de la tonalidad menor

Published On Aug-07-2020

Armonía Avanzada I

Transcripción En la armonía moderna, resulta provechoso

Conclusión

Published On Feb-27-2018

Armonía Avanzada II

TranscripciónEn esta lección, estudiamos el atonalismo, a

Aprende la psicología del consumidor: creación de la disciplina

Published On May-24-2020

-Estrategias de Marketing basadas en el Consumidor

La psicología aplicada al consumidor es uno de los temas

Soluciones acústicas (Parte I)

Published On Jan-17-2018

-Sistemas de Sonido en Vivo y Venues

TranscripciónProbablemente hayamos asistido a conciertos e

Melodías en las cuerdas por fila: violas y violonchelos

Published On Aug-11-2017

Instrumentación y Orquestación

Transcripción Estudiaremos ahora las características de

Piano Blues parte I

Published On Mar-13-2017

Arreglos para Banda I: Bajo, Piano, Guitarra y Batería

Transcripción Dentro del piano Blues, la mano izquierd

Timestretch: Algoritmo MPEX

Published On Mar-11-2017

Edición de Audio

Transcripción MPEX El algoritmo MPEX ofrece una alternati

X

vonkelemen premium

Miles de vídeos HD con los secretos mejor guardados de los VonKelemen Master Instructors.

Aprende con los profesionales más importantes y relevantes del mundo,
granadores de múltiples premios Grammy y Billbord

  • más info

    Moogie Canazio

    Nathan East, Ray Charles, Sarah Vaughan, Dionne Warwick, Luis Miguel, Caetano Veloso, Eric Clapton, Diana Ross, Selena, Tom Jobim, João Gilberto, Maria Bethânia, Ivan Lins...

  • más info

    Rafa Sardina

    Stevie Wonder, D'Angelo, Lady Gaga, Celine Dion, Cristian Castro, Michael Jackson, Alejandro Fernandez, Mariah Carey, Plácido Domingo, Illya Kuriaki & The Valderramas, Shakira...

  • más info

    Sebastian Krys

    Sergio Dalma, Eros Ramazzotti, Sandy e Junior, Gloria Estefan, Carlos Vives, Shakira, Alejandro Sanz, Luis Fonsi, Vega, Kinky, Los Rabanes, Obie Bermúdez, Ricky Martin...

  • más info

    Benny Faccone

    Santana, Sting, Michael Jackson, Stevie Wonder, Dizzy Gillespie, Whitney Houston, Luis Miguel, Ricky Martin, Los Fabulosos Cadillacs, Maná, Barbra Streisand, Patti LaBelle...

  • más info

    Peter Doell

    Toto, War, Elton John, The Beach Boys, Celine Dion, Hans Zimmer, Ray Charles, Miles Davis, Marilyn Manson, R.E.M., Ben Harper, Tom Jones, Adam Lambert, Chuck Berry, Lynyrd...

  • más info

    Colin Liebich

    Brian Vibberts (ganador de múltiples premios Grammy), CJ Vanston (Productor de Toto, Chic Corea, Spinal Tap), Billy Sheehan...

  • más info

    Brent Fischer

    Usher, Paul McCartney, Robert Palmer, D’Angelo, Joao Gilberto, Carlos Santana, Raphael Saadiq, Michael Jackson, Prince, Al Jarreau, Toni Braxton, Eric Benet...

Selecciona tu membresía
MensualAnual
$29/mes $290/año
Acceso ilimitado a todo el
contenido PREMIUM
Acceso ilimitado a todo el
contenido PREMIUM
Contrato anual,
facturado mensualmente
Contrato anual,
prepagaso
Suscribirme Suscribirme
$29/mes $290/año