Timbreid

timbreID

Librería de William Brent para realizar clasificaciones de sonidos basadas en 15 descriptores de audio. Muy útil para realizar experimentos de organización relativos a la síntesis concatenativa y el Timbre Space (espacio tímbrico). Aca una lista de parches de pd introductorios a este objeto que puede ser bastante útil.
Intro 1 (análisis y clasificación).
Intro 2 (funcionamiento de los objetos de descriptores de audio relacionados con la percepción).
Intro 3 (funcionamiento de los objetos descriptores de audio basados en el espectro y la forma de onda).
Intro 4 (generar una lista compuesta por múltiples descripciones de un sonido en varios momentos de su desarrollo).
Intro 5 (Usar timbreID para clasificar, agrupar y encontrar muestras de audio basadas en múltiples descripciones).
Intro 6 (clasificar audio priorizando unas características sobre otras).

Los 15 objetos que calculan características son:

Nombre Explicación salida
barkSpec Espectro de poder cambiando la amplitud por la escala bark lista de 47 valores
bfcc cepstrum de un espectro con la escala Bark lista de 47 valores
cepstrum logaritmo de la porción real de la transformada de fourier del espectro de la señal ventana de análisis / 2
magSpec magnitud de fourier ventana de análisis / 2
mfcc cepstrum de la frecuencia mel lista de 38 valores
specBrightness Promedio de la suma de las magnitudes por encima de una frecuencia dada 1 dato
specCentroid centro de masa del espectro. Suma las amplitudes y dice cual es la "frecuencia central"
specFlatness la proporción entre el promedio geométrico y el promedio aritmético de un espectro. Que tan ruidosa es una señal
specFlux Suma de la diferencia cuadrada de dos espectros sucesivos (que tanto cambia un espectro al otro)
specIrregularity inspeccionar un espectro de grava a agudo comparando un bin con sus vecinos
specKurtosis Que tan puntiagudo es un espectro
specRolloff frecuencia debajo de la cual una cantidad especial de energía (definida opr el usuario) está concentrada
specSkewness la simetría de la envolvente espectral
specSpread esparcimiento de la energía de un espectro
zeroCrossing Cuantas veces la señal cruzó por cero en la ventana

Después de entrenar el objeto timbreID, se puede exportar su base de datos de entrenamiento en .timid, un formato de texto, un formato ARFF para usar con el paquete WEKA y .mat para usar en MATLAB o GNU Octane. Las busquedas de cercanía dentro del objeto [timbreID] se usan con la estrategia k-nearest neighbor donde k puede ser escogida por el usuario. Se pueden usar 4 métricas de similaridad: Euclidiana, Manhattan (taxicab), Correlación y Similaridad de Coseno. Cuando se usan características mixtas se pueden normalizar los resultados para que no haya distorsión. Se pueden asignar pesos a las características para explorar el efecto de sus proporciones durante el proceso de clasificación. Se puede ordenar la base de datos según la varianza para que los cálculos se hagan basados en los atributos que tengan la mayor varianza.

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License