|
¿QUE
ES UN MP3?
Los archivos
en formato MP3 (*.mp3) son los nuevos archivos de musica comprimidos mediante
MPEG que hay dando vueltas en internet. Estos son archivos de musica comunes
(*.wav) los cuales son comprimidos en gran medida y asi pasados a este formato.
Dada la magnitud de la compresion se volvio muy comun utilizarlos para comprimir
temas enteros de CD en (valga la redundancia) formato mp3 calidad CD, los
cuales ahora pasan de maquina en maquina via internet. El exito de este formato
sobre otros formatos (como el nuevo formato de YAMAHA *.TVQ o *.VQF) es la
gran compresión, la opcion de calidad al comprimir y la facilidad de uso de
los programas que existen. Las unicas desventajas que tienen estos archivos
es que aun no son tan chicos (1 minuto de audio calidad CD en formato MP3
ocupa 1 mega) y que se necesita de una maquina potente para trabajar con MP3
ya que utiliza a fondo el procesador, tanto para reproducir como para comprimir.
SU
ORIGEN Y ACTUALIDAD
Las siglas MP3
responden a la abreviatura de MPEG 1 Layer 3, que es un alogaritmo de codificación
perceptual. Este entre otros fue desarrollado por el Moving Picture Expert
Group (MPEG) (http://www.cselt.it/mpeg/)
junto con el Instituto Tecnológico de Fraunhofer (http://www.ipa.fhg.de/english/).
MPEG 1 no fue
siempre el denominador de este sistema, antes de él se llamaba Musicam. El cual
fue la base para crear el MPEG 1 Layer 1 y 2. Pero debido a que Musicam ya se
encontraba registrado en varias partes del mundo, por distintas empresas, se
decidió que llevase el nombre de sus creadores. El formato MPEG es una alternativa
para el formato avi, como MP3 lo es para WAV.
Moving Picture
Expert Group es un comité de investigación del ISO/IEC. El MPEG está a cargo
del desarrollo internacional de estándares de compresión, descompresión, procesamiento
y la representación codificada de películas, audio y la combinación de ambas.
Es una institución sin fines de lucro creada en 1988, que reúne tres veces por
año a trescientos (300) expertos de veinte (20) países.
No solo a desarrollado
el MPEG 1 Layer 1, 2 y 3 (1992) sino que también existen el MPEG 2 (1994), MPEG
2.5, MPEG 4 versiones 1 (oct. 1998) y 2 (dic. 1999). Hoy en día se encuentra
en desarrollo el MPEG 4 versiones 3, 4 y 5, MPEG 7 y por ultimo el MPEG 21.
A diferencia
del MPEG 1 el MPEG 2 tiene en cuenta el sonido envolvente (surround) y la extensión
multilingüe. El MPEG 2.5 fue creado por el Instituto Fraunhofer y a pesar de
que no es una especificación ISO divide una segunda vez la frecuencia de muestreo
entre dos. Funciona bien para ciertas aplicaciones de ancho de banda critico.
ISO (http://www.iso.ch/) es la Organización Internacional
de Estándares, que fue establecido en 1947. La importancia de este organismo
no gubernamental es considerable ya que sus normas facilitan el intercambio
internacional. Creando así un denominador común entre las industrias de diversas
regiones del mundo. El organismo responsable de ello en la Argentina es el Instituto
Argentino de Normalización (IRAM) (http://www.iram.com.ar/). Al cual se deberá
acudir en caso de buscar las normas ISO con respecto a estos formatos de audio,
estas normas no son gratuitas, de modo que representan el 80% de los ingresos
del ISO; el 20 % restante corresponde a publicaciones.
El MP3 fue adoptado
como norma ISO en 1992 (IS - 11172 - 3) y (IS 13818 - 3). De este modo se establecieron
estándares de mercado e industria definidos para el MP3.
RETENIENDO
EL SONIDO
El MP3 es un
sistema de compresión con perdida, por lo cual el sonido original y el comprimido
no son iguales. Pero las perdidas no deberían ser perceptibles para el oído
humano, de manera que no se tendría que notar la diferencia.
El sonido es
una honda continua que se propaga a través del aire u otros medios, formada
por diferencias de presión, que pueden detectarse mediante la medición de la
presión en un punto determinado. Como se trata de una honda continua es necesario
un proceso de digitalización para representarla como una serie de números. Hoy
en día la mayoría de las operaciones realizadas sobre señales de sonido son
digitales y en menor medida se utilizan señales analógicas. Las señales digitales
poseen muchas ventajas sobre las analógicas, aunque por desgracia esta requiere
un ancho de banda mucho mayor que el de la señal analógica.
El proceso de
digitalización se compone de dos etapas: muestreo y cuantizacion. En el muestreo
se divide el eje del tiempo en segmentos discretos; la frecuencia de muestreo
será la inversa del tiempo que haya entre una medida y la siguiente. En estos
momentos se realiza la cuantización, que, en su forma más sencilla, consiste
simplemente en medir el valor de la señal en amplitud y registrarlo. El teorema
de Nyquist garantiza que la frecuencia necesaria para muestrear una señal que
tiene sus componentes más altas a una frecuencia dada f es como mínimo 2f. Por
tanto, siendo el rango superior de la audición humana en torno a los 20 Khz,
la frecuencia que garantiza un muestreo ajustado a cualquier sonido audible
será de unos 40 Khz (el CD tiene 44.1Khz). Según el fin que se tenga los valores
pueden llegar a ser muy inferiores a estos. De manera que la voz humana acostumbra
fluctuar entre 6 y 20 Khz y en algunos casos es menor. En cuánto a la cauntizacion
se puede realizar una división a intervalos iguales o según una determinada
función de densidad. De manera que haya mas resolución en determinados tramos.
Este proceso es denominado PCM (Pulse Code Modulación).
Cuantos menos
bits se utilicen en el muestreo y la cuantizacion, mayor será el ruido. Para
evitar que el ruido sea excesivo hay que usar una mayor cantidad de bits. Gran
parte de esta información es innecesaria y ocupa un ancho de banda del cual
se podría dispensar, a costa de aumentar la complejidad del sistema decodificador
e incurrir en cierta perdida de calidad. Esto se logra mejor con la cuantizacion
a intervalos determinados por una función de densidad.
El rango de frecuencias
que percibe el oído humano esta aproximadamente entre los 20Hz y los 20kHz siendo
este más sensible entre los 2Hz y 4Hz. De manera que el sonido mientras más
cerca este de a los extremos de la escala, mayor será la dificultad audible
del mismo.
LA
CLAVE DEL ÉXITO
Cuando se percibe
una señal de un volumen alto (agudo o de mayor energía) en una frecuencia
y otra de volumen mas bajo (grave o de menor energía) en una frecuencia cercana
esta ultima no será audible. Este efecto se llama enmascaramiento simultaneo
o en frecuencia (también existe el enmascaramiento asimultáneo o en el tiempo).
Y a cierta distancia de la frecuencia enmascaradora, el efecto se reduce tanto
que resulta despreciable. El rango de frecuencias en las que se produce el
fenómeno se denomina banda critica (critical band). La amplitud de la banda
critica varia según la frecuencia en la que nos situemos y viene dada por
determinados datos que demuestran que es mayor con la frecuencia. De esta
manera se trata de desechar todo aquello que el oído humano no podría captar.
Para aprovechar
estas características se utiliza un sistema denominado Codificación de Sub bandas
o CBS (sub-band coding). Donde el MP3 es el ejemplo más popular. En este proceso
la señal original es descompuesta en sub bandas mediante una base de filtros.
Las sub bandas son comparadas con el original mediante el modelo psicoacustico
que determina que bandas son importantes, cuales no y por ultimo cuales pueden
ser eliminadas.
Los modelos psicoacústicos
se componen a partir de las percepciones de un grupo de personas entrenadas
para rendir al máximo en este campo. Por medio de una serie de experimentos
se puede determinar la sensibilidad del oído humano a una serie de fenómenos,
de forma que aparezcan resultados útiles para el tratamiento del sonido, como
ya hemos visto. Para ello se llevan a cabo experimentos para medir la sensibilidad
del oído humano, el enmascaramiento en frecuencia, el enmascaramiento temporal,
y el enmascaramiento pre - temporal.
Del víbrate que
utilicemos para producir la codificación depende la eliminación de menor o mayor
cantidad de datos siguiendo el modelo psicoacustico hasta lograr la compresión
necesaria. Luego se cuantifican y codifican las sub bandas restantes y el resultado
es finalmente comprimido mediante un alogaritmo estándar Huffman o LZW.
Se puede comprimir
con distinto ancho de banda (kHz), modo (mono o estéreo) y bibrate (kbps) (cantidad
de bits que se consumen por segundo de audio) obteniendo distintas calidades
según para que se vaya a utilizar ese sonido. Dependiendo de la calidad buscada
estará la elección de la compresión que se lleve a cabo.
La decodificación
es más sencilla, ya que no precisa la aplicación de ningún modelo psicoacustico.
Simplemente se analizan los datos y se recomponen las bandas y sus muestras
correspondientes.
El existo que
lleva consigo el formato MP3 esta sustentado por tres pilares. Su capacidad
de compresión: es un sistema de compresión de audio con el cual podemos almacenar
audio en 1/12 del espacio original. Calidad de compresión: un método de compresión
no es otra cosa que un alogaritmo (serie de ecuaciones matemáticas) capaz
de simplificar la información. Pero lamentablemente con perdida de calidad.
Y por ultimo la facilidad de distribución: gracias a Internet se puede enviar
o recibir sin mayor problema, incluso con conexiones lentas, tales como las
de módems de 14kb.
¿DONDE
CONSEGUIR MP3?
Existen
dos formas:
A-
CREARLOS NOSOTROS MISMOS: mediante extracción de pistas de CD y conversión
desde otros formatos de audio como veremos más adelante.
B-
BAJÁNDOLOS DE INTERNET: Sin duda, la opción que
más suele interesar. Aquí tenemos dos opciones una de
ellas es descargarlos de páginas web, una labor tediosa
pues son pocas las webs que los ofrecen y tienen poca variedad. La opción
más recomendable es utilizar algún programa de intercambio
de ficheros MP3 (mas conocidos como clónicos de Napster).
Si
en los ordenadores de millones de usuarios conectados a la Red existen ficheros
MP3, entonces, ¿por qué no crear un gigantesco almacén distribuido donde todos
los usuarios pueden compartir sus archivos MP3 con el resto de usuarios?.
Actualmente, existen muchas aplicaciones (la mayoría gratuitas) que responden
a la anterior pregunta, proporcionando el soporte de software necesario para
el intercambio de recursos MP3.
Este tipo de programas permiten compartir los archivos MP3 disponibles con
el resto de usuarios. Es posible, por tanto, descargar ficheros MP3 de los
ordenadores de otros usuarios. Por otro lado, el resto de usuarios puede descargar
archivos MP3 del ordenador local. Además, se ofrece una herramienta de búsqueda,
un reproductor de MP3 y la posibilidad de realizar chat. La herramienta estrella
en este campo era hasta hace poco Napster 2.0 beta 8, que ha tenido una aceptación
sin precedentes, siendo también fruto de polémica (ya que hacía sencilla
la distribución ilegal de temas musicales).
Tal
éxito hace que, continuamente, aparezcan clónicos de gran calidad. Dichos
programas distribuyen gratuitamente MP3, al igual que hacía Napster
hasta que se convirtio en un programa de pago. En estos momentos destacan
cuatro, todos ellos en inglés pero tienen parches para pasarlos al
castellano. Una vez bajados e instalados en nuestro pc se requiere un proceso
de registro bastante sencillo y rápido, que consiste en indicar una
dirección e-mail y elegir un nombre de usuario y contraseña.
Para descargarlos haz click sobre ellos:
Morpheus
(una opción muy recomendable, quiza no tenga tantos usuarios como otras
herramientas de intercambio de archivos pero no suelen quedar descargas a
medio terminar como en otros programas)
WinMx
(tiene bastantes usuarios y permite además bajar programas, videos
...)
DmSatellite
(en español y se conecta a la red de AudioGalaxy Satellite)
Gnucleus
(además de mp3 podrás descargar vídeos, documentos, ZIPs, HTML,
etc.)
SIGUIENTE
>>
|