La tarjeta de sonido
Un poco de historia
El PC (Ordenador Personal) no fue pensado en un principio para manejar
sonido, excepto por esa reminiscencia que en algunos ordenadores ya no se
instala (o está desconectada) llamada "altavoz interno" o "PC
Speaker".
Ese pitido que oímos cuando arrancamos el ordenador ha sido durante
muchos años el único sonido que ha emitido el PC. En un principio, el
altavoz servía para comunicar errores al usuario, ya que la mayoría de
veces, el ordenador debía quedarse solo trabajando (los primeros
ordenadores eran muy lentos, y los usuarios tienen derecho a
merendar).
Pero entró en escena el software que seguramente MÁS ha hecho
evolucionar a los ordenadores desde su aparición: los videojuegos.
Probablemente los programadores pensaron: "¿No sería maravilloso que los
muñequitos ésos emitieran sonidos? ¿No sería aún más increíble una banda
sonora?" Para quien jamás haya jugado a un juego con música o sonido por
el altavoz del PC, que pruebe este VIEJO
juego, probablemente de los primeros que se programaron para los
compatibles. (Por cierto, no tenemos ni idea de cómo se sale de él, como
no sea con Ctrl+Alt+Supr...)
Si jugáis al "Alley Cat" comprobaréis que el sonido no es nada del otro
mundo (aunque he oído verdaderas MARAVILLAS MUSICALES en el altavoz del
PC, cosas que jamás hubiera creído). Sin embargo, un poco más tarde, en
plena revolución de la música digital (empezaban a popularizarse los
instrumentos musicales digitales) apareció en el mercado de los
compatibles una tarjeta que lo revolucionó, la tarjeta de sonido
SoundBlaster.
Por fin era posible convertir sonido analógico a digital para guardarlo
en nuestro PC, y también convertir el sonido digital que hay en nuestro PC
a analógico y poder escucharlo por nuestros altavoces. Posteriormente
aparecieron el resto: SoundBlaster PRO, SoundBlaster 16, Gravis, AWE 32,
AWE 64, MAXI Sound... todas más o menos compatibles con la superexitosa
SoundBlaster original, que se convirtió en un auténtico estándar.
ADC/DAC
Los ordenadores tenían (siguen teniendo) un "problema", sólo saben
trabajar con datos digitales (más concretamente binarios, 0s y 1s), por lo
que cuando conectamos unos altavoces a nuestra tarjeta de sonido, hay
alguien que transforma esos datos digitales en analógicos para que nuestro
altavoz los entienda. De eso se encarga el DAC (Conversor
Digital-Analógico, ).
Y supongo que todo el mundo habrá deducido para qué sirve el ADC
(Conversor Analógico-Digital); efectivamente, cuando grabamos desde una
fuente externa (por ejemplo desde nuestro equipo musical), deberemos
transformar esos datos analógicos que llegan por el cable en muestras
digitales que podamos almacenar en nuestro disco duro.
Pero a alguien le puede ocurrir que necesite reproducir sonido,
tratarlo al mismo tiempo con una fuente externa y volver a grabarlo. O
simplemente reproducir y grabar al mismo tiempo. Esta característica se
conoce como "fullduplex" y debe estar presente en cualquier tarjeta
de sonido medianamente decente (creo que actualmente ya lo está en
prácticamente todas). Para ello, los dos conversores ADC-DAC deben
trabajar de forma separada.
16 bits
Nada de 32, 64, 128 y 256 bits. Las tarjetas de sonido (excepto muy
raras excepciones profesionales) toman las muestras de sonido a 16 bits
(aunque se llame SoundBlaster 128 PCI o MaxiSound 64). Esto ha llevado
a engaño a mas de uno (y de dos) al creer que su tarjeta de sonido
trabajaba con más bits que su propio procesador (pero se trata del numero
de voces, que es otro tema completamente distinto). Esos bits vienen a
definir la posición del altavoz. ¿Qué significa esto? Vamos a
explicarlo.
Para emitir sonidos, los altavoces se mueven dando golpes. Estos golpes
hacen que el aire que nos rodea vibre, y nuestros oídos captan esas
vibraciones y las transforman en impulsos nerviosos que van a nuestro
cerebro... (bueno, eso ya no es cosa de los ordenadores). Pues bien,
deberemos indicarle al altavoz dónde debe "golpear". Para ello simplemente
le enviaremos una posición (en este caso un número). Pues bien, cuantas
más posiciones podamos representar, mejor será el sonido. Y cuantos más
bits tengamos, más posiciones podremos representar (sencillo
¿verdad?).
8 bits |
256 posiciones |
16 bits |
65536
posiciones |
La diferencia es apreciable. Y supongo que todo el mundo se puede hacer
una idea de qué sonará mejor...
¿Son necesarios más bits? En principio no; sin embargo, como en todo,
cuando el ADC no es excesivamente bueno, los últimos bits captados tienen
información que no es demasiado fidedigna. Esto significa que si podemos
trabajar con un mayor abanico de bits (20 o más), aunque perdamos calidad
el sonido final seguirá siendo igual de bueno.
44,1 KHz significa calidad de CD
Vamos a explicar esto. Las tarjetas de sonido simplemente transforman
una señal continua (el sonido es algo continuo, no va a t-r-o-z-o-s) en
una discreta (aunque no lo parezca). Explicamos la palabra "discreta": que
sucede a ciertos intervalos de tiempo.
Veamos un gráfico de ejemplo.
En el dibujo apreciáis una línea continua, que representa un sonido.
Sin embargo, en realidad cuando la captamos con nuestra tarjeta de sonido
no podemos capturar TODA la onda, capturaremos simplemente una
serie de puntos (los que están marcados), un punto cada cierto
tiempo, es decir, un muestreo de los datos con una determinada
frecuencia; la onda que nos quedará será del siguiente estilo:
Os podéis imaginar que si en lugar de 44KHz utilizamos 22KHz, en
realidad capturaremos la mitad de posiciones:
El sonido se degrada rápidamente.
La conclusión de este ejercicio de dibujo a mano alzada es muy
sencilla: cuanta más resolución tengamos, mejor será la representación del
sonido en nuestro ordenador. Algunas tarjetas incorporan interpolación,
mediante la que se suavizan los picos y se puede volver a obtener una onda
más parecida a la original, mejorando, según los fabricantes, la calidad
de sonido. Realmente, aún no conozco a ninguna persona que haya sido capaz
de distinguir entre los dos sonidos (con y sin interpolación).
¿Y porqué exactamente 44’1KHz? Por el mismo motivo por el que el VHS
emite 24 imágenes por segundo: si el ojo humano es capaz de reconocer como
mucho unas 30 imágenes por segundo, sería un derroche de medios (y dinero)
emitir 100 imágenes por segundo, por el simple hecho de que no notaríamos
la diferencia. Del mismo modo, el oído humano es capaz de reconocer
unos 44.000 sonidos cada segundo (o sea, capta el sonido con esa
frecuencia), con lo que la utilización de un mayor muestreo no tiene
ningún sentido (en principio).
Todas las tarjetas de sonido domésticas pueden trabajar con una
resolución de 44’1KHz, y muchas incluso lo hacen a 48KHz. Las
semi-profesionales trabajan en su mayoría con esos 48KHz y algunas incluso
con 50KHz. Las profesionales llegan cerca de los 100KHz.
La utilización de este muestreo ampliado se debe al mismo motivo por el
que algunas tarjetas utilizan más de 16bits para cada muestra: si los
datos de partida no son suficientemente fieles o después nos vamos a
dedicar a modificar el sonido, perderemos calidad, así que cuanta más
calidad tengamos en un principio, mejores resultados obtendremos al final,
es mejor trabajar con un margen de confianza.
|