Almacenamiento


 

Los primeros PCs carecían de disco duro, sólo disponían de una o dos disqueteras gracias a las cuales se cargaban los programas y se guardaba la información; incluso era posible llegar a tener almacenados en un único disquete ¡de 360 Kb! el sistema operativo, el procesador de textos y los documentos más utilizados. Evidentemente, los tiempos han cambiado; hoy en día, quien más quien menos dispone de discos duros de capacidad equivalente a miles de aquellos disquetes, y aun así seguimos quejándonos de falta de espacio. En fin...

 

Generalidades

Antes de entrar a discutir los tipos de disquetes, discos duros, dispositivos de almacenamiento masivo portátiles y demás, vamos a explicar algunos conceptos que aparecerán en la explicación de todos estos aparatos.

El tamaño: Kb, MB y GB

Como decían en la publicidad de Godzilla, "el tamaño importa". Aparte de la durabilidad, la portabilidad, la fiabilidad y otros temas más o menos esotéricos, cuando buscamos un dispositivo de almacenamiento lo que más nos importa generalmente es su capacidad.

En informática, cada carácter (cada letra, número o signo de puntuación) suele ocupar lo que se denomina un byte (que a su vez está compuesto de bits, generalmente 8). Así, cuando decimos que un archivo de texto ocupa 4.000 bytes queremos decir que contiene el equivalente a 4.000 letras (entre 2 y 3 páginas de texto sin formato).

Por supuesto, el byte es una unidad de información muy pequeña, por lo que se usan sus múltiplos: kilobyte (Kb), megabyte (MB), gigabyte (GB)... Debido a que la informática suele usar potencias de 2 en vez de potencias de 10, se da la curiosa circunstancia de que cada uno de estos múltiplos no es 1.000 veces mayor que el anterior, sino 1.024 veces (2 elevado a 10 = 1.024). Por tanto, tenemos que:

1 GB = 1.024 MB = 1.048.576 Kb = más de 1.073 millones de bytes

¡La tira de letras, sin duda! Se debe tener en cuenta que muchas veces en vez del 1.024 se usa el 1.000, por ejemplo para hacer que un disco duro parezca un poco mayor de lo que es en realidad, digamos de 540 MB en vez de 528 MB (tomando 1 MB como 1.000 Kb, en vez de 1.024 Kb).

Claro está que no todo son letras; por ejemplo, un archivo gráfico de 800x600 puntos en "color real" (hasta 16,7 millones de colores) ocupa 1,37 MB (motivo por el cual se usan métodos de compresión como JPEG, GIF, PCX, TIFF); un sistema operativo como Windows 95 puede ocupar instalado más de 100 MB; 74 minutos de sonido con calidad digital ocupan 650 MB; etcétera, etcétera.

 

La velocidad: MB/s y ms

La velocidad de un dispositivo de almacenamiento no es un parámetro único; más bien es como un coche, con su velocidad punta, velocidad media, aceleración de 1 a 100 y hasta tiempo de frenado.

La velocidad que suele aparecer en los anuncios es la velocidad punta o a ráfagas, que suele ser la mayor de todas. Por ejemplo, cuando se dice que un disco duro llega a 10 MB/s, se está diciendo que teóricamente, en las mejores condiciones y durante un brevísimo momento es capaz de transmitir 10 megabytes por segundo. Y aun así, puede que nunca consigamos llegar a esa cifra.

La velocidad que debe interesarnos es la velocidad media o sostenida; es decir, aquella que puede mantener de forma más o menos constante durante lapsos apreciables de tiempo. Por ejemplo, para un disco duro puede ser muy aceptable una cifra de 5 MB/s, muy lejos de los teóricos 16,6 MB/s del modo PIO-4 o los 33,3 MB/s del UltraDMA que tanto gustan de comentar los fabricantes, claro.

Y por último tenemos el tiempo medio de acceso. Se trata del tiempo que por término medio tarda el dispositivo en responder a una petición de información debido a que debe empezar a mover sus piezas, a girar desde el reposo si es que gira y a buscar el dato solicitado. En este caso se mide en milisegundos (ms), y puesto que se trata de un tiempo de espera, tiempo perdido, cuanto menos sea mejor. Por ejemplo, un disco duro tiene tiempos menores de 25 ms, mientras que un CD-ROM puede superar los 150 ms. También se habla a veces del tiempo máximo de acceso, que suele ser como el doble del tiempo medio.

 

 

Tecnologías: óptica y magnética

Para grabar datos en un soporte físico más o menos perdurable se usan casi en exclusiva estas dos tecnologías. La magnética se basa en la histéresis magnética de algunos materiales y otros fenómenos magnéticos, mientras que la óptica utiliza las propiedades del láser y su alta precisión para leer o escribir los datos.

No vamos a explicar aquí las teorías físicas en que se basa cada una de estas tecnologías, yo lo he hecho y no creo que fuera nada divertido ni útil para la mayoría; vamos más bien a explicar las características peculiares prácticas de cada una de ellas.

La tecnología magnética para almacenamiento de datos se lleva usando desde hace decenas de años, tanto en el campo digital como en el analógico. Consiste en la aplicación de campos magnéticos a ciertos materiales cuyas partículas reaccionan a esa influencia, generalmente orientándose en unas determinadas posiciones que conservan tras dejar de aplicarse el campo magnético. Esas posiciones representan los datos, bien sean una canción de los Beatles o bien los bits que forman una imagen o el último balance de la empresa.

Dispositivos magnéticos existen infinidad; desde las casetes o las antiguas cintas de música hasta los modernos Zip y Jaz, pasando por disqueteras, discos duros y otros similares. Todos se parecen en ser dispositivos grabadores a la vez que lectores, en su precio relativamente bajo por MB (lo que se deriva de ser tecnologías muy experimentadas) y en que son bastante delicados.

Les afectan las altas y bajas temperaturas, la humedad, los golpes y sobre todo los campos magnéticos; si quiere borrar con seguridad unos cuantos disquetes, póngalos encima de un altavoz conectado en el interior de un coche al sol y déjelos caer a un charco un par de veces. Y si sobreviven, compre acciones de la empresa que los ha fabricado.

Diferencias entre el CD-ROM y el DVD

La tecnología óptica de almacenamiento por láser es bastante más reciente. Su primera aplicación comercial masiva fue el superexitoso CD de música, que data de comienzos de la década de 1.980. Los fundamentos técnicos que se utilizan son relativamente sencillos de entender: un haz láser va leyendo (o escribiendo) microscópicos agujeros en la superficie de un disco de material plástico, recubiertos a su vez por una capa transparente para su protección del polvo.

Realmente, el método es muy similar al usado en los antiguos discos de vinilo, excepto porque la información está guardada en formato digital (unos y ceros como valles y cumbres en la superficie del CD) en vez de analógico y por usar un láser como lector. El sistema no ha experimentado variaciones importantes hasta la aparición del DVD, que tan sólo ha cambiado la longitud de onda del láser, reducido el tamaño de los agujeros y apretado los surcos para que quepa más información en el mismo espacio; vamos, el mismo método que usamos todos para poder meter toda la ropa en una única maleta cuando nos vamos de viaje...

La principal característica de los dispositivos ópticos es su fiabilidad. No les afectan los campos magnéticos, apenas les afectan la humedad ni el calor y pueden aguantar golpes importantes (siempre que su superficie esté protegida). Sus problemas radican en la relativa dificultad que supone crear dispositivos grabadores a un precio razonable, una velocidad no tan elevada como la de algunos dispositivos magnéticos y en que precisan un cierto cuidado frente al polvo y en general cualquier imperfección en su superficie, por lo que es muy recomendable que dispongan de funda protectora. De todas formas, un CD es mucho más probable que sobreviva a un lavado que un disquete, pero mejor no tener que probarlo.

 

El interfaz SCSI

Acrónimo de Small Computer Systems Interface y leído "escasi", aunque parezca mentira. Mucha gente ha oído hablar de estas siglas y en general las asocian a ordenadores caros o de marca y a un rendimiento elevado, pero no muchos conocen el porqué de la ventaja de esta tecnología frente a otras como EIDE.

La tecnología SCSI (o tecnologías, puesto que existen multitud de variantes de la misma) ofrece, en efecto, una tasa de transferencia de datos muy alta entre el ordenador y el dispositivo SCSI (un disco duro, por ejemplo). Pero aunque esto sea una cualidad muy apreciable, no es lo más importante; la principal virtud de SCSI es que dicha velocidad se mantiene casi constante en todo momento sin que el microprocesador realice apenas trabajo.

Esto es de importancia capital en procesos largos y complejos en los que no podemos tener el ordenador bloqueado mientras archiva los datos, como por ejemplo en la edición de vídeo, la realización de copias de CD o en general en cualquier operación de almacenamiento de datos a gran velocidad, tareas "profesionales" propias de ordenadores de cierta potencia y calidad como los servidores de red.

Las distintas variantes de la norma son:

Tipo de norma SCSI

Transferencia máxima con 8 bits

Transferencia máxima con 16 bits (modos Wide)

SCSI-1

5 MB/s

No aplicable

SCSI-2 o Fast SCSI

10 MB/s

20 MB/s

Ultra SCSI o Fast-20

20 MB/s

40 MB/s

Ultra-2 SCSI o Fast-40

40 MB/s

80 MB/s

Los tipos de SCSI de 8 bits admiten hasta 7 dispositivos y suelen usar cables de 50 pines, mientras que los SCSI de 16 bits o Wide, "ancho" en inglés, pueden tener hasta 15 dispositivos y usan cables de 68 pines. La denominación "SCSI-3" se usa de forma ambigua, generalmente refiriéndose al tipo Ultra SCSI de 8 bits, aunque a veces también se utiliza para los Ultra SCSI de 16 bits (o "UltraWide SCSI") y Ultra-2.

Las controladoras SCSI modernas suelen ser compatibles con las normas antiguas, por ejemplo ofreciendo conectores de 50 pines junto a los más modernos de 68, así como conectores externos (generalmente muy compactos, de 36 pines), salvo en algunos modelos especiales que se incluyen con aparatos SCSI que están diseñados sólo para controlar ese aparato en concreto, lo que abarata su coste.

Los dispositivos SCSI deben ir identificados con un número único en la cadena, que se selecciona mediante una serie de jumpers o bien una rueda giratoria en el dispositivo. Actualmente algunos dispositivos realizan esta tarea automáticamente si la controladora soporta esta característica, lo que nos acerca algo más al tan deseado y huidizo Plug and Play, "enchufar y listo".

Debe tenerse en cuenta que las ventajas de SCSI no se ofrecen gratis, por supuesto; los dispositivos SCSI son más caros que los equivalentes con interfaz EIDE o paralelo y además necesitaremos una tarjeta controladora SCSI para manejarlos, ya que sólo las placas base más avanzadas y de marca incluyen una controladora SCSI integrada. Si está pensando en comprar un ordenador o una placa base nuevos, piense si no le merecería la pena adquirir una placa base que la incorpore por lo que pueda necesitar en el futuro...

 

 

Los sistemas de archivo

Todo dispositivo para el almacenamiento de datos debe ser formateado antes de su uso; es decir, que se le debe dar un cierto formato lógico que indique cómo será almacenada la información: el tamaño de los paquetes, la forma en que se distribuyen, los atributos posibles de los archivos (nombre, tipo, fecha...) y otras características que definirán un tipo de sistema de archivo concreto.

En el mundo PC el sistema de archivo más extendido es el FAT16 de las versiones de DOS superiores a la 3 y del Windows 95 original, usado en los disquetes y la mayoría de los discos duros. La VFAT (FAT Virtual) de Windows 95 que permite nombres largos no es más que un parche sobre este sistema de archivo, no un sistema de archivo en sí.

El otro sistema en rápida extensión es el FAT32 de Windows 98 y de la versión OSR-2 de Windows 95 (la "4.00.950B", como se identifica a sí misma en el icono de Sistema del Panel de control). Las ventajas de este sistema de archivo frente al anterior radican en que es de 32 bits y tiene un tamaño de cluster muy pequeño, lo que le hace capaz de admitir grandes discos duros y aprovecharlos muy bien, además de no necesitar artificios como VFAT para usar nombres largos de archivo.

Vayamos por partes; primero, los clusters; son como "cajones" en que el disco duro está dividido, en los cuales se guardan los archivos. Se da la peculiaridad de que un cluster no puede ser compartido por dos archivos distintos, por lo que si tenemos un tamaño de cluster de 16 Kb y queremos guardar un archivo que ocupa 17 Kb, se repartirá en dos clusters, ocupando uno entero y sólo 1 Kb del otro; el resto (15 Kb) se desperdiciará. Sí, ha leído bien; ¡tiraremos el 47% del espacio!!. Y esto no es nada, ya verá.

Lo mismo ocurre si queremos almacenar un archivo que ocupa sólo 1 byte; si el cluster es de 16 Kb (16.384 bytes), se desperdiciarán totalmente 16.383 bytes, ¡el 99,99% del espacio!! Como comprenderá, en estas condiciones resulta muy importante mantener el tamaño del cluster lo menor posible para minimizar las pérdidas que ocasionan estos archivos, especialmente los muy pequeños. Observe la tabla a continuación que relaciona el tamaño de las particiones (a continuación explicaremos qué son) con el tamaño del cluster en FAT16 y en FAT32:

Tamaño de la partición

Tamaño del cluster

FAT16

Hasta 2 GB

32 Kb

Menos de 1 GB

16 Kb

Menos de 512 MB

8 Kb

Menos de 256 MB

4 Kb

Menos de 128 MB

2 Kb

FAT32

A partir de 8 GB

8 Kb

Menos de 8 GB

4 Kb

En cuanto al tamaño de los discos, no es difícil de entender; si el sistema de archivo da direcciones de archivo de 16 bits, esto nos da 2 elevado a 16 = 65.536 direcciones, que a un máximo de 32 Kb por cluster son 2.097.152 Kb, es decir, 2 GB como máximo para FAT16. ¿Quiere esto decir que no podemos usar discos de más de 2 GB? No, afortunadamente; pero implica que deberemos dividirlos en varias particiones, que son cada una de las divisiones lógicas (que no físicas) de un disco, las cuales se manejan como si fueran discos duros separados (con su propia letra de unidad e incluso con diferentes tipos de sistema de archivo si lo deseamos). Por ejemplo, un disco de 3,5 GB debe dividirse al menos en dos particiones de 2 GB o menos cada una para usarlo con FAT16.

Para FAT32 el cálculo es similar, aunque no se usan los 32 bits, sino "sólo" 28, lo que da un máximo de ¡¡2.048 GB por partición!! (2 Terabytes) usando clusters de 8 Kb. Sin duda no necesitaremos hacer más de una partición al disco...

Observe que para mantener el mismo tamaño de cluster de 4 Kb en un disco de 2 GB, en FAT16 necesitaríamos al menos 8 particiones de como mucho 255,9 MB, mientras que en FAT32 nos bastaría con una. Indudablemente, aunque no podamos instalar FAT32 resulta preferible perder algo de espacio a tener que manejar un disco subdividido en unidades "C", "D", "E", "F"... y así hasta "J".

Para terminar, tres consideraciones: primero, la ganancia de espacio al pasar de FAT16 a FAT32 es enorme, varios cientos de MB en un disco de un par de GB, y en mi opinión ésta es la mejor (y casi única) ventaja de Windows 98 frente a Windows 95 (no frente a la versión OSR-2, que ya tiene soporte para FAT32).

Segundo, ambos sistemas son incompatibles a nivel de utilidades de disco. Léase las Norton, las utilidades de defragmentación (por cierto, defragmentar es organizar un poco todos esos trozos de archivo que andan dispersos en decenas de clusters separados en el disco duro), los compresores de disco y demás. Si instala FAT32, deshágase de su software antiguo para estos menesteres o el follón puede ser enorme.

Y tercero, no son los únicos sistemas de archivo, ni mucho menos los mejores. En el caso de la FAT16 supongo que ya se lo esperaba, pero es que la FAT32 tampoco es una maravilla; por ejemplo, carece de características de seguridad implícitas en el sistema de archivo (como acceso restringido a determinados usuarios) o bien auto-compresión de los archivos, características que sí tienen sistemas más avanzados como los de Unix y Linux, el de 32 bits de OS/2 (HPFS) y el de 32 bits del mismísimo Windows NT (NTFS). ¿Por qué Microsoft inventó el FAT32 teniendo ya el muy eficiente NTFS? Misterios de la vida, amigos...