Langsiktig datalagring: Hva er det beste mediet?

Fra Blu-ray-plater til magnetbånd, arkivarer leter etter et billig lagringsmedium som vil vare i århundrer.

INNE ILibrary of Congress i Washington, D.C., det er en levende tidskapsel. Det enorme lagringsanlegget, drevet av Motion Picture, Broadcasting, and Recorded Sound Division, er fylt med vokssylindere, platespillere og andre deler av datert audiovisuelt utstyr. Noen vil kanskje se det som en søppelplass med utdatert teknologi, men Stephanie Barb liker å kalle dette stedet "landet med tapte leker." 

"Vi pleide å spille plater hele tiden," sier Barb, nestleder for IT-tjenestedrift ved Library of Congress. Nå er det nesten et innfall å eie en platespiller.

Når maskiner blir foreldet, kan dataene de har, også gå tapt. Programvare og maskinvare faller ut av generell bruk ettersom nyere produkter og tjenester erstatter dem. Det er en av flere veisperringer som teknikere og arkivarer som Barb kontinuerlig møter i deres søken etter å lagre informasjon for langsiktig oppbevaring. Akkurat nå sier eksperter at det ikke er én lagringsenhet som kan lagre data for alltid. Alternativer som magnetbånd, Blu-ray Disc,

og til og med DNA kan gi stabile, men relativt midlertidige lagringsbanker der data kan leve mens bedre teknologier testes og bringes på markedet. Hvert av disse valgene har imidlertid sine egne mangler, og ingen metode er perfekt både når det gjelder kapasitet og holdbarhet, med nye innovasjoner alltid på vei.

Library of Congress, for eksempel, har et digitalt fotavtrykk på 176 000 terabyte, med nettstedskataloger med bøker, bilder, videoer og andre medier som tar opp 5350 terabyte alene (tilsvarer nesten 2 milliarder tre minutter lange MP3-filer). Akkurat nå vokser dette fjellet av data med rundt 1500 terabyte i året. Arkivarer kjemper mot tiden for å forlenge levetiden til viktige dokumenter og medier.

"En del av bevaringsprosessen er å holde operativsystemer og maskinvare oppdatert," sier Natalie Buda Smith, direktør for digital strategi ved Library of Congress.

Ingenting varer evig

Bevaring av filer i eldre medier, som LP-plater og spillkonsoller som har blitt avviklet, krever litt DIY-triksing. På biblioteket bygger arkivarer om gamle mediespillere for å gjenopprette data og overføre dem til en mer moderne form for lagring. Noen ganger utvikler teamet til og med spesialiserte teknologier. For eksempel et system kalt IRENE, som biblioteket utviklet sammen med Lawrence Berkeley National Laboratorium, leser dybden av sporene i ødelagte grammofonplater for å konvertere musikken til en digital format.

hyller med mye gammeldags opptaksutstyr
Båndspillere, platespillere og andre gamle dataleseverktøy fyller «landet med tapte leker». Library of Congress

Dette er spesielt viktig med materialet som er kvalifisert for opphavsrett, sier Barb. Bøker kan vare evig hvis de blir bevart på riktig måte, men gjenstander som sendes inn for opphavsrett på mer korrupterbart materiale, som DVDer, CDer og DVR-er, kan forringes over tid. "Det setter oss i en krise for å trekke disse dataene fra de foreldede teknologiene og bevare dem digitalt, fordi vi kommer til å miste det som er der," forklarer Barb. Siden det følger med et duplikat med hver opphavsrettsinnlevering, legger Library of Congress det vanligvis til samlingene med den hensikt å oppdatere til en mer moderne metode.

Sikkerhetskopier arbeidet ditt

Når det gjelder å bevare data for fremtiden, er det viktig å beholde konteksten som innholdet eksisterer i. «Innholdet sier: 'Her er bitene'; konteksten sier: "Her er alle de andre tingene du trenger for å forstå disse bitene," bemerker Ethan Miller, emeritusdirektør for National Science Foundations Senter for forskning i lagringssystemer. Den ekstra konteksten inkluderer metadata, programvare og maskinvare som videospillemulatorer. Det er den moderne ekvivalenten til en Rosetta-stein - en nøkkel som gir mening til skriftspråk og symboler fra fortiden.

Mye av dataene som samles inn er "født-digitalt innhold" i stedet for innhold som måtte digitaliseres, sier Buda Smith. Artefakter samlet fra internettarkivering er gode eksempler. Selv om den virtuelle-første informasjonen til slutt kan ende opp på et fysisk medium som tape, kan den leve i en rekke andre lagringsformer underveis. Å lagre flere sikkerhetskopier på forskjellige medier er også god praksis.

Holdt sammen av tape

Biblioteket bevarer mesteparten av dataene sine på et tiår gammelt medium som så langt har bestått tidens tann: enkelt og rimelig magnetbånd. Materialet er et Goldilocks-medium verdsatt for sin tetthet, dataskrivehastigheter og lave kostnader.

Selv om båndlagring har eksistert siden midten av 1900-tallet, blir den fortsatt forbedret for å presse flere og flere databiter på hver tomme bånd. Bedrifter som IBM jobber med å doble kapasiteten per kassett (til maksimalt 45 terabyte) i nyere generasjoner samtidig som formatet er relevant for fremtiden. Men tape er ikke idiotsikkert. Hvis magnetstripen er skadet eller overopphetet, kan dataene slettes. Og selv om tape er raskere å lese fra og skrive til enn flere nye medier, er ikke dataene den inneholder like lett å få tilgang til eller redigere som informasjon som er lagret på flash-stasjoner eller harddisker (HDDer).

En drivkraft

Måten du bruker data på, og hvor ofte, vil påvirke hvilke lagringsmedier som passer best. HDD-er – grunnlaget for skyinfrastruktur – er en god startløsning for små selskaper med digitale samlinger, sier Shawn Brume, IBMs lagringsstrateg. Ta filmstudioer, for eksempel.

«Vi er nesten 25 år inne i [filmingen av] filmen Stjerne krigen prequels, sier Brume. "Disney har aldri flyttet de rå opptakene fra å filme de fra digital teknologi, og har uttalt at det ikke vil gjøre det." Det er fordi å holde dem på en harddisk lager klippeopptak eller sette inn opptak, når filmskaperne bestemmer seg for å gjøre endringer, mye lettere.

Men HDD blir dyrere med tid og skala, legger Brume til, og gjør bruken til et kostbart problem med systemer som kontinuerlig pumper ut store mengder data, som autonome kjøretøy. De gjennomsnittlig førerløst bilsystem vil generere oppover 400 terabyte i året: Hvis du har millioner av biler som alle gjør det samme, vil selskaper lett bli knust av harddisker. På tvers av bransjen, den totale kostnaden for å lagre en terabyte med data på HDD-lagring med dyp tetthet (inkludert driftskostnader for infrastruktur) varierer fra omtrent $0,70 til omtrent $0,80 per måned, ifølge Brume. For bånd er det mye mindre, på omtrent $0,08 til $0,12 per måned. Så med denne metoden vil informasjonen til slutt måtte migreres til tape for rimeligere, langsiktig og offline lagring. "Det er en prosess med inntak, sortering, koordinering og kopiering til tape," sier Brume.

Hvis du ser på historien, har ingenting vært det evige mediet bortsett fra noe som er meislet på veggen i en hule

Shawn Brume, IBMs lagringsstrateg

IBM gir råd til selskaper om hvordan de kan flytte dataene sine fra HDD-er til langsiktig båndinfrastruktur hvis de trenger å hente dem i fremtiden. Men ulempen med tape, i motsetning til harddisker, er at det er ganske vanskelig å endre. Du må slette og skrive om alt selv om du bare vil endre én detalj.

Kappløpet om å få plass

En ofte oversett konkurrent kan snart gå foran tape og skylagring i det evige lagringskappløpet. Mange eksperter er enige om at Blu-ray, eller optiske polykarbonatplater, viser et enormt løfte, spesielt for å bevare data i flere tiår, og kanskje århundrer, i en urørt boks. Oppkalt etter den fiolette laseren i leseren, har dette systemet en fordel over flash eller harddisker, siden delene ikke slites ut, forklarer Miller.

Alt kommer ned til grunnleggende mekanikk. HDD-er leser eller skriver ikke særlig godt etter å ha blitt slått av for en trolldom. På samme måte har flash-stasjoner en begrenset levetid. Det er fordi elektronene i enhetens transistorer lekker ut ved bruk, passerer gjennom barrierer og endrer ladningen av materialet over måneder og år. "Det betyr at du må lese flashen med jevne mellomrom og skrive om dataene," sier Miller.

Det er der Blu-ray kan utmerke seg. Ifølge Miller er teknologien som trengs for å skanne platene relativt enkel i sin konstruksjon: Det er i utgangspunktet en motor som snurrer, en leser som går inn og ut, og en laveffektlaser. Optiske stasjoner er enda enklere enn de som brukes til magnetbånd. Et lavere prispunkt på $50 til $200 per kjøretur gjør også avtalen bedre.

For Miller koker spørsmålet om hvor data skal lagres ned til spørsmålet om hvilke teknologier som vil være tilgjengelig om 100 til 1000 år for å lese den - enten fra Blu-ray eller mer eksperimentelle former for lagring som glass og DNA.

"Hvis du ser på historien, har ingenting vært det evige mediet bortsett fra noe som er meislet på veggen i en hule," sier Brume. Men selv den informasjonen tærer på. Med hver nye oppfinnelse for journalføring – stein, papir, kode – måtte kunnskap fortsatt overføres og oversettes til neste sted. "Vi har alltid måttet administrere data," legger han til. "Det har aldri vært et evig tilfelle av noe."

Les mer PopSci+ historier.

Siste blogginnlegg

Ars Technica-guiden til mekaniske tastaturer
October 09, 2023

Unike mekaniske bryterundersjangreBedrifter og entusiaster utvikler alltid forskjellige spinn på den mekaniske bryteren. Igjen, du kan gå ned i et ...

Drop Signature Series Islay Night praktisk: Et tastatur uten piler på $349
October 10, 2023

Høye taster møter skarpe, taktile brytereForstørr/ F- og J-tastene er spesielt diskede. Scharon HardingDet kanskje mest slående med tastaturet er t...

Advokatkonflikt kan være til fordel for Activision Blizzard i trakasseringssøksmål [Oppdatert]
October 07, 2023

Forstørr/ Activisions kontorer i Los Angeles.Getty bilder52 med Oppdatering 21. oktober: I et svar inngitt til retten onsdag kaller California DFEH...