Довгострокове зберігання даних: який найкращий носій?

Від дисків Blu-ray до магнітної стрічки архівісти шукають дешеві носії інформації, які прослужать століття.

ВСЕРЕДИНІБібліотека Конгресу у Вашингтоні, округ Колумбія, є жива капсула часу. Величезне сховище, яким керує Відділ кіно, радіомовлення та звукозапису, заповнене восковими циліндрами, програвачами та іншим застарілим аудіовізуальним обладнанням. Хтось може сприймати це як звалище застарілих технологій, але Стефані Барб любить називати це місце «країною втрачених іграшок».

«Раніше ми постійно грали записи», — каже Барб, заступник директора з операцій з ІТ-служби Бібліотеки Конгресу США. Зараз володіння програвачем – це майже примха.

Коли машини застарівають, дані, які вони зберігають, також можуть бути втрачені. Програмне та апаратне забезпечення виходить із загального використання, оскільки нові продукти та послуги замінюють їх. Це одне з кількох перешкод, з якими техніки та архівісти, такі як Барб, постійно стикаються у своєму прагненні зберегти інформацію для тривалого збереження. Експерти кажуть, що зараз немає жодного пристрою зберігання даних, який міг би зберігати дані вічно. Такі варіанти, як магнітна стрічка, диск Blu-ray,

і навіть ДНК може забезпечити стабільні, але відносно тимчасові банки зберігання даних, у яких можуть зберігатися дані, поки кращі технології тестуються та виводяться на ринок. Однак у кожного з цих варіантів є свої недоліки, і жоден із методів не є ідеальним з точки зору як потужності, так і довговічності, а нові інновації завжди на горизонті.

Бібліотека Конгресу, наприклад, має цифровий слід 176 000 терабайт, на веб-сайті якого є каталоги книг, фотографій, відео та інших носіїв, які займають лише 5350 терабайт (еквівалент майже 2 мільярдів трихвилинних файлів MP3). Зараз ця гора даних зростає приблизно на 1500 терабайт на рік. Архівісти змагаються з часом, щоб продовжити життя важливих документів і носіїв.

«Частиною процесу збереження є підтримка операційних систем і апаратного забезпечення в актуальному стані», — каже Наталі Буда Сміт, директор із цифрової стратегії Бібліотеки Конгресу.

Ніщо не вічне

Зберігання файлів на старих носіях, як-от платівки та ігрові консолі, які були зняті з виробництва, потребує трохи майстрування своїми руками. У бібліотеці архівісти переробляють старовинні медіаплеєри, щоб відновити дані та перенести їх на сучаснішу форму зберігання. Іноді команда навіть розробляє спеціальні технології. Наприклад, система під назвою IRENE, яку бібліотека розробила спільно з Національною бібліотекою імені Лоуренса Берклі Лабораторія зчитує глибину канавок у розбитих фонографічних платівках, щоб перетворити музику на цифрову формат.

полиці з великою кількістю старого звукозаписувального обладнання
Магнітофонні деки, програвачі та інші старовинні інструменти для читання даних наповнюють «країну втрачених іграшок». Бібліотека Конгресу

Це особливо важливо для матеріалів, на які поширюється авторське право, каже Барб. Книги можуть зберігатися вічно, якщо вони належним чином зберігаються, але елементи, подані на захист авторських прав на більш пошкоджені матеріали, як-от DVD-диски, компакт-диски та відеореєстратори, з часом можуть погіршитися. «Це ставить нас у кризу, щоб отримати ці дані з цих застарілих технологій і зберегти їх у цифровому вигляді, тому що ми втратимо те, що там є», — пояснює Барб. Оскільки з кожним поданням про авторські права надається дублікат, Бібліотека Конгресу зазвичай додає його до колекцій з наміром оновити до сучаснішого методу.

Резервне копіювання вашої роботи

Коли йдеться про збереження даних на майбутнє, важливо зберегти контекст, у якому існує вміст. «У вмісті сказано: «Ось фрагменти»; контекст говорить: «Ось усе інше, що вам потрібно, щоб зрозуміти ці деталі», — зазначає Ітан Міллер, почесний директор Національного наукового фонду Центр досліджень систем зберігання. Додатковий контекст включає метадані, програмне та апаратне забезпечення, наприклад емулятори відеоігор. Це сучасний еквівалент Розеттського каменю — ключа, який надає значення письмовим мовам і символам минулого.

Багато даних, які зараз збираються, є «вродженим цифровим контентом», а не контентом, який потрібно було оцифрувати, каже Буда Сміт. Гарними прикладами є артефакти, зібрані з інтернет-архівів. Навіть незважаючи на те, що перша віртуальна інформація може зрештою опинитися на фізичному носії, як-от стрічка, вона може зберігатися в різних інших формах зберігання. Збереження кількох резервних копій на різних носіях також є хорошою практикою.

Скріплені скотчем

Бібліотека зберігає більшість своїх даних на носії десятиліть давності, який досі витримав випробування часом: простій і доступній магнітній стрічці. Цей матеріал є середнім золотоволоски, який цінується за його щільність, швидкість запису даних і низьку вартість.

Незважаючи на те, що стрічкове зберігання існує з середини 1900-х років, воно все ще постійно вдосконалюється, щоб стискати все більше і більше бітів даних на кожен дюйм стрічки. Компанії як IBM, працюють над подвоєнням ємності на картридж (максимум до 45 терабайт) у новіших поколіннях, зберігаючи актуальність формату для майбутнього. Але стрічка не надійна. Якщо магнітна стрічка пошкоджена або перегріта, дані можуть бути стерті. І хоча стрічка швидше для читання та запису, ніж новітні носії, дані, які вона містить, не так легко отримати доступ або редагувати, як інформацію, що зберігається на флеш-накопичувачах або жорстких дисках (HDD).

Рушійна сила

Те, як ви використовуєте дані та як часто, впливатиме на те, які носії інформації найкраще підходять. Жорсткі диски — основа хмарної інфраструктури — є хорошим початковим рішенням для невеликих компаній із цифровими колекціями, — каже Шон Брум, стратег IBM зі зберігання даних. Взяти, наприклад, кіностудії.

«Ми майже 25 років [знімали] фільм Зоряні війни приквелів», — каже Брум. «Дісней ніколи не переміщував необроблені кадри з цифрових технологій, і заявив, що цього не робитиме». Це тому, що Зберігаючи їх на жорсткому диску, потрібно вирізати або вставляти відзнятий матеріал, коли кінематографісти вирішать внести зміни, легше.

Але жорсткий диск стає дорожчим із часом і масштабом, додає Брум, що робить його використання дорогим клопотом із системами, які постійно викачують великі пакети даних, як автономні транспортні засоби. The середня система безпілотного автомобіля генеруватиме більше 400 терабайт на рік: якщо у вас є мільйони автомобілів, які працюють однаково, тоді компанії легко розгромлять жорсткі диски. Загальна вартість зберігання в галузі За даними Брума, терабайт даних на жорсткому диску (включаючи витрати на роботу інфраструктури) коливається приблизно від 0,70 до приблизно 0,80 доларів на місяць. Для стрічки це набагато менше, приблизно від 0,08 до 0,12 долара на місяць. Отже, за допомогою цього методу інформацію зрештою потрібно буде перенести на стрічку для дешевшого, довгострокового та автономного зберігання. «Це процес прийому, зіставлення, координації та копіювання на стрічку», — каже Брум.

Якщо ви подивитеся на історію, ніщо не було вічним засобом, крім того, що висічено на стіні в печері

Шон Брум, стратег IBM зі зберігання даних

IBM консультує компанії щодо того, як перенести свої дані з жорстких дисків на довгострокову стрічкову інфраструктуру, якщо їм знадобиться отримати їх у майбутньому. Але недоліком стрічки, на відміну від жорстких дисків, є те, що її досить важко переробити. Ви повинні стерти і переписати все, навіть якщо ви хочете змінити одну деталь.

Гонка, щоб звільнити простір

Претендент, якого часто забувають, незабаром може випередити стрічкове та хмарне сховище в гонці вічного сховища. Багато експертів погоджуються, що Blu-ray, або полікарбонатні оптичні диски, мають величезні перспективи, особливо для збереження даних протягом десятиліть, а може й століть, у недоторканій коробці. Названа на честь фіолетового лазера в зчитувальному пристрої, ця система має перевагу перед флеш-пам’яттю або жорсткими дисками, оскільки деталі не зношуються, пояснює Міллер.

Все зводиться до базової механіки. Жорсткі диски не читають і не записують дуже добре після вимкнення на заклинання. Так само флеш-накопичувачі мають обмежений термін служби. Це тому, що електрони в транзисторах пристрою витікають під час використання, проходячи через бар’єри та змінюючи заряд матеріалу протягом місяців і років. «Це означає, що вам доведеться час від часу зчитувати флеш-пам’ять і переписувати дані», — каже Міллер.

Ось де Blu-ray може досягти успіху. За словами Міллера, технологія, необхідна для сканування дисків, відносно проста за своєю конструкцією: в основному це двигун, який обертається, зчитувач, який входить і виходить, і лазер малої потужності. Оптичні приводи навіть простіші, ніж ті, що використовуються для магнітних стрічок. Нижча ціна від 50 до 200 доларів за диск також підсолоджує угоду.

Для Міллера питання про те, де зберігати дані, зводиться до питання про те, які будуть технології доступний через 100-1000 років для читання — чи то з Blu-ray, чи з більш експериментальних форм зберігання, як-от скло і ДНК.

«Якщо ви подивитеся на історію, ніщо не було вічним засобом, окрім того, що висічено на стіні в печері», — каже Брум. Але навіть ця інформація роз'їдає. З кожним новим винаходом для ведення записів — каменем, папером, кодом — знання все одно потрібно було передавати у спадок і перекладати на інше місце. «Нам завжди доводилося керувати даними», — додає він. «Ніколи не було вічності».

Читати далі PopSci+ історії.

Остання публікація в блозі

До річок і лісів: електричний гірський велосипед Specialized
September 25, 2023

ІнтерфейсВелосипед має вбудований дисплей над перемикачем увімкнення/вимкнення, але він показує лише рівень заряду акумулятора та допоміжний рівень...

Lucid надає Air спортивного вигляду, запускає новий суббренд Sapphire
September 25, 2023

Збільшити/ Lucid Air Sapphire був розроблений для роботи навколо іподрому.Ясний128 з У п’ятницю на Monterey Car Week стартап Lucid, що займається в...

Ілон Маск підняв акції Tesla твітом про можливий викуп
September 25, 2023

Збільшити/ Ілон Маск у 2015 році.ODD ANDERSEN/AFP/Getty Images252 з Генеральний директор Tesla сколихнув фондовий ринок у вівторок з твіт припускаю...