
Декількома словами
Архів Інтернету, розташований у старій церкві в Сан-Франциско, відіграє ключову роль у збереженні цифрової історії, особливо після видалення даних федеральними установами США. Організація документує зміни, зберігає зниклі вебсторінки, бореться з "гнилими посиланнями".
В старовинній церкві Сан-Франциско, серед гудіння серверів, розмістився Архів Інтернету, який став актуальним як ніколи.
Якщо ви коли-небудь переходили за гіперпосиланням на Wayback Machine, щоб переглянути стару вебсторінку, ви вже знайомі з Архівом Інтернету. Ця некомерційна організація, заснована в 1996 році, є цифровою бібліотекою інтернет-сайтів і культурних артефактів. Вона містить сотні мільярдів копій урядових вебсайтів, новинних статей і даних. Wayback Machine — це точка доступу архіву до майже трьох десятиліть веб-історії. Але багато хто з мільйона щоденних відвідувачів, які заходять на онлайн-адресу Архіву Інтернету, можуть нічого не знати про його фізичне розташування: стару церкву Християнської науки в районі затоки.
Штаб-квартира Архіву Інтернету, вражаючий храм з білими колонами в стилі грецького відродження, височіє на південь від мосту Золоті Ворота. Біля входу в неф будівлі голосно гудуть три величезні чорні комп'ютерні сервери.
«Це і є Архів Інтернету», — сказав Марк Грем, директор Wayback Machine Архіву Інтернету, вказуючи на стеки серверів. Грем проводив щотижневу публічну екскурсію штаб-квартирою для близько дюжини відвідувачів нещодавно в березні. Він підвищив голос, щоб його було чутно за гулом комп'ютерів. «Ці машини — сервери, які зараз використовуються для запису та збереження матеріалів. Світяться індикатори — це означає, що щось записується або зчитується з цих жорстких дисків.»
Сервери в режимі реального часу записують Всесвітню павутину. Результати вражають. Щодня за допомогою автоматизованих сканерів в Архів Інтернету завантажується близько 100 терабайтів матеріалів, або близько мільярда URL-адрес. Велика частина цього потрапляє в Wayback Machine, а решта — це оцифровані аналогові медіа — книги, телебачення, радіо, наукові статті — відскановані та збережені на серверах.
Як один з небагатьох масштабних архіваторів, які створюють резервні копії Інтернету, Архів Інтернету зараз перебуває в унікальному становищі. Після інавгурації президента Трампа в січні деякі федеральні вебсторінки зникли. Хоча деякі сторінки були повністю видалені, багато з них повернулися в Інтернет зі змінами, які, за словами чиновників нової адміністрації, були внесені відповідно до указів Трампа про видалення «політики різноманітності, рівності, інклюзивності та доступності». Тисячі наборів даних були стерті — переважно в агентствах, що займаються наукою та навколишнім середовищем, — у дні після повернення Трампа до Білого дому.
Інформація про зміну клімату, репродуктивне здоров'я, гендерну ідентичність і сексуальну орієнтацію також була під загрозою. Наприклад, сторінки, що стосуються Enola Gay — літака B-29, який скинув атомну бомбу на Хіросіму і не має особливого відношення до історії ЛГБТК, — були серед списку постів, які Пентагон позначив для видалення. Деякі видалені сторінки, зокрема ті, що стосуються Enola Gay, знову з'явилися, оскільки агентства з'ясовують, як виконувати директиви Трампа.
Архів Інтернету є одним з небагатьох проєктів, які існують для того, щоб вловлювати те, що провалюється крізь цифрові щілини, і водночас робити цю інформацію доступною для громадськості. Через шість тижнів після початку роботи нової адміністрації, за словами директора Wayback Machine Грема, Архів Інтернету зафіксував близько 73 000 вебсторінок, які існували на урядових вебсайтах США і були видалені після інавгурації Трампа.
Грем зазначив, що, наприклад, Архів Інтернету наразі є єдиним місцем, де громадськість може знайти копію інтерактивної хронології подій 6 січня. Ця хронологія є продуктом комітету Конгресу, який розслідував напад на Капітолій, і з тих пір була видалена з їхнього вебсайту. Грем сказав, що збереження таких записів відповідає інтересам суспільства.
«Скільки грошей з наших податків було витрачено на це?» — сказав він, маючи на увазі хронологію та роботу комітету. «Це була нетривіальна робота, і це частина нашої історії — і лише з цієї причини вона варта збереження та вивчення, розуміння.»
Для нових президентських адміністрацій типово вносити зміни до федеральних вебсайтів. У 2008 році Архів Інтернету став співзасновником інструменту під назвою End of Term Web Archive для відстеження та резервного копіювання таких змін. Але Грем сказав, що за другого терміну Трампа масштаби та швидкість видалення урядових даних були безпрецедентними.
«Багато людей намагаються зрозуміти: «Що, чорт забирай, щойно сталося?» — сказав Грем. «Ми просто робимо свою роботу, намагаючись бути найкращою бібліотекою, якою ми можемо бути, намагаючись допомогти зберегти культурну спадщину нашого часу — зробити цей матеріал доступним і корисним для людей зараз і в майбутньому.»
З моменту другої інавгурації Трампа все більше людей звертаються до цієї некомерційної організації. За словами Грема, судячи з великого стрибка переглядів сторінок, який він спостерігав протягом останніх двох місяців, Архів Інтернету залучає набагато більше відвідувачів, ніж зазвичай — журналістів, дослідників та інших допитливих людей. Дехто хоче звернутися до архіву за інформацією, втраченою або зміненою під час чистки, а інші прагнуть зробити свій внесок у процес архівування.
«Існує хвиля підтримки Архіву Інтернету через різкі зміни, що відбуваються в частинах урядової веб-інфраструктури, які, як ви й уявити не могли, зміняться», — сказав Брюстер Кале, засновник і нинішній директор Архіву Інтернету. «Люди приходять і згуртовуються навколо нас — використовуючи його, вказуючи на речі, допомагаючи організовувати речі, надсилаючи контент для архівування — набори даних, які перебувають під загрозою або були видалені.»
Ненсі Крігер, соціальний епідеміолог з Гарвардського університету, яка порівняла чистку з «цифровим спаленням книг» в лютневому інтерв'ю, є однією з них. Вона об'єдналася з іншими вченими, щоб спробувати зберегти федеральні дані про охорону здоров'я, які нещодавно зникли з урядових вебсайтів. Вона допомогла розробити список термінів для надсилання до Архіву Інтернету, щоб допомогти в пошуку та збереженні.
«Ми хочемо зберегти дані про громадське здоров'я, які мають вирішальне значення для добробуту людей», — сказала вона.
Наприклад, зазначила вона, на сайті Центрів з контролю та профілактики захворювань є вебсторінка під назвою «Припинення гендерного насильства». У ній висвітлюються дослідження CDC, які показують, що дівчата-підлітки та молоді жінки несуть непропорційно великий тягар випадків ВІЛ у всьому світі, що зумовлено гендерним насильством і поганим доступом до медичних послуг. Сторінка, яка була доступна 16 січня до інавгурації Трампа, тепер містить напис «сторінку не знайдено».
Команда Грема працює над тим, щоб випередити майбутні чистки, намагаючись виявити та зафіксувати матеріал, який може бути підданий більшому ризику видалення, сказав він.
«Безумовно, ця адміністрація в певному сенсі полегшила нам роботу», — сказав він. «Ще в перший день вони почали ділитися термінами, словами, тематичними областями, які будуть розглядатися — такими термінами, як «DEI».»
Архів Інтернету не фіксує все. Повідомлення про ризики пташиного грипу для людей і домашніх тварин ненадовго з'явилося і зникло на вебсайті Центрів з контролю та профілактики захворювань. Грем сказав, що, схоже, Wayback Machine не встигла його зафіксувати.
«Пам'ятаю, я одразу зайшов і затамував подих: «О, чи є це у нас?» І у нас цього не було», — сказав він.
Є шанс, що він може з'явитися пізніше, можливо, через потік матеріалів, що надходять від зовнішніх учасників і партнерів. Більшість того, що Архів Інтернету завантажує в Wayback Machine, стає доступним для громадськості з мінімальною затримкою. У деяких випадках, оскільки організація співпрацює з різними партнерами в процесі архівування, існує затримка між тим, коли матеріал збирається цими партнерами, і тим, коли він стає доступним через Wayback Machine.
«Я все ще тримаю кулаки за це», — сказав Грем. Коли скраперам Архіву Інтернету не вдається захопити такі дані, він сказав, що «це можливість для нас навчитися, як ми можемо краще виконувати свою роботу». Оскільки організація працює над адаптацією, Грем сказав, що робота змушує його працювати понаднормово. «На особистому рівні це був певний спринт», — сказав він. «Я працював сім днів на тиждень протягом останніх багатьох тижнів. Я виявляю, що, буквально з моменту інавгурації, прокидаюся раніше з почуттям мети та енергії.»
Незважаючи на свою новаторську роль у цифровій сфері, команда Архіву Інтернету хоче тримати в центрі уваги людей, а не лише машини. Біля серверів стіни заставлені глиняними скульптурами — мініатюрними двійниками, які увічнюють людей, що працювали в організації.
«У нас є всі ці маленькі статуї, що, на мою думку, є способом вшанування людей, які працюють над цими колекціями», — сказав Кале. «Люди мають можливість створювати технології, які, на нашу думку, будуть нам добре служити. Важливо, щоб люди розуміли, як вони можуть брати участь, що це не щось, що відбувається з ними. Це наше.»
Авінаш Крішна, 22-річний випускник коледжу, приїхав з району Сакраменто, щоб оглянути штаб-квартиру. Він сказав, що користується послугами Архіву Інтернету близько десяти років. Екскурсія давно була в його списку справ, але нещодавній візит на сторінку Вікіпедії підняв її вище. Для нього це стало прикладом того, як він бачив, що Інтернет стає все більш залежним від інструментів архіву.
«Я не пам'ятаю сторінку, але, знаєте, значний відсоток посилань, які були в статті Вікіпедії, — це посилання на Архів Інтернету», — сказав він. «Це дуже сумно — те, що люди вважають першоджерелом, — це те, чого більше не існує.»
Крішна сумує за тим, що відомо як цифрове розкладання або «гнила ланка» — величезне кладовище неробочих посилань в Інтернеті. Це те, що ви бачите, коли стикаєтеся з «Помилкою 404» або «сторінку не знайдено». У той час як видалення адміністрацією Трампа федеральних вебсторінок є помітним прикладом проблеми розірваних зв'язків, це вже давно стало епідемією. Дослідження Pew Research Center, опубліковане минулого року, показало, що приблизно 38% вебсторінок в Інтернеті, які існували в 2013 році, були недоступні станом на 2023 рік. Згідно з дослідженням Harvard Law Review, опублікованим у 2014 році, близько половини всіх посилань, наведених у висновках Верховного суду США, більше не вели до вихідного матеріалу.
Кале, який на початку усвідомив ефемерну природу Інтернету, сказав, що швидка деградація живої мережі є серйозною загрозою для збереження історії. «Ми будуємо нашу культуру на хитких пісках», — сказав він.
Будучи гігантом з відновлення гнилих ланок, Архів Інтернету рятує в середньому 10 000 мертвих посилань, які з'являються на сторінках Вікіпедії щодня. Загалом, за даними організації, лише у Вікіпедії виправлено понад 23 мільйони неробочих посилань.
Швидке знищення даних урядових сайтів — це лише остання проблема, з якою стикається некомерційна організація. З 2020 року Архів Інтернету отримує дорогі позови про порушення авторських прав через оцифрування книг і музики, які не є суспільним надбанням. Звукозаписні компанії та видавці книг подали позови проти некомерційної організації на сотні мільйонів доларів.
Засновник Кале сказав, що дорогі судові процеси, які, за словами експертів з права, мають на меті стримування, загрожують майбутньому архіву. Зі штатом близько 120 осіб, організація мала бюджет близько 28 мільйонів доларів минулого року — менше однієї п'ятої бюджету Публічної бібліотеки Сан-Франциско. Він фінансується за рахунок великих і малих пожертвувань, а також грошей, які надходять від музеїв, бібліотек та інших установ, які платять некомерційній організації за збереження її колекцій. Крім того, організація також стала мішенню в нещодавній серії кібератак на бібліотеки.
Навіть у той час, коли Архів Інтернету перебуває під загрозою, його засновник Кале цінує те, що у штаб-квартирі велика кімната з високими серверами — джерело життєвої сили бібліотеки — залишається відкритою, на виду у всіх.
«Це як відкриті стеки», — сказав він. «Це не сховано в якомусь бункері. Це «ми». Це виглядає трохи вразливо, чи не так?» Кале сказав, що, на його думку, ця вразливість посилає повідомлення: «Ми повинні підтримувати наші інституції, інакше вони зникнуть.»