Тарихті Өшірмеу: Веб-Мұрағат Мәселесі
Бір ай бұрын Twitter-де бір жаңалық назарыма түсті: MTV өзінің веб-сайт мұрағатын жойыпты. Мыңдаған мақала, сурет мен бейнелер бір сәтте жоқ болды. Ағылшын Twitter қайнап жатқан: біреулер ашуланса, енді біреулер мұңайған. Бірақ бұл оқиға бізге басқа бір үлкен сұрақ қояды: егер MTV сияқты алыптар өз веб-тарихын сақтай алмаса, онда қарапайым сайттар не істемек?

MTV мұрағаттың жойылғаны - бұл тек байқалған бөлігі ғана. Байланысты зерттеулер іздеп, ғаламтордың тамырын ұстап көрдім - оның халі әлсіреп барады. Pew Research орталығының мәліметтері нағыз сандық апокалипсисті хабарлайды: 2013 жылы жасалған веб-парақшалардың 38%-ы бүгінде жойылып кетіпті. Уикипедияның өзі - білімнің алтын қазынасы - шіріп кеткен жіппен тігілген көрпеге айналған: оның беттерінің 54%-ында "өлі" сілтемелер бар.
Бірақ бұл, әрине, табиғи өлім емес. Бұл - ғаламтор алаңдарындағы қырғын. Google-дың қанағаттанбайтын алгоритмдері сайттар тез ашылсын деп талап етеді. Сайттар іздеу нәтижелерде бірінші боп шығу үшін өз тарихын құрбандыққа шалуда: ескі мақалалар мен файлдар - бәрі қоқысқа кетуде.
Сонда қырылып жатқан контентті кім сақтайды? Сіз бе? Мен бе? Иә, біздің әрқайсымызда өз "сандығымыз" бар: флешкалар, хард драйвтар, Google Drive пен Notion секілді платформалар. Бірақ олардың көбі - жабық мұрағаттар, құпия бөлмелер. Бүкіл әлемде екі миллиардтан астам адам Google Drive қолданады. Бірақ шын мәнінде ашық, қолжетімді мұрағат біреу ғана, оның аты - Internet Archive. Бұл - ғаламтордың уақыт капсуласы. Бір рет басасыз да - және міне, сіз 2008 жылғы YouTube-тесіз. Тағы да бір рет - және 2001 жылғы CNN алдыңызда тұр.
Wayback Machine - ол ғаламтордың бас мұрағатшысы: ол көреді, біледі, сақтайды. Бірақ ол да кемшіліксіз емес. Ол тек сұралғанды ғана сақтайды. Ал сұралмағандар ше? Олар мәңгілікке жоғалып кетеді.
Веб-парақшаны сақтау қарапайым нәрсе көрінгенімен, мұндай ауқымды платформа құру - оңай нәрсе емес. Оның бірнеше себебі бар: Біріншіден, технологияның жылдам дамуы. Файл форматтары мен сақтау құрылғылары тез ескіреді, бұл сақталған мазмұнға қол жеткізуді қиындатады. Бүгінгі таңда оңай ашылатын файл он жылдан кейін құпия кодқа айналуы мүмкін. Екінші мәселе - сақтау орны. Ғаламтордағы ақпарат мөлшері күн санап артуда. Мұның бәрін сақтау үшін алып веб-қоймалар керек. Ал мұндай қоймаларды ұстап тұру оңай емес, әрі арзанға түспейді. Үшіншіден, ақпаратты жүйелеу қиындығы. Миллиондаған парақшаны сақтап қана қоймай, оларды дұрыс реттеу де керек. Әйтпесе, керек ақпаратты табу мүмкін болмай қалады. Соған қоса, ауқым пен қамту аясы да бар. Күн сайын өндірілетін контент көлемі мұрағаттауды барған сайын қиындатып келеді. Бұл - теңізге құйылған су тамшыларын санаумен бірдей.
Бүкіл ғаламторды мұрағаттау мүмкін еместігі анық. Алайда тіпті маңызды ақпаратты сақтау да оңайға соқпайды. Мұның айқын мысалы - өткен жылы АҚШ-та болған оқиға. Сонда федералдық сот Internet Archive мұрағат қызметіне қарсы шешім шығарды. Не болды? COVID-19 індеті кезінде Internet Archive көптеген кітаптарды цифрлық түрде көшіріп, оқырмандарға тегін таратқан. Мақсаты игі болғанымен, ірі баспагерлер мұны заңсыз деп тапты. Сот та солардың жағына шықты. Білім мен ақпаратты баршаға қолжетімді ету – игі іс. Алайда заң мен этика мұны әрдайым қолдай бермейді.
Internet Archive заң тұзағына түсті. Бірақ мұрағаттау – тек олардың міндеті емес. Ғаламтор – мың құбылған әлем. Бүгін бар сілтеме ертең жоқ болуы әбден мүмкін. Басқа ашық веб-мұрағат құрсақ қайтеді? Әрине, оған да сот тыйым салуы ғажап емес. Сонда не істейміз?
Цифрлық мұрағат – күрделі дүние. Бір жағынан, оны қолжетімді ету керек. Екінші жағынан, ақпараттың жақсылап сақталғаны да маңызды. Осы екі мақсатты қалай үйлестірсек болады? Әзірге бұл міндеттің Internet Archive-тан басқа зор үлесі университеттер мен кітапханалардың мойнында. Бірақ олардың қалталары жұқа, техникалары ескі. Мұны тағы да еске түсіргіңіз келсе, оқыған университеттің веб-порталына кіріп көріңіз - егер әрине, ондай портал бар болса.
Ал жеке компаниялар ше? Оларда қаржы да, технология да жетерлік. Бірақ олар да мінсіз емес. Пайда табуды бірінші орынға тым қатты қоюы мүмкін. Ғылыми мақалалар нарығы – осы абсурд театрының ең үздік қойылымы. Елестетіп көріңізші: ғалымдар өз еңбектерін оқу үшін ақша төлейді. Бұл – Кафканың қиялынан да асып түсетін нәрсе. (Әрине, мұндай абсурдқа қарсы тұратындар да табылды. Мысалы, қазақстандық Александра Элбакян құрған Sci-Hub – ғылыми қарақшылықтың флагманы). Екі сектор бірігіп жұмыс істесе қайтеді? Мемлекеттік жауапкершілік пен жеке инновация қол ұстасса, тамаша болар еді. Бірақ мұндай одақты дұрыс басқару – оңай шаруа емес.
Internet Archive – бұл біздің дәуіріміздің Ұлы Александрия кітапханасы. Бірақ бізде кітаптар емес, биттер мен байттар бар. Әр жоғалған сілтеме – бұл өшірілген естелік, жойылған білім. MTV сайтының құлауы – осы еритін мұзтаудың тек бір ұшы ғана.
Біз ақпараттың теңізінде жүзіп жүрміз, бірақ осы жүзетін кемемізді түзететін құралдарымыз әлі де ескі. Заң да, технология да біздің цифрлық мұрамызды қорғауға дайын емес. Бір жағынан, Internet Archive сияқты алыптар күресуде. Екінші жағынан, біз өзіміздің цифрлық ізімізді басқара алмаймыз. Мүмкін, шешім – орталықтандырылған мұрағаттан гөрі, таратылған жүйеде шығар? Әлде бізге мүлде жаңа тәсіл керек пе?
Бұл жай ғана ескі сайттар туралы емес. Болашақ тарихшылар осы заманды зерттегенде нәрселер шынымен де қалай өткенін біле алмайтын шығар. Бір нәрсе анық: егер біз әрекет етпесек, біздің тарихымыз жай ғана жоғалып кетеді.