Сохранение для (цифровых) возрастов: Цифровые архивариусы от сотрудничают с классиками, чтобы улучшить методы сохранения базы данных

Так как применение пошло живое в 2013, больше чем 5 000 исследователей использовали его, чтобы разобрать тысячи речей, найденных в Илиаде и Одиссее и исследовать различные связи от тех Бек, исследованный в ее книге.«Я получаю электронные письма от людей, во всем мире выражающих их оценку для базы данных», сказал Бек, адъюнкт-профессор Классики в Техасском университете в Остине. «Я услышал в июне от студента в Мексике, который использовал заявление написать его тезис степени бакалавра».Однако, поскольку новая сеть и возможности базы данных стали доступными, Бек находил, что он бросающий вызов обновил приложение, которое было разработано, используя технологии с 2000-х.Возможно, более беспокойно, когда браузеры изменяются и университетские веб-серверы удаляются, был шанс, что в будущем база данных могла бы быть потеряна пескам времени.

«Как классик, очень долгосрочная доступность текстов – фундаментальная предпосылка нашей всей дисциплины», объяснил Бек. «Я могу поднять рукопись от 1,000 лет назад и если я знаю, как прочитать почерк, тот ресурс все еще доступен мне. Однако я не имею ни малейшего представления, на что доступность ресурсов, которые являются в настоящее время цифровыми, будет похожа через 100 лет».

Работы, которые она написала как студент, недоступны, потому что программы письма и форматы файлов, которые она использовала, теперь устаревшие. «Я не хочу, чтобы это произошло с проектами, с которыми я связан».Она попросила помощи из Общих Библиотек Университета, которые предложили, чтобы она говорила с исследователями от Texas Advanced Computing Center (TACC) с экспертными знаниями в цифровом архивировании и сохранении.

Вместе, они приступают к развитию нового способа сохранить цифровые базы данных гуманитарных наук.На Конференции по Суставу ACM/IEEE 2017 года по Цифровым Библиотекам (JCDL) Бек наряду с Вэйцзя Сюем, исследователем в TACC, Марией Естевой, цифровым архивариусом в TACC, и И-Хсуэн Се, студентом информатики доктора философии в UT Austin, поддержанном Science & Technology Affiliates TACC для Исследования (ЗВЕЗДА) Программа Ученых, представил решение, которое сохраняет базу данных Бека речей Гомера, включая многомерные связи среди текстов и понимания Бек, развитый за годы исследования.

«Ценность данных исследований не только проживает в ее содержании, но и в том, как это сделано доступным для пользователей», сказала Естева. «Данные исследований часто представляются в интерактивном режиме через веб-приложение, дизайн которого часто является результатом лет работы исследователей. Поэтому сохранение данных и функциональностей применения становится одинаково важным».Стратегия сохранения, которую они разработали, позволяет ученым повторно начинать приложение базы данных во множестве окружающей среды – от отдельных компьютеров, к виртуальным машинам, к будущим веб-серверам – не ставя под угрозу его интерактивные функции. Это сохраняет данные отдельно из интерактивного применения, таким образом, ученые могут снова использовать его в других технических и функциональных контекстах.

Процесс эксплуатирует аспекты эмуляции и виртуализации – методы, примененные в бизнесе и технологии – но идет вне этих подходов.Это отделяет веб-кодекс от данных и повторно развертывает все применение на различных платформах, включая виртуальные машины.

У процесса есть четыре этапа:извлечение данных и кода программы;идентификация зависимостей (где один объект полагается на функцию другого объекта), и разъединение применения от данных;переразвертывание применения и утверждение его результатов; ираспределение заявления конечным пользователям.Используя этот метод, исследователь может перезагрузить применение позднее, запустив изображение виртуальной машины, которое содержит полностью функциональное применение.

Этот подход соответствует хорошо развивающейся природе цифрового сохранения и с требованиями для повторного использования данных, говорят исследователи.Для Приветствия проект обеспечил авеню, чтобы сохранить исследование, которое она провела за многие годы.Для И-Хсуэн Се это представило возможность применить принципы информатики, которые она изучает в своей программе специализации зрелому проекту стоимости сообществу классики.

Ее главная задача на проекте состояла в том, чтобы проверить алгоритм обнаружения зависимости, который определяет отношения между веб-кодексом и библиотеками, требуемыми повторно развернуть и запустить приложение.«Было захватывающе собрать идеи экспертов от различных областей», сказал Се. «Доктор Бек дал нам мотивацию, чтобы сохранить гуманность цифровые проекты. Доктор Естева, если требования и цели цифрового сохранения и доктора Сюя дали идеи об автоматизации процесса идентификации зависимостей из веб-кодекса, чтобы значительно уменьшить человеческие усилия в сохранении веб-приложения», сказала она.Команда в настоящее время работает над дальнейшей автоматизацией стадий обнаружения зависимости, чтобы сделать стратегию generalizable для других проектов и принимающей окружающей среды.

Как с любым цифровым методом сохранения, нужно все еще контролировать и иногда обновлять проект. Однако риск несовместимости ниже, потому что обновления новых веб-технологий или хостинг-услуги могут быть выполнены в любом пункте в жизненном цикле проекта от кода программы и данных.

«Я приезжаю в этот проект с точки зрения долгосрочного сохранения, но главное, которое я понял в течение работы, состоит в том, что наличие интерактивного, доступного цифрового компонента к Вашему исследованию означает, что достигает большего количества людей, и это достигает их по-разному», сказал Бек. «Это мне действительно важно и имеет стратегию сохранения в месте, которое делает ее достижимой за более длительный промежуток времени, и с более широким множеством пользователей очень важно».