Новости из архива

Share ideas, strategies, and trends in the crypto database.
Post Reply
mostakimvip04
Posts: 70
Joined: Sat Dec 21, 2024 7:21 am

Новости из архива

Post by mostakimvip04 »

Меня особенно интересует коллекция Recap, потому что она обширна, полезна и представляет собой интересный пример самоформирующегося архива. Этот набор судебных документов в электронном виде взят из базы данных Pacer правительства США . Когда юристы подают документы в федеральный суд, они представляют их в электронном виде, например, в формате PDF, документа Microsoft Word или отсканированного бумажного документа. Документы, которые можно опубликовать, попадают в базу данных Pacer, которая находится в свободном доступе.

Ну, не совсем бесплатно. Правительство продаёт доступ к этим публичным Магазин документам по десять центов за страницу , при этом лимит на количество документов составляет три доллара. Это кажется справедливой ценой для тех, кому нужно всего несколько документов, но она непомерно высока для тех, кому требуется огромное количество данных для исследования.

И это подводит нас к Recap (написано наоборот). Группа учёных и активистов придумала гениальную схему, позволяющую сделать судебные документы общедоступными и бесплатными, а также принести пользу отдельным пользователям, которые делают этот проект возможным.

Они создали плагин для браузера Firefox , который отслеживает, когда посетитель ищет информацию на сайте Pacer. Если искомый пользователем судебный документ доступен в коллекции Recap Интернет-архива, его можно скачать бесплатно. Если исследователь платит и скачивает судебный документ с сайта Pacer, он автоматически добавляется в коллекцию Recap.

В результате Интернет-архив хранит обширную базу данных, содержащую более 700 000 судебных дел. Эта коллекция, насчитывающая миллионы и миллионы документов, находится в общедоступном архиве и может свободно использоваться в исследовательских целях.

Эта автоматическая загрузка в Интернет-архив стала новым применением нашего интерфейса, подобного S3. Она потребовала терпения и отладки, пока программисты из Принстона и сотрудники Интернет-архива устраняли неполадки. Благодаря кропотливой работе система работает практически без участия оператора уже три года. Самый популярный на данный момент иск связан со спором о товарных знаках Apple Computer и Samsung; за последнюю неделю его скачали 1100 раз. Самый популярный иск был скачан почти 35 000 раз.

Мы рады возможности внедрить поддержку независимых архивов в компьютерные приложения и предложить массовый доступ к материалам для самых разных целей, выходящих за рамки того, что предполагали создатели баз данных. Мы надеемся, что больше сервисов будут поддерживать архивы.
Post Reply