Skip to content

Собрать данные портала "База данных рассекреченных дел и документов федеральных государственных архивов" (unsecret.rusarchives.ru) #26

@ivbeg

Description

@ivbeg

Цель

На портале unsecret.rusarchives.ru размещена общедоступная база рассекреченных документов. Необходимо собрать данные из этой базы и выложить их как открытые данные.

Задача

  • выбрать язык программирования Python / R или иной, на выбор
  • написать парсер для сайта unsecret.rusarchives.ru
  • выгрузить все данные в формате CSV или JSON или XML
  • загрузить набор данных на хаб открытых данных hubofdata.ru

Требования

  • открытый исходный код в Github под свободной лицензией
  • открытые данные под лицензией Creative Commons

Пожелания

  • сделать описание к выгруженным данным. Структуры данных и набора целиком.

Оценки трудоёмкости

Ожидаемое время на задачу не более 1 дня

Вспомогательные материалы:

  • База данных рассекреченных дел и документов федеральных государственных архивов http://unsecret.rusarchives.ru

Вопросы

Вопросы можно писать на ibegtin@infoculture.ru или в комментариях к этой задаче

Metadata

Metadata

Assignees

No one assigned

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions