Цель
На портале Минприроды опубликованы государственные доклады http://www.mnr.gov.ru/regulatory/list.php?part=1257 в которых приведены цифры и таблицы с состоянием минирально-сырьевых ресурсов по территориям, городам и индикаторам
Необходимо проанализировать эти отчёты, спроектировать структуры данных и извлечь данные из докладов и выложить их как открытые данные.
Задача
- выбрать язык программирования Python / R или иной, на выбор
- проанализировать структуру докладов и описать её
- написать парсер для докладов http://www.mnr.gov.ru/regulatory/list.php?part=1257
- выгрузить все данные в формате CSV или JSON или XML
- загрузить набор данных на github и на хаб открытых данных hubofdata.ru
Требования
- открытый исходный код в Github под свободной лицензией
- открытые данные под лицензией Creative Commons
- загрузить данные на Хаб открытых данных https://hubofdata.ru
Пожелания
- сделать описание к выгруженным данным. Структуры данных и набора целиком.
Оценки трудоёмкости
Ожидаемое время на задачу не более 3 недель
Вспомогательные материалы:
Вопросы
Вопросы можно писать на ibegtin@infoculture.ru или в комментариях к этой задаче
Цель
На портале Минприроды опубликованы государственные доклады http://www.mnr.gov.ru/regulatory/list.php?part=1257 в которых приведены цифры и таблицы с состоянием минирально-сырьевых ресурсов по территориям, городам и индикаторам
Необходимо проанализировать эти отчёты, спроектировать структуры данных и извлечь данные из докладов и выложить их как открытые данные.
Задача
Требования
Пожелания
Оценки трудоёмкости
Ожидаемое время на задачу не более 3 недель
Вспомогательные материалы:
Вопросы
Вопросы можно писать на ibegtin@infoculture.ru или в комментариях к этой задаче