Обсуждение Алгоритма извлечения открытых данных (вопросы, предложения)
Тема в разделе "Алгоритм извлечения открытых данных", создана пользователем Служба технической поддержки, 09.06.2014
09.06.2014

Уважаемые публикаторы! Обратите внимание на разработку документа АЛГОРИТМ ИЗВЛЕЧЕНИЯ ОТКРЫТЫХ ДАННЫХ ! Данный документ является первой рабочей версией документации (Версия 1.0-dev-1) к библиотеке Opendata API, позволяющий определить важные особенности машиночитаемости метаинформации и данных, публикуемых на официальных сайтах и автоматизированных системах государственных органов в соответствии с Методическими рекомендациями.

Библиотека Opendata API разработана для извлечения открытых данных с сайтов, опубликовавших открытые данные по Методическим рекомендациям версии 2.3. Можно использовать в качестве реализации для синхронизации с Порталом открытых данных РФ (data.gov.ru).

Приглашаем всех пользователей к обсуждению документа! Вопросы и предложения можно оставлять в данной ветке Форума!

10.07.2014

Для Тульского регионального портала открытых данных http://opendata71.ru я применил такой алгоритм для извлечения данных о спортивных объектах:
1. Скачиваю json файлы по заранее определенным ссылкам.
2. Предразую json в словарь.
3. Извлекаю из словаря по ключам.
Реализовано на python 2.7 (вероятно 3 будет удобнее из-за кодировки utf-8). Подробности с кодом тут - http://tulalinux.ru/stati/63-open-data-sport1. В последствии данные предполагаю использовать для создания информера на сайте.

Инка Simb0l Ивановна Инка Simb0l Ивановна's picture
Registered:13.11.2014
13.11.2014

Уважаемые админы!
Для рядовых пользователей-как извлечь данные? Когда я наживаю "скачать", у меня автоматически открывается Internet Explorer, там неясно-или вся инфа или частично в html формате. Неужели никак больше нельзя?Есть ли возможность скачать в формате EXEL?

17.11.2014

Добрый день, можете конкретизировать свой вопрос или описать последовательность выполняемых Вами действий?

Вашуркин Максим Вашуркин Максим's picture
Registered:17.09.2016
17.09.2016

Добрый вечер.Такой же вопрос,т.к. я рядовой пользователь. Нужно узнать точное количество "сайтов и (или) страниц сайтов в сети «Интернет», на которых размещается общедоступная информация и доступ к которым в течение суток составляет более трех тысяч пользователей сети «Интернет»" Захожу в соответсвующий реестр http://data.gov.ru/opendata/7705846236-bloger, вижу актуальную версию и загружаю. Извлекаю из архива но компьютере файл формата xml. Что дальше?Как узнать точное число сайтов? Word2007 открывает файл и показывает 149 страниц...Можно как-то автоматизировано просмотреть?

Пожалуйста,ответьте побыстрее

Вашуркин Максим Вашуркин Максим's picture
Registered:17.09.2016
17.09.2016

подсказали.

24.08.2017

И мне хотелось бы понять как извлекать данные в формате json и xml.

 

Иванов Сергей Иванов Сергей's picture
Registered:05.06.2019
16.06.2019

Для 2019 года алгоритм для извлечения данных изменился или нет?