Типовые проблемы подготовки и публикации наборов

Предъявляются следующие требования к подготовке данных для публикации на Портале открытых данных РФ.

Требований для подготовки файла к публикации в формате XML не предъявляются.  Единственное требование, чтобы файл набора проходил валидацию относительно файла структуры.

Для подготовки файла к публикации в формате CSV предъявляются 3 основных требования.

Требование №1

Файл должен содержать данные в табличном представлении

Требование №2

Таблица должна иметь плоский вид (отсутствует какая-либо иерархия, в столбцах и строках – отсутствуют объединенные ячейки)

Правильно:

Неправильно:

Требование №3

Таблица не должна содержать заголовок и иную информацию. Таблица должна начинаться с первой ячейки.

Правильно:

Неправильно:

Распространенные ошибки

Перед публикацией необходимо просмотреть файл через редактор Notepad++

Например, Вы копируете в Вашу таблицу Excel список предприятий города. Внешне все выглядит хорошо, все данные в одной ячейке.

Но если посмотреть на эту ячейку через Notepad++, то можно увидеть, что происходит разрыв строки после первого элемента списка.

При составлении файла необходимо использовать французские кавычки (ёлочки): « »

Обычные двойные кавычки используются для внутренней разметки текста, поэтому при их некорректном использовании нарушается внутренняя структура файла.

При соблюдении вышеперечисленных требований, проблем с загрузкой и конвертацией файла в машиночитаемый формат не возникнет.