Про дані реєстру АТУ

Яновський Дмитро

Доброго дня!

На підставі статей 1, 13, 19, 20 Закону України «Про доступ до публічної інформації» від 13 січня 2011 року, які надають право звертатись із запитами до розпорядників інформації щодо надання публічної інформації, прошу надати наступну інформацію (наступні документи):

З огляду на те, що саме ваше Міністерство є розпорядником даних реєстру АТУ, які представлені у вигляді відкритих даних на державному порталі https://data.gov.ua/dataset/a2d6c060-e7e...
просимо вас повідомити з якою метою в реєстрі зберігаються тисячі пустих записів(що значно впливає на об'єм даних, які попри це - пусті.
До прикладу, загальна кількість записів із пустими полями для вулиць: 80,099
Якщо навіть ми звузимо запит до БД
SELECT * FROM "ATU-09.11.2021" WHERE "STREET_NAME" = '' AND "CITY_NAME" <> '' AND "CITY_REGION_NAME" = ''
тобто тільки з наявним полем населеного пункту(так віднімемо записи про область), та з пустим полем району(віднімемо записи де вказується район міста), ми маємо 72 000 пустих записів
Так, для міста Рівного ми маємо 45 пустих записів вулиць: посилання на скріншот https://ibb.co/K5nPXTz
Така сама історія і з, наприклад, Луцьм чи Тернополем.
Це можна зрозуміти, якби у вулиць, та інших поіменованих об'єктів стояли айді чи КОАТУУ/КАТОТТГ. Тому було б зрозуміло нащо в реєстрі є просто "Рівненська область" або "м.Рівне" з пустим полем вулиці. Це був би запис про одиницю АТУ. Проте наразі потреба в такому записі зовсім не очевидна. А тим більше - 45 таких.

Така ситуація погіршує обробку даних і разом з тим викликає запитання про якість даних та роботу із ними.
Прошу повідомити причини такого набору даних, та чи буде проведено оптимізацію. Як аналітик даних стверджую що така робота займе відсили декілька...секунд.
Для моєї локальної копії реєстру це робиться отак:
DELETE FROM "ATU-09.11.2021" WHERE rowid NOT IN ( SELECT min( rowid ) FROM "ATU-09.11.2021" GROUP BY STREET_NAME, CITY_REGION_NAME, CITY_NAME, REGION_NAME, OBL_NAME);

2) у наборі даних для "с.Зелена, Вiйтовецька ТГ" та "с.Писарівка, Вiйтовецька ТГ" у слові "Вiйтовецька" чомусь використовується латинська "і". Прошу повідомити з якої причини, або виправити.

З повагою,

Яновський Дмитро

Міністерство юстиції України

1 Attachment

[ Email has no body, please see attachments ]

Офіційна скринька Головного офісу,

1 Attachment