Інформаційні системи і технології в статистиці (2003)

5.3. Автоматизоване оброблення статистичних даних обстежень умов життя домогосподарств

Обстеження умов життя домогосподарств здійснюється відповідно до вимог таких міжнародних стандартів:

застосування принципу територіального, ймовірнісного відбору при формуванні мережі домогосподарств, яким пропону- ється взяти участь в обстеженні;

добровільна згода домогосподарств на участь в обстеженні;

періодична заміна (ротація) респондентів (домогосподарств);

розповсюдження даних вибіркового обстеження на генеральну сукупність, якою є все населення України.

Головними напрямами, за якими ведеться щоквартальне спостереження, є вивчення:

структури споживчих витрат домогосподарств (грошових витрат на придбання продовольчих, непродовольчих товарів та оплату послуг);

структури інших витрат (матеріальної допомоги іншим домогосподарствам, витрат, пов’язаних з веденням особистого підсобного господарства, з придбанням нерухомості, будівництвом, формуванням заощаджень тощо);

значення особистого підсобного господарства для формування рівня матеріального добробуту домогосподарства (надходження та використання продукції особистого підсобного господарства для власного споживання, отримання грошових коштів від їх продажу);

структури доходів і джерел інших надходжень у домогосподарство (окремо вивчаються доходи, які отримує кожен член домогосподарства);

доплати, пенсії, стипендії, допомоги по безробіттю, а також ті види доходів, які надходять до домогосподарства в цілому (допомоги на дітей, допомоги від родичів та інших осіб, доходи від продажу нерухомості та майна, субсидія на оплату житла та комунальних послуг, використання заощаджень).

Вхідною інформацією для збирання інформації щодо загальної характеристики є такі документи:

1) «Контрольна картка домогосподарства»;

2) «Запитальник основного інтерв’ю». Опитування домогосподарства проводиться на початку обстеження за програмою відповідного запитальника стосовно загальних характеристик домогосподарства: його складу, житлових умов, наявності та використання земельних ділянок, худоби та птиці, антропометричних даних, рівнів освіти та статусів зайнятості його членів. Крім того, інтерв’юер заповнює контрольну картку складу домогосподарства, в якій протягом усього обстеження спостерігаються зміни в його складі.

Спостереження за витратами і доходами домогосподарств протягом кварталу здійснюється за допомогою:

1) щоденника поточних витрат домогосподарств;

2) квартального запитальника про витрати та доходи домогосподарства. Щоденник поточних витрат заповнюється безпосередньо домогосподарством двічі на квартал. У ньому респонденти (домогосподарства) щоденно записують усі витрати та надають їх детальний опис (наприклад, щодо куплених продуктів харчування — опис продукту, його вага та вартість, місце купівлі). Крім того, у щоденнику домогосподарство вказує інформацію про щоденне споживання продуктів, вироблених в особистому підсобному господарстві або отриманих у подарунок. У перший місяць після звітного кварталу здійснюється збирання даних щодо значних і нерегулярних витрат, пов’язаних, зокрема, з купівлею продуктів харчування для споживання протягом тривалого періоду часу (мішків та ін.), а також щодо доходів домогосподарства. Оскільки домогосподарствам складно пригадати всі витрати та доходи за квартал, вони заносять їх протягом кварталу в «Журнал квартальних витрат».

Одноразові тематичні опитування здійснюються за допомогою анкет під час проведення квартального опитування. У 2001 р. тематичні опитування стосувалися:

витрат домогосподарств на будівництво й ремонт житла та господарських будівель;

наявності в домогосподарствах товарів тривалого користування та стану здоров’я членів домогосподарств;

заборгованості членам домогосподарств із виплати зарплати, пенсій, стипендій, допомог, компенсацій тощо, заборгованості домогосподарств за житлово-комунальні послуги;

самооцінювання домогосподарствами рівня доходів.

Передавання звітності здійснюється: на реґіональному рівні — нарочним і засобами електронного зв’язку, на державному рівні — засобами електронного зв’язку у вигляді текстового файла.

Вихідні форми задачі формуються тільки на державному рівні у вигляді бюлетеня (збірника). Збірник складається з трьох частин. Частина перша містить: інформацію щодо програми обстеження, принципів формування вибіркової сукупності; методологічні пояснення щодо оцінки якості даних; методичні пояснення щодо основних термінів та системи показників, які характеризують стан матеріального добробуту домогосподарств, а також підсумки обстеження в цілому по Україні. У другій частині збірника наводяться дані щодо витрат і доходів домогосподарств в розрізі реґіонів — Автономної Республіки Крим, областей, міст Києва та Севастополя. Основні таблиці: «Оплата населенням житлово-комунальних послуг», «Розподіл домогосподарств за самооцінкою їх матеріальної забезпеченості», «Структура витрат домогосподарств», «Структура грошових витрат», «Структура грошових доходів і сукупних ресурсів». У третій частина збірника подається аналогічна інформацію щодо стану матеріального добробуту домогосподарств в розрізі економічних районів.

Нормативно-довідкова інформація складається з локальних довідників, які використовуються для класифікації респондентів і кодування питань обстеження. У цій задачі використовуються довідники: реґіонів, типів населених пунктів, родинних зв’язків членів домогосподарства, причин зміни складу домогосподарства, видів зайнятості, форм власності, галузей економіки, в яких працюють члени домогосподарств, видів діяльності.

Опитування відібраних для обстеження домогосподарств виконують економісти з обстеження домогосподарств (інтерв’юери), які є штатними працівниками реґіональних управлінь статистики. Кожний інтерв’юер проводить спостереження 20—28 домогосподарств. Оброблення матеріалів обстеження здійснюється централізовано в управлінні обстеження умов життя домогосподарств Держкомстату України разом з відділом обстеження умов життя домогосподарств ГМУС у місті Києві.

Вибіркове обстеження умов життя домогосподарств проводиться в усіх реґіонах країни. Вибіркова сукупність домогосподарств, які обстежуються, репрезентує все населення України, за винятком військовослужбовців строкової служби, осіб, що знаходяться в місцях позбавлення волі, осіб, які постійно проживають у будинках-інтернатах, будинках для осіб похилого віку, гуртожитках (крім сімейних). Збирання інформації та формування бази даних виконується на реґіональному рівні. Контроль та формування бази даних для розв’язання задачі здійснюється в міжреґіональному управлінні статистики. Оброблення інформації проводиться на державному рівні в Держкомстаті України за такою технологією:

1. Уведення інформації з Контрольної картки домогосподарства і Запитальника основного інтерв’ю. Дані вводяться у файли SYBASE;

2. Візуальний контроль первинних даних;

3. Передання інформації в Міжреґіональне управління статистики засобами електронної пошти;

4. Формування на підставі отриманих даних основного інтерв’ю реєстру об’єктів обліку;

5. Уведення інформації з документів «Щоденник поточних витрат домогосподарств», «Квартальний запитальник про витрати та доходи домогосподарства». Дані вводяться у файл SYBASE;

6. Передання інформації в Міжреґіональне управління статистики засобами електронної пошти;

7. Конвертація вибраних розділів файлів СКБД в текстовий формат з допомогою спеціального програмного забезпечення;

8. Конвертація текстових файлів у формат пакета SPSS;

9. Контроль отриманої інформації засобами пакета SPSS. Використовується синтаксичний, логічний та фрагментальний контроль. Фрагментальний контроль здійснюється вручну. Для його проведення виконується сортування масиву засобами пакета SPSS за визначеними ознаками, потім аналізуються максимальні чи мінімальні значення ознак. Так, наприклад, сортування може відбуватися за значенням суми витрат у порядку зменшення цих сум. Потім перевіряються дані по доходах з метою з’ясування відповідності доходів і витрат;

10. Передання даних у Комітет статистики;

11. Виконання розрахунків засобами пакета SPSS;

12. Формування таблиць для бюлетенів. Розроблення підсумків обстежень здійснюється:

за типами місця проживання домогосподарств (міські поселення, сільська місцевість). При цьому міста поділяються на великі (з чисельністю населення 100 тис. осіб і більше) та малі (з чисельністю населення менше 100 тис. осіб);

залежно від чисельного складу домогосподарств (одна, дві, три, чотири, п’ять і більше осіб);

залежно від числа дітей у складі домогосподарств (одна дитина, двоє, троє, четверо і більше дітей);

залежно від числа дорослих осіб у складі домогосподарств з дітьми (одна, дві, три і більше особи);

залежно від складу домогосподарств без дітей (домогосподарства з однієї особи: у працездатному та непрацездатному віці; домогосподарства з двох і більше осіб: усі у працездатному віці, у працездатному і непрацездатному віці, всі у непрацездатному віці);

залежно від наявності та чисельності працюючих осіб у складі домогосподарств (домогосподарства, в яких немає працюючих; домогосподарства, в яких є одна, дві, три і більше працюючих осіб);

залежно від віку та статі особи, яка очолює домогосподарство (голови домогосподарства);

у групуваннях залежно від розміру середньодушових грошових і сукупних витрат домогосподарств.

При аналізі якості оцінок показників, побудованих на основі даних вибіркового обстеження, вирішальне значення для правильності інтерпретації результатів та для контролю оптимальності дизайну вибірки має інформація: по реґіонах; по економічних районах;

13. Оцінювання якості отриманих статистичних даних за формулою



Найбільш наочно характеризують якість даних вибіркових обстежень такі показники: гранична похибка вибірки LSE та відносна стандартна похибка вибірки RSE (або коефіцієнт варіації СV).

Величина граничної похибки вибірки LSE визначає межі довірчого інтервалу для оцінки показника. Вона розраховується за формулою

LSE = t – SE,

де t — довірче число (квантиль нормального розподілу або квантиль розподілу ймовірностей), яке визначає співвідношення граничної та стандартної похибки за даної ймовірності p (p — імовірність того, що похибка вибірки для оцінювання показника не перевищить величину LSE). Типові значення l, які застосовуються при аналізі даних вибіркових обстежень: 0,67 (для p = 0,50), 1,28 (для p = 0,80), 1,64 (для p = 0,90), 1,96 (для p = 0,95), 2,58 (для p = 0,99).

Гранична похибка вибірки використовується для побудови довірчих границь оцінок (границь довірчих інтервалів). Наприклад, для побудови нижньої уI та верхньої у^ довірчих границь інтервальної оцінки середнього значення у використовуються формули

Y – Y – LSE;

Y – Y + LSE.

Відносна стандартна похибка вибірки RSE (або коефіцієнт варіації CV) розраховується за формулою:

RSE =(SE/y) × 100( %).

Відносна стандартна похибка часто використовується як показник придатності даних для аналізу. Так, якщо RSE < 5 %, то оцінка вважається надійною, якщо 5 % < RSE < 10 % — оцінка є придатною для кількісного аналізу, але її надійність недостатньо висока, якщо 10 % < RSE < 25 %, то оцінка придатна лише для якісного аналізу і її слід використовувати обережно (але іноді публікують дані, для яких RSE сягає 30—40 %).