Інформаційні системи у фінансово-кредитних установах (1999)

1.3.1. Поняття та основні системи класифікації

Для того, щоб забезпечити організацію та формалізоване подання ЕКІ, її пошук і обробку, а також для скорочення обсягів оброблюваних даних потрібна їх попередня класифікація і кодування.

Класифікація — це поділ множини об’єктів на підмножини за їх схожістю або згідно з певними методами. Сукупність методів і правил класифікації та її результат становлять систему класифікації.

Об’єкт класифікації — це елемент класифікаційної множини, що має ті чи інші властивості, так звані ознаки класифікації, за якими класифікуються об’єкти.

До основних систем класифікації ЕКІ належать ієрархічна, фасетна і змішана.

Ієрархічна система класифікації (ІСК) — це система, в якій поділ множини об’єктів на підмножини виконується послідовно згідно із заданими ознаками. Тобто первинна множина об’єктів спочатку поділяється на підмножини, утворені за однією ознакою, котра може набувати різних значень. Далі кожна здобута підмножина поділяється на групи за значеннями наступної ознаки. Ці групи, у свою чергу, поділяються на підгрупи за наступними ознаками і т.д. Отже, між виділеними групами об’єктів встановлюється певна ієрархія. При цьому кожна підмножина (і об’єкт) належить лише одній вищій множині.

ІСК характеризується глибиною, тобто кількістю ступенів поділу первинної множини, або, що те саме, кількістю заданих ознак класифікації. ІСК притаманні простота, наочність, логічність побудови, добра пристосованість до ручної обробки. Проте ця система не позбавлена й недоліків. Насамперед це жорсткість структури (через фіксованість ознак і порядку їх розміщення), складність включення нових ознак, необхідність великого резерву місткості.

Фасетна класифікація полягає в паралельному поділі множини об’єктів на незалежні підмножини (класифікаційні угруповання). Послідовність створення класифікаційних угруповань задається фасетною формулою Ф = (ф1,ф2,... фn). Одні й ті самі об’єкти можуть входити до різних підмножин Хі. Наприклад:

Х1 = (Ф1,Ф2, ...,Фr);

Х2 = (Ф1,...,Фr-1);

...

Хn = (Ф1,Ф2).

Переваги фасетної системи класифікації полягають у гнучкості її структури, можливості включення нових фасет і виключення старих. До недоліків такої системи можна віднести нетрадиційність і складність її використання в разі ручної обробки даних і недостатньо повне використання місткості з огляду на те, що багато можливих комбінацій фасет не мають практичного застосування.

Змішана система класифікації передбачає використання обох згаданих щойно систем.

Зауважимо, що в ієрархічній системі класифікації на будь-якому рівні підмножини елементів не повинні перетинатися, а сума елементів усіх множин кожного рівня дорівнює кількості елементів первинної (початкової) множини. Для фасетної класифікації це не є обов’язковим, а отже, сума елементів підмножин може бути більшою за кількість елементів початкової множини. Для фасетної системи обов’язковим є неповторюваність ознак.

Вибраний метод класифікації має задовольняти такі вимоги: бути достатньо містким і повним; характеризуватися достатньою та економічно обґрунтованою глибиною (кількість ознак має бути виправданою); гнучкістю та надмірністю (можливість подальшого розширення номенклатури); забезпечувати розв’язання всіх комплексів задач; характеризуватися лаконічністю, чіткістю та ясністю класифікаційних ознак.