Можливості використання нейронних мереж в комп'ютеризованих системах діагностики. Сучасні методи та засоби моніторингу оперують з великою кількістю інформативних параметрів, що характеризують стан досліджуваного об'єкту. Отже, має місце велика розмірність простору діагностичних ознак, за якими будуються вирішальні правила. Тому виникає задача відбору параметрів, що будуть визначатися при проведенні моніторингу, і на основі яких будуть формуватися правила прийняття діагностичних рішень, а також задача розробки методів і алгоритмів, що дозволяють ефективно виконувати обробку даних в багатовимірному просторі ознак і не потребують значних апаратних ресурсів. Використання статистичних методів призводить до суттєвого ускладнення алгоритмів обробки інформаційних сигналів, оскільки доводиться аналізувати багатовимірні функції розподілу ймовірності та формування громіздких вирішальних правил, що значно підвищує обчислювальні витрати на реалізацію відповідного алгоритму. Побудова вирішальних правил на основі відокремлюючих гіперплощин у випадку багатовимірних лінійно нероздільних просторів розподілу діагностичних ознак призводить до розв'язання системи складних нелінійних рівнянь з великою кількістю аргументів, функціонально пов'язаних з ознаками. Вирішення таких систем при побудові відокремлюючих гіперплощин є складною задачею (з обчислювальної точки зору) і знижує ефективність роботи класифікатора. Тому при побудові систем моніторингу, необхідно застосовувати такі методи та алгоритми, які дозволяють ефективно виконувати обробку даних в багатовимірному просторі діагностичних ознак, накопичувати отриману інформацію про можливі стани виробу, визначати закономірності в зміні значень параметрів інформаційних сигналів в залежності від ступеня дефектності об'єкта, розширювати базу класів станів та уточнювати її в процесі роботи без повного переналаштування системи. Отже, дослідження, розробка та впровадження нових більш ефективних методів обробки сигналів і прийняття діагностичних рішень на сьогодення є актуальною задачею. Виходом з даної ситуації є розробка спеціалізованих систем моніторингу, ядром яких є програмний комплекс, що дозволяє змінювати структуру бази знань, доповнювати її новими знаннями для вирішення задач діагностики технічного стану при мінімальній зовнішній участі людини. Використання сучасних засобів і методів обробки експериментальних даних з метою отримання більшої кількості інформативних параметрів, виконання діагностики об'єкту контролю за умови обмеженої кількості інформації, а також використання механізму, який дав змогу забезпечити високу завадостійкість неодмінно призводить до застосування в якості апарату обробки вхідних даних штучних нейронних мереж. В системах моніторингу використання нейромережевих технологій забезпечує проведення кластерного аналізу отриманих експериментальних даних, розпізнавання стану об'єктів за інформаційними сигналами, прогнозування розвитку дефектів в часі, а також розширення власної бази знань про номенклатуру можливих станів та дефектів об'єктів в процесі роботи. Даний підхід дає можливість перейти до безеталонних методик контролю, а також виявляти і поширювати на нові діагностичні параметри причинно-наслідкові зв'язки між співвідношенням значень інформаційних параметрів об'єкту контролю і його технічним станом. Програмне забезпечення діагностичних систем, що застосовує нейромережеві технології є найбільш раціональним з точки зору складності алгоритмів та об'єму використаного обчислювального ресурсу. В задачах моніторингу навчена нейронна мережа не тільки вміє розпізнавати (класифікувати) отримані під час діагностики інформаційні сигнали і ставити відповідні діагнози, розширювати простір діагностичних ознак без суттєвого переналаштування, а й зберігає інформацію про закономірності та взаємозв'язки характеристик цих сигналів та стану об'єкта діагностики, а також може правильно класифікувати раніш невідомі інформаційні сигнали, що відповідають можливим станам об'єкта. Вибір архітектури нейронної мережі для вирішення задачі діагностики виробів. Приступаючи до розробки нейромережевого класифікатора, як правило, виникає проблема вибору оптимальної архітектури нейронної мережі. Необхідно чітко знати, який саме клас задач вирішуватиме дана діагностична система, оскільки різні архітектури нейронних мереж розроблені та призначені для вирішення конкретних груп задач. Застосування невірно вибраної архітектури може суттєво знизити ефективність класифікатора та призвести до неправильного розпізнавання стану об'єкта. Оскільки області застосування найбільш відомих парадигм нейронних мереж перетинаються, то для вирішення конкретної задачі можна використовувати різні архітектури, при цьому результати можуть виявитися однаковими. Чи буде використання однієї або іншої мережі краще і практичніше, залежить в більшості випадків від умов вирішуваної задачі. Отже для вибору кращої архітектури необхідно проводити детальні дослідження. Серед найбільш популярних і ефективних основних парадигм нейронних мереж, які застосовуються в задачах класифікації та кластерного аналізу можна виділити наступні мережі: багатошаровий персептрон, радіально-базисні нейронні мережі, нейронні мережі і карти Кохонена, мережі адаптивної резонансної теорії. Так само, для вирішення поставлених задач можуть застосовуватися гібридні нейронні мережі, що можуть поєднувати в собі різні концепції деяких базових парадигм (види нейронів, архітектуру мережі, методи навчання тощо). Типова класифікація нейронних мереж поділяє їх на два класи: мережі прямого поширення та рекурентні мережі або мережі зі зворотними зв'язками. В мережах прямого поширення нейрони розміщені шарами та мають однонапрямні зв'язки між ними, а самі мережі є статичними в тому розумінні, що у відповідь на вхідний сигнал вони виробляють одну сукупність вихідних значень, яка не залежить від попереднього стану мережі. Рекурентні мережі є динамічними, оскільки завдяки зворотнім зв'язкам в них модифікуються вхідні значення нейронів, що призводить до зміни стану нейронної мережі. В табл. 5.1 представлені найбільш поширені архітектури нейронних мереж і пов'язані з ними алгоритми навчання (список не є вичерпним). В останній колонці перераховані задачі, для яких може бути застосована кожна архітектура. Мережа певної архітектури потребує відповідного алгоритму навчання і призначена для вирішення обмеженого класу задач. Окрім розглянутих алгоритмів навчання, поширеними також є алгоритми: Adaline і Madaline, лінійний дискримінантний аналіз, проекції Саммона, аналіз головних компонент тощо. Для вибору архітектури нейронної мережі, яку можна використовувати в задачах діагностики основними передумовами є: можливість навчатись без учителя, здатність вирішувати задачі категоризації даних (кластерний аналіз) та класифікації, а також складність будови мережі та можливість розширення множини діагностичних ознак без суттєвих змін в архітектурі. З табл. 5.1 видно, що серед наведених архітектур основним вимогам задовольняють нейронні мережі Кохонена (кластерний аналіз), багатошаровий персептрон або мережа RBF (виявлення і класифікація дефектів), їх комбінації (гібридна нейронна мережа) та мережі сімейства ART, отже дані архітектури мережі можуть бути використані при вирішенні задачі діагностики виробів. Алгоритм побудови класифікатора на основі нейронних мереж виглядає наступним чином: 1) Робота з даними: підготувати вибірку навчальних прикладів, характерних для даної задачі; розбити всю сукупність даних на навчальну, контрольну і тестову множини. 2) Попереднє оброблення даних: вибрати систему ознак, характерних для даної задачі, і виконати перетворення даних відповідним чином для подачі на вхід мережі. В результаті бажано отримати лінійно роздільний простір множини даних; вибрати систему кодування вихідних значень. 3) Конструювання, навчання і оцінка якості мережі: вибрати топологію мережі - кількість шарів, число нейронів в шарах тощо; вибрати функцію активації нейронів; вибрати алгоритм навчання мережі; оцінити якість роботи мережі на основі тестової множини або іншого критерію, оптимізувати архітектуру; вибрати оптимальний варіант мережі й оцінити достовірність її роботи. 4) Застосування та діагностика: дослідити ступінь впливу різних чинників на прийняття рішення; переконатися, що мережа забезпечує необхідну достовірність класифікації, при необхідності повернутися на етап 2, змінивши спосіб представлення об'єктів або змінивши базу даних; практично використовувати мережу для вирішення поставленої задачі. Гібридна нейронна мережа. Дослідження показали, що окремо нейронні мережі Кохонена та багатошаровий персептрон повністю не вирішують задачі, які з'являються при діагностуванні виробів, оскільки для персептрона обов'язково необхідна початкова навчальна вибірка (апріорна інформація про об'єкт діагностування та можливу номенклатуру його станів чи дефектів), а мережа Кохонена не здатна виконати достовірну класифікацію дефектів у випадку існування лінійно нероздільних просторів діагностичних ознак [7, 16]. Саме тому, була розроблена спеціальна гібридна нейронна мережа, що складається з шару Кохонена та багатошарового персептрона [5, 8]. Для вирішення задачі діагностування виробів було розроблено новий алгоритм навчання даної мережі, алгоритм її функціонування та нові функціональні вузли. Архітектура даної гібридної нейронної мережі (рис. 5.1) дозволяє визначати та класифікувати стани (дефекти) об'єктів з високою достовірністю, будувати нелінійні розділяючі гіперплощини, проводити кластерний аналіз та розширювати власну базу знань в процесі функціонування. Розроблений алгоритм навчання та роботи мережі полягає в наступному. Шар нейронів Кохонена групує близькі вхідні сигнали X в кластери, а необхідна функція Y = G(X) будується на основі звичайної нейронної мережі прямого поширення (багатошарового персептрона або радіально-базисної мережі), що з'єднана з виходами нейронів Кохонена. Нейрони шару Кохонена навчаються без вчителя, на основі самоорганізації, а нейрони шарів, що використовуються для розпізнавання та класифікації, навчаються з вчителем ітераційними методами. При цьому навчальна вибірка для мереж прямого поширення формується шаром Кохонена. Запропонований алгоритм роботи нейронів Кохонена, полягає у визначенні власного центру та розміру класу, за який відповідає даний нейрон. Для відслідковування нових об'єктів та формування відповідних класів використано спеціальний блок спостереження, який у випадку появи нового об'єкта формує сигнал для виділення нового нейрона в мережі Кохонена та налаштування вагових коефіцієнтів багатошарового персептрону. Для аналізу та прийняття відповідного рішення блок спостереження приймає паралельно на свої входи інформацію з виходів нейронів Кохонена та персептрона. Таким чином, у складі розробленої гібридної нейронної мережі, обидві її складові функціонують як дві незалежні мережі. Мережа Кохонена використовується для вирішення задачі кластерного аналізу (попереднього розбиття множини об'єктів на класи), формування навчальної вибірки для подальшого навчання багатошарового персептрона і надає інформацію блоку спостереження для виявлення нового об'єкта. Багатошаровий персептрон в свою чергу навчається на основі створеної мережею Кохонена навчальної вибірки. Він використовується для вирішення задачі класифікації, дозволяє будувати нелінійні розділяючі гіперплощини і надає інформацію блоку спостереження для виявлення нового об'єкта. Також, в якості навчальної для багатошарового персептрона може використовуватись вибірка, що отримана із застосуванням математичних і статистичних методів обробки інформаційних сигналів. Робота шару Кохонена у складі гібридної нейронної мережі. Шар Кохонена [16] складається з деякої кількості M адаптивних лінійних суматорів (рис. 5.2), що діють паралельно (лінійних формальних нейронів). Всі вони мають однакову кількість входів N і отримують на свої входи один і той же вектор вхідних сигналів X = (x1,...,xN). На рис. 5.2 введено наступні позначення: xi – вхідні сигнали, сукупність усіх вхідних сигналів нейрона утворюють вектор x; wi – вагові коефіцієнти, сукупність вагових коефіцієнтів утворюють вектор W; F() – функція активації нейрона, NET – зважена сума вхідних сигналів, OUT – сигнал на виході нейрона. На виході j-го лінійного елементу формується сигнал де wji – ваговий коефіцієнт i-го входу j-го нейрона, wj0 – пороговий коефіцієнт. Для налаштування параметрів шару Кохонена використовується алгоритм навчання без вчителя. Результатом роботи мережі Кохонена є побудова відображення набору вхідних векторів високої розмірності на карту кластерів меншої розмірності таким чином, що близьким кластерам на карті відповідають близькі один до одного вхідні вектори в початковому просторі. В процесі самоорганізації на виході шару Кохонена формуються кластери (група активних нейронів певної розмірності, вихід яких відмінний від нуля), що характеризують певні категорії вхідних векторів. Після проходження шару лінійних елементів сигнали посилаються на обробку за правилом «переможець забирає все» (WTA) [11]: серед вихідних сигналів yj шукається максимальний, його номер . Остаточно, на виході сигнал з номером jmax дорівнює одиниці, а всі інші – нулю. Якщо максимум одночасно досягається для декількох jmax, то приймають всі відповідні сигнали рівними одиниці або тільки перший в списку. Дані, що подаються на входи шару Кохонена, представляються у вигляді вектора діагностичних ознак в N-вимірному евклідовому просторі, а також мають бути масштабовані для подальшої їх обробки. Вихідним результатом роботи шару Кохонена є множина класів можливих станів (дефектів) об'єкта. В подальшому, визначені класи та їх центри будуть використовуватись в якості навчальної вибірки для налаштування багатошарового персептрона. На відміну від класичної реалізації мережі Кохонена або карт Кохонена, де у зв'язку з різними розмірами класів кожен клас описують декілька нейронів мережі, в розробленій нейронній мережі було реалізовано новий алгоритм роботи нейронів Кохонена. Його зміст полягає в наступному: кожен клас характеризується власним центром та розміром, що визначається дисперсією об'єктів в середині класу. Таким чином інформація про клас (центр класу та його розмір) міститься в одному нейроні шару Кохонена, де розмір класу – це додатковий параметр нейрона. Під час роботи шар Кохонена визначає відстань до центру класу, відстань до границі класу та відношення цих двох величин. Такий алгоритм роботи дає можливість однозначно класифікувати тип стану об'єкта і віднести його до відповідного класу. Навчання такої мережі відбувається за правилом WTA. Запропонований алгоритм роботи нейронів для характеристики розміру кожного класу спрощує архітектуру нейронної мережі, підвищує швидкодію програмного забезпечення, а також зменшує апаратні витрати на реалізацію системи діагностики. Це дає можливість нарощувати кількість діагностичних ознак, що характеризують клас до якого відноситься стан об'єкту дослідження, а отже і розмірність вхідного вектора даних, без збільшення кількості нейронів мережі та без її ускладнення. Але недоліком такої моделі є зосереджена пам'ять нейронної мережі, тобто інформація про клас зберігається в одному нейроні, і його пошкодження веде до втрати інформації про весь клас. Подібний недолік було виправлено шляхом резервного запису поточних параметрів мережі. Такий підхід потребує менших витрат фізичної пам'яті комп'ютера, ніж використання додаткових нейронів і, у разі пошкодження мережі, дає можливість повністю відновити її працездатність.