Область наук:
  • Комп'ютер та інформатика
  • Рік видавництва: 2006
    Журнал: Известия Південного федерального університету. Технічні науки

    Наукова стаття на тему 'Алгоритми активного розглядання в системах розпізнавання осіб для санкціонованого доступу'

    Текст наукової роботи на тему «Алгоритми активного розглядання в системах розпізнавання осіб для санкціонованого доступу»

    ?8. Бакіров Т.К. Розробка багатоагентної системи аналізу захищеності обчислювальної мережі // Проблеми техніки і технології телекомунікацій: Матер. V Міжнар. наук.-техн. конф. - 16-18 листопада 2004 року - Самара, 2004. - С.234-236.

    9. Bakirov T.K., Valeyev S.S. Multiagent Computer Network Security Analysis System // Proceedings of the 6th International Workshop on Computer Science and Information Technologies CSIT'2004, Vol.2, Budapest, Hungary, 2004, pp. 140-143.

    К.В. Калінін, М.В. Петрушан, А.І. Самарін, Д.В. Шапошников

    Росія, г. Ростов-на-Дону, НДІ нейрокібернетики ім. А.Б. Когана РГУ

    АЛГОРИТМИ АКТИВНОГО РОЗГЛЯДАННЯ В СИСТЕМАХ РОЗПІЗНАВАННЯ ОСІБ ДЛЯ санкціонованого доступу Введення

    Санкціонований доступ до об'єктів інформаційної безпеки в цілому ряді випадків виражається в фізичному обмеження проходу сторонніх осіб на територію, що охороняється. Автоматизація процедури санкціонованого доступу пов'язана із застосуванням методів ідентифікації особистості на основі аналізу її индивидуализирующих біометричних показників. Особливе місце серед цих показників займає особа, розпізнавання якого як дистантной характеристики не вимагає від тестованого людини виконання якихось додаткових процедур або маніпуляцій. Тому проблеми розпізнавання осіб присвячено безліч наукових робіт [1, 2] і ряд успішних комерційних проектів [3, 4]. Як і в будь-якій задачі аналізу цільових зображень і розпізнавання образів на підстильному тлі біометрична ідентифікація особи передбачає послідовну реалізацію алгоритмів сегментації особи (цільового об'єкта), алгоритмів його признакового опису - формування еталона, і алгоритмів розпізнавання, побудованих на формуванні міри близькості поточного опису і еталонного. Залежно від умов, що враховуються при створенні системи ідентифікації, реалізація цих трьох алгоритмічних етапів може бути здійснена різними способами. В цілому передбачається, що система ідентифікації повинна стійко функціонувати в умовах лінійних перетворень зображення, обмежених ракурсних трансформацій об'єкта ідентифікації і в певному діапазоні змін умов освітлення, пов'язаних з розташуванням джерела світла. В якійсь мірі ефективність рішення задачі ідентифікації при перерахованих умовах визначається вибором характеристик первинного простору ознак масиву. Виділення області особи здійснюється досить просто для рухомих об'єктів, коли спочатку сегментируется область руху, а потім здійснюється згортка виділених областей з набором масочний еталонів особи. Аналогічно «захоплення особи» може спроститися при початковій колірної сегментації областей зображення, але метод не працює при наявності змішаних расових груп ідентифікованих осіб. Інваріантність до умов освітлення виходить автоматично при переході від яскравості масиву зображення до масиву «діяльностей» в системах ідентифікації з використанням тривимірних моделей. Правда, подальші операції ідентифікації в тривимірному просторі з обчислювальної позиції сильно ускладнюються, а з алгоритмічної - зіставлення об'ємних образів при лінійних і ракурсів зміни, не стають простіше. В роботі розглядаються всі три етапи процедури розпізнавання осіб з використанням алгоритмів, асоційованих результатами досліджень психофізіологічних механізмів зорового сприйняття вищих тварин і людини. Зокрема, в якості первинних ознак обрані орієнтовані перепади яскравості градиентного препарату зображення [5]. орга-

    низация обробки зорового потоку подібна організації перетворень, здійснюваних сітківкою ока - неоднорідність дозволу по полю зору і об'єднання ділянок поля зору в радіальні рецептивні поля. Опис способу здійснюється шляхом його активного розглядання - формування послідовності точок фіксації «погляду» [6]. Таку організацію візуального сенсора повторюють в технічних системах і програмних моделях. Ці візуальні сенсори називаються фовеальній сенсорами. Фовеальній сенсор обов'язково повинен здійснювати розглядають руху, тому системи з рухомим сенсором називають активними системами зору (active vision).

    Первинний аналіз зображення і активний фовеальній сенсор Подання первинних зорових ознак інваріантних до контрасту і рівню освітленості зорової сцени в цій роботі, як і в багатьох роботах по машинному зору, здійснюється переходом від яскравості масиву зображення до градиентному полю [7]. У градієнтному масиві кожній точці яркостного зображення з її локальної околицею відповідають точки кодованих у напрямку OG (i, j) сверхпороговое по модулю MG (i, j) перепадів яскравості:

    OG (i, j) = ak при MG (i, j) > th

    де ak = 0 ^ 15 (крок дискретизації 22,5 °) номер інтервалу, в який потрапляє отримане напрямок градієнта перепаду яскравості в локальній області зображення, th - порогове значення модуля градієнта.

    Якщо для всього зображення обчислюється розподіл кодованих перепадів яскравості за напрямками і нормується на загальне число перепадів, то отримана гістограма розподілу орієнтацій носить назву інтегральної гістограми IG (ak) перепадів яскравості. На рис.1 представлено вихідне зображення особи (a); градієнтний препарат зображення при різних значеннях порога модуля градієнта (b, c), кожній з сверхпороговое точок градиентного препарату присвоюється одне з значень ak; на рис.1 ^) представлена ​​інтегральна гістограма розподілу орієнтованих перепадів для випадку рис.1 (с).

    Опис об'єкта у вигляді інтегральної гістограми, а точніше, фазові відносини між модами гістограми інваріантні до зсуву, повороту і масштабування. Тому такий опис, будучи стиснутим і інваріантним до лінійним трансформацій, може бути використано в якості початкового узагальненого опису образів. Деталізація опису зображення здійснюється з використанням моделі фовеальній сенсора.

    Аналізований в даний момент часу ділянку зображення характеризується координатами (i, j) напрямку погляду сенсора в системі координат зображення зорової сцени і радіусом зони уваги R. Покладається, що сенсор має центральне (фовеальній) і деяку сукупність периферичних радіальних рецептивних полів, тобто полів, в межах яких первинна зорова інформація підсумовується.

    Схематичне зображення такого сенсора представлено на рис. 2. Цей сенсор має одне центральне поле зору, центр якого збігається з напрямком його «погляду», і 16 радіальних периферичних полів

    Розподіл відгуків фовеальній орієнтаційної фільтра у вигляді сукупності матриць, що складається з нулів і одиниць, з зазначенням координат точок фіксації погляду і радіусів зон уваги є достатнім для опису довільного зорового образу, що доводиться рішенням оберненої задачі-відновлення зображення з точністю до рівня яскравості за сукупністю таких відгуків [8].

    Рис.1. Первинне перетворення яскравості зображення і гістограма розподілу орієнтованих перепадів

    орієнтація перепаду

    Мал. 2. Зона уваги фовеальній сенсора - (а), і відгук фовеальній сенсора в зоні уваги - (Ь), представлений у вигляді матриці розподілу орієнтованих перепадів по секторам радіальний рецептивних полях.

    Сегментація осіб на зображеннях із застосуванням структурно-контекстного і локально-простору ознак описів

    Як зазначалося у вступі, при вирішенні задачі розпізнавання осіб сегментація цільової області в більшості робіт здійснюється шляхом послідовного сканування різномасштабним масковим фільтром всього зображення і виділенням тих областей на зображенні, які мають максимальний відгук. Потім в виділених областях шукаються базові точки (не менше двох) для подальшого обчислення коефіцієнтів лінійного перетворення цільової області зображення і проводиться зіставлення прізнакових описів поточного зображення і еталонного, прив'язаних до єдиної системи координат.

    При використанні сприймає пристрої з матричної (піксельної) структурою, видалення і наближення об'єкта не обмежується тільки лише масштабними перетвореннями одержуваного зображення. Внаслідок кінцевої роздільної здатності матриці, навіть при поступальному об'єкт рухається у зворотному спостереження, відбуваються значні нелінійні спотворення, що не можна усунути масштабними перетвореннями результуючого зображення. Тому признаковая опис способу повинен або володіти инвариантностью до таких нелінійних спотворень, або мати різні описи для різномасштабних зображень. Таким чином, з огляду на перелічені обмеження масочний методів, нами був розроблений алгоритм сегментації особи за допомогою детектування областей очей. Алгоритм включає в себе процедуру пошуку потенційних облас-

    тей очей за допомогою порівняння інтегральних гістограм в різних частинах зображення з еталонною гистограммой. Потім для кожної виділеної області передбачуваних очей аналізується можливість того, що знайдений:

    а) центр очі при великому масштабі з використанням локально-простору ознак опису;

    б) ліве око або праве око при малому масштабі особи з використанням структурно-контекстного опису;

    У разі підтвердження центрів очей проводиться визначення координат наступних точок фіксації погляду (до 15 точок), в кожній з яких аналізується відгук фовеальній фільтра. На рис. 3 представлені результати сегментації області очей для трьох різномасштабних зображень особи (верхній ряд), причому на першому малюнку зображений одне око на складному текстурованому тлі. У нижньому ряду представлено розподіл центрів областей, в яких інтегральні гістограми схожі з еталонними (чорні точки). Прямокутником виділені підтверджені області розташування очей і локалізації особи. Можливість виділення окремих частин обличчя і наявність локально признакового опису дозволяє порівнювати частково закриті або закамуфльовані особи.

    Алгоритми розпізнавання осіб при їх квазіракурсних трансформаціях

    Для отримання признакового опису області особи, детектувати на попередньому етапі, використовувалася сукупність відгуків фовеальній фільтра (матриці розподілу орієнтацій по радіальних рецептивних полях) в 15 -20 точках фіксації, 2 з яких (центри очей) є базовими точками для побудови відносної системи координат.

    Процедура розпізнавання полягала в порівнянні сформованого простору ознак опису (сукупності відгуків фовеальній фільтрів) аналізованого зображення з ознаковими описами з бази еталонів. Відгук фільтра у вигляді матриці 16 Х 16 можна розглядати як точку в 256-вимірному просторі ознак. Тоді розбіжність відгуків Бп в п-тій точці фіксації погляду можна інтерпретувати як відстань між точками в такому просторі:

    ч 2

    Бп = 1? (М1к1 - М2к1) 2,

    V до, 1

    (1)

    Мал. 3. різномасштабних зображення осіб (верхній ряд), розподіл центрів областей, в яких інтегральні гістограми схожі з еталонними (чорні точки) і підтверджені області очі і обличчя (нижній ряд)

    де М1 - признаковая вектор еталонного опису, М2-опис поточного зображення, до, I - відповідно, номери рядка і стовпця матриці відгуку фовеальній сенсора. Відгуки вважаються ідентичними в разі якщо Б "менше фіксованого параметра Dt, що визначається експериментально. Співвідношення (1), по суті, обмежує околиця точки-відгуку гіперсферу в просторі ознак. Всі точки-відгуки, що потрапляють всередину гіперсфери, вважаються ідентичний-

    ними. Однак, часто еквіконтекстний кластер в гіперпросторі не є гіпершаром, а має іншу форму, витягнуту по деяким осях, стислу по іншим. Облік таку особливість відбивається в формулах (2).

    Dn =? ТСцСМц -M2kl) 2; при? Wkl = 256; (2)

    V k, l kl

    Коефіцієнти адаптуються в міру накопичення бази зображень «своїх» і «чужих» осіб за допомогою алгоритмів навчання за методом зворотного поширення помилки, використовуваного в нейромережевих класифікаторах [9].

    Міра близькості описів осіб Б визначається як сума заходів близькості описів в точках фіксації сенсора Б ". На рис. 4 представлені розподілу значень міри близькості описів в парах «свій-свій» і «свій - чужий» до і після адаптації коефіцієнтів для тестової вибірки з 20 зображень осіб по 10-15 передавальний кожного. Як видно з графіків вибір порогового значення величини неузгодженості Бї дозволяє вибрати потрібну установку однієї з помилок 1-го або 2-го роду. Мінімізація обох помилок відразу досягається тільки в результаті застосування процедури адаптації вагових коефіцієнтів. Слід зазначити, що формування сумарної заходи неузгодженості може також здійснюватися з використанням підстроювання вагових вкладів кожної з точок фіксації погляду, що відображає інформативність для ідентифікації тієї чи іншої частини особи.

    висновок

    Описані алгоритми, засновані на спекуляціях, асоційованих результатами психофізіологічних механізмів зорового сприйняття людини, реалізовані у вигляді спеціалізованого програмно-апаратного комплексу FACEГОENT. При тестуванні розробленого комплексу в реальних умовах були отримані наступні результати. При розмірі бази еталонних описів в 50 персон і числі тестованих осіб 150 осіб, включаючи занесених в базу, комплекс забезпечував 100% ідентифікацію «чужих» і помилкову тривогу при пропуску «свого» в 4% випадків. Час обробки і розпізнавання на базі з 150 чоловік становить до 1 с. В основі програмної частини комплексу лежить модель фовеа-ального типу FOSFI [10], що включає в себе описані вище алгоритми у вигляді окремих блоків. На рис.5 представлені чотири послідовні рівня формування опису особи в моделі Р08Р1.

    a Ь

    Мал. 4. Гістограми розподілу заходів близькості прізнакових описів особи в парах «свій-свій» і «свій-чужий» а - до процедури «навчання», Ь - після.

    Проведене дослідження показало, що перехід від яскравості зображення до градиентному дає инвариантность опису до рівня яскравості і контрасту, а інтегральне опис у вигляді гістограм сверхпороговое орієнтованих перепадів яскравості дозволяє отримати инвариантность до лінійним трансформацій аналізованого образу. Прив'язана до системи координат об'єкту (центри очей) сукупність локальних описів у вигляді відгуків фовеальній фільтрів в максимально інформативних областях особи дає можливість отримати формалізує-

    ванні досить компактні опису зображень різноманіття осіб достатньої інформаційної ємності для практичних завдань санкціонованого доступу. Таким чином, при даному поданні інформації з'являється можливість порівнювати не зображення із зображенням, а опис з описом.

    Мал. 5. Багаторівневе признаковая опис

    Робота виконана за підтримки гранту РФФД № 05-01-00689

    БІБЛІОГРАФІЧНИЙ СПИСОК

    1. WechslerH. Face Recognition: From Theory to Applications. / Springer-Verlag, 2002. - 921p.

    2. Kumar V., T. Poggio. Learning based approach to real-time tracking and analysis of faces. // Proc. of the 4-th Int. Conf. on Face and Gesture Recognition, Grenoble, France, 2000. - p.91-96.

    3. Іванов А.І. Біометрична ідентифікація особи по динаміці підсвідомих рухів: Монографія. - Пенза: Изд-во Пенз. Держ. ун-ту, 2000. 188с.

    4. Dail D.Q., G.Can, J.H. Lai, P.C. Yuen. Face Recognition Based on Local Fisher Features // T. Tan, Y. Shi, and W. Gao (Eds.): ICMI 2000, LNCS 1948 2000. - p.230-236.

    5. Гаврилей Ю.К., Самарін А.І., ШевченкоМ.А. Активний аналіз зображень в системах з фовеальній сприйняттям. // Нейрокомп'ютери: розробка, застосування. № 7-8, 2002. С.34 - 46.

    6. Ярбус А.Л. Роль руху очей в процесі зору. // М., Наука, 1965, с.166.

    7. Абду І., Претт У. Кількісний розрахунок детекторів контурів, заснованих на підкресленні перепадів яскравості з подальшим пороговим обмеженням // ТІІЕР, 1979. N »5, С.59-70.

    8. Самарін А.І., Шевченко М.А. Алгоритм автоматичного побудови описів об'єктів сцени в базисі розглядають рухів фовеальній сенсора. В зб. наукових праць Всеросійської науково-технічної конференції «Нейроінформатика - 2002». Збірник наукових праць в 2-х частинах. Ч.1. М .: МІФІ, 2002. С. 85 - 94.

    9. Осовский С. Нейронні мережі для обробки інформації. М. Вид-во Фінанси і статистика. 2002. 344с.

    10. Petrushan M. V., Samarin A. I., and Shaposhnikov D. G. FOSFI: A System for Face Image Recognition. Pattern Recognition and Image Analysis, Vol. 15, No. 2, 2005, pp. 425-427.

    І.М. Ісмаїлов, Ф.Д. Касимов, Н.Г. Джавадов

    Азербайджан, м.Баку, Національна Академія Авіації, Азербайджанське Національне Аерокосмічне Агентство

    ПІДВИЩЕННЯ ТОЧНОСТІ І ДОСТОВІРНОСТІ пілотажної-навігаційної інформації ДЛЯ БЕЗПЕЧНОЇ ПОСАДКИ ПОВІТРЯНОГО СУДНА

    На сучасному етапі розвитку авіації проблема підвищення точності і достовірності як навігаційної, так і пілотажної інформації стала пріоритетною в забезпеченні безпеки польотів. Дана проблема тісно переплітається також з діяльністю екіпажу, який приймає рішення за результатами аналізу значного обсягу інформації, часто в умовах, як дефіциту часу, так і неточної інформації. Це особливо відноситься до етапу посадки віз-


    Завантажити оригінал статті:

    Завантажити