В роботі розглянуті методи обчислення характеристик зображень, які застосовуються для ефективної організації контекстного пошуку.

Анотація наукової статті з комп'ютерних та інформаційних наук, автор наукової роботи - Цеглярів А.П., Ляшева С.А., Шлеймовіч М.П.


Область наук:

  • Комп'ютер та інформатика

  • Рік видавництва: 2014


    Журнал: Вісник Казанського технологічного університету


    Наукова стаття на тему 'Контекстний пошук зображень'

    Текст наукової роботи на тему «Контекстний пошук зображень»

    ?004.932

    А. П. Кирпичников, С. А. Ляшева, М. П. Шлеймовіч

    Контекстного пошуку ЗОБРАЖЕНЬ

    Ключові слова: контекстний пошук зображень, міри схожості зображень, колірні характеристики, текстурні характеристики, характеристики форми, характеристики об'єктів, системи контекстного пошуку.

    В роботі розглянуті методи обчислення характеристик зображень, які застосовуються для ефективної організації контекстного пошуку.

    Keywords: content-based image retrieval, images similarity measure, color characteristics, texture characteristics, the characteristics of shape, characteristics of the objects, content-based image retrieval system.

    In this paper discusses methods for calculating the characteristics of the images that are used for the efficient organization of content-based image retrieval.

    В даний час пошук зображень є актуальною областю теоретичних і практичних розробок. Він застосовується, наприклад, в системах дистанційного зондування Землі, електронної комерції, медичної діагностики, забезпечення безпеки та ін.

    Найбільш ефективні по співвідношенню точності і часу системи контекстного пошуку зображень, в яких запитом є деяке зображення або набір його характеристик і потрібно знайти в заданій базі зображень (колекції) зображення, максимально схожі на запит відповідно до обраної мірою подібності.

    Міри схожості зображень визначаються на портретному, композиційному або семантичному рівнях [1]. У першому випадку шукаються зображення, максимально близькі до запиту. При використанні міри схожості на композиційному рівні зображення розглядається як сукупність пікселів, а не безліч зображень об'єктів. Семантичний рівень відповідає пошуку зображень, що містять шукані об'єкти, які є в запиті.

    Для визначення міри схожості зображень використовуються їх характеристики, які умовно можна розділити на чотири основні групи: характеристики кольору, характеристики текстури, характеристики форми і характеристики об'єктів [2].

    Серед різних колірних характеристик найбільш часто використовуються гістограма квітів, вектор колірної зв'язності, коррелограмм квітів, колірні моменти, дескриптор домінантного кольору [3].

    Колірна гістограма обчислюється в результаті підрахунку числа пікселів на зображенні або його області, що потрапляють в певні квантовані осередки в деякому колірному просторі, наприклад, RGB. Перевагою колірних гістограм є простота і висока швидкість їх отримання, вони мало залежать від перетворень перенесення, повороту і малих нахилів щодо оптичної осі, масштабування і часткового перекриття об'єктів. Однак дані характеристики можуть бути чутливі до напрямку спостереження і масштабом, оскільки відносне мале число пікселів певного кольору може при цьому різко змінитися. Слід також зазначити, що

    в гістограмі квітів не фіксується місце розташування пікселів один щодо одного, тобто одна і та ж гістограма може бути отримана для різних зображень [1].

    Найпростіший метод побудови колірної гістограми передбачає об'єднання двох старших розрядів (біт) від кожної колірної складової кольору RGB (зазвичай кожна колірна компонента має однобайтовое ціле значення). За цим 6-розрядних кодів будується гістограма, яка містить N = 26 = 64 осередків (кишень). Інший підхід полягає в незалежному обчисленні гістограм для кожної колірної складової, з подальшим їх об'єднанням в одну. На рис. 1 і 2 показані два зображення і гістограми їх колірних складових в просторі RGB, за якими видно наскільки відрізняється колірне зміст зображень.

    а)

    ^ HlL ^ L

    в)

    б)

    г)

    Мал. 1 - Зображення (а) і гістограми його червоною (б), зеленої (в) і синьою (г) колірних складових в просторі RGB

    б)

    в)

    г)

    Мал. 2 - Зображення та гістограми його червоною (б), зеленої (в) і синьою (г) колірних складових в просторі RGB

    Для визначення ступеня подібності двох зображень по їх колірним гістограми И1 і И2, що мають N осередків, можна використовувати різні функції відстані, наприклад, такі [4]: ​​- кореляційне відстань:

    ? і i (i) H 2 (0

    d (І j, і 2) = - i =

    i

    (1)

    ? іi2 (i) H22 (i) i = i

    1 N

    де Іj (i) = Іj (i) - ^? Hj (l), j = 1, 2;

    1 = 1

    | Відстань Хі-квадрат:

    d (Hi, і 2) = ?

    (Hi (i) - И2 (i)) 2. 1 Hi (i) + И2 (i) '

    - перетин:

    N

    d (Hi, И2) =? min (Hi (i), И2 (i));

    i = 1

    - відстань Бхатачарія:

    (2)

    (3)

    d (Hi, І 2) =

    N

    i-?-

    i = 1

    4Hi (i) І 2 (i)

    N

    N

    (4)

    ? н, (/)? н 2 (/)

    и и

    Відзначимо, що наведені заходи відстані можуть відрізнятися від однойменних метрик, які використовуються на практиці. Наприклад, в програмної бібліотеці ОрепСУ, широко застосовується для реалізації систем машинного зору відстань Хі-квадрат обчислюється за формулою:

    d (Hi, І 2) =? ™ - І 2 (i)) 2

    (5)

    ,= 1 Н-1 (0

    Також слід зазначити, що часто гістограми нормуються, наприклад значення в їх осередках можуть бути приведені до діапазону від 0 до 1.

    Серед зазначених заходів відстані найбільш популярна функція перетину гістограм, що визначається формулою (3). При цьому значення перетину гістограм можна нормувати, розділивши його на кількість пікселів зображення, вибраного в якості еталонного (це може бути зображення-запит):

    ? min (Hi (i), Їм (i))

    d (Иi, Їм) =

    i = i

    N

    ? Їм (i)

    (6)

    i = i

    де Н, Нм - гістограми зображення з бази і модельного зображення відповідно. Отримана величина називається схожістю і служить мірою близькості колірного змісту зображення в базі і еталонного (модельного) зображення.

    У таблиці 1 наведені результати порівняння зображень, показаних на рис. 1 і 2, методами зіставлення гістограм із застосуванням розглянутих заходів відстані. У таблиці 2 містяться результати порівняння двох пар однакових зображень з використанням гістограм з 16 осередками. У таблиці 3 показано, як сильно відрізняються тестові зображення від зображення, що містить тільки білий колір (тут також використовуються гістограми з 16 осередками). Для обчислення значень відстані використовувалися кошти бібліотеки ОрепСУ. При цьому гістограми нормувалися.

    Слід звернути увагу на те, що згідно з таблицями 2 і 3, на основі нормованої гістограми і кореляційного відстані неможливо відрізнити довільне зображення від зображення білого кольору.

    Також для пошуку можуть застосовуватися накопичувальні (кумулятивні) гістограми [3]:

    м (0 =? н (]), (7)

    1 = 1

    де М (/) -? -я осередок накопичувальної гістограми; / = 1, ..., N Н (1) - 1-а група гістограми; 1 = 1, ..., ?.

    Таблиця 1 - Відстань між зображеннями на основі колірних гістограм

    Міра відстані Величина відстані

    число осередків

    8 i6 32

    Корреляционное відстань 0.7622 0.6i87 0.5151

    Відстань Хі-квадрат i84.43 5620.9 22347

    Перетин 4.2589 8.5531 11.792

    Відстань Бхатачарія 0.37i5 0.4731 0.5282

    Таблиця 2 - Відстань між однаковими тестовими зображеннями на основі колірних гістограм

    Міра відстані Величина відстані

    Рис.1 Рис. 2

    Корреляционное 1 + 1

    відстань

    Відстань 0 0

    Хі-квадрат

    Перетин 32.3365 8.8544

    Відстань Бха- 0 0

    тачарія

    Таблиця 3 - Відстань між кольоровими тестовими зображеннями і зображенням білого кольору на основі колірних гістограм

    Міра відстані Величина відстані

    Рис.1 Рис. 2

    Корреляционное відстань 1 + 1

    Відстань Хі-квадрат 32.3365 8.8544

    Перетин 0 0

    Відстань БХА-тачарія 1 + 1

    Вектор колірної зв'язності дозволяє об'єднати інформацію про колірному змісті зображення з просторовою інформацією [5]. Він має такий вигляд:

    СС? = (( «!, Д), (А2, р2), ..., (ам,}), (8)

    де Л - кількість зв'язкових і незв'язних пікселів в 1-м колірному інтервалі, / = 1, ..., N. Під зв'язковим пикселом розуміється піксель, що належить який-небудь однорідної за кольором області зображення, а під незв'язним - що не належить таким областям. Для отримання колірних інтервалів виконується колірна сегментація зображень. Найпростіший і в той же час досить ефективний підхід до колірної сегментації описаний в роботі [6]. Він полягає в заміні кольору пікселя зображення на найбільш близький йому колір (відповідно до обраної міру відстані) із заданого числа найбільш часто зустрічаються в цьому зображенні квітів.

    Колірна коррелограмм - це таблиця, індексована по колірних парам, де к-я запис для пари (/,] ') визначає ймовірність знаходження на зображенні пікселі з кольором] на відстані до від пікселя з кольором / [5]. Нехай I - набір пікселів зображення, а 1ф) - безліч пікселів, які мають колір з (/). Тоді колірна коррелограмм визначається наступним чином:

    г (Ц =, Рг, lP2

    PlGIc (i), P2eI

    |I.

    c (j) \\ Pl - P2 \ =

    (9)

    де р1, р2 - пікселі; /,] Е {1, 2, ..., N1; N - число пікселів; до е {1, 2, ..., е}; р1 -р2 | - відстань між пікселями р1, р2.

    Розмір колірної коррелограмми може бути дуже великим в тому випадку, якщо враховувати всілякі пари квітів. Тому часто використовують автокоррелограмму, яка фіксує просторову кореляцію тільки між однаковими квітами і таким чином має значно менші розміри в порівнянні з коррелограмм.

    Використовувані в пошукових системах колірні моменти визначаються наступним чином: - середнє значення:

    1 N

    = N Z fj

    М,

    (10)

    стандартне відхилення:

    До

    1 N

    N Z (f -м,)

    j = 1

    - третій центральний ступінь асиметрії):

    (11)

    момент (відображає

    (

    s, =

    1 N

    NZ (f, j -Mi) 3

    j = 1

    (12)

    де fj - значення i-й колірної компоненти j-го пікселя зображення, N - число пікселів зображення.

    Зазвичай колірні моменти визначаються з використанням колірних моделей L * u * v * і L * a * b *. Момент третього порядку s, забезпечує збільшення ефективності пошуку. Однак його використання підвищує чутливість до змін сцени. Кольорові моменти в порівнянні з іншими колірними характеристиками дозволяють отримати найбільш компактний набір ознак (9 значень - 3 моменту на 3 колірних компоненти), що може вплинути на результативність пошуку. Як правило, колірні моменти можуть бути використані для отримання попередніх результатів, які будуть уточнюватися більш складними засобами пошуку. Як приклад в таблиці 4 наведені значення зазначених колірних моментів для ряду зображень, показаних на рис. 3. Кольорові моменти були обчислені з використанням колірної моделі L * a * b *. Для наведених прикладів видно, що значення колірних моментів розрізняються.

    У стандарті MPEG-7 визначено набір дескрипторів для опису мультимедійних даних [7]. Для представлення зображення або його деякої області можуть бути використані домінантні кольори. Відповідний дескриптор (дескриптор домінантного кольору) обчислюється таким чином. Спочатку виконується квантування кольорів -Кольорове простір (колірної куб) ділиться на рівні частини по кожній з координат і значення, які утворюються на перетині розбиття, заміщають реальні кольори. Для заміщення вибирається квантування значення, що відрізняється від реального кольору на мінімальну відстань. Далі обчислюється відсоток кожного кольору на зображенні або його області. Дескриптор домінантного кольору є найбільш зручним для подання локальних характеристик зображення або його області, де для надання інформації кольорів досить малого числа квітів [3].

    3

    Мал. 3 - Зображення для обчислення колірних моментів

    Таблиця 4 -Значення колірних моментів

    Моменти Зображення на рис. 4

    а Б В Г

    Mi 115.6 130.2 136.1 132.3

    Oi 61.6 60.4 58.3 52.6

    Si -25.4 -41.9 21.2 -44.8

    Mi 122.1 130.1 134.4 127.0

    O2 9.4 5.5 10.7 4.6

    s2 10.9 5.9 11.7 5.4

    M3 138.7 126.1 122.7 124.6

    O3 22.4 18.9 33.4 18.2

    s3 -11.1 -20.9 -18.4 -10.3

    Для зіставлення векторів колірної зв'язності, колірних коррелограмм, колірних моментів і дескрипторів домінантного кольору необхідно вибрати деяку міру відстані (або подібності). Це можуть бути, наприклад, заходи, аналогічні тим, які були описані при розгляді гістограм, а також відомі заходи евклидова відстані, манхеттонского відстань, відстань Чеби-шева і ін.

    Текстерно характеристики описують просторове розподіл квітів або значень інтенсивності на зображенні [2]. Текстурна характеристика є мірою таких властивостей зображень і / або їх областей, як гладкість, шорсткість і регулярність.

    Один з найпростіших підходів, що застосовуються для опису текстури, полягає у використанні статистичних характеристик, що визначаються за гистограмме освітленості цілого зображення або його області [8]. В якості таких характеристик часто використовують моменти. Для опису текстури особливо важливий другий момент - дисперсія с2. Дисперсія є мірою яскравості контрасту, що можна використовувати для побудови дескрипторів відносної гладкості, наприклад:

    Я = 1--1Т. (13)

    1 + а 2

    Величина Я дорівнює 0 для областей з нульовою дисперсією (областей постійної яскравості) і наближається

    до 1 для великих значень дисперсії. Часто дисперсію нормують, тобто призводять до діапазону значень від 0 до 1. Для цього виконують поділ на квадрат значення максимальної яскравості. Також можна визначити:

    однорідність:

    Homogeneity =? І 2 (i)

    i = 1

    і ентропію:

    N

    Entropy =? І (i) log;

    1

    (14)

    (15)

    ?= 1 Н (0 де N - число рівнів яскравості, Н (/) - значення? -Й осередку нормованої гістограми яскравості, Н (/) е [0, 1]. Максимум величини однорідності досягається для зображення, всі елементи якого мають однакову яскравість , тобто для максимально однорідного зображення, і зменшується в міру зростання яскравості відмінностей. Ентропія характеризує мінливість яскравості зображення - вона дорівнює 0 для області постійної яскравості і максимальна в разі рівно можливих значень.

    Описані текстурні характеристики мають певні обмеження - вони не несуть інформації про взаємне розташування елементів зображення. Врахувати просторову інформацію можна за рахунок розгляду не тільки розподілу яркостей і квітів, а й місце розташування пікселів з їх рівними або близькими значеннями. Один з підходів тут заснований на застосуванні матриці входжень. Матриця входжень - це двовимірний масив, індекси рядків і стовпців якої відповідають допустимим значенням яскравості або кольору пікселів. Значення матриці]) вказує скільки разів значення / зустрічалося на зображенні зі значенням] в деякому заданому просторовому відношенні, що визначається вектором зміщення е [2].

    Для напівтонових зображень часто використовують нормовану матрицю входжень:

    Оа (?, 1)

    Nd (i, j) = |

    (16)

    ??Cd (і j)

    i j

    Значення нормованої матриці входжень належать діапазону [0, 1] і їх можна розглядати в якості оцінок ймовірності спільного просторового розподілу відповідних значень яскравості пікселів.

    Матриці входжень використовуються як вихідні дані для обчислення текстурних характеристик. Наприклад, на основі нормованої матриці входжень можна обчислити наступні характеристики [2]: - енергія:

    Energy = ?? Nd (i, j), (17)

    - ентропія: Entropy = ?? Nd (i, j) log2

    1

    Nd (i, j)

    контраст:

    СопЬШ = XX "1) 2 N. О, 1) ,

    - однорідність:

    ^ (/, У)

    Homogeneity = XX

    г 1 кореляція:

    1 + 1 г -11

    СоггеШгоп = XX

    (Г-л) (1-л) ^ (г, 1)

    СТгСТ1

    (19)

    (20)

    (21)

    де л, л - середні значення, аг, О / - среднеквадра-тичні відхилення сум ^ (г) і N? 0, обчислених в напрямку рядків і стовпців зображення:

    Nd (г) = X Nd (г, 1), (22)

    ^ (1) =! ^ (Г, /).

    (23)

    Також можуть застосовуватися характеристики, описані в книзі [7]:

    - максимум ймовірності:

    тах {^ (г, 1)}, (24)

    момент різниці к-го порядку:

    XX (г -1) (г, 1):

    (25)

    зворотний момент різниці к-го порядку:

    N. (г, 1)

    XX

    (26)

    г 1,1 .р (г - 1) до Ще одна застосовувана різновид матриці входжень для напівтонових зображень називається симетричною матрицею входжень. У цій матриці групуються пари симетричних відносин суміжності:

    sd (г, 1) = с. (Г, 1) + С ^ (г, 1). (27) Аналогічно можна побудувати матриці входжень для кольорових зображень. Тут можна використовувати два підходи. Перший полягає в поділі кольорового зображення на три напівтонових, кожне з яких відповідає одному з колірних каналів, і обчисленні характеристик цих напівтонових зображень. Другий підхід передбачає квантування кольору, тобто колірну сегментацію, і побудова матриці входжень для квантованих квітів.

    На рис. 4 показані чотири зображення з відмінними текстурами, для яких визначені енергія, ентропія, контраст і однорідність за формулами (17) - (20). Значення відповідних характеристик наведені в таблиці 5 (рядки відповідають зображенням на рис. 4). Для їх розрахунку була використана нормована матриця входжень з вектором зміщення (2, 2).

    Однією з проблем при побудові текстурних характеристик на основі матриць входжень є вибір вектора зміщення. Для її вирішення в разі нормованих матриць пропонується використовувати статистичну перевірку хі-квадрат. Тут обґрунтовується, що найбільш вираженою структурі текстурного образу відповідають значення вектора зміщення е, що задовольняють максимуму величини:

    X

    ^) = XX

    N. (г, 1)

    1 N. (г) N. (1)

    - 1.

    (28)

    в) г)

    Мал. 4 - Текстерно зображення

    Таблиця 5 - Значення текстурних характеристик

    № Характеристики

    Енергія Ентропія Контраст Однорідність

    1 0.000033 10.1178 4222.62 0.0549725

    2 0.000075 9.5437 2158.24 0.0831185

    3 0.000068 9.4649 2701.75 0.0663726

    4 0.000202 8.7534 1018.89 0.1297459

    Добре відомим і простим у застосуванні підходом до виявлення характерних ознак зображень є виділення країв. Кількість країв в заданій області фіксованого розміру є деякою характеристикою заповнення цієї області. У процесі виділення країв зазвичай обчислюються їх напрямки, значення яких також можуть застосовуватися для опису образу текстури.

    В даний час активно розвивається підхід до аналізу текстур, який базується на застосуванні локальних бінарних шаблонів [9, 10]. Локальний бінарний шаблон (ЛБШ) являє собою опис околиці точки зображення в двійковій формі. Оператор ЛБШ, який застосовується до пікселя зображення, використовує N пікселів околиці, приймаючи центральний піксель як поріг. Пікселі околиці, інтенсивності яких більше або дорівнюють інтенсивності центрального пікселя приймають значення 1, а решта - значення 0. Таким чином, виходить N розрядний бінарний код, який описує околицю пікселя. Зазвичай використовуються восьмирозрядних ЛБШ. Локальний бінарний шаблон називається рівномірним, якщо він містить не більше трьох серій 0 і 1 (наприклад, 00000000, 001110000 і 11100001). Рівномірні ЛБШ визначають тільки найбільш важливі локальні особливості изображе-

    ня і забезпечують істотне скорочення безлічі різних кодів. Характеристикою області зображення на основі ЛБШ є гістограма кодів. Для пошуку зображень використовуються методи порівняння гістограм, аналогічні тим, що застосовуються до колірних характеристик.

    В даний час активно розвиваються методи обробки зображень, засновані на їх пірамідальному поданні. Піраміда зображень - це набір уявлень (шарів, рівнів) зображення з різними масштабами. Як правило, кожен шар піраміди в два рази менше по висоті і по ширині, ніж попередній. Часто застосовуються гаусові і лапласови піраміди [1].

    У гаусом піраміді кожен шар згладжується симетричним гаусовим фільтром і піддається повторної дискретизації, щоб отримати наступний шар. Шар гаусом піраміди пророкує вид наступного рівня з більш дрібним масштабом. Помилки передбачення можна зафіксувати за допомогою лапласовой піраміди. Ла-пласова піраміда будується наступним чином. Найнижчий рівень лапласовой піраміди (шар з найбільш грубим масштабом) аналогічний нижнього рівня гаусом піраміди, а кожен наступний рівень являє собою різницю між шаром гаусом піраміди і пророкуванням, отриманим оператором підвищення дискретизації (перевиборкі), який збільшує попереднє зображення в два рази по обох напрямках за рахунок повторення пікселів. В результаті обробки зображень лапласовой піраміди можна отримати різні текстурних характеристики, локальні для кожного рівня. Це дає великий набір ознак, які дозволяють розрізняти навіть складні ієрархічно організовані текстури [11].

    Для обчислення ефективних текстурних характеристик також можуть застосовуватися енергетичні карти Лавс, автокореляційна функція, частотний спектр, ознаки Тамуров, фільтри Га-бору, вейвлетного ознаки. Дані підходи досить докладно описані, наприклад, в роботах [1-3, 5, 8, 12-14].

    У літературі описано багато різних характеристик форми. Найпростішими з них є геометричні параметри областей такі, як площа, довжина периметра, центр ваги, округлість, прямоугольность, характеристики описує прямокутника, характеристики опуклої оболонки. Зазвичай ці характеристики обчислюються після сегментації зображення, що полягає в його поділі на фон і об'єкт.

    Ефективними характеристиками форми є початкові моменти, центральні моменти, нормовані центральні моменти і інваріантні моменти [8].

    Ряд характеристик форми можна побудувати за результатами аналізу кордону області. Наприклад, для опису форми можна застосувати ланцюгові коди, за допомогою яких можна представити кордон області у вигляді послідовності з'єднаних відрізків із зазначенням їх довжин і напрямків.

    На основі перетворення Фур'є можна побудувати Фур'є-дескриптори кордону. нехай є

    К-точкова дискретна межа на площині ху. Починаючи з її довільної точки (х0, у0), будемо обходити кордон, наприклад, проти годинникової стрілки, і позначимо координати зустрічаються точок кордону у вигляді (х0, у0), (хь УО, ..., (хк-1, ук 1).

    Ці координати можна записати у формі x (k) = хк, у (к) = ук. Тоді кордон можна представити у вигляді послідовності координатних пар <х (к), у (до)>, де k = 0, 1, ..., К-1. Далі, кожну пару координат можна розглядати як комплексне число ^ • (к) = х (к) + / у (к), де / - уявна одиниця. Комплексні коефіцієнти а (і), і = 0, 1, ..., К-1, дискретного перетворення Фур'є кінцевої послідовності s (к), до = 0, 1, ..., К-1, називають фур'є-дескрипторами кордону . Перевагою Фур'є-дескрипторів є те, що найбільш суттєва інформація про кордон, міститься, як правило, в невеликій кількості перших коефіцієнтів, а решта можна відкинути.

    Найпростішою характеристикою форми є гістограма форми [2]. Один із способів її побудови полягає в наступному:

    1. Визначається кількість розрядів гістограми, рівне мінімального числа рядків і стовпців, в яких містяться пікселі області;

    2. Кожному розряду гістограми ставиться у відповідність одна з рядків і стовпців області;

    3. Кожен розряд гістограми заповнюється кількістю пікселів області, що містяться у відповідному рядку або стовпці.

    Для забезпечення інваріантності до масштабу можна зафіксувати кількість розрядів, відповідних рядках і стовпцях. Якщо визначити порядок розрядів гістограми так, щоб вони відповідали перегляду області в напрямку від лівого верхнього кута до правого нижнього, то можна забезпечити інваріантність щодо перенесення. Забезпечити инвариантность щодо повороту можна наступним чином: обчислюються осі найкращого аппроксимирующего еліпса і область повертається до тих пір, поки більша вісь не стане вертикальною.

    Ще один можливий спосіб опису форми полягає в побудові гістограми за значенням кута нахилу дотичній в кожному граничному пікселі області. Цей захід є інваріантної щодо масштабу і перенесення. Щоб домогтися інваріантності щодо повороту використовують такі способи:

    1) область повертають, контролюючи положення великої осі аппроксимирующего еліпса;

    2) гістограма циклічно зсувається таким чином, щоб першим розрядом став розряд з найбільшим значенням.

    Для визначення форми об'єкту на зображенні застосовуються також моменти Зерніке, які є ортогональними моментами, інваріантними до обертання, масштабом і переносу [3, 15].

    Наявність або відсутність об'єктів і їх взаємне розташування можуть служити критеріями для пошуку необхідних зображень, тобто зіставити зображення при контекстному пошуку можна шляхом виділення на зображеннях в базі даних об'єктів,

    присутніх на зображенні-запиті. Для цього можна скористатися різними методами детектування об'єктів на зображеннях.

    Наприклад, для виявлення об'єктів на зображеннях в даний час активно застосовується метод Віоли-Джонса, розроблений П.Віолой і М.Джонсом в 2001 р В основі цього методу лежать: (1) інтегральне представлення зображення, (2) застосування ознак Хаара, ( 3) класифікатор на основі алгоритму адаптивного бустінга і (4) каскадне комбінування класифікаторів [16, 17].

    Ознака Хаара складається з суміжних прямокутних областей. Ці області позиціонуються на зображенні, далі відбувається підсумовування інтенсивності пікселів в областях, потім між сумами обчислюється різниця. На етапі виявлення в методі Віоли-Джонса використовується вікно, визначеного розміру, яке переміщається по зображенню. Ознака Хаара розраховується для кожної області зображення, що відповідає сучасному стану вікно. Наявність або відсутність предмета в вікні визначається різницею між значенням ознаки і учнем порогом. Оскільки ознаки Хаара мало підходять для навчання або класифікації, для опису об'єкта з достатньою точністю необхідна більша кількість ознак. Тому в методі Віоли-Джонса ознаки Хаара організовані в каскадний класифікатор. Перевага використання ознак Хаара є найбільша, в порівнянні з іншими ознаками, швидкість. При використанні інтегрального представлення зображення, ознаки Хаара можуть обчислюватися за постійний час.

    Після виділення об'єктів в деяких випадках необхідно їх ідентифікувати. Для цієї мети служать методи розпізнавання образів. На практиці часто застосовуються байєсовські класифікатори, машини опорних векторів, нейронні мережі [18].

    В даний час розроблено велику кількість систем контекстного пошуку, що мають різні архітектури, запропоновані, наприклад:

    - Лонгом, Жангом і Фенгом,

    - Велткампом і Танасе,

    - Руї, Хуангом і Чангом,

    - Хове,

    - Жуангом, Ліу і Паном,

    - Нака, Верником, Янгом і Галатсаносом. Незалежно від конкретної архітектури, сучасні системи пошуку зображень за змістом обов'язково включають такі підсистеми [3]:

    1. Базу зображень;

    2. Підсистему вилучення низькорівневих ознак зображень;

    3. Базу візуальних ознак;

    4. Підсистему індексації зображень;

    5. Інтерфейс користувача;

    6. Додаткові підсистеми, що реалізують різні методи обробки інформації, в тому числі: метод автоматичної анотації зображень, метод індексації зображень з використанням тезауруса форм, методи визначення подібності зображень, відповідні че-

    ловеческій сприйняття подібності зображень, і ін.

    Ефективна організація пошуку зображень дозволяє підвищити точність керуючих рішень і скоротити час на їх формування.

    література

    1. Форсайт Д. А., Понс Ж. Комп'ютерне зір. Сучасний підхід: Пер. з англ. - М .: Видавничий дім «Вільямс», 2004.

    2. Шапіро Л. Комп'ютерне зір / Л.Шапіро, Дж.Стокман; Пер. з англ. - М .: БИНОМ. Лабораторія Знання, 2006..

    3. Левашкіна А.О. Розробка методів пошуку зображень на основі обчислювальних моделей візуального уваги. Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.17. - Єкатеринбург 2009.

    4. Gary Bradsky, Adrian Kaehler Learning OpenCV Computer Vision with the OpenCV Library - O'Reilly, 2008.

    5. Long F., Zhang H., Feng D. Fundamentals of content-based image retrieval // Multimedia Information Retrieval and Management - Technological Fundamentals and Applications, Springer-Verlag, 2003 pp. 1-26.

    6. J.R. Parker, Algorithms for Image Processing and Computer Vision (2nd edition), John Wiley & Sons Ltd., New York 2010.

    7. Стандарт MPEG-7 [Електронний ресурс]: Дескриптор домінантного кольору. - Режим доступу: http://book.itep.ru/1/15/mpeg_7.htm, 11.09.2014.

    8. Гонсалес Р., Вудс Р. Цифрова обробка зображень: Пер. з англ. - М .: Техносфера, 2005.

    9. Matti Pietikinen, Abdenour Hadid, Guoying Zhao, Timo Ahonen Computer Vision Using Local Binary Patterns. -Springer; 2011.

    10. Цеглярів А.П., Ляшева С.А., Шлеймовіч М.П. Виявлення та супроводження об'єктів в бортових системах обробки зображень // Вісник Казанського технологічного університету. - Казань: КНІТУ, 2014. - Т. 17. № 13. - С. 331-334.

    11. Яні Б. Цифрова обробка зображень. - М .: Техносфера, 2007.

    12. Фісенко В.Т., Фісенко Т.Ю. Комп'ютерна обробка і розпізнавання зображень: навч. посібник. - СПб: СПбГУ ІТМО, 2008.

    13. M.Tuceryan, AKJain, Texture analysis, in: C.Chen, LFPau, PSPWang (Eds.), The Handbook of Pattern Recognition and Computer Vision (2nd edition), World Scientic Publishing Co., 1998, pp . 207-248.

    14. W.Y.Ma, and B.S.Manjunath, "A comparison of wavelet features for texture annotation," Proc. of IEEE Int. Conf. on Image Processing, Vol. II, pp. 256-259, Washington D.C., Oct. 1995.

    15. Чернодуб А.Н. Метод виділення ознак на основі спільних векторів моментних фазових розподілів і моментів Зерніке / А.Н.Чернодуб // Proc. of XVI-th International Conference "Knowledge-Dialogue-Solution", (September 06 - 10, 2010 Kyiv (Ukraine)). -Kyiv, 2010. - P. 162-169.

    16. Введення в природно-інтуїтивну взаємодію з комп'ютером [Електронний ресурс] // Національний Відкритий Університет «ІНТУЇТ» [Офіц. сайт]. URL:

    http://www.intuit.ru/studies/courses/10619/1103/info (дата звернення: 30.09.2014).

    17. Введення в розробку мультимедійних додатків з використанням бібліотек OpenCV і IPP [Електронний ресурс] // Національний Відкритий Універ-

    ситет «ІНТУЇТ» [Офіц. сайт]. URL: http://www.intuit.ru/studies/courses/10621/1105/info (дата звернення: 30.09.2014).

    18. Местецький Л.М. Математичні методи розпізнавання образів [Електронний ресурс] // Національний

    Відкритий Університет «ІНТУЇТ» [Офіц. сайт]. URL: http://www.intuit.ru/studies/courses/2265/243/info (дата звернення: 13.09.2014).

    © А. П. Кирпичников - д. Ф.-м. н., зав. каф. інтелектуальних систем і управління інформаційними ресурсами КНІТУ, Ця електронна адреса захищена від спам-ботів. Вам потрібно увімкнути JavaScript, щоб побачити її.; С. А. Ляшева - к.т.н., доцент кафедри прикладної математики та інформатики КНІТУ-КАИ; М. П. Шлеймовіч - к.т.н., доцент кафедри автоматизованих систем обробки інформації та управління КНІТУ-КАИ, Ця електронна адреса захищена від спам-ботів. Вам потрібно увімкнути JavaScript, щоб побачити її..

    © A. P. Kirpichnikov - Dr. Sci, Head of the Department of Intelligent Systems & Information Systems Control, KNRTU, Ця електронна адреса захищена від спам-ботів. Вам потрібно увімкнути JavaScript, щоб побачити її.; S. A. Lyasheva - PhD, Associate Professor of the Department of Applied Mathematics & Informatics, KNRTU-KAI; M. P. Shleymovich - PhD, Associate Professor of the Department of Automated Information Processing Systems & Control, KNRTU-KAI, Ця електронна адреса захищена від спам-ботів. Вам потрібно увімкнути JavaScript, щоб побачити її..


    Ключові слова: Контекстного пошуку ЗОБРАЖЕНЬ /CONTENT-BASED IMAGE RETRIEVAL /Міри схожості ЗОБРАЖЕНЬ /CONTENT-BASED IMAGE RETRIEVAL SYSTEM /КОЛІРНІ ХАРАКТЕРИСТИКИ /COLOR CHARACTERISTICS /текстурних ХАРАКТЕРИСТИКИ /ХАРАКТЕРИСТИКИ ФОРМИ /ХАРАКТЕРИСТИКИ ОБ'ЄКТІВ /CHARACTERISTICS OF THE OBJECTS /СИСТЕМИ контекстного пошуку /IMAGES SIMILARITY MEASURE /TEXTURE CHARACTERISTICS /THE CHARACTERISTICS OF SHAPE

    Завантажити оригінал статті:

    Завантажити