ScanEx Image Processor v.5.0. Руководство - часть 15

 

  Главная      Учебники - Разные     Программа обработки данных дистанционного зондирования Земли ScanEx Image Processor v.5.0. Руководство

 

поиск по сайту            правообладателям  

 

 

 

 

 

 

 

 

содержание      ..     13      14      15      16     ..

 

 

ScanEx Image Processor v.5.0. Руководство - часть 15

 

 

 

Переключатель

 

Растр

  –  при  включении  сообщает  о  необходимости  использовать  в  качестве 

источника  эталонов  тематический  растровый  слой.  В  случае  использования  растрового 

слоя  необходимо  учесть,  что  в  качестве  номеров  тематических  классов  будут 

использованы коды яркости заданного слоя. При этом, для корректной работы алгоритма, 

количество  яркостных  классов  не  должно  превышать  50,  классы  должны  быть 

отсортированы  в  порядке  возрастания  от  1  до  максимального  значения  тематических 

классов  без  пропусков.  Выпадающий  список  справа  –  задает  растровый  тематический 

слой. 

Группа

 

Ограничить  результат  по  маске

  –  позволяет  задать  ограничивающую  область, 

используемую при классификации. 

Выпадающий  список

  –  позволяет  выбрать  векторную  маску  или  заданную  прямоугольную 

область (

Выбранный регион

). 

Группа

 

Параметры классификации – 

позволяет выбирать метод классификации и настраивать 

его специфические параметры: 

Выпадающий  список 

Метод  классификации

  –  позволяет  задать  один  из  реализованных  в 

программе методов классификации с учителем: 

 

Нейронная  сеть  –  алгоритм  классификации  с  помощью  нейронных  сетей  прямого 
распространения; 

 

Деревья  –  алгоритм,  позволяющий  осуществлять  классификацию  растров  с 
помощью древовидного классификатора. 

Для  каждого  из  методов  доступны  собственные  основные  и  дополнительные  параметры.  Для 

метода классификации «

Нейронные сети» 

это: 

Раскрывающийся список 

Топология

– определяет топологию нейронной сети

Поле  ввода

  Число  элементов

  –  отображает  количество  найденных  в  указанном 

источнике  эталонов  тематических  классов.  Значение  «NA»  сообщает  о 
некорректном источнике эталонов (число тематических классов более 50). 

Поле ввода

 Число скрытых слоев

 задает количество скрытых слоев:

 

 

0

 – без скрытых слоев; 

 

1

 – один скрытый слой; 

 

2

 – два скрытых слоя. 

Поле  ввода

  Нейронов  в  первом  слое

  –  позволяет  задать  количество  нейронов  в 

первом скрытом слое. 

Группа

 

Параметры обучения

 – 

задает параметры обучения нейронной сети:

 

Поле  ввода

  Максимальная  ошибка

  –  задает  среднеквадратическую  ошибку,  при 

достижении которой обучение считается успешным. 

Поле  ввода

  Максимальное  число  эпох

  –  задает  максимальное  количество  эпох 

обучения (циклов, в которых используется весь входной набор пикселей). 

Поле  ввода

  Скорость  обучения

  –  задает  скорость  обучения,  типичные  значения  в 

диапазоне  от  0.001  до  0.1.  При  большом  значении  параметра  нейронная  сеть 

 

обучается  быстрее,  но  может  «проскочить»  оптимальное  значение.  При 
меньших значениях параметра достигается более качественное обучение сети, 
но  за  большее  время.  Чтобы  понять,  следует  ли  уменьшить  значение 
параметра,  нужно  следить  за  изменением  среднеквадратической  ошибки  в 
процессе  обучения:  если  ее  изменение  имеет  колебательный  характер, 
значение параметра следует уменьшить (Рис. 125). 

Поле  ввода

  Шаг  контроля  ошибки

  –  задает  шаг,  с  которым  выполняется 

перекрестная  проверка  для  определения  качества  обучения  нейронной  сети. 
Ошибка  контролируется  на  каждом  N-м  образце  из  входного  набора,  который 
не используется для обучения. 

Выпадающий  список 

Использовать  начальное  значение  генератора

  –

 

указывает 

программе  на  необходимость  использования  генератора  случайных  чисел. 
Принимает значения «Да» и «Нет». 

Поле  ввода 

Начальное  значение  генератора

  -

 

задает  начальное  значение 

генератора  случайных  чисел.  Служит  для  того,    чтобы  можно  было  получить 
одинаковый результат на разных машинах. 

Группа

 

Дополнительные параметры

 – 

позволяет настроить дополнительные параметры 

обучения нейронной сети: 

Поле  ввода

  Смещение  производной

  –  задает  смещение  производной  сигмоида, 

необходимое,  чтобы  избежать  «коллапса»  нейронной  сети.  «Коллапс» 
наступает,  если  суммарный  входной  сигнал  сигмоидальной  функции  слишком 
велик  по  амплитуде,  в  этом  случае  используемый  алгоритм  обучения  не 
способен  изменить  веса  нейронной  сети,  и  она  перестает  обучаться.  Данный 
параметр  гарантирует  изменение  весов  в  области  значений,  для  которых 
производная сигмоида близка к нулю. Типичные значения от 0,0 до 0,1. 

Поле  ввода

  Момент  инерции

  –  задает  значение  параметра  «инерции»  (памяти) 

нейронной сети, принимающее значение от 0 до 1. Данный параметр позволяет 
«запоминать»  направления  прошлых  изменений  весов,  что  предотвращает 
резкие изменения. Если значение равно 0, то нейронная сеть в каждый момент 
обучается  только  на  значениях  яркостей  очередного  входного  пикселя, 
«забывая»  историю  обучения  (результат  обучения  на  предыдущем  пикселе). 
Если значение равно 1, нейронная сеть перестает обучаться совсем. Значение в 
диапазоне  0.0  –  0.3  часто  позволяет  избежать  колебательного  характера 
изменения ошибки. 

Поле  ввода

  Скорость  естественного  убывания

  –  параметр,  определяющий 

«естественное угасание» значений весов w

ij

. Данный параметр задает скорость 

убывания  магнитуды  весов,  чтобы  предотвратить  переобучение  сети,  что 
помогает  избежать  «коллапса»  нейронной  сети,  поскольку  нейронная  сеть 
«забывает»  чему  ее  учили,  если  такого  рода  обучения  не  повторяется  (это 

 

позволяет  уменьшить  влияние  выбросов).  Параметр  принимает  небольшие 
отрицательные значения. 

Поле  ввода

  Порог  для  классификации

  –  задает  параметр,  определяющий 

требуемую  точность  классификации.  Параметр,  при  котором  классификация 
считается правильной. 

Выпадающий  список 

Гиперболический  арктангенс  от  ошибки

  –  при  включении 

задает необходимость преобразования ошибки из диапазона [-1,+1] в диапазон 

,

 

, что также иногда позволяет избежать «коллапса» нейронной сети. 

В  этом  случае  основное  обучение  сосредотачивается  на  тех  входных  данных, 
для которых ошибка максимальна, что может ухудшить общий результат, если 
эти данные соответствуют выбросам и аномальным значениям.  

Поле  ввода

  Влияние  веса  образцов

  –  позволяет  изменить  влияние  веса  образцов 

при  обучении.  При  бесконечном  значении  веса  влияние  пропорционально 
отношению единицы к значению, указанному в данном поле. 

Блок, 

расположенный  под 

раскрывающимися  списками

  указания  параметров,  содержит 

дополнительные интерактивные пояснения – при выборе какого-либо параметра сверху, в 

данном блоке отображается соответствующие развернутые пояснения.  

Для  удобства  пользователя  все  параметры  заполнены  усредненными  значениями,  характерными 

соответствующим  полям,  и  после  их  изменения  новые  значения  отображаются  жирным 

шрифтом.  

Группа

 

Параметры  выходных  растров

  –  содержит  поля  для  настройки  параметров  выходных 

растров: 

Поле

 

ввода

  Имя  слоя  с  классами

  –  позволяет  задать  имя  слоя,  содержащего  результат 

классификации; 

Флаг 

Создать слой с вероятностями

  –  активирует  возможность создания  дополнительного 

слоя с вероятностями; 

Поле

 

ввода

  Создать  слой  с  вероятностями

  –  позволяет  задать  имя  слоя,  содержащего 

значения вероятностей; 

Флаг 

Маскировать  результаты  с  неопределенностью

  –  при  активации  все 

результирующие значения с неопределенностью будут скрыты. 

Кнопка

 

Выполнить

  –  инициирует  процесс  спектральной  классификации  с  помощью  Нейронной 

сети. 

Кнопка

 

Закрыть

  –  закрывает  диалог  без  выполнения  классификации  и  сохранения  заданных 

параметров. 

Ниже  приведен  фрагмент  строки  состояния  (Рис  133),  в  которой  указан  процент  неверно 

классифицированных пикселей (13% на контрольной выборке, при разности с требуемым откликом 

не более 0.1) и среднеквадратическая ошибка по всем классам (0.1630 на контрольной выборке). 

 

 

Рис 133.

 

Фрагмент строки состояния в процессе выполнения классификации с помощью 

Нейронной сети 

В  результате  выполнения  классификации  будет  автоматически  создан  новый  растровый 

тематический слой с именем «

NeuralNetwork_Classes

». А при включенном 

флаге 

Создать слой 

с вероятностями

  –  будет  также автоматически создан дополнительный слой  с вероятностями  – 

«

NeuralNetwork_Classes_Prob

».  Для  последующей  обработки  полученных  результатов  можно 

использовать инструментарий 

Показать легенду

 (см. 

«Отображение результатов классификаций 

(Показать легенду)»

). 

Древовидный классификатор 

Описание алгоритма классификации с помощью деревьев. 

Алгоритм  обучения  древовидных  классификаторов  основывается  на  книге  Ripley,  1996.  В 

программе  реализован  алгоритм  обучения  ансамбля  древовидных  классификаторов,  каждый  из 
которых  обучается  на  случайном  подмножестве  обучающей  выборки.  При  классификации 

результирующий  класс  определяется  путем  голосования  (по  всему  ансамблю  деревьев),  а  его 

вероятность  оценивается  как  отношение  «проголосовавших»  за  него  деревьев  к  общему  числу 

деревьев. 

Как  и  все  древовидные  классификаторы,  программа  использует  в  каждой  вершине  дерева 

проверку  значений  одной  переменной  (одного  из  каналов),  которое  сравнивается  с  порогом,  т.е. 

вершины являются бинарными классификаторами.  

В  процессе  обучения  каждой  вершине  «приписана»  часть  обучающей  выборки,  которая 

попадает  в  нее  при  классификации  существующим  в  данный  момент  деревом.  Каждая  вершина 

оценивается  на  предмет  необходимости  (степень  однородности  по  классам  обучающей  выборки, 

число  элементов)  и  «полезности»  (улучшение  качества  классификации)  ее  дальнейшего 

разбиения,  и  если  она  неоднородна  (к  ней  приписаны  разные  классы),  и  приписанных  к  ней 

элементов много (больше заданного порога), то производится попытка разделить данную вершину. 

При  оценке  неоднородности  вершины  с  точки  зрения  необходимости  ее  разбиения 

используется девианс: 

2

log

c

c

c

D

n

 

 

где суммирование ведется по всем классам 

с

, попавшим при обучении в данную вершину, 

c

n

 

- число элементов обучающей выборки, попавших в вершину, и 

c

- вероятность класса 

с

 в данной 

вершине, скорректированная  на априорную вероятность классов. Если  девианс вершины невелик 
(составляет лишь малую часть девианса корневой вершины), то дальнейшее разделение вершины 

считается  ненужным.  Другим  критерием  необходимости  разбиения  является  число  элементов 

 

обучающей  выборки,  отнесенных  к  вершине  –  если  оно  мало,  то  дальнейшее  разбиение  также 

нецелесообразно. 

Для  этого  нужно  выбрать  переменную  (канал  снимка)  и  пороговое  значение,  по  которому 

будет  проходить  разделение  (т.е.  правило  в  каждой  вершине  проверяет 

j

Ch

a

,  где 

Ch

  - 

значение в выбранном канале, и 

j

a

– очередной 

j

-й порог). В качестве меры 

( )

c

i p

 однородности 

распределения  вероятностей 

c

p

  классов  в  вершине  дерева    (при  оценке  полезности  разбиения 

данной  вершины)  используется  энтропия 

(

)

ln

c

i

i

i p

p

p

 

,  где 

i

p

  –  вероятность 

i

-го  класса; 

энтропия  равна  нулю,  если  вершине  приписан  только  один  класс  (вершина  «чистая»),  и 
максимальна,  когда  вероятность  всех  классов  для  данной  вершины  одинакова  (вершина  не 

информативна). Для разбиения дерева с использованием выбранного порога и канала порога  мы 

получим оценку уменьшения неоднородности, равную 

(

)

(

)

(

|

)

(

)

(

|

)

c

j

c

j

j

c

j

i

i p

p Ch

a

i p Ch

a

p Ch

a

i p Ch

a

 

 

т.е.  из  значения  неоднородности  вершины  вычитается  взвешенная  (вероятностями 

попадания  в  новые  вершины)  сумма  неоднородностей  новых  вершин.  В  качестве  очередного 
разбиения выбирается такое, которое максимизирует эту величину. 

Классификация с помощью деревьев.  

Для  классификации  растровых  слоев  с  использованием  древовидного  классификатора 

используется  диалог  инструмента 

Спектральная  классификация  с  учителем

,  который 

вызывается  командой 

Классификация 

 

С  учителем 

 

Спектральная  классификация

 

главного меню программы. При этом должен быть задан 

Метод классификации

 – Деревья (Рис 

134). 

 

 

Рис 134.

 

Диалог 

Спектральная классификация с учителем

, метод классификации - 

Деревья

 

В 

группе

 

Выбрать  каналы

  –  задаются  спектральные  каналы,  участвующие  в  процессе 

классификации. 

Группа

 

Источник образцов

 – определяет источник эталонов для обучения нейронной сети: 

Переключатель

 

Вектор

 – при включении сообщает о необходимости использовать в качестве 

источника  эталонов  полигональный  векторный  слой.  Выпадающий  список  справа  – 
позволяет выбрать векторный слой. 

Выпадающий список

 

Классы из:

 – позволяет выбрать одно из атрибутивных полей указанного 

выше  векторного  слоя,  содержащее  коды  тематических  классов.  Коды  тематических 

классов  должны  быть  представлены  положительными  целочисленными  значениями, 

количество классов не должно быть более 50. 

Выпадающий  список

 

Веса  из:

  –  позволяет  выбрать  одно  из  атрибутивных  полей  указанного 

выше векторного слоя, содержащее значение весов тематических классов.  

Переключатель

 

Растр

  –  при  включении  сообщает  о  необходимости  использовать  в  качестве 

источника  эталонов  тематический  растровый  слой.  В  случае  использования  растрового 

слоя  необходимо  учесть,  что  в  качестве  номеров  тематических  классов  будут 

использованы коды яркости заданного слоя. При этом, для корректной работы алгоритма, 

количество  яркостных  классов  не  должно  превышать  50,  классы  должны  быть 

отсортированы  в  порядке  возрастания  от  1  до  максимального  значения  тематических 

классов  без  пропусков.  Выпадающий  список  справа  –  задает  растровый  тематический 

слой. 

 

Группа

 

Ограничить  результат  по  маске

  –  позволяет  задать  область,  в  которой  выполняется 

классификация после обучения ансамбля деревьев. 

Выпадающий  список

  –  позволяет  выбрать  векторную  маску  или  заданную  прямоугольную 

область (

Выбранный регион

). 

Группа

 

Параметры классификации – 

позволяет выбирать метод классификации и настраивать 

его специфические параметры: 

Выпадающий  список 

Метод  классификации

  –  позволяет  задать  один  из  реализованных  в 

программе методов классификации с учителем: 

 

Нейронная  сеть  –  алгоритм  классификации  с  помощью  нейронных  сетей  прямого 
распространения; 

 

Деревья  –  алгоритм,  позволяющий  осуществлять  классификацию  растров  с 
помощью древовидного классификатора. 

Для  каждого  из  методов  доступны  собственные  основные  и  дополнительные  параметры.  Для 

метода классификации «

Деревья» 

это: 

Группа

 

Основные параметры

 – задает параметры обучения древовидного классификатора: 

Поле

 

ввода

 Число элементов

 – 

задает число элементов (классов) в обучающей выборке. 

Поле

 

ввода

 Число деревьев

 – задает число используемых для обучения деревьев. Каждое 

дерево обучается на случайно выбранном подмножестве. Типичное число деревьев 

–  несколько  десятков.  Увеличение  числа  деревьев  влечет  за  собой  увеличение 

времени обучения классификатора. 

Поле

 

ввода

  Доля  образцов  на  одно  дерево

  –  задает  долю  (в  процентах)  от  общего 

числа образцов, которая используется для обучения одного дерева. 

Поле

 

ввода

  Число  образцов

  –  задает  максимальное  число  пикселей,  используемых  при 

обучении. Если число пикселей в растрах больше указанного, то из них выбирается 
случайное  подмножество  заданного  объема.  Рекомендованное  значение  для 

современных компьютеров – порядка 100,000. 

Группа

 

Дополнительные  параметры

  –  позволяет  настроить  дополнительные  параметры 

обучения древовидного классификатора: 

Поле

 

ввода

  Минимальный  размер  после  разделения

  –  задает  минимальное  число 

образцов,  отнесенных  к  терминальным  вершинам  (листьям)  дерева,  при  котором 

она  может  быть  разделена.  Данное  число  вычисляется  с  использованием  весов 

образцов. Рекомендованное значение 5. 

Поле

 

ввода

  Минимальный  размер  листа

  –  задает  минимальное  число  образцов, 

отнесенных  к  терминальным  вершинам  (листьям)  дерева.  Рекомендованное 

значение 10. 

Блок, 

расположенный  под 

раскрывающимися  списками

  указания  параметров,  содержит 

дополнительные интерактивные пояснения – при выборе какого-либо параметра сверху, в 

данном блоке отображается соответствующие развернутые пояснения.  

 

Для  удобства  пользователя  все  параметры  заполнены  усредненными  значениями,  характерными 

соответствующим  полям,  и  после  их  изменения  новые  значения  отображаются  жирным 

шрифтом.  

Группа

 

Параметры  выходных  растров

  –  содержит  поля  для  настройки  параметров  выходных 

растров: 

Поле

 

ввода

  Имя  слоя  с  классами

  –  позволяет  задать  имя  слоя,  содержащего  результат 

классификации; 

Флаг 

Создать слой с вероятностями

  –  активирует  возможность создания  дополнительного 

слоя с вероятностями; 

Поле

 

ввода

  Создать  слой  с  вероятностями

  –  позволяет  задать  имя  слоя,  содержащего 

значения вероятностей; 

Флаг 

Маскировать  результаты  с  неопределенностью

  –  при  активации  все 

результирующие значения с неопределенностью будут скрыты. 

Кнопка

 

Выполнить

 – инициирует процесс спектральной классификации с помощью древовидного 

классификатора. 

Кнопка

 

Закрыть

  –  закрывает  диалог  без  выполнения  классификации  и  сохранения  заданных 

параметров. 

 

В  результате  выполнения  классификации  будет  автоматически  создан  новый  растровый 

тематический  слой  с  именем  «

Trees_Classes

».  А  при  включенном 

флаге 

Создать  слой  с 

вероятностями

  –  будет  также  автоматически  создан  дополнительный  слой  с  вероятностями  – 

«

Trees_Classes_Prob

».  Для  последующей  обработки  полученных  результатов  можно 

использовать инструментарий 

Показать легенду

 (см. 

«Отображение результатов классификаций 

(Показать легенду)»

).

 

Принцип максимальной энтропии. 

Описание алгоритма классификации по принципу максимальной энтропии. 

Одну  из  основных  проблем  в  дешифрировании  снимков  представляет  поиск  объектов  при 

наличии только «положительной» информации, т.е. только данных о местах присутствия данного 

объекта или феномена. Такая задача традиционно решается с использованием сходства яркостных 

характеристик - либо эмпирическими методами, такими, как метод ближайшего соседа, либо чисто 

параметрическими методами, требующими точного знания распределения вероятностей яркостей в 

местах  присутствия  феномена.  В  обоих  случаях  результат  зависит  от  задаваемых  пользователем 

параметров,  в  первую  очередь  позволяющих  отличить  существенные  для  дешифрирования 

признаки от случайного шума, и является скорее искусством, чем наукой.  

Для снижения субъективности в научных исследованиях традиционно применяется принцип, 

получивший название «Бритва Оккама», и состоящий в выборе из всех возможных описаний того, 

которое  имеет  минимальную  сложность  и  не  привносит  в  алгоритм  распознавания  информации, 

 

отсутствующей в данных. Математическим выражением этого принципа в нашем случае является 

принцип максимальной энтропии, кратко описанный ниже. 

Рассмотрим  следующую  задачу:  построить  функцию  плотности  вероятности  присутствия 

некоторого  феномена 

A

  в 

n

  точках  пространства  при  условии  наблюдения  в  этих  же  точках 

пространства  значений  переменных 

1

2

,

,..,

n

X

x x

x

,  например  яркостей  в  каналах  снимка; 

обозначим эту функцию  

1

2

( ),

( , ,...,

)

A

p

f

x x

x

x x

Поскольку  никакой  априорной  информации  о  виде  распределения 

( )

A

f

x

  не  имеется,  то 

использовать  традиционный  метод  максимального  правдоподобия  для  оценки  параметров  не 

представляется  возможным.  Поэтому  мы  будем  искать  такое  распределение,  которое 

«предсказывает»  имеющиеся  данные,  не  добавляя  ничего  нового,  и  является  непрерывной 

функцией.  Вся  доступная  информация  о  распределении 

( )

A

f

x

  представлена  выборкой 

X

которую  мы  считаем  представительной,  поэтому  мы  можем  оценить  выборочные  статистики 

распределения,  например  средние  значения  яркостей  или  их  ковариационную  матрицу.  Если 

выборка  достаточно  велика  (а  для  данных  дистанционного  зондирования  это  обычно  так),  то 

искомое  распределение 

( )

A

f

x

  должно  иметь  те  же  самые  статистики,  что  накладывает  на  него 

ограничения в виде равенств. 

В  общем  случае,  если  мы  имеем 

m

  функций 

( ),

1,2,...,

i

g

i

m

x

  от  наблюдаемых 

переменных,  например 

1

1

( )

g

x

x

,  то  их  математические  ожидания 

( )

A

i

E g

x

=

i

G

  есть  

( )

( )

i

A

g

f

dx

x

x

,  где 

  -  область  возможных  значений 

x

  (для  снимка  –  диапазон  изменения 

яркостей в каналах). Мы считаем, что  эти математические ожидания 

i

G

  известны и совпадают с 

вычисленными по нашей выборке средними, т.е. 

1

(

)

i

k

k

i

G

g

n

x

Для  формализации  задачи  Джейнс  (Jaynes  E.T.,  1957)  предложил  использовать 

относительную  энтропию,  или  меру  различия  распределений  (дивергенцию)  Кульбаха-Лейблера 

(Kullback,  S.,  Leibler,  R.A.,  1951).  Эта  мера  (относительная  энтропия)  определяет  отклонение 

функции плотности распределения 

( )

f x

 от эталонной функции плотности распределения 

0

( )

f x

0

0

( )

,

( ) log

( )

f x

S f f

f x

dx

f x



 

 

и при отсутствии ограничений достигает максимума тогда, когда функция 

( )

f x

 совпадает с 

эталонной 

0

( )

f x

 

Джейнс предложил в качестве эталонного распределения использовать предел «точечного» 

распределения 

( )

A

m

x

, вся вероятность которого сосредоточенна в известных точках 

1

2

( , ,.., )

n

x x

x

 

присутствия  феномена 

A

,  и  искать  распределение 

( )

A

f

x

,  которое  наиболее  близко  к  нему  в 

смысле  указанной  меры  при  условии  выполнения  ограничений.    Таким  образом,  мы  получаем 

задачу максимизации с ограничениями в виде равенств: 

arg max

,

( )

,

1, 2,...,

A

f

i

i

f

S f m

E

g

G i

m





x

 

которая решается методом множителей Лагранжа и приводит к распределению Гиббса вида  

1

1 1

( ) ...

( )

1

( )

( ,...,

)

A

m

m m

g x

g

x

f

Z

e

 

x

 

где 

1

,...,

m

 - полученные при решении множители Лагранжа 

Множитель 

1

( ,...,

)

m

Z

  берется  таким,  чтобы  интеграл  от 

( )

A

f

x

  по  всей  области 

определения равнялся единице. 

Дудик с соавторами (Dudı´k et al., 2004) предложили для решения этой задачи использовать 

функцию логарифмического правдоподобия с пенальти (штрафом): 

1

ln

(

| , )

A

j

i

i

j

i

f

n

 

x

λ g

 

в  которой  искомая  функция  плотности 

( | , )

A

f

x λ g

  имеет  приведенный  выше  вид 

распределения  Гиббса,  а  регуляризирующие  веса 

i

  предотвращают  «переобучение»,  т.е. 

препятствуют  вырождению  распределения 

( | , )

A

f

x λ g

  в  вырожденное  «точечное»  распределение 

( )

A

m

x

  и  способствуют  плавному  изменению  вероятности  при  изменении  значений  переменных. 

Для  вычисления  нормализующей  константы 

1

( ,...,

)

m

Z

  используются  «фоновые»  значения 

переменных, выбранные случайно по всей территории, покрытой снимком. 

Поскольку использование плотности вероятности 

( )

A

f

x

 неудобно, то Стивен и Дудик (Steven 

J.P.,  Dudik  M.,  2008)  предложили  преобразовать  полученную  плотность  вероятности  в  условную 

вероятность,  принимающую  значения  в  диапазоне  от  0  до  1,  что  при  определенных  условиях 

соответствует вероятности присутствия феномена при заданных значениях переменных: 

( | , )

( | )

1

( | , )

H

A

H

A

e f

Q A

e f

x λ g

x

x λ g

 

где 

H

 – энтропия 

( | , )

A

f

x λ g

. Одним из обоснований использования такой формулы является 

то,  что  значение  негэнтропии  близко  к  математическому  ожиданию  логарифма  плотности 

 

( | , )

A

f

x λ g

,  т.е.  его  типичному  значению,  которое,  в  свою  очередь,  значимо  отлично  от  нуля 

только в местах присутствия феномена:  

( | , )ln

( | , )

A

A

H

f

f

 

x λ g

x λ g

 

Поэтому  для  «типичных»  мест  наличия  феномена 

A

  мы  будем  иметь 

( | , )

H

A

f

e

x λ g

  и 

(

| )

Q A

x

  для  них  примерно  равно  0.5.  Таким  образом,  хотя  используемая  мера 

(

| )

Q A

x

  и  не 

является в точности равной вероятности присутствия феномена 

A

, она есть монотонная функция 

от  такой  вероятности,  а  значений  0.5  может  быть  использовано  в  качестве  порогового  для 

детектирования присутствия феномена. 

В качестве примера рассмотрим использование только одной переменной Ch1 и нормальным 

распределением вероятностей феномена с математическим ожиданием, равным 4.0, и СКО, равным 

2. Теоретическая плотность вероятности, и гистограмма, полученная для выборки из 500 значений 
Ch1, соответствующих присутствию феномена, приведены на рисунке ниже (Рис 135)

 

Рис 135.

 

Распределение вероятности наблюдаемого феномена 

В  качестве  статистик  использовались  две  функции, 

1

( )

g

x

x

  и 

2

2

( )

g

x

x

.  В  результате 

применения  описанного  алгоритма  были  получены  значения 

1

3.9776

  и 

2

-17.2319

которым  соответствует  значение  математического  ожидания,  равное  4.12  ,  и  СКО,  равное  2.39, 

 

близкие  к  исходным.  Сравнение  полученных  результатов  с  теоретическими  приведено  ниже  (Рис 

136)

 

Рис 136.

 

Сравнение оценки и теоретического распределения 

Таким образом, при использовании ковариационной матрицы (как это сделано в программе 

Scanex Image Processor) мы получаем возможность аппроксимации распределения феноменов, для 

которых форма распределения является унимодальной и близкой к «колоколообразной». Отличие 

использованного  подхода  от  стандартных  методов  аппроксимации  распределения  нормальным 

состоит  в  том,  что,  во-первых,  при  построении  распределения  используется  вся  информация  о 

снимке, в том числе и распределение яркостей в местах отсутствия феномена, и во-вторых, метод 

допускает  использование  произвольных  функций,  а  не  только  ковариационной  матрицы,  что 
делает  его  гораздо  более  гибким.  Так,  при  использовании  третьих  степеней  переменных  метод 

позволяет  аппроксимировать  несимметричные  распределения,  а  при  использовании  четвертых 

степеней переменных – распределения с формой, близкой к треугольной или прямоугольной. 

Классификация изображений по принципу максимальной энтропии

 

Для  использования  данной  возможности,  в  программе,  используется  диалоговое  окно 

Бинарный  классификатор 

(Рис  137).  Для  вызова  окна  необходимо  выполнить  команду 

Классификация 

 С учителем 

 

Максимальная энтропия 

 

Бинарный классификатор

 

главного меню программы. 

 

 

Рис 137.

 

Диалоговое окно 

Бинарный классификатор

 

Выпадающий  список  группы

 

Выберите  растры

  –  позволяет  задать  растровые  каналы, 

участвующие  в  классификации.  Используемые  каналы  должны  иметь  одинаковый  базис 

(размер в пикселях, пространственное разрешение пикселя и одинаковую географическую 

привязку),  в  случае  если  данное  условие  не  соблюдено,  выводится  соответствующее 

сообщение.  Для  приведения  каналов  к  требуемому  виду,  можно  воспользоваться 

инструментарием 

Экстент

. 

Кнопка

 

Добавить

 – добавляет текущий канал к списку участвующих в обработке. 

Ниже в окне располагается список всех участвующих в обработке каналов. 

Кнопка

 

Убрать

  –  позволяет  удалить  из  списка  участвующих  в  обработке  каналов  выделенный 

канал. 

Кнопка

 

Убрать все

 – позволяет очистить список участвующих в обработке каналов. 

Кнопка

 

Добавить  все

  –  позволяет  добавить  к  списку  участвующих  в  обработке  каналов,  все 

загруженные в программу растровые каналы.  

Группа

 

Векторная  маска  обучающих  образцов

  –  определяет  векторную  маску  с  эталонами, 

участвующими  в  обработке.  Минимально  допустимый  объем  выборки  (минимальное 

количество  пикселей,  формирующих  эталоны)  составляет  100  пикселей,  в  случае,  если 

объем выборки меньше, выводится соответствующее сообщение (Рис 138). 

 

Выпадающий  список 

– 

позволяет 

выбрать  один  из  загруженных  в 

программу векторных слоев. 

Флаг

 

Ограничение  по  полю

  –  при 

включении 

позволяет 

использовать  в  качестве  эталонов 

только  те  векторные  объекты, 

которые удовлетворяют заданному 

в 

соответствующих 

элементах 

управления условию: 

Выпадающий

 

список

  –  позволяет  выбрать  название  атрибутивного  поля  векторного  слоя,  по 

которому будет произведен отбор импортируемых объектов. 

Выпадающий список

 

Условие

 – позволяет установить условие: 

 

== - равенство значению, указанному в поле 

Значение

 

!= - неравенство значению, указанному в поле 

Значение

 

< - меньше указанного в поле 

Значение

 значения. 

 

> - больше указанного в поле 

Значение

 значения. 

 

<= - меньше или равно указанному в поле 

Значение

 значению. 

 

>= - больше или равно указанному в поле 

Значение

 значению. 

Поле

 

ввода

 

Значение

  –  позволяет  установить  значение  атрибутивного  поля  векторного 

объекта, с которым будет выполняться сравнение. 

Группа

 

Векторная  маска  классификации

  –  позволяет  определить  «область  интереса»  при 

обработке.  

Выпадающий список группы

 – позволяет выбрать один из загруженных в программу векторных 

слоев,  в  пределах  контуров  которого  будет  выполнена  классификация.  Данный 

векторный  слой  должен  иметь  один  или  более  полигональных  объектов.  Либо  задать 

«область интереса» с помощью 

инструмента 

Выбор регион

а. 

Кнопка

 

Выполнить

 – инициирует процесс классификации методом максимальной энтропии. 

Кнопка

 

Отмена

 – закрывает диалоговое окно. 

 

В  процессе  классификации  методом  максимальной  энтропии  может  возникнуть 

предупреждающее  сообщение  (Рис  139),  возникающее  при  слабой  корреляции  какого-либо  из 

каналов с остальными, участвующими в обработке. Например, при бинаризации теплового канала 

вместе с каналами видимого или ближнего инфракрасного диапазонов. Не является ошибкой, и, в 

зависимости  от  поставленной  задачи,  бинаризация  подобного  сочетания  каналов  оправдана  и 

может дать хорошие результаты. 

 

Рис 138.

 

Сообщение об ошибке в связи с 

недостатком обучающих образцов 

 

 

Рис 139.

 

Диалоговое окно 

Предупреждение 

о слабой 

сочетаемости каналов 

Результатом 

обработки 

будет 

являться 

новый 

растровый 

слой 

с 

именем 

«

class_probability»

,  значения  яркости  пикселей  которого,  должны  интерпретироваться,  как 

нормированная  вероятность  присутствия  эталона  в  текущем  пикселе  в  диапазоне  [0-1].  Для 

визуализации данного растрового слоя можно использовать инструментарий градиентной палитры, 

о  котором  написано  в  разделе 

«Отображение  растров  в  режиме  градиентной  палитры»

  данного 

руководства пользователя. 

В случае необходимости, полученный растровый слой с вероятностями можно нормировать 

в  другой  диапазон  (например,  в  диапазон  [0-100]),  или  бинаризовать  используя  пороговое 
значение.  Для  выполнения  этих  операции  можно  использовать  макросы,  входящие  в  состав 

поставки программного обеспечения, или создать собственные макросы.  

Для нормализации вероятностей в другой диапазон можно использовать макрос, доступный 

по  команде 

Классификация 

  С  учителем 

  Максимальная  энтропия 

 

Умножить 

вероятности. 

Появится диалоговое окно 

Умножить вероятности

 (Рис 140). 

В 

выпадающем  списке

 

Вероятность

  –  необходимо  указать  растровый  слой  с  вероятностями 

(

class_probability

),  создаваемый  автоматически  после  классификации  с  использованием 

метода максимальной энтропии (

Бинарный классификатор

). 

В 

поле  ввода

 

MaxVol

  –  задается  максимальное  значение  нормированного  выходного  растрового 

слоя. 

Группа 

Выходной растр

 – позволяет настраивать параметры выходного растра: 

Поле ввода

 - задает название выходного растра. 

Группа

 

переключателей

 

Домен

  –  задает  область  вычислений  в  случае,  если  используются 

более одного растрового канала: 

Переключатель

 

Объединение

  –  задает  вычисление  по  общему  размеру  используемых 

растровых каналов. 

Переключатель

 

Пересечение

 – задает вычисление по области пересечения растров. 

В данном случае эти элементы управления не используются, так как обрабатывается только 

один растровый канал. 

 

Флаг

 

Выходной  растр  в  базисе  первого  входного

  –  отменяет  ресамплинг 

результирующего  растра  в  базис  рабочего  проекта.  Более  подробно  о  ресамплинге 

рассказано в разделе 

"Инструментарий Экстент"

 руководства пользователя. 

Выпадающий 

список

 

Векторная  маска

  – 

позволяет  ограничить 

зону 

обработки, 

используя 

векторный 

слой  или  выделенную 
прямоугольную  область 

(

Выбранный регион

). 

Данный 

элемент 

управления может быть 

использован,  только  в 

случае  если  выключен 

флаг 

Выходной растр 

в  базисе  первого 
входного

Группа 

Параметры  – 

отвечает 

за 

дополнительные 

условия: 

Группа 

переключателей

 

Фильтры 

передискретизации

 – задает фильтр свертки, при помощи которого будет выполняться 

ресамплинг  изображения.  Более  подробно  о  ресамплинге  рассказано  в  разделе 

"Инструментарий Экстент"

 руководства пользователя. 

Поле ввода

 

Радиус вычислительных фильтров

 – в данном случае не используется. 

Поле  ввода

 

Выходное  значение  «нет  данных»

  –  позволяет  определить  значение  «нет 

данных» для результирующего растрового слоя.

 

Флаг

 

Не  определять  домен  по  векторной  маске

  –  при  включении  флага  выключается 

использование  векторной  маски  для  ограничения  зоны  обработки  пикселей.  Включение 

данной  опции  может  потребоваться  в  случае  необходимости  обработать  фрагмент 

растра, лежащий вне полигонального объекта векторного слоя.  

Флаг

 

Игнорировать «нет данных» входных растров

 – исключает при обработке значения 

яркости входных каналов, соответствующие значению «нет данных». 

Кнопка

 

Выполнить

 – подтверждает выполнение обработки. 

Кнопка

 

Отмена

 – отменяет выполнение обработки и закрывает интерфейсный диалог. 

 

Рис 140.

 

Диалоговое окно 

Умножить вероятности

 

 

 

 

 

 

 

 

содержание      ..     13      14      15      16     ..