|
Главная -> Дистанционное зондирование 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 [57] 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 признак, или вектор признаков, может быть любым математическим преобразованием измерений образа. Это очень широкое определение. В дальнейшем ограничимся обсуждением трех часто используемых в приложениях дистанционного зондирования преобразований, а именно: отбор подмножества признаков, отношения и линейные комбинации. Подмножества. Нахождение подмножеств признаков - просто отбор признаков. Блок выделения признаков передает т измерений, подавляя оставшиеся. Конечно, т не превышает п, размерности исходного пространства измерений.
Результат Рис. III.22. Система распознавания образов с блоком выделения признаков Отношения. В этом случае каждый из пг компонент вектора признаков (снова m<in) -отношение двух измерений образа, т. е. У] = XifXk / = 1, 2,..., m; I iik) kn. В этом случае следует избегать ситуаций, когда Xfe = 0. Для конкретных применений дистанционного зондирования были найдены подходящие отношения признаков путем рассуждений, базирующихся на физической сущности связанных с ними явлений и на экспериментах. Иногда используются отношения, в которых числитель и знаменатель представляют собой суммы или разности измерений образов, что преследует цель «вычитания» или «сокращения» нежелательных влияний атмосферы или меняющейся освещенности сцены. Линейные комбинации. Каждый из т компонент вектора признаков {m<in) является линейной комбинацией измерений образа, т. е. t/y = bjXi + bjx. + •+ bjnXn /=1,2,..., m, (111.40)- где все bji - константы. Для записи (П1.40) можно использовать векторное/матричное обозначение, введенное в разделе П1.5, Y = ВХ, &01&00. - Ь. у ••Ьп (111.41) - bnibm- В данном случае мы должны знать, как выбрать т и как определить тп констант в матрице Ь; как обычно, наша цель - мак- симйзировать точность классификации при минимизации времени вычислений, необходимого для классификации. Методы для достижения этой цели выходят за рамки нашего рассмотрения. Заинтересованный читатель может обратиться к литературе [10, 11]. Представленные три метода выделения признаков в дистанционном зондировании относительно просты. Возможны гораздо более сложные признаки, включая признаки, учитывающие пространственные и временные вариации данных, однако уровень сложности препятствует их рассмотрению здесь. Эффективное использование таких признаков - предмет продолл<аю-щегося изучения как в дистанционных исследованиях, так и в обработке изображений. Важно понимать, что при выборе признаков нельзя игнорировать предположений, касающихся классификатора. Например, мы подробно рассматривали классификатор по максимуму правдоподобия, предполагающий нормальное распределение данных для каждого класса. Если исходные измерения образов имеют нормальное распределение, классификатор может использоваться с признаками, состоящими из любого поднабора или линейной комбинации измерений, так как такие признаки также распределены нормально. Однако признаки, которые становятся отношениями нормально распределенных измерений, не подчиняются нормальному распределению и не должны использоваться с таким классификатором. Задачи 111.19. Укажите по крайней мере две причины, почему желательно уметь давать оценку вероятности ошибки классификатора. 111.20. Используя рисунок, аналогичный рцс. 111.23, объясните, как вероятность ошибки в классификации может быть связана с перекрытием функций распределения вероятностей классов. Ваше объяснение должно включать интерпретацию членов в выражении для вероятности ошибки [см. уравнение (III.26)]. 111.21. Опишите три способа оценки вероятности ошибки классификатора, отмечая преимущества и Рис. III.23 недостатки каждого. II 1.22. Опишите в общих терминах понятие статической разделимости и объясните, почему оно применимо в качестве индикатора вероятности ошибки. III.23. Назовите две причины, по которым J-M расстояние - более полезная мера статистической разделимости, чем дивергенция. I1I.,24. Многоспектральные сканеры на борту природно-ресурсных искусственных спутников Земли Ландсат 1 и Ландсат 2 были 4-канальными. На орбитальной станции Скайлаб был 13-канальный сканер. Предполагая, что для анализа данных применяется классификатор по правилу максимума правдоподобия, использующий нормальные статистики, сравните время вычислений, требуемое для классификации данных Ландсат (все четыре диапазона длин волн) с временем, требуемым для классификации данных Скайлаб (все 13 диапазонов длин волн). 12* 179 111.26. Ркпользуя рис. 111.22, объясните роль выделения признаков в распознавании образов и опишите три операции выделения признаков, обычно используемых в прикладных дистанционных исследованиях. Цели изучения. После изучения разд. П1.10 и П1.11 читатель должен уметь: 1. Дать нематематическое, интуитивное определение кластерного анализа. 2. Указать двспособа, которыми кластерный анализ может оказать помощь в анализе многомерных данных. 3. Перечислить три существенных элемента математического определения кластера и проиллюстрировать приведением двух или более примеров одного из этих элементов тот факт, что кластерный анализ - операция, которая может быть определена многими способами. 4. Описать различия между контролируемой и неконтролируемой классификациями, соответствующим образом используя такие термины, как спектральные классы, информационные классы, обучающие выборки, области решения и кластер. 5. Сформулировать условия, при которых можно ожидать хорошую работу методов неконтролируемой классификации. 6. Дать по крайней мере три практических ограничения контролируемой классификации. 7. Объяснить цель или функцию каждого шага в типичной процедуре цифрового анализа данных дистанционного зондирования (например, табл. И1.1). 111.10. Кластерный анализ, неконтролируемый анализ В разд. П1.5 отмечалось, что для применения на практике предположения о том, что классы имеют многомерные нормальные функции распределения вероятностей, необходим метод для обнаружения случаев, когда функции распределения вероятностей многомодальны (имеют более одного максимума), поскольку в этих случаях предположение о нормальности не выполняется. В подобных ситуациях мы должны также уметь разделить такой класс или классы на подклассы, каждый из которых имеет одномодальные и приблизительно нормальные функции распределения вероятностей. Мы дадим решение этой задачи, применяя форму анализа, называемую кластерным анализом, и покажем далее, что он обеспечивает метод неконтролируемой классификации, особенно полезный, когда число обучающих выборок сильно ограничено или оно вообще отсутствует. Кластерный анализ Тот факт, что функция плотности вероятностей, подобная изображенной на рис. П1.10, имеетj;y, или максимум в некоторой области пространства измерений, означает, чтоб6льшая часть векторов измерений стремится расположиться в этой об-180 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 [57] 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 0.0127 |
|