|
Главная -> Дистанционное зондирование 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 [116] 117 118 119 120 121 122 123 124 125 126 127 128 129 ходима оценка десятимерной статистики по пяти обучающим выборкам. Для наших целей, однако, важным является то, что есть максимум, т. е. существует оптимальная сложность измерений. Эти результаты были получены теоретически, но такое явление наблюдалось и на практике. На рис. УП.5 приведены некоторые результаты, полученные с использованием пробной классификации 12-канальных данных дистанционного зондирования [5]. В классификации использовались все 12 спектральных каналов и определенное обучающее множество. Затем такая же классификация с этим же обучающим множеством выполнена <с использованием оптимально определенных подмножеств 12 признаков. На рис. VII.5 показана точность в зависимости от числа признаков. Видно, что максимум этой кривой соответствует вычисленному теоретически. В этом случае самая высокая точность была для трех признаков, причем она была намного выше точности классификации, полученной по 12 признакам. Результат второго исследования: влияние шума Перейдем ко второму эксперименту, который поможет установить параметры системы датчиков. В этом случае исследование проводилось для определения влияния шума на анализ многоспектральных данных методом распознавания образов Рис. VII.6. Аэрофотоснимок части тестового участка для эксперимента по определению чувствительности к шуму [6] [6]. Данные по сельскохозяйственной области собирались многоспектральным сканером, затем к ним для образования модифицированных множеств данных добавлялся смоделированный шум различного уровня. Все множества данных анализировались одинаково и результаты сравнивались. На рис. VII.6 при- « 60 ........2 0 2 5 7 15 17 Стандартное отклонение шума, Рис. VII. 10. Оси главных компонен] в двухмерном пространстве Рис. VII.9. Точность распознавания в зависимости от уровня наложенного шума [6]: 1 - пшеница, 2 - соя, 3 - обш,ая средняя точность для всех класса» веден обычный аэрофотоснимок небольшой части тестового-участка, использовавшийся для справок. На рис. УП.7 приведена распечатка одного канала данных, сначала без шума, а затем с различными уровнями добавленного шума. Уровень шума о - стандартное отклонение шума в единицах уровней яркости. Другими словами, 0 = 5 - это такой уровень шума, при котором стандартное отклонение шума равно пяти уровням яркости от обшего количества, равного 256. На рис. VU.8 дан результат классификации данных, по которому можно определить качественное ухудшение точности классификации при увеличении уровня шума. На этом рисунке все точки, отнесенные к классу пшеницы, обозначены ,,w", а точки, отнесенные ко всем остальным классам, -пробелами. (Из-за уменьшения рисунка «w» изобразились в виде точек.) На рис. VII.9 результаты пробной классификации представлены в количественной форме. Дана средняя точность для двух отдельных классов. Хотя эти кривые, как и предполагалось, направлены вниз, относительно этих двух классов необходимо отметить следуюшее. Сбор множества данных произведен в начале лета с тестового участка сельскохозяйственной зоны США. В это время года пшеница созревает, приобретает золотисто-коричневый цвет и готова к уборке. В то же время соя, посеянная всего несколько недель назад, еше не полностью распустила листву и лишь незначительная часть земли закрыта ею. В результате класс пшеницы относительно легко отличить от других классов этой сцены, а с классом сои это сделать значительно сложнее. Заметим, что при добавлении в данные шума точность распознавания более сложного для идентификации класса сои ухудшается гораздо быстрее, чем точность распознавания класса пшеницы. И, действительно, хотя проект классификатора привел к хорошей точности классификации сои при отсутствии шума (выше среднего уровня), в условиях шума точность ее классификации быстро падала, тогда как точность классификации пшеницы оставалась гораздо выше среднего уровня. Это говорит о том, что чем более трудным для классификации является класс, тем более сильное влияние на него оказывает уменьшение отношения сигнал/шум. Результат третьего исследования: существенная размерность Перейдем к третьему исследованию, которое должно быть рассмотрено до образования списка параметров системы датчиков. Методы сжатия данных позволяют передавать или хранить небольшое число бит данных без потери информации. Таким образом, приходим к выводу, что с помощью исследований по сжатию данных можно определить объем реально имеющейся информации по отношению к количеству необработанных данных. Один метод сжатия данных показан на рис. VH.IO. Здесь приведена гипотетическая кривая распределения данных в одном измерении в зависимости от распределения в другом. Предположим, что имеются данные, распределенные в оконтуренной области двухмерного пространства. Мы можем определить новую систему координат, одна ось которой yi расположена в направлении распределения, как показано на рис. VH.IO, а другая г/2 - перпендикулярна к первой. Необходимая для это-то математическая операция проста: значения данных в новой системе координат получаются путем линейной комбинации значений данных в старой системе координат где Хь Х2 - координаты данных в старой системе координат, а i/i, уо - координаты данных в новой системе координат. При таком преобразовании динамический диапазон новой координаты г/1 гораздо больше, чем исходных координат Xi или Х2, а диапазон г/2 - небольшой. Такую же операцию можно выполнить для данных в пространствах большей размерности. Одну за другой определяют новые координаты, и каждый раз новая координата перпендикулярна ко всем выбранным ранее и направлена по максимальной плотности динамического диапазона. Это преобразование называется методом главных компонент [7]. Когда имеют дело с данными со степенью корреляции или избыточности компонент, что свидетельствует о вытянутом распределении в п-мерном пространстве (а это обычно для многоспектральных данных), этот метод можно использовать для представления данных в пространстве более низкой размерности без значительной потери информации. На pnc.VH.ll показан 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 [116] 117 118 119 120 121 122 123 124 125 126 127 128 129 0.0133 |
|