|
Главная -> Дистанционное зондирование 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 [70] 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 взаимосвязей между этими объектами. Другие операции, приведенные в табл. IV.4, предназначены для снятия различных, видов шумов, возмол<но, привнесенных системой сбора данных,, и тем самым могут быть использованы для улучшения последующего классификационного анализа. Статистический анализ - другой очень общий термин. Мы используем его здесь применительно к классу количественных, (численных) методов, которые помогают характеризовать данные часто для обучения классификатора. Однако нередко эти методы используются в других целях, таких как оценивание альтернативных планов сбора данных или определение качества других результатов анализа (таких, как классификация). Некоторые статистические методы рассмотрены в гл. HI и VI этой книги. Кластерный анализ, выделение признаков и классификация. также рассматриваются в гл. III. Однако материал в ней ограничен в двух отношениях: он имеет дело только со спектральными характеристиками данных, игнорируя их пространственный и временной аспекты; и внимание в основном сосредоточено на одном примере каждой функции обработки. Читатель, заинтересованный в углубленном изучении этих проблем, должен обратиться к литературе, приведенной в табл. IV.4. Результаты, полученные на запросы пользователя, часто включают значительно больше возможностей обработки, чем простое воспроизведение карт или печать сводных таблиц. Об этом уже говорилось при рассмотрении подсистемы вывода в начале главы. Для пользователя, которому нужны карты, задание нового формата и аннотация «необработанных» результатов классификации, требуются минимальные дополнительные этапы обработки. Получение табличных сводок может потребовать расширенного статистического анализа результатов классификации для приведения их к виду, необходимому для представления, у > в ряде практических случаев прямой вывод результатов классификации в виде твердой копии не является сам по себе достаточным для удовлетворения запросов пользователя. Лучше, если результаты классификации хранятся в вычислительной системе, и пользователь имеег к ним доступ и может работать с ними в интерактивном режиме. В этом случае результаты являются действительно данными, пригодными для ввода их в другие типы систем для хранения, поиска и обработки. Если бы все возможности обработки, перечисленные в табл. IV.4, должны были осуществляться в одной системе обработки данных, то интерфейс между аналитиком данных и системой настолько бы усложнился, что эффективность работы аналитика значительно бы уменьшилась. Он просто не знал бы, что ему выбрать! Поэтому подсистема анализа, состоящая из соответствующего подмножества этих возможностей обработки, вероятно, является более эффективным средством для аналити- ка, чем та же подсистема, пытающаяся реализовать их все. Тогда узловым моментом проектирования системы становится определение соответствующего подмножества. В самом начале главы мы отметили, что проектирование оптимальной системы обработки данных дистанционного зондирования в большой степени зависит от назначения системы, и теперь мы видим главную причину этой зависимости. Если, например, система должна использоваться для функционального или поточного получения выходных материалов, то работа ее должна быть хорошо налаженной, и основное внимание при проектировании уделяется простоте и эффективности. Если же система предназначена главным образом для исследований, основное внимание будет уделено, вероятно, гибкости, т. е. широкому выбору методов, из которых можно получить процедуры анализа. Другие аспекты назначения системы, которые являются важными факторами при ее проектировании, включают характеристики данных (объем, сложность), типы приложений, в которых должен применяться процесс анализа, и предполагаемую опытность пользователей и аналитиков данных. Эти факторы влияют не только на выбор процедур обработки данных, но и на способ их реализации. Возможен большой набор компромиссов между аппаратурой и программным обеспечением. Если цель - поточная работа, из соображений эффективности многие основные процессы могут быть реализованы на специализированном оборудовании. Если же для исследований главное - гибкость, то наиболее приемлемой является программная реализация на универсальной ЭВМ. Многие из тех же самых факторов влияют на определение интерфейса между подсистемой анализа и аналитиком данных. Мы называем этот интерфейс интерактивной подсистемой, которая рассматривается в следующем разделе. Задачи IV.13. Учет чьих требований более важен при проектировании подсистемы .•анализа - пользователя или аналитика данных? В каких отношениях? IV.,14. При использовании в подсистеме анализа менее мош;ного алгоритма классификации обсудите последствия для пользователя. IV.15. Повлечет ли большая гибкость подсистемы анализа (скажем, шесть алгоритмов кластерного анализа вместо одного) снижение степени мастерства .аналитика? Обсудите этот вопрос. IV. 16. Какие из функций обработки, перечисленные в начале разд. IV.4, можно включить: а) в подсистему ввода, б) в подсистему вывода? Цели изучения. После изучения разд. IV.5 читатель должен уметь: 1. Определить роль интерактивной подсистемы в системе обработки данных. 2. Обсудить вопрос о том, как могут измениться требования к интерактивной подсистеме при изменении требований пользователя. IV.5. Интерактивная подсистема Даже те, кто рассматривает полностью автоматизированную обработку данных дистанционного зондирования как задачу будущего, охотно согласятся с тем, что в понятиях современной технологии «человек как элемент системы», аналитик данных является необходимой частью любой эффективно современной системы обработки данных дистанционного зондирования. Существуют две связанные между собой причины уникальной роли человека в системе. Первая заключается в его способности, эффективно получать и сохранять сведения «общей картины»,, т. е. не только о полном множестве данных дистанционного зондирования, но также и о соответствующих справочных данных,, возможно имеющихся в различных форматах и на различных носителях, и связях между справочными данными и данными дистанционного зондирования. Вторая причина - его врожденная способность делать выборку данных, доступных ему, существенно используя предыдущий опыт и знания для принятия ответственных рещений. Другими словами, человек проявляет высокий уровень интеллектуального поведения при управлении процессом анализа. Для сравнения, современные ЭВМ способны только на относительно примитивный уровень «искусственного интеллекта». За один раз они могут учитывать только несколько битов, а их способность синтезировать «общую картину» по данным и рассуждать не идет ни в какое сравнение с человеческой. Они несколько компенсируют эти недостатки своим быстродействием и вычислительными способностями - характеристиками, которые мы используем при проектировании всей системы обработки данных. Но вычислительная наука должна соверщить какой-то существенный скачок в области искусственного интеллекта, прежде чем мы сможем ожидать полного исключения человека из процесса анализа данных дистанционного зондирования. Задача, следовательно, в проектировании интерактивной подсистемы сводится к обеспечению взаимодействия человека с мащиной и данными настолько эффективно, насколько это возможно. Перечислим основные элементы этой подсистемы в том порядке, в каком мы их будем рассматривать, а именно: 1) поиск данных, 2) интерфейс аналитик/данные, 3) интерфейс аналитик/система обработки данных, 4) интерфейс аналитик/результаты, 5) распределенный доступ, 6) обучение аналитиков данных, 7) требования к аппаратуре. Как и для других элементов системы обработки данных, относительная важность каждого из перечисленных зависит от конкретного характера среды, в которой должна использоваться система. Поиск данных Осуществление доступа к интересующему нас множеству (множествам) данных может быть одним из наиболее дорогостоящих и требующих больших затрат времени аспектов взаи- 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 [70] 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 0.0105 |
|