SlideShare a Scribd company logo
1 of 26
НЕКОТОРЫЕ ВОПРОСЫ
ТЕМАТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ
            ЗЕМЛИ

     Бучнев А.А., Пяткин В.П.
        ИВМиМГ СО РАН
Центральные вопросы тематической
обработки (интерпретации) данных
дистанционного зондирования Земли
(ДДЗЗ) – вопросы повышения качества
дешифрирования – непосредственно
связаны с проблемой выбора
адекватных алгоритмов
распознавания. Возникающие при
этом трудности обусловлены
следующими причинами:
1. Структура реальных данных не соответствует модели
   данных, используемой в алгоритме. Например,
   невыполнение предположения о нормальном
   распределении векторов данных или невыполнение
   условия, что поле измерений является случайным.
2. Непрезентативность обучающих последовательностей –
   недостаточное количество данных для восстановления
   параметров решающего правила.
3. Несоответствие обучающих данных и данных,
   предъявляемых на распознавание (“загрязнение”
   выборок смешанными векторами измерений, т.е.
   векторами, которые образуются при попадании в
   элемент разрешения съемочной системы нескольких
   природных объектов).
4. Неточное соответствие обучающих данных,
   получаемых с помощью кластеризации, истинным
   тематическим классам.
5. Помехи аппаратуры, атмосферных условий и т.п.

Таким образом, можно сказать, что современный
опыт автоматизированного распознавания ДДЗЗ
показывает: заранее практически невозможно уста-
новить, какой алгоритм будет лучше с точки зрения
точности классификации. Поэтому в распознающую
систему целесообразно закладывать несколько
алгоритмов и выбор оптимального алгоритма
проводить эмпирически.
Наличие смешанных векторов в ДДЗЗ является,
вероятно, одним из наиболее серьезных
источников ошибок при построении
тематической карты классификации.
В классификации ДДЗЗ чаще других
используются методы, которые можно разбить
на две группы: классификация с обучением
(контролируемая классификация) и
кластерный анализ (автоматическая
классификация).
Большинство алгоритмов классификации для
отнесения векторов признаков классам
вычисляют для каждого вектора значения
подходящей функции «правдоподобия».
Классификатор Байеса для нормально
  распределенных векторов признаков
Поэлементный и объектные классификаторы.
Поскольку физические размеры реально
сканируемых пространственных объектов, как
правило, больше разрешения съемочных
систем, между векторами признаков
существуют взаимосвязи. Использование
информации подобного рода дает
возможность повысить точность
классификации, если пытаться распознавать
одновременно блок смежных векторов
квадратной или крестообразной формы.
Необходимые для построения решающих
функций классов оценки статистических
характеристик – векторов средних и
ковариационных матриц, коэффициентов
пространственной корреляции между
значениями координат соседних векторов в
горизонтальном и вертикальном
направлениях – определяются на основе
векторов из обучающих выборок (полей).
Алгоритмы кластеризации:
•    Иерархические
     - Восходящие (аггломеративные): отдельная связь, полная
     связь, связь центроидов,…
    - Нисходящие
    М. Жамбю. Иерархический кластер-анализ и соответствия.
     Пер. с фр. М., Финансы и статистика, 1988.
•    Squared-Error Based
    К-средних, ISODATA (Iterative Self-Organizing Data
     Analysis Technique), ..
•    pdf оценивание через плотности смеси (Mixture Densities)
•    Graph Theory-Based
•    Fuzzy (Fuzzy C-means)
•    Neural Networks-Based
•    Sequential Data
МЕТОД АНАЛИЗА МОД МНОГОМЕРНОЙ ГИСТОГРАММЫ
Алгоритм К-средних может быть отнесен к классу параметрических, т.к. он
неявным образом предполагает природу плотности вероятности: кластеры
стремятся иметь конкретную геометрическую форму, зависящую от
выбранной метрики. Альтернативой является подход, основанный на
предположении, что исходные данные являются выборкой из многомодового
закона распределения, причем векторы, отвечающие отдельной моде,
образуют кластер [1, 2]. Таким образом, задача сводится к анализу мод
многомерных гистограмм.

1. P.M. Narendra, Goldberg. A non-parametric clustering scheme for landsat.
Pattern Recognition, vol. 9, 1977, pp. 207-215.

2. В.А. Красиков, В.А. Шамис. Кластерная процедура на базе многомерной
гистограммы распределения. Исследование Земли из космоса, № 2, 1982, с.
107-114.
3. Асмус В.В. Программно-аппаратный комплекс обработки спутниковых
данных и его применение для задач гидрометеорологии и мониторинга
природной среды.// Диссертация (научный доклад) на соискание ученой
степени доктора физико-математических наук. На правах рукописи. Москва
– 2002, - 75 с.
ГИБРИДНЫЙ МЕТОД: АНАЛИЗ МОД МНОГОМЕРНОЙ
  ГИСТОГРАММЫ С ПОСЛЕДУЮЩЕЙ ИЕРАРХИЧЕСКОЙ
                        ГРУППИРОВКОЙ
Cистема кластеризации дополнена двухэтапной процедурой (с
сохранением всех ранее существовавших функций): на первом этапе
выполняется предварительное разбиение исходной выборки на
кластеры с помощью модального анализа, а затем для получения
окончательного результата используется иерархическая группировка.
Применение иерархической группировки для кластеризации
исходного набора векторов нереально из-за того, что используемая в
алгоритме матрица расстояний состоит (в начале работы алгоритма)
из N(N-1)/2 элементов, где N – количество векторов. Предварительное
использование модального анализа позволяет сократить объем данных
до разумных пределов. В качестве входных данных для иерархической
группировки используются векторы средних группы векторов,
связанных с каждой модой многомерной гистограммы. Напомним, что
на каждом шаге восходящей иерархической классификации
объединяются два кластера, расстояние между которыми минимально.
Среди всех возможных расстояний между кластерами для ускорения
вычислений используется простейшее – расстояние между векторами
средних в кластерах.
Достоинством иерархической группировки является то, что после
построения иерархического дерева кластеризации можно “разрезать”
его на любом уровне иерархии, т.е. получать разные кластерные
карты, не запуская снова процесс кластеризации.
Паводок в районе
Камня-на-Оби 04.05.2011
Контролируемая классификация (8 классов) и
кластеризация методом К-средних (10 кластеров)
Жесткая и нечеткая кластеризации
Объемы полученных кластеров
 125000

 100000

  75000

  50000

  25000

      0
Затопление поймы Оби в районе пос.
Молчаново (Томская область, 26.06.2010)
Контролируемая классификация
К-средних (80 кластеров, 1.5 сигма)
Кластеры воды
Усть-Чарыш: 29.05.2004 (Метеор-3М) и
       27.04.2010 (MODIS/Terra)
Контролируемая классификация и
      кластерный анализ
Зона Обского водохранилища
  19.04.2011 (MODIS/Terra)
Метеор-М №1 03.04.2012
К-средних и С-средних (20 кластеров)

More Related Content

Viewers also liked

Изображения в ArcGIS. Практические советы.
Изображения в ArcGIS. Практические советы. Изображения в ArcGIS. Практические советы.
Изображения в ArcGIS. Практические советы. Konstantin Nagornyuk
 
практ работа 3 4
практ работа  3 4практ работа  3 4
практ работа 3 4malina93
 
Загрязнение воздуха в Кривом Роге
Загрязнение воздуха в Кривом РогеЗагрязнение воздуха в Кривом Роге
Загрязнение воздуха в Кривом РогеYevhen Vasylenko
 
Практика дистанционного зондирования земель сельхозназначения в Ставропольско...
Практика дистанционного зондирования земель сельхозназначения в Ставропольско...Практика дистанционного зондирования земель сельхозназначения в Ставропольско...
Практика дистанционного зондирования земель сельхозназначения в Ставропольско...агрохимцентр "Ставропольский"
 
дистанционное зондирование земли
дистанционное зондирование землидистанционное зондирование земли
дистанционное зондирование землиGulnaz Sayan
 
Web AppBuilder for ArcGIS. расширенные возможности
Web AppBuilder for ArcGIS. расширенные возможностиWeb AppBuilder for ArcGIS. расширенные возможности
Web AppBuilder for ArcGIS. расширенные возможностиKonstantin Nagornyuk
 
Biatov A.P. "GIS for zoologists" - the Institute of Zoology NAS of Ukraine, K...
Biatov A.P. "GIS for zoologists" - the Institute of Zoology NAS of Ukraine, K...Biatov A.P. "GIS for zoologists" - the Institute of Zoology NAS of Ukraine, K...
Biatov A.P. "GIS for zoologists" - the Institute of Zoology NAS of Ukraine, K...Anton Biatov
 
Порівняння обсягів забруднення окремих областей України
Порівняння обсягів забруднення окремих областей УкраїниПорівняння обсягів забруднення окремих областей України
Порівняння обсягів забруднення окремих областей УкраїниSasha Tsymbalyuk
 
Introduce variable/ Indices using landsat image
Introduce variable/ Indices using landsat imageIntroduce variable/ Indices using landsat image
Introduce variable/ Indices using landsat imageKabir Uddin
 
Band Combination of Landsat 8 Earth-observing Satellite Images
Band Combination of Landsat 8 Earth-observing Satellite ImagesBand Combination of Landsat 8 Earth-observing Satellite Images
Band Combination of Landsat 8 Earth-observing Satellite ImagesKabir Uddin
 
Landsat 8 OLI (Operational Land Imager)
Landsat 8 OLI (Operational Land Imager)Landsat 8 OLI (Operational Land Imager)
Landsat 8 OLI (Operational Land Imager)Haris Khan
 
Image classification and land cover mapping
Image classification and land cover mappingImage classification and land cover mapping
Image classification and land cover mappingKabir Uddin
 

Viewers also liked (13)

Изображения в ArcGIS. Практические советы.
Изображения в ArcGIS. Практические советы. Изображения в ArcGIS. Практические советы.
Изображения в ArcGIS. Практические советы.
 
практ работа 3 4
практ работа  3 4практ работа  3 4
практ работа 3 4
 
Загрязнение воздуха в Кривом Роге
Загрязнение воздуха в Кривом РогеЗагрязнение воздуха в Кривом Роге
Загрязнение воздуха в Кривом Роге
 
Практика дистанционного зондирования земель сельхозназначения в Ставропольско...
Практика дистанционного зондирования земель сельхозназначения в Ставропольско...Практика дистанционного зондирования земель сельхозназначения в Ставропольско...
Практика дистанционного зондирования земель сельхозназначения в Ставропольско...
 
дистанционное зондирование земли
дистанционное зондирование землидистанционное зондирование земли
дистанционное зондирование земли
 
Web AppBuilder for ArcGIS. расширенные возможности
Web AppBuilder for ArcGIS. расширенные возможностиWeb AppBuilder for ArcGIS. расширенные возможности
Web AppBuilder for ArcGIS. расширенные возможности
 
Biatov A.P. "GIS for zoologists" - the Institute of Zoology NAS of Ukraine, K...
Biatov A.P. "GIS for zoologists" - the Institute of Zoology NAS of Ukraine, K...Biatov A.P. "GIS for zoologists" - the Institute of Zoology NAS of Ukraine, K...
Biatov A.P. "GIS for zoologists" - the Institute of Zoology NAS of Ukraine, K...
 
Порівняння обсягів забруднення окремих областей України
Порівняння обсягів забруднення окремих областей УкраїниПорівняння обсягів забруднення окремих областей України
Порівняння обсягів забруднення окремих областей України
 
LANDSAT
LANDSATLANDSAT
LANDSAT
 
Introduce variable/ Indices using landsat image
Introduce variable/ Indices using landsat imageIntroduce variable/ Indices using landsat image
Introduce variable/ Indices using landsat image
 
Band Combination of Landsat 8 Earth-observing Satellite Images
Band Combination of Landsat 8 Earth-observing Satellite ImagesBand Combination of Landsat 8 Earth-observing Satellite Images
Band Combination of Landsat 8 Earth-observing Satellite Images
 
Landsat 8 OLI (Operational Land Imager)
Landsat 8 OLI (Operational Land Imager)Landsat 8 OLI (Operational Land Imager)
Landsat 8 OLI (Operational Land Imager)
 
Image classification and land cover mapping
Image classification and land cover mappingImage classification and land cover mapping
Image classification and land cover mapping
 

Similar to Geo sib 2012

Thesis abstract on "An identification of stochastic systems"
Thesis abstract on "An identification of stochastic systems"Thesis abstract on "An identification of stochastic systems"
Thesis abstract on "An identification of stochastic systems"Raman Budny
 
03 кластеризация документов
03 кластеризация документов03 кластеризация документов
03 кластеризация документовLidia Pivovarova
 
интелектуальный анализ экономических данных в системе каркас
интелектуальный анализ экономических данных в системе каркасинтелектуальный анализ экономических данных в системе каркас
интелектуальный анализ экономических данных в системе каркасVladimir Burdaev
 
РЕАЛИЗАЦИЯ РАДИАЛЬНО-БАЗИСНОЙ НЕЙРОННОЙ СЕТИ НА МАССИВНО-ПАРАЛЛЕЛЬНОЙ АРХИТЕК...
РЕАЛИЗАЦИЯ РАДИАЛЬНО-БАЗИСНОЙ НЕЙРОННОЙ СЕТИ НА МАССИВНО-ПАРАЛЛЕЛЬНОЙ АРХИТЕК...РЕАЛИЗАЦИЯ РАДИАЛЬНО-БАЗИСНОЙ НЕЙРОННОЙ СЕТИ НА МАССИВНО-ПАРАЛЛЕЛЬНОЙ АРХИТЕК...
РЕАЛИЗАЦИЯ РАДИАЛЬНО-БАЗИСНОЙ НЕЙРОННОЙ СЕТИ НА МАССИВНО-ПАРАЛЛЕЛЬНОЙ АРХИТЕК...ITMO University
 
Сергей Терехов — Активное обучение при малой доле примеров с известными ответами
Сергей Терехов — Активное обучение при малой доле примеров с известными ответамиСергей Терехов — Активное обучение при малой доле примеров с известными ответами
Сергей Терехов — Активное обучение при малой доле примеров с известными ответамиYandex
 
Data Mining - lecture 6 - 2014
Data Mining - lecture 6 - 2014Data Mining - lecture 6 - 2014
Data Mining - lecture 6 - 2014Andrii Gakhov
 
многомерные модели данных
многомерные модели данныхмногомерные модели данных
многомерные модели данныхasheg
 
FaceDetection+GenderRecognition_review
FaceDetection+GenderRecognition_reviewFaceDetection+GenderRecognition_review
FaceDetection+GenderRecognition_reviewKhryashchev
 
Анализ структуры магистральных электросетей методами теории сложных сетей
Анализ структуры магистральных электросетей  методами теории сложных сетейАнализ структуры магистральных электросетей  методами теории сложных сетей
Анализ структуры магистральных электросетей методами теории сложных сетейСергей Макрушин
 
Анализ топологической структуры магистральных электросетей: поиск новых моделей
Анализ топологической структуры магистральных электросетей: поиск новых моделейАнализ топологической структуры магистральных электросетей: поиск новых моделей
Анализ топологической структуры магистральных электросетей: поиск новых моделейСергей Макрушин
 
Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...
Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...
Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...Natalia Polkovnikova
 
Karkas интеллектуальный анализ
Karkas интеллектуальный анализKarkas интеллектуальный анализ
Karkas интеллектуальный анализVladimir Burdaev
 
Введение в машинное обучение
Введение в машинное обучениеВведение в машинное обучение
Введение в машинное обучениеGrigory Sapunov
 
Сегментация изображений в компьютерной графике.ppt
Сегментация  изображений в компьютерной графике.pptСегментация  изображений в компьютерной графике.ppt
Сегментация изображений в компьютерной графике.pptssuser413a98
 
Presentation Diplom
Presentation DiplomPresentation Diplom
Presentation Diplomguestc80a581
 

Similar to Geo sib 2012 (20)

Thesis abstract on "An identification of stochastic systems"
Thesis abstract on "An identification of stochastic systems"Thesis abstract on "An identification of stochastic systems"
Thesis abstract on "An identification of stochastic systems"
 
03 кластеризация документов
03 кластеризация документов03 кластеризация документов
03 кластеризация документов
 
интелектуальный анализ экономических данных в системе каркас
интелектуальный анализ экономических данных в системе каркасинтелектуальный анализ экономических данных в системе каркас
интелектуальный анализ экономических данных в системе каркас
 
РЕАЛИЗАЦИЯ РАДИАЛЬНО-БАЗИСНОЙ НЕЙРОННОЙ СЕТИ НА МАССИВНО-ПАРАЛЛЕЛЬНОЙ АРХИТЕК...
РЕАЛИЗАЦИЯ РАДИАЛЬНО-БАЗИСНОЙ НЕЙРОННОЙ СЕТИ НА МАССИВНО-ПАРАЛЛЕЛЬНОЙ АРХИТЕК...РЕАЛИЗАЦИЯ РАДИАЛЬНО-БАЗИСНОЙ НЕЙРОННОЙ СЕТИ НА МАССИВНО-ПАРАЛЛЕЛЬНОЙ АРХИТЕК...
РЕАЛИЗАЦИЯ РАДИАЛЬНО-БАЗИСНОЙ НЕЙРОННОЙ СЕТИ НА МАССИВНО-ПАРАЛЛЕЛЬНОЙ АРХИТЕК...
 
лекция 36
лекция 36лекция 36
лекция 36
 
Сергей Терехов — Активное обучение при малой доле примеров с известными ответами
Сергей Терехов — Активное обучение при малой доле примеров с известными ответамиСергей Терехов — Активное обучение при малой доле примеров с известными ответами
Сергей Терехов — Активное обучение при малой доле примеров с известными ответами
 
лекция 34
лекция 34лекция 34
лекция 34
 
Data Mining - lecture 6 - 2014
Data Mining - lecture 6 - 2014Data Mining - lecture 6 - 2014
Data Mining - lecture 6 - 2014
 
многомерные модели данных
многомерные модели данныхмногомерные модели данных
многомерные модели данных
 
FaceDetection+GenderRecognition_review
FaceDetection+GenderRecognition_reviewFaceDetection+GenderRecognition_review
FaceDetection+GenderRecognition_review
 
Анализ структуры магистральных электросетей методами теории сложных сетей
Анализ структуры магистральных электросетей  методами теории сложных сетейАнализ структуры магистральных электросетей  методами теории сложных сетей
Анализ структуры магистральных электросетей методами теории сложных сетей
 
лекция 35
лекция 35лекция 35
лекция 35
 
Анализ топологической структуры магистральных электросетей: поиск новых моделей
Анализ топологической структуры магистральных электросетей: поиск новых моделейАнализ топологической структуры магистральных электросетей: поиск новых моделей
Анализ топологической структуры магистральных электросетей: поиск новых моделей
 
Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...
Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...
Нейросетевые технологии, нечёткая кластеризация и генетические алгоритмы в эк...
 
Karkas интеллектуальный анализ
Karkas интеллектуальный анализKarkas интеллектуальный анализ
Karkas интеллектуальный анализ
 
Введение в машинное обучение
Введение в машинное обучениеВведение в машинное обучение
Введение в машинное обучение
 
Лекция 9
Лекция 9Лекция 9
Лекция 9
 
тапаев к.
тапаев к.тапаев к.
тапаев к.
 
Сегментация изображений в компьютерной графике.ppt
Сегментация  изображений в компьютерной графике.pptСегментация  изображений в компьютерной графике.ppt
Сегментация изображений в компьютерной графике.ppt
 
Presentation Diplom
Presentation DiplomPresentation Diplom
Presentation Diplom
 

More from InterExpo Geo-siberia

More from InterExpo Geo-siberia (14)

гюнтер шмитт
гюнтер шмиттгюнтер шмитт
гюнтер шмитт
 
готтфрид конечный
готтфрид конечныйготтфрид конечный
готтфрид конечный
 
голубева а.б.
голубева  а.б.голубева  а.б.
голубева а.б.
 
пластинин цкту 18 апр 2012
пластинин цкту 18 апр 2012пластинин цкту 18 апр 2012
пластинин цкту 18 апр 2012
 
Milev studnicka
Milev studnickaMilev studnicka
Milev studnicka
 
тубанов гео сибирь
тубанов гео сибирьтубанов гео сибирь
тубанов гео сибирь
 
романенко
романенкороманенко
романенко
 
пац доклад 2012 гео сибирь
пац  доклад 2012 гео сибирьпац  доклад 2012 гео сибирь
пац доклад 2012 гео сибирь
 
ступин
ступинступин
ступин
 
геодезический контроль (геосибирь 2012)
геодезический контроль (геосибирь 2012)геодезический контроль (геосибирь 2012)
геодезический контроль (геосибирь 2012)
 
презентация 2
презентация 2презентация 2
презентация 2
 
бляхарский
бляхарскийбляхарский
бляхарский
 
геодезический контроль (геосибирь 2012)
геодезический контроль (геосибирь 2012)геодезический контроль (геосибирь 2012)
геодезический контроль (геосибирь 2012)
 
казаненко, мурзинцев
казаненко, мурзинцевказаненко, мурзинцев
казаненко, мурзинцев
 

Geo sib 2012

  • 1. НЕКОТОРЫЕ ВОПРОСЫ ТЕМАТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ Бучнев А.А., Пяткин В.П. ИВМиМГ СО РАН
  • 2. Центральные вопросы тематической обработки (интерпретации) данных дистанционного зондирования Земли (ДДЗЗ) – вопросы повышения качества дешифрирования – непосредственно связаны с проблемой выбора адекватных алгоритмов распознавания. Возникающие при этом трудности обусловлены следующими причинами:
  • 3. 1. Структура реальных данных не соответствует модели данных, используемой в алгоритме. Например, невыполнение предположения о нормальном распределении векторов данных или невыполнение условия, что поле измерений является случайным. 2. Непрезентативность обучающих последовательностей – недостаточное количество данных для восстановления параметров решающего правила. 3. Несоответствие обучающих данных и данных, предъявляемых на распознавание (“загрязнение” выборок смешанными векторами измерений, т.е. векторами, которые образуются при попадании в элемент разрешения съемочной системы нескольких природных объектов).
  • 4. 4. Неточное соответствие обучающих данных, получаемых с помощью кластеризации, истинным тематическим классам. 5. Помехи аппаратуры, атмосферных условий и т.п. Таким образом, можно сказать, что современный опыт автоматизированного распознавания ДДЗЗ показывает: заранее практически невозможно уста- новить, какой алгоритм будет лучше с точки зрения точности классификации. Поэтому в распознающую систему целесообразно закладывать несколько алгоритмов и выбор оптимального алгоритма проводить эмпирически.
  • 5. Наличие смешанных векторов в ДДЗЗ является, вероятно, одним из наиболее серьезных источников ошибок при построении тематической карты классификации. В классификации ДДЗЗ чаще других используются методы, которые можно разбить на две группы: классификация с обучением (контролируемая классификация) и кластерный анализ (автоматическая классификация). Большинство алгоритмов классификации для отнесения векторов признаков классам вычисляют для каждого вектора значения подходящей функции «правдоподобия».
  • 6. Классификатор Байеса для нормально распределенных векторов признаков Поэлементный и объектные классификаторы. Поскольку физические размеры реально сканируемых пространственных объектов, как правило, больше разрешения съемочных систем, между векторами признаков существуют взаимосвязи. Использование информации подобного рода дает возможность повысить точность классификации, если пытаться распознавать одновременно блок смежных векторов квадратной или крестообразной формы.
  • 7. Необходимые для построения решающих функций классов оценки статистических характеристик – векторов средних и ковариационных матриц, коэффициентов пространственной корреляции между значениями координат соседних векторов в горизонтальном и вертикальном направлениях – определяются на основе векторов из обучающих выборок (полей).
  • 8. Алгоритмы кластеризации: • Иерархические - Восходящие (аггломеративные): отдельная связь, полная связь, связь центроидов,… - Нисходящие М. Жамбю. Иерархический кластер-анализ и соответствия. Пер. с фр. М., Финансы и статистика, 1988. • Squared-Error Based К-средних, ISODATA (Iterative Self-Organizing Data Analysis Technique), .. • pdf оценивание через плотности смеси (Mixture Densities) • Graph Theory-Based • Fuzzy (Fuzzy C-means) • Neural Networks-Based • Sequential Data
  • 9.
  • 10.
  • 11.
  • 12. МЕТОД АНАЛИЗА МОД МНОГОМЕРНОЙ ГИСТОГРАММЫ Алгоритм К-средних может быть отнесен к классу параметрических, т.к. он неявным образом предполагает природу плотности вероятности: кластеры стремятся иметь конкретную геометрическую форму, зависящую от выбранной метрики. Альтернативой является подход, основанный на предположении, что исходные данные являются выборкой из многомодового закона распределения, причем векторы, отвечающие отдельной моде, образуют кластер [1, 2]. Таким образом, задача сводится к анализу мод многомерных гистограмм. 1. P.M. Narendra, Goldberg. A non-parametric clustering scheme for landsat. Pattern Recognition, vol. 9, 1977, pp. 207-215. 2. В.А. Красиков, В.А. Шамис. Кластерная процедура на базе многомерной гистограммы распределения. Исследование Земли из космоса, № 2, 1982, с. 107-114. 3. Асмус В.В. Программно-аппаратный комплекс обработки спутниковых данных и его применение для задач гидрометеорологии и мониторинга природной среды.// Диссертация (научный доклад) на соискание ученой степени доктора физико-математических наук. На правах рукописи. Москва – 2002, - 75 с.
  • 13. ГИБРИДНЫЙ МЕТОД: АНАЛИЗ МОД МНОГОМЕРНОЙ ГИСТОГРАММЫ С ПОСЛЕДУЮЩЕЙ ИЕРАРХИЧЕСКОЙ ГРУППИРОВКОЙ Cистема кластеризации дополнена двухэтапной процедурой (с сохранением всех ранее существовавших функций): на первом этапе выполняется предварительное разбиение исходной выборки на кластеры с помощью модального анализа, а затем для получения окончательного результата используется иерархическая группировка. Применение иерархической группировки для кластеризации исходного набора векторов нереально из-за того, что используемая в алгоритме матрица расстояний состоит (в начале работы алгоритма) из N(N-1)/2 элементов, где N – количество векторов. Предварительное использование модального анализа позволяет сократить объем данных до разумных пределов. В качестве входных данных для иерархической группировки используются векторы средних группы векторов, связанных с каждой модой многомерной гистограммы. Напомним, что на каждом шаге восходящей иерархической классификации объединяются два кластера, расстояние между которыми минимально. Среди всех возможных расстояний между кластерами для ускорения вычислений используется простейшее – расстояние между векторами средних в кластерах. Достоинством иерархической группировки является то, что после построения иерархического дерева кластеризации можно “разрезать” его на любом уровне иерархии, т.е. получать разные кластерные карты, не запуская снова процесс кластеризации.
  • 15. Контролируемая классификация (8 классов) и кластеризация методом К-средних (10 кластеров)
  • 16. Жесткая и нечеткая кластеризации
  • 17. Объемы полученных кластеров 125000 100000 75000 50000 25000 0
  • 18. Затопление поймы Оби в районе пос. Молчаново (Томская область, 26.06.2010)
  • 26. К-средних и С-средних (20 кластеров)