Министерство общего и профессионального образования

                                                Российской Федерации

 

      Российский государственный гидрометеорологический университет

 

                                        Факультет заочного обучения

 

 

 

 

                                     МЕТОДИЧЕСКИЕ УКАЗАНИЯ

                                                         по курсу

                         “Географические информационные системы”

 

 

 

 

                                  Специальность 320300 - Геоэкология

                                                           Курс V

 

                                                                      Подлежит возврату

                                                         на факультет заочного обучения

 

 

 

 

 

 

 

 

 

 

 

                                                      Санкт-Петербург

                                                               2000

 

                                        Одобрено Ученым Советом

Российского государственного гидрометеорологического университета

 

В методических указаниях по дисциплине «Географические информационные системы» представлены все разделы программы курса, дана их краткая характеристика с указанием вопросов, на которые студентам следует обратить особое внимание. Приведены варианты контрольной работы.

 

Одобрено методической комиссией факультета экологии и физики природной среды РГГМУ

 

   Составитель: Третьяков В.Ю., кандидат географических наук,  Российский государственный гидрометеорологический университет.

 

   Ответственный редактор: Шелутко В.А., доктор географ. наук, профессор, Российский государственный гидрометеорологический университет.

 

   Рецензент:  Осипов Г.К., доктор географических наук, профессор, председатель Северо-западного регионального отделения ГИС-ассоциации России, Санкт-Петербургский государственный технический университет.

 

 

 

 

 

 

 

 

 

 

 

Российский государственный гидрометеорологический университет (РГГМУ),

2000 г.

 


                                                ОБЩИЕ УКАЗАНИЯ

 

   Настоящие методические указания составлены на основе и в полном соответствии с программой курса “Географические информационные системы”.  Необходимость данного курса определяется прежде всего тем, что основным предназначением специалиста-эколога является получение новой смысловой информации об экологическом состоянии объектов окружающей среды и прогнозирование их будущего, что возможно лишь на основании обработки имеющейся разнородной и противоречивой информации, различных видов моделирования, т.е. с широким применением информационных технологий. Профессиональные же картографы и программисты имеют слабое представление о тех естественнонаучных проблемах, инструментом для решения которых должны являться ГИС-технологии. Поэтому для эколога совершенно необходимым является овладение методологией применения ГИС-технологий. Разумеется, для получения достаточно прочных знаний совершенно необходимым является самостоятельная работа с географическими информационными системами на компьютере, разработка собственных ГИС-проектов. Однако специфика заочной формы обучения не позволяет выполнить это требование. Поэтому в настоящем курсе основной упор сделан на овладение обучающимися понятийным аппаратом ГИС-технологий. Данные указания содержат лишь краткие резюме рассматриваемых вопросов и отнюдь не заменяют собой рекомендованную учебную и научную литературу, с которой необходимо работать.

      Основной формой обучения является самостоятельная работа студентов-заочников с рекомендованными учебниками и пособиями. При работе с литературой следует конспектировать изучаемый материал, акцентируя внимание на ясное определение и понимание терминов. Необходимо стремиться к тому, чтобы в конспекте в достаточно полном объеме были отражены вопросы, по которым выполняется самопроверка.

      Учебным планом предусматривается самостоятельное выполнение контрольной работы в форме реферата. Контрольная работа, аккуратно оформленная и имеющая поля для замечаний рецензента, высылается в Университет. Во время лабораторно-экзаменационной сессии преподавателями Университета читаются установочные и обзорные лекции по курсу.

   К выполнению контрольной работы студент должен приступить только после усвоения материала. Ответы на вопросы контрольной работы нельзя  дословно выписывать их текста учебного пособия. Студент должен уметь собственными словами передать проработанный материал. Для оформления контрольной работы нужно использовать отдельную тетрадь и разборчиво написать в ней текст работы, оставляя поля для замечаний. Ответы на вопросы следует излагать в том порядке, в котором они указаны в задании. На титульном листе контрольной работы выписывается номер зачетной книжки. Работа должна быть датирована, подписана студентом и представлена в университет не позже, чем за 40-50 дней до начала сессии. Если студент имеет возможность разработки собственных ГИС-проектов или хотя бы их отдельных элементов, то он может представить их в качестве курсовой работы. В этом случае экзамен будет приниматься в форме обсуждения с преподавателем разработанного студентом ГИС-проекта.

   Если работа не зачтена, ее нужно выполнить второй раз в соответствии с замечаниями рецензента. Исправленные ответы приводятся в конце тетради. Контрольная работа, выполненная студентом не по своему варианту, не рецензируется и не засчитывается. На экзаменационную сессию нужно являться, имея при себе рецензию на выполненную контрольную работу.

 

                                                         Литература.

Основная:

Экоинформатика.  Теория. Практика. Методы и системы.  /Под ред. акад. РАН В.Е.Соколова. Спб, ГМИ, 1992.

Кошкарев А.В., Тикунов В.С. Геоинформатика// Под ред. Д.В. Лисицкого. - М.: “Картоцентр”-”Геоиздат”, 1993.

Коновалова Н.В., Капралов Е.Г. Введение в ГИС. Учебное пособие. Изд. 2-е исправленное и дополненное. Комитет ГИС-образование ГИС-Ассоциации. М.: 1997.

Дополнительная:

“Информационный бюллетень” ГИС-Ассоциации (периодическое издание) М.: ГИС-Ассоциация.

Программно-аппаратное обеспечение, фонд цифрового материала, услуги и нормативно-правовая база геоинформатики. Ежегодный обзор. Вып. 3 (1996-1997, в двух томах). Приложение к “Информационному бюллетеню” ГИС-Ассоциации.- М.: ГИС-Ассоциация.

ГИС-обозрение. Журнал. М.

Цветков В.Я. Геоинформационные системы и технологии. М.: Изд-во Финансы и статистика, 1998.

Хаскольд Вильям. Введение в городские географические информационные системы. Пер. с англ. 1996.

 

Заявки на литературу можно посылать в ГИС-Ассоциацию по адресу:

117917, Москва, ГСП-1, Ленинский пр-т, 65, ГАНГ, исх. 107,

тел./факс (095) 135-76-86, 137-37-87

 

 

ТАБЛИЦА ВАРИАНТОВ КОНТРОЛЬНЫХ ВОПРОСОВ

Вариант контрольных вопросов определяется по последней цифре номера студенческого билета. Например, номер студенческого билета 38224 последняя цифра 4, ей соответствует вариант № 4. Вопросы с соответствующими номерами даны в конце каждого раздела.

варианта        Номера вопросов

1         1   11   27   37   42   52   57

2         2   12   28   38   43   53   58

3         3   14   29   39   44   54   59

4         6   13   30   40   45   55   60

5         7   15   31   41   46   56   61

6         4   16   21   22   32   47   62

7         5   17   23   33   48   63   67

8         8   18   24   34   49   64   68

9         9   19   25   35   60   65   69

0        10   20   26   36   51   66   70           

 

              УКАЗАНИЯ ПО РАЗДЕЛАМ ПРОГРАММЫ

                                                          Введение  

   Географические информационные системы – это компьютерные системы (или в более узком смысле программные пакеты), предназначенные для сбора, хранения, дополнения, обработки, анализа, моделирования, визуализации пространственно-координированной (т.е. имеющей пространственную привязку, пространственно-распределенной) информации, а также проведения экспертиз при принятии управленческих решений.

   По одному из определений "информация - это все, чем могут быть дополнены наши знания, убеждения и предположения. Другими словами, информация есть способность к накоплению знаний". Основоположник кибернетики Норберт Винер считал, что информация - фундаментальная категория (понятие), такая же основа мироздания, как вещество или энергия: "Информация есть информация, а не материя и не энергия. Информация - это совокупность сведений, уменьшающих неопределенность в выборе различных возможностей. Информация - основное понятие кибернетики. Кибернетика изучает технические и биологические системы исключительно с точки зрения их способности воспринимать определенную информацию, сохранять информацию в памяти, передавать ее по каналам связи и перерабатывать информацию в сигналы, направляющие деятельность устройств или организмов. Адекватное  восприятие информации обеспечивает нормальное функционирование технических устройств, оно является необходимым условием выживания любого организма.

   Геоэкология предполагает системный (кибернетический) подход к исследованию геосистем, которые рассматриваются как кибернетические системы, получающие извне вещество, энергию и информацию, потребляющие их, преобразующие, перераспределяющие между различными своими компонентами и выделющими за свои пределы материю, энергию и информацию в иных формах. Применение информационных технологий в геоэкологии тем более важно, что геоэкология является синтезирующей наукой, интегрирующей достижения целого комплекса естественных, точных и социальных наук.

   Информация бывает трех родов. Информация первого рода - это фактические результаты непосредственных измерений. Далее информация подвергается обработке: классификации,  статистической обработке,  составлению таблиц,  карт,  атласов, диаграмм и т.д. Это вторичная информация первого вида. Впоследствии она преобразуется во вторичную информацию второго вида. Это: научные отчеты,  статьи,  ипломные,  диссертационные работы, обобщения,  закономерности, гипотезы, теории. В общем случае первичная информация может быть преобразована во вторичную информацию многими способами. При этом на основании одной и той же первичной информации можно в принципе получить различающуюся и даже противоречивую вторичную информацию: различные выводы, гипотезы, представления. Вторичная информация представляется на специфическом языке данной науки и рассчитана для потребления специалистами в данной области знания. Затем вторичная информация преобразуется в третичную информацию, предназначенную для "лиц, принимающих решения": представителей власти, управляющих производством и т.д. Третичная информация представляет собой рекомендации или методики, написанные доступным для неспециалистов языком. Ясно, что адекватность "конвертации" геоэкологической информации может быть обеспечена лишь адекватностью реальности принятых теорий функционирования и развития геосистем.

   В любой ГИС можно выделить ее стандартное программное ядро: программное обеспечение, программный пакет, разработанный одной из крупных фирм по производству программного обеспечения.  В большинстве случаев для анализа и моделирования экологических процессов, или хотя бы для разработки собственного интерфейса пользователя необходимо создавать программы, которые будут управлять работой ГИС для данного конкретного проекта. Эта возможность реализуется при помощи встроенного в стандартную ГИС внутреннего языка создания ГИС приложений. Разработка стандартных ГИС - дело многочисленных коллективов профессиональных программистов специализированных фирм. Однако эти программисты не имеют экологического образования и не знают специфики задачи, для решения которой разрабатывается конкретная ГИС. Поэтому разработка конкретного ГИС-приложения или участие в его создании совместно с программистом-профессионалом - дело специалиста-эколога.

Таким образом, для реализации конкретной ГИС необходима совокупность из программных и технических средств хотя бы в пределах одного компьютера. Это тот случай, когда получение поставляемых в ГИС данных находится вне рамок данной конкретной ГИС: данные каким-то образом получены, записаны в файлы необходимых форматов и импортируются в ГИС.   Однако возможен такой случай, когда к ГИС подключаются блоки автоматизированного измерения различных характеристик, т.е. в ГИС включена информационно-измерительная система. Вообще информационной системой  называется система, реализующая автоматизированный сбор, обработку и манипулирование данными и включающая в себя технические средства обработки данных, программное обеспечение и соответствующий персонал.  Упрощенная структура информационной системы подразумевает наличие измерительного блока, блока ввода данных в базы данных, системы управления базами данных, комплекса прикладных программ  и обслуживающего персонала. Информационные системы подразделяются на измерительные информационные системы и обрабатывающие информационные системы. Разумеется, система может быть одновременно и измерительной, и обрабатывающей. Отличие информационной системы от геоинформационной состоит в отсутствии блоков визуализации информации и ее анализа. В общем случае в состав конкретной геоинформационной системы может входить информационно-измерительная система. В таком случае в состав конкретной ГИС кроме измерительных датчиков должны входить телекоммуникационные средства передачи информации: кабельная сеть, модемы и т.д.

 

Вопросы для самопроверки:

1.     Что такое информация?

2.     Типы информации.

3.     Определение географической информационной системы (ГИС) и ее обобщенная структура.

4.     Информационно-измерительная система и ее отличие от ГИС. 

 

Литература.

Экоинформатика.  Теория. Практика. Методы и системы. С. 7-13, 90-103.

Кошкарев А.В., Тикунов В.С. Геоинформатика. С.5-20.

Коновалова Н.В., Капралов Е.Г. Введение в ГИС. С. 7-11.

 

        1. Геоинформационные системы: общие вопросы.

   В информатике существует 3 основных подхода: вероятностно-статистический, связанный в первую очередь с именем Клода Шеннона, комбинаторный, или теоретико-множественный, и семантический.

    В основе вероятностно-статистического подхода теории информации лежит предложенный в 1948 г. Шенноном способ измерения количества информации, содержащегося в одном случайном объекте (событии, величине, функции) относительно другого случайного объекта. Этот способ приводит к выражению количества информации числом. По теории Шеннона количество информации I вычисляется по формуле:

  n

I=Spilogpi,

  i=1

где pi - вероятность появления - го сигнала, n - количество всех возможных сигналов. У этой теории есть значительный недостаток - она не учитывает содержательную сторону информации. По ней совокупность из 100 букв, выбранных случайным образом, фраза в 100 букв из газеты, пьесы Шекспира или теории Эйнштейна имеют в точности одинаковое количество информации.

   Вместе с тем понятно, что нас интересует не только и даже не столько количество информации, сколько ее содержательная сторона, ее смысл и полезность. Одно и то же сообщение может иметь колоссальное значение для одного получателя и не иметь никакого значения для другого. Более того, одно и то же сообщение для различных субъектов может иметь весьма различный и даже противоположный смысл. Очевидно, что характер восприятия информации зависит от собственных характеристик субъекта, извлекающего или применяющего информацию.

   Преодолеть недостаток теории Шеннона и отразить качественную сторону информации стремится семантическая теория информации. Семантика является частью математической логики. Область семантики - исследование интерпретаций логического исчисления, формальной аксиоматической теории; изучение смысла и значения конструкций формализованного языка теории, способа понимания его логических связок и формул. Семантика уделяет внимание возможности точного описания и определения таких понятий, как "истина", "определимость", "обозначение", по крайней мере применительно к точно описанным языкам.

  Семантическая теория информации описывает сообщения со структурно-лингвистических позиций и ориентирована на построение моделей, отображающих собственные законы организации объектов окружающего мира и представления их в информационных системах. Смысл информации может быть понят приемником только в том случае, если он знает язык природы или располагает способами его построения.

    Реальное использование информации только отчасти определяется собственными качествами информации. Довольно характерно, что весьма редко полученная первооткрывателем качественно новая информация достойно оценивается обществом и быстро находит реализацию в практической деятельности.

   Прагматическая ценность информации связывается с представлением о цели. При этом под целью понимается опережающее отражение, предвосхищение результата человеческой деятельности, идеальный образ предмета потребности. Чем более способствует информация достижению цели, тем более она ценна. При таких логических построениях фактически предполагается, что существует некоторое множество целей, к которым стремится субъект. Для достижения этих целей он неизбежно должен управлять окружающей средой и в какой-то мере своим поведением. Для управления ему необходима информация. Эта информация тем ценней, чем она надежней выводит субъекта к поставленной цели. Однако сами по себе цели не даются откуда-то со стороны, а получаются фактически в результате моделирования системы отношений "субъект - окружающая среда" самим субъектом. Истинность этой модели сама по себе требует доказательства. Если модель ложна, т.е. неадекватно отражает окружающий мир, то могут быть ложны и цели. Фактически мы движемся по замкнутому кругу: "модель - информация - модель". Этот круг можно разорвать, если рассматривать не субъективное состояние субъекта относительно целей, порожденных его собственным субъективным видением реального мира, а объективное его состояние относительно реальных условий его жизнедеятельности. Так как субъект стремится обеспечить свою устойчивость в пространстве внешних переменных, а проще говоря, стремится обеспечить свое развитие и выживание, то ценность информации может быть определена по тому, насколько она способствует достижению этого результата. Ценность информации тем выше, чем более надежно она предупреждает субъекта о приближении к границе устойчивости. Связав ценность информации со степенью устойчивости субъекта, можно ввести и соответствующую систему измерения. Однако это можно сделать лишь с позиции стороннего наблюдателя, наблюдающего входные переменные и информацию, поступившую от среды к субъекту и реакцию на нее субъекта. Ценность информации зависит от расстояния субъекта от границы области устойчивости. Но такая система измерения ценности информации самим субъектом в принципе не реализуема. Любой способ измерения ценности информации самим субъектом, будь то конкретный человек или общество в целом, будет всегда условен, хотя ценность информации является безусловно объективной категорией.

И тем не менее в реальной жизни мы всегда говорим о ценности информации. В рамках взаимодействия субъекта с информацией по мере ее использования ценность ее очевидным образом теряется. При этом процесс потери ценности информации в большей степени подчиняется законам количественной информации. Получение новой информации всегда связано, по крайней мере при ее восприятии, с первоначально редкими событиями (сообщениями). Их редкость может иметь различную природу и в том числе определяться слабой разработанностью технических средств измерений или их принципиальной новизной, или переходом субъекта в новые, для него незнакомые условия среды (например, экспедиция в ранее неизученную акваторию или территорию). Разумеется, субъект может "стоять на месте", а со временем могут изменяться условия среды, что наиболее характерно для современности. Пока некоторые события редки и при этом осознается их соотношение с целью, их информационная ценность очень велика. По мере увеличения частоты их повторяемости и накопления опыта их использования в системе принятия решений ценность их постепенно снижается. Как явления окружающего мира эти события (сообщения) становятся обычными и не способными существенно влиять на изменение механизмов управления.

   Прагматическая ценность информации сохраняется тогда, когда она связывается с объектами, поведение которых трудно предсказуемо, когда субъект пребывает в состоянии постоянного ожидания событий (например, прогноз погоды, наводнений, землетрясений и т.п.). В целом же по мере использования информации об окружающем мире ценность ее снижается.

   Однако поскольку разные субъекты и один и тот же субъект в разное время могут извлекать из одной и той же информации совершенно различное содержание, постольку и ее потенциальная ценность во времени остается неизменной и неизмеримой. С этой точки зрения закон сохранения на информацию не распространяется, а количество информации от ее использования не зависит.

Тем не менее желание оценить информацию объективно совершенно оправдано. В конце концов с этим прямо связана оценка, в том числе и стоимостная, работы самых различных информационных служб общества и в конечном итоге практически всех его членов, относимых к классу научных работников. Именно "полезность любой вещи делает ее потребительной стоимостью. Потребительное свойство не зависит от того, много или мало труда стоит человеку его присвоение. Потребительная стоимость реализуется лишь в процессе потребления". Эти положения, сформулированные в "Капитале" Карла Маркса, не подвергаются в наше время мировой экономической наукой сомнению. Информация не может быть стоимостью, не будучи предметом потребления. Поскольку в информацию вложен человеческий труд, то она может рассматриваться как товар. Если на нее нет спроса, то у нее нет и стоимости. Однако вещь в настоящее время может не представлять ценности, а в будущем стать очень ценной: так, для человека каменного века железная руда не представляла никакой ценности, так же, как для человека 18 века бокситы. Сбор информации первичен по отношению к потреблению и она собирается тогда, когда еще не может быть стоимостью. Общество оплачивает этот труд, создающий лишь базу для раскрытия возможной полезности загодя, заведомо не зная, где, когда, как и в какой области эти полезности будут раскрыты. В этот локальный момент времени полученная, но еще не используемая обществом информация не имеет стоимости, а труд людей, связанных с ее сбором, переработкой, хранением и представлением оплачивается обществом в целом в соответствии с общим уровнем общественного развития. Сбор такой информации - область фундаментальной науки. Соответственно до тех пор, пока исторически не раскрыта полезность собранной в рамках этой деятельности информации, труд связавших себя с фундаментальной наукой людей не образует стоимости.

   Как только потребительная стоимость вещи и соответственно связанной с ней информации раскрыта, то информация становится обычным товаром со всеми атрибутами экономики. Ее ценность определяется в системе спроса-предложения и здесь начинают действовать вполне объективные законы рынка и проблема прагматической ценности информации становится чисто экономической. Ее прагматическая ценность начинает выражаться в системе спроса-предложения в соответствующих денежных эквивалентах.

   Информация является атрибутом взаимодействия. Будучи порождением чисто материальных отношений, сама по себе она не материальна. На информацию не распространяются физические законы сохранения и она фактически вступает в качестве регулятора процессов, определяемых этими законами. Так, на сбор, передачу, хранение информации неизбежно затрачиваются вещество и энергия, но увеличение скорости ее обращения и повышение адекватности ее использования приводит к экономии вещества, энергии и человеческого труда в объемах, намного превышающих затраты.

Элемент геоэкологических данных содержит три главные компоненты:  атрибутивные сведения,  которые описывают сущность характеристики;  географические сведения, описывающие положение элемента в пространстве;  временные сведения, описывающие момент или период времени,  к  которым относится элемент данных.  Данные выступают как сырье, которое путем переработки можно превратить в информацию, т.е. данные – строительный материал для создания информации.  Они рассматриваются как объект обработки и основа для получения информации.  Данные – это атрибут информации,  который обозначает факты,  понятия,  инструкции,  которые представлены в условной форме, удобной для пересылки,  интерпретации и обработки человеком или автоматическими средствами.  Информация – это смысл,  вкладываемый человеком в данные.  Знания в философском их понимании – отражение семантических аспектов реальности в мозгу человека или  в технической системе.

 Первичная информация подразделяется в зависимости от целей,  для достижения которых она собирается,  на научно-поисковую,  научную режимную и практического назначения. Особенность научно-поисковой информации, собираемой обычно в рамках фундаментальных исследований под новые, иногда очень нечетко определенные гипотезы и цели состоит в том, что она почти всегда избыточна и интерактивна. Избыточность связана с большой неопределенностью при постановке задач, высокая интерактивность объясняется необходимостью быстрой смены методов и методик наблюдений, что в свою очередь обеспечивает расширенный научный поиск. Научная режимная информация связана с теми исследованиями, при помощи которых осуществляется верификация достаточно реалистичных гипотез и теорий. Ее характерной чертой является четкое обоснование переменных, методов, объемов собираемой информации. Такого типа исследования в норме проводятся по хорошо обоснованным программам.  Специфической чертой первичной информации в сфере практической  деятельности является ее жесткое подчинение определенным хозяйственным задачам с максимальным удешевлением всей процедуры сбора. Измеряются только те переменные и в таком объеме, в каком это необходимо и достаточно для надежных практических действий в данной предметной области. В информацию последнего типа входит выделившаяся в отдельную область мониторинговая информация.

   Согласно словарю “Природопользование” Н.Ф.Реймерса (1984) под мониторингом окружающей среды понимается “слежение за состоянием окружающей человека природной среды и предупреждение о создающихся критических ситуациях, вредных или опасных для здоровья людей и других живых организмов”. В других определениях мониторинга, приведенных в данном словаре (всего их 10!), обращается внимание либо на прстранственный аспект, либо на методы его реализации: космический, авиационный, биологический и т.д. При таком подходе смысл мониторинга заключается в осуществлении двух взаимосвязанных функций - наблюдения (слежения) и предупреждения. Такой мониторинг нацелен на фиксацию отрицательных последствий хозяйственных действий и их вторичных эффектов. и поэтому обладает низким прогностическим потенциалом.

Идея глобального мониторинга окружающей среды впервые была высказана в монографии "Глобальный мониторинг окружающей среды", изданной в 1971 г. Научным комитетом по проблемам окружающей среды Международного совета научных союзов. Под мониторингом понималась система контроля над окружающей средой, включающая три блока: наблюдения за состоянием среды, определения возможных изменений и мероприятий по управлению (регулированию) окружающей среды.

 Важнейшим принципом регионального экологического мониторинга должен являться принцип проблемной организации. Этот принцип противополагается идее тотального мониторинга “всего и вся” и снимает синдром “избытка данных - недостатка информации”. Программа исследования и наблюдения развертывается только под определенную экологическую проблему.

Мониторная система должна быть открыта не только для развития, но и для пользователей. Информационная открытость - необходимое условие нормального функционирования системы, которое может быть обеспечено средствами ГИС-технологий. Все результаты экологических исследований и наблюдений должны быть доступны для управленцев, предпринимателей, политиков, широкой общественности. Однако этот принцип накладывает определенные обязательства на пользователей, которые должны сформулировать свои требования при формировании программ мониторинга. Оперативность экологического мониторинга должна выражаться не столько в технической стороне дела - оперативности переработки и выдачи информации, сколько в оперативности принятия решений в критических ситуациях. При таком требовании информация, выдаваемая управляющему, должна быть ориентирована на принятие решений и включать типы имевших место критических экологических ситуаций и действий по их разрешению.

   Каждый из типов информации имеет собственную потенциальную прагматическую ценность и подлежит независимому хранению. При этом на любом уровне обработки как первичную, так и вторичную информацию можно преобразовывать сколь угодно разными способами и не существует гарантии, что принятый способ является наилучшим. С этой точки зрения первичная информация имеет наивысшую прагматическую ценность. Если сохранена первичная информация, то всегда можно получить любую другую, Если же она утеряна, то развитие исследований невозможно.

   Типы данных.   Отличительная особенность текстовых материалов - отчетов экспедиций, статей, книг состоит в том, что имея большой фактический материал: они не всегда представлены в специально классифицированном виде и не обеспечивают пространственную локализацию данных. Статистические материалы имеют цифровую форму и более удобны для непосредственного использования в ГИС. Среди них особо следует выделить государственную статистику. Картографические источники:

1) Общегеографические карты. Топографические (масштаб 1:200 000 и крупнее), обзорно-топографические (мельче 1:200 000 и до 1 000 000 включительно) и обзорные (мельче 1 :  1 000 000) карты содержат разнообразные сведения о рельефе,  гидрографии, почвенно-растительном покрове, населенных пунктах, хозяйственных объектах, путях сообщения, линиях коммуникации, границах. В геоинформатике эти карты служат для двух целей:  получения информации об указанных объектах и их картографической привязки. К этой же группе источников можно отнести фотокарты и космофотокарты;  2) Карты природы. Это наиболее разнообразная по тематике группа карт. Она включает карты геологического строения и ресурсов недр, геофизические, рельефа земной поверхности и дна океана, метеорологические и климатические, гидрологические и океанографические, почвенные, геоботанические, зоогеографические, медико-географические, ландшафтные и общие физико-географические, охраны природы;  3) Для ГИС социоэкологической тематики важным источником данных являются карты народонаселения; 4) Карты экономики; 5) Карты науки, подготовки кадров, обслуживания населения . Отдельно выделяются политические, административные и исторические карты.

   Аэрофотосъемки регулярно выполнялись в нашей стране с 30-ых годов и сейчас накоплен фонд снимков, полностью покрывающих страну, а для многих районов с многократным перекрытием, что особенно важно при изучении динамики объектов. Космические снимки начали поступать с 60-х годов и к настоящему времени их фонд насчитывает десятки миллионов. Виды космических материалов разнообразны. Существует 2 технологии космических съемок: съемки с фотографических и со сканерных систем. Дистанционное зондирование осуществляется специальными приборами – датчиками, которые могут быть пассивными и активными, причем пассивные датчики улавливают отраженное или испускаемое естественное излучение, а активные способны сами излучать необходимый сигнал и фиксировать его отражение от объекта.

   Стратегия формирования многозональных систем и использования материалов их съемок состоит в том, что для каждой задачи исследования и конкретных физико-географических условий выбирается один профилирующий канал, дающий наибольший объем информации. Другие каналы съемки пополняют недостающие сведения и повышают надежность дешифрирования изучаемых объектов или процессов. Эффективность дешифрирования материалов многозональных съемок существенно возрастает при применении метода синтеза зональных снимков (сделанных в различных зонах спектра излучения) и формировании по ним изображений местности в условных цветах.

   В последние годы в среде ГИС широко используются портативные приемники данных о координатах объектов с глобальной системы навигации (позиционирования) GPS, дающие возможность получать горизонтальные и вертикальные координаты с точностью от нескольких метров до нескольких миллиметров, что в сочетании с портативными персональными ЭВМ и специализированным программным обеспечением обработки данных с системы GPS позволяет использовать их для полевых съемок в условиях необходимости их сверхоперативного выполнения (например, при ликвидации последствий стихийных бедствий и техногенных катастроф).

   Широки возможности использования стационарных измерительно-наблюдательных сетей для получения гидрологических и метеорологических данных, регулярный сбор и обработка которых имеет уже более чем столетнюю историю.   Многообразны работы, проводимые для океанологических целей..

   Все моря России – замерзающие. Поэтому очень важное значение имеет ледовая информация.  При проведении исследований на стационарах или экспедиционных  собираются сведения о характеристиках ландшафтов. Здесь применяются интересные методики сбора данных, но, как правило, они не координируются в государственном и тем более глобальном масштабах.

   Велико информационное значение справочных изданий по отдельным типам географических объектов. Известны справочники Гидрометслужбы по климату, водному балансу, различные каталоги и кадастры.

 

Вопросы для самопроверки:

5.     Три подхода в теории информации. Особенности вероятностно-статистического и семантического подходов.

6.     Прагматическая ценность информации.

7.     Данные, информация, знания – различия между ними.

8.     Разделы первичной экологической информации.

9.     Принципы организации мониторинга и мониторных систем.

10.  Источники и типы данных.

 

Литература.

Экоинформатика.  Теория. Практика. Методы и системы. С. 14-21, 42-84, 90-95, 103-105, 109-116, 203-219.

Кошкарев А.В., Тикунов В.С. Геоинформатика. С.16-20, 35-44.

 

   2. Классификация и структура ГИС.

   Согласно официальному определению ГИС-Ассоциации России, географическая информационная система - это информационная система, обеспечивающая сбор, хранение, обработку, доступ, отображение и распространение пространственно-координированных данных (пространственных данных). ГИС содержит данные о пространственных объектах, включает набор функциональных возможностей ГИС, в которых реализуются операции геоинформационных технологий, или ГИС-технологий, поддерживается программным, аппаратным, информационным, нормативно-правовым, кадровым и организационным обеспечением. По территориальному охвату различаются глобальные, или планетарные ГИС (global GIS), субконтинентальные ГИС, национальные ГИС, зачастую имеющие статус государственных, региональные ГИС (regional GIS), субрегиональные ГИС и локальные, или местные ГИС (local GIS). ГИС различаются по предметной области информационного моделирования, например: городские ГИС или муниципальные ГИС (МГИС, urban GIS), природоохранные ГИС (environmental GIS) и т.п. Особое наименование, как широко распространенные, получили земельные информационные системы. Проблемная ориентация ГИС определяется решаемыми в ней задачами (научными и прикладными), среди них инвентаризация ресурсов (в том числе кадастр), анализ, оценка, мониторинг, управление и планирование, поддержка принятия решений. Интегрированные ГИС (ИГИС, integrated GIS, IGIS) совмещают функциональные возможности ГИС и систем цифровой обработки изображений (материалов дистанционного зондирования) в едином программном пакете. Полимасштабные, или масштабно-независимые ГИС (multiscale GIS) основаны на множественных или полимасштабных представлениях пространственных объектов (multiple representation, multiscale representation), что обеспечивет графическое или картографическое воспроизведение данных на любом из избранных уровней масштаба на основе единственного набора данных с большим пространственным разрешением. Пространственно-временные ГИС (spatial-temporal GIS) оперируют пространственно-временными данными.

   Реализация геоинформационных проектов, т.е. создание ГИС в широком смысле слова включает этапы предпроектных исследований, в том числе изучение требований пользователя и функциональных возможностей используемых программных средств ГИС, технико-экономическое обоснование, оценку соотношения "затраты"/"прибыль"; системное проектирование ГИС, включая стадию пилотного проекта, разработку ГИС; ее тестирование на небольшом территориальном фрагменте, или тестовом участке, создание опытного образца (прототипа); внедрение ГИС, эксплуатацию и использование.

   Логически и организационно во всех ГИС можно выделить несколько конструктивных блоков, называемых также модулями или подсистемами, выполняющими определенные функции. Последние вытекают из четырех типов решаемых ГИС задач:

1) сбора, 2) обработки, 3) моделирования и анализа данных, 4) использования результатов при принятии решений.

   Таким образом, ГИС может использоваться как: 1) информационная основа для изучения природных особенностей региона; 2)  инструмент исследования динамики или прогноза процессов и явлений; 3)  информационно-справочная система, по определенному запросу выполняющая поиск и выборку данных; 4) система, осуществляющая моделирование геосистем и позволяющая на основе экспертных оценок принимать решения по управлению и регулированию.

   Приведенные схемы соответствуют современным полномасштабным многофункциональным и универсальным ГИС, хотя в конкретных реализациях возможно изменение баланса между их отдельными блоками или редуцирование отдельных подсистем (модулей). Тем не менее любая ГИС должна иметь систему визуализации данных, выводящую на экран имеющуюся информацию в виде карт, таблиц, схем и т.п., и систему управления данными, при помощи которой происходит их поиск, сортировка, удаление, добавление, исправление и анализ. Также двумя необходимыми компонентами ГИС являются системы ввода и вывода информации.

   Базы данных являются обязательными компонентами ГИС. Топографическая основа карт обыкновенно хранится в файлах принятой в данной стандартной ГИС структуры, которые в принципе можно назвать файлами графических баз данных, тематические базы данных содержат в себе нагрузку карты и дополнительные данные, которые относятся к пространственным, но на карту не наносятся: описания территорий или информация, содержащаяся в научных отчетах.

   С точки зрения их программной архитектуры ГИС можно разделить на: 1)"открытые", имеющие встроенные возможности расширения, адаптации к новым форматам данных, возможности создания программных приложений пользователем, поддерживающие стандартные форматы и языки программирования высокого уровня;

2)  "специализированные", поставляемые вместе с библиотекой программных приложений; 3)  "закрытые", не имеющие возможностей расширения и написания приложений.

   По своей мощности и возможностям эксплуатации ГИС подразделяются на:

 1)  мощные, ориентированные на рабочие станции и сетевую эксплуатацию системы, обрабатывающие колоссальные объемы информации, имеющие разнообразные средства ввода (от дигитайзеров и сканеров до станций обработки космических снимков) и вывода, дающие практически типографское качество получаемой карты;

2) специализированные системы, также предназначенные для рабочих станций, несколько менее мощные, чем ГИС первого типа, созданные для определенных задач (например, обработки геодезических данных или городского кадастра), достигающие в этих областях результатов, нередко превосходящих аналогичные результаты универсальных систем и имеющие необходимый набор функций, обеспечивающий им стандартные возможности ГИС; 3) “настольные” ГИС, работающие на персональных компьютерах, предназначенные для учебных и справочно-информационных целей, в силу ограниченности имеющихся в их распоряжении машинных ресурсов не обладающие развитыми средствами анализа данных - характерной чертой более крупных систем. В этом классе систем необходимо выделить урезанные версии крупных ГИС для рабочих станций, предназначенные для ПК. Такие програмные продукты обладают сравнительно скромным набором возможностей по сравнению с версиями этих же систем для рабочих станций. Однако у них есть существенный плюс - совместимость со своими версиями для рабочих станций.

   Основные требования, предъявляемые к ГИС:

   1. Прежде всего полнота, то есть охват всех сторон информационного, программного, технического обеспечения, которые встречаются в процессе эксплуатации системы, возможность обработки массивов неоднородной пространственно-координирован-ной информации и способность поддерживать базы данных для широкого класса географических объектов;  2. Система должна быть комплексной. Основное преимущество геоинформационных технологий по сравнению с традиционными методиками состоит в возможностях совместного анализа больших групп параметров в их взаимной связи, что очень важно для изучения сложных географических явлений и процессов. ГИС должна имитировать технологию географических исследований; 3. Система должна быть открытой, обеспечивая легкость модификаций и адаптации к новым условиям для поддержания ее на современном уровне не только разработчиками, но и пользователями. Трансформации необходимы как для обеспечения эволюционности, так и для прикладной переориентации системы.

   Кроме ГИС, существуют и другие виды компьютерных графических систем: CAD-системы и Mapping-системы. Первые являются системами для автоматизированного проектирования (САПР), создания технических чертежей с использованием средств машинной графики. Вторые - программные продукты, специально предназначенные для профессионального производства карт. Однако они лишены возможностей моделирования и анализа, не нацелены на управление данными. Кроме того, в САПР изначально отсутствовала возможность применения картографических проекций, с их помощью можно было делать только планы объектов, которые можно было считать плоскими. В настоящее время в САПР внедряются элементы создания карт.

   Фундаментом к проекту ГИС является создание пространственной базы данных, описывающей местоположение и форму географических объектов. Для этого необходимо перевести карту в цифровую форму, то есть организовать структуры для хранения данных и их использования. В ГИС эти структуры специфичны и сильно отличаются от принятых в CAD и Mapping-систеах.

   Описание географических объектов в ГИС предполагает указание их позиционной и содержательной составляющих. Позиционная часть описания данных (позиционные свойства географических объектов, т.е. их координаты и очертания) организуется в определенную модель пространственных данных, связанную с их непозиционными (содержательными, семантическими, тематическими) атрибутами - содержащимися в базе данных числовыми или символьными характеристиками. Пространственные объекты разделяются на множество элементарных объектов - примитивов. К ним принадлежат точки (точечные объекты), линии (линейные объекты), площади (контуры, ареалы, полигоны). Некоторые ГИС добавляют собственные примитивы, например поверхности (рельефы).

   Данные, встречающиеся на карте, представляют из себя связанные объекты, состоящие из геометрических примитивов и их атрибутов. Атрибуты могут относиться как к примитивам, так и к объектам. Совокупность примитивов и атрибутов образует простой объект. Совокупность простых объектов образует сложный или составной объект. Иерархия объектов очень удобна, поскольку позволяет избежать дублирования информации и обеспечивает наследование: изменения объекта или атрибута порождают изменения во всех объектах, частью которых он является.

   Не все ГИС допускают обращения к сложному объекту, состоящему из нескольких примитивов или объектов, как к целому. Некоторые системы различают только точечные, линейные и площадные объекты, наследственность в них отсутствует.

   Таким образом, двумя основными типами информации для ГИС являются пространственные и тематические базы данных. Пространственная информация описывает расположение и очертания географических объектов, может содержать и связи между ними. Тематическая информация содержит описания количественных и качественных характеристик объектов.

   Все объекты и примитивы должны иметь свой идентификатор, при помощи которого можно привязать к графической информации тематическую. Использование идентификаторов открывает широкие возможности для просмотра и анализа данных. Пользователь может указать на объект на экране дисплея курсором, и система определит его идентификатор, по которому найдет относящиеся к объекту интересующие нас данные, или, наоборот, по информации в базе можно выделить на экране географический объект.

  Обычно ГИС работают с распространенными проекциями: Меркатора, Ламберта, стереографической, азимутальной, прямоугольной и др. Список из 10-15 поддерживаемых проекций имеет практически каждая система.

   Модели (структуры) представления пространственной информации, наиболее часто употребляемые в ГИС, бывают двух основных типов:

1) векторные: описание осуществляется путем указания координат объектов и составляющих их частей; 2)  растровые:  описание в виде совокупности точек (ячеек).

   Растровые данные получаются, подобно фотографии, в виде отдельных точек, которыми манипулируют компьютерные программы как по одной, так и группами. Это представление применяется в основном там, где графическая информация должна быть просмотрена, но не нуждается в модификации или анализе. Растр применяется в основном там, где пользователей не интересуют отдельные пространственные объекты, а интересует точка пространства как таковая с ее характеристиками (высотная отметка или глубина, влажность или тип почв и т.п.). Недостаток растровых форматов состоит в сложности распознавания объектов.

    Векторные данные используются в ГИС и CAD системах для представления информации, которая имеет объектную природу и нуждается в анализе и манипулировании. Они хранятся в виде точек и линий, связанных геометрически и математически. Это означает, что информация может толковаться как серия индивидуальных точек, а может образовывать новые сложные структуры данных. Наличие атрибутов позволяет получать информацию, например, о типе почв, гидрологической сети или жилых строениях. Такая информация обычно хранится в соответсвующих базах данных.

   Большинство ГИС требует, чтобы данные были представлены в векторном формате, хотя в ряде систем допускается использование растровых изображений в качестве основы для создания электронной карты или иллюстраций.

   Стандартные форматы существуют как для растровой, так и для векторной информации. К растровым форматам относятся, например, PCX, TIFF, GIF, RLE, RLC. Файлы растровых форматов получаются обыкновенно при помощи автоматических цифрователей, фиксирующих элементы рисунка построчно при перемещении сканерного луча (сканеры, сканирующие устройства). К векторным относятся форматы DXF, DX90, PIC, DWG, IGES, DGN, HPGL и многие другие.    Распространенный формат DXF появился из пакета AutoCAD и стал стандартом в связи с его популярностью. В настоящее время он используется как обменный для переброски данных между CAD приложениями. DXF хорошо документирован.

   Формат DX90 является международным форматом электронных морских навигационных карт. По современным международным правилам судоходства статус электронной карты равен статусу бумажной и капитан судна имеет право не иметь на борту ни одной бумажной карты, а вместо них компьютер с навигационной ГИС. Преимущества - налицо: ГИС может взять на себя прокладку курса, автоматизированное управление, благодаря спутниковой связи любое изменение навигационной обстановки (ликвидация или ввод в эксплуатацию маяка, появление преграды на фарватере и т.п.) моментально фиксируется в ГИС вне зависимости от местонахождения судна.

    Обычная бумажная карта, особенно тематическая, зачастую бывает перегружена информацией. В ГИС компьютерные карты состоят из слоев: карта логически организована как набор слоев информации. Слой составляют объекты, объединенные одной темой, например, вся гидрография. Карту можно представить себе в виде положенных друг на друга прозрачных пленок (слоев). Каждый слой содержит информацию одного класса: слои дорог, построек, промышленных объектов, ландшафтов и т.д. Большинство ГИС может содержать колоссальное число слоев. На экран (и, разумеется, на печать) можно выводить отдельные слои информации или группы слоев в различных сочетаниях, можно и все слои одновременно. Естественно, что на каждом слое можно разместить гораздо больше информации, чем данных по этой тематике на бумажной карте. Пользователь имеет возможность самостоятельного добавления новых слоев и послойного распределения информации. Послойное размещение информации значительно облегчает анализ: например, на экран можно вывести слой промышленных предприятий и слой уровня загрязнения воздуха. В некоторых ГИС в слое могут содержаться объекты одного типа, а не одной темы: слои точек, слои линий, слои площадей. Иногда в слое могут быть объекты, разные и по типу и по теме, но чаще всего встречается все-таки логическая разбивка информации на слои.

   Большинство ГИС используют для целей обработки и визуализации данных эффективные подходы, основанные на организации данных в виде баз данных (БД). Под базой данных принято понимать "совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимо от прикладных программ".

 

Вопросы для самопроверки:

11.  Определение ГИС.

12.  Функциональная структура ГИС, ее основные блоки.

13.  Классификации ГИС с точки зрения территориального охвата, предметной области информационного моделирования, проблемной ориентации.

14.  Что такое интегрированные,  полимасштабные, пространственно-временные ГИС?

15.  Классификация ГИС с точки зрения их программной архитектуры.

16.  Классификация ГИС по мощности и возможностям эксплуатации.

17.  Основные требования, предъявляемые к ГИС.

18.  CAD- и Mapping-системы, их отличия от ГИС.

19.  Позиционная и содержательная составляющие информации о географических объектах.

20.  Элементарные объекты – примитивы.

21.  Простые и сложные объекты.

22.  Что такое идентификатор?

23.  Модели (структуры) представления пространственной информации.

24.  Послойное представление информации.

 

Литература.

Экоинформатика.  Теория. Практика. Методы и системы. С 374-407.

Кошкарев А.В., Тикунов В.С. Геоинформатика. С. 11-14, 47-58, 124-125.

Коновалова Н.В., Капралов Е.Г. Введение в ГИС. С. 40-60.

 

 

   3. Технологии ввода позиционной информации.

   Технические средства геоинформатики можно условно разделить на три группы, каждая из которых содержит как универсальные, так и специфичные только для нее приборы и оборудование. Для кодировки пространственных данных и прежде всего аналого-цифрового преобразования картографических материалов используют средства цифрования; для обработки и преобразования данных - вычислительную технику; для визуализации данных, что выражается главным образом в построении графических изображений, применяют автоматизированные устройства графопостроения.

   Разумеется, возможно непосредственное создание текстовых файлов в ASCII-кодах, описывающих координаты пространственных объектов и их последующее преобразование в файлы соответствующей данной ГИС структуры. Однако для перевода информации с бумажной карты в элетронную применяются различные технологии обработки картографических материалов.

   Средствами кодирования пространственных данных для ввода их в ЭВМ начиная с ранних стадий развития геоинформатики были цифрователи двух основных видов: 1) полуавтоматические цифрователи (дигитайзеры - digitizer) с ручным  обводом и автоматической регистрацией координат на носитель данных; 2) автоматические, фиксирующие элементы рисунка построчно при перемещении сканерного луча (scanner). Менее распространены устройства, основанные на иных принципах регистрации (например, приборы автоматического прослеживания линий.

   Сканеры - устройства для считывания графической и текстовой информации. В ГИС они широко используются для получения растровых карт. Сканер позволяет создавать электронную копию изображения для последующей ее обработки. Классифицировать сканеры можно последующим параметрам: способу подачи исходного материала для считывания (ручные, планшетные, протяжные, например, роликовые и барабанные); по принципу считывания ипформации (работающие на просвет, работающие на отражение); по глубине цвета (2, 8 или более бит на точку) или отношению к цветопередаче (штриховые, полутоновые и цветные).   Среди других параметров следует выделить: оптическое (геометрическое) разрешение и формат (максимальный размер) сканируемого источника.  Ручные сканеры имеют Т-образный вид и осуществляют сканирование при ручном перемещении сканера по оригиналу. Обычная ширина сканирования - 10 см. Эти сканеры самые дешевые. Ясно, что при ручном использовании они мало пригодны для ввода картографической информации, поскольку не позволяют получить требуемую точность. Эти сканеры работают на отражение, имеют оптическое разрешение 100-800 dpi (точек на дюйм). Глубина цвета может быть от 8 бит (полутоновые) до 24 бит (цветные).  Протяжные сканеры при сканировании протаскивают оригинал через себя. В этом случае, как правило, имеются ограничения только на ширину листа. Они могут работать как на отражение. так на просвет. Типичный представитель этого типа - рулонные сканеры.  Барабанные сканеры имеют барабан, на который крепится сканируемый материал. Сканирование производится при вращении барабана. Сканирующая головка перемещается по направляющей параллельно оси барабана. Размер сканируемого оригинала зависит от размера барабана. Принцип работы планшетного сканера относительно пост. Внутри светонепрницаемого корпуса помещается устройство, состоящее из люминисцентной или специальной лампы, освещающей изображение, и фотоэлемента, собирающего отраженный или прошедший свет. Устройство представляет из себя матрицу из тысяч светочувствительных ячеек, каждая из которых накапливает заряд и приобретает потенциал. величина которого пропорциональна энергии поглощенного света. Затем аналогово-цифровой преобразователь определяет для каждого потенциала его цифровое значение (диапазон значений зависит от разрешающей способности преобразователя). В то время как сканер считывает изображение, интерфейсная плата сканера передает соответствующие данные на компьютер, где они обрабатываются в соответствующей программной системе.

   Результат сканирования может быть представлен в виде файла различных форматов. Наиболее популярны TIFF, PCX, GIF, EPS, BMP. Размеры места на диске, необходимого для хранения изображения. зависят от величины изображения, разрешающей способности сканера, а также от количества оттенков цвета. Для получения качественного картографического изображения, необходимого для последующей векторизации, следует сканировать изображение с разрешением 600-800 dpi (точек на квадратный дюйм).

   Цветные сканеры обычно имеют два режима работы: черно-белый и цветной. Цветное сканирование осуществляется за три прохода: отраженный от изображения свет поочередно проходит через три светофильтра: красный, зеленый и синий. Иногда применяется альтернативный вариант: последовательное освещение изображения светом трех цветов. Совмещение результатов дает представление о цвете. Количество передаваемых цветов зависит от числа разрядов, отведенных на один пиксел (одну точку), обычно это 24, 30 или 36 разрядов (бит). Созданное для сканеров программное обеспечение позволяет сканировать, редактировать и ретушировать изображения, а также записывать их в формате, удобном последующей обработки и преобразования.

   Дигитайзер - это устройство планшетного типа, предназначенное для ввода информации в цифровой форме. Дигитайзер состоит из электронного планшета (иногда на нем имеется прямоугольное меню) и курсора. Дигитайзер имеет собственную систему координат и при передвижении курсора по планшету координаты перекрестья его нитей передаются в компьютер. Размеры планшета дигитайзера колеблются от А4 до А0, переменным является также количество кнопок на курсоре (от одной до 17). Стандартом считается наличие 12 кнопок. Чем большим их количеством обладает курсор дигитайзера, тем больше команд при работе может быть осуществлено нажатием на них. Во многих дигитайзерах используют своеобразное меню, также снижающее необходимость обращения к клавиатуре. Меню - это очерченная часть рабочего поля (обычно левый нижний угол), разделенная на секции и очень напоминающая по своему виду и способу работы сенсорную клавиатуру, только нажатие “клавиш” осуществляется не руками, а курсором дигитайзера.

   Существует несколько способов ввода информации в ГИС с использованием традиционных карт и планов. Это цифрование с использованием дигитайзера (дигитализация) и цифрование растрового изображения на экране компьютера (векторизация). Дигитализация имеет две разновидности: по точкам и потоком, а векторизация - три: ручная, интерактивная и автоматическая. Дигитализация по точкам является самым старым методом из перечисленных. Оператор обводит курсором дигитайзера контура, нажимая при этом необходимые кнопки. При каждом нажатии в компьютер посылается код кнопки и/ или координаты точки пересечения нитей курсора. Изображения обведенных линий и объектов появляются на экране монитора. Этот метод не требует специализированной аппаратуры кроме дигитайзера и сложного программного обеспечения, однако, является самым трудоемким. При цифровании по точкам ошибки со стороны оператора практически неизбежны.  Дигитализация потоком по сути не отличается от предыдущего метода, просто это другой режим работы дигитайзера, при котором с планшета дигитайзера, представляюшего собой проволочную сетку сигнал подается не при нажатии на клавишу курсора, а при пересечении курсором линий сетки, что избавляет оператора от необходимости постоянно нажимать на клавишу. С этим методом связано неудобство хранения большого количества лишних координат, получающихся при пересечении линий сетки.

   Ручная и интерактивная векторизация по “подложке” называются также цифрованием на экране. Они требуют специализированного, сложного программного обеспечения и мощной аппаратуры, так как требуют большого быстродействия компьютера и значительных объемов памяти. Отсканированное изображение из файла выводится на экран монитора, и само цифрование осуществляется по этой “подложке” обычно при помощи мыши. Здесь каждый объект, как и в традиционном цифровании, необходимо обвести, только не на планшете, а на экране. При ручной векторизации все операции выполняет сам опрератор, а при интерактивной часть операций производится автоматически. Так, например, при векторизации горизонталей или других изолиний достаточно задать начальную точку и направление отслеживания линии. Далее векторизатор сам отследит эту линию до тех пор, пока на его пути не встретятся неопределенные ситуации (разветвление или разрыв линии). Здесь опрератор помогает программе разрешить неопределенность и векторизация продолжается до встречи с новой неопределенностью. В основе этого метода лежит умение программы распознать направление обхода объекта в его поточечном изображении. Большинство векторизаторов, работающих в интерактивном режиме, обладают возможностями настройки на преодоление некоторых неопределенных ситуаций, что позволяет векторизовать, например, штриховые и штрих-пунктирные линии, горизонтали с бергштрихами, бровки оврагов и т.п. Возможности интерактивной векторизации прямо связаны с качеством исходного материала и сложностью карты. Несмотря на трудоемкость, эти способы позволяют добиться гораздо большей точности, чем при обычном цифровании дигитайзером, поскольку линии проводятся прямо по линиям, полученным со сканера, а изображение на экране может быть увеличено до необходимых размеров.

    Автоматическое цифрование подразумевает очень небольшое по сравнению со всеми остальными способами вмешательство оператора в работу системы. Карта вначале сканируется, а затем автоматически переводится в векторный формат. Этот тип ввода информации состоит из этапов предварительного редактирования, непосредственного перевода из растрового формата в векторный и окончательного редактирования. Некоторые программные продукты корректируют всевозможные помехи (пятна, грязь и др.) с использованием специальных программ. Эти системы по заложенным в них образцам распознают символы, линии, окружности и т.п. Окончательное редактирование обязательно проводится после перевода форматов. Оно необходимо, поскольку самая изощренная программа может неверно распознать объект, принять, например, символ за группу точек, определить полигон как набор линий и т.д. Автоматический перевод из растрового формата в векторный наиболее удобен в том случае, если обрабатывается большое количество однотипных простых чертежей или карт. Такие программы очень дороги, их покупка становится выгодной только при постоянных больших объемах однотипных работ. В качестве базовой необходимо иметь технологию цифрования и средства дополнительного редактирования. Дигитализацию по точкам или потоком лучше всего использовать для цифрования картографического материала, имеющего нестандартный размер, масштаб, систему координат при плохом качестве исходного материала, его большой сложности, изобилии перекрывающихся символов и текста, наличии пропусков. Ручная векторизация по подложке наиболее приемлема для изображений средней сложности или тех, которые необходимо лишь частично перевести в векторный формат. Интерактивная векторизация подходит для подготовки данных к гибридным векторно-растровым приложениям, для карт с небольшим количеством сложных объектов, для карт, требующих введения среднего количества атрибутов и с ограниченным числом слоев при хорошем качестве исходного материала. Автоматическая векторизация оптимальна при большом количестве несложных документов, для карт с преобладанием линейных элементов, для карт и рисунков с повторяющимися символами, при хорошем качестве исходного материала.

   Цифрование - ступенчатый процесс, включающий: подготовку исходной карты к цифрованию, выделение слоев и объектов, составление ведомостей на объекты, непосредственное цифрование, занесение атрибутивной информации в соответствующие файлы или таблицы. Цифрование - это перевод пространственной информации в цифровую форму. Точки, линии и площадные объекты представляются в виде последовательностей пар координат x,y. Точки представляются одной парой координат, линии представляют из себя строку координат. а полигоны формируются из линий и должны быть замкнуты. Цифрование осуществляется при помощи дигитайзера. Бумажные карты могут быть мятыми, деформированными, рваными. Желательно копирование карт с тонкой легко мнущейся основы на более твердую. Другим важным условием качественной работы является хорошая читаемость карты, четкость печатного изображения, позволяющего легко выделять контуры.

   Предварительная подготовка к цифрованию включает в себя выделение объектов, принадлежащих к одному слою (например, гидрография) и/или типу (линии, точкиЮ полигоны. Каждому объекту должен быть присвоен порядковый номер, устанавливающий последовательность цифрования, по которому затем будет добавлена атрибутивная информация. В некоторых системах она добавляется сразу при цифровании, в других - после полного завершения процесса, иногда допускается и тот и другой способ.

   В начале цифрования лист должен быть надежно закреплен на планшете. Поскольку каждый дигитайзер имеет собственную систему координат, важно иметь возможность перевести эти условные координаты в истинные географические. Поэтому в начале сеанса работы снимаются координаты нескольких (не менее двух) так называемых установочных точек, для которых должны быть известны и координаты в системе координат дигитайзера и в истинной географической системе. Эти координаты в дальнейшем используются для пересчета всех остальных точек в нужные координаты.

  Следует несколько увеличить действительную величину цифруемого листа, что позволяет довести линии, отсекаемые краями карты. При этом удается гораздо точнее соединить этот лист с соседними. Необходимо также обращать внимание на аккуратное определение мест пересечения линий, выделение наиболее точного местоположения пересечения в процессе подготовки к цифрованию. Обязательно также отмечать точку полигона, принимаемую за начальную, чтобы не проходить начало линии дважды. Присваиваемый полигону номер (идентификатор) лучше всего ставить внутри него, чтобы не путать идентификаторы смежных областей.

   Большинство ГИС снабжены возможностями. обеспечивающими аккуратное цифрование, например, точное начало одной линии на другой, что важно при цифровании реки и ее притоков. Необходимо, чтобы линия, изображающая приток. точно начиналась на русле, иначе при решении различных задач, например при поиске оптимального пути ГИС не сможет найти правильного решения, да и при простой визуализации окажется, что они не соединены. К другим возможностям того же плана относятся: замыкание линий, привязка к началу, концу, произвольной точке выбранной линии, оцифрованной ранее и т.п. Одной из важных проблем является то, что слои и/или отдельные типы элементов обводятся отдельно в различных сеансах работы, поэтому на экране появляется не вся картинка, а только полигоны или только линии. В связи с этим не удается точно увязать между собой объекты, принадлежащие к разным слоям или группам. Такие ошибки не всегда могут быть исправлены при последующем редактировании. В некоторых системах, например GeoDraw найдено следующее решение этой проблемы: система позволяет загрузить на экран монитора изображение неактивных в данный момент слоев, выбираемых оператором. Объекты, цифруемые в данном сеансе, могут быть привязаны к неактивным, таким образом, осуществляется точное увязывание контуров между собой.

   При обведении контуров оператор должен точно соблюдать порядок занесения объектов в файл. Редактирование ошибок ввода производится неодинаково в различных ГИС. В большинстве систем редактирование возможно и в процессе цифрования и после него. Часть ошибок, например незамкнутость полигонов, неузловое пересечение линий, отсутствие номера или идентификатора объекта ГИС обычно отслеживает автоматически, однако некоторые ошибки могут быть найдены и исправлены только человеком: к ним относится соответствие номеров объектов на подготовленной и оцифрованной карте, отбор объектов для цифрования и его соблюдение.

 

Вопросы для самопроверки.

25.  Технические средства  ввода позиционной информации.

26.  Способы  ввода позиционной информации.

27.  Способы дигитализации.

28.  Способы векторизации.

29.  Что такое «подложка»? Когда она применяется?

30.  Преимущества и недостатки различных способов цифрования.

31.  Выбор способа цифрования в зависимости от качества данных и цели.

32.  Методика цифрования и его этапы.

 

Литература.

Кошкарев А.В., Тикунов В.С. Геоинформатика. С. 45-46.

Коновалова Н.В., Капралов Е.Г. Введение в ГИС. С. 30-33, 61-72.

 

   4. Структуирование пространственных данных.

   Пространственные объекты подразделяются на множество атомарных, или элементарных объектов - примитивов. К ним принадлежат точки (точечные обекты), линии (линейные объекты), контуры (ареалы, полигоны, polygon, area, area feature, region, face), поверхности (рельефы, surface, relief), ячейки регулярных пространственных сетей и элементы разрешения изображений (пикселы). Первые четыре примитива: нуль-, одно-, двух- и трехмерные пространственные объекты ориентированы на их векторные представления (когда их описание осуществляется путем указания координат объектов и составляющих их частей). Ячейки регулярных сетей и пикселы связаны с растровыми представлениями (в виде совокупности ячеек, на которые разбиваются объекты). В общем растровом формате представления различаются собственно растровые и регулярно-ячеистые (клеточные, матричные, решетчатые) представления. Собственно растровое представление или растровая модель данных - цифровое представление пространственных объектов в виде совокупности ячеек растра (пикселов) изображения на экране дисплея с присвоенными им значениями класса объекта. Растровое представление предполагает позиционирование объектов путем указания их положения в соответствующей растру (разрешению экрана дисплея) прямоугольной матрице единообразно для всех типов пространственных объектов (точек, линий, полигонов, поверхностей). Регулярно-ячеистое представление - это цифровое представление пространственных объектов в виде совокупности ячеек регулярной сети, т.е. двумерных пространственных объектов, элементов разбиения линиями регулярной сети земной поверхности, а не изображения, как в предыдущем случае. Ячейки характеризуются правильной геометрической формой (треугольник, четырехугольник, шестиугольник, сферическая или сфероидическая трапеция при построении сети на сфере или эллипсоиде соответственно), абсолютными размерами в линейной или градусной мере. Эти размеры определяют пространственное разрешение образующей регулярной сети. Ячейки характеризуются также относительными размерами (равновеликие, неравновеликие). По структуре представления пространства растровые модели делятся на регулярные, нерегулярные и вложенные. Плоские модели регулярной мозаики разбивают поверхность на квадраты, треугольники, шестиугольники. Среди нерегулярных мозаик чаще всего используют треугольные сети неправильной формы - Triangulated Irregular Network (TIN) - системы неравносторонних треугольников, соответствующих триангуляции Делоне и полигонам Тиссена. Триангуляция Делоне - треугольная полигональная сеть, образуемая на множестве точечных объектов путем их соединения непересекающимися линиями. TIN-модель была разработана в начале 70-х как простой способ построения поверхностей на основе набора неравномерно расположенных точек. Сети TIN особенно удобны для цифрового моделирования рельефа, представляя его набором высотных отметок в узлах сети (точках перегиба). Таким образом, рельеф представляется многогранной поверхностью. TIN-модель позволяет использовать в качестве элементов более сложные многоугольники, которые можно разбить на треугольники. Эта модель может использоваться как при растровом, так и векторном представлении пространственных объектов. В частности, она используется в ГИС ARC/INFO в модуле цифрового моделирования рельефа. В этом случае к узлам треугольной сети, а также ребрам (сторонам треугольников) относится далее все атрибуты цифровой модели рельефа. В векторных ГИС элементы TIN-модели можно рассматривать как полигоны с атрибутами угла наклона, экспозиции и площади, с тремя вершинами, имеющими атрибуты высоты и с 3-мя сторонами, характеризующимися углами наклона и направлением.

   Полигоны Тиссена (или Дирихле), или диаграммы Вороного, ячейки Вигнера-Зейтца, многоугольники близости позволяют проводить анализ на соседство, близость и доступность. Они представляют собой геометрические конструкции, образуемые относительно множества точек таким образом, что границами полигонов являются отрезки перпендикуляров, восстанавливаемых к серединам отрезков прямых, соединяющих две ближайшие точки.

   Основное преимущество растровых и ячеистых представлений - слияние позиционной и семантической (тематической) информации в единой прямоугольной матрице, расположение элементов которой определяется номером их столбца и строки. При необходимости координаты пиксела или любого угла угла ячейки пространственной сети могут быть легко вычислены. Значение элемента служит непосредственным указателем его семантической определенности, его смысловым кодом или идентификатором. С каждым семантическим значением может быть связан неограниченный по длине набор атрибутов, каждый из которых может быть развернут в производный слой с размерностью исходной матрицы. Поэтому не столь обязательно разделение данных на позиционную и семантическую (тематическую) составляющие, существенно упрощаются аналитические операции, многие из которых сводятся к попиксельным операциям.

   Ячеистое представление объектов путем их соотнесения с территориальными регулярными ячейками основано на разбиении территории на ячейки правильной геометрической формы (прямоугольной, квадратной, треугольной, гексагональной или трапецевидной) в некоторой системе координат (прямоугольной геодезической, географической или условных прямоугольных координатах карты). При этом сеть может мысленно строиться на плоскости, поверхности шара или эллипсоида (в последнем случае регулярными ячейками являются сферические трапеции заданного углового размера). Размеры ячеек определяются требуемым пространственным разрешением, в случае необходимости оперировать различным пространственным разрешением применяются системы вложенных друг в друга территориальных ячеек.

   Простота машинной реализации растровых представлений находится в противоречии с другой главной их особенностью - значительными затратами машинной памяти в сравнении с векторными представлениями. Существуют способы сжатия (компрессии, упаковки) растровых данных, которые позволяют значительно уменьшить этот недостаток. Простейший из них - групповой код, называемый также лексиграфическим. Суть его состоит в следующем: фрагмент исходного растрового слоя преобразуется при этом в ряд пар целых чисел, нечетные позиции из которого отводятся для указания числа повторений ячеек со значениями, занимающими четные позиции ряда. Поскольку число позиций в строке исходной матрицы известно, то его расшифровка не представляет сложности. Принцип группового кодирования широко распространен, однако не принадлежит к самым эффективным. Гораздо более результативны подходы пирамидального представления, в частности подходы квадротомического дерева. Квадротомические структуры разбивают изображение или территорию на вложенные ячейки. В этом случае пространственный объект представляется в виде иерархической древовидной структуры, полученной в результате разбиения пространства или его изображения на квадратные участки или квадратные блоки, квадранты, каждый из которых в свою очередь делится рекурсивно на 4 вложенных до достижения некоторого уровня, обеспечивающего требуемую детальность описания объекта, разумеется, ограниченную разрешением растра. Контур представляется в виде вложенных друг в друга квадратных блоков и производного квадротомического дерева, на каждом из уровней которого указывается принадлежноссть или непринадлежность объектов данного уровня контуру. Квадротомическое представление обеспечивает значительную экономию объемов памяти, требуемых для хранения растровых данных, и что еще более важно - сокращает время доступа к элементам пространственных объектов. Квадротомическое представление является “интеллектуализированным” растром. Для представления трехмерных изображений используется аналогичная методика построения октотомических деревьев.

   В растровых форматах в большинстве случаев неясно, относятся ли координаты к центральной точке пиксела или к одному из его углов. Пространственное разрешение при растровом формате определяется размерами ячейки сетки или соответствующей одному пикселу клеточки карты. Векторные же данные могут задаваться с любой степенью точности. Векторная модель предоставляет произвольный доступ к данным. В векторном формате легче осуществляются операции с линейными и точечными объектами, замена условных обозначений. Растровая модель дает информацию о том, что расположено в той или иной точке, векторная - где расположен тот или иной объект.

   Векторные представления или структуры данных имеют аналогии в картографии, где различаются объекты с точечным, линейным и площадным характером их пространственной локализации.

   Множество точечных объектов, образующее слой однородных данных может быть представлено в векторном формате в виде необязательно упорядоченной последовательности записей, каждая из которых содержит три числа: уникальный идентификационный номер объекта (его идентификатор), значение координат X,Y.

   Множество линейных объектов (например, элементы гидрографической сети), образующих однородный слой, может быть представлено последовательностью координат точек, аппроксимирующих кривые ломаными, составленными из отрезков прямых. Именно с представлением линейных объектов в виде последовательности образующих их точек связано изначально понятие о векторном формате представления: любая кривая может быть описана с заданной точностью совокупностью отрезков прямых - векторов. Расположение образующих кривую точек с фиксированными  координатами зависит от сложности рисунка с привязкой к характерным точкам кривой. Слой линейных сетей разбивается на линейные отрезки (дуги), которые представляются идентификаторами и упорядоченными последовательностями значений координат образующих их точек в соответствующих форматах. Дуга (arc, string, chain, line, edge) - синоним - нить - последовательность сегментов, имеющая начало и конец в узлах. Сегмент - отрезок прямой линии, соединяющий две точки с известными координатами.

   Векторные форматы представления пространственных данных могут топологическими и нетопологическими. Топология - раздел математики, имеющий своим назначением выяснение и исследование в рамках математики идеи непрерывности. Топологические свойства фигур не изменяются при любых деформациях, производимых без разрывов или соединений. В ГИС топологические модели характеризуются наличием совокупностей взаимосвязей, таких, как соединение дуг на их пересечениях, упорядочением набора звеньев, образующих границу полигона, взаимосвязей между полигонами и т.д. Слово “топологический” означает, что в модели объекта хранятся взаимосвязи между объектами, что расширяет использование данных для различных видов пространственного анализа. Топологические модели позволяют представлять элементы карты и всю карту в целом в виде графов. В теории графов: граф - конечное множество вершин, соединенных ребрами. Вершины и ребра - элементы графа, число вершин называется порядком графа. Вершины - объекты, ребра - связи между объектами. Граф называется пустым, если не имеет ребер. Две вершины смежны, если они соединены ребром, два ребра смежны. если имеют общую вершину. Граф называется ориентированным, если каждое ребро имеет определенное направление. Ребра такого графа называются дугами. Граф называется связным, если любые две его вершины соединены маршрутом. Таким образом, в топологической векторной модели площади (полигоны, контура), линии и точки описываются границами и узлами. Каждая граница идет от начального к конечному узлу, и известно, какие полигоны находятся справа и слева. В соответствии с алгебраической топологией полигоны называются 2-ячейками, линии - 1-ячейки и точки - 0-ячейки. Карта рассматривается как ориентированный двухмерный ячеечный комплекс. Топологическое векторное представление отличается от нетопологического наличием возможности получения исчерпывающего списка взаимоотношений между связанными геометрическими примитивами без измерения координат пространственных объектов. Покрытие - набор файлов, отображающих пространственные объекты (точки, дуги, полигоны) и структуру отношений между ними. Примеры топологических отношений между объектами: указание соподчиненности “главный водоток - приток” в линейных сетях, указание принадлежности линейных объектов к описываемым ими контурам, “часть чего-либо”, “левый, правый по отношению к чему либо”, “ начало” и “конец” чего-либо.

   Векторное нетопологическое представление - син. “модель спагетти” содержит описание только геометрии пространственных объектов, но не их топологических отношений.

   Векторные форматы представления линейных отрезков содержат идентификатор линейного отрезка и координатные пары. Кроме того, должен содержаться элемент, позволяющий выделить заданный отрезок в общей совокупности записей линейных объектов слоя, которому соответствует обычно файл данных. В IDRISI (разработка Аспирантской школы Университета Кларка, штат Массачусетс, США) это делается путем помещения вслед за идентификатором целого числа,указывающего число координатных пар, в ARC/INFO линейные отрезки отделяются друг от друга меткой END.

   В нетопологической модели каждый именованный контур (т.е. со своим идентификатором) представляется совокупностью пар координат, образующих его границу линейных отрезков в избранной последовательности (например, по часовой стрелке). Каждый линейный отрезок за исключением внешней границы контуров будет в таком случае описан дважды, т.к. с каждой стороны от отрезка расположен свой полигон. Такой способ представления неэффективен с точки зрения объемов информации и обработки с помощью аналитических операций ГИС, но применяется в недорогих ГИС. Поэтому широко распространено линейно-узловое топологическое представление, в котором контурные объекты описываются в виде множества трех элементов циклических сетей: узлов (node), дуг (arc) и собственно полигонов (polygon). Между этими объектами устанавливаются некоторые топологические отношения, необходимым элементом которых должна быть связь идентификаторов полигонов и дуг. Дугам приписывается указатель правого и левого полигонов, фиксируется направление обхода контуров (полигонов). Различают простой полигон (simple), не содержащий внутренних (inner), и составной (complex), содержащий внутренние полигоны, называемые также “островами” (island) и анклавами (hole). Совокупность полигонов образует полигональный слой, который обязательно включает особо идентифицируемый полигон, внешний по отношению ко всем другим полигонам, называемый универсальным или внешней областью.

   Существуют гибридные модели, сочетающие векторную и растровую структуры - “вастерные модели”.

   Преобразование типа “вектор-растр” - типичная задача растровых ГИС с поддержкой векторного ввода данных (IDRISI). Она должна решаться и в случае необходимости непосредственного вывода векторных данных на устройства печати дискретного типа (матричные и лазерные принтеры), подготовки данных к визуализации средствами графических редакторов и при визуализации на растровых видеоэкранах вообще. Векторно-растровое преобразование может использоваться для генерализации изображения. Идеология преобразования типа “вектор-растр”: а) на набор векторных данных в виде полигонов с их номерами (идентификаторами) “накладывается” (совмещается) регулярная сеть с необходимым размером ячеек, б) принадлежность ячейки полигону определяется положением ее геометрического центра, в) ячейка получает номер того полигона, к которому принадлежит. Результаты совершенно однозначны. Для точек: ячейка получает номер точечного объекта, если он в ней находится, для линий: если линия проходит через ячейку, то она получает признак этой линии.

   Обратная задача - растрово-векторное преобразование используется в приложениях, связанных с интерпретацией цифровых (например, аэрокосмических) изображений и вообще векторизации отсканированных картографических изображений. Его идеология такова: а) классификация растрового изображения - присвоение ко всем ячейкам сети номеров классов, б) выделение границ разных классов, в) выделение полигонов, описываемых номером класса и последовательностью координат его границ. Однако реализация сталкивается с большими трудностями и поэтому ее эффективность в значительной мере зависит от того, насколько успешно чисто автоматизированные методы векторизации сочетаются с интерактивными возможностями контроля процесса преобразования. К счастью, наиболее трудо- и времяемкие стадии этого процесса поддаются автомаизации: фильтрация исходного растрового изображения, подавление шумов, определение и устранение разрывов линий, утоньшение линий, “скелетизация” изображения путем выделения каркасных линий (линии должны бать представлены одним рядом ячеек, не должно быть их удвоения, утроения). Некоторые из побочных эффектов опрерации растрового-векторного преобразования приводят к появлению небольших по размерам “паразитных” полигонов. Для их удаления используется ценз отбора, связанный с его размером (исп. в ARC/INFO). Путем использования экспертных систем можно добиться удаления некоторых ложных полигонов, связывая ценз отбора с их формой.

 

Вопросы для самопроверки:

 

33.  Примитивы векторных и растровых представлений пространственных объектов.

34.  Различия между растровыми и векторными моделями, их преимущества и недостатки.

35.  Собственно растровое представление или растровая модель данных.

36.  Регулярно-ячеистое представление.

37.  Что такое TIN-модель?

38.  Что такое полигоны Тиссена и триангуляция Делоне?

39.  Применение лексиграфического кода.

40.  Применение пирамидальных структур на примере квадротомического дерева.

41.  Что такое дуги и сегменты?

42.  Виды векторных форматов.

43.  Различия между векторными топологическими и векторными нетопологическими форматами.

44.  Понятие графа.

45.  Что такое покрытие?

46.  Модель «спагетти».

47.  Линейно-узловое топологическое представление.

48.  Преобразование «вектор-растр».

49.  Преобразование «растр-вектор».

 

Литература:

Кошкарев А.В., Тикунов В.С. Геоинформатика. С.47-58, 63-69.

Коновалова Н.В., Капралов Е.Г. Введение в ГИС. С. 58-59.

 

    5. “Интеллектуализация” ГИС.   

   Хотя хранящаяся в ГИС информация представляет собой исключительную ценность, она приносит практическую пользу только при решении прикладных задач. Каждая ГИС кроме модулей, производящих ввод и вывод информации, обязательно комплектуется средствами, предназначенными для решения специфических задач пользователя. Без этих средств это уже не ГИС, а CAD-система (Computer-Aided Design - САПР - система автоматизированного проектирования) или AM - Automated Mapping -система автоматизированного картографирования. Но и этого уже мало. В технологию ГИС широко внедряются экспертные системы. Это - системы искусственного интеллекта, использующие знания из сравнительно узкой предметной области для решения возникающих в ней задач, причем так, как это делал бы эксперт-человек, то есть в процессе диалога с заинтересованным лицом, поставляющим необходимые сведения по конкретному вопросу. Вспомним отличие данных от знаний: данные - формализованные факты, знания - отражение семантических аспектов реальности в сознании человека или технической системе. Если ранее в задачи обработки данных на ЭВМ входило только оперирование с данными, причем смысл манипуляций понимал пользователь, то теперь разрабатываются программы, способные анализировать семантику (смысл) используемых данных. При этом необходимо обращаться к базам знаний. Такие программы способны производить логические цепочки на основе ранее полученных выводов, сравнивать выводы с имеющимися знаниями, проверять их логичность, уточнять и строить новые логические конструкции. Если полученный результат явно противоречит здравому смыслу, то при традиционном алгоритмическом построении программы это безразлично компьютеру, но в экспертной системе такое не должно остаться незамеченным.

   Знания делятся на предметные или общедоступные и индивидуальные или эмпирические. К общедоступным относятся наборы сведений в учебниках или другой научной литературе, а индивидуальные знания часто носят эмпирический характер, основанный на правилах и подходах, которые эксперт не может четко или однозначно сформулировать - такие правила и подходы называются эвристиками.

    Для экспертных систем необходимы три компоненты: факты, правила (процедурные знания) и управляющие структуры. Фактические знания сообщаются экспертной системе экспертом-специалистом в процессе диалога и отражают его взгляды на момент работы. Процедурные знания или правила тесно связаны с фактическим и являются накопленными знаниями, на основе которых в свою очередь разрабатывались правила, определяющие функционирование системы. Управляющие знания позволяют подбирать наилучшую стратегию в работе системы.  Существуют интеллектуальные системы, способные самообучаться на основе накопленного опыта анализа, контроля и принятия решений. В них появляются знания второго уровня, знания о знаниях или метазнания.

   Экспертная система, как правило, состоит из 4 компонент: базы знаний, машины вывода, системы накопления метазнаний (т.е. знаний второго уровня для самообучения системы), системы объяснений и общения с пользователем. Реальные системы могут содержать лишь некоторые из этих элементов. Знания в базе знаний в отличие от данных требуют иного представления, для чего используются семантические сети с произвольной структурой, а также более регуляризованные сети - фреймы. Фреймы выражают общие понятия, а слоты или ячейки дают их детализацию, что приводит к типичной иерархической структуре. Например, в экспертной системе по оценке состояния природной среды фрейму “состояние природной среды” в качестве его слотов соответствуют “степень загрязненности атмосферы”, “загрязнение поверхностных вод”, “загрязнение подземных вод”, “состояние почв”, “состояние растительных сообществ”, “состояние животного населения” и т.д. Каждый слот кроме имени может иметь одно или несколько значений, качественных или количественных, например: “выбросы вредных веществ предприятием в атмосферу” ® “изобутилен”, “200”, “600”, “400”, “600”; “этиленгликоль”, “40”, “70”, “60”, “80” и т.д. При характеристике выбросов изобутилена, этиленгликоля и т.д. первое числовое значение может определять фоновые, второе - максимальные концентрации, третье - реальные средние, 4 - ПДК. В качестве слота могут использоваться сложные структуры, включающие иерархию слотов более низкого порядка. Так, в слот “выбросы вредных веществ предприятием в атмосферу” можно включить слот “состояние атмосферы”, который в свою очередь будет характеризоваться “ скоростью ветра”, “распределением температур”, “стратификацией атмосферы” и т.д. При изменении содержания слотов преобразуется вся семантическая структура в зависимости от конкретных целей.

   Большое распрстранение получили “продукции”. Их можно представить в виде выражения “если - то” (ядра), например: “если содержание углеводородов в выбросе в атмосферу првысит ПДК в 100 раз, то это может привести к экологической катастрофе”. Для получения выводов “продукции” могут образовывать сложные цепочки. Кроме ядра “продукции” допускают использование пред- и постусловий, разрешающих или запрещающих применять данное условие, а также определяющих, необходимо ли изменять что-либо в базе знаний в зависимости от результата выполнения процедуры “если - то”.

   Например, поставим условие, что химический комбинат А намерен увеличить выпуск каучука из изопентана на 10%, то увеличение объема выброса в атмосферу изопрена приведет к превышению ПДК. Тогда постусловие должно изменить объем увеличения продукции или сделать предположение о возможности увеличения производства каучука на предприятии Б. Если поставить условие о пересмотре ПДК, тогда “продукция” будет описывать уже другую ситуацию.

   Другая задача. Необходимо выбрать место для размещения нового завода (А) по производству алюминия с определенным объемом производства - 100 тыс. т в год). Желательно выполнение следующих условий: Р1 - залежи бокситов удалены не боле чем на 500 км; Р2 - добыча бокситов не менее 400 тыс. т в год; производство из бокситов не менее 200 тыс. т. глинозема; Р4 - наличие значительных энергоресурсов; Р5 - район размещения завода - конкретный регион для обеспечения занятости населения; Р6 - город для размещения завода должен полностью укомплектовать его персоналом в 700 человек, чтобы не было расходов по привлечению рабочей силы со стороны. “Продукция”, описывющая ситуацию для места (Б) такова: (Б) Р, Р6 (N>700), A ®B, (Б), Q, где Р определяет выполнение первых пяти условий размещения предприятия А, т.е. Р = Р1 ÇР2 ÇР3 ÇР4 ÇР5 ; Р6 определяет, достаточно ли свободных трудовых ресурсов (более 700 человек), В фиксирует пригодность пункта для размещения завода, Q определяет состояние окружающей среды после строительства завода.

   Применение “продукции” упрощает диалог и объяснения пользователю, почему принято то или иное решение. Возможен синтез фреймов и “продукций”, например, использование “продукций” в качестве слотов во фреймах.

   Важной особенностью экспертных систем является возможность работы с нечеткими данными и самое главное, нечеткими знаниями. Используя комбинации элементов знаний, можно придти к вполне определенным заключениям, т.е. даже на основе ненадежных данных можно получать правдоподобные выводы. Для характеристики фактов используется нечеткая логика, разработаны коэффициенты уверенности для измерения степени доверия к любому заключению.

   Другим важным элементом экспертной системы является машина логического вывода - универсальная думающая машина, база знаний - это то, над чем ей необходимо думать. В ответ на запрос экспертная система должна быть способна строить логические выводы и на их основе приходить к заключениям. Здесь проверяется выполнимость задачи при конкретных условиях по отношению к имеющимся правилам и подбирается путь ее решения. При этом в отличие от традиционных алгоритмов, осуществляющих механический перебор всех правил, в экспертной системе пространство поиска сужается за счет того, что компьютер должен представлять, что же ему встретится. Например, в экспертной системе оценки воздействий техногенных атмосферных выбросов на окружающую среду в зависимости от места размещения предприятия система должна перебирать не всю имеющуюся в памяти информацию о характеристиках и правилах воздействия загрязнения на растительные организмы, включая пальмы, мангры и ягель, при условии, что предприятие размещается в средней полосе России, а четко выбрать входящие в зону влияния предприятия сообщества (расчет этой зоны - дело входящей в ГИС модели). При этом она должна не останавливаться, если по данному растению нет данных, а грамотно подобрать аналог. Так, если нет данных по березе, то нужно в качестве аналога подобрать параметры другой мелколиственной породы, а не сибирской кедровой сосны. Если нет данных по лиственнице, то нельзя брать правила для ели, поскольку лиственница сбрасывает хвою каждую осень, а у ели она многолетняя. Подобная система должна знать видовой сообществ той территории, которую она призвана обслуживать, уметь оперировать с понятиями доминантов, эдификаторов, второстепенных и третьестепенных видов, эндемиков, уметь определять устойчивость экологических систем по Ляпунову и Лагранжу, оценивать предельно допустимое воздействие на природную среду и т.д.

   Процедура получения выводов путем анализа фреймов или “продукций” называется прямой стратегией. Возможна и обратная стратегия, когда человек выдвигает гипотезы, а компьютер их проверяет. Используются и смешанные стратегии, когда машина выдает ряд вариантов решения, из их выбирается одно, которое затем анализируется при помощи обратной стратегии. Естественно, этот путь неоднозначен.

   Блок накопления метазнаний проверяет непротиворечивость вновь поступающих сведений имеющимся правилам. Это достигается путем проверки семантической непротиворечивости, а также автоматическим тестированием. Проверка семантической непротиворечивости состоит в согласовании вносимых изменений правилам базы знаний, а автоматическое тестирование проверяет нововведения на большом количестве задач, чтобы оценить их положительное влияние на работу экспертной системы. В случае конфликтной ситуации может оказаться необходимым пересмотр правил.

   Экспертная система, проводя классификацию, сравнивает объекты с идеальными моделями. При этом она не ограничивается алгоритмической классификацией и учитывает семантику. Так например, эвристическая программа должна суметь сгруппировать объекты Москва, Орел, Брянск в класс “города”, а Лена, Москва, Волга - в класс “реки”. Экспертная система должна обладать аппаратом многокритериальных оценок, выводить одни правила из других.

   Так как правила, разработанные одним специалистом, часто сильно отличаются от разработанных другим, то экспертная система становится “вторым я” автора, копируя его стиль работы.

   Система объяснений используется для разъяснения пользователю того, как экспертная система пришла к тому или иному конкретному выводу. Причем в процессе работы пользователь может задавать дополнительные вопросы о получении промежуточных результатов, уточнять цели, инспектировать правила с точки зрения их согласования между собой и соответствия поставленным целям и т.д. Метод рассуждения, который не может быть объяснен человеку, является неудовлетворительным, даже если с ним система работает лучше, чем специалист.

   Как правило, система объяснений делает трассировку хода проведения рассуждений в обратном порядке от того места, к которому относится вопрос, или от конечного результата. Каждый шаг рассуждения подкрепляется выводами из правил базы знаний. Экспертная система, объясняет также, почему она не пошла другим путем, какие правила базы знаний этот путь заблокировали. Объяснения экспертной системы помогают совершенствовать базу знаний, показывая ее слабые места, которые ведут к неправильным выводам.

   Система общения пользователя с экспертной системой должна быть максимально удобна для человека. Существуют проекты экспертных систем, которые смогут на слух воспринимать естественную человеческую речь на ограниченном английском языке, графические изображения, карты, фотографии.

   Экспертные системы могут сильно различаться своей конфигурацией в зависимости от задач, технических средств, объемов данных и знаний. Важной является возможность комбинирования экспертных систем с математическими моделями, выполняющими алгоритмические вычисления. Такие системы называются интегрированными. Они подразделяются на несколько типов: интерпретирующие, позволяющие на основе наблюденных фактов делать описания и выводы; прогнозирующие - выводящие следствия из совокупности состояний исследуемых явлений, например прогноз погоды, урожайность и т.д.; диагностирующие - прежде всего в медицине; проектирующие - в строительстве; планирующие; мониторинговые; ремонтные; обучающие и др.

   Включение экспертных систем в ГИС позволяет сделать последние более эффективными и легче используемыми, обучать малоопытных пользователей работе с ними, совершенствовать поиск информации в больших массивах данных.

Одно из интересных приложений экспертных систем в геоэкологии может состоять в их применении не только для обучения отдельным географическим и экологическим дисциплинам, но и в качестве “интеллектуального интерфейса” для связи с пакетами вычислительных программ, с которыми пользователь мало знаком. Здесь экспертные системы смыкаются с обучающими системами. С развитием экспертных систем роль специальных знаний все более возрастает,  облегчается их передача от учителя к ученику, улучшается сохранность накопленных знаний и возможность их дальнейшего пополнения и совершенствования. Экспертные системы могут рассматриваться как одно из самых мощных средств геоэкологических исследований на ближайшую перспективу.

 

Вопросы для самопроверки:

50.  Обоснуйте необходимость включения в ГИС блока экспертной системы.

51.  Структура экспертной системы.

52.  Что такое эвристики?

53.  Что такое базы знаний?

54.  Приведите собственный пример фрейма и слотов.

55.  Приведите собственный пример продукции. 

56.  Машина логического вывода.

57.  В каких случаях при работе с экспертной системой применяются прямая и обратная стратегии?

58.  Для чего нужны система объяснений и система общения?

 

Литература:

Кошкарев А.В., Тикунов В.С. Геоинформатика. С.97-102.

 

   6.  Анализ данных.

    Существует перечень обязательных функций, наличие которых требуется от любой ГИС. Это: арифметические и геометрические функции, сетевой анализ, анализ наложений, выделение объектов в новый слой и утилиты работы с полями баз данных. Можно выделить следующие группы элементарных операций аналитического характера:  1. Операции переструктуризации данных (предпроцессорные операции); 2. Трансформация проекций и изменение систем координат; 3. Операции вычислительной геометрии. 4. Оверлейные операции (наложение разноименных и разнотипных слоев  данных); 5. Общие аналитические, графо-аналитические и моделирующие функции.

   Переструктуризация данных. Пространственные данные, введенные в среду ГИС, зачастую нуждаются в некоторых предварительных операциях, позволяющих адаптировать эти данные к дальнейшей обработке. Наиболее важными операциями являются операции преобразования данных из векторного в растровые представления и обратно. В блок трансформации проекций и изменения систем координат входят и операции пересчета координат пространственных объектов (опрерации ротации - поворота, сдвига,масштабирования осей) и более сложные трансформации, связанные, например, с "укладкой" объектов в систему опорных точек с точно известными координатами (например, привязка спутникового снимка), и трансформация картографических проекций как наиболее сложная подгруппа операций. Картометрические (арифметические) операции включают в себя: расчет площадей, длин ломаных линий, периметров, площадей склонов, объемов, заключенных между поверхностями, координат центров полигонов. К ним принадлежат также операции определения принадлежности точки внутренней области полигона, описание геометрических и топологических отношений точечных, линейных и полигональных объектов двух разноименных слоев в целом при их наложении (оверлее). Геометрические утилиты используются для анализа пространственных данных и связей между ними. Очень часто создается буферная зона - район, граница которого отстоит на заданном или высчитанном расстоянии от границы исходного объекта, например, водоохранные зоны.  Оверлейные операции являются средством анализа множества разноименных и разнотипных по характеру локализации объектов. Суть их состоит в наложении двух разноименных слоев (или множества слоев, больше двух, при многократном повторении операции наложения) с созданием производных объектов, возникающих при их геометрическом наслоении и с наследованием их семантики (атрибутов). В этих операциях можно выделить: 1) Определение перекрытий. (Распознание перекрывающихся площадей разных полигонов);

2) Определение внутренних областей. Эта операция распознает площади (полигоны), целиком лежащие внутри какой-либо области (другого полигона или объединения полигонов); 3) Объединение площадей; 4) Определение линии пересечения полигонов; 5) Создание буферной зоны нескольких объектов; 6) Поиск точки касания (пересечения) линейного объекта;  6) Поиск ближайшего объекта расчетом расстояний до объектов зоны; 7)  Поиск объектов, попадающих в определенный район; 8) Определение центра прямоугольника, охватывающего объект.

   Основное назначение функций зонирования состоит в построении новых объектов - зон, т.е. участков территорий, однородных в смысле выбранного критерия или целой группы критериев. Границы зон могут либо совпадать с границами ранее существовавших объектов (задача “нарезки избироательных округов по сетке квартального деления), либо строится в результате различных видов моделирования (зоны экологического риска). Типичные задачи этого типа: выделение зон градостроительной ценности территорий, зон экологического риска, зонирование урбанизированных территорий по транспортной доступности, построение зон обслуживания поликлиник и т.д.

   Сетевой анализ позволяет проанализировать пространственные сети связных линейных объектов (дороги, водопроводы, линии электропередач, гидрографическая сеть). В классическом представлении сеть считается набранной из линий, которые могут иметь не более двух общих точек касания с другими линиями - начало и конец. Другим важным фактором, определяющим сеть, является способ соединения ее элементов. Во всех типах сетей встречаются два типа соединений: “из/в” и “из/через”. Первый тип соединения прост. Второй тип означает, что объект А соединяется с В через С. Такой тип соединения встречается в электрических сетях. Например, серия кабелей подходит к узлу, серия кабелей выходит из него, однако не все кабели соединяются со всеми. Математически сети описываются теорией графов. Обычно сетевой анализ служит для задач определения ближайшего, наиболее выгодного пути, для определения зон влияния на объекты сети других объектов. Типичной задачей сетевого анализа является определение адреса. С картой дорог связывается файл БД, содержащий необходимую информацию. С участками сети обычно связывают понятие направления движения. Другими данными, относящимися к сети, могут быть мощность потока, его временные интервалы и т.д. Для гидрографической сети это может быть средний расход на данном участке.

   Утилиты работы с полями баз данных включают в себя поиск имени поля и его значения, поиск по маске, создание, редактирование и удаление поля, калькуляцию, кассификацию и перегруппировку. Калькуляция - создание нового поля и расчет  его значений по значениям старых полей согласно введенной формуле. Например, расчет площади земельного участка по масштабу карты и координатам с сохранением полученного значения в новом поле с именем “площадь”. Классификация - создание нового значения в новом поле по классификационным правилам. Пример: классификация земельных участков по трем градациям - крупные, средние и мелкие по численным значениям поля “площадь” и сохранение результата в новом поле “размер”. Перегруппировка - создание нового значения по группам подобных значений. Например, сгруппировать земельные участки по типу: селитебная территория, пашня, сад, огород, свалка, лес и т.п. и подсчитать общую площадь земель каждого класса. В результате образуется новая таблица, которую можно записать в файл базы данных.

   Операции с трехмерными объектами. В отличие от цифровых представлений точечных, линейных и площадных объектов трехмерные объекты: поверхности, рельефы требуют особых форм представления, поскольку их пространственное положение должно описываться не только плановыми (географическими или геодезическими), но и высотными координатами (аппликатами). Следует различать цифровые модели картографического изображения рельефа (изолинии, отметки высот, знаки оврагов и т.п.) и собственно цифровые модели рельефа. Модели топографических поверхностей подразделяются на: 1) регулярная (геометрически упорядоченная) модель с заданием высотных отметок в вершинах правильных геометрических фигур; 2) геометрически упорядоченная (аналоговая) модель с расположением точек на горизонталях, структурных линиях и в характерных точках поверхности; 3) полурегулярная как комбинация первых двух типов; 4) хаотическая (случайная) модель с произвольным расположением точек дисретизации поверхности. TIN-модель можно рассматривать как частный случаем второго типа. Кроме создания моделей собственно рельефа в класс задач создания моделей поверхностей входят и трехмерные визуализации,  например построение панорамы города. Моделироваться могут как изображение действительного рельефа или непрерывного поля (статически или динамически), так и воображаемые поверхности, построенные по одному или нескольким показателям, например, поверхность цен на землю, поверхность экологического риска и т.д.

   Анализ растровых изображений. В качестве таких изображений в ГИС обычно выступают снимки. Преимущество снимков - в их современности и достоверности, поэтому достаточно часто встречающийся вид анализа - временной. Сравниваются и ищутся различия между снимками различной давности, таким образом оценивается динамика произошедших изменений. Часто анализируются пространственные взаимосвязи нескольких явлений. К снимкам может также быть применен кластерный анализ, на основе которого выделяются области лесов, рек, полей и т.д. С растровыми образами производятся картометрические вычисления: длин, площадей, объемов. Существует специальная область анализа, которую иногда называют картографической алгеброй (map algebra).

   Специализированный анализ. Обычно ГИС не снабжены возможностями специализированного анализа, например, экологического и т.д. Это связано с тем, что единой схемы такого анализа не существует, производители стандартных ГИС не могут соответственно, включить их в программное обеспечение ГИС. Различные пользователи производят такой анализ по собственным методикам и правилам. Поэтому возможности специализированного анализа в ГИС реализуются средствами создания приложений самими пользователями. Однако некоторые фирмы (INTERGRAPH, ESRI) предоставляют пользователям возможность укомплектовывать систему фирменными модулями, реализующими специализированные анализы.

 

Вопросы для самопроверки:

59.  Для каких целей служат операции переструктуризации данных?

60.  Предложите примеры картометрических операций при проведении экологических исследований.

61.  В каких геоэкологических и социоэкологических исследованиях может быть полезно использование оверлейных операций?

62.  Придумайте примеры применения сетевого анализа при: экологической оценке водосборного бассейна; при социоэкологических исследованиях (на Ваш выбор).

63.  Приведите примеры применения утилит работы с полями баз данных при проведении экологической оценки территории.

64.  Формы представления трехмерных объектов.

65.  Модели топографических поверхностей.

66.  В каких случаях, на Ваш взгляд, при проведении экологических исследований необходимо проведение операций с трехмерными объектами?

67.  Приведите примеры анализа растровых изображений при проведении экологических исследований.

 

Литература:

Кошкарев А.В., Тикунов В.С. Геоинформатика. С.63-87.

Коновалова Н.В., Капралов Е.Г. Введение в ГИС. С. 83-93.

 

    7. Блок моделирования ГИС.

    Во-первых, в ГИС применяется картографическое моделирование: семантическая информация должна быть наиболее адекватно визуализирована. Речь идет о выборе наиболее действенных картографических средств для представления экологической информации.  Здесь мы переходим к моделированию состояния объектов. Объекты (водоемы, водотоки), природные экосистемы, агросистемы, населенные пункты и т.д. характеризуются значительным перечнем своих характеристик - атрибутов, которым в семантической базе данных ГИС соответствуют отдельные поля, а каждому объекту в базе данных отводится отдельная строка - запись. Экологическое состояние объекта (или уровень трофности, комфортности проживания и т.п.) зависит от всей совокупности характеристик объекта. Поэтому для адекватного определения экологического состояния применяются методы теории многокритериального оценивания, теории нечетких множеств и т.д. Эти методы могут входить в ГИС в качестве отдельного модельного блока.

    Важная роль в диагностике и прогнозировании состояния геосистем принадлежит имитационным моделям функционирования экологических систем. Метод проб и ошибок, при котором объект рассматривается как "черный ящик", не применим к геосистемам, потому что это подразумевает длительные поиски оптимального режима функционирования экосистемы с многочисленными разнообразными входами, а также вследствие уникальности каждой природной геосистемы, которая не может подвергаться риску необратимых изменений. Кроме того, имитационное моделирование геосистем может вызываться необходимостью познания их связей и функций, не доступных во всех своих деталях прямым наблюдениям.  Необходимость подобных исследований определяется чрезвычайно сложным характером взаимодействия антропогенных воздействий с естественным ходом развития экосистемы, т.к. она имеет траекторию естественного развития и область внутригодовой и межгодовой изменчивости. Из-за этого одни натурные наблюдения не в состоянии вскрыть сложные механизмы функционирования геосистемы в условиях антропогенного пресса и ее отклика на них. Образно говоря, перед исследователем постоянно стоит "проблема заключившего пари с хозяином Эзопа". (Согласно легенде сей почтенный муж в пьяном виде поспорил на все свое состояние, что сможет выпить море. Протрезвев, он обратился за помощью к своему рабу, древнегреческому баснописцу Эзопу. Тот ему посоветовал сказать: "Я готов выпить море, но только без воды рек, в него впадающих". Противник в споре, разумеется, не смог отделить морскую воду от речной.) Имитационная модель как раз и выступает в роли разделителя процессов.

   На основании только результатов имитационного моделирования можно определять экологически обоснованные нормы антропогенного воздействия на конкретные природные объекты.

   Применение геоинформационных технологий предполагает многовариантность моделирования. Многовариантность может проявляться на всех стадиях моделирования - на этапе его информационного обеспечения, его переработки и отображения результатов моделирования. Имитационные модели функционирования экосистем могут физически входить в состав ГИС в качестве отдельного программного блока, а могут и являться внешними по отношению к ГИС, обеспечивая ГИС наборами правил для экспертной системы (экологически обоснованные ПДК и т.п.). Блок моделирования ГИС может содержать проблемно-ориентированные библиотеки программ, реализующих практически все разновидности моделирования, применяющегося в науках о Земле.

 

Вопросы для самопроверки:

68.  Применяемые в ГИС типы моделирования. Обоснуйте необходимость имитационного моделирования процессов в экосистемах.

 

Литература:

Кошкарев А.В., Тикунов В.С. Геоинформатика. С. 89-96.

 

   8. Обзор применяемых для создания ГИС программных средств.

   Классические ГИС профессионального уровня. К этому типу широко известные ГИС фирм INTERGRAPH, ESRI и др. Это мощные системы, первоначально созданные для рабочих станций и сетевого использования. Рабочая станция - высокопроизводительный компьтер с RISC(Redused Instruction Set Computer) процессором и мощным графическим ускорителем. Как правило, работает под управлением операционной системы UNIX. Такие системы поддерживают многочисленные приложения. Онм включают блоки цифрования картографического материала в различных режимах, работают с большим количеством внешних устройств, имеют многооконный режим, допускают настройку меню, позволяют встраивать пользовательские программы на языках высокого уровня.

   Программные продукты фирмы INTERGRAPH (США).  Всего около 250 программных продуктов фирмы предназначены для работы с использованием ГИС-технологий в различных приложениях. Они предоставляют возможность работы в многопользовательском режиме и режиме клиент-сервер. Их преимуществами являются: модульная архитектура, поддержка промышленных СУБД различных фирм, наличие языка программирования высокого уровня, возможность хранения очень больших объемов структуированной информации, работа с растровыми изображениями, работа с различными картографическими проекциями, преобразования из проекции в проекцию, прстроение и анализ 3-х мерных моделей территорий, работа с распределенными базами данных, развитая система создания карт. Области применения: ведение земельного кадастра, управление землей и недвижимостью, комплексная оценка и управление урбанизированными территориями, управление транспортными потоками, планирование и оптимизация перевозок, управление природными ресурсами (лесными, водными, недрами), экологический мониторинг, оценка и прогнозирование состояния окружающей среды, высококачественная картография (как топографическая, так и тематическая), управление инженерными коммуникациями. Основу программных ГИС-продуктов составляет семейство модулей MGE. Ядро системы - программа MicroStation. MGE модули являются надстройкой над этой программой. MicroStation имеет встроенные языки UCM и MDL, причем первый - макроязык пользовательских команд, а второй - Си-подобный язык программирования. Управление окружающей средой осуществляется при помощи следующих модулей: MGE Environmental Manager (ERMAMGR) - представление данных и вероятностный пространственный анализ, MGE Environmental AT123D (ERMAAT) - моделирование распространения загрязнения, MGE Environmental Modflow (ERMAMF) - моделирование и анализ миграции грунтовых вод, MGE Environmental Site Database  (ERMASDB) - создание и управление схемой базы данных и пользовательским интерфейсом, MGE Voxel Analyst (MGVA) - визуализация и анализ трехмерных данных, ERMA Data Manager (ERMA-DM) - создание и ведение экологической базы данных, генерирование отчетов и тематических карт,  ERMA Groundwater Modeller (ERMA-GWM) - моделирование и анализ потоков и распространения загрязнений в грунтовых водах. Включает три системы моделирования методом конечных элементов: MODFLOW, MODPATH, M3D.

   Имеется ряд модулей обработки снимков и цифровой фотограмметрии, работы с пространственными сетевыми объектами, векторизации. Векторные графические данные хранятся в форматах программы MicroStation (dgn-файлах). Этот формат является открытым. Программное обеспечение позволяет использовать многих типов электронных тахеометров и GPS приемников. Система позволяет читать файлы в форматах DWG и DXF. Имеется конвертор данных между системами Intergraph и MapInfo. Модуль MGE ASCII Loader обеспечивает импорт и экспорт файлов в ASCII формате. Через модуль RIS осуществляется прямой доступ к базам данных тематической информации ORACLE, INGRES, SYBASE, INFORMIX, MS SQL SERVER и др. Система позволяет работать с растровыми данными всех распространенных форматов. Собственное программное обеспечение может быть создано на языках Си, Fortran, Pascal, Ada, а также с помощью средств графического ядра системы Microstation - макроязыка пользовательских команд UCM и языка программирования MDL.

   Разработки Института исследований систем окружающей среды (ESRI, US). ARC/INFO - универсальная, поддерживающая все основные платформы система. Она является основой семейства программных продуктов фирмы ESRI. Система ARC/INFO существует в двух видах: для UNIX и Windows NT и PC ARC/INFO (для работы на персональном компьютере). По своим функциональным возможностям PC ARC/INFO является сужением системы ARC/INFO. В свою очередь DAK является подмножеством функций системы PC ARC/INFO. Он позволяет вводить и редактировать новую информацию, создавать топологию, выполнять преобразования из проекции в проекцию. Программный продукт ArcCAD интегрирует в себе возможности технологий САПР и ГИС в едином программном продукте. ArcView представляет собой ГИС “настольного типа”. ArcView и ARC/INFO могут взаимодействовать в сети и на функциональном уровне. Каждая из этих систем может обрабатывать команды, посланные из другой системы. MapObjects - набор инструметальных средств для разработчиков картографических и ГИС приложений. SDE обеспечивает работу с крупными распределенными базами пространственных данных.

  Основные возможности.  ARC/INFO использует векторно-топологическую структуру пространственных данных и полностью включает возможности реляционной базы данных. Макроязык AML позволяет создавать пользовательские приложения. ARC/INFO может работать в локальной сети. Возможно одновременное редактирование карт несколькими пользователями. При работе с тематическими данными можно использовать внешние СУБД Oracle, Ingres, Informix, DB2, SQL/400 и т.д. Обеспечивается прямой доступ к базам данных dBASE, INFO, ASCII с разделителями, а также Oracle, Ingres, Informix, SYBASE. ARC/INFO обладает богатым набором функций пространственного анализа.

   Области применения: ведение земельного кадастра, управление землей и недвижимостью; комплексная оценка и управление территориями; управление на транспорте, планирование и оптимизация перевозок; управление природными ресурсами (лесными, водными, недропользование); экологический мониторинг, оценка и прогнозирование состояния окружающей среды; маркетинговые исследования; планирование инвестиций; высококачественная картография как топографическая, так и тематическая.

   Структура.  ARC/INFO состоит из базового комплекта программ и модулей расширения. Базовый комплект - это полнофункциональная ГИС для работы с пространственной информацией. Он поддерживает все операции по созданию и использованию геоинформационной системы, т.е. ввод информации, ее редактирование, организацию пространственных запросов и анализ информации, а также создание качественной картографической продукции. В базовом комплекте расположена также подсистема DATA CONVERSION, которая обеспечивает преобразование данных из проекции в проекцию. Модули расширения включают: ARC/INFO TIN - модуль моделирования поверхностей для анализа и отобржения непрерывных пространственных явлений (рельеф, уровень электромагнитного поля и т.д.). Основа модели - нерегулярная триангуляционная сеть (TIN); ARC/INFO COGO - модуль интегрирования данных геодезических измерений и вычислений в ГИС (обработка теодолитных ходов, прямые и обратные задачи, прямые и обратные засечки и т.д.); ARC/INFO GRID - модуль анализа растровых данных. Он применяется в области гидрологического и геологического анализа, многомерного статистического анализа пространственных данных. В нем сосредоточены функции растрового моделирования. Они включают выделение водосборов и дренажной сети, определение порядков водотоков и решение задач фильтрации, расчеты извилистости и кривизны склонов, анализ видимости, определение оптимальных путей. Модуль содержит функции многомерного статистического анализа, дискриминантного и кластерного анализа. Эти функции позволяют выполнять комплексную оценку территории; ARC/INFO NETWORK - модуль для работы с сетями топологически связанных объектов (энергетические сети, трубопроводы и т.п.). Он содержит также функции геокодирования, т.е. привязки адресных или других географически соотнесенных с их пространственным положением данных. В этом модуле реализованы функции поиска оптимальных маршрутов, оценки поглощения ресурсов в сети, районирования с использованием элементов сети в качестве границ районов, выбора частных сетей из более крупной сети в соотыетствии заданными критериями, объединения нескольких сетей в одну сеть, решения задачи транспортной доступности с учетом параметров сетей; ARCSCAN - модуль ввода картографических данных со сканеров.

   Векторные графические данные используются в форматах программных продуктов ESRI (покрытия ARC/INFO и шейпфайлы ArcView). Система поддерживает также многие стандарты обмена данными и работу с растровыми графическими данными в форматах ERDAS и TIFF. Модули IMAGE INTEGRATOR и GRID поддерживают ряд дополнительных растровых форматов. Поддерживается топологическая модель данных. Наряду с ней система работает еще с несколькими моделями данных. Это сети нерегулярных треугольников (TIN), а также модель обобщенных площадных объектов, называемых регионами, что дает возможность работы с перекрывающимися полигонами без построения топологии. Графические примитивы можно добавлять, перемещать, удалять. Модуль ARCEDIT позволяет осуществлять прямое редактирование регионов и полигонов, автоматическое и интерактивное построение топологии, редактирование групп объектов за одну операцию.

 

Вопрос для самопроверки:

69.  Какая из перечисленных ГИС профессионального уровня наиболее подходит для решения экологических задач Вашего региона (или разработок, в которых Вы принимаете участие)? Обоснуйте свой выбор.

 

Литература:

Кошкарев А.В., Тикунов В.С. Геоинформатика. С.134-155.

Коновалова Н.В., Капралов Е.Г. Введение в ГИС. С. 101-122..

 

    9. ArcView - ГИС “настольного типа”.

   Структура.  ArcView - базовое ядро. Совместно с базовым ядром поставляются стандартные подсистемы: Avenue - макроязык разработки приложений; CAD Reader - модуль, обеспечивающий прямое чтение форматов Microstation и AutoCAD: DGN, DWG, DXF; JFIF - модуль для работы с растровыми изображениями данного формата; IMAGINE - модуль, обеспечивающий возможность использования растрового формата ERDAS; Digitizer - обеспечивает ввод информации с дигитайзера; Database Themes - позволяет просматривать и делать выборки данных из внешней (возможно удаленной) базы данных;

Network Analyst - анализ пространственных сетей; Spatial Analyst - широкий набор средств пространственного моделирования на растровой модели данных, посторения изолиний, интерполяции и т.д.

   Используемые данные:   1) Графические. Покрытия ARC/INFO,  векторные графические данные в открытом нетопологическом формате shape file; имеется конвертор из формата MIF системы MapInfo в формат “shape file”; растровые графические данные в форматах ERDAS, BSQ, TIFF, BIL, BIP, Sun RS, RLS;

2) Тематические (семантические). Прямой доступ к базам данных dBASE, INFO, ASCII с разделителями и непрямой доступ к сетевым базам данных ORACLE, INGRES, SYBASE, INFORMIX. К объектам карты можно привязывать графики, растровые и векторные изображения, видео и аудиоинформацию.

   Географический анализ: построение буферных зон, анализ точек в полигоне,

анализ линий в полигоне, анализ полигона по отношению к полигону, анализ взаимного расположения слоев (оверлей); поддерживается адресное геокодирование; анализ растрово-векторной информации на основе регулярных grid-моделей и пространственных сетей.

   Картографическая визуализация. Послойная настройка визуализации с определением типов штриховки, типов прорисовки границ и цветов. Имеются функции визуализации тематической информации значками переменного размера, картодиаграммами, полями плотности. Предусмотрены возможности классификации и шкалирования информации, приведение ее к нормализованному виду. Имеется расширенный набор символов и шрифтов. Графические примитивы в формате shape file можно добавлять, перемещать, удалять. Возможно добавление отдельных промежуточных точек.

   ArcView создан на основе языка Avenue. Как сам язык, так и среда программирования на этом языке поставляются стандартно в составе базового модуля. Avenue - это объектно-ориентированный язык написания макрокоманд, специально ориентированный на работу с пространственными данными.

   В ArcView осуществляется работа с видами, таблицами, диаграммами, макетами и программами, хранящимися или перечисленными в одном файле, называемом проект. Одновременно можно работать только с одним проектом. Проект представляет собой файл, который ArcView создает для того, чтобы хранить любые комбинации взаимосвязанных компонентов ArcView - виды, таблицы, диаграммы, макеты и программы. Проект включает в себя также ссылки на файлы простанственной и табличной информации. Файлы проектов имеют расширение .apr. При открытии или  закрытии проекта открываются (закрываются) все компоненты проекта. Размер и позиция всех открытых окон в проекте сохраняются вместе с проектом: они появляются каждый раз при открытии проекта именно в том виде, в котором их сохранили.  Вид - это интерактивная карта, которая позволяет визуализировать, исследовать и анализировать географические данные. Вид характеризует используемые данные и способ их отображения, но не включает сами файлы данных, а ссылается на них. В одном проекте может быть много различных видов. Разные виды могут включать одни и те же данные. Вид является набором тем. Тема - набор географических объектов в виде, т.е. слой, например, тема городов, тема рек, тема дорог и т.д. Тема представляет один из следующих источников географических данных: 1) пространственные данные, такие, как покрытия ARC/INFO или шейпфайлы ArcView. Большинство покрытий включает несколько различных классов объектов, каждый раз только один из классов может быть включен в тему. Шейпфайл может представлять точечные, линейные и полигонные объекты. Можно редактировать объекты темы, которые представлены в формате шейпфайлов; 2) Снимки, например космические; 3) Табличные данные, включающие точечные события с координатами X,Y или файлы пользователей, которые можно геокодировать в ArcView. Данные могут быть на локальном диске или к ним необходимо обращаться по сети. Тема указывает на географические данные, которые она представляет. Но она не хранит сами данные. Темы в виде перечислены в содержании таблицы. Каждая тема имеет собственную легенду, которая присутствует в таблице оглавления. Таблицы являются динамическими, поскльку отражают текущее состояние данных, на которых базируются. Если данные изменяются, то таблица будет автоматически отражать это изменение. Таблицы могут быть отредактированы в ArcView и быть записаны в файлы источников данных. Диаграмма - это графическое представление табличных данных. Если редактируется таблица, то немедленно изменится  визуализирующая ее диаграмма. Одни и те же табличные данные могут быть изображены не более чем в одной диаграмме. Имеется шесть типов диаграмм: площадные, ленточные и столбчатые, линейные, круговые, точечные. Макет - это карта, позволяющая отображать виды, таблицы, импортированную графику.

 

Вопрос для самопроверки:

70.  Подходит ли, на Ваш взгляд ArcView для решения экологических задач? Обоснуйте ответ.

 

10. Организация конкретной ГИС средствами ArcView.

 

            Чтобы создать свою ГИС, нацеленную на решение определенных задач, необходимо включить в данный проект необходимые данные и, если необходимо, программы, настроить размеры всех окон, легенды, т. е. обозначения объектов (типы штриховок или заливок для площадных объектов, толщины и вид линий для линейных, символы для точечных).  В Вид могут импортироваться как векторные, так и растровые данные.

Источником векторных тем (слоев) могут служить шейпфайлы ArcView или покрытия ARC/INFO. При этом в ArcView не могут использоваться топологические взаимосвязи между объектами покрытий. Невозможно также редактировать покрытия, для этого их необходимо конвертировать в шейпфайлы ArcView.

Растровые данные могут импортироваться практически всех распространенных современных форматов. Растровые слои могут использоваться  в качестве подложки для векторизации на экране. Наиболее применяемые растровые изображения – это спутниковые снимки или отсканированные тематические карты (ландшафтные, биогеографические, карты землеустройства и т.д.). Все растровые файлы по отношению к географической привязке подразделяются на два класса: а) файлы, в которых содержится привязка (например, файлы форматов ERDAS – фирмы, специализирующейся на обработке космических снимков); б) файлы, не имеющие привязки, например, изображения, полученные при помощи сканера. В последнем случае для правильного размещения растровой темы необходимо создать специальный текстовой файл, называемый «мировым» (в англоязычной терминологии – world file), в котором описываются параметры географической привязки изображения.

Импортируемая семантическая информация может быть представлена в различных форматах баз данных. Применяемый для хранения формат -  dBASE. Довольно частая в экологических исследованиях задача – визуализировать результаты измерений параметров в различных точках. В этом случае и позиционная, и семантическая информация может содержаться в одном файле формата dBASE, INFO или текстовом файле, имеющем структуру строк и столбцов. В любом случае двух полях (столбцах) должны храниться сведения о координатах точек, а в других – семантические характеристики точек. Темы (слои), источником которых служат файлы этих типов называются “темами событий”.

Естественно, часто необходимо провести интерполяцию данных, полученных для отдельных точек. В этом нам поможет модуль расширения ArcView Spatial Analyst. Этот модуль не входит в программный пакет ArcView, он должен приобретаться отдельно и подключаться к этому пакету. С его помощью можно строить изолинии и создавать грид-темы – растровые слои, построенные по векторным данным. Грид-тема – это прямоугольная матрица, состоящая из отдельных квадратных ячеек. Каждая ячейка имеет на плоскости данной проекции одинаковые размеры и одно значение проинтерполированной характеристики. Грид-темы хороши для представления непрерывных полей (например, давления, уровня загрязнения воздуха, шума, напряженности электромагнитного поля и т.д.) и необходимы для получения значений поля в точках с определенными координатами.

Ряд модулей входит в программный пакет ArcView. Для того, чтобы иметь возможность пользоваться ими, необходимо лишь подключить их в опции «Модули» (“Extensions”). Модуль Cad Reader необходим для чтения и конвертации данных форматов САПР – систем автоматизированного проектирования, Database Themes – для работы с распределенными по компьютерной сети базами данных, Digitizer – для работы с дигитайзером (дигитализации), IMAGINE Image Support и JPEG Image Support – для работы с растровыми данными, Dialog Designer – для разработки собственных интерфейсов пользователя – экранов с кнопками, надписями, меню и т. д., облегчающих диалог с компьютером.

Программный пакет ArcView имеет Avenue - встроенный язык создания ГИС-приложений, т.е. программ, которые могут запускаться исключительно из самого пакета ArcView. Этот язык является объектно-ориентированным – в нем объекты и действия над ними составляют единые конструкции. В программный пакет входит также набор примеров программ на Avenue, которые пользователь имеет возможность применять и редактировать.

 

Контрольная работа.

 

1.     Что такое информация?

2.     Типы информации.

3.     Определение географической информационной системы (ГИС) и ее обобщенная структура.

4.     Информационно-измерительная система и ее отличие от ГИС. 

5.     Три подхода в теории информации. Особенности вероятностно-статистического и семантического подходов.

6.     Прагматическая ценность информации.

7.     Данные, информация, знания – различия между ними.

8.     Разделы первичной экологической информации.

9.     Принципы организации мониторинга и мониторных систем.

10.  Источники и типы данных.

11.  Определение ГИС.

12.  Функциональная структура ГИС, ее основные блоки.

13.  Классификации ГИС с точки зрения территориального охвата, предметной области информационного моделирования, проблемной ориентации.

14.  Что такое интегрированные,  полимасштабные, пространственно-временные ГИС?

15.  Классификация ГИС с точки зрения их программной архитектуры.

16.  Классификация ГИС по мощности и возможностям эксплуатации.

17.  Основные требования, предъявляемые к ГИС.

18.  CAD- и Mapping-системы, их отличия от ГИС.

19.  Позиционная и содержательная составляющие информации о географических объектах.

20.  Элементарные объекты – примитивы.

21.  Простые и сложные объекты.

22.  Что такое идентификатор?

23.  Модели (структуры) представления пространственной информации.

24. Послойное представление информации.

25.  Технические средства  ввода позиционной информации.

26.  Способы  ввода позиционной информации.

27.  Способы дигитализации.

28.  Способы векторизации.

29.  Что такое «подложка»? Когда она применяется?

30.  Преимущества и недостатки различных способов цифрования.

31.  Выбор способа цифрования в зависимости от качества данных и цели.

32.  Методика цифрования и его этапы.

33.  Примитивы векторных и растровых представлений пространственных объектов.

34.  Различия между растровыми и векторными моделями, их преимущества и недостатки.

35.  Собственно растровое представление или растровая модель данных.

36.  Регулярно-ячеистое представление.

37.  Что такое TIN-модель?

38.  Что такое полигоны Тиссена и триангуляция Делоне?

39.  Применение лексиграфического кода.

40.  Применение пирамидальных структур на примере квадротомического дерева.

41.  Что такое дуги и сегменты?

42.  Виды векторных форматов.

43.  Различия между векторными топологическими и векторными нетопологическими форматами.

44.  Понятие графа.

45.  Что такое покрытие?

46.  Модель «спагетти».

47.  Линейно-узловое топологическое представление.

48.  Преобразование «вектор-растр».

49.  Преобразование «растр-вектор».

50.  Обоснуйте необходимость включения в ГИС блока экспертной системы.

51.  Структура экспертной системы.

52.  Что такое эвристики?

53.  Что такое базы знаний?

54.  Приведите собственный пример фрейма и слотов.

55.  Приведите собственный пример продукции. 

56.  Машина логического вывода.

57.  В каких случаях при работе с экспертной системой применяются прямая и обратная стратегии?

58.  Для чего нужны система объяснений и система общения?

59.  Для каких целей служат операции переструктуризации данных?

60.  Предложите примеры картометрических операций при проведении экологических исследований.

61.  В каких геоэкологических и социоэкологических исследованиях может быть полезно использование оверлейных операций?

62.  Придумайте примеры применения сетевого анализа при: экологической оценке водосборного бассейна; при социоэкологических исследованиях (на Ваш выбор).

63.  Приведите примеры применения утилит работы с полями баз данных при проведении экологической оценки территории.

64.  Формы представления трехмерных объектов.

65.  Модели топографических поверхностей.

66.  В каких случаях, на Ваш взгляд, при проведении экологических исследований необходимо проведение операций с трехмерными объектами?

67.  Приведите примеры анализа растровых изображений при проведении экологических исследований.

68.  Применяемые в ГИС типы моделирования. Обоснуйте необходимость имитационного моделирования процессов в экосистемах.

69.  Какая из перечисленных ГИС профессионального уровня наиболее подходит для решения экологических задач Вашего региона (или разработок, в которых Вы принимаете участие)? Обоснуйте свой выбор.

70.  Подходит ли, на Ваш взгляд ArcView для решения экологических задач? Обоснуйте   ответ.

 

Hosted by uCoz