5 Форматы данных, используемые в ГИС

Основные типы данных, используемые в геоинформационных системах - растровые и векторные данные.

Растровые данные - это матрица или сетка, в каждой ячейке (пикселе) которой содержится числовое значение. В качестве растровых данных могут быть использованы цифровые изображения или значения непрерывных величин (например, рельеф).

В векторных данных местоположение объектов задается с помощью координат и математических формул. В геоинформационных системах используются специализированные форматы векторных данных, позволяющие хранить как информацию о местоположении объектов, так и их атрибутивные (непространственные) характеристики.

5.1 Shape файлы

Основным форматом векторных данных в ГИС является shapefile6. Этот проприетарный формат данных от компании ESRI, который был разработан ими в 90-х годах прошлого века. При использовании этого формата данные хранятся в нескольких файлах с разными расширениями, обязательными из которых являются:

- .shp - геометрия объектов;

- .shx - файл индексов необходим для ускорения расчетов и связи геометрии и атрибутов;

- .dbf - таблица атрибутов:

- .prj - сведения о проекции и системе координат.

Без перечисленных выше файлов данные не будут корректно открываться и обрабатываться в ГИС.

Недостатки работы с shape файлами7:

  • в файле не задается система координат;

  • состоит из нескольких файлов;

  • названия атрибутов должны быть не длинее 10 букв;

  • всего можно добавить не более 255 атрибутов;

  • ограниченное количество типов данных в атрибутах;

  • файл должен быть не более 2 Гигабайт;

  • не описываются топологические отношения объектов;

  • в файле могут быть только объекты с одним типом геометрии;

  • и прочие.

5.2 Geojson

Постепенно на замену shapefile приходят другие форматы данных, например, GeoJSON - формат представления различных структур географических данных, основанный на JavaScript object notation (JSON).

В GeoJSON объект состоит из набора пар ключ/значение, также называемых свойствами. Имя каждого свойства – строка. Значение свойства может представлять собой строку, число, объект, массив или один из литералов: «true», «false» и «null». Массив состоит из элементов, где каждый элемент может принимать одно из значений, описанных выше.

Пример GeoJSON:

{
  "type": "Feature",
  "geometry": {
    "type": "Point",
    "coordinates": [125.6, 10.1]
  },
  "properties": {
    "name": "Dinagat Islands"
  }
}

Формат поддерживает следующие типы объектов Point, LineString, Polygon, MultiPoint, MultiLineString, and MultiPolygon.

Геометрические объекты с атрибутивными характеристиками составляют Feature объекты. Наборы объектов хранятся как FeatureCollection объекты8. Полное описание формата представлено здесь.

Для проверки и валидации geojson файлов можно пользоваться сервисом geojson.io

Существует еще дополненная версия topojson, в котором учитываются топологические отношения между объектами. В этом формате вместо того, чтобы представлять геометрию дискретно, геометрия в файлах TopoJSON сшивается из общих линейных сегментов, называемых дугами9.

5.3 Geopackage

Также все более широкое распространение получает формат GeoPackage, который фактически является файлом SQL-базы данных с расширением .gpkg10.

GeoPackage - это контейнер SQLite, а стандарт кодирования GeoPackage определяет правила и требования к контенту, хранящемуся в контейнере.

Стандарт GeoPackage определяет схему, включая определения таблиц, утверждения целостности, ограничения формата и ограничения содержимого. Требуемый и поддерживаемый контент GeoPackage полностью определен в стандарте. Эти возможности построены на общей основе, и механизм расширения предоставляет разработчикам возможность включить дополнительные функции в свои GeoPackages.

Стандарт кодирования GeoPackage описывает набор соглашений для хранения следующего в базе данных SQLite:

  • векторные объекты;

  • наборы тайловых матриц изображений и растровых карт в различных масштабах;

  • атрибуты (непространственные данные);

  • дополнения.

Вот здесь еще можно посмотреть презентацию про shape файлы и их альтернативы https://www.slideshare.net/jachym/switch-from-shapefile

Кроме этих форматов в ГИС также могут использоваться и некоторые другие, например, GPX (формат обмена данными GPS)11, KML12 (формат файлов, который используется для отображения географических данных в геобраузерах, таких как Google Планета Земля, Google Карты и Google Карты для мобильных устройств; создан на основе стандарта XML).