Геоинформационные системы. Лекция 5
В течение всей истории человечества изображения и карты использовались для манипуляции мнениями.
На заметку
В случае с картами манипулировать даже проще, чем с обычными графиками, потому что в среднем человек больше будет доверять именно карте и считать ее более надежной и объективной.
Соотношение данных и чернил (data ink ratio), которое должно показывать количество информации, отображаемое определенным количеством чернили (или пикселей). Идеальным соотношением является единица, то есть количество информации соответствует количеству затраченных графических элементов.
Эдвард Тафти “Визуальное представление количественной информации” (Edward Tufte “The Visual Display of Quantitative Information”)
Цель этого соотношения данных и чернил состоит в том, чтобы устранить избыточность визуализации так, чтобы она по-прежнему отображала необходимую информацию, но при этом была легко воспринимаемой. Все, что не несет значимой информации должно быть убрано: метки осей, иногда сами оси, подписи и маркеры линий, линии сетки.
Основные цели создания визуализаций, от которых будет зависеть выбор конкретной методики ее подготовки:
описание, то есть простое и ясное представление имеющихся данных;
исследование - визуализация как что-то что позволяет аудитории увидеть неочевидные на первый взгляд закономерности и паттерны;
организация - представление данных в четком и структурированном виде;
декоративность - создание визуально привлекательной картинки, зачастую вызывающей определенный эмоциональный отклик, но не всегда точной.
кто будет являться основной аудиторией? должна ли эта визуализация быть понятна широкому кругу людей или предполагается ее использование только для специалистов (в научной статье, докладе, результатах исследования)?
что за переменная или переменные будут отображаться?
какой метод будет наиболее простым и понятным?
что является наиболее важным для отображения?
нужно ли акцентировать внимание на отдельных деталях?
Важно
В нашем случае при визуализации пространственных данных следует учитывать еще и их специфику.
Визуальные характеристики включают в себя:
расположение;
размер;
форму;
яркость цвета;
цвет;
ориентацию символа;
текстуру (штриховку).

Источник: https://cartosquad.com/guide/visvar.html
Существует четыре основных аспекта восприятия визуальных характеристик. Именно эти аспекты и особенности интерпретации будут влият на то, как их понимают на карте:
селективность - возможность однозначно выделить группу объектов на основе изменения визуальной переменной;
ассоциативность - возможность отнести объекты к одной группе, несмотря на разницу в визуальной переменной;
диссоциативность - возможность определять значимость символов;
упорядоченность - возможность распознать последовательность изменения величины.
На заметку
Ассоциативность или диссоциативность могут нарушать восприятие “одинаковости” объектов на карте, поэтому, если важно, чтобы объекты воспринимались единой группой, рекомендуется избегать изменений размера и светлоты в символах.






Основные типы переменных, которые могут отображаться на карте:
качественные
номинальные (категориальные) - группы, которым нельзя присвоить числовой эквивалент и нельзя ранжировать по возрастанию/убыванию;
ранговые - группы, которые можно упорядочить, но нельзя присвоить числовой эквивалент и количественно сравнить группы между собой;
количественные
Самый простой вариант выбора палитры - воспользоваться уже готовой 🤓
Но и в этом случае желательно знать некоторые особенности палитр.
С точки зрения теории цвета мы воспринимаем:
собственно цвет;
яркость цвета, также уже упоминавшуюся в предыдущем разделе;
насыщенность или чистота цвета, которая изменяется при добавлении в чистый цвет черного или белого.
Источник: https://earthobservatory.nasa.gov/blogs/elegantfigures/page/2/
Сложность в создании хороших палитр, которые будут правильно восприниматься на экране компьютера в том, что компьютер и человеческий глаз воспринимают цвета по-разному:
компьютер строит изображение из нескольких узких цветовых каналов, в то время как человеческий глаз воспринимает спектр шире;
компьютеры распознают яркость по линейному закону, а человеческий глаз - по экспоненциальному, поэтому оттенки темных цветов различать проще;
человеческий глаз более восприимчив к зеленой части спектра, чем красной, и более восприимчив к красной, чем к синей части спектра.
Наиболее хорошо и очевидно мы воспринимаем изменения в яркости (причем это общее и для компьютеров, и для человеческого глаза).
Поэтому изменение от светлого к темному и наоборот будут наиболее просты и однозначны в восприятии, даже если концы палитры будут слабо насыщенными, а центральная часть - наиболее чистой по цвету.
То есть, если яркость меняется последовательно, цвет отчасти отходит на второй план.
С учетом этого факта в 2015 году Натаниелем Смитом и Стефаном ван дер Вольтом (Nathaniel J. Smith, Stefan van der Walt) были разработаны цветовые палитры magma, inferno, plasma, viridis в составе библиотеки matplotlib colormaps.
Позднее этот набор был дополнен еще одной палитрой cividis2.
Основной принцип их построения состоит в том, что центр имеет максимальную яркость, а вправо и влево однородно оно уменьшается, переходя в цвета с противоположных концов спектра: к синему и красному или оранжевому и фиолетовому.
То есть они объединяют два градиента разных цветов по яркости.
На заметку
Чаще всего вы видите такие палитры при отображении температуры: белый центр, от которого расходятся в противоположные стороны красный и синий градиенты. Также такие цветовые схемы могут быть использованы для отображения доходов и убытков, изменений во времени, отклонений от нормы или среднего значения.
Внимание
Использование таких палитр обосновано тогда, когда данные подразумевают, что середина и значение ей соответствующее имеет определенный смысл.
В настоящее время рекомендуется избегать так называемой радужной палитры, потому что сама по себе она искажает изображение объектов.
Это связано с тем, что в ней содержатся различные по яркости и цвету фрагменты, которые не позволяют однозначно последовательно выстроить цвета3.

Примеры сервисов:
Классификация для числовых значений подразумевает разбивку на интервалы.
Самые широко применяемые методы классификации в геоинформационных системах:
В методе равных интервалов длина интервала рассчитывается по формуле: \[Интервал = \frac{max X_i - min X_i}{ Количество \ интервалов} \]
Метод квантилей использует несколько другой подход: вместо деления всего диапазона на интервалы здесь на группы равного размера делится все количество объектов.
\[Количество\ объектов\ в\ группе = \frac{Всего\ объектов}{ Количество \ интервалов} \]
Важно
При использовании равных интервалов может получиться так, что какие-то из них будут пустыми.
При применении квантилей вы не получите пустых интервалов. Как правило, этот метод рекомендуется при наличии значительных выбросов, если вам необходимо уменьшить их влияние.
Но следует помнить, что метод квантилей фактически не будет учитывать вариацию показателя внутри группы.
Если исходные данные распределены по нормальному закону или необходимо показать отклонение от среднего значения, то оптимальным может быть метод на основе стандартного отклонения: \[Интервал = n \cdot\sigma\]
\(n\) - номер интервала, \(\sigma\) - стандартное отклонение: \[\sigma=\sqrt{\frac{\sum_{i=1}^{n} (x_i-\overline{x})^2}{N-1}} \]
где \(x_i\) - величина показателя для \(i-го\) объекта, \(\overline{x}\) - среднее значение показателя, \(N\) - общее количество объектов.
Важно
Однако при использовании этого метода необходимо помнить, что будет учитываться фактически вариация от среднего, а не в рамках интервалов относительно друг друга.
Кроме того, интервалы здесь рассчитываются отдельно, что может привести к потере данных.
Расчет интервалов по методу естественных интервалов происходит итеративно:
случайным образом разбить данные на интервалы;
рассчитать сумму квадратов отклонений от среднего по формуле \(\sum_{i=1}^{n} (x_i-\overline{x})^2\);
сравнить полученные значения между классами;
изменить интервалы;
пересчитать сумму квадратов отклонений.
Процесс повторяется до тех пор, пока для каждого интервала не будет достигнуто условие \(\sum_{i=1}^{n} (x_i-\overline{x})^2 \rightarrow min\).
Как понять какое количество интервалов вам нужно?
Вы можете опираться на общеизвестные теории восприятия информации, которые говорят нам о том, что кратковременная память не способна удерживать более 7 интервалов (максимум 10). Поэтому, как правило, рекомендуют использовать от 3 до 7 интервалов.
Чем больше у вас будет интервалов/категорий, тем сложнее будет вашему потенциальному зрителю.
Дополнительно
Если вы хотите опираться на количественную методику расчета числа интервалов, можно воспользоваться распространенной формулой Стерджесса, где \(n\) - количество интервалов, \(N\) - число объектов:
\(n = 1+|log_2 N|\) или \(n = 1+|3.322 \lg N|\)
Внимание
Отметим, что здесь мы ведем речь не о топографических картах, а о так называемых тематических картах, на которых отображается какой-то показатель.
Способы отображения различных показателей на карте можно поделить на несколько больших групп:
карты символов;
картограммы;
карты линейных знаков;
картодиаграммы.
Карты символов делятся на две основные группы:
пропорциональные или градуированные символы
карты плотности точек.
Карты пропорциональных символов в литературе по картографии могут еще называться картами точечных символов
Карта пропорциональных символов или карта точечных символов (второй термин более характерен для отечественной литературы) - это тип тематической карты, на которой символы различной величины показывают значение количественного показателя. Размер символа здесь напрямую зависит от величины показателя.
В качестве символов может быть использована любая простая геометрическая фигура (круг, квадрат, треугольник и т.д.) или пиктограмма.
Предупреждение
Использование кругов влечет за собой определенные сложности для их масштабирования, так как площадь круга при увеличении изменяется нелинейно.
Джеймс Флэннери в своей диссертации оценил, насколько люди способны сравнивать между собой площади круга, что послужило основой для метода масштабирования символов, названного его именем.
1838 map of railroad traffic in Ireland, one of the first thematic maps to use proportional symbols.
Основной визуальной характеристикой при создании карты пропорциональных символов является размер, который может быть однозначно интерпретируемым только для количественных переменных.
На заметку
Пропорциональные символы могут быть использованы для отображения абсолютных значений показателей, в которых отсутствуют отрицательные значения. Как правило, это относится к пространственно экстенсивным или глобальным переменным, то есть тем, которые могут быть соотнесены только с пространственной единицей целиком как суммой ее составных частей.
Размещение символов зависит от того, какие данные лежат в основе карты:
если исходные данные представляют собой отдельные точечные наблюдения, то символы размещаются в месте наблюдения;
если исходные данные отнесены к какой-то площадной единице (административного деления, например), то они размещаются в геометрическом центре этой площадной единицы. В том случае, если площадной объект представляет собой неправильные многоугольник, геометрический центр которого лежит за его пределами, то символ может быть смещен внутрь.
An 1858 proportional symbol map by Charles Joseph Minard, with a circle for each department sized according to the amount of meat shipped to Paris for consumption, including pie charts distinguishing the types of meat.
Источник: https://www.flickr.com/photos/b_willers/6331225797/in/photostream/
Источник: https://ig.ft.com/coronavirus-global-data/
Источник: https://studio.unfolded.ai/public/b56a3794-fe0f-47fe-94d3-44e4ca59dd80
Дополнительно
Карты пропорциональных символов позволяют комбинировать несколько визуальных переменных. Например, вы можете отобразить один показатель размером, а другой цветом или формой.
Подход отображения величины показателя с помощью скопления точек равномерно и случайным образом в пределах административного района.
Арманд Жозеф Фрер де Монтизон (Armand Joseph Frère de Montizon) - Carte Philosophique figurant la Population de la France
Самым знаменитым примером карты плотности точек является карта Джона Сноу, которая положила начало пространственному анализу, тематическому картографированию, ГИС, кластеризации и современной эпидемиологии, но на самом деле история не совсем такая, как ее обычно рассказывают4.

Deaths from cholera in Soho, London 1854 by Edmund Cooper.
В картах плотности точек выделяют два основных типа, которые некоторыми картографами рассматриваются как радикально различные:
карты плотности один-к-одному, где каждая точка соответствует индивидуальному случаю, например, одному заболевшему
один-ко-многим, где каждая точка соответствует не индивидуальному наблюдению, а группе.
Некоторые исследователи предлагают разделить описанные два типа карт и называть карты плотности один-к-одному - картами распределения точек, а карты один-ко-многим - картами плотности точек.
Карта чемпионов футбольной лиги с 1936 по 2019 год (Map of NCAA football champions, 1936–2019, with an isotype proportional symbol). Источник: https://commons.wikimedia.org/wiki/File:College_Football_Champions_Map.png
Картограмма в терминологии картографии предполагает некое подобное карте изображение, поэтому, как правило, в них происходит либо искажение топологии (взаимного расположения объектов), либо искажение формы.
В англоязычной литературе такие карты называются choropleth (от древнегреческого χῶρος (khôros) - ‘область, регион’ and πλῆθος (plêthos) - ‘множество’). При этом термин “cartogram” существует самостоятельно и используется для того, что в традиции отечественной картографии принято называть анаморфной картой. Разница в терминологии часто приводит к неправильному переводу или неправильному названию этого типа карт в некоторых источниках.
Дополнительно
Скорее всего эта разница может быть объяснена самим происхождением понятия “картограмма” (нем. kartogramm), который был предложен немецкими картографами Хааком и Вайхелем и впоследствии получил широкое применение в качестве обозначения всех тематических карт. Судя по всему, отсюда он и перешел в отечественную картографию. Но со временем американский картограф Райс и другие конкретизировали термин и он получил свое современное значение в международной терминологии.
Один из самых распространенных типов отображения географических данных - все объекты раскрашиваются или заштриховываются в зависимости от значения какого-либо показателя.
Основной визуальной характеристикой здесь является яркость или цвет, текстура или штриховка используется значительно реже.
На заметку
В традиции отечественной картографии выделяют методы качественного и количественного фона в зависимости от картографируемой переменной. Так, при создании фоновой картограммы по номинальной переменной (тип почвы, горные породы) применяется соответственно метод качественного фона, а при количественной (плотность населения, доход, ВВП) - метод количественного фона.
Карта уровня образования жителей Франции, Чарльз Дюпин, 1826 год
“cartes teintées” (тонированные карты) для отображения различных видов статистических данных: образование, уровень преступности, заболеваемость, условия проживания и прочие. Например, карта заболеваемости холерой в Париже 1832 года Шарля Пике.
1832 год, карта эпидемии холеры в Париже, Шарль Пике (Charles Picquet)
Одной из первых карт качественного фона считается карта языковых регионов Готтфрида Гензела (Gottfried Hensel), опубликованная им в 1741 году в работе по языкознанию Synopsis Universae Philologiae.
Четыре mappae geographico-polyglottae с первыми словами из молитвы «Отче наш” на разных языках и системах письма. Источник: https://commons.wikimedia.org/wiki/File:Hensel_1741_4maps.jpg#/media/%D0%A4%D0%B0%D0%B9%D0%BB:Hensel_1741_4maps.jpg
Chorochromatic map of ethnic groups in Europe, from the 2nd edition of Physikalisher Atlas
Отношение площади купленной крестьянами земли к имеющимся у них надельной в %. Карта уездов Таврической губернии / Центральный статистический комитет. 1939. 2 л.
Почвенная карта СССР / под ред. Л. И. Прасолова. М.: 1-я образцовая тип. им. Огиза РСФСР, [1938?]. 1 к. цв.; 34х27 см.
При создании фоновых картограмм следует учитывать, что они представляют минимальную визуальную равнозначность объектов, то есть наше восприятие будет искажено формой и размером самих по себе площадных объектов.
Например, административно-территориальные единицы разного размера и формы, но с одинаковым количеством населения будут иметь совершенно различные паттерны распределения этого населения по территории.
Важно
В связи с этим рекомендуется нормализовывать данные.
Основными приемами нормализации являются:
вычисление плотности путем деления переменной на площадь территориальных единиц;
вычисление доли от целого;
вычисление средней величины на душу населения;
скорость изменения по отношению к предыдущему периоду времени.
Дазиметрическая карта - это такой тип тематической карты, в котором используется площадная символика (заливка или штриховка) для отображения пространственно распределенной величины на основе фоновой картограммы с ее корректировкой по вспомогательным данным о пространственном распределении.
На заметку
Название произошло от греческих δασύς (dasýs) «плотный» и μέτρο (métro) «мера». Такое название появилось благодаря тому, что такие карты, как правило создавались для отображения плотности населения.
Одна из первых дазиметрических карт: карта плотности населения
Картограмма национального состава населения по Оренбургской области. Сост. по данным соц.-эконом. справочника «Средняя Волга» изд. 1934 г. / сост. Волж. картогр. ф-кой В.К.Т. Г.У.Г.С.К. Н.К.В.Д. 1935 г. [Саратов: Волж. картогр. ф-ка], 1935. 1 к. цв.; 30х48 см
Двухкомпонентные фоновые картограммы (bivariate choropleth) сочетают в себе сразу две цветовые шкалы для отображения комбинации двух количественных переменных.
С одной стороны, такой подход позволяет показать и проанализировать связь между двумя явлениями.
Внимание
Главная сложность в том, что получается слишком неоднозначная цветовая шкала, восприятие которой затруднено.
Поэтому широкого распространения такие картограммы не получили.



Источник: https://timogrossenbacher.ch/2019/04/bivariate-maps-with-ggplot2-and-sf/
Kashnitsky I. & Schöley J. (2018). Regional population structures at a glance. The Lancet, 392(10143), 209–210. https://doi.org/10.1016/S0140-6736(18)31194-2
Впервые этот метод был предложен американским статистиком Германом Черновым в 1973 году (Herman Chernoff, The Use of Faces to Represent Points in K-Dimensional Space Graphically, Journal of the American Statistical Association, vol. 68, no. 342, pp. 361–368, 1973).
Как правило, такой способ комбинации отображения различных переменных значительно проще считывается визуально, чем цветовые сочетания или сочетания цвет-форма/размер символа, так как по своей природе человеку проще искать и воспринимать паттерны в лицах других людей.
Анаморфная (также встречается под названием анаморфированная карта или анаморфоза) карта - это преобразованная непространственноподобная карта, изменяющая формы показанных объектов и направления, но точно отражающая их топологические отношения.
В иностранной литературе такие карты, как правило, называются просто картограммами - cartogram или area cartogram.
На заметку
Иногда анаморфные карты также называют картоидами, так как истинные очертания объектов заменены на геометрическую абстракцию.
Источник: https://www.viewsoftheworld.net/?p=5833#more-5833
Вариацией анаморфных карт является несмежная картограмма (иногда в отечественной литературе встречается термин “топологически разорванная картограмма”, иностранный термин - “non-contiguous cartogram”), в которой также размер объектов изменяется пропорционально визуализируемой величине, но с некоторыми особенностями:
нарушается смежность объектов друг с другом;
изменение размера объектов происходит пропорционально с сохранением их формы
Источник: https://howmuch.net/articles/atlas-of-economic-growth
Как правило, в таком типе карт каждый исходный объект заменяется объектом универсальной формы, размер которого будет зависеть от величины показателя.
Самыми распространенными являются картограмма ДеМерса и Дорлинга: первая использует квадраты, а вторая - круги.
Источник: https://www.nytimes.com/elections/2012/ratings/electoral-map.html
Источник: https://archive.nytimes.com/www.nytimes.com/interactive/2008/08/04/sports/olympics/20080804_MEDALCOUNT_MAP.html?_r=0
Сеточная картограмма (также иногда встречается под названием “мозаичная картограмма”, иностранный же термин - “mosaic cartogram” или “grid cartogram”, также встречается термин “hex grid cartogram” для тех из них, которые используют шестиугольники) составляется из повторяющихся фигур одинакового размера (как правило, квадратов/прямоугольников или шестиугольников, так как ими можно без зазоров заполнить любую по размеру площадь на плоскости) для построения мозаичного представления переменной.
Важно
Эти картограммы могут показаться похожими на карты, построенные на основе регулярной сетки. Но при использовании регулярной сетки для агрегирования каждой ячейке соответствует определенное значение величины, полученное при агрегировании, а в сеточной картограмме каждая ячейка соответствует определенному и только одному значению отображаемой переменной.
Источник: https://ourworldindata.org/population-growth
Источник: https://www.washingtonpost.com/graphics/politics/2016-election/50-state-poll/
Источник: https://www.viewsoftheworld.net/?p=4487
Фактически такие карты представляют собой двухкомпонентные картограммы, в которых вторая переменная задает не цвет или яркость, а насыщенность цвета.
Поэтому отдельные объекты, имеющие большее значение будут более яркими и насыщенными, а объекты с наименьшим влиянием на результат или отображаемую величину будут затемнены. Это затемнение и уменьшение насыщенности достигается за счет вариации в прозрачности (тот самый “альфа-канал”), что позволяет добиться эффекта наложения фильтра на карту.
На таких картах объекты преобразуются в объекты универсальной формы и размера (как правило, квадратные или шестиугольные), которые потом могут быть раскрашены по значениям показателей либо внутри них могут быть построены графики или приведены значения цифрами.
На заметку
Плиточные карты (в иностранной литературе называемые “tile grid maps”) рекомендуется применять тогда, когда нужно сделать так, чтобы зритель не отвлекался на форму и размер объектов, так как в этом случае все объекты будут выглядеть одинаково.
Важно
Главное отличие плиточной карты от графической картограммы в том, что здесь все объекты не только универсальной формы, но и одинакового размера, тогда как в графической картограмме размер варьируется в зависимости от величины отображаемого показателя.
Сеточная картограмма отличается от плиточной карты тем, что в ней каждый объект составляется из небольших ячеек универсальной формы и размера, в то время, как в плиточной карте каждый исходный объект заменяется одним универсальным объектом.
Источник: https://ria.ru/20250811/reyting-2034531704.html
Источник: https://t.me/data_publication/705
Карты потоков (flow maps) - это тематические карты, использующие линейные символы для отображения движения между локациями: движение людей, трафик, поставки продукции, миграции животных и прочее.
Как правило, карты потоков используют линейные символы с различной толщиной, чтобы показать объемы перемещений или передвижений между локациями, что делает их близкими к картам пропорциональных символов.
Карта экспорта мяса железнодорожным транспортом из регионов Франции в Париж
Карты потоков показывают несколько аспектов перемещения:
начало и конец передвижения;
маршрут;
что перемещается;
количество перемещаемого;
направление перемещения;
скорость перемещения.


Источник: https://t.me/qgishack/587
Карты изолиний (также могут называться изоплетами, изоквантами или изарифмиями) - карты, на которых отображены линии равных значений (от греческого isos - равный).
Дополнительно
В 1889 году Френсис Гальтон предложил термин изограмма (от греческого ἴσος (isos) ‘равный’ и γράμμα (gramma) ‘написание, рисунок’) для линий, показывающих равенство физической величины или количества, однако этот термин уже использовался в лингвистике для слов, в которых не повторяется ни одна буква дважды.
В XX веке в США получил распространение термин изоплета (от греческого πλῆθος, plethos, ‘количество’), в то время как в Европе стал использоваться термин изоритма (от греческого ἀριθμός, arithmos, ‘число’). В нашей стране более широкое распространение получил термин “изолиния”, являющийся словом гибридного греческо-английского происхождения. Также существует еще один греческо-английский термин “изометрическая линия” (от греческого μέτρον, metron, ‘измерение’).
Существует целый ряд специальных названий для изолиний в зависимости от того, какие величины они отображают:
изобаты - линии равной глубины;
изобары - линии равного давления;
изогипса (горизонталь) - линия равной высоты;
изотерма - линия равных температур;
изокоста - линия комбинации факторов производства, которые можно купить за одну и ту же сумму;
изокванта - линия одинакового объема производства продукции;
изохора - линия равного объема;
изохрона - линия равного времени.
Источник: https://riatelab.github.io/MDM/
Isochrone map of time it takes to get to Paris. Carte des communications rapides entre Paris et le reste de la France /dressée par E. Martin ; E. Chevaillier, del. Source: University of Chicago Map Collection.
Картодиаграммы могут рассматриваться как один из случаев использования символов на карте, где вместо простых геометрических фигур или значков на карте размещаются графики.
Источник: https://openedo.mrsu.ru/catalog/Estestvennie/2015/Osnovy_geoinformatsionnogo_kartografirovaniya/main/37.html
Источник: https://www.primegroup.ru/services_and_decisions/informatsionno-analiticheskie_sistemy/sistemy_vizualizacii/
Nuñez JR, Anderton CR, Renslow RS (2018) Optimizing colormaps with consideration for color vision deficiency to enable accurate interpretation of scientific data. PLoS ONE 13(7): e0199239. https://doi.org/10.1371/journal.pone.0199239.)
How rainbow colour maps can distort data and be misleading https://theconversation.com/how-rainbow-colour-maps-can-distort-data-and-be-misleading-167159
Балтыжакова Т.И. Геоинформационные системы: курс лекций