Технологии

В рамках проекта выполнен анализ существующих отечественных технологий сбора, обработки, хранения, распространения и анализа ПД, а также формирования продуктов и услуг, оказываемых на их основе с приведением сравнительного анализа с мировыми аналогами/эквивалентами. Комплексный анализ свыше 500 информационных источников (публикации в рецензируемых изданиях, патенты, техническая документация и др.), позволил выявить и исследовать особенности «жизненного цикла» ПД в его современном виде. Жизненный цикл пространственных данных реализуется в рамках сложной системы взаимоотношений, в которую вовлечено большое число разнообразных видов экономической деятельности, технологий, ресурсов. Полученные с помощью различных методов (дистанционное зондирование, геодезия, локализованные сенсоры) пространственные данные претерпевают несколько стадий обработки, в результате чего формируются продукты различных уровней (от уровня 0 «сырые ПД» до уровня 3 «ПД с глубоким уровнем обработки»), при этом потребители пользуются продуктами всех уровней. Наблюдается многообразие сочетаний различных потребителей и уровней обработки данных. За счёт интеграции технологий получения, обработки и анализа пространственных данных с системами хранения и распространения реализуются геоинформационные сервисы и услуги, популярность и экономическое значение которых неуклонно возрастает.

Ключевыми, базовыми технологиями, в совокупности обеспечивающими основы процессов сбора, обработки, хранения, распространения и анализа пространственных данных, а также продуктов и услуг, оказываемых на их основе, являются:

  • дистанционное зондирование Земли;
  • глобальное спутниковое позиционирование;
  • геодезические измерения;
  • аппаратные и программные средства обработки и анализа пространственных данных;
  • Интернет.

Общемировой тенденцией является интеграция пространственных данных и процедур их обработки в решения по хранению данных общего назначения. Можно отметить высокое качество «пространственных расширений» для всех популярных реляционных СУБД. Классификацию технологий распространения ПД можно представить 3-мя основными типами:

  • открытые сервисы (Интернет, доступ к данным и их получение бесплатны);
  • закрытые сервисы (Интернет, доступ к данным и их получение платны, регламентированы);
  • сервисы-дистрибьюторы (подбор данных выполняется на основании технического задания заказчика).

В контексте современной геополитической обстановки немаловажную роль играет импортоназевисимость применяемых в Российской Федерации решений по сбору, обработке, хранению и распространению ПД. Наибольшей самостоятельностью и конкурентоспособностью в международном масштабе характеризуется отечественная система спутникового позиционирования ГЛОНАСС. Наименее импортонезависимыми представляются аппаратные средства обработки и анализа пространственных данных (микроэлектроника, компьютеры и др.), отечественные разработки в этом сегменте не соответствуют современным потребностям экономики. Состояние отечественных технологий дистанционного зондирования Земли и геодезических измерений (с учётом намеченных перспектив развития) можно охарактеризовать, как допустимо-приемлемое для внутренних задач, однако эти технологии неконкурентоспособны на международном рынке. Исследование включает оценки также и по другим ключевым типам технологических реурсов, обеспечивающих жизненный цикл ПД в России.

Прослеживаются тенденции, свидетельствующие о возможном введении ограничений импорта в Россию технологий, критически важных для обработки и анализа ПД, а также развертывания геоинформационных сервисов. Прежде всего это касается элементной базы для реализации технических решений по сбору пространственных данных, а также специализированных программных средств, ориентированных на обработку пространственных данных, включая данные дистанционного зондирования и данные геодезических измерений.

Сопоставительный анализ результатов патентного поиска по тематическим ключевым словам, проведённого в базах данных ФИПС (Россия) и USPTO (США), свидетельствует о том, что в области ПД, ДЗЗ и ГТ патентная активность в России, относительно невысока.

В рамках исследования проведен семантический анализ больших текстовых данных с использованием системы iFORA (правообладатель – НИУ ВШЭ), который позволил выявить тематики трендов в сфере ПД. Результаты представлены на «интерактивной семантической карте трендов».

Семантическая карта получена в результате использования базы документов iFORA и реализации алгоритмов системы. При обращении к базе документов iFORA был использован перечень поисковых терминов направления «Пространственные данные».
Поисковые термины на английском языке были подобраны с использованием предметно-алфавитных указателей научной литературы и валидированы с отраслевыми экспертами. Число документов за период 2009–2019 гг., в которых встречаются отобранные для анализа термины, составляет около 225 тысяч.

Система iFORA осуществляет анализ документной базы, включающей научные статьи, патенты, грантовые заявки, стратегические и аналитические материалы, обзоры рынков,отраслевую периодику экономической, научно-технологической и иной направленности, на предмет встречаемости заданных поисковых условий и синтаксических конструкций, слов-маркеров и близких по смыслу терминов.

Таким образом, алгоритмически выявляются все контексты, где упоминается интересующая тема. Тем самым система эффективно преодолевает ограничения, свойственные традиционной экспертной аналитике, выполняемой «ручными» методами.

Семантическая карта представляет собой автоматически формируемые онтологии, демонстрирующие наиболее значимые тематики и технологические направления. Точки семантической карты характеризуют какой-либо тренд, технологию, направление исследований, рынок, продукт, услугу и т.п.; размер шрифта подписи пропорционален степени их значимости (показатель, отражающий относительную частоту встречаемости термина в анализируемом корпусе документов), а цвет позволяет определить кластер (группу близких по смыслу терминов), к которому относится каждый из терминов.  На карте приводятся термины, которые упоминаются чаще остальных в контексте направления «Пространственные данные». Связи между терминами обозначаются линиями (ребрами) между точками, а также их близким расположением; ребра свидетельствуют об устойчивой совместной встречаемости соответствующих терминов в проанализированных источниках.

На полученной семантической карте представлены десять кластеров, тематики которых отмечены соответствующими цветами: «Спутниковая навигация», «Агроресурсы; точное земледелие», «Инструментальные средства», «Глубокое обучение», «Гидрогеология», «Климатология; гидрометеорология», «Лазерное сканирование», «Геоморфология», «Инфраструктура пространственных данных», «Обработка изображений». Для каждого кластера приведено общее число документов и оценена динамичность, то есть темп роста (снижения) употребления термина из года в год в течение определенного периода времени (с нормализацией на общий размер текстовых массивов за каждый период): чем быстрее растет распространенность термина, тем выше значение данного показателя.

  • Презентация для скачивания:
Пролистать наверх