Новый российский алгоритм в пять раз ускорит анализ геоданных

Новый российский алгоритм в пять раз ускорит анализ геоданных

Принципиально новый подход к пространственной индексации объектов на земной поверхности, который повысит ее производительность в 5-6 раз, предложили ученые МИИГАиК. По их мнению, новый подход найдет применение в системах экологического мониторинга, городского управления, логистики и других пространственных моделях любого масштаба и назначения. Об этом РИА Новости сообщили в пресс-службе вуза.
Индексация — это краеугольный камень всех современных баз данных. Именно благодаря ей возможно из миллионов и миллиардов записей найти необходимые практически моментально. Простейшим, знакомым всем индексом является алфавитный указатель в книге, сообщил доцент кафедры информационно-измерительных систем Московского университета геодезии и картографии (МИИГАиК) Олег Гвоздев.

«Пространственные индексы, в свою очередь, позволяют быстро искать пространственные объекты, имея координаты в пространстве. Найти ближайшую станцию метро или ресторан. Направить обращение в обслуживающую конкретный адрес диспетчерскую скорой помощи или пожарной. Распределить нагрузку на сотрудников курьерской службы и пункты самовывоза. Сформировать отчет, отражающий распределение событий по районам города и решить другие повседневные задачи», — рассказал Гвоздев.

Олег Гвоздев отметил, что обычные методы пространственной индексации позволяют найти объекты, близкие к нужной области, но каждый из них нужно проверить на точное совпадение требованиям запроса.

«Наш метод позволяет сразу получить готовый результат, не обращаясь к данным этих объектов. Более того — он позволяет устранить повторные проверки, для случаев, когда, например, несколько объектов имеют общие точки или границы. Это существенно сокращает объем вычислений и дает 5-6-кратный прирост производительности, по сравнению с доминирующими на рынке универсальными решениями (PostgreSQL+PostGIS), и до 30 процентов — по сравнению со специализированными высокопроизводительными методами на базе сеточных индексов», — пояснил он.
По мнению авторов, предлагаемый метод будет особенно полезен в системах типа «умный город» или «цифровой двойник», куда данные поступают непрерывным потоком, а количество запросов достигает нескольких десятков тысяч в секунду, и уже в этом десятилетии может достичь уровня миллионов в секунду.
Другое потенциальное направление применения разработки — «наука о данных» (Data Science) и анализ больших данных (Big Data Analytics), которые лежат в основе современных методов выработки рациональных управленческих решений в коммерческих организациях и общественных институтах.

«Этот результат усиливает и дополняет существующую инструментальную базу, доступную исследователям и разработчикам. С его помощью можно оптимизировать решение множества практически значимых задач. А он, в свою очередь, основан на еще более фундаментальных исследованиях в области теории построения адаптивных информационных и геоинформационных систем. Все это способствует выходу геоинформатики на новый виток интенсивного развития», — рассказал Олег Гвоздев.
В заключение ученый напомнил, что любой способ высвободить 5 процентов или даже 2 процента вычислительной мощности позволяет провести больше экспериментов, проанализировать больше данных, а в перспективе — совершить новые открытия. К тому же, предложенный метод принципиально расширяет инструментальную базу специалистов в Data Science.

Иллюстрация к статье: Яндекс.Картинки
Подписывайтесь на наш Telegram, чтобы быть в курсе важных новостей медицины

Оставить комментарий

Вы можете использовать HTML тэги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>