21 Июля 15:51

USD 78.3129

0

EUR 91.0821

0

Brent 68.7

-0.7

Природный газ 3.327

-0.07

14 мин
645

ИИ в системах раннего предупреждения чрезвычайных ситуаций в арктических перевозках судами смешанного типа плавания

Авторы рассматривают подходы и методы машинного обучения для прогнозирования вероятности различных типов чрезвычайных ситуаций, возникающих при арктических перевозках судами смешанного типа «река-море» на основе входного набора данных, и предлагают модели решения задач прогнозирования чрезвычайных ситуаций в условиях Северного морского пути. В статье приведена классификация входных данных для алгоритмов машинного обучения, выявлены проблемы в данных и их характеристиках и предложены варианты решения этих проблем.

ИИ в системах раннего предупреждения чрезвычайных ситуаций в арктических перевозках судами смешанного типа плавания

Ключевые слова: Арктика, машинное обучение, река-море, прогнозирование, алгоритмы, Северный морской путь.

В условиях стремительно меняющегося климата, когда арктические льды начинают таять, все большее внимание уделяется развитию судоходства в высоких широтах, в том числе по трассам Северного морского пути. Одновременно растет потребность в эффективных системах обеспечения безопасности как экипажа и грузов, так и окружающей среды. Традиционные меры предосторожности, основанные на метеорологических прогнозах и опыте навигации в сложных условиях, не всегда достаточны. В последние годы все чаще применяются технологии искусственного интеллекта для анализа больших массивов данных и своевременного выявления потенциальных угроз. Одной из наиболее востребованных областей применения ИИ становятся системы раннего предупреждения для судов смешанного типа плавания, которые могут работать как в речных, так и в морских условиях Арктики. В рамках «северного завоза» по рекам доставляются самые разные типы грузов – продукты питания, строительные материалы, топливно-энергетическая продукция, насыпные грузы и прочие [1, 2]. Будущее арктического судоходства зависит от понимания рисков и инцидентов. Подход и методы машинного обучения используют данные об инцидентах и природных условиях для прогнозирования и выявления рисков. Предлагаемый подход начинается с разведочного анализа данных для выявления закономерностей в исторических данных об инцидентах и условиях окружающей среды. Результаты разведочного анализа используются для выбора входных признаков, кластеризации записей об инцидентах по маршрутам и слиянии классов инцидентов во время подготовки данных для ввода в модели машинного обучения. Затем исследуются несколько моделей машинного обучения для многоклассовой классификации на основе таких показателей, как точность, достоверность, F-1 в случае разбалансировки классов, сосредоточив внимание на точности положительных прогнозов и фактически положительных записей. Наиболее эффективная модель определяется путем сравнения этих показателей. Наконец, выходные данные машинного обучения анализируются с использованием графиков важности признаков и частичной зависимости для исследования взаимосвязи между признаками и типом инцидентов и выявления факторов риска, которые влияют на возникновение различных типов инцидентов. Это, в свою очередь, может информировать о стратегических решениях, которые помогают повысить безопасность навигации в Арктике для судов смешанного типа «река-море».

В целях применения технологий ИИ и машинного обучения в оценке и прогнозировании рисков возникновения ЧС необходимо учитывать факторы аварийности и опираться на следующие виды анализа ее вероятности, а именно:

- Анализ факторов аварийности – понимание причинных факторов, связанных с возникновением аварий.

- Анализ вероятности аварийности – прогнозирование вероятности или частоты возникновения аварий.

- Анализ тяжести аварийности – прогнозирование последствий или результатов возникновения аварий.

- Анализ описания аварийности – интерпретация текстовых данных для лучшего понимания типов аварий или причинных факторов.

Возможности алгоритмов машинного обучения в некоторой степени зависят от доступности соответствующих наборов данных, которые описывают вероятность или последствия аварий. Было выявлено восемь основных источников данных:

- Базы данных аварий – использование табличных данных, состоящих из деталей инцидента, таких как тип, время, местоположение, суда и причины аварий.

- Данные о движении судов – позиции судов из различных источников, из таких как автоматические идентификационные системы, радар или синтетические данные.

- Данные инспекций – сведения о результатах инспекций портового или государственного контроля флага, которые включают сведения о недостатках или задержаниях этого судна.

- Список судов/проектов – сведения о судовом флоте, такие как характеристики или проекты судов.

- Экспертное заключение – использование информации, полученной от опытных штурманов, экспертов в области навигации, из анкет или интервью.

- Текстовые данные – использование неструктурированных текстовых данных, таких как навигационные и метеорологические данные или описания аварий.

- Данные симулятора – использование выходных данных симулятора полного мостика, используемых для тестирования определенных сценариев.

- Измерения на месте – данные, полученные с бортовых датчиков на месте, таких как акселерометры или датчики давления, данные с датчиков оборудования и устройств для ликвидации последствий ЧС

Из имеющихся наборов данных, указанных выше, проводится анализ того, какие характеристики были включены в качестве независимых или зависимых переменных в различные исследования. Более 25 различных характеристики, которые сгруппированы в пять категорий:

- Данные о судне, включая размер судна, возраст, осадка, грузоподъемность, тип.

- Управление судном, включая государство флага, классификационное общество, национальность, компанию и строителя.

- Данные о рейсе, включая местоположение, дату и время суток, глубину воды, расстояние от берега, уровень трафика, поведение судна и скорость.

- Метеорологические и океанологические условия, включая сезон, ветер, волны, лед, осадки, видимость, давление, температуру и течение и др.

- История инцидентов, включая историю проверок, недостатки, задержания, страховые иски, последствия аварий и подробности аварий.

Ограничения в наборах данных

Данные об инцидентах могут быть ненадежны или занижены, что подрывает статистический анализ, особенно учитывая незначительные аварии. В результате обученные модели будут иметь внутреннюю предвзятость в отношении прогнозирования аварийных ситуаций. Аналогичным образом в базах данных аварий присутствуют проблемы с качеством, такие как отсутствующие поля или неправильное позиционирование. Чтобы не допустить искажения в прогнозах разработанных моделей, эти ограничения необходимо устранить. В этом случае решение автоматического обеспечения качества данных лежит в применении алгоритмов обработки естественного языка. Вторым ключевым ограничением данных об авариях является им присущее нечастое возникновение, что ограничивает возможности обучения многих алгоритмов и подрывает репрезентативность данных обучения. В новых изучаемых средах, например, на территориях, где происходит изменение маршрутов судов, модели, связанные с историческими данными и прогнозами, могут стать недействительными. В таких условиях вероятностные или случайные сети могут быть более подходящими, чем использование данных об авариях. Кроме того, из-за нечастого возникновения аварий сбор достаточной информации может потребовать сопоставления данных об авариях за несколько лет. В течение этого периода условия, технологии и поведение судов, которые привели к этим авариям, меняются, следовательно, репрезентативность данных обучения для будущих прогнозов становится менее сильной. Результаты инспекций и осмотра судов, скорее всего, предскажут только подмножество потенциальных опасностей. Навигационные происшествия, такие как столкновения и посадки на мель, имеют пространственно-временные причинные факторы, которые нельзя оценить только по данным инспекций. Эксперты могут маркировать относительный риск инцидента в различных ситуациях для того или иного судна. И эти метки станут целевыми признаками для разработки модели машинного обучения. Ручная маркировка также требует больших временных затрат, и поэтому может оказаться невозможным собрать достаточно маркированных данных от морских специалистов. Кроме того, экспертное суждение субъективно и может быть подвержено предубеждениям, которые могут повлиять на точность прогнозирования. Данные о судне могут быть неполными, так как не учитывают поведение судна и внешние факторы, влияющие на навигацию. Необходимы детализированные данные о движении судов и радарные данные. Чтобы избежать ошибок, которые повлияют на результаты, делая их неоптимальными или вводящими в заблуждение, и оптимально использовать наборы данных, важно создать общий алгоритм их предварительной обработки и проверки.

Выбор и разработка модели

Основным преимуществом использования методов машинного обучения является возможность интегрировать многочисленные наборы данных, тем самым повышая точность прогнозирования. Логистическая регрессия, как тип обобщенной линейной модели, использует сигмоидальную функцию для прогноза вероятностей. Она популярна из-за своей простоты и эффективности и применяется для базовых прогнозов, таких как оценка аварий различных типов судов и инцидентов, связанных с погодой. Одним из ее преимуществ является легкость в оценке влияния каждой переменной на зависимую переменную, что улучшает интерпретируемость. Однако она не может решать сложные нелинейные задачи из-за линейной природы своей функции принятия решений и требует некоторой настройки. Искусственные нейронные сети (ANN) имитируют организацию биологических нейронных сетей. Они стали популярны благодаря алгоритму обратного распространения ошибки для обучения многослойных персептронов. ANN состоят из входных слоев, скрытых слоев и выходного слоя и обучаются с помощью градиентного спуска для минимизации функции стоимости. Преимущество ANN заключается в их способности изучать сложные нелинейные отношения, что способствует высокой производительности. CNN (сверточная нейронная сеть) – это особая форма ANN, используемая для сложных задач классификации, особенно с использованием изображений. В одном из исследований была предпринята попытка использовать этот подход для оценки риска столкновений по фотографиям дорожного движения, которому ранее была присвоена оценка риска группой экспертов [9]. Рекуррентные нейронные сети (RNN) расширяют ANN с помощью циклов, так что предыдущие выходные данные могут использоваться в качестве входных данных, что делает их особенно полезными в данных временных рядов и областях обработки естественного языка. Сети с долговременной краткосрочной памятью (LSTM) – это популярная форма RNN, которая решает проблемы долгосрочной зависимости RNN, обеспечивая лучшее сохранение информации в течение длительных периодов времени через шлюзы использования. На пример, LSTM можно внедрить для прогнозирования будущего риска столкновений на основе путей движения судов или для прогнозирования тенденций в количестве аварий. Проблема нейронных сетей заключается в их сложности, что может привести к длительному времени разработки, переобучению, плохим обобщениям и низкой интерпретируемости. Кроме того, для обучения им часто требуются значительные наборы данных, что может быть невозможно в случае редких событий, таких как морские аварии. Метод опорных векторов (SVM) может выполнять линейную и нелинейную классификацию, строя гиперплоскость или набор гиперплоскостей в многомерном пространстве, чтобы максимизировать разницу между тренировочными данными, и стала популярной благодаря своей возможности классификации. Однако SVM не обладают собственной способностью определять, насколько различные признаки влияют на прогнозирование аварий, что может ограничить их применение в исследованиях риска чрезвычайных ситуаций. Методы SVM, кластеризация на основе плотности и RNN помогут в прогнозировании риска столкновений [9]. Однако учет динамических данных вызывает вычислительные сложности, особенно из-за дисбаланса классов и редкости аварий. Дерево решений – это непараметрический метод обучения, предсказывающий целевую переменную через правила принятия решений на основе характеристик данных. Этот метод прост и прозрачен и может вычислять важность каждой характеристики для прогнозов. Однако деревья решений часто не достигают высокой точности из-за трудностей с непрерывными и категориальными переменными и склонны к переобучению. Ансамблевые методы, такие как случайные леса и XGBoost, улучшают стабильность и точность, используя бэггинг и случайное подпространство для разнообразия деревьев и снижения дисперсии, что помогает избежать переобучения. Случайные леса (Random Forest) широко популярны и доступны на многочисленных языках, а также обладают такими неотъемлемыми свойствами, как скорость обучения и надежность при использовании многомерных и несбалансированных наборов данных. Однако дерево решений редко достигает высокой точности, отчасти из-за методологических недостатков при использовании смеси непрерывных и категориальных переменных. Деревья решений склонны к переобучению, но ансамбль деревьев решений, таких как случайные леса или XGBoost, может привести к более точным прогнозам. Алгоритмы случайных лесов достигли второго по величине показателя точности (96 %) для прогнозирования аварий судов [4]. XGBoost еще больше расширяет обучение на основе деревьев посредством усиления и градиентного спуска, так что новые модели итеративно обучаются на остаточных ошибках предыдущих моделей. В результате этот метод достигает одной из самых высоких прогностических точностей в сравнительных исследованиях [4]. Утверждается, что XGBoost более точен, более масштабируем для больших наборов данных и высокоэффективен и, как прогнозируется, станет одним из наиболее широко применяемых методов в науке о данных.

Проблемы дисбаланса классов

Морские аварии – редкие и представляют вызов для моделирования из-за дисбаланса классов. Существующие ИИ-разработки в судоходстве полезны, но подвержены предвзятости и имеют ограничения, затрудняющие их обобщение для анализа будущих чрезвычайных ситуаций. Большинство алгоритмов машинного обучения предполагают сбалансированное распределение данных, поэтому их эффективность может снижаться. Проблему дисбаланса можно решить либо балансировкой данных, либо использованием алгоритмов, учитывающих вес классов. Метод SMOTE (Synthetic Minority Oversampling Technique) помогает в этом, создавая искусственные данные для меньшинств, увеличивая долю положительных классов. Применение SMOTE повысило общую точность прогнозов с 97,8 до 99,3 % за счет сокращения числа ложноотрицательных результатов [10].

Природа дисбаланса классов затрудняет оценку результатов моделей машинного обучения. Из-за дисбаланса используют альтернативные метрики, такие как «матрица путаницы», F1-оценка и кривая ошибок (ROC). «Матрица путаницы» помогает оценить полноту и точность классификации, а F1-оценка объединяет их для общей точности модели. Кривая ROC показывает баланс между полнотой и ложноположительными результатами, сравнивая классификаторы через AUC, где идеальный – 1, а случайный – 0,5. Оценить точность прогнозов на основе редких событий сложно, даже с тестовыми и обучающими данными. Это усложняет оценку методов машинного обучения по сравнению с традиционными подходами в предсказании морских аварий. Алгоритмы могут предсказывать вероятности классов, что интерпретируется как относительная вероятность аварий и оценка риска.

Однако из-за присущего классам дисбаланса и использования стратегий повторной выборки эта вероятность не калибруется и будет генерировать более высокие вероятности для большинства классов. Хотя существуют методы исправления дисбаланса классов, во многих случаях может быть недостаточно данных для калибровки результатов. Поэтому может быть желателен безразмерный вывод, такой как индекс безопасности судна или качественные уровни риска. Это позволяет провести некоторую границу между риском различных сценариев, но не имеет количественных метрик вероятности или последствий.

Заключение

Использование технологий ИИ в сфере безопасности и модели прогнозирования рисков растет, но его применение в морской области ограничено. Машинное обучение и большие данные могут улучшить понимание вероятностей и последствий аварий с точностью свыше 90 % [4]. Эти методы позволяют создавать сложные и масштабируемые модели, преодолевая ограничения традиционных подходов. Машинное обучение может повысить безопасность судов, предоставляя точные инструменты для оценки рисков в реальном времени в транспортно-логистической системе Северного морского пути. В работе также выделены аспекты, требующие дальнейшего исследования, которые актуальны не только для морского транспорта, но и для других транспортных процессов. Прогнозировать аварийные ситуации непросто из-за сложной связи со случайными факторами. Машинное обучение подходит для таких задач, так как не требует априорных предположений и справляется с нелинейными, многомерными данными, характерными для морской безопасности, особенно для судов смешанного типа «река-море». Однако человеческий фактор может ограничивать его возможности. В отличие от этого, прогнозирование расхода топлива, связанное с изученным механическим процессом и доступными данными, может быть более точным, достигая точности свыше 99,99 %. Такой уровень точности маловероятен в прогнозировании аварий. Для их улучшения моделей нужно включать пространственно-временные данные (погода, батиметрия, поведение судна) и учитывать человеческой фактор, который сложно количественно оценить, но он важен, так как является причиной многих аварийных ЧС. Мы продемонстрировали разнообразие данных для моделей прогнозирования чрезвычайных ситуаций. Машинное обучение может преодолеть предвзятость экспертов в оценках риска, что улучшает точность и снижает затраты. Эти методы могут воспроизводить экспертные оценки. Это открывает возможности для автоматизированных инструментов поддержки принятия решений для обеспечения безопасности судов в реальном времени на основе опыта морских специалистов, но, в свою очередь, требует большого набора данных. Модели машинного обучения критикуются за недостаточную прозрачность и интерпретируемость. Однако с учетом небольшой эффективности логистической регрессии, ее применению уделяется внимание благодаря хорошей интерпретируемости [4]. Несмотря на преимущества машинного обучения, пока мало доказательств, что оно превосходит традиционные модели прогнозирования рисков на море.

Литература

1. Антипов Е.О., ТутыгинА.Г., Коробов В.Б. Проблемы осуществления транспортировки грузов Арктической зоне РФ морским путем // Управленческое консультирование. 2017. № 11 (107). С. 72–79. [Antipov E.O., Tutygin A.G., Korobov V.B. Problems of cargo transportation in the Arctic zone of the Russian Federation by sea // Managerial consulting. 2017. № 11 (107). Pp. 72–79. (In Russ.)].

2. Полешкина И.О. Оценка эффективности продовольственного обеспечения районов Крайнего Севера России // Экономика региона.2018. Т. 14. Вып. 3. С. 820–835. [Poleshkina I.O. Evaluation of the effectiveness of foodsupply in the regions of the FarNorth of Russia // The economy of the region. 2018. Vol. 14. Iss. 3. Pp. 820–835. (In Russ.)].

3. Fan S, Blanco-Davis E, Yang Z, Zhang J, Yan X. Incorporation of human factors into maritime accident analysis using a data-driven Bayesian network. Reliab Eng Syst Saf 2020;203:107070.

4. Jin, M., Shi, W., Yuen, K., Xiao, Y., & Li, K. (2019). Oil tanker risks on the marine environment: An empirical study and policy implications. Marine Policy, 108. doi:10.1016/j.marpol.2019.103655.

5. Rezaee, S., Pelot, R., & Finnis, J. (2016). The effect of extratropical cyclone weather conditions on f ishing vessel incidents’ severity level in Atlantic Canada. Safety Science, 85,33–40. doi:10.1016/ j.ssci.2015.12.006.

6. Rezaee, S., Pelot, R., & Ghasemi, A. (2016). The effect of extreme weather conditions on commercial f ishing activities and vessel incidents in Atlantic Canada. Ocean and Coastal Management, 130, 115–127. doi:10.1016/j.ocecoaman.2016.05.011.

7. Heij, C., & Knapp, S. (2018). Predictive power of inspection outcomes for future shipping accidents An empirical appraisal with special attention for human factor aspects. Maritime Policy and Management, 45(5), 604–621. doi:10.1080/03088839.2018.1440441.

8. Knapp, S., Kumar, S., Sakurada, Y., & Shen, J. (2011). Econometric analysis of the changing effects in wind strength and significant wave height on the probability of casualty in shipping. Accident Analysis and Prevention, 43, 1252–1266. doi:10.1016/j.aap.2011.01.008.

9. Zhang, W., Feng, X., Goerlandt, F., & Liu, Q. (2020). Towards a convolutional neural network model for classifying regional ship collision risk levels for waterway risk analysis. Reliability Engineering and System Safety, 204. doi:10.1016/j.ress.2020.107127.

10. He, J., Hao, Y., & Wang, X. (2021). An interpretable aid decision-making model for flag state control ship detention based on SMOTE and XGBoost. Journal of Marine Science and Technology, 9,2. doi:10.3390/jmse902015



Статья «ИИ в системах раннего предупреждения чрезвычайных ситуаций в арктических перевозках судами смешанного типа плавания» опубликована в журнале «Neftegaz.RU» (№3, Март 2025)

Авторы:
882298Код PHP *">
Читайте также
1/12