









|
Библиотека
|
ваш профиль |
Статья опубликована с лицензией Creative Commons Attribution-NonCommercial 4.0 International License (CC BY-NC 4.0) – Лицензия «С указанием авторства – Некоммерческая».|
Программные системы и вычислительные методы
Оформленная ссылка на статью:
Челышев Э.А., Раскатова М.В., Федорович А.А., Королев А.И., Ососков В.С. Признаковое пространство и гибридная нейросетевая модель для оценки уровня артериального давления человека по видеоданным // Программные системы и вычислительные методы. 2026. № 2. С. 229-248. DOI: 10.7256/2454-0714.2026.2.79241 EDN: BJZZPI URL: https://nbpublish.com/library_read_article.php?id=79241
Признаковое пространство и гибридная нейросетевая модель для оценки уровня артериального давления человека по видеоданным
DOI: 10.7256/2454-0714.2026.2.79241EDN: BJZZPIДата направления статьи в редакцию: 08-04-2026Дата получения первой рецензии с формулировкой «Отправлена на доработку с рекомендациями рецензента»: 15-04-2026 20:33Дата доработки рукописи автором после первой рецензии: 25-05-2026 20:42Дата получения последней положительной рецензии с рекомендацией «опубликовать»: 31-05-2026 09:30Статья публикуется в одобренном рецензентами варианте (после получения последней положительной рецензии, рекомендующей рукопись к публикации) с исправлениями автора (внесенными им после получения предварительных рецензий, рекомендующих рукопись к доработке). Все рецензии (включая предварительные рецензии) опубликованы в открытом доступе непосредственно за текстом самой статьи. Все варианты авторских исправлений хранятся в депозитарии издательства и могут быть доступны по требованию уполномоченных организаций. Прочитать все рецензии на эту статью Дата публикации: 02-06-2026Аннотация: Предметом настоящего исследования являются нейросетевые алгоритмы интеллектуального анализа видеоданных в задаче бесконтактной оценки уровня физиологических параметров человека. Исследуется задача оценки уровня артериального давления по видеоплетизмографическим записям лица. Поскольку давление характеризуется систолическим и диастолическим значениями, задача формулируется как восстановление регрессии для двух целевых переменных. В работе применён репрезентативный набор данных, содержащий видеозаписи 2251 испытуемого. Для анализа предложен и реализован метод выделения области интереса, извлечения зелёного канала и построения частотно-временных представлений с помощью непрерывного вейвлет-преобразования. Разработана гибридная архитектура, обеспечивающая эффективную обработку нестационарных сигналов кровотока, снижение размерности признаков и повышение точности прогнозирования. Особое внимание уделено устойчивости модели к внешним помехам. Для выделения региона интереса и его сегментации использовались предобученные нейросетевые модели. Обработка извлекаемых временных рядов производилась посредством применения частотного фильтра и дальнейшего непрерывного вейвлет-преобразования временного ряда. Для задачи восстановления регрессии уровня артериального давления применялась гибридная нейросетевая модель на основе одномерных свёрточных и рекуррентных LSTM-сетей. Предложенный метод существенно уменьшает размерность данных за счет извлечения амплитудно-энергетических, частотных, динамических и фазовых показателей колебаний кровотока в четырех частотных диапазонах, соответствующих различным регуляторным механизмам организма. Достигнуты значения средней абсолютной ошибки 15,2 мм рт. ст. для систолического и 9,3 мм рт. ст. для диастолического давления. Полученные показатели сопоставимы с зарубежными аналогами, хотя и несколько хуже, несмотря на использование значительно более репрезентативной выборки. Тем не менее, данная модель не удовлетворяет клиническим требованиям точности (5 мм рт. ст.) и требует дальнейшего совершенствования. Особое внимание следует уделить расширению набора данных случаями с экстремальными значениями давления, а также проверке устойчивости алгоритма к переменному освещению и случайным движениям камеры. Ключевые слова: артериальное давление, видеоплетизмография, нейронная сеть, машинное обучение, вейвлет-преобразование, LSTM, сверточная нейронная сеть, видеоданные, физиологический параметр, частотно-временной анализAbstract: The subject of this study is neural network algorithms for intelligent video data analysis in the task of contactless assessment of the level of human physiological parameters. The task of assessing blood pressure levels based on video plethysmographic recordings of a face is being investigated. Since blood pressure is characterized by systolic and diastolic values, the task is formulated as regression reconstruction for two target variables. The work uses a representative dataset containing video recordings of 2,251 subjects. For the analysis, a method for selecting the area of interest, extracting the green channel, and constructing time-frequency representations using a continuous wavelet transform is proposed and implemented. A hybrid architecture has been developed that provides efficient processing of non-stationary blood flow signals, reducing the dimension of features and increasing the accuracy of forecasting. Special attention is paid to the model's resistance to external interference. For the task of restoring blood pressure regression, a hybrid neural network model based on one-dimensional convolutional and recurrent LSTM networks was used. The proposed method significantly reduces the data dimension by extracting amplitude-energy, frequency, dynamic and phase parameters of blood flow fluctuations in four frequency ranges corresponding to various regulatory mechanisms of the body. The values of the average absolute error of 15.2 mmHg for systolic and 9.3 mmHg for diastolic pressure were achieved. The obtained indicators are comparable to their foreign counterparts, although somewhat worse, despite using a much more representative sample. However, this model does not meet the clinical accuracy requirements (5 mmHg) and requires further improvement. Particular attention should be paid to expanding the dataset with cases with extreme pressure values, as well as checking the algorithm's stability to variable lighting and random camera movements. Keywords: blood pressure, remote photoplethysmography, neural network, machine learning, wavelet transform, LSTM, convolutional neural network, video data, physiological parameter, time-frequency analysisВведение. В настоящее время информационные технологии и машинное обучение находят активное применение в медицине. В последние годы развивается перспективное направление, связанное с применением методов и алгоритмов обработки видеоданных и машинного обучения в задаче оценки физиологических параметров человека. В настоящей работе исследуется задача оценки уровня артериального давления человека на примере данных видеоплетизмографии (англ. remote photoplethysmography). Видеоплетизмография является экспериментальной диагностической процедурой, заключающейся в видеосъемке поверхности кожи человека с дальнейшей обработкой полученных видеоданных для оценки физиологического состояния испытуемого. Данные видеоплетизмографии содержат в себе сведения о колебаниях кровотока поверхностных сосудов кожи человека, которые проявляются в изменении интенсивности цвета во времени. Безусловно, видеоданные, полученные в ходе видеоплетизмографического исследования, являются зашумленными, кроме того, в них присутствуют ошибки квантования камеры и представления цвета. Однако практика показывает, что при надлежащей обработке данных видеоплетизмографии с их помощью удается осуществлять бесконтактный мониторинг физиологического состояния человека [1]. Таким образом, для оценки физиологического состояния человека по данным видеоплетизмографии не требуются какие-либо специализированные медицинские устройства, достаточным является применение персонального компьютера или мобильного телефона, оснащенных видеокамерой. Настоящая работа посвящена задаче оценки уровня артериального давления (АД) по данным видеоплетизмографии. Целью работы является разработка гибридной нейросетевой модели оценки уровня АД по видеоданным и признакового пространства для нее. Отметим, что АД человека характеризуется двумя параметрами: систолическим (верхним) и диастолическим (нижним) давлением. Таким образом, задача оценки уровня АД может быть сформулирована как задача восстановления регрессии для двух целевых значений. Существует ряд публикаций, посвященных использованию видеоплетизмографии и обработки ее результатов для задачи оценки физиологических параметров человека. Работа [2] посвящена оценке эффективности совместного использования видимого (в модели RGB, англ. Red, Green, Blue) и ближнего инфракрасного света в задаче бесконтактного измерения АД по данным видеоплетизмографии. При сравнении результатов, полученных на видеоряде в формате RGB и ближнем инфракрасном диапазоне, достоверных статистических различий между ними выявлено не было. В работе [3] рассматривается задача оценки уровня АД по видеоданным с использованием гибридной искусственной нейронной сети, сочетающей в себе ResNet18 и двунаправленную LSTM-сеть (англ. Long Short-Term Memory). В данной работе средняя абсолютная ошибка (MAE) достигала 12.35 и 9.54 мм рт. ст. для САД и ДАД соответственно. В работе [4] решается задача определения уровня систолического АД по аналогичным данным. В данной работе предложена гибридная нейросетевая архитектура: блок анализа сигнала ВПГ, сочетающий в себе сверточную нейронную сеть и сеть Vision Transformer, блок анализа общих сведений о пациенте, представленный многослойным персептроном, и итоговый выходной блок, также основанный на многослойном персептроне. Наилучшим результатом, достигнутым в данной работе, является значение MAE для САД, равное 11.35 мм рт. ст. В работе [5] решается задача оценки уровня гемоглобина в крови и уровня АД на основе данных видеоплетизмографии. Для прогнозирования использовалась искусственная нейронная сеть, основанная на архитектуре U-Net. В работе были получены значения средней абсолютной процентной ошибки (MAPE), равные 7.52 мм рт. ст. для диастолического артериального давления (ДАД) и 9.52 мм рт. ст. для систолического артериального давления (САД). В исследовании [6] также используется нейронная сеть, основанная на архитектуре U-Net с использованием обучения с переносом (англ. transfer learning). При этом во всех рассмотренных публикациях размер набора данных не превышал 200 видеозаписей, а в работе [6] составил всего 17 человек. Аналогичных отечественных исследований авторам найти не удалось. Материалы и методы. Настоящее исследование проводилось на добровольцах в процессе госпитализации в ФГБУ «Национальный медицинский исследовательский центр терапии и профилактической медицины» Минздрава России для обследования и подбора/коррекции медикаментозной терапии. Исследование проводилось в соответствии со стандартами надлежащей клинической практики (GCP) и принципами Хельсинкской декларации. Протокол исследования был одобрен локальным этическим комитетом (протокол № 01-05/24 от 30.01.2024 г.). Все испытуемые дали письменное согласие на участие в исследовании. Видеозапись производилась в лаборатории с постоянным микроклиматом (температура +23±1°С, влажность – 40-60%) в положении сидя с использованием видеокамеры с частотой дискретизации 30 Гц. Для равномерности освещения использовалась кольцевая светодиодная лампа. Данный набор данных включает в себя видеозаписи лиц 2251 испытуемого. Рассматриваемый набор данных включает в себя помимо видеозаписей лиц испытуемых также сведения о наличии или отсутствии у испытуемых ряда хронических заболеваний, таких как 1) артериальная гипертензия (АГ); 2) ишемическая болезнь сердца или постинфарктный кардиосклероз (ИБС/ПИКС); 3) хроническая сердечная недостаточность (ХСН); 4) нарушения ритма сердца (НРС); 5) цереброваскулярные заболевания (ЦВБ); 6) хроническая ишемия нижних конечностей (ХИНК); 7) хронические обструктивные заболевания легких (ХОБЛ); 8) сахарный диабет (СД); 9) системные заболевания соединительной ткани (СЗСТ); 10) заболевания желудочно-кишечного тракта (ЗЖКТ); 11) заболевания мочеполовой системы (ЗМПС). Учитывался также прием медикаментозной терапии по поводу данных заболеваний, физиологические параметры испытуемого (рост, вес, возраст), отношение к курению. Также фиксировались значения АД, измеренные в процессе видеозаписи. В таблице 1 представлены общие характеристики по набору данных. Таблица 1. Общие статистические характеристики по набору данных
Из всего набора данных только 14,3% человек не имели никаких ХЗ в анамнезе (условно здоровые). 12,6% испытуемых имели одно ХЗ, 16,2% сочетание двух ХЗ, 18,7% – трех, 16,2% – четырех, 11,5% – пяти, 6,4% – шести, 2,7% – семи, 0,9% – восьми и 0,4% человек имели сразу девять ХЗ в анамнезе. Таким образом, практически ¾ испытуемых являются коморбидными пациентами. На этом фоне обращает на себя внимание, что 46% мужчин и 83% женщин никогда не курили. На рисунке 1 представлена гистограмма распределения значений уровня САД и ДАД. Необходимо отметить, что в рассматриваемом наборе данных распределение значений уровня АД не является равномерным.
Для каждого видеоряда Выделение региона интереса является важным этапом в силу того, что видеоданные содержат в себе также окружающий фон. Для выделения региона интереса (лица человека) на видео использовался нейросетевой детектор лиц YuNet FaceDetector [7]. Выбор данной нейросетевой модели выделения лиц обусловлен ее вычислительной эффективностью и небольшим размером. По полученным границам региона интереса производится обрезка кадра с его дальнейшим приведением к размеру, пригодному для дальнейшей обработки. Следующим этапом является сегментация региона интереса. По согласованию с медицинскими специалистами были выбраны следующие сегменты региона интереса: левая и правая щёки и левая и правая половина лба. Выбор данных сегментов региона интереса обусловлен различными регуляторными процессами в них [8]. Для выделения сегментов региона интереса использовалась предобученная нейросетевая модель разметки ключевых точек лица, основанная на архитектуре ResNet [9]. Данная нейросетевая модель производит выделение 68 ключевых точек лица, отмеченных на рисунке 2 синим. Можно, однако, заметить, что в разметке отсутствуют точки, соответствующие верхней границе лба. Для решения данной проблемы было выполнено дополнительное построение шести точек на лбу человека на основе имеющихся точек с учетом геометрических размеров головы человека. Для этой цели осуществлялся расчет угла наклона головы Рис. 2. Ключевые точки лица [10] Пусть для видеокадра
Рис. 3. Пример временного ряда интенсивности цвета Была произведена частотная фильтрация полученных временных рядов с использованием полосового фильтра Баттерворта 4-го порядка с нижней частотой Затем полученные сигналы были подвергнуты частотно-временному анализу посредством непрерывного вейвлет-преобразования (НВП). Фурье-анализ в данном исследовании не применялся в силу того, что частотные характеристики колебаний кровотока могут изменяться во времени [14]. НВП для дискретного сигнала задается формулой (2). В качестве материнского вейвлета использовался комплексный вейвлет Морле. В результате были получены частотно-временные представления для каждого из 4 сегментов региона интереса. Полученное таким образом частотно-временное представление по-прежнему содержит многочисленные шумы и артефакты. Для снижения зашумленности признакового пространства, подаваемого на вход искусственной нейронной сети, а также повышения степени его интерпретируемости специалистом, необходима дополнительная обработка полученных частотно-временных преставлений. В настоящей работе предлагается метод, основанный на оконном анализе частотно-временных представлений. Пусть имеются комплексные коэффициенты НВП Для каждого частотного диапазона Для сохранения междиапазонных отношений по мощности и одновременного устранения влияние общего масштаба частотно-временного образа, вводится относительная доля мощности диапазона, определяемая формулой (5). Величина где Амплитудно-энергетические показатели, извлекаемые путем оконного анализа, включают в себя средние по временному окну амплитуду Частотные показатели представлены центроидом частоты К динамическим показателям относятся показатель вариабельности амплитуды где где
Вычисление динамических показателей позволяет численно оценить изменчивость амплитудных характеристик для каждого частотного диапазона в отдельности, и, как следствие, изменчивость регуляторных процессов организма человека во времени. Для вычисления фазовых показателей в начале по формуле (9) производится вычисление нормированных (имеющих амплитуду равную 1) коэффициентов НВП где Фаза диапазона
где По итогу консультаций с медицинскими специалистами было установлено, что характеристики, описывающие скорость распространения кровотока между сегментами региона интереса, также являются информативными для оценки уровня артериального давления. По этой причине дополнительно при выполнении оконного анализа вычисляется задержка распространения волны между сегментами региона интереса. Пусть имеются два сегмента с индексами где По полученной комплексной полосовой сумме может быть вычислен фазовый лаг временного окна Для извлеченных амплитудно-энергетических признаков была выполнена робастная нормировка. Нормировка производилась для каждого объекта выборки в отдельности, поскольку размах значений амплитуды для частотно-временных представлений различных объектов выборки значительно различался в силу вариации различных параметров видеосъемки (различия в освещении, в оттенке кожи испытуемого и т.п.). Амплитудно-энергетические признаки были подвергнуты лог-нормализации, после чего выполнялась их робастная нормализация по формуле (21), затем была произведена нормировка к отрезку где
Учитывая, что артериальное давление человека является изменяющимся во времени физиологическим параметром, целесообразно использовать для его оценки нейросететвые архитектуры, ориентированные на анализ и обработку последовательностей. В настоящей работе предложена гибридная нейросетевая архитектура, сочетающая в себе одномерную сверточную нейронную сеть и рекуррентную нейронную сеть типа LSTM (англ. Long Short-Term Memory). Одномерные сверточные нейронные сети, применяемые к временной последовательности признаков, эффективно выделяют локальные устойчивые шаблоны и подавляют кратковременные шумы за счёт свёрточной фильтрации и инвариантности к сдвигу, однако имеют ограниченную способность моделировать зависимости на больших временных интервалах без существенного увеличения глубины сети или размера рецептивного поля. Рекуррентные сети типа LSTM, напротив, ориентированы на учёт долгосрочных временных зависимостей и могут интегрировать информацию по всей длительности записи, но при прямой подаче высокоразмерных и зашумлённых признаков склонны к переобучению и хуже справляются с локальными артефактами, поскольку вынуждены одновременно решать задачи фильтрации и моделирования динамики [15, 16]. В связи с этим в настоящей работе предлагается гибридная нейросетевая каскадная архитектура, сочетающая в себе одномерную сверточную нейронную сеть как экстрактор признаков и сеть LSTM как модуль моделирование долговременной динамики и агрегирование информации на уровне всей записи. Экстрактор признаков выполняет подавление шумов и формирует компактное и устойчивое представление последовательности, подаваемое на вход сети LSTM. На вход сети подаётся трёхмерный тензор, который последовательно обрабатывается двумя одномерными свёрточными слоями с ядром размера 5 и функцией активации ReLU, причём между свёртками в целях регуляризации имеется слой Dropout (слой отсева) с вероятностью 0.2. Выход второго сверточного слоя подаётся на вход LSTM-слою со скрытой размерностью 128; из выходной последовательности LSTM извлекается скрытое состояние последнего временного шага, которое после применения Dropout с вероятностью 0.2 проходит через полновязный линейный слой, формирующий итоговый выход размерности Рис. 4. Архитектура предложенной нейронной сети (рисунок авторов) Ввиду несбалансированности распределения целевых переменных применялась техника «oversampling», то есть обучение проводилось с применением стратегии взвешенной функции потерь Хубера. Веса для функции потерь вычислялись на основе гистограммного распределения САД в обучающей выборке с шириной бина 10 мм рт.ст. и параметром где
Модель обучалась в течение 40 эпох с использованием оптимизатора AdamW. Подбор значений гиперпараметров обучения производился посредством стохастического байесовского поиска по пространству гиперпараметров с механизмом прерывания неэффективных сеансов обучения. Качество модели оценивалось по средней абсолютной ошибке (англ. MAE) и среднеквадратичной ошибке (англ. RMSE) для САД и ДАД отдельно. Отбор лучшей модели осуществлялся на основе минимальной суммы RMSE по САД и ДАД на валидационной выборке с сохранением весов модели. Результаты исследования. Обработка данных и проведение вычислительных экспериментов производились на языке программирования Python. В ходе проведенной фильтрации данных были удалены 93 объекта набора данных (около 4% всего набора) по различным причинам: недостаточная длительность видео, отсутствие необходимой информации об испытуемом и его АД и т.д. Из имевшегося набора данных были удалены объекты с редкими значениями АД (менее 15 объектов на бин гистограммы распределения САД). Фильтрация именно по уровню САД объясняется его большей дисперсией. Разбиение на обучающую, валидационную и тестовую выборки осуществлялось стратифицировано по пациентам для исключения утечки информации между выборками. На рисунке 5 представлен пример тепловой карты модулей коэффициентов частотно-временного представления (амплитудная скалограмма), полученный для зеленой цветовой компоненты. На тепловой карте прослеживаются горизонтальные полосы, соответствующие колебаниям кровотока человека, принадлежащим определенным частотным диапазонам [17]. Рис. 5. Амплитудная скалограмма Для обученной гибридной нейросетевой модели были получены представленные в таблице 2 значения метрик, достигнутые на тестовой выборке. Таблица 2. Значения метрик, достигнутые на тестовой выборке
Обсуждение. Разработанная гибридная нейросетевая модель оценки уровня АД по видеоданным показала результаты, сопоставимые с результатами зарубежных исследований по сравниваемым метрикам, хотя качество оказалось несколько хуже рассмотренных работ. Однако при этом необходимо отметить, что в настоящей работе использовался наиболее репрезентативный набор данных (более 2000 валидных объектов), что существенно больше аналогичного показателя в прочих исследованиях. Согласно общепринятым нормам, для клинического применения устройства измерения уровня АД необходимо, чтобы данное устройство давало погрешность не более 5 мм рт.ст. Разработанная в рамках настоящего исследования гибридная нейросетевая модель не удовлетворяет данному требованию. Кроме того, в процессе ее опытного применения были выявлены случаи, когда модель давала существенно заниженные или завышенные значения АД, особенно в случаях, когда истинное значение АД у испытуемого оказывалось существенно повышенным или пониженным. Мы связываем это с недостаточной репрезентативностью данных исследуемого набора, соответствующих существенным отклонениям уровня АД. Заключение. В данной работе предложены метод формирования признакового пространства и гибридная нейросетевая модель оценки уровня АД по видеоданным, сочетающая в себе одномерную сверточную нейронную сеть и рекуррентную нейронную сеть типа LSTM. Предложенный метод формирования признакового пространства существенно уменьшает размерность данных, что способствует ускорению их обработки и повышению скорости обучения нейронных сетей. С учетом нестационарной природы кровотока кожи лица был выбран частотно-временной анализ, основанный на НВП для получения частотно-временных образов данных ВПГ. Полученные значения метрик сопоставимы с результатами зарубежных исследований, хотя и несколько им проигрывают. Опытное применение показывает, что в ряде случаев модель дает заведомо ошибочные оценки, в силу чего не является пригодной для клинической практики. Авторы считают, что важным является сбор данных, соответствующих значениям АД, существенно отклоняющихся от нормальных. Дополнительно авторам хотелось бы отметить тот факт, что предложенные в рамках данного исследования решения имеют свои ограничения. Прежде всего, необходимо отметить, что сбор данных выполнялся в лабораторных условиях (поддерживался стабильный уровень освещенности, камера располагалась на крепко закрепленном штативе). Необходимо дополнительное исследование влияния переменного освещения и случайных движений лица человека или камеры на качество результатов. Кроме того, важным фактором являются характеристики камеры и ее частота дискретизации. В дальнейшем авторы планируют исследовать эти вопросы. Однако мы считаем, что разработанное решение после ряда доработок может успешно и широко применяться в профилактических целях как ранний предиктор артериальной гипертензии. ФИНАНСИРОВАНИЕ / FINANCING Работа выполнена в рамках государственного задания Минздрава России № 124013100904-7. / The work was carried out within the framework of the state assignment of the Ministry of Health of Russia № 124013100904-7.
Статья публикуется в одобренном рецензентами варианте (после получения последней положительной рецензии, рекомендующей рукопись к публикации) с исправлениями автора (внесенными им после получения предварительных рецензий, рекомендующих рукопись к доработке).
Все рецензии (включая предварительные рецензии) опубликованы в открытом доступе непосредственно за текстом самой статьи. Все варианты авторских исправлений хранятся в депозитарии издательства и могут быть доступны по требованию уполномоченных организаций. Библиография
1. Fedorovich A.A., Drapkina O.M., Pronko K.N., Sinopalnikov V.I., Zemskov V.M. Telemonitoring of capillary blood flow in the human skin: new opportunities and prospects // Clinical Practice. 2018. Vol. 15. Pp. 561-567. EDN: URFZWW.
2. Kawasaki S. et al. Performance evaluation of blood pressure estimation using an RGB-NIR camera // Artif Life Robotics. 2025. Vol. 30. Pp. 484-492. DOI: 10.1007/s10015-025-01015-3. EDN: KGCVZU. 3. Chen Y., Zhuang J., Li B., Zhang Y., Zheng X. Remote blood pressure estimation via the spatiotemporal mapping of facial videos // Sensors. 2023. Vol. 23, No. 6. Article ID 2963. DOI: 10.3390/s23062963. EDN: NYHENE. 4. Curran T. et al. Estimating Blood Pressure with a Camera: An Exploratory Study of Ambulatory Patients with Cardiovascular Disease // arXiv preprint. 2025. Article ID 2503.00890v1. URL: https://arxiv.org/pdf/2503.00890 (дата обращения: 02.04.2026). 5. Tan S. et al. Remote Photoplethysmography Technology for Blood Pressure and Hemoglobin Level Assessment in the Preoperative Assessment Setting: Algorithm Development Study // JMIR Formative Research. 2025. Vol. 9. Article ID e60455. URL: https://formative.jmir.org/2025/1/e60455 (дата обращения: 02.04.2026). 6. Kim S., Lim H., Baek J., Lee E.C. RGB Camera-Based Blood Pressure Measurement Using U-NetBasic Generative Model // Electronics. 2023. Vol. 12, No. 18. Article ID 3771. DOI: 10.3390/electronics12183771. EDN: BLGRMB. 7. Wu W., Peng H., Yu S. YuNet: a tiny millisecond-level face detector // Machine Intelligence Research. 2023. Vol. 20. Pp. 345-356. DOI: 10.1007/s11633-023-1423-y. EDN: VGASUI. 8. Fallet S., Moser V., Braun F., Vesin J.-M. Imaging photoplethysmography: What are the best locations on the face to estimate heart rate? // 2016 Computing in Cardiology Conference (CinC). Vancouver, BC, Canada, 2016. Pp. 341-344. 9. He K., Zhang X., Ren S., Sun J. Deep Residual Learning for Image Recognition // 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas, NV, USA, 2016. Pp. 770-778. DOI: 10.1109/CVPR.2016.90. 10. Wei F.-F., Chi T., Chen X. A Multi-Feature Fusion and Situation Awareness-Based Method for Fatigue Driving Level Determination // Electronics. 2023. Vol. 12, No. 13. Article ID 2884. DOI: 10.3390/electronics12132884. EDN: EOXUQY. 11. Castellano Ontiveros R., Elgendi M., Menon C. A machine learning-based approach for constructing remote photoplethysmogram signals from video cameras // Commun Med. 2024. Vol. 4. Article ID 109. DOI: 10.1038/s43856-024-00519-6. EDN: CQRTKT. 12. Lewandowska M. et al. Measuring pulse rate with a webcam – a noncontact method for evaluating cardiac activity // Proc. Federated Conf. Comput. Sci. Inform. Syst. (FedCSIS). Szczecin, Poland, 2011. Pp. 405-410. 13. Крупаткин А.И. Колебания кровотока – новый диагностический язык в исследовании микроциркуляции // Регионарное кровообращение и микроциркуляция. 2014. Т. 13, № 1(49). С. 83-99. EDN: SAHYCN. 14. Torrence C., Compo G.P. A practical guide to wavelet analysis // Bulletin of the American Meteorological Society. 1998. Vol. 79, No. 1. Pp. 61-78. DOI: 10.1175/1520-0477(1998)0792.0.CO;2. EDN: LPIQSL. 15. Димитриченко Д.П. Оптимизация рекуррентной нейронной сети при помощи автоматов с переменной структурой // Программные системы и вычислительные методы. 2023. № 4. С. 30-43. DOI: 10.7256/2454-0714.2023.4.69011 EDN: FEIPTC URL: https://nbpublish.com/library_read_article.php?id=69011 16. Ismail Fawaz H., Forestier G., Weber J. et al. Deep learning for time series classification: a review // Data Mining and Knowledge Discovery. 2019. Vol. 33, No. 4. Pp. 917-963. DOI: 10.1007/s10618-019-00619-1. EDN: ZNBHAE. 17. Челышев Э.А., Раскатова М.В. Методы и алгоритмы машинного обучения в задаче оценки уровня артериального давления // Вестник Воронежского государственного технического университета. 2026. Т. 22, № 1. С. 63-68. DOI: 10.36622/1729-6501.2026.22.1.009. EDN: CBLENK.
References
1
. Fedorovich, A. A., Drapkina, O. M., Pronko, K. N., Sinopalnikov, V. I., & Zemskov, V. M. (2018). Telemonitoring of capillary blood flow in the human skin: New opportunities and prospects. Clinical Practice, 15, 561-567. EDN: URFZWW.
2 . Kawasaki, S., et al. (2025). Performance evaluation of blood pressure estimation using an RGB-NIR camera. Artificial Life and Robotics, 30, 484-492. https://doi.org/10.1007/s10015-025-01015-3. EDN: KGCVZU. 3 . Chen, Y., Zhuang, J., Li, B., Zhang, Y., & Zheng, X. (2023). Remote blood pressure estimation via the spatiotemporal mapping of facial videos. Sensors, 23(6), Article ID 2963. https://doi.org/10.3390/s23062963. EDN: NYHENE. 4 . Curran, T., et al. (2025). Estimating blood pressure with a camera: An exploratory study of ambulatory patients with cardiovascular disease. arXiv Preprint. Article ID 2503.00890v1. Retrieved April 2, 2026, from https://arxiv.org/pdf/2503.00890. 5 . Tan, S., et al. (2025). Remote photoplethysmography technology for blood pressure and hemoglobin level assessment in the preoperative assessment setting: Algorithm development study. JMIR Formative Research, 9, Article ID e60455. Retrieved April 2, 2026, from https://formative.jmir.org/2025/1/e60455. 6 . Kim, S., Lim, H., Baek, J., & Lee, E. C. (2023). RGB camera-based blood pressure measurement using U-NetBasic generative model. Electronics, 12(18), Article ID 3771. https://doi.org/10.3390/electronics12183771. EDN: BLGRMB. 7 . Wu, W., Peng, H., & Yu, S. (2023). YuNet: A tiny millisecond-level face detector. Machine Intelligence Research, 20, 345-356. https://doi.org/10.1007/s11633-023-1423-y. EDN: VGASUI. 8 . Fallet, S., Moser, V., Braun, F., & Vesin, J.-M. (2016). Imaging photoplethysmography: What are the best locations on the face to estimate heart rate? In 2016 Computing in Cardiology Conference (CinC) (pp. 341-344). Vancouver, BC, Canada. 9 . He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep residual learning for image recognition. In 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) (pp. 770-778). Las Vegas, NV, USA. https://doi.org/10.1109/CVPR.2016.90. 10 . Wei, F.-F., Chi, T., & Chen, X. (2023). A multi-feature fusion and situation awareness-based method for fatigue driving level determination. Electronics, 12(13), Article ID 2884. https://doi.org/10.3390/electronics12132884. EDN: EOXUQY. 11 . Castellano Ontiveros, R., Elgendi, M., & Menon, C. (2024). A machine learning-based approach for constructing remote photoplethysmogram signals from video cameras. Communications Medicine, 4, Article ID 109. https://doi.org/10.1038/s43856-024-00519-6. EDN: CQRTKT. 12 . Lewandowska, M., et al. (2011). Measuring pulse rate with a webcam-a noncontact method for evaluating cardiac activity. In Proceedings of the Federated Conference on Computer Science and Information Systems (FedCSIS) (pp. 405-410). Szczecin, Poland. 13 . Krupatkin, A. I. (2014). Fluctuations of blood flow-a new diagnostic language in the study of microcirculation. Regional Blood Circulation and Microcirculation, 13(1), 83-99. EDN: SAHYCN. 14 . Torrence, C., & Compo, G. P. (1998). A practical guide to wavelet analysis. Bulletin of the American Meteorological Society, 79(1), 61-78. https://doi.org/10.1175/1520-0477(1998)0792.0.CO;2. EDN: LPIQSL. 15 . Dimitrichenko, D.P. (2023). Optimization of a recurrent neural network using automata with a variable structure. Software systems and computational methods, 4, 30-43. https://doi.org/10.7256/2454-0714.2023.4.69011 16 . Ismail Fawaz, H., Forestier, G., Weber, J., et al. (2019). Deep learning for time series classification: A review. Data Mining and Knowledge Discovery, 33(4), 917-963. https://doi.org/10.1007/s10618-019-00619-1. EDN: ZNBHAE. 17 . Chelyshev, E. A., & Raskatova, M. V. (2026). Methods and algorithms of machine learning in the task of assessing arterial pressure levels. Bulletin of Voronezh State Technical University, 22(1), 63-68. https://doi.org/10.36622/1729-6501.2026.22.1.009. EDN: CBLENK.
Результаты процедуры рецензирования статьи
Рецензия выполнена специалистами Национального Института Научного Рецензирования по заказу ООО "НБ-Медиа". Предмет исследования – уровень АД с оценкой по видеоданным плетизмографии с помощью гибридной искусственной нейронной сети, сочетающей в себе ResNet18 и двунаправленную LSTM-сеть. Представляют интерес используемые для решения задачи оценки артериального давления математические методы обработки данных использования видеокамер совместно с компьютерной техникой. Предложенная автором методология использует гибридную нейросетевую модель. Объединяет свёрточную нейронную сеть (CNN) в качестве экстрактора признаков, выполняющего подавление шумов и формирующего компактное и устойчивое представление последовательности, подаваемое на вход сети LSTM, и рекуррентную сеть. Используется также метод формирования признакового пространства на основе частотно временного анализа. Задача измерения АД крайне актуальна как для больных, так и для здоровых людей. Имеет массового пользователя. Технологии бесконтактной оценки физиологических параметров открывают новые возможности для безопасного и удобного дистанционного мониторинга состояния пациентов на дому. Актуальное внимание в статье уделено подбору, описанию и обоснованию избавления полезной информации от шума. Это беда многих систем измерения. Особенно в медицине с нарушением патологией всех законов и правил. Здесь представленные исследования имеют несомненную методическую ценность. Всё же неаккуратное включение математических выражений из старых сервисов должно быть обязательно исправлено. Большинство математических выражений приводятся без описания их смысла. Например, «В результате были получены частотно-временные представления для каждого из 4 сегментов региона интереса …», дается математическое выражение, но без обоснования. Подробное описание смысла преобразований не дано почти для всех математических выражений статьи. Уверен, что описание математических выражений будет полезно всем читателям, тем более физиологам и медикам. Отдельный перечень обозначений в формулах был бы также полезен. То же касается и раздела «Материалы …», который включает в себя видеозаписи лиц 2251 испытуемого, а также, помимо видеозаписей лиц испытуемых, сведения о наличии или отсутствии у испытуемых тех или иных хронических заболеваний, их физиологические параметры, значения АД, измеренные в процессе видеозаписи. Этих данных нет в статье. Хотя АД зависит от их возраста, веса, профессии, физического развития, отношения и участия в исследованиях. Хорошо бы понять, что это в физиологическом плане за люди, как они привлекались к исследованиям. Какова при этом привлечении была роль стимулирования и принуждения. Очень важно учесть такой естественный показатель сердечно-сосудистой системы как пульс (ЧСС). В большинстве домашних и клинических манометрах он присутствует. То же можно сказать и о реанимационных мониторах. Его нужно в перспективе учесть, так как он тесно и сильно влияет на систолическое и диастолическое АД. Время измерения и его длительность также сказываются на АД. Не могу не заметить, что обучение нейросети зависит от направленности на диагностику или на профилактику. Библиография включает 18 источников. Список литературы в целом адекватен. Исследование отличается продуманной методологией и репрезентативным набором данных. Хотя у работы есть ограничения, она вносит вклад в науку и открывает новые возможности для изучения бесконтактного мониторинга АД. Результаты будут полезны специалистам в области медицинской информатики и цифровой диагностики, а также разработчикам алгоритмов машинного обучения. Надеюсь, что замечания будут полезны коллективу исследователей, грубые ошибки, особенно небрежности, будут учтены. И так как это первое исследование по оценке уровня АД по видеоплетизмографии, отличающееся оригинальным использованием гибридной нейросетевой каскадной архитектуры, то я рекомендую статью напечатать в журнале «Программные системы и вычислительные методы». Полный текст рецензии на сайте QR код для проверки
Результаты процедуры повторного рецензирования статьи
Рецензия выполнена специалистами Национального Института Научного Рецензирования по заказу ООО "НБ-Медиа". Авторы в качестве цели работы указывают разработку гибридной нейросетевой модели оценки уровня АД по видеоданным и признакового пространства для нее. В статье представлен достаточно широкий анализ литературных российских и зарубежных источников по теме исследования. Список литературы содержит семнадцать источников, на все источники в тексте имеются ссылки. Стиль и язык изложения материала является научным и доступным для широкого круга читателей. Статья структурирована – в наличии введение, основная часть (материалы и методы; результаты исследования; обсуждение), заключение. Теоретико-методологической основой статьи являются работы таких авторов, например: Челышев Э.А., Раскатова М.В. (Методы и алгоритмы машинного обучения в задаче оценки уровня артериального давления); Димитриченко Д.П. (Оптимизация рекуррентной нейронной сети при помощи автоматов с переменной структурой); Fallet S., Moser V., Braun F., Vesin J.-M. (Imaging photoplethysmography: What are the best locations on the face to estimate heart rate?). В работе рассматривается задача оценки уровня артериального давления по видеоданным с использованием гибридной искусственной нейронной сети, сочетающей в себе ResNet18 и двунаправленную LSTM-сеть. Обработка данных и проведение вычислительных экспериментов производились на языке программирования Python. В ходе проведенной фильтрации данных были удалены 93 объекта набора данных (около 4% всего набора) по различным причинам: недостаточная длительность видео, отсутствие необходимой информации об испытуемом и его артериального давления и т.д. Из имевшегося набора данных были удалены объекты с редкими значениями артериального давления. Разбиение на обучающую, валидационную и тестовую выборки осуществлялось стратифицировано по пациентам для исключения утечки информации между выборками. В работе результаты исследования представлены в виде табличного и графического материала (имеется пять рисунков и две таблицы). Авторами разработана гибридная нейросетевая модель оценки уровня артериального давления по видеоданным, полученные результаты сопоставимы с результатами зарубежных исследований по сравниваемым метрикам, хотя авторы отмечают, что качество оказалось несколько хуже рассмотренных работ. Статья «Признаковое пространство и гибридная нейросетевая модель для оценки уровня артериального давления человека по видеоданным» может быть рекомендована к публикации в журнале «Программные системы и вычислительные методы». Полный текст рецензии на сайте QR код для проверки | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

Рус

