Рус Eng Cn Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Тренды и управление
Правильная ссылка на статью:

Большие данные в практике управления современным государством

Косоруков Артем Андреевич

кандидат политических наук

старший преподаватель, факультет государственного управления, Московский государственный университет имени М.В. Ломоносова

119992, Россия, г. Москва, Ломоносовский проспект, 27, корп. 4, ауд. А814

Kosorukov Artem Andreevich

PhD in Politics

Senior Educator, the faculty of Public Administration, the department of Political Analysis, M. V. Lomonosov Moscow State University

119992, Russia, g. Moscow, Lomonosovskii prospekt, 27k4, aud. A814

kosorukovmsu@mail.ru
Другие публикации этого автора
 

 
Кшеменецкая Мария Николаевна

аспирант, кафедра государственной политики, факультет политологии, Московский государственный университет имени М.В. Ломоносова

119991, Россия, г. Москва, ул. Ломоносовский Проспект, 27, корп. 4

Kshemenetskaya Mariya Nikolaevna

Post-graduate student, the department of State Policy, M. V. Lomonosov Moscow State University

119991, Russia, g. Moscow, ul. Lomonosovskii Prospekt, 27, korp. 4

askmaria135@gmail.com

DOI:

10.7256/2454-0730.2019.1.23359

Дата направления статьи в редакцию:

18-06-2017


Дата публикации:

22-03-2019


Аннотация: Предметом исследования в статье выступают большие данные как совокупность современных способов работы с объемными информационными массивами, формирующимися в различных сферах общественной жизни - от сферы безопасности до сферы онлайн-образования и здравоохранения. Автором подробно рассмотрены прикладные особенности больших данных, представленные в отчетах и докладах консалтинговых компаний McKinsey и Gartner, рейтинге доступности данных Open Data Barometer, а также в российской практике государственного регулирования персональных данных. Важным аспектом предмета исследования является интеграция наборов больших данных на стыке беспроводных сетей, облачных вычислений и межмашинного взаимодействия, способствующих совершенствованию практики управления современным государством, на примере «умного города» позволяющих улучшить качество работы городских служб и способствовать более рациональному использованию ресурсов. Методология исследования включает в себя применение исторического и аналитического методов, метода анализа документов, а также прогностического метода. Новизна исследования заключается в том, что автором на основе широкого круга эмпирических источников исследованы инновационные способы применения больших данных в практике управления государством, включая сферу безопасности и защиты от чрезвычайных ситуаций, образования и здравоохранения, сферу транспорта и финансово-бюджетную сферу.


Ключевые слова:

большие данные, умный город, персональные данные, геопространственные данные, облачные вычисления, Интернет вещей, мобильные датчики, этика данных, краудсорсинг, эффективность государства

Abstract: The subject of this research is the big data as a combination of modern techniques of working with the extensive database forming in various spheres of social life – from security to online education and healthcare. The authors carefully examine the applied peculiarities of big data presented in the reports of consulting companies McKinsey and Gartner, data accessibility ranking Open Data Barometer, as well as the Russian practice of government regulation of personal data. An essential aspect of the subject of research is the integration of big data sets at the interface of wireless networks, cloud computing, M2M communication, which contribute to improving practice governing a modern state, increase efficiency of city services on the example of “smart city”, as well as promote more rational resource management. The scientific novelty is defined by the fact that using a wide variety of empirical sources, the authors examine the innovative techniques of big data implementation with regards to state governing, including the sphere of security, protection from emergency situations, education, healthcare, transportation, as well as financial and budgetary sphere.


Keywords:

big data, smart city, personal data, geospatial data, cloud computing, Internet of things, mobile sensors, data ethics, crowdsourcing, government efficiency

Большие данные (англ. big data) – представляют собой концептуальный подход и совокупность методов работы с информационными массивами различной степени статистической обработки и структурированности, которые дают возможность на основе функционирования многочисленных узлов компьютерной сети моделировать процесс принятия решений на различных уровнях управления – от операционного до стратегического, повышая эффективность управленческих решений политико-административного, корпоративного и общественного секторов, направленных на реализацию общественно значимых социально-политических и экономических инициатив. К важнейшим характеристикам больших данных можно отнести скорость их образования, под которой понимаются потоковые данные, например, переход от периодического сбора данных в ходе переписи населения к сбору и анализу данных в режиме реального времени. Разнообразие выступает не менее значимой характеристикой больших данных, связанной с тем, что большие данные представляют собой слабоструктурированные данные, поступающими в различных цифровых форматах с различных датчиков и мобильных устройств. Третьей характеристикой больших данных является степень их достоверности, которая отражает неопределенность в отношении содержания данных и их качества.

Возникновение понятия «большие данные» связывают с отчетом исследовательского подразделения компании McKinsey 2011 года, в котором была описана проблема появления больших наборов данных, полноценный сбор и анализ которых стал возможен только на базе новых технических и программных элементов распределенных систем обработки данных. В данном отчете большие данные были определены как «наборы данных, размер которых превышает возможности стандартных программных средств по их сбору, хранению, управлению и анализу» [1, p. 1]. Однако сам термин был впервые упомянут двумя учеными НАСА еще в 1997 году [2]: Кокс и Элсворт описали проблему, с которой они столкнулись, попытавшись визуализировать в удобном для зрительного восприятия виде большие данные: наборы преимущественно числовых данных оказались слишком большими, чтобы хранить их на стандартных жестких дисках или даже на удаленных дисках, а тем более подвергать их необходимой вычислительной обработке. Таким образом, исследователи изначально столкнулись с невозможностью оценить истинный масштаб данных и оперировать ими для получения практически полезного результата.

Мерв Адриан из исследовательской и консалтинговой компании Gartner в своем определении больших данных делает акцент на значительном объеме, высокой скорости создания и преимущественно слабо структурированном характере содержащейся в них информации: большие данные - это объемные информационные активы, которые требуют инновационных и рентабельных форм обработки информации для более эффективного принятия решений, в том числе, специальных технологий и аналитических методов для преобразования данных в стоимость на рынке информационных продуктов [3]. Объективной основой этого процесса выступает качественный переход в распространении сети Интернет за последние 10-15 лет (если в 2005 г. только 18,4% домашних хозяйств в мире имели доступ к сети Интернет, то в 2016 г. – 52,3%) [4]. В эти годы также наблюдался экспоненциальный рост объема произведенной человечеством цифровой информации, охватывающей практически все сферы общественной жизни. В частности, происходило увеличение объема больших данных как следствие роста: 1) числа цифровых устройств, позволяющих выстраивать соединения типа «машина-машина», 2) скорости передачи данных по широкополосным каналам связи, 3) количества Wi-Fi-соединений и др. В результате, мировой доход на рынке технического и программного обеспечения в сфере бизнес-аналитики и работы с большими данными в 2017 году достиг 150,8 млрд. долларов, на 12,4% превысив показатели 2016 года (при этом до 2020 года среднегодовой темп роста составит в среднем 11,9%) [5].

На современном этапе большие данные формируются на основе все большего количества активных и пассивных источников, включая клики в сети Интернет, мобильные звонки и SMS, пользовательский контент и социальные сети, а также бизнес-транзакции. Машинное обучение на основе анализа больших данных позволяет исследователям в автоматическом режиме собирать либо новые типы данных, например, данные из социальных сетей, либо огромное количество традиционных данных с меньшими издержками, в частности, распознавать и оцифровывать текстовые, видео- и аудиоматериалы. Кроме того, растущая способность инноваций, в частности, в сфере машинного обучения, производить, собирать, хранить и анализировать огромные объемы данных, позволит пересмотреть на новой технологической основе содержание каждого из этапов принятия государственных решений, в частности, определения управленческих проблем на подготовительном этапе, разработки, реализации и имплементации (продвижения) целей на последующих этапах, а также оценки достигнутых результатов на завершающем этапе [6, с. 282].

При этом ключевой ценностью больших данных в сфере государственного управления является публикация и доступность наборов открытых данных, которые публикуются государственными органами всех уровней на соответствующих электронных ресурсах (например, на Портале открытых данных РФ [7]). Согласно рейтингу доступности ключевых наборов открытых данных, необходимых для граждан и ведения бизнеса - Open Data Barometer, в 2016 году Россия поднялась на 25 место в мире, уступив таким странам как Великобритания (1 место), Канада (2 место), Франция (3 место), США (4 место), Южная Корея (5 место), Бразилия (18 место), однако продемонстрировала более высокие показатели, чем у большинства стран БРИКС: Индия (33 место), ЮАР (46 место) и Китай (71 место). Прогресс, который позволил России улучшить свои позиции и подняться с 41 места в 2015 году, касался в основном публикации наборов по криминальной статистике, государственным закупкам, юридическим лицам, экологической обстановке и результатах выборов всех уровней. Однако, в России сохраняется определенный дефицит в сфере публикации наборов открытых данных по недвижимости, расходам федерального и регионального бюджетов, социальному и экономическому эффекту от раскрытия государственных данных.

Ценность сознания больших данных заключается в комбинировании традиционных открытых данных государственных органов с геопространственными данными, такими как спутниковые данные в реальном времени, GPS-данные от операторов сотовой связи, данные об экономических транзакциях, данные Интернет-браузеров и приложений, включая социальные сети, отслеживающие географию пользователей. Наборы больших данных создаются в нескольких формах: текстовые сообщения, изображения, аудио и видео-файлы, показания носимой электроники, сигналы GPS от сотовых телефонов, онлайн-транзакции, пассивные данные от зданий, транспортных средств или видеокамер, установленных на улицах. Такие данные можно комбинировать с данными, собираемыми государством, например, открытыми данными, данными по экстренным вызовам 911, финансово-кредитным историям работников и хозяйствующих субъектов. В результате исследователи получают возможность с помощью применения того или иного метода или алгоритма структурирования больших данных сопоставлять их с имеющимися открытыми правительственными данными и получать прирост информации относительно той или иной социально значимой проблемы, а также находить более оптимальные пути ее решения.

«Океан» больших данных, формирующийся в режиме реального времени на стыке беспроводных сетей, облачных вычислений, технологий межмашинного взаимодействия, современных Интернет-протоколов IPv4 и IPv6, и программно-конфигурируемых сетей, позволяющих объединять информационные потоки, исходящие от многочисленных датчиков и устройств, собирающих данные о транспортных потоках, экологической обстановке, энергетике, здравоохранении и др., в перспективе даст возможность создания пошаговой картины взаимодействия индивидов, коммерческих и общественных организаций, государственных институтов в течение длительного периода времени, предоставляя возможность анализа как структуры, так и о содержания данных взаимодействий.

Осознавая ценность многочисленных наборов больших данных для системы государственного управления, государства стремятся контролировать процессы их сборы, хранения и практического применения. Так, в Российской Федерации уже действуют поправки в 242-ФЗ, согласно которым все персональные данные о российских гражданах, которые входят в наборы больших данных, должны храниться на серверах, размещенных на территории России [8]. Так, если социальная сеть LinkedIn была заблокирована за нарушение закона о персональных данных, то социальная сеть Twitter с первого полугодия 2018 года локализует персональные данные россиян на территории России. В октябре 2016 года Открытое правительство предлагало разработать концепцию развития больших данных в России с целью поддержки соответствующего информационного рынка, однако на сегодняшний момент общий вектор государственных усилий скорее направлен на осуществление контроля над всеми видами данных, позволяющего минимизировать возможные риски использования персональных данных россиян иностранными государствами и корпоративными агентами. При этом главным юридическим механизмом, с помощью которого государство стремится контролировать большие данные, является приравнивание в юридическом отношении понятия «большие данные» к понятию «персональные данные». Однако, это приводит к усилению патерналистского характера государственной информационной политики, не оказывая существенного влияния на ее эффективность и соответствие современным информационным вызовам, что в результате может затруднить развитие российского рынка анализа данных вследствие упущенных проектов, связанных с международной кооперацией.

Немаловажным представляется этический аспект сбора, хранения и использования больших данных. Несмотря на то, что сторонники больших данных в государственном управлении, промышленности и консалтинговых компаниях используют такой термин как революция в области больших данных, делая акцент на позитивных экономических последствиях и финансовой выгоде, ими обычно упускается из виду этическое измерение использования больших данных. Так, государство и крупные корпорации, составляя наборы больших данных из различных источников, получают доступ к персональным данным, делая это без явного согласия граждан или в обход довольно несовершенных законов в данной сфере деятельности. Более того, применяемые технологии анализа больших данных в сфере безопасности, могут допускать ошибки, например, в процессе идентификации преступников или террористов благодаря несовершенству сетевого моделирования криминальных и террористических структур, что в результате приводит к дополнительным проверкам простых граждан или даже применению к ним силовых методов со стороны правоохранительных органов [9].

Немаловажной составляющей этического аспекта выступает использование больших данных в сфере здравоохранения, в рамках которой наборы собираемых данных включают в себя данные, поступающие от приложений для фитнеса или датчиков носимой электроники. Эти данные, описывающие состояние здоровья людей, в сочетании с их онлайн-поведением, включая активность в социальных сетях, данными о покупке медицинских препаратов и медтехники, а также номерами полисов медицинского страхования, позволяют получить представление о потенциальных рисках для здоровья как отдельных индивидов, так и для групп населения. Медицинские страховые компании на основе полученных от сторонних мобильных приложений и Интернет-компаний данных могут проводить более дифференцированную политику, связанную со стоимостью медицинского страхования или объемом страхового покрытия для физических лиц, а также адаптировать свои страховые продукты под наиболее вероятные риски для здоровья населения в том или ином городе или регионе. Государство также может корректировать государственную политику в сфере здравоохранения на основе наборов больших данных, сопоставление и анализ которых позволяет прогнозировать востребованность тех или иных медицинских услуг в зависимости от экологической обстановки в регионе, направлений внешней и внутренней миграции, связанной с распространением тех или иных инфекционных заболеваний.

Технологическому аспекту развития больших данных посвящен значительный объем исследований в данной области знаний. Построение «умного города» на базе Интернета вещей и облачных вычислений могут привести к пересмотру сложившейся практики государственного управления социально-экономическим развитием городов. Благодаря развитию Интернета вещей (онлайн-передача информации через датчики зданий, дорог, автомобилей и людей в облачные хранилища, а также общение датчиков между собой), здания могут автоматически передавать любую информацию, необходимую коммунальным службам для их качественного обслуживания, промышленная инфраструктура может передавать информацию об уровнях загрязнения воды или воздуха, автомобили могут передавать информацию о погодных условиях на дороге. Такие данные об общественной инфраструктуре, собранные благодаря активности самих граждан, либо собранные датчиками пассивно, могут помочь государственным служащим выделять необходимые ресурсы в режиме реального времени, проводить социально-экономический анализ развития города, моделировать общественную мобильность и принимать более выверенные инвестиционные решения. Комбинирование наборов больших данных, собранных из различных источников, способствует реализации концепции «умного города», может значительно улучшить качество и производительность городских служб, практику оказания государственных услуг, рациональное использование энергетических и водных ресурсов, утилизацию городских отходов.

Технологический аспект использования больших данных также можно проанализировать на примере опыта Массачусетского технологического института и Гарвардского университета, создавших в 2012 году платформу массового онлайн-образования edX. Цель состояла в том, чтобы исследовать взаимодействие студентов в сети Интернет в целях определения наиболее удачных педагогических подходов. В результате, были созданы онлайн-курсы с десятками тысяч студентов по всему миру, позволяющих корректировать тот или иной фрагмент лекции или семинара в зависимости от степени усвоения материала студентами (на основе изучения отзывов самих студентов). Более того, платформа позволила определить какие формулировки вопросов и заданий для самостоятельной подготовки вызывают наибольшее непонимание или неверное толкование, а также выявить ошибки, которые чаще всего допускают студенты в ходе усвоения того или иного курса. Платформа работает на основе анализа больших данных, собирая информацию со студенческих форумов, аккаунтов социальных сетей и блогов, позволяя выявить наиболее полезные сообщения для решения тех или иных заданий курса, впоследствии включив данные сообщения в доработанном виде в содержание курса. Анализ больших данных, связанных с активностью студентов в Интернет-пространстве, создает конкурентные преимущества для подобных образовательных проектов, позволяя им выстраивать более эффективную стратегию развития и прогнозировать перспективные направления дальнейшего роста.

В последние годы технологии анализа больших данных все более широко используются в сфере безопасности и борьбы с преступностью во многих странах мира.В 2013 на основе анализа данных социальных сетей и мобильных устройств специальные службы США смогли за несколько дней вычислить и найти подозреваемых в теракте на Бостонском марафоне. В 2017 году в КНР построено уже три центра больших данных и облачных вычислений с целью анализа динамики городской криминогенной обстановки и вычисления актуальных или вероятных угроз безопасности в рамках городской среды [10], в перспективе КНР планирует построить интегрированный национальный центр обработки и хранения больших данных [11]. В настоящее время китайская компания Didi Chuxing, занимающаяся оказанием информационных услуг в сфере транспорта, работает совместно с дорожной полицией 11 китайских городов, помогая местной полиции с помощью анализа данных, собираемых с помощью мобильных телефонов и смартфонов водителей, а также камер безопасности дорожного движения, выявлять нарушителей правил дорожного движения, составляя электронные профили водителей. Также компания разработала систему мониторинга и оптимизации движения транспортных средств в мегаполисах, опираясь не только на регулярный анализ дорожной обстановки, но и на устоявшиеся модели использования транспортного средства тем или иным водителем. Более того, компания занялась разработкой мобильных приложений в сфере безопасности для таксомоторных компаний, которые отвечают за идентификацию и анализ поведения водителей и пассажиров такси [12][13].

Во время чрезвычайных ситуаций сотрудники государственных служб спасения оперируют несколькими потоками больших данных, включая обработку входящих телефонных звонков и GPS-данных мобильных устройств, с которых произведены вызовы из зоны ЧС, что в совокупности позволяет им уточнить географическое положение пострадавших и получить более детальную информацию для эффективного реагирования. Кроме того, может проводиться автоматизированный мониторинг данных наблюдателей на месте ЧС, которые фиксируют и размещают информацию на сайтах социальных сетей, фото и видео-хостингов, что особенно важно для оперативного реагирования, в частности, на природные катастрофы. Распространяемые в Интернет-пространстве данные могут оказаться крайне неточными или ошибочными, поэтому они выступают для служб спасения скорее вспомогательным источником информации. Однако уже разрабатываются приложения для мобильных устройств, позволяющие пользователям во время ЧС осуществлять взаимопомощь и помогать спасателям, передавать информацию о местонахождении и физическом состоянии пострадавших, проводить предварительную медицинскую диагностику, распространять сведения о пунктах медпомощи и др.

Применение больших данных на практике во многом усиливается благодаря вовлечению граждан в процесс решения тех или иных задач государственного управления. Новые технологии, в частности, краудсорсинговые платформы, использующиеся при составлении бюджета и повышении эффективности бюджетных расходов [14], позволяют гражданам индивидуально или на уровне общественной экспертизы подключаться к решению государственных задач. Внедрение больших данных в практику государственного управления способствует построению более эффективной модели государственного управления или соуправления, в рамках которой государство пытается расширить каналы участия граждан, обратить их внимание на положительные практики использования больших данных, формирующихся с использованием персональных данных. Более того, современные технологии передачи данных позволяют государству получать все больший объем потоковых данных, благодаря которым становится возможным производство инновационных разработок в сфере управления транспортом, образованием, здравоохранением, безопасностью и др. (на основе интеграции соответствующих наборов данных). Большие данные становятся важным элементом мониторинга эффективности работы государства и предупреждения о возможных ошибках и отклонениях от поставленных целей, обеспечивают не только аналитическую поддержку принимаемых решений, но и поддерживают работу механизма обратной связи, позволяя обнаруживать проблемы и корректировать ошибки в режиме реального времени.

Библиография
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
References
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.

Результаты процедуры рецензирования статьи

В связи с политикой двойного слепого рецензирования личность рецензента не раскрывается.
Со списком рецензентов издательства можно ознакомиться здесь.

Представленная для рецензирования статья «Большие данные в практике управления современным государством» является проблемно-аналитическим исследованием. Название статьи соответствует ее содержанию. Верно определен предмет исследования, он действительно совпадает с содержанием статьи. Недостаточно серьезным выглядит описание методологии исследования.
В общем и целом структура, стиль и содержание работы соответствуют основным научным требованиям. Статья написана добротным, грамотным научным языком. Библиография оформлена в соответствии с требованиями, цитируются актуальные источники в необходимом объеме. Стиль изложения вполне научен и не нуждается в корректировке. Стиль и язык изложения соответствуют содержанию. Содержательно статья также может быть оценена сугубо положительно.
Работа безусловно является актуальной в научном плане и злободневной - в аналитическом. Научная новизна работы заключается существенном дополнении известных фактов, что дает новую интерпретацию проблеме, а также в дополнении известного, но на других примерах.
К сожалению, автор не избежал неточностей. Например, непонятно, причем здесь вызовы «службы 911», если речь идет не только о США (а в первую очередь, о РФ). На сс. 2 и 3 встречаются опечатки. Указанные недостатки, на наш взгляд, не являются существенными и не влияют на общее положительное впечатление от работы.
Данная статья соответствует научному уровню журнала, представляет несомненный читательский интерес, не требует обязательной авторской доработки. Статью следует публиковать.

20 июня 2017 г. 20 час. 45 мин.