Математическое моделирование и вычислительный эксперимент
Правильная ссылка на статью:
Пестерев Е.В., Клюшин Я.Г.
Моделирование принятия решения на основе анализа многомерных данных
// Кибернетика и программирование.
2016. № 3.
С. 54-65.
DOI: 10.7256/2306-4196.2016.3.18956 URL: https://nbpublish.com/library_read_article.php?id=18956
Аннотация:
Использование методов обработки многомерных данных при принятии решения является неотъемлемой частью систем анализа бизнес-процессов. В предлагаемой работе авторами была поставлена задача анализа многофакторных задач исследования операций при заданном множестве альтернатив. Как следствие, в качестве предмета исследования выбран процесс принятия решения, основанный на анализе многомерных данных, полученных из статистики функционирования рассматриваемых систем. Сформулированную в терминах обработки статистических данных поставленную задачу предлагается исследовать с точки зрения более общего подхода, а именно в терминах теории распознавания образов и хемометрики. В статье предложены методы формирования и обработки статистических данных, которые заключается в формировании многомерной структуры данных с последующей ее обработкой производственной функцией (функцией уверенности). Исходные признаки, образующие обучающуюся выборку, предлагается анализировать с точки зрения принципа доминирующих мотиваций, математически сформулированного в работе как их взаимное влияние как друг на друга, так и на принимаемое решение. Для апробации методов проведена серия численных экспериментов, целью которой было сравнение как составленных алгоритмов, отражающих предложенный подход, с байесовским подходом, так и различных производственных функций между собой. Серия экспериментов заключается в распознавании среднего арифметического нескольких сгенерированных случайных чисел. В результате получены зависимости количества правильных ответов от определяющих параметров (количество объектов, количество признаков, величина обучающей выборки, количество возможных значений каждого признака). Полученные результаты демонстрируют лучшее качество классификации объектов с помощью предложенных методов над классификацией, произведенной с использованием вероятностного подхода. Полученные результаты могут быть использованы в широком спектре задач, не связанных непосредственно с принятием решения, предусматривающих свою постановку в терминах анализа многомерных данных.
Ключевые слова:
поддержка принятия решений, функция уверенности, производственные функции, статистические данные, многомерные данные, распознавание образов, хемометрика, байесовская вероятность, многофакторные модели, многомерная статистика
Abstract:
Methods of multidimensional data processing in the decision making processes are an essential part of the business-processes analysis. In this research the authors intend to analyze multidimensional operations when numerous alternatives are presented. Thus, the subject of the research is the decision making process based on the analysis of multidimensional data received from the system functioning statistics. The authors suggest to analyze the subject of the research that is proposed in terms of statistical data processing from the point of view of the general approach, in particular, within the framework of the image discrimination theory and chemometrics. The authors of the article offer particular methods for generating and processing statistical data. These methods involve developing a multidimensional data structure followed by processing its production function (certainty function). The authors suggest to analyze oiriginal features constituting selected data from the point of view of the dominating motivation principle that is mathematically demonstrated as the mutual influence between these features as well as on the decision to be made. To verify the methods, the authors have performed a number of numerical experiments aimed at both comparing developed algorithms reflecing the authors' approach with Bayesian approach and comparing different production functions. A number of experiments intend to find out the arithmetical mean of several generated random numbers. As a result, the authors have proved the dependence of the number of correct responses on constitutive parameters (the number of objects, the number of features, the volume of the selected data, the number of possible values for each feature). The results of the research demonstrate the better practice of classifying objects based on the authors' methods compared to the classification based on the probability approach. The results can be used to solve a wide range of tasks that are not directly related to the decision making process but deal with multidimensional data analysis.
Keywords:
multiple-factor models, Bayesian probability, chemometrics, pattern recognition, multidimensional data, statistical data, production function, confidence function, decision support, multivariate statistics