Рус Eng Cn Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Программные системы и вычислительные методы
Правильная ссылка на статью:

Бахрушин В.Е. Программная реализация методов анализа нелинейных статистических связей в системе R

Аннотация: Существующие программные средства статистического анализа данных (SPSS, Statistica и др.) обычно предлагают для поиска корреляции лишь методы, пригодные для выявления линейной связи между числовыми данными, а также некоторые показатели связи для ранговых, качественных и смешанных данных. Однако реальная связь между количественными данными часто бывает нелинейной. Это приводит к тому, что имеющиеся средства не позволяют выявлять такие связи и могут приводить к ошибочным выводам об отсутствии корреляции. Универсальным показателем наличия статистической связи между двумя рядами числовых данных является выборочный коэффициент детерминации. Для его определения используют два подхода, один из которых базируется на аппроксимации неизвестной функции связи кусочно-постоянной функцией, а второй - на сглаживании имеющихся данных. В работе предложена программная реализация обоих методов средствами системы R. Достоинством этой системы является возможность использования большого числа специализированных библиотечных функций, предназначенных для статистического анализа, а также написания авторских программ для решения нестандартных задач. Тестирование разработанных приложений на модельных примерах показало их корректную работу и возможность использования для решения прикладных задач нелинейного корреляционного анализа.


Ключевые слова:

Нелинейная связь, Коэффициент детерминации, Программное обеспечение, Язык R, Сглаживание данных, Корреляционное отношение, Коэффициент корреляции Пирсона, Тестирование, Группирование данынх, Кусочно-постоянная функция

Abstract: existing software for data statistical analysis (SPSS, Statistica etc.) usually offer for defining correlations just methods applicable for finding linear relationships in numerical data, along with some relation indicators for rank, qualitative and mixed data. However actual relation between quantitative data is often nonlinear. This leads to the fact that present means do not allow identifying such relations, which can lead to false conclusions about the absence of correlation. An universal indicator of present statistical correlation between two rows of numerical data is sample coefficient of determination. There are two approaches to calculated that coefficient: first is based on the approximation of some unknown function with piecewise constant function, second is based on the smoothing available data. The article proposes software realization for both methods in R system. The advantage of this system is in the availability of a large number of specialized library functions for statistical analysis, as well as in writing programs for non-standard tasks. Testing of the developed application on model examples proved their correctness allowing the use for solving practical problems in nonlinear correlation analysis.


Keywords:

nonlinear relationship, coefficient of determination, software, R programming Language, data smoothing, correlation ratio, Pearson correlation coefficient, testing, data grouping, piecewise constant function


Эта статья может быть бесплатно загружена в формате PDF для чтения. Обращаем ваше внимание на необходимость соблюдения авторских прав, указания библиографической ссылки на статью при цитировании.

Скачать статью

Библиография
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
References
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.