Рус Eng Cn Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Программные системы и вычислительные методы
Правильная ссылка на статью:

Сидоркина И.Г., Шумков Д.С. Кусочно-линейная аппроксимация при решении задач извлечения данных

Аннотация: Прогнозирование является одним из основных вопросов, которые возникают при анализе временных рядов. При этом ставится задача определить будущее поведение временного ряда по его известным прошлым значениям. В данной работе предложен метод для прогнозирования временных рядов, который базируется на идеи выделения базовых паттернов (шаблонов) из исходных данных и позволяет установить внутренние закономерности исследуемого ряда. На сегодняшний момент одним из подходов, в котором ведутся исследования в области прогнозирования временных рядов, является системы Data Mining или “раскопка данных”. Это связано с тем, что классические методы, основанные исключительно на линейных (ARIMA) и нелинейных (GARCH) моделях прогнозирования, не позволяют достичь необходимой точности прогноза. Используя методы, разработанные в рамках данной технологии, можно увеличить эффективность прогнозирования и выявить скрытые закономерности в исследуемых временных рядах.


Ключевые слова:

временной ряд, аппроксимация, кусочно-линейная аппроксимация, прогнозирование, раскопки данных, базовые шаблоны, паттерны, локальные экстремумы.

Abstract: forecasting is one of the main issues in the analysis of the time series. The goal is to determine future behavior of a time sires by its know past values. In this article the author proposes a method of time series prediction based on the idea of allocating basic patters (templates) from the input data allowing to define the internal rules of the studied series. Currently on of the approaches in the field of time series prediction is the Data Mining (or “data excavation”) system. This is due to the fact that classical methods, based only on the linear (ARIMA) and non-linear (GARCH) models of prediction can’t provide the required accuracy. Usage of the methods developed with this technology makes it possible to increase the performance of prediction and reveal hidden patterns in the studied time series.


Keywords:

Software, time series, approximation, piecewise-linear approximation, forecasting, data excavation, basic patterns, patterns, local extremes, algorithm.


Эта статья может быть бесплатно загружена в формате PDF для чтения. Обращаем ваше внимание на необходимость соблюдения авторских прав, указания библиографической ссылки на статью при цитировании.

Скачать статью

Библиография
1. Last M., Kandle A, Bunke H. Data Mining in Time Series Databases. Series in Machine Perception and Artificial Intelligence. Vol. 57. — World Scientific, 2004. — 205 p.
2. Witten, I.H. (Ian H.) Data mining: practical machine learning tools and techniques / Ian H. Witten, Eibe Frank. — 2nd ed. — Elsevier, 2005. — 558 p.
3. Keogh, E.J., Chakrabarti, K., Mehrotra, S., and Pazzani, M.J. (2001a). Locally Adaptive Dimensionality Reduction for Indexing Large Time Series Databases. Proc. 2001 ACM SIGMOD Conf. on Management of Data. pp. 151–162.
4. Kim, S., Park, S., and Chu, W.W. (2001). An Index-Based Approach for Similarity Search Supporting Time Warping in Large Sequence Databases. Proc. 17th Int. Conf. on Data Engineering (ICDE). pp. 607–614.
5. Дюк В. Data Mining: учебный курс (+ CD). — СПб: Питер, 2001. — 386 с.
6. Лебедев Е.К. Вычисление вероятностей переходов для цепей Маркова, аппроксимирующих сигна-лы в фазовых системах / Е.К. Лебедев, Н.А. Галанина, Н.Н. Иванова // Вестник Чувашского универ-ситета. — 2001. — № 3. — С. 89-100
References
1. Last M., Kandle A, Bunke H. Data Mining in Time Series Databases. Series in Machine Perception and Artificial Intelligence. Vol. 57. — World Scientific, 2004. — 205 p.
2. Witten, I.H. (Ian H.) Data mining: practical machine learning tools and techniques / Ian H. Witten, Eibe Frank. — 2nd ed. — Elsevier, 2005. — 558 p.
3. Keogh, E.J., Chakrabarti, K., Mehrotra, S., and Pazzani, M.J. (2001a). Locally Adaptive Dimensionality Reduction for Indexing Large Time Series Databases. Proc. 2001 ACM SIGMOD Conf. on Management of Data. pp. 151–162.
4. Kim, S., Park, S., and Chu, W.W. (2001). An Index-Based Approach for Similarity Search Supporting Time Warping in Large Sequence Databases. Proc. 17th Int. Conf. on Data Engineering (ICDE). pp. 607–614.
5. Dyuk V. Data Mining: uchebnyy kurs (+ CD). — SPb: Piter, 2001. — 386 s.
6. Lebedev E.K. Vychislenie veroyatnostey perekhodov dlya tsepey Markova, approksimiruyushchikh signa-ly v fazovykh sistemakh / E.K. Lebedev, N.A. Galanina, N.N. Ivanova // Vestnik Chuvashskogo univer-siteta. — 2001. — № 3. — S. 89-100