Читать статью 'Методика нормализации алфавита поиска для повышения качества идентификации сущностей по частотным характеристикам их данных' в журнале Программные системы и вычислительные методы на сайте nbpublish.com
Рус Eng Cn Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Мальшаков Г.В., Мальшаков В.Д. Методика нормализации алфавита поиска для повышения качества идентификации сущностей по частотным характеристикам их данных

Опубликовано в журнале "Программные системы и вычислительные методы" в № 4 за 2015 год в рубрике "Математическое и программное обеспечение новых информационных технологий" на страницах 407-413.

Аннотация: Используя частотные распределения данных как их «идентификатор», возможно обнаружить данные одной системы в других предназначенных для взаимодействия системах, тем самым согласовав их работу. В этом случае идентификация сущностей предметной области происходит с помощью алфавита поиска - набора лексем с частотами их использования в данных сущности, располагающихся в записях реляционной базы данных прикладного программного обеспечения. Предметом исследования является методика нормализации алфавита поиска для повышения качества идентификации сущностей предметной области по частотным характеристикам их данных, заключающийся в удалении лексем алфавита входящих в другие лексемы алфавита с аналогичной частотой повтора в данных сущности. В качестве методов исследования использовались системный анализ, теория информации, теория алгоритмов, алгебра логики, теория множеств, сравнительный анализ, методы интеллектуального анализа данных и методы разработки программного обеспечения и баз данных. Экспериментально (на примере 178 сущностей) доказано, что данная методика позволяет в среднем в 5 раз уменьшить объём алфавита поиска, что значительно повышает быстродействие идентификации сущностей по частотным характеристикам их данных. Благодаря уменьшению количества более коротких лексем методика нормализации позволяет уменьшить ошибку распознавания, как показали эксперименты в среднем на 0.02036 на каждую идентификацию.

Ключевые слова: нормализация, алфавит, поиск, сущность, частотный анализ данных, корреляция, база данных, программное обеспечение, идентификация, методика

DOI: 10.7256/2305-6061.2015.4.17813

Эта статья может быть бесплатно загружена в формате PDF для чтения. Обращаем ваше внимание на необходимость соблюдения авторских прав, указания библиографической ссылки на статью при цитировании.

Скачать статью

Библиография:
Мальшаков Г.В. Методика повышения интероперабельности прикладного программного обеспечения на основе частотного анализа данных // Электротехнические комплексы и системы управления.-2015.-№ 3.-С. 67-70.
Мальшаков Г.В. Исследование ошибок идентификации сущностей прикладного программного обеспечения, выполняемой на основе частотного анализа данных // Наукоёмкие технологии.-2015.-№ 10.-С. 24-28
ГОСТ Р 55062-2012 “Информационные технологии. Системы промышленной автоматизации и их интеграция. Интероперабельность. Основные положения”
Башмаков А.И., Башмаков И.А. Интеллектуальные информационные технологии: Учеб. Пособие. – М.: Изд-во МГТУ им. Н.Э. Баумана, 2005. – 304 с.
Хомоненко А. Д., Цыганков В. М., Мальцев М. Г. Базы данных: Учебник для высших учебных заведений / Под ред. проф. А. Д. Хомоненко.-6-е изд., доп.-СПб.: КОРОНА-Век, 2009.-736 с.
Системы управления базами данных и знаний: Справ. изд. / А.Н.Наумов, А.М.Вендров, В.К.Иванов и др.; Под. ред. А.Н.Наумова. – М.: Финансы и статистика, 1991. – 352 c.: ил.

Правильная ссылка на статью:
просто выделите текст ссылки и скопируйте в буфер обмена