Рус Eng За 365 дней одобрено статей: 1868,   статей на доработке: 312 отклонено статей: 769 
Библиотека
Статьи и журналы | Тарифы | Оплата | Ваш профиль

Мальшаков Г.В., Мальшаков В.Д. Методика нормализации алфавита поиска для повышения качества идентификации сущностей по частотным характеристикам их данных

Опубликовано в журнале "Программные системы и вычислительные методы" в № 4 за 2015 год в рубрике "Математическое и программное обеспечение новых информационных технологий" на страницах 407-413.

Аннотация: Используя частотные распределения данных как их «идентификатор», возможно обнаружить данные одной системы в других предназначенных для взаимодействия системах, тем самым согласовав их работу. В этом случае идентификация сущностей предметной области происходит с помощью алфавита поиска - набора лексем с частотами их использования в данных сущности, располагающихся в записях реляционной базы данных прикладного программного обеспечения. Предметом исследования является методика нормализации алфавита поиска для повышения качества идентификации сущностей предметной области по частотным характеристикам их данных, заключающийся в удалении лексем алфавита входящих в другие лексемы алфавита с аналогичной частотой повтора в данных сущности. В качестве методов исследования использовались системный анализ, теория информации, теория алгоритмов, алгебра логики, теория множеств, сравнительный анализ, методы интеллектуального анализа данных и методы разработки программного обеспечения и баз данных. Экспериментально (на примере 178 сущностей) доказано, что данная методика позволяет в среднем в 5 раз уменьшить объём алфавита поиска, что значительно повышает быстродействие идентификации сущностей по частотным характеристикам их данных. Благодаря уменьшению количества более коротких лексем методика нормализации позволяет уменьшить ошибку распознавания, как показали эксперименты в среднем на 0.02036 на каждую идентификацию.

Ключевые слова: нормализация, алфавит, поиск, сущность, частотный анализ данных, корреляция, база данных, программное обеспечение, идентификация, методика

DOI: 10.7256/2305-6061.2015.4.17813

Эта статья недоступна для пользователей, которые не вошли в цифровую библиотеку издательства под своим логином и паролем. Перейдите по ссылке, чтобы зарегистрироваться или осуществить вход.

Если вы один из авторов этой статьи, вы можете открыть бесплатный доступ к этой статье для своих читателей. Вы должны зайти под своим логином и паролем, чтобы воспользоваться услугой. Перейдите по ссылке, чтобы зарегистрироваться или осуществить вход.

Вы также можете заказать печатный номер журнала с этой статьей.

Библиография:
Мальшаков Г.В. Методика повышения интероперабельности прикладного программного обеспечения на основе частотного анализа данных // Электротехнические комплексы и системы управления.-2015.-№ 3.-С. 67-70.
Мальшаков Г.В. Исследование ошибок идентификации сущностей прикладного программного обеспечения, выполняемой на основе частотного анализа данных // Наукоёмкие технологии.-2015.-№ 10.-С. 24-28
ГОСТ Р 55062-2012 “Информационные технологии. Системы промышленной автоматизации и их интеграция. Интероперабельность. Основные положения”
Башмаков А.И., Башмаков И.А. Интеллектуальные информационные технологии: Учеб. Пособие. – М.: Изд-во МГТУ им. Н.Э. Баумана, 2005. – 304 с.
Хомоненко А. Д., Цыганков В. М., Мальцев М. Г. Базы данных: Учебник для высших учебных заведений / Под ред. проф. А. Д. Хомоненко.-6-е изд., доп.-СПб.: КОРОНА-Век, 2009.-736 с.
Системы управления базами данных и знаний: Справ. изд. / А.Н.Наумов, А.М.Вендров, В.К.Иванов и др.; Под. ред. А.Н.Наумова. – М.: Финансы и статистика, 1991. – 352 c.: ил.

Правильная ссылка на статью:
просто выделите текст ссылки и скопируйте в буфер обмена