Ключевые слова: электронная почта, интеллектуальная обработка текста, нейросетевой классификатор, векторная модель отображения
ФИЛЬТРАЦИЯ НЕСАНЦИОНИРОВАННЫХ СООБЩЕНИЙ В ПОЧТОВЫХ ЭЛЕКТРОННЫХ СЕРВИСАХ
УДК 519.688
DOI:
В статье предложено решение задачи фильтрации электронной почтовой корреспонденции на основе предварительной интеллектуальной обработки электронных сообщений с использованием нейросетевого классификатора. Обработка электронных сообщений включает в себя автоматическую обработку текста на основе лингвистического подхода. В работе рассмотрена векторная модель отображения признаков электронного сообщения. Предложено в качестве меры значимости термов использовать Ltc-меру взвешивания. Также обоснован комбинированный подход сокращения признакового пространства путем расчета величины характеризующей значимость терма для определенного класса k и формированием коллоката сообщения с использованием показателей силы смысловой (синаптической) связи между качественными признаками (термами) словосочетаний. Обоснованно использование меры тесноты взаимосвязи двух качественных признаков словосочетаний: коэффициенты ассоциации Ка и контингенции Кk. Для решения задачи фильтрации несанкционированных электронных сообщений выбрана адаптивная нейронная сеть АRТ преимуществом которой является способность самообучаться (создавать образы) для адаптации к изменяющимся потребностям адресата корреспонденции исследована и подтверждена эффективность предложенной модели электронного сообщения, интегрированной с методом нейросетевой классификации для интеллектуальной фильтрации электронной корреспонденции.
1. Николаев, И.А. Спам: экономические потери: Аналитический доклад /[Электронный ресурс] (http://www.fbk.ru/news/5419/83743/).
2. Слепов, О. Контентная фильтрация /О. Слепов // JetInfo № 10 (149)/2005 [Электронный ресурс] (http://www.jetinfo.ru/Sites/new/Uploads/ 2005_10.pdf).
3. Соловьев, Н.А. Развитие концепции обнаружения вторжений /Е.Н. Чернопрудова, Н.А. Соловьев //Современные информационные технологии в науке, образовании и практике: материалы VIII Всерос. науч.-практ. конф., /Оренбург. гос. ун-т. – Оренбург: ГОУ, 2009. – С. 66-67. - ISBN 978-5-7410-0975-8
4. Чернопрудова, Е.Н. Нейросетевая модель интеллектуальной фильтрации несанкционированных рассылок /Е.Н Чернопрудова // Информации Материалы IХ всероссийской научно-технической конференции – Оренбург: ОГУ, 2010, с. 44-47.
5. Чернопрудова, Е.Н Интеллектуальная фильтрация несанкционированных рассылок на основе нейронной сети /Е.Н. Чернопрудова, Н.А. Соловьев // Академический журнал «Интеллект. Инновации. Инвестиции». Спец. выпуск, 2011. с.106-107.
6. McCallum, A. A comparison of Event Models for Naïve Bayes Classifiection / A. McCallum, K. Nigam; // In AAAI-98 Workshop on Learning for Text Categorization. – 1998 – 8 c.
7. Fuernkranz, J. A study using n-gram features for Text Categoriza-tion / J. Fuernkranz // Tech report OEFAI-TR-98-30 – 1998.
8. Dasigi, V. Neural Net Learning Issues in Classification of Free Text Documents / V. Dasigi, R. Manu // AAAI spring symposium on Machine Learning in Information Access – 1996.
9. Li, Y. Classification of Text Documents /Y.H. Li, A.K. Jain //The Computer Journal, Vol. 41, No. 8, 1998
10. Mingyong, L. An improvement of TFIDF weighting in text categorization / L. Mingyong, Y. Jiangang [Электронный ресурс] http:// www.ipcsit.com/vol47/009-ICCTS2012-T049.pdf)
11. Cover, T. Elements of Information theory / T. Cover, J. Thomas [Электронный ресурс] (https:// web.cse.msu.edu/cse842/Papers/CoverThomas-Ch2.pdf)
12. Кондратьев, М.E Двухуровневая иерархическая кластеризация новостного потока в РОМИП 2006 / М.E. Кондратьев // Российский семинар, по оценке методов информационного поиска. Труды четвертого российского семинара РОМИП'-2006. Санкт-Петербург: НУ ЦСИ, 2006, 274 с. 126-138 [Электронный ресурс] (http://romip.narod.ru/ romip2006/index.html)
13. Hotho, A. Ontology-based Text Clustering / A. Hotho, S. Staab, A. Maedche [Электронный ресурс]
14. Lan, M. Supervised and Traditional Term Weighting Methods for Automatic Text Categorization / M. Lan, C. L. Tan, Senior Member [Электронный ресурс]
15. Маннинг, К.Д. Введение в информационный поиск/К.Д. Маннинг, П. Рагхаван, Х. Шютце, Вильямс. М.: 2011, 528 с.
16. Ягунова, Е.В. От коллокаций к конструкциям /Е.В. Ягунова, Л.М Пивоварова // Русский язык: конструкционные и лексико-семантические подходы - СПб, 2011. – 43с.
17. Хохлова, М.В. Экспериментальная проверка методов выделения коллокаций /М.В. Хохлова [Электронный ресурс] (http://www.helsinki.fi/ slavicahelsingiensia/ preview/sh34/pdf/21.pdf ).
18. Минашкин, В.Г. Теория статистики / В.Г. Минашкин, Р.А. Шмойлова, Н.А. Садовникова, Л.Г. Моисейкина, Е.С. Рыбакова, М.: изд. центр ЕАОИ. 2008, 296 с.
19. Чернопрудова, Е. Н. Защита почтовых сервисов от несанкционированных рассылок на основе контентной фильтрации электронных сообщений: дис. … канд. тех. наук: 05.13.19 /Чернопрудова Елена Николаевна. – Уфа, 2013. – 131 с.
20. Хайкин, С. Нейронные сети: полный курс /С. Хайкин - М.: Вильямс, 2006, - 1104 с.
21. Свидетельство о государственной регистрации программы для ЭВМ № 2013617655 «Программа фильтрации спама на основе нейронной сети» / Е. Н. Чернопрудова, Н. А.Соловьев, В. А. Пучков. Заявка № 2013617655. Дата поступления 21 мая 2013 г. Зарегистрировано в Реестре программ для ЭВМ 21 августа 2013 г.
22. Валеев, С.С. Многоуровневая система фильтрации спама на основе технологий искусственного интеллекта / С.С. Валеев, А.П. Никитин // Вестник УГАТУ, 2008, т.11, №1(28). С. 215-219.
Ключевые слова: электронная почта, интеллектуальная обработка текста, нейросетевой классификатор, векторная модель отображения
Для цитирования: Чернопрудова Е.Н., Соловьев Н.А., Юркевская Л.А. ФИЛЬТРАЦИЯ НЕСАНЦИОНИРОВАННЫХ СООБЩЕНИЙ В ПОЧТОВЫХ ЭЛЕКТРОННЫХ СЕРВИСАХ. Моделирование, оптимизация и информационные технологии. 2017;5(4). URL: https://moit.vivt.ru/wp-content/uploads/2017/10/ChernoprudovaSoavtori_4_1_17.pdf DOI:
Опубликована 31.12.2017