Разработка алгоритма многоклассового классификатора системы федеративного обучения, функционирующей в условиях неполноты классов локальных классификаторов
Работая с нашим сайтом, вы даете свое согласие на использование файлов cookie. Это необходимо для нормального функционирования сайта, показа целевой рекламы и анализа трафика. Статистика использования сайта отправляется в «Яндекс» и «Google»
Научный журнал Моделирование, оптимизация и информационные технологииThe scientific journal Modeling, Optimization and Information Technology
cетевое издание
issn 2310-6018

Разработка алгоритма многоклассового классификатора системы федеративного обучения, функционирующей в условиях неполноты классов локальных классификаторов

Михалев П.А.,  Куцакин М.А.,  Карамыхова О.В. 

УДК 004.852
DOI: 10.26102/2310-6018/2024.47.4.023

  • Аннотация
  • Список литературы
  • Об авторах

Актуальность исследования обусловлена необходимостью решения задачи обучения моделей многоклассовых классификаторов, используемых в структуре системы федеративного машинного обучения, оперирующей обучающей выборкой данных, которая содержит как общедоступные данные, так и конфиденциальные данные, формирующие скрытые классы. Подобная проблема возникает в условиях обучения классификатора с использованием выборки данных, часть из которых состоит из персональной информации или данных различной степени конфиденциальности. В связи с этим данная статья направлена на исследование особенностей модели гауссовой смеси распределений как способа представления скрытых классов, представляющих конфиденциальные данные, а также обоснование выбора алгоритмического метода нахождения оценок максимального правдоподобия ее параметров. Ведущим методом решения проблемы идентификации параметров скрытых классов является обоснованно выбранная двухэтапная итерационная процедура «ожидание-максимизация» (EM-алгоритм), обеспечивающая усиление связи между пропущенными (конфиденциальными) данными и неизвестными параметрами модели данных, представленной гауссовой смесью распределений. В статье представлена схема разработанного алгоритма многоклассового классификатора системы федеративного машинного обучения, представленная параллельно выполняющимися циклами формирования локальных моделей обучения и их последующего ансамблирования в глобальную модель обучения.

1. Wahab O.A., Mourad A., Otrok H., Taleb T. Federated Machine Learning: Survey, Multi-Level Classification, Desirable Criteria and Future Directions in Communication and Networking Systems. IEEE Communications Surveys & Tutorials. 2021;23(2):1342–1397. https://doi.org/10.1109/COMST.2021.3058573

2. Lo S.K., Lu Q., Zhu L., Paik H.-Y., Xu X., Wang C. Architectural Patterns for the Design of Federated Learning Systems. Journal of Systems and Software. 2022;191. https://doi.org/10.1016/j.jss.2022.111357

3. Mikhalev P.A., Kutsakin M.A., Mironov O.Yu. On the need for parametric optimization of systems with federated machine learning. In: Modern Informatization Problems in Simulation and Social Technologies (MIP-2023'SCT): Proceedings of the XXVIII-th International Open Science Conference, 15 November 2022 – 15 January 2023, Yelm, WA, USA. Yelm: Science Book Publishing House LLC; 2023. pp. 37–41. (In Russ.).

4. Allwein E.L., Schapire R.E., Singer Y. Reducing multiclass to binary: a unifying approach for margin classifiers. Journal of Machine Learning Research. 2001;1:113–141.

5. Goodman R., Miller J.W., Smyth P. Objective Functions For Neural Network Classifier Design. In: 1991 IEEE International Symposium on Information Theory, 24–28 June 1991, Budapest, Hungary. IEEE; 1991. pp. 87. https://doi.org/10.1109/ISIT.1991.695143

6. Galar M., Fernández A., Barrenechea E., Bustince H., Herrera F. An overview of ensemble methods for binary classifiers in multi-class problems: Experimental study on one-vs-one and one-vs-all schemes. Pattern Recognition. 2011;44(8):1761–1776. https://doi.org/10.1016/j.patcog.2011.01.017

7. Arı Ç., Aksoy S., Arıkan O. Maximum likelihood estimation of Gaussian mixture models using stochastic search. Pattern Recognition. 2012;45(7):2804–2816. https://doi.org/10.1016/j.patcog.2011.12.023

8. Tohka J., Krestyannikov E., Dinov I.D., Graham A.M., Shattuck D.W., Ruotsalainen U. Genetic Algorithms for Finite Mixture Model Based Voxel Classification in Neuroimaging. IEEE Transactions on Medical Imaging. 2007;26(5):696–711. https://doi.org/10.1109/TMI.2007.895453

9. Martı́nez A.M., Vitrià J. Learning mixture models using a genetic version of the EM algorithm. Pattern Recognition Letters. 2000;21(8):759–769. https://doi.org/10.1016/S0167-8655(00)00031-3

10. Pernkopf F., Bouchaffra D. Genetic-based EM algorithm for learning Gaussian mixture models. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2005;27(8):1344–1348. https://doi.org/10.1109/TPAMI.2005.162

Михалев Павел Андреевич

Академия Федеральной Службы Охраны Российской Федерации

Орел, Россия

Куцакин Максим Алексеевич
Кандидат технических наук

РИНЦ |

Академия Федеральной Службы Охраны Российской Федерации

Орел, Россия

Карамыхова Оксана Викторовна
Кандидат педагогических наук

Академия Федеральной Службы Охраны Российской Федерации

Орел, Россия

Ключевые слова: федеративное машинное обучение, многоклассовая классификация, конфиденциальные обучающие данные, модель гауссовой смеси распределений, EM-алгоритм

Для цитирования: Михалев П.А., Куцакин М.А., Карамыхова О.В. Разработка алгоритма многоклассового классификатора системы федеративного обучения, функционирующей в условиях неполноты классов локальных классификаторов. Моделирование, оптимизация и информационные технологии. 2024;12(4). URL: https://moitvivt.ru/ru/journal/pdf?id=1731 DOI: 10.26102/2310-6018/2024.47.4.023

31

Полный текст статьи в PDF

Поступила в редакцию 30.10.2024

Поступила после рецензирования 18.11.2024

Принята к публикации 20.11.2024