Ключевые слова: федеративное машинное обучение, многоклассовая классификация, конфиденциальные обучающие данные, модель гауссовой смеси распределений, EM-алгоритм
Разработка алгоритма многоклассового классификатора системы федеративного обучения, функционирующей в условиях неполноты классов локальных классификаторов
УДК 004.852
DOI: 10.26102/2310-6018/2024.47.4.023
Актуальность исследования обусловлена необходимостью решения задачи обучения моделей многоклассовых классификаторов, используемых в структуре системы федеративного машинного обучения, оперирующей обучающей выборкой данных, которая содержит как общедоступные данные, так и конфиденциальные данные, формирующие скрытые классы. Подобная проблема возникает в условиях обучения классификатора с использованием выборки данных, часть из которых состоит из персональной информации или данных различной степени конфиденциальности. В связи с этим данная статья направлена на исследование особенностей модели гауссовой смеси распределений как способа представления скрытых классов, представляющих конфиденциальные данные, а также обоснование выбора алгоритмического метода нахождения оценок максимального правдоподобия ее параметров. Ведущим методом решения проблемы идентификации параметров скрытых классов является обоснованно выбранная двухэтапная итерационная процедура «ожидание-максимизация» (EM-алгоритм), обеспечивающая усиление связи между пропущенными (конфиденциальными) данными и неизвестными параметрами модели данных, представленной гауссовой смесью распределений. В статье представлена схема разработанного алгоритма многоклассового классификатора системы федеративного машинного обучения, представленная параллельно выполняющимися циклами формирования локальных моделей обучения и их последующего ансамблирования в глобальную модель обучения.
1. Wahab O.A., Mourad A., Otrok H., Taleb T. Federated Machine Learning: Survey, Multi-Level Classification, Desirable Criteria and Future Directions in Communication and Networking Systems. IEEE Communications Surveys & Tutorials. 2021;23(2):1342–1397. https://doi.org/10.1109/COMST.2021.3058573
2. Lo S.K., Lu Q., Zhu L., Paik H.-Y., Xu X., Wang C. Architectural Patterns for the Design of Federated Learning Systems. Journal of Systems and Software. 2022;191. https://doi.org/10.1016/j.jss.2022.111357
3. Mikhalev P.A., Kutsakin M.A., Mironov O.Yu. On the need for parametric optimization of systems with federated machine learning. In: Modern Informatization Problems in Simulation and Social Technologies (MIP-2023'SCT): Proceedings of the XXVIII-th International Open Science Conference, 15 November 2022 – 15 January 2023, Yelm, WA, USA. Yelm: Science Book Publishing House LLC; 2023. pp. 37–41. (In Russ.).
4. Allwein E.L., Schapire R.E., Singer Y. Reducing multiclass to binary: a unifying approach for margin classifiers. Journal of Machine Learning Research. 2001;1:113–141.
5. Goodman R., Miller J.W., Smyth P. Objective Functions For Neural Network Classifier Design. In: 1991 IEEE International Symposium on Information Theory, 24–28 June 1991, Budapest, Hungary. IEEE; 1991. pp. 87. https://doi.org/10.1109/ISIT.1991.695143
6. Galar M., Fernández A., Barrenechea E., Bustince H., Herrera F. An overview of ensemble methods for binary classifiers in multi-class problems: Experimental study on one-vs-one and one-vs-all schemes. Pattern Recognition. 2011;44(8):1761–1776. https://doi.org/10.1016/j.patcog.2011.01.017
7. Arı Ç., Aksoy S., Arıkan O. Maximum likelihood estimation of Gaussian mixture models using stochastic search. Pattern Recognition. 2012;45(7):2804–2816. https://doi.org/10.1016/j.patcog.2011.12.023
8. Tohka J., Krestyannikov E., Dinov I.D., Graham A.M., Shattuck D.W., Ruotsalainen U. Genetic Algorithms for Finite Mixture Model Based Voxel Classification in Neuroimaging. IEEE Transactions on Medical Imaging. 2007;26(5):696–711. https://doi.org/10.1109/TMI.2007.895453
9. Martı́nez A.M., Vitrià J. Learning mixture models using a genetic version of the EM algorithm. Pattern Recognition Letters. 2000;21(8):759–769. https://doi.org/10.1016/S0167-8655(00)00031-3
10. Pernkopf F., Bouchaffra D. Genetic-based EM algorithm for learning Gaussian mixture models. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2005;27(8):1344–1348. https://doi.org/10.1109/TPAMI.2005.162
Ключевые слова: федеративное машинное обучение, многоклассовая классификация, конфиденциальные обучающие данные, модель гауссовой смеси распределений, EM-алгоритм
Для цитирования: Михалев П.А., Куцакин М.А., Карамыхова О.В. Разработка алгоритма многоклассового классификатора системы федеративного обучения, функционирующей в условиях неполноты классов локальных классификаторов. Моделирование, оптимизация и информационные технологии. 2024;12(4). URL: https://moitvivt.ru/ru/journal/pdf?id=1731 DOI: 10.26102/2310-6018/2024.47.4.023
Поступила в редакцию 30.10.2024
Поступила после рецензирования 18.11.2024
Принята к публикации 20.11.2024