Ключевые слова: проверка статистических гипотез, непараметрические критерии, ранговые критерии, точные распределения ранговых критериев, перестановки с повторениями, алгоритмы перестановки, программы C++ для перестановок
Алгоритмы и программы расчета непараметрических критериев проверки статистических гипотез на основе перестановок с повторениями
УДК 519.23; 303.717
DOI: 10.26102/2310-6018/2025.49.2.022
Одной из важных задач статистического анализа является проверка статистических гипотез, а в этой группе наиболее перспективной представляется подгруппа непараметрических ранговых критериев, весьма устойчивых для работы с малыми выборками, когда не представляется возможность достоверно обосновать гипотетический закон распределения. В свою очередь, это обстоятельство вызывает необходимость отказаться от асимптотических аппроксимаций и располагать точными критическими значениями критериев (или так называемыми в современной литературе p-value). В настоящее время аналитические решения имеются лишь для весьма ограниченного класса критериев (знаков, Уилкоксона, серий, Ансари-Брэдли). Для всех остальных, для точного решения, требуется компьютерный перебор огромного количества возможных перестановок рангов. Созданию универсального алгоритма для получения точного и быстрого распределения ранговых непараметрических критериев и посвящена настоящая работа. Алгоритм, реализованный на языках программирования с открытым исходным кодом С++, Javascript и Python, основан на известной задаче комбинаторики – перестановок с повторениями, с адаптацией его к задачам проверки гипотез ранговыми критериями. В качестве таких критериев рассмотрены критерии: Краскелла-Уоллиса, Муда, Лемана-Розенблатта, а также группа критериев нормальных меток: Фишера-Йетса, Кэйпона, Клотца, Ван-дер-Вардена. Алгоритм адаптирован и для других возможных ранговых задач непараметрической статистики.
1. Mehta C.R., Patel N.R. IBM SPSS Exact Tests. IBM Corp.; 2013. 226 p.
2. Агамиров Л.В., Агамиров В.Л., Вестяк В.А. Численные методы и алгоритмы расчета точных распределений непараметрических критериев проверки статистических гипотез. Вестник Московского авиационного института. 2013;20(4):212–218.
3. Van de Wiel M.A. The Probability Generating Function of the Freund-Ansari-Bradley Statistic. In: Memorandum COSOR: Volume 9711. Eindhoven: Technische Universiteit Eindhoven; 1997. 9 p.
4. Choi W., Lee J.W., Huh M.-H., Kang S.-H. An Algorithm for Computing the Exact Distribution of the Kruskal-Wallis Test. Communications in Statistics – Simulation and Computation. 2003;32(4):1029–1040. https://doi.org/10.1081/SAC-120023876
5. Meyer J.P., Seaman M.A. A Comparison of the Exact Kruskal-Wallis Distribution to Asymptotic Approximations for All Sample Sizes up to 105. The Journal of Experimental Education. 2013;81(2):139–156. https://doi.org/10.1080/00220973.2012.699904
6. Van de Wiel M.A. Exact Distributions of Multiple Comparisons Rank Statistics. Journal of the American Statistical Association. 2002;97(460):1081–1089. https://doi.org/10.1198/016214502388618898
7. Odiase J.I., Ogbonmwan S.M. JMASM20: Exact Permutation Critical Values for The Kruskal-Wallis One-Way ANOVA. Journal of Modern Applied Statistical Methods. 2005;4(2). https://doi.org/0.22237/jmasm/1130804820
8. Spurrier J.D. On the Null Distribution of the Kruskal-Wallis Statistic. Journal of Nonparametric Statistics. 2003;15(6):685–691. https://doi.org/10.1080/10485250310001634719
9. Divine G.W., Norton H.J., Barón A.E., Juarez-Colunga E. The Wilcoxon-Mann-Whitney Procedure Fails as a Test of Medians. The American Statistician. 2018;72(3):278–286. https://doi.org/10.1080/00031305.2017.1305291
10. Hothorn T., Hornik K., van de Wiel M.A., Zeileis A. Implementing a Class of Permutation Tests: The Coin Package. Journal of Statistical Software. 2008;28(8):1–23. https://doi.org/10.18637/jss.v028.i08
11. Антипина Н.М., Захаров В.Н., Протасов Ю.М., Юров В.М. Непараметрический критерий различия для двух связанных выборок в табличном редакторе MS Excel. Вестник Московского государственного областного университета Серия: Экономика. 2021;(2):47–55.
12. Streitberg B., Rohmel J. Exact Distributions for Permutation and Rank Tests: An Introduction to Some Recently Published Algorithms. Statistical Software Newsletter. 1986;12(1):10–17.
13. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. Москва: ФИЗМАТЛИТ; 2006. 816 с.
14. Pollard J.H. A Handbook of Numerical and Statistical Techniques: With Examples Mainly from the Life Sciences. Cambridge: Cambridge University Press; 1977. 349 p.
15. Липский В. Комбинаторика для программистов. Москва: Мир; 1988. 213 c.
Ключевые слова: проверка статистических гипотез, непараметрические критерии, ранговые критерии, точные распределения ранговых критериев, перестановки с повторениями, алгоритмы перестановки, программы C++ для перестановок
Для цитирования: Агамиров Л.В., Агамиров В.Л., Тутова Н.В., Андреев И.А., Зиганшин Д.Д. Алгоритмы и программы расчета непараметрических критериев проверки статистических гипотез на основе перестановок с повторениями. Моделирование, оптимизация и информационные технологии. 2025;13(2). URL: https://moitvivt.ru/ru/journal/pdf?id=1880 DOI: 10.26102/2310-6018/2025.49.2.022
Поступила в редакцию 05.04.2025
Поступила после рецензирования 30.04.2025
Принята к публикации 14.05.2025