Ключевые слова: приближенная обработка запросов, алгоритмы обработки запросов, конвейер запросов, кластерная выборка, хранилище данных, гибридная транзакционно-аналитическая обработка данных
Разработка алгоритма приближенной обработки конвейера запросов в реляционной системе управления базами данных
УДК 004.65
DOI: 10.26102/2310-6018/2022.38.3.027
В статье рассматриваются алгоритм приближенной обработки запросов в системах управления базами данных реляционного типа. Описываемый алгоритм позволяет получить приближенные результаты запросов с агрегированием и группированием, что позволяет применить его в задачах аналитической обработки запросов с целью снижения времени отклика при обработке запросов. Представленные алгоритмы реализуют метод случайной кластерной выборки и используют математическое обеспечение, позволяющее получить оптимизированное распределение пространства выборки с применением метрики качества выборки. В качестве такой метрики выбран коэффициент вариации. Также в статье продемонстрирована модель конвейера аналитических запросов, представленная в форме направленного ациклического графа. Алгоритм приближенной обработки запросов расширен для условий применения его в потоке запросов, что позволяет оценить доверительный интервал вместе с результатом обработки конвейера запросов. Данный алгоритм может быть применен при разработке специального программного обеспечения процессора базы данных, реализующего архитектуру приближенной обработки запросов в реляционных базах данных. Такой подход находит место в поле исследований синтеза структуры гибридных хранилищ данных, реализующих транзакционно-аналитическую обработку данных. В дальнейшем исследовании предполагается получение экспериментальной оценки представленного подхода.
1. Babcock B., Chaudhuri S., Das G. Dynamic sample selection for approximate query processing. Proceedings of International Conference on Management of Data, SIGMOD ’03. 2003;539–550. DOI: 10.1145/872819.872822.
2. Ganti V., Lee M., Ramakrishnan R. (2000). ICICLES: self-tuning samples for approximate query answering. VLDB. 2000;176–187.
3. Cormode G., Garofalakis M., Haas P.J., Jermaine C. Synopses for massive data: Samples, histograms, wavelets, sketches. Foundations and Trends in Databases. 2012;4(1–3):1–294. DOI:10.1561/1900000004.
4. Xu B., Tirthapura S., Busch C. Sketching asynchronous data streams over sliding windows. Distributed Computing. 2008;20(5):359–374. DOI:10.1007/s00446-007-0048-7.
5. Chaudhuri S., Ding B., Kandula S. Approximate query processing: No silver bullet. Proceedings of the 2017 ACM SIGMOD International Conference on Management of Data. 2017;511–519. DOI: 10.1145/3035918.3056097.
6. Григорьев Ю.А., Ухаров А.О., Плутенко А.Д. Использование вейвлет-преобразования для приближенной обработки многомерных данных. Информатика и системы управления. 2008;15(1):3–13.
7. Громей Д.Д., Козлов С.В., Филимонов А.В. Оптимизация распределения пространства выборки для запросов с группированием в процессе их приближенной обработки. Системы управления и информационные технологии. 2022;89(3):48–54. DOI: 10.36622/VSTU.2022.89.3.011.
8. Cao Y., Fan W. Data driven approximation with bounded resources. Proceedings of the VLDB Endowment. 2017;10(9):973–984. DOI: 10.14778/3099622.3099628.
9. Al-wesabi O.A., Abdullah N., Sumari P. (2020). Hybrid Storage Management Method for Video-on-Demand Server. Emerging Trends in Intelligent Computing and Informatics. 2020;1073:695–704. DOI: 10.1007/978-3-030-33582-3_65.
10. Козлов С.В., Невров А.А., Латышев И.П., Филимонов А.В. Подходы к приближенной обработке аналитических запросов в реляционных системах управления базами данных. I-methods. (2021);13(4). Доступно по: http://intech-spc.com/wp-content/uploads/archive/2021/4/7-kozlov.pdf (дата обращения: 30.09.2022).
Ключевые слова: приближенная обработка запросов, алгоритмы обработки запросов, конвейер запросов, кластерная выборка, хранилище данных, гибридная транзакционно-аналитическая обработка данных
Для цитирования: Филимонов А.В. Разработка алгоритма приближенной обработки конвейера запросов в реляционной системе управления базами данных. Моделирование, оптимизация и информационные технологии. 2022;10(3). URL: https://moitvivt.ru/ru/journal/pdf?id=1242 DOI: 10.26102/2310-6018/2022.38.3.027
Поступила в редакцию 19.09.2022
Поступила после рецензирования 27.09.2022
Принята к публикации 30.09.2022
Опубликована 30.09.2022