<?xml version="1.0" encoding="UTF-8"?>
<article article-type="research-article" dtd-version="1.3" xml:lang="ru" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="https://metafora.rcsi.science/xsd_files/journal3.xsd">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">moitvivt</journal-id>
      <journal-title-group>
        <journal-title xml:lang="ru">Моделирование, оптимизация и информационные технологии</journal-title>
        <trans-title-group xml:lang="en">
          <trans-title>Modeling, Optimization and Information Technology</trans-title>
        </trans-title-group>
      </journal-title-group>
      <issn pub-type="epub">2310-6018</issn>
      <publisher>
        <publisher-name>Издательство</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.26102/2310-6018/2026.55.4.020</article-id>
      <article-id pub-id-type="custom" custom-type="elpub">2232</article-id>
      <title-group>
        <article-title xml:lang="ru">Моделирование и оптимизация процесса сбора данных для искусственного интеллекта в медицине</article-title>
        <trans-title-group xml:lang="en">
          <trans-title>Modeling and optimization of data collection process for artificial intelligence in medicine</trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0000-0001-7766-3011</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Иващенко</surname>
              <given-names>Антон Владимирович</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Ivaschenko</surname>
              <given-names>Anton Vladimirovich</given-names>
            </name>
          </name-alternatives>
          <email>anton.ivashenko@gmail.com</email>
          <xref ref-type="aff">aff-1</xref>
        </contrib>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0009-0004-1127-0978</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Терехин</surname>
              <given-names>Михаил Александрович</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Terekhin</surname>
              <given-names>Mikhail Aleksandrovich</given-names>
            </name>
          </name-alternatives>
          <email>terexin.m.a@yandex.ru</email>
          <xref ref-type="aff">aff-2</xref>
        </contrib>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0000-0002-3131-1368</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Порецкова</surname>
              <given-names>Галина Юрьевна</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Poretskova</surname>
              <given-names>Galina Yuryevna</given-names>
            </name>
          </name-alternatives>
          <xref ref-type="aff">aff-3</xref>
        </contrib>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0009-0001-4497-4216</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Жданович</surname>
              <given-names>Герман Эдуардович</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Zhdanovich</surname>
              <given-names>German Eduardovich</given-names>
            </name>
          </name-alternatives>
          <xref ref-type="aff">aff-4</xref>
        </contrib>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0009-0005-8611-0204</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Мельников</surname>
              <given-names>Денис Алексеевич</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Melnikov</surname>
              <given-names>Denis Alexeyevich</given-names>
            </name>
          </name-alternatives>
          <xref ref-type="aff">aff-5</xref>
        </contrib>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0009-0005-5291-1791</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Радаев</surname>
              <given-names>Дмитрий Евгеньевич</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Radaev</surname>
              <given-names>Dmitry Evgenievich</given-names>
            </name>
          </name-alternatives>
          <xref ref-type="aff">aff-6</xref>
        </contrib>
      </contrib-group>
      <aff-alternatives id="aff-1">
        <aff xml:lang="ru">Самарский государственный медицинский университет</aff>
        <aff xml:lang="en">Samara State Medical University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-2">
        <aff xml:lang="ru">Самарский государственный медицинский университет</aff>
        <aff xml:lang="en">Samara State Medical University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-3">
        <aff xml:lang="ru">Самарский государственный медицинский университет</aff>
        <aff xml:lang="en">Samara State Medical University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-4">
        <aff xml:lang="ru">Приволжский государственный университет путей сообщения</aff>
        <aff xml:lang="en">Volga State Transport University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-5">
        <aff xml:lang="ru">Пензенский государственный технологический университет</aff>
        <aff xml:lang="en">Penza State Technological University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-6">
        <aff xml:lang="ru">Пензенский государственный технологический университет</aff>
        <aff xml:lang="en">Penza State Technological University</aff>
      </aff-alternatives>
      <pub-date pub-type="epub">
        <day>01</day>
        <month>01</month>
        <year>2026</year>
      </pub-date>
      <volume>1</volume>
      <issue>1</issue>
      <elocation-id>10.26102/2310-6018/2026.55.4.020</elocation-id>
      <permissions>
        <copyright-statement>Copyright © Авторы, 2026</copyright-statement>
        <copyright-year>2026</copyright-year>
        <license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This work is licensed under a Creative Commons Attribution 4.0 International License</license-p>
        </license>
      </permissions>
      <self-uri xlink:href="https://moitvivt.ru/ru/journal/article?id=2232"/>
      <abstract xml:lang="ru">
        <p>Развитие технологий искусственного интеллекта в медицине требует реализации системного подхода по сбору и обработке структурированных наборов данных (датасетов) для обучения, тестирования и валидации моделей машинного обучения. В статье предложено решение этой задачи путем имитационного моделирования на основе теории массового обслуживания, в ходе которого необходимо оценить плановую пропускную способность каждой точки сбора информации, обеспечение достаточного количества пациентов, доступности и достоверности их медицинской информации, обеспечение требований законодательства в части защиты персональных данных и врачебной этики. Исследование предложенного подхода было произведено на примере анализа процессов сбора биомедицинских данных, предназначенных для обучения моделей искусственного интеллекта методам дистанционной диагностики. Эмпирическая часть исследования проводилась на базе пунктов сбора биомедицинских сигналов в течение шести месяцев. Общий объём выборки составил 574 пациента. В рамках исследования была построена имитационная модель, позволившая провести оптимизацию процесса сбора данных. По данным имитационного моделирования средняя интенсивность сбора данных составила 7,28 пациента в день при выраженной вариативности нагрузки. В ходе оптимизации были произведены изменения в процессе сбора данных путем распараллеливания, что позволило повысить производительность за счет сокращения времени на анкетирование и термометрию и увеличения входящего потока пациентов. Проведенная оптимизация процесса сбора данных позволила повысить интенсивность работы с 4,67 до 12,12 пациентов в день. Предложенный подход позволяет обосновать архитектуру организационно-технологического процесса сбора информации до начала масштабирования и минимизировать риски превышения календарных сроков формирования медицинских датасетов.</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <p>Development of Artificial Intelligence technologies in medicine requires a systematic approach to collecting and processing structured datasets for training, testing, and validating machine learning models. This paper proposes a solution to this problem through simulation modeling based on queueing theory. This modeling requires estimating the planned throughput of each data collection point, ensuring a sufficient number of patients, the availability and reliability of their medical information, and meeting legal requirements regarding personal data protection and medical ethics. The proposed approach was studied using the analysis of biomedical data collection processes designed to train artificial intelligence models for remote diagnostic methods. The empirical part of the study was conducted at biomedical signal collection points over a six-month period. The total sample size was 574 patients. A simulation model was developed to optimize the data collection process. According to the simulation modeling, the average data collection intensity was 7.28 patients per day with significant variability in the workload. During the optimization process, changes were made to the data collection process through parallelization, which increased productivity by reducing the time spent on questionnaires and temperature measurements and increasing patient throughput. The optimization of the data collection process increased the workload from 4.67 to 12.12 patients per day. The proposed approach allows us to validate the architecture of the organizational and technological process for data collection before scaling and minimizes the risk of exceeding the schedule deadlines for generating medical datasets.</p>
      </trans-abstract>
      <kwd-group xml:lang="ru">
        <kwd>медицинский датасет</kwd>
        <kwd>имитационное моделирование</kwd>
        <kwd>теория массового обслуживания</kwd>
        <kwd>цифровой двойник</kwd>
        <kwd>пропускная способность</kwd>
        <kwd>искусственный интеллект</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>medical dataset</kwd>
        <kwd>simulation modeling</kwd>
        <kwd>queueing theory</kwd>
        <kwd>digital twin</kwd>
        <kwd>throughput</kwd>
        <kwd>artificial intelligence</kwd>
      </kwd-group>
      <funding-group>
        <funding-statement xml:lang="ru">Исследование выполнено без спонсорской поддержки.</funding-statement>
        <funding-statement xml:lang="en">The study was performed without external funding.</funding-statement>
      </funding-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <title>References</title>
      <ref id="cit1">
        <label>1</label>
        <mixed-citation xml:lang="ru">Решетников Р.В., Тыров И.А., Васильев Ю.А. и др. Методики оценки качества больших генеративных моделей для базовых сценариев применения в здравоохранении. Врач и информационные технологии. 2025;(3):64–75. https://doi.org/10.25881/18110193_2025_3_64</mixed-citation>
      </ref>
      <ref id="cit2">
        <label>2</label>
        <mixed-citation xml:lang="ru">Васильев Ю.А., Бобровская Т.М., Арзамасов К.М. и др. Основополагающие принципы стандартизации и систематизации информации о наборах данных для машинного обучения в медицинской диагностике. Менеджер здравоохранения. 2023;(4):28–41. https://doi.org/10.21045/1811-0185-2023-4-28-41</mixed-citation>
      </ref>
      <ref id="cit3">
        <label>3</label>
        <mixed-citation xml:lang="ru">Шарова Д.Е., Михайлова А.А., Гусев А.В. и др. Анализ мирового опыта в регулировании использования медицинских данных для целей создания систем искусственного интеллекта на основе машинного обучения. Врач и информационные технологии. 2022;(4):28–39. https://doi.org/10.25881/18110193_2022_4_28</mixed-citation>
      </ref>
      <ref id="cit4">
        <label>4</label>
        <mixed-citation xml:lang="ru">Arora A., Alderman J.E., Palmer J., et al. The value of standards for health datasets in artificial intelligence-based applications. Nature Medicine. 2023;29(11):2929–2938. https://doi.org/10.1038/s41591-023-02608-w</mixed-citation>
      </ref>
      <ref id="cit5">
        <label>5</label>
        <mixed-citation xml:lang="ru">Schwabe D., Becker K., Seyferth M., Klaß A., Schaeffter T. The METRIC-framework for assessing data quality for trustworthy AI in medicine: a systematic review. npj Digital Medicine. 2024;7(1). https://doi.org/10.1038/s41746-024-01196-4</mixed-citation>
      </ref>
      <ref id="cit6">
        <label>6</label>
        <mixed-citation xml:lang="ru">Kim J.-W., Kim Ch., Kim K.-H., et al.  Scalable Infrastructure Supporting Reproducible Nationwide Healthcare Data Analysis toward FAIR Stewardship. Scientific Data. 2023;10(1). https://doi.org/10.1038/s41597-023-02580-7</mixed-citation>
      </ref>
      <ref id="cit7">
        <label>7</label>
        <mixed-citation xml:lang="ru">Барсегян Н.В., Галимулина Ф.Ф. Цифровое моделирование и оптимизация экономических систем: теория массового обслуживания и анализ данных. Курск: Университетская книга; 2025. 82 с.</mixed-citation>
      </ref>
      <ref id="cit8">
        <label>8</label>
        <mixed-citation xml:lang="ru">Слободняк И.А., Антипина П.В. Оптимизация организации работы сервисных служб с использованием теории управления системами массового обслуживания. Экономика и управление: проблемы, решения. 2020;1(12):19–24. https://doi.org/10.36871/ek.up.p.r.2020.12.01.004</mixed-citation>
      </ref>
      <ref id="cit9">
        <label>9</label>
        <mixed-citation xml:lang="ru">Полухин П.В. Применение методов теории массового обслуживания для оценки параметров синхронизации распределенных вычислительных систем. Моделирование, оптимизация и информационные технологии. 2022;10(2). https://doi.org/10.26102/2310-6018/2022.37.2.028</mixed-citation>
      </ref>
      <ref id="cit10">
        <label>10</label>
        <mixed-citation xml:lang="ru">Третьякова М.Е., Смакуев А.Д., Филатов В.В. Проектирование процесса оказания услуг на основе методов теории массового обслуживания. Прикладные экономические исследования. 2022;(2):24–31. https://doi.org/10.47576/2313-2086_2022_2_24</mixed-citation>
      </ref>
      <ref id="cit11">
        <label>11</label>
        <mixed-citation xml:lang="ru">Touré V., Krauss Ph., Gnodtke K., et al. FAIRification of health-related data using semantic web technologies in the Swiss Personalized Health Network. Scientific Data. 2023;10. https://doi.org/10.1038/s41597-023-02028-y</mixed-citation>
      </ref>
      <ref id="cit12">
        <label>12</label>
        <mixed-citation xml:lang="ru">Fun W.H., Tan E.H., Khalid R., et al. Applying Discrete Event Simulation to Reduce Patient Wait Times and Crowding: The Case of a Specialist Outpatient Clinic with Dual Practice System. Healthcare. 2022;10(2). https://doi.org/10.3390/healthcare10020189</mixed-citation>
      </ref>
      <ref id="cit13">
        <label>13</label>
        <mixed-citation xml:lang="ru">Vecillas Martin D., Berruezo Fernández Ch., Gento Municio A.M. Systematic Review of Discrete Event Simulation in Healthcare and Statistics Distributions. Applied Sciences. 2025;15(4). https://doi.org/10.3390/app15041861</mixed-citation>
      </ref>
      <ref id="cit14">
        <label>14</label>
        <mixed-citation xml:lang="ru">Di Pumpo M., Ianni A., Miccoli G.A., et al. Queueing Theory and COVID-19 Prevention: Model Proposal to Maximize Safety and Performance of Vaccination Sites. Frontiers in Public Health. 2022;10. https://doi.org/10.3389/fpubh.2022.840677</mixed-citation>
      </ref>
      <ref id="cit15">
        <label>15</label>
        <mixed-citation xml:lang="ru">Kuruppu Appuhamilage G.D.K., Hussain M., Zaman M., Khan W.A. A health digital twin framework for discrete event simulation based optimised critical care workflows. npj Digital Medicine. 2025;8(1). https://doi.org/10.1038/s41746-025-01738-4</mixed-citation>
      </ref>
      <ref id="cit16">
        <label>16</label>
        <mixed-citation xml:lang="ru">Declerck J., Kalra D., Vander Stichele R., Coorevits P. Frameworks, Dimensions, Definitions of Aspects, and Assessment Methods for the Appraisal of Quality of Health Data for Secondary Use: Comprehensive Overview of Reviews. JMIR Medical Informatics. 2024;12. https://doi.org/10.2196/51560</mixed-citation>
      </ref>
    </ref-list>
    <fn-group>
      <fn fn-type="conflict">
        <p>The authors declare that there are no conflicts of interest present.</p>
      </fn>
    </fn-group>
  </back>
</article>