<?xml version="1.0" encoding="UTF-8"?>
<article article-type="research-article" dtd-version="1.3" xml:lang="ru" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="https://metafora.rcsi.science/xsd_files/journal3.xsd">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">moitvivt</journal-id>
      <journal-title-group>
        <journal-title xml:lang="ru">Моделирование, оптимизация и информационные технологии</journal-title>
        <trans-title-group xml:lang="en">
          <trans-title>Modeling, Optimization and Information Technology</trans-title>
        </trans-title-group>
      </journal-title-group>
      <issn pub-type="epub">2310-6018</issn>
      <publisher>
        <publisher-name>Издательство</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.26102/2310-6018/2025.51.4.043</article-id>
      <article-id pub-id-type="custom" custom-type="elpub">2063</article-id>
      <title-group>
        <article-title xml:lang="ru">Разработка информационной системы для анализа наполнения веб-сайтов текстовыми документами</article-title>
        <trans-title-group xml:lang="en">
          <trans-title>Development of an information system for analyzing the content of websites with textual documents</trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author" corresp="yes">
          <contrib-id contrib-id-type="orcid">0000-0002-4659-0726</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Поцебнева</surname>
              <given-names>Ирина Валерьевна</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Pocebneva</surname>
              <given-names>Irina Valerievna</given-names>
            </name>
          </name-alternatives>
          <email>ipozebneva@cchgeu.ru</email>
          <xref ref-type="aff">aff-1</xref>
        </contrib>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0009-0003-9318-8152</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Андреева</surname>
              <given-names>Кристина Алексеевна</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Andreeva</surname>
              <given-names>Kristina Alekseevna</given-names>
            </name>
          </name-alternatives>
          <email>kandreeva@cchgeu.ru</email>
          <xref ref-type="aff">aff-2</xref>
        </contrib>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0009-0009-4132-0194</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Пуговкина</surname>
              <given-names>Наталия Александровна</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Pugovkina</surname>
              <given-names>Natalia Aleksandrovna</given-names>
            </name>
          </name-alternatives>
          <email>pugovka01112002@gmail.com</email>
          <xref ref-type="aff">aff-3</xref>
        </contrib>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0000-0002-3752-0152</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Гусев</surname>
              <given-names>Павел Юрьевич</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Gusev</surname>
              <given-names>Pavel Yrievich</given-names>
            </name>
          </name-alternatives>
          <email>pgusev@cchgeu.ru</email>
          <xref ref-type="aff">aff-4</xref>
        </contrib>
      </contrib-group>
      <aff-alternatives id="aff-1">
        <aff xml:lang="ru">Воронежский государственный технический университет</aff>
        <aff xml:lang="en">Voronezh State Technical University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-2">
        <aff xml:lang="ru">Воронежский государственный технический университет</aff>
        <aff xml:lang="en">Voronezh State Technical University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-3">
        <aff xml:lang="ru">Воронежский государственный технический университет</aff>
        <aff xml:lang="en">Voronezh State Technical University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-4">
        <aff xml:lang="ru">Воронежский государственный технический университет</aff>
        <aff xml:lang="en">Voronezh State Technical University</aff>
      </aff-alternatives>
      <pub-date pub-type="epub">
        <day>01</day>
        <month>01</month>
        <year>2026</year>
      </pub-date>
      <volume>1</volume>
      <issue>1</issue>
      <elocation-id>10.26102/2310-6018/2025.51.4.043</elocation-id>
      <permissions>
        <copyright-statement>Copyright © Авторы, 2026</copyright-statement>
        <copyright-year>2026</copyright-year>
        <license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This work is licensed under a Creative Commons Attribution 4.0 International License</license-p>
        </license>
      </permissions>
      <self-uri xlink:href="https://moitvivt.ru/ru/journal/article?id=2063"/>
      <abstract xml:lang="ru">
        <p>Работа посвящена вопросам анализа наполнения веб-сайта организации текстовыми документами в целях осуществления поддержки принятия решений при управлении образовательными программами организации высшего образования. Наполнение веб-сайта организации текстовыми документами выступает одним из критериев эффективности работы сайта. Сами критерии эффективности, в свою очередь, определяются типом сайта и типом организации, которая это сайт создала и поддерживает. В работе рассматриваются веб-сайты организаций высшего образования и их особенности. Одной из рассматриваемых особенностей выступает необходимость наличия рабочих программ в виде текстовых документов. Помимо необходимости наличия, рабочие программы на веб-сайте организации являются информационным материалом для абитуриентов, что повышает ценность подобной информации. Анализ наличия и содержания рабочих программ позволит решить ряд управленческих задач, однако для этого требуется проектирование и разработка инструмента проверки наличия рабочих программ. Для решения задачи проверки наличия и анализа содержания рабочих программ осуществлены проектирование и разработка информационной системы. Этап проектирования информационной системы заключался в разработке контекстной и декомпозированной диаграмм IDEF0 и диаграммы действий. Контекстная диаграмма определила систему, входы, выходы, элементы управления и механизмы информационной системы. Декомпозированная диаграмма содержит следующие модули: парсинга, обработки документов, анализа учебных планов, интеграции данных, экспорта. Диаграмма действия включает следующие акторы: администратор, внешний сайт, база данных, система визуализации – и следующие прецеденты: парсинг сайта, обработка документов, анализ учебных планов, интеграция данных, экспорт данных, визуализация данных. Реализация информационной системы обеспечила возможность построения общего дашборда образовательной организации, дашборда факультета, дашборда кафедры. Результаты работы обеспечивают возможность принятия управленческих решений на основе информации о наличии рабочих программ на сайте образовательной организации.</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <p>This study focuses on analyzing the content of organizational websites with textual documents in order to support decision-making in the management of educational programs of a higher education organization. The presence of textual documents on an organization's website is one of the key criteria for assessing website effectiveness. These effectiveness criteria, in turn, are determined by the type of website and the type of organization that created and maintains it. The paper examines websites of higher education institutions and their specific characteristics. One such characteristic is the necessity of having curricula (working programs) available in the form of textual documents. Besides being a mandatory requirement, these curricula serve as informational materials for prospective students, thereby increasing the value of such information. Analyzing the availability and content of curricula can help address various management tasks; however, this requires designing and developing a tool to verify the presence of curricula. To solve the problem of verifying the availability and analyzing the content of curricula, an information system was designed and developed. The design phase involved creating an IDEF0 context diagram, a decomposed IDEF0 diagram, and an action (use case) diagram. The context diagram defined the system, inputs, outputs, controls, and mechanisms of the information system. The decomposed diagram includes the following modules: web parsing, document processing, curriculum analysis, data integration, and data export. The action diagram identifies the following actors: administrator, external website, database, visualization system, and includes the following use cases: website parsing, document processing, curriculum analysis, data integration, data export, and data visualization. The implementation of the information system enabled the creation of comprehensive dashboards for educational organizations, faculty-level dashboards, and department-level dashboards. The results of the system’s operation support managerial decision-making based on information about the availability of curricula on educational institution websites.</p>
      </trans-abstract>
      <kwd-group xml:lang="ru">
        <kwd>информационная система</kwd>
        <kwd>анализ веб-сайта</kwd>
        <kwd>рабочие программы дисциплин</kwd>
        <kwd>образовательные организации высшего образования</kwd>
        <kwd>парсинг веб-сайта</kwd>
        <kwd>обработка документов</kwd>
        <kwd>диаграммы IDEF0</kwd>
        <kwd>визуализация данных</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>information system</kwd>
        <kwd>website analysis</kwd>
        <kwd>work programs of disciplines</kwd>
        <kwd>higher education institutions</kwd>
        <kwd>website parsing</kwd>
        <kwd>document processing</kwd>
        <kwd>IDEF0 diagrams</kwd>
        <kwd>data visualization</kwd>
      </kwd-group>
      <funding-group>
        <funding-statement xml:lang="ru">Исследование выполнено без спонсорской поддержки.</funding-statement>
        <funding-statement xml:lang="en">The study was performed without external funding.</funding-statement>
      </funding-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <title>References</title>
      <ref id="cit1">
        <label>1</label>
        <mixed-citation xml:lang="ru">Brügger N. Website History and the Website as an Object of Study. New Media &amp; Society. 2009;11(1-2):115–132. https://doi.org/10.1177/1461444808099574</mixed-citation>
      </ref>
      <ref id="cit2">
        <label>2</label>
        <mixed-citation xml:lang="ru">Cebi S. Determining Importance Degrees of Website Design Parameters Based on Interactions and Types of Websites. Decision Support Systems. 2013;54(2):1030–1043. https://doi.org/10.1016/j.dss.2012.10.036</mixed-citation>
      </ref>
      <ref id="cit3">
        <label>3</label>
        <mixed-citation xml:lang="ru">Вейс Л.Д., Живоглядов В.П. Информационная система поддержки принятия управленческих решений на основе ГИС и WEB-технологий. Информатика и системы управления. 2001;(2):50–57.</mixed-citation>
      </ref>
      <ref id="cit4">
        <label>4</label>
        <mixed-citation xml:lang="ru">Ударцева О.М., Рыхторова А.Е. Использование инструментов веб-аналитики в оценке эффективности способов продвижения библиотечных ресурсов. Библиосфера. 2018;(2):93–99. https://doi.org/10.20913/1815-3186-2018-2-93-99</mixed-citation>
      </ref>
      <ref id="cit5">
        <label>5</label>
        <mixed-citation xml:lang="ru">Butkiewicz M., Madhyastha H.V., Sekar V. Understanding Website Complexity: Measurements, Metrics, and Implications. In: IMC '11: Proceedings of the 2011 ACM SIGCOMM Conference on Internet Measurement Conference, 02–04 November 2011, Berlin, Germany. New York: Association for Computing Machinery; 2011. P. 313–328. https://doi.org/10.1145/2068816.2068846</mixed-citation>
      </ref>
      <ref id="cit6">
        <label>6</label>
        <mixed-citation xml:lang="ru">Khder M. Web Scraping or Web Crawling: State of Art, Techniques, Approaches and Application. International Journal of Advances in Soft Computing &amp; Its Applications. 2021;13(3):145–168.</mixed-citation>
      </ref>
      <ref id="cit7">
        <label>7</label>
        <mixed-citation xml:lang="ru">Tang L., Laban Ph., Durrett G. MiniCheck: Efficient Fact-Checking of LLMs on Grounding Documents. In: EMNLP 2024: Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, 12–16 November 2024, Miami, FL, USA. Association for Computational Linguistics; 2024. P. 8818–8847.</mixed-citation>
      </ref>
      <ref id="cit8">
        <label>8</label>
        <mixed-citation xml:lang="ru">Apu K.U. AI-Driven Data Analytics and Automation: A Systematic Literature Review of Industry Applications. Strategic Data Management and Innovation. 2025;2(01):21–40.</mixed-citation>
      </ref>
      <ref id="cit9">
        <label>9</label>
        <mixed-citation xml:lang="ru">Li X., Pu W., Zhao X. Agent Action Diagram: Toward a Model for Emergency Management System. Simulation Modelling Practice and Theory. 2019;94:66–99. https://doi.org/10.1016/j.simpat.2019.02.004</mixed-citation>
      </ref>
      <ref id="cit10">
        <label>10</label>
        <mixed-citation xml:lang="ru">Van Rossum G., Drake F.L. An Introduction to Python. Bristol: Network Theory Ltd.; 2003. 164 p.</mixed-citation>
      </ref>
      <ref id="cit11">
        <label>11</label>
        <mixed-citation xml:lang="ru">Mateos-Garcia J., Steinmueller W.E. The Institutions of Open Source Software: Examining the Debian Community. Information Economics and Policy. 2008;20(4):333–344. https://doi.org/10.1016/j.infoecopol.2008.06.001</mixed-citation>
      </ref>
    </ref-list>
    <fn-group>
      <fn fn-type="conflict">
        <p>The authors declare that there are no conflicts of interest present.</p>
      </fn>
    </fn-group>
  </back>
</article>