<?xml version="1.0" encoding="UTF-8"?>
<article article-type="research-article" dtd-version="1.3" xml:lang="ru" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="https://metafora.rcsi.science/xsd_files/journal3.xsd">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">moitvivt</journal-id>
      <journal-title-group>
        <journal-title xml:lang="ru">Моделирование, оптимизация и информационные технологии</journal-title>
        <trans-title-group xml:lang="en">
          <trans-title>Modeling, Optimization and Information Technology</trans-title>
        </trans-title-group>
      </journal-title-group>
      <issn pub-type="epub">2310-6018</issn>
      <publisher>
        <publisher-name>Издательство</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.26102/2310-6018/2018.23.4.014</article-id>
      <article-id pub-id-type="custom" custom-type="elpub">524</article-id>
      <title-group>
        <article-title xml:lang="ru">АВТОМАТИЗАЦИЯ СРАВНЕНИЯ ХИМИЧЕСКИХ ФОРМУЛ</article-title>
        <trans-title-group xml:lang="en">
          <trans-title>THE AUTOMATIZATION OF CHEMICAL FORMULAS COMPARISON</trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Вайнгольц</surname>
              <given-names>Наталия Александровна</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Vayngolts</surname>
              <given-names>Natalia Alexandrovna</given-names>
            </name>
          </name-alternatives>
          <email>natalia.vayngolts@gmail.com</email>
          <xref ref-type="aff">aff-1</xref>
        </contrib>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Верещак</surname>
              <given-names>Григорий Алексеевич</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Vereshchak</surname>
              <given-names>Grigory Alekseevich</given-names>
            </name>
          </name-alternatives>
          <email>grigoryg37@gmail.com</email>
          <xref ref-type="aff">aff-2</xref>
        </contrib>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Коробкин</surname>
              <given-names>Дмитрий Михайлович</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Korobkin</surname>
              <given-names>Dmitry Mikhailovich</given-names>
            </name>
          </name-alternatives>
          <email>dkorobkin80@mail.ru</email>
          <xref ref-type="aff">aff-3</xref>
        </contrib>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Фоменков</surname>
              <given-names>Сергей Алексеевич</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Fomenkov</surname>
              <given-names>Sergey Alekseevich</given-names>
            </name>
          </name-alternatives>
          <email>saf550@yandex.ru</email>
          <xref ref-type="aff">aff-4</xref>
        </contrib>
      </contrib-group>
      <aff-alternatives id="aff-1">
        <aff xml:lang="ru">Волгоградский государственный технический университет</aff>
        <aff xml:lang="en">Volgograd State Technical University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-2">
        <aff xml:lang="ru">Волгоградский государственный технический университет</aff>
        <aff xml:lang="en">Volgograd State Technical University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-3">
        <aff xml:lang="ru">Волгоградский государственный технический университет</aff>
        <aff xml:lang="en">Volgograd State Technical University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-4">
        <aff xml:lang="ru">Волгоградский государственный технический университет</aff>
        <aff xml:lang="en">Volgograd State Technical University</aff>
      </aff-alternatives>
      <pub-date pub-type="epub">
        <day>01</day>
        <month>01</month>
        <year>2026</year>
      </pub-date>
      <volume>1</volume>
      <issue>1</issue>
      <elocation-id>10.26102/2310-6018/2018.23.4.014</elocation-id>
      <permissions>
        <copyright-statement>Copyright © Авторы, 2026</copyright-statement>
        <copyright-year>2026</copyright-year>
        <license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This work is licensed under a Creative Commons Attribution 4.0 International License</license-p>
        </license>
      </permissions>
      <self-uri xlink:href="https://moitvivt.ru/ru/journal/article?id=524"/>
      <abstract xml:lang="ru">
        <p>Эксперту патентного ведомства для установления уникальности&#13;
патентируемой технологии необходимо провести сравнение патентной заявки с&#13;
документами патентного массива и удостовериться в отсутствии полных аналогов&#13;
изобретения. При анализе патентов химических классов требуется сравнивать&#13;
химические формулы, которые могут быть приведены в различных форматах: MOL,&#13;
InChi, SMILES, структурная формула, молекулярный отпечаток. В данной работе&#13;
описывается разработка программного модуля, автоматизирующего процедуры&#13;
конвертации различных способов формализации химической формулы, сравнения&#13;
формул химических соединений в патентной заявке и документах патентного&#13;
массива, выявления патентов-аналогов на основе результатов сравнения химических&#13;
соединений, содержащихся в патентах. Сравнение химических формул производится&#13;
на основе вычисления схожести молекулярных отпечатков с использованием&#13;
коэффициента Танимото. Коэффициент схожести патентов вычисляется на основе&#13;
максимальных значений коэффициента Танимото для набора сравниваемых&#13;
химических соединений из патентов. Программный модуль реализован на языке Java с&#13;
использованием технологии Spring Framework, СУБД H2 и библиотеки Chemistry&#13;
Development Kit (CDK). Реализованный программный модуль показал высокую&#13;
эффективность (высокая полнота и точность поиска патентов-аналогов на основе&#13;
химических формул, низкие значения потери информации и информационный шум) при&#13;
проверке на тестовом патентном массиве.</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <p>An expert of the patent office to establish the uniqueness of the patented technology, it&#13;
is necessary to compare the patent application with the patents and make sure that there are&#13;
no analogues of the invention. When analyzing patents of chemical classes, it is required to&#13;
compare chemical formulas that can be given in different formats: MOL, InChi, SMILES,&#13;
structural formula, molecular fingerprint. This paper describes the development of a software&#13;
that automates the procedures: conversion of various formalization of the chemical formula,&#13;
comparison of chemical formulas from the patent application and patents, identification of&#13;
patents-analogues based on the results of comparison of chemical formulas. Comparison of&#13;
chemical formulas is based on the calculation of the similarity of molecular fingerprints using&#13;
the Tanimoto coefficient. The coefficient of similarity of patents is calculated based on the&#13;
maximum values of the Tanimoto coefficient for a set of compared chemical compounds from&#13;
patents. The software is developed on Java using the Spring Framework technology, the H2,&#13;
and the Chemistry Development Kit (CDK). The software showed a high performance (high&#13;
recall and precision of the patent search on the basis of chemical formulas, the lowest values&#13;
of the information loss and noise).</p>
      </trans-abstract>
      <kwd-group xml:lang="ru">
        <kwd>химическая формула</kwd>
        <kwd>smiles</kwd>
        <kwd>inchi</kwd>
        <kwd>mdl molfile</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>chemical formula</kwd>
        <kwd>smiles</kwd>
        <kwd>inchi</kwd>
        <kwd>mdl molfile</kwd>
      </kwd-group>
      <funding-group>
        <funding-statement xml:lang="ru">Исследование выполнено без спонсорской поддержки.</funding-statement>
        <funding-statement xml:lang="en">The study was performed without external funding.</funding-statement>
      </funding-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <title>References</title>
      <ref id="cit1">
        <label>1</label>
        <mixed-citation xml:lang="ru">Д.М. Коробкин, Н.А. Гордеев, С.А. Фоменков, М.А. Дыков. Метод&#13;
выявления патентных трендов на основе описаний технических&#13;
функций. Известия ВолгГТУ. Сер. Актуальные проблемы управления,&#13;
вычислительной техники и информатики в технических системах. -&#13;
Волгоград, 2018. - № 5 (215). - C. 56-60.</mixed-citation>
      </ref>
      <ref id="cit2">
        <label>2</label>
        <mixed-citation xml:lang="ru">Д.М. Коробкин, С.А. Фоменков, И.А. Кобликов, Г.А. Карачунова.&#13;
Методика семантического патентного поиска. Известия ВолгГТУ.&#13;
Сер. Актуальные проблемы управления, вычислительной техники и&#13;
информатики в технических системах. - Волгоград, 2017. - № 1 (196). -&#13;
C. 65-73.</mixed-citation>
      </ref>
      <ref id="cit3">
        <label>3</label>
        <mixed-citation xml:lang="ru">Chemical formula | Britannica.com [Электронный ресурс]. – Режим&#13;
доступа : https://www.britannica.com/science/chemical-formula (дата&#13;
обращ. 15.05.2018).</mixed-citation>
      </ref>
      <ref id="cit4">
        <label>4</label>
        <mixed-citation xml:lang="ru">MDL Information Systems, Inc. CTFile Formats / MDL Information&#13;
Systems, Inc. – San Leandro : MDL Information Systems, 2003. – 106 с.</mixed-citation>
      </ref>
      <ref id="cit5">
        <label>5</label>
        <mixed-citation xml:lang="ru">Heller, R. The IUPAC International Chemical Identifier (InChI) / R. Heller,&#13;
Alan D. McNaught // CHEMISTRY International. – 2009. – № 1. – С. 7-9.</mixed-citation>
      </ref>
      <ref id="cit6">
        <label>6</label>
        <mixed-citation xml:lang="ru">Daylight Theory: SMILES [Электронный ресурс]. – Режим доступа :&#13;
http://www.daylight.com/dayhtml/doc/theory/theory.smiles.html (дата&#13;
обращ. 15.05.2018).</mixed-citation>
      </ref>
      <ref id="cit7">
        <label>7</label>
        <mixed-citation xml:lang="ru">Dalke, A. Molecular fingerprints, background [Электронный ресурс] // A.&#13;
Dalke. – Режим доступа : http://www.dalkescientific.com/writings/diary/&#13;
archive/2008/06/26/fingerprint_background.html (дата обращ.&#13;
15.05.2018).</mixed-citation>
      </ref>
      <ref id="cit8">
        <label>8</label>
        <mixed-citation xml:lang="ru">Bulk Data Storage System [Электронный ресурс]. – 2018. – Режим&#13;
доступа : https://bulkdata.uspto.gov/ (дата обращ. 25.10.2018).</mixed-citation>
      </ref>
      <ref id="cit9">
        <label>9</label>
        <mixed-citation xml:lang="ru">ChemSpider reaches 50 million compounds [Электронный ресурс]. –&#13;
Режим доступа: http://www.rsc.org/journals-books-databases/librariansinformation/librarians-notes/all-articles/2016/jun/chemspider-reaches-50-&#13;
million-compounds/ (дата обращ. 18.05.2018).</mixed-citation>
      </ref>
      <ref id="cit10">
        <label>10</label>
        <mixed-citation xml:lang="ru">PubChem Docs – About [Электронный ресурс]. – Режим доступа:&#13;
https://pubchemdocs.ncbi.nlm.nih.gov/about (дата обращ. 18.05.2018).</mixed-citation>
      </ref>
      <ref id="cit11">
        <label>11</label>
        <mixed-citation xml:lang="ru">ChemSynthesis – Chemical Database [Электронный ресурс]. – Режим&#13;
доступа: http://www.chemsynthesis.com/ (дата обращ. 18.05.2018).</mixed-citation>
      </ref>
      <ref id="cit12">
        <label>12</label>
        <mixed-citation xml:lang="ru">NCI/CADD Chemical Resolver – Chemical Identifier Resolver&#13;
documentation [Электронный ресурс]. – Режим доступа:&#13;
https://cactus.nci.nih.gov/chemical/structure_documentation (дата обращ.&#13;
18.05.2018).</mixed-citation>
      </ref>
      <ref id="cit13">
        <label>13</label>
        <mixed-citation xml:lang="ru">Д.М. Коробкин, Е.А. Тюлькина, С.А. Фоменков, С.Г. Колесников.&#13;
Система извлечения технических функций из патентного массива.&#13;
ИТНОУ: Информационные технологии в науке, образовании и&#13;
управлении. - 2017. - № 2 (2). - C. 24-30.&#13;
</mixed-citation>
      </ref>
      <ref id="cit14">
        <label>14</label>
        <mixed-citation xml:lang="ru">И.А. Кобликов, Д.М. Коробкин, С.А. Фоменков, В.А. Яровенко.&#13;
Методика извлечения описаний реализуемых в патенте технических&#13;
функций. Известия ВолгГТУ. Сер. Актуальные проблемы управления,&#13;
вычислительной техники и информатики в технических системах. -&#13;
Волгоград, 2017. - № 8 (203). - C. 55-59.</mixed-citation>
      </ref>
      <ref id="cit15">
        <label>15</label>
        <mixed-citation xml:lang="ru">Tanimoto (cdk 2.1-SNAPSHOT API) [Электронный ресурс]. – Режим&#13;
доступа:&#13;
http://cdk.github.io/cdk/2.1/docs/api/org/openscience/cdk/similarity/&#13;
Tanimoto.html (дата обращ. 21.05.2018).</mixed-citation>
      </ref>
      <ref id="cit16">
        <label>16</label>
        <mixed-citation xml:lang="ru">Spring Framework Overview [Электронный ресурс]. – Режим доступа:&#13;
https://www.tutorialspoint.com/spring/spring_overview.htm (дата обращ.&#13;
18.05.2018).&#13;
</mixed-citation>
      </ref>
      <ref id="cit17">
        <label>17</label>
        <mixed-citation xml:lang="ru">. Spring Boot and H2 in memory database – Why, What and How? – Spring&#13;
Boot Tutorial [Электронный ресурс]. – Режим доступа:&#13;
http://www.springboottutorial.com/spring-boot-and-h2-in-memorydatabase (дата обращ. 19.05.2018).</mixed-citation>
      </ref>
      <ref id="cit18">
        <label>18</label>
        <mixed-citation xml:lang="ru">Chemistry Development Kit [Электронный ресурс]. – Режим доступа:&#13;
https://cdk.github.io/ (дата обращ. 19.05.2018).</mixed-citation>
      </ref>
      <ref id="cit19">
        <label>19</label>
        <mixed-citation xml:lang="ru">Гопта Е.А., Фоменков С.А., Карачунова Г.А. Автоматизация процесса&#13;
линейного синтеза физического принципа действия. Известия&#13;
Волгоградского государственного технического университета. 2010.&#13;
№ 11 (71). С. 129-133.</mixed-citation>
      </ref>
    </ref-list>
    <fn-group>
      <fn fn-type="conflict">
        <p>The authors declare that there are no conflicts of interest present.</p>
      </fn>
    </fn-group>
  </back>
</article>