Метод формирования онтологии предметной области «Патентное представление технических систем» для поиска инновационных технических решений
Работая с нашим сайтом, вы даете свое согласие на использование файлов cookie. Это необходимо для нормального функционирования сайта, показа целевой рекламы и анализа трафика. Статистика использования сайта отправляется в «Яндекс» и «Google»
Научный журнал Моделирование, оптимизация и информационные технологииThe scientific journal Modeling, Optimization and Information Technology
cетевое издание
issn 2310-6018

Метод формирования онтологии предметной области «Патентное представление технических систем» для поиска инновационных технических решений

Верещак Г.А.   Коробкин Д.М.   Фоменков С.А.   Фоменкова М.А.   Колесников С.Г.  

УДК 004.89
DOI: 10.26102/2310-6018/2020.31.4.007

  • Аннотация
  • Список литературы
  • Об авторах

В данной работе решалась одна из самых насущных проблем синтеза новых технических решений – автоматизированное формирование информационного обеспечения на основе анализа патентов USPTO. С развитием направления автоматизированного изобретательства в последнее время все больше используются CAI-системы (Computer-Aided Invention). Наполненность баз знаний и полнота онтологий предметных областей напрямую влияет на успешность работы CAI-систем. Цель работы заключалась в разработке метода автоматизированного формирования онтологии предметной области «Патентное представление технических систем» для поиска инновационных технических решений. В качестве концептов онтологии предметной области «Патентное представление технических систем» рассматривались элементы конструкции технического объекта (ТО) и связи между ними, а так же описания решаемых изобретением проблем. Первый пункт формулы изобретения патентного документа выступал в качестве основного источника информации. Единицей извлечения являлись семантические структуры SAO (Subject-Action-Object). Были определены основные лингвистические особенности патентных документов. Сформированы методы предварительной обработки патентного массива, извлечения SAO из формулы патента, экспорта извлеченных SAO в онтологию предметной области. Разработанные методы были апробированы на патентных документах США. Среднее время разбора одного патента автоматизированной системой составляет 1.72316 секунды, показатели точности извлечения информации из текста патента - выше 70%.

1. Коробкин Д.М., Фоменков С.А., Колесников С.А. Метод синтеза функциональной структуры новых технических решений на основе данных патентных массивов. Моделирование, оптимизация и информационные технологии. 2019;7(2):135-148.

2. Коробкин Д.М., Фоменков С.А., Колесников С.Г. Автоматизация процесса формирования информационного обеспечения базы данных физических эффектов. Вестник компьютерных и информационных технологий. 2005;3(9):22-25.

3. Kharitonov A., Korobkin D., Fomenkov S., Kolesnikov S. Extraction of morphological features of technical systems from russian patent. В сборнике: CEUR Workshop Proceedings. IS 2019 - Proceedings of the 14th International Conference on Interactive Systems: Problems of Human-Computer Interaction. 2019:205-213.

4. Korobkin D.M., Vasiliev S.S., Fomenkov S.A., Lobeyko V.I. Extraction of structural elements of inventions from russian-language patents. В сборнике: Multi Conference on Computer Science and Information Systems, MCCSIS 2019 - Proceedings of the International Conferences on Big Data Analytics, Data Mining and Computational Intelligence 2019 and Theory and Practice in Modern Computing 2019. 4. 2019:159-166.

5. Васильев С.С., Коробкин Д.М., Фоменков С.А. Метод извлечения элементов конструкции изобретений из русскоязычных патентов. Математические методы в технике и технологиях - ММТТ. 2019;7:105-110.

6. Choi, S. et al. SAO network analysis of patents for technology trends identification: A case study of polymer electrolyte membrane technology in proton exchange membrane fuel cells. Scientometrics, 2011:863-883.. DOI: 10.1007/s11192-011-0420-z.

7. Stanza, 2020. URL: https://stanfordnlp.github.io/stanza/.

8. Kravets A.G., Korobkin D.M., Dykov M.A.E-patent examiner: two-steps approach for patents prior-art retrieval. В сборнике: IISA 2015 - 6th International Conference on Information, Intelligence, Systems and Applications. 2015. DOI: 10.1109/IISA.2015.7388074.

Верещак Григорий Алексеевич

Волгоградский государственный технический университет

Волгоград, Российская Федерация

Коробкин Дмитрий Михайлович
кандидат технических наук доцент

Волгоградский государственный технический университет

Волгоград, Российская Федерация

Фоменков Сергей Алексеевич
доктор технических наук профессор

Волгоградский государственный технический университет

Волгоград, Российская Федерация

Фоменкова Марина Александровна

Волгоградский государственный технический университет

Волгоград, Российская Федерация

Колесников Сергей Григорьевич

Волгоградский государственный технический университет

Волгоград, Российская Федерация

Ключевые слова: технические системы, патенты, онтология, извлечение информации

Для цитирования: Верещак Г.А. Коробкин Д.М. Фоменков С.А. Фоменкова М.А. Колесников С.Г. Метод формирования онтологии предметной области «Патентное представление технических систем» для поиска инновационных технических решений. Моделирование, оптимизация и информационные технологии. 2020;8(4). Доступно по: https://moitvivt.ru/ru/journal/pdf?id=853 DOI: 10.26102/2310-6018/2020.31.4.007

481

Полный текст статьи в PDF