Ключевые слова: технические системы, патенты, онтология, извлечение информации
Метод формирования онтологии предметной области «Патентное представление технических систем» для поиска инновационных технических решений
УДК 004.89
DOI: 10.26102/2310-6018/2020.31.4.007
В данной работе решалась одна из самых насущных проблем синтеза новых технических решений – автоматизированное формирование информационного обеспечения на основе анализа патентов USPTO. С развитием направления автоматизированного изобретательства в последнее время все больше используются CAI-системы (Computer-Aided Invention). Наполненность баз знаний и полнота онтологий предметных областей напрямую влияет на успешность работы CAI-систем. Цель работы заключалась в разработке метода автоматизированного формирования онтологии предметной области «Патентное представление технических систем» для поиска инновационных технических решений. В качестве концептов онтологии предметной области «Патентное представление технических систем» рассматривались элементы конструкции технического объекта (ТО) и связи между ними, а так же описания решаемых изобретением проблем. Первый пункт формулы изобретения патентного документа выступал в качестве основного источника информации. Единицей извлечения являлись семантические структуры SAO (Subject-Action-Object). Были определены основные лингвистические особенности патентных документов. Сформированы методы предварительной обработки патентного массива, извлечения SAO из формулы патента, экспорта извлеченных SAO в онтологию предметной области. Разработанные методы были апробированы на патентных документах США. Среднее время разбора одного патента автоматизированной системой составляет 1.72316 секунды, показатели точности извлечения информации из текста патента - выше 70%.
1. Коробкин Д.М., Фоменков С.А., Колесников С.А. Метод синтеза функциональной структуры новых технических решений на основе данных патентных массивов. Моделирование, оптимизация и информационные технологии. 2019;7(2):135-148.
2. Коробкин Д.М., Фоменков С.А., Колесников С.Г. Автоматизация процесса формирования информационного обеспечения базы данных физических эффектов. Вестник компьютерных и информационных технологий. 2005;3(9):22-25.
3. Kharitonov A., Korobkin D., Fomenkov S., Kolesnikov S. Extraction of morphological features of technical systems from russian patent. В сборнике: CEUR Workshop Proceedings. IS 2019 - Proceedings of the 14th International Conference on Interactive Systems: Problems of Human-Computer Interaction. 2019:205-213.
4. Korobkin D.M., Vasiliev S.S., Fomenkov S.A., Lobeyko V.I. Extraction of structural elements of inventions from russian-language patents. В сборнике: Multi Conference on Computer Science and Information Systems, MCCSIS 2019 - Proceedings of the International Conferences on Big Data Analytics, Data Mining and Computational Intelligence 2019 and Theory and Practice in Modern Computing 2019. 4. 2019:159-166.
5. Васильев С.С., Коробкин Д.М., Фоменков С.А. Метод извлечения элементов конструкции изобретений из русскоязычных патентов. Математические методы в технике и технологиях - ММТТ. 2019;7:105-110.
6. Choi, S. et al. SAO network analysis of patents for technology trends identification: A case study of polymer electrolyte membrane technology in proton exchange membrane fuel cells. Scientometrics, 2011:863-883.. DOI: 10.1007/s11192-011-0420-z.
7. Stanza, 2020. URL: https://stanfordnlp.github.io/stanza/.
8. Kravets A.G., Korobkin D.M., Dykov M.A.E-patent examiner: two-steps approach for patents prior-art retrieval. В сборнике: IISA 2015 - 6th International Conference on Information, Intelligence, Systems and Applications. 2015. DOI: 10.1109/IISA.2015.7388074.
Ключевые слова: технические системы, патенты, онтология, извлечение информации
Для цитирования: Верещак Г.А., Коробкин Д.М., Фоменков С.А., Фоменкова М.А., Колесников С.Г. Метод формирования онтологии предметной области «Патентное представление технических систем» для поиска инновационных технических решений. Моделирование, оптимизация и информационные технологии. 2020;8(4). URL: https://moitvivt.ru/ru/journal/pdf?id=853 DOI: 10.26102/2310-6018/2020.31.4.007
Опубликована 31.12.2020