Ключевые слова: технические функции, обработка естественно-языковых текстов, патенты, роспатент, link grammar parser, грамматика
ИЗВЛЕЧЕНИЕ ОПИСАНИЙ МОРФОЛОГИЧЕСКИХ ПРИЗНАКОВ ТЕХНИЧЕСКИХ ОБЪЕКТОВ ИЗ РУССКОЯЗЫЧНЫХ ПАТЕНТОВ
УДК 004.89
DOI: 10.26102/2310-6018/2018.23.4.031
Задача автоматизации синтеза инновационных решений в области технических систем и технологий является одной из наиболее приоритетных проблем науки. Авторы работы предлагают осуществлять автоматизацию важнейших, начальных этапов проектирования новых технических систем и технологий на основе актуализируемых баз знаний, полученных из мирового патентного массива, в том числе из патентной базы РосПатента. Согласно методу морфологического анализа и синтеза предполагается, что из некоторого технического решения (патента) извлекаются основные структурные признаки (функции технических объектов), на основе которых ищутся альтернативные варианты. Все полученные признаки сводятся в морфологическую таблицу, комбинируются, что дает множество новых решений. В данной работе описывается процесс разработки модуля извлечения описаний технических функций из российских патентов. Была сформирована грамматика представления описаний технических функций в текстах русскоязычных патентов согласно модели «Действие-Объект-Условие»; разработаны алгоритмы первичной обработки патентного массива, извлечения технических функций посредством анализа деревьев зависимостей, формирования морфологической таблицы. Работоспособность программного модуля, состоящего из блока обработки патентного массива; блока сегментации текста патентной формулы; блока семантического анализа текста; блока извлечения описаний технических функций; блока представления результатов обработки патентного массива, была проверена на ряде тестовых задач.
1. Половинкин А.И. Методы инженерного творчества: учеб. пособие / Половинкин А.И.; ВПИ. - Волгоград, 1984. - 365 с.
2. Фоменков С.А., Давыдов Д.А., Камаев В.А. Моделирование и автоматизированное использование структурированных физических знаний. Монография. - М.: Машиностроение - 1, 2004. - 278 с.
3. Давыдов Д.А., Фоменков С.А. Автоматизированное проектирование линейных структур физических принципов действия технических систем. //Машиностроитель, 2002, №2, с. 33-35.
4. Фоменков С.А., Колесников С.Г., Коробкин Д.М. Методика модификации информационного обеспечения базы данных физических эффектов. Известия Волгоградского государственного технического университета. 2012. № 10 (97). С. 166-170.
5. Дыков М.А., Кравец А.Г., Коробкин Д.М., Укустов С.М., Сальников М.Ю. Автоматизированная система принятия решений при патентной экспертизе. Известия Волгоградского государственного технического университета. 2014. № 6 (133). С. 35-41.
6. Коробкин Д.М., Фоменков С.А., Колесников С.Г. Автоматизация процесса формирования информационного обеспечения базы данных физических эффектов. Вестник компьютерных и информационных технологий. 2005. № 3 (9). С. 22-25.
7. Поисковая система ФИПС РосПатента [Электронный ресурс]. – 2018. – Режим доступа : http://www1.fips.ru/wps/portal/IPS_Ru (дата обращ. 25.10.2018).
8. Кобликов И.А., Коробкин Д.М., Фоменков С.А., Яровенко В.А. Методика извлечения описаний реализуемых в патенте технических функций. Известия Волгоградского государственного технического университета. 2017. № 8 (203). С. 55-59.
9. Коробкин Д.М., Тюлькина Е.А., Фоменков С.А., Колесников С.Г. Система извлечения технических функций из патентного массива. ИТНОУ: Информационные технологии в науке, образовании и управлении. 2017. № 2 (2). С. 24-30.
10. Korobkin D., Fomenkov S., Kravets A., Kolesnikov S., Dykov M. Threesteps methodology for patents prior-art retrieval and structured physical knowledge extracting. Communications in Computer and Information Science. 2015. Т. 535. С. 124-136.
11. Link Grammar Parser [Электронный ресурс]. – 1998. – Режим доступа : http://www.abisource.com/projects/linkgrammar (дата обращ. 28.05.18).
12. Korobkin D.M., Fomenkov S.A., Kolesnikov S.G. A function-based patent analysis for support of technical solutions synthesis. В сборнике: 2016 2nd International Conference on Industrial Engineering, Applications and Manufacturing, ICIEAM 2016 – Proceedings 2. 2016.
13. Хомский Н., Миллер Дж. Введение в формальный анализ естественных языков // Кибернетический сборник / Под ред. А.А.Ляпунова и О.Б.Лупанова. — М.: Мир, 1965.
14. Коробкин Д.М., Колесников С.Г., Фоменков С.А. Методика извлечения практического применения физических эффектов из патентных документов. В сборнике: Информационные технологии в науке, образовании и управлении материалы XLIV международной конференции и XIV международной конференции молодых учёных IT + S&E`16. под редакцией Е.Л. Глориозова. 2016. С. 92-100.
15. Korobkin D.M., Fomenkov S.A., Kolesnikov S.G. Ontology-Based extraction of Physical Effect description from Russian text. В сборнике: Proceedings of the European Conference on Data Mining 2014 and International Conferences on Intelligent Systems and Agents 2014 and Theory and Practice in Modern Computing 2014 - Part of the Multi Conference on Computer Science and Information Systems, MCCSIS 2014 2014. С. 260-262.
16. Изучаем Spark: молниеносный анализ данных / Х. Карау, Э. Конвински, П. Венделл, М. Захария. - Москва: ДМК Пресс, 2015. - 304 с
Ключевые слова: технические функции, обработка естественно-языковых текстов, патенты, роспатент, link grammar parser, грамматика
Для цитирования: Васильев С.С., Харитонов А.А., Коробкин Д.М., Фоменков С.А. ИЗВЛЕЧЕНИЕ ОПИСАНИЙ МОРФОЛОГИЧЕСКИХ ПРИЗНАКОВ ТЕХНИЧЕСКИХ ОБЪЕКТОВ ИЗ РУССКОЯЗЫЧНЫХ ПАТЕНТОВ. Моделирование, оптимизация и информационные технологии. 2018;6(4). URL: https://moit.vivt.ru/wp-content/uploads/2018/10/VasilyevSoavtori_4_18_1.pdf DOI: 10.26102/2310-6018/2018.23.4.031
Опубликована 31.12.2018