СПОСОБ И СИСТЕМА СЕМАНТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТОВЫХ ДОКУМЕНТОВ
申请公布号:RU2016133365(A)
申请号:RU20160133365
申请日期:2016.08.12
申请公布日期:2016.12.20
发明人:Мительков Дмитрий Владимирович;Новиков Андрей Юрьевич;Сатин Борис Борисович
分类号:G06F17/27
主分类号:G06F17/27
摘要:1. Способ семантической обработки текстовых документов, заключающийся в том, что:морфологически и синтаксически анализируют содержание текстового документа и запроса пользователя;сегментируют текст на клаузы;формируют функционально-ролевые структуры клауз;выявляют референциальную связность между игроками функционально-ролевых структур клауз;кореферент с наибольшей степенью общности заменяют кореферентом с более конкретным значением;определяют риторические отношения между клаузами и более крупными текстовыми элементами;связывают функционально-ролевые структуры клауз риторическими отношениями для получения дискурсного графа текстового документа и запроса пользователя;сформированный дискурсный граф текстового документа дописывают к метаинформации текстового документа;индексируют текстовый документ по игрокам функционально-ролевых структур клауз;для каждой функционально-ролевой структуры клауз запроса пользователя производят оценку соответствия функционально-ролевым структурам клауз текстового документа;производят оценку соответствия риторических отношений между функционально-ролевыми структурами клауз текстового документа и запроса;производят оценку расстояния от пересечения дискурсных графов запроса пользователя и текстового документа до ядра дискурсного графа текстового документа;определяют значение функции соответствия текстового документа запросу пользователя (ценность текстового документа);ранжируют по ценности текстовые документы с учетом семантических признаков;отсекают текстовые документы, ценность которых ниже порога, заданного