Методы обработки сводок происшествий с выявлением особенностей фигурантов и происшествий

Методы обработки сводок с выявлением особенностей

фигурантов и происшествий

Кузнецов Игорь Петрович (ИПИ РАН, г. Москва)

Аннотация

Рассматривается класс систем, ориентированных на обработку сводок для задач правоохранительных органов. Учитывается тот факт, что сводки - это тексты естественного языка, где имеют место многочисленные сокращения, различные способы выражения одного и того же. Система должна иметь средства анализа для устранения неоднозначностей на различных уровнях, для восстановления недостающей информации, ее дополнения существенными характеристиками, для варьирования терминами при поиске похожих происшествий и фигурантов.

В статье описывается подход к построению такого сорта систем, который заключается в использовании лингвистического процессора, обеспечивающего лексический и морфологический анализ с построением простейшей семантической сети. Вся последующая обработка переносится на уровень таких сетей и осуществляется на базе логико-аналитических средств и методов. Рассматривается вид таких сетей для представления содержательных портретов документов, а также терминологического словаря, их использование для выявления особенностей происшествий и фигурантов, для расширения пространства поиска.

Введение

При построении систем, ориентированных на работников правоохранительных органов, возникает задача обработки текстовых документов: описаний происшествий, телефонных книжек, словесных портретов. Как правило, такие документы объединяются в сводки. Требуется анализировать эти сводки и использовать для различных целей, прежде всего, для поиска похожих происшествий, фигурантов. Здесь возникают проблемы, вызванными следующими факторами.

Во-первых, сводки - это тексты естественного языка, где имеют место многочисленные сокращения (ГР-КА, РАБ.МИЛ...), различные способы выражения одного и того же. Каждое слово может присутствовать в виде различных словоформ. Поэтому обработка должна включать морфологический анализ с дополнительными средствами расшифровки сокращений.

Во-вторых, в словесных портретах фигурантов, а также при описании характера происшествий существенными являются термины, словосочетания типа СИНЯЯ КЛЕТЧАТАЯ КУРТКА, РАЗБОЙНОЕ НАПАДЕНИЕ и др. Один и тот же признак или факт может быть выражен с помощью различных терминов и форм. Поэтому обработка сводок должна включать элементы синтактико-семантического анализа. Более того, с помощью такого анализа требуется также уточнять значения слов. Важно знать, что определяют слова типа ШИРОКИЙ, БОЛЬШОЙ, КРУПНЫЙ,... - это форма лба, носа, тела или другой части тела. Просто поиск по таким словам неэффективен.

В-третьих, нужно учитывать, что люди по-разному называют одно и тоже. При поиске похожих фигурантов или происшествий требуется варьировать терминами а рамках их семантических пространств. Система должна знать, к примеру, что СВЕТЛЫЕ ВОЛОСЫ это могут быть РЫЖИЕ ВОЛОСЫ или БЛОНДИН и т.д. При этом требуются элементы логического вывода. Например, по росту 190-195 см. система должна понимать, что человек ВЫСОГО РОСТА.

И наконец, в-четвертых, важную роль при поиске фигурантов и происшествий играют, так называемые, качественные или содержательные признаки, например, отражающие способ проникновения, способ совершения преступления и др. Такие признаки могут в явном виде не присутствовать в текстах. Их нужно восстанавливать, используя соответствующие классификаторы криминальной милиции. К ним пользователи привыкли. Поэтому и объяснение результатов, по возможности, система должна выдавать в терминах этих классификаторов.

В данной статье рассматривается подход к решению перечисленных проблем, который нашел свое воплощение в реально работающей системе "Криминал". Подход заключается в использовании блоков лексического и морфологического анализа, которые делят текст на части (выделяют слова, предложения), приводит слова в каноническую форму и строят на этой основе простейшую семантическую сеть. Вся последующая обработка переносится на уровень таких сетей - они называются РСС. Знания о словах и терминологические словари представляются в виде РСС.

Для обработки используется специальное инструментальное средство - язык ДЕКЛ [1,2,3], основой которого являются РСС и продукции: наборы правил ЕСЛИ... ТО... В правилах допускаются переменные, сняты многие ограничения на левую и правую части. Правила достаточно независимы, их можно легко менять, что обеспечивает высокую эффективность и гибкость. Такой подход позволяет включать в обработку сложные логико-аналитические механизмы. Некоторые из них, относящиеся к обработке языка, будут описаны в настоящей статье.

1. Семантико-ориентированный подход

Семантико-ориентированный подход основывается на модели, в которой базовыми являются понятия:

- значимые объекты (это могут быть лица или "фигуранты", машины, оружие, города, организации и любые другие интересующие пользователя объекты);

- значимые связи или факты (рассматриваются в достаточно широком смысле, т.е. это могут быть приметы, свойства, события, происшествия и вся другая информация, относящаяся к значимым объектам).

Задачи лингвистического процессора:

- деление текста на части (лексический анализ):

- преобразование слов в каноническую форму (морфологический анализ);

- выделение из документа значимых объектов и связей с преобразованием в семантическую сеть, называемую содержательным портретом документа.

Итак, задача лингвистического процессора - построение структуры, удобной для последующей обработки. Система как бы старается быстро отвлечься от чисто языковых явлений, перенося обработку на семантический уровень.

Далее следует этап пост-лингвистической обработки: выявляется аналитическая информация, характеризующая документ и его значимые объекты. Для этого используется терминологический словарь, который тоже представлен в виде семантической сети.

2. Содержательные портреты документов

Содержательный портрет - это семантическая сеть (РСС), которая представляет значимые объекты и их связи [4]. Последние - это наборы сгруппированных признаков (слов в канонической форме).

Признаки группируются с учетом порядка их расположения, а также следующих факторов:

- какую информацию они представляют (приметы, адрес и др.);

- к какому значимому объекту относятся (лицу, машине, оружию и др.);

- в каком месте встретились и сколь близко расположены.

Отметим, что ориентация системы на определенные значимые объекты может легко меняться - за счет изменения в терминологическом словаре соответствующих фрагментов, определяющих классы таких объектов.

Рассмотрим пример содержательного портрета документа, когда система ориентирована на выделение фигурантов, их примет, особенностей и совершаемых действий. Тогда при построении содержательного портрета из документа извлекается информация следующего вида:

- фигуранты, упоминавшиеся в документе (в том числе, неизвестные лица), каждому выявленному фигуранту присваивается свой код;

- ФИО каждого фигуранта (ФИО);

- приметы каждого фигуранта (ПРИМ_);

- национальность;

- адрес каждого фигуранта, где родился, прописан, где проживает (АДР_);

- место работы, должность каждого фигуранта;

- номера телефонов фигурантов;

- место и время происшествия;

- по какой статье проходит происшествие;

- марка и номер машины, ее особенности;

- тип оружия, его номерной знак и другие особенности;

- соотнесенность к предложению (ПРЕДЛ_).

Содержательный портрет состоит из фрагментов. Это понятие шире, чем известное в логике понятие предикат. Каждый фрагмент может иметь свой код, который может стоять на аргументых местах других фрагментов.

Пример 1.

Рассмотрим содержательный портрет одного из документов:

УБИЙСТВО Восточное ОУВД

ОВД мо "Сокольники"

.... обнаружен труп неизвестного мужчины с тремя огнестрельными

ранениями в ногу, живот и область сердца. Давность трупа около 4

часов. Труп направлен в 11 морг. Его приметы: на вид 27-35 лет,

рост 175-180 см. плотного телосложения, волосы черные средней

длины. Одет: пальто серое, коричневый пиджак, черная рубашка,

синие брюки с манжетами....

Содержательный портрет этого документа имеет следующий вид:

ДОК_(24,TEXT,1)

FIO(0+,??,??,??,1)

ЗАГЛ_(24,УБИЙСТВО/1+)

ОУВД(24,ВОСТОЧНЫЙ/2+)

ПРИМ_(0-,ВОЗР.,27,35,РОСТ,175,180,КРЕПКИЙ,

ТЕЛОСЛОЖЕНИЕ,ВОЛОС,"темные волосы",СРЕДНИЙ,ДЛИНА,ПАЛЬТО,СЕРЫЙ,

КОРИЧНЕВЫЙ,ПИДЖАК,ЧЕРНЫЙ,РУБАШКА,СИНИЙ,БРЮКИ,МАНЖЕТА/3+)

ОРГАН_(24,ОВД_МО,СОКОЛЬНИКИ/4+)

ПРЕДЛ_(24,1-,2-,4-,ОБНАРУЖЕНИЕ,ТРУП,0-,МУЖЧИНА,ТРЕМЯ,

ОГНЕСТРЕЛЬНЫЙ,РАНЕНИЕ,НОГА,ЖИВОТ,ОБЛ.,СЕРДЦЕ,ДАВНОСТЬ,ТРУП,

ОКОЛО,4,ЧАС,ТРУП,НАПРАВИТЬ,11,МОРГ,3-,)

Во фрагменте ЗАГЛ_(24,УБИЙСТВО/1+), представляющем заголовок, знак 1+ обозначает его код (код вводится через знак плюс). Знак 1- это тот же самый код, но повторно используемый. С помощью таких кодов указывается место расположения в предложении соответствующей информации, представленной во фрагменте. Сказанное справедливо для

знаков 2+, 2- и др.

Фрагмент ДОК_(24,'1-96',TXT) указывает на порядковый номер документа (это номер 24 по времени поступления) и имя файла 1-96.TXT, содержащего сводку с данным документом.

Фрагмент FIO(0+,??,??,??,1) представляет неизвестное лицо - без ФИО. Если бы ФИО было известно, то на местах ?? стояли бы фамилия-имя-отчество. Знак 0+ есть код фигуранта. С помощью знака 0- указывается приметы (ПРИМ_) этого фигуранта и место, где он встретился в предложении, см. фрагмент ПРЕДЛ_. Аналогичным образом может быть указан его адрес, номер телефона и др.

Каждый признак (слово или словосочетание) соотносится к одному из перечисленных ранее видов. Если такое соотнесение невозможно, то признак соотносится к предложению с указанием его месторасположения.

Признаки сгруппированы по видам, образуя, к примеру, приметы фигуранта (ПРИМ_), его адрес (АДР_), номер телефона (ТЕЛ_), или же указывая на соотнесенность к определенному предложению (ПРЕДЛ_) документа. В каждом фрагменте на первом месте стоит или код фигуранта 0- (если признаки соотнесены к нему) или номер документа 24.

Методы построения содержательных портретов описаны в статье [4], представленной на данную конференцию.

3. Семантические фильтры

Под семантическими фильтрами будем понимать средства анализа, которые (за счет использования терминологического словаря) обеспечивают: автоматическое выявление из текстов особенностей фигурантов, уточняют его словесный портрет, обеспечивают формирование по классификатору особенностей происшествия. Семантический фильтр - это обобщенная форма (наподобие фрейма), в которой имеются уточняемые компоненты.

Важным элементом семантических фильтров являются родо-видовые деревья (называемые SUB-деревьями), а также компоненты, задающие семантические пространства терминов. SUB-деревья состоят из классов, подклассов и значимых объектов, связанных отношением "род-вид" (в ряде случаев в рамках SUB-дерева удобно представлять связь типа "часть-целое"). Такое SUB-дерево включает в себя основные разделы классификатора: преступные действия, оружие, должностные лица, характер связи и др.

Каждый такой раздел расшифровывается. Например:

ОРУЖИЕ:

- КАСТЕТ,

- ПИСТОЛЕТ,

- ВАЛЬТЕР,

- ПИСТОЛЕТ ПМ,....

- РУЖЬЕ, ВИНТОВКА:

- КАРАБИН,

- МЕЛКОКАЛИБЕРНАЯ ВИНТОВКА,...

- ГРАНАТОМЕТ и др.

ОСОБЫЕ ПРИМЕТЫ

- БОРОДА,

- УСЫ и др.

Значимые глаголы (а также другие языковые средства, выражающие интересующие пользователя оценки или явления) делятся на группы или семантические пространства, в каждый из которых помещаются глаголы с похожими действиями или одинаковыми результатами.

Например, УБИЙСТВО, УБИТЬ, ЗАСТРЕЛИТЬ, ЗАРЕЗАТЬ, ЗАДУШИТЬ, ЗАКОЛОТЬ, РАСЧЛЕНИТЬ - у всех этих действий одинаковый результат. Они образуют группу с основным словом <убийство>.

На этой основе строятся семантические фильтры. Типичный пример семантического фильтра:

<убийство> <оружие, инструмент>.

В нем компоненты, стоящие в скобках, заполняются конкретным материалом текста в соответствии с SUB-деревом или семантическим пространством. В результате вычленяется конкретный, интересующий пользователя материал.

Фильтр срабатывает при наличии уточняющего материала, который выявляется в процессе конкретизации. Такой процесс заключается в переборе многих вариантов, где допускаются перестановки слов текста, возможность их нахождения на определенном расстоянии (обычно, не более, чем через 2-3 слова). При этом знаки препинания, служебные слова и предлоги (если они специально не заданы в фильтре) не учитываются. В результате охватываются различные способы выражения одного и того же смысла - с помощью различных форм и средств:

УБИТ ИЗ ПИСТОЛЕТА, ЗАРЕЗАН НОЖОМ, ЗАКОЛОТЬ НОЖОМ и др. Вместо слов ЗАРЕЗАН, НОЖ могут стоять любые другие слова, допустимые в семантическом фильтре.

Отметим некоторые наиболее важные моменты, связанные с построением семантических фильтров.

Во-первых, в ряде случаев элементы SUB-дерева можно пополнять автоматически, пользуясь контекстом. Например: автомашина <...>, город <...>, село <...> и др. Любое слово, стоящее на месте многоточия и начинающиеся с большой буквы, может быть автоматически отнесено к соответствующему классу.

Во-вторых, объекты, выражаемые многосложными формами, можно вводить через специальные семантические фильтры - определения. Например, фильтры

<особые приметы>::=<цвет> <особые приметы>

<одежда>::=<цвет> <одежда>

<одежда>::=<материал> <одежда>

позволяют распознавать словосочетания типа РЫЖАЯ БОРОДА, СИНИЕ ДЖИНСЫ, КОЖАНАЯ КУРТКА,... и относить их к особым приметам (одежде).

4. Терминологический словарь

Терминологический словарь обеспечивает представление типовых классификаторов, служащих для различения особенностей происшествий и фигурантов. Он содержит ключевые понятия (классы), связи между ними, представленные в нотации семантических сетей - РСС.

Терминологический словарь служит, во-первых, для выявления особенностей документа и его значимых объектов (при использовании в семантических фильтрах), и во-вторых, для расширения пространства поиска и формирования объяснительной компоненты.

Терминологический словарь содержит следующие виды связей:

- род-вид, класс-подкласс (для представления таких связей в семантической сети используются фрагменты типа SUB);

- безусловные синонимы (используются фрагменты SYNON);

- условные синонимы, т.е. слова совпадают по смыслу при определенном контексте (фрагменты SYNON);

- антонимы, т.е.противоположные по смыслу (фрагменты OR_OR);

- взаимоисключающие (фрагменты OR_OR);

- близкие по смыслу, т.е. из одного вытекает другое (фрагменты NEAR);

- представляющие семантические фильтры (используются фрагменты WORD);

- образующие словосочетания (фрагменты WORD).

Рассмотрим фрагмент терминологического словаря на примере.

Пример 2.

SUB(ГЛАЗА,СЛЕПОЙ)

SYNON(СЛЕПОЙ,ОСЛЕПНУТЬ,СЛЕПНУТЬ,ПОДСЛЕПОВАТЫЙ)

SUB(ГЛАЗА,"глаза нормальные")

SYNON("глаза нормальные",НОРМАЛЬНЫЙ,ОБЫЧНЫЙ/1+) 1-(ГЛАЗА)

SUB(ГЛАЗА,"плохо видит")

WORD("плохо видит",ПЛОХОЙ,ВИДЕТЬ)

OR_OR("глаза нормальные",СЛЕПОЙ,КОСОГЛАЗЫЙ,"плохо видит")

NEAR(СЛЕПОЙ,"плохо видит")

WORD("Особые приметы",ЦВЕТ,"Особые приметы")

SUB(ЦВЕТ,ЧЕРНЫЙ) NEAR(ЧЕРНЫЙ,ТЕМНЫЙ)

SUB(ЦВЕТ,ТЕМНЫЙ)

SUB(ЦВЕТ,СЕРЫЙ)

SUB("Особые приметы",МАСКА)

SUB("Особые приметы",БАКЕНБАРД)

SUB("Особые приметы",БОРОДА)

Рассмотрим, что значат фрагменты примера 2 и как они используются.

SYNON(СЛЕПОЙ,ОСЛЕПНУТЬ,СЛЕПНУТЬ,ПОДСЛЕПОВАТЫЙ) - означает,

что слова-признаки являются синонимами. Система использует такие фрагменты, чтоб приводить слова-признаки в содержательных портретах входных документах к одному виду. Имеется в виду слово, которое стоит во фрагменте на первом месте. Фактически, таким способом устраняется недостатки блока морфологического анализа.

Фрагмент:

SYNON("глаза нормальные",НОРМАЛЬНЫЙ,ОБЫЧНЫЙ/1+) 1-(ГЛАЗА) - это условный синоним. За счет этого фрагмента в содержательном портрете документа слово НОРМАЛЬНЫЙ или ОБЫЧНЫЙ будет заменено на признак "глаза нормальные" только, если рядом (в пределах 2-3-х позиций) стоит слово ГЛАЗА. Условные синонимы необходимы, так как слова типа НОРМАЛЬНЫЙ, ОБЫЧНЫЙ,... могут относиться к чему угодно.

Фрагмент типа NEAR(...) указывает на близость признаков и используется для расширения пространства поиска, а также при выявлении аналитических признаков. Система вместо слов текста пробует подставлять близкие слова и пробует таким способом искать адекватные документы или выявлять конкретные данные и факты.

Фрагменты типа OR_OR(...) означают или то, или другое, или третье. Они используются в различных видах аналитической обработки для выявления несоответствий, противоречий.

Фрагмент SUB(ГЛАЗА,СЛЕПОЙ) представляет отношение РОД-ВИД. Он означает, что глаза могут быть слепыми. Такие фрагменты служат для соотнесения информации к определенному классу. Они образуют SUB-дерево, представляющее ветви классификатора.

Фрагменты типа WORD("плохо видит",ПЛОХОЙ,ВИДЕТЬ) служат для выявления словосочетаний с пополнением содержательного портрета соответствующими значимыми характеристиками. Признак "плохо видит" будет сформирован при наличии рядом стоящих слов - ПЛОХОЙ, ВИДЕТЬ. Они могут стоять в любом порядке на расстоянии в пределах 2-3-х позиций, что позволяет учесть разнообразные языковые формы с этими словами. Причем, вместо слов-признаков могут стоять их видовые понятия, т.е. пояснения (через SUB), если таковые имеются. Таким образом, фрагменты типа WORD(...) - это обобщенные формы, допускающие различные вариации слов, представленных в SUB-дереве.

Концепция семантических фильтров реализуется с помощью фрагмента вида WORD("Особые приметы",ЦВЕТ,"Особые приметы"), где ЦВЕТ и "Особые приметы" имеют пояснения. Признак "Особые приметы" будет сформирован при наличии рядом стоящих слов, относящихся к классам ЦВЕТ и "Особые приметы". Такие слова могут стоять в любом порядке на расстоянии в пределах 2-3-х позиций, что позволяет учесть разнообразные языковые формы с различными словами.

За счет последнего фрагмента и ветвей SUB-дерева примера 2 словосочетания типа ЧЕРНАЯ МАСКА, РЫЖАЯ БОРОДА также будут отнесены к классу "Особые приметы".

Отметим два важных момента. Во-первых, фрагменты типа SUB(...), OR_OR(...) и NEAR(...) играют важную роль для расширения пространства поиска. На базе имеющихся слов-признаков запроса порождаются так называемые вторичные признаки:

- близкие по смыслу термины (на основе фрагментов NEAR);

- поясняющие термины (на основе фрагментов SUB);

- наличия противоречивых признаков (на основе фрагментов OR_OR). В результате в поиск вовлекается значительно большее число признаков.

Во-вторых, фрагменты типа SUB(...) и WORD(...) фактически представляют собой обобщенные знания, которые позволяют выявлять качественные характеристики в соответствии с родо-видовым деревом. В настоящее время подобные знания строятся человеком. В перспективе фрагменты типа WORD(...) предполагается строить но основе обучающей выборки.

5. Аналитические фрагменты

Аналитические фрагменты представляют значимые признаки, которые выявляются из текста описания и которые характеризуют описываемое происшествие или фигуранта. Для выявления используются классификаторы, заданные в терминологическом словаре, а также семантические фильтры.

Пример основных классов терминологического словаря, характеризующих криминальные происшествия: предварительные действия, способ проникновения, способ совершения преступления, преступные действия, предлог, организация, оружие, транспортные средства, ценные бумаги, драгоценные изделия, ценные изделия.

Пример основных классов терминологического словаря, характеризующих фигурантов (лиц): пол, особые приметы, индивидуальные особенности, телосложение, тип лица, волосы, глаза, лоб, брови, нос, рот, губы, зубы, подбородок, уши, одежда.

Пример 3.

На основе терминологического словаря блок пост-лингвистической обработки сформирует следующие аналитические фрагменты, дополняющие содержательный портрет примера 1:

FIG_(0-,ПОЛ,МУЖЧИНА,ВОЗРАСТ,27,35,РОСТ,175,180,ТЕЛОСЛОЖЕНИЕ,

КРЕПКИЙ,ВОЛОС,"темные волосы",ОДЕЖДА,ПАЛЬТО,СЕРЫЙ,РУБАШКА,

ЧЕРНЫЙ,БРЮКИ,СИНИЙ,ПИДЖАК,КОРИЧНЕВЫЙ,СТАТУС,ПОТЕРПЕВШИЙ,ТРУП)

ANAL_(24,"Преступные действия",РАНЕНИЕ,ОГНЕСТРЕЛЬНЫЙ,ЛИЧНОСТЬ,

"Лицо кавказской национальности")

Первый фрагмент (FIG_) представляет особенности фигуранта с кодом 0-, а второй (ANAL_) - происшествия из документа 24.

Отметим, во-первых, в каждом аналитическом фрагменте признаки расположены в строгой последовательности: за каждым основным классом (ВОЗРАСТ, ТЕЛОСЛОЖЕНИЕ, ВОЛОС, ОДЕЖДА, СТАТУС) идут подклассы (если они есть) и далее - признаки, поясняющие наличие данного класса или подкласса. Например, слово ТРУП поясняет, почему присвоен статус - ПОТЕРПЕВШИЙ.

Во-вторых, упомянутые признаки могут присутствовать в документе в неявном виде. Например, словосочетание ЧЕРНЫЕ ВОЛОСЫ система привела к "темные волосы". Таким способом признаки обобщаются и унифицируются, чтоб легче их было сравнивать.

Другой пример. Признак "Драгоценные изделия" может быть порожден по словам ЗОЛОТО и КОЛЬЦО. При этом слов ДРАГОЦЕННЫЙ и ИЗДЕЛИЯ может не быть в тексте.

Аналитические фрагменты и представленные в них признаки играют важную роль в задачах поиска, объяснения и реферирования документов. Рассмотрим этот вопрос на отдельных задачах.

Поиск похожих документов (происшествий) осуществляется по запросам и заключается в анализе содержательных портретов документов на предмет их совпадения с содержательным портретом запроса. Аналитические признаки используются для быстрого отбора документов, соответствующих запросу. Далее осуществляется детальная оценка этих документов с подсчетом весов близости. Такой вес равен взвешенной сумме совпавших слов-признаков. При этом учитываются как первичные признаки (значимые слова запроса в каноническом виде), так и порожденные - аналитические, которые в общую сумму дают больший вес.

Аналогичную роль аналитические фрагменты играют и при поиске похожих фигурантов. Тогда для отбора документов используются наиболее значимые характеристики словесного портрета, представленные во фрагментах. Далее делается подсчет весов близости - по всем

признакам.

Аналитические фрагменты позволяют давать оценку документа по ключевым позициям, представляющими в сжатом виде наиболее значимую информацию. Такая оценка может играть роль реферата. Более того, с помощью аналитических фрагментов становится возможным при поиске и объяснении использовать привычные человеку классификаторы, что делает результат более понятным.

Заключение

Будущее логико-аналитических систем в области криминалистики в возможности учитывать как можно большее количество факторов. Среди них важное место занимают качественные или содержательные признаки, например, отражающие способ проникновения, способ совершения преступления и др. Большую роль также играют различные признаки: адреса, приметы, место, характер преступления и др. Соответствующие алгоритмы разработаны и реализованы в рамках логико-аналитической системы "Криминал".

Литература:

1. Кузнецов И.П. Пузанов В.В., Шарнин М.М. Система обработки декларативных структур знаний ДЕКЛАР-2. Москва, ИПИАН, 1988 г.

2. Кузнецов И.П. Механизмы обработки семантической информации. М. "Наука", 1978. 175 с.

3. Кузнецов И.П. Шарнин М.М. Интеллектуальный редактор знаний на основе расширенных семантических сетей. В сб. Системы и средства информатики. М. "Наука", 1993.

4. Кузнецов В.П., Мацкевич А.Г. Автоматическое выявление из документов значимой информации с помощью шаблонов и контекста, См. труды наст. конференции.