Главная Страница > Системы |
Система обеспечивает
автоматическую формализацию различного рода справок и сообщений (заявок на
работу, резюме, автобиографических данных), представляющих собой тексты
естественного языка.
Перед многими службами,
имеющими дело с потоками текстовой информации, возникает проблема их
формализации: необходимость представления в тех формах, которые приняты в этих
службах и в рамках которых данная информация используется. Например, важная
задача многих кадровых и рекрутинговых агентств связана автоматической обработкой автобиографических
данных, заявок на работу (резюме), написанных в достаточно произвольной форме -
в виде текстов естественного языка (ЕЯ). Такие тексты содержат сведения о
человеке: ФИО, год рождения, адрес, время и место учебы с указанием
наименования учебного заведения, факультета, специальности, места работы
(организации) с указанием периода работы, должности, основных обязанностей и
др. Будем называть эти данные информационными объектами.
Использовать такие тексты,
представленные в электронном виде, например, для поиска нужного работника,
составления разного рода отчетов, оказывается не простой задачей.
Полнотекстовые базы данных могут служить для поиска отдельных компонент: ФИО,
организаций с уникальными названиями и др. Но общей картины получить трудно.
Требуется формализация текстов:
выделение значимых компонент (информационных объектов) и их отображение на поля
требуемой анкеты с фиксированными полями или сайта. Тогда становится возможным
использование типовых средств для решения
пользовательских задач. Во многих службах и агентствах такая формализация
делается вручную специально подготовленными людьми, или же самим человеком,
которому предлагается ввести его сведения в указанные поля по требуемой форме.
Это достаточно трудоемкая работа. Следует также учитывать тот факт, что во
многих службах и агентствах уже накоплены в электронном виде данные большого
объема, представляющие собой неформализованную информацию - тексты ЕЯ. Требуется
их формализация.