ТЕЗАУРУС
(от греч. thesauros
- сокровище, сокровищница), множество смысловыражающих единиц нек-рого
языка
с заданной на нём системой семантич. (см. Семантика) отношений.
Т. фактически определяет семантику языка (национального языка, языка конкретной
науки или формализованного языка для автоматизированной системы управления).
Первоначально Т. рассматривали как одноязычный словарь, в к-ром семантич.
отношения определяются группировкой слов по тематич. рубрикам. Напр., англ.
Т. (автор П. М. Роджет), изданный в 1962 (1-е изд. 1852), содержит
1040 рубрик, по к-рым распределено ок. 240 000 слов. Указател-ь (ключ)
к
этому Т. содержит алфавитный перечень слов с указанием рубрик и подрубрик,
к к-рым относится каждое слово. Существуют традиционные общеязыковые Т.
(описания семантич. систем отд. языков) для англ., франц., исп.
языков. К Т. весьма близки одноязычные словари, задающие выражения осн.
семантич. параметров каждого слова, напр, словарь рус. языка С. И. Ожегова.
В 70-х гг. 20 в. получили распространение
информационно-поисковые Т. В этих Т. выделены спец. лексич. единицы - дескрипторы.,
по
к-рым можно осуществлять автоматич. поиск документальной информации. С
каждым словом такого Т. сопоставляется синонимичный дескриптор (см. Синонимия),
и
для дескрипторов явным образом указываются семантич. отношения: род - вид,
часть - целое, цель - средство и т. д. Обычно принято разделять родо-видовые
(иерархические) и ассоциативные отношения. Так, "Информационно-поисковый
тезаурус по информатике", изданный в СССР в 1973, для каждого дескриптора
предусматривает словарную статью, где отдельно указаны синонимичные
ключевые слова, родовые, видовые и ассоциативные дескрипторы. Для лучшей
ориентации в ассоциативных связях между дескрипторами к этому Т. приложены
семантич. карты тематич. классов. При автоматизированном информационном
поиске ищутся документы, у к-рых индекс содержит не только дескрипторы
запроса, но и те дескрипторы, к-рые находятся с ними в определённых семантич.
отношениях. Иногда бывает полезно выделять в Т. конкретные ассоциативные
отношения, специфичные для данной тематич. области: болезнь - возбудитель,
прибор - назначение (или измеряемая величина) и т. п. Положение
лексической единицы (слова, словосочетания) в Т. характеризует его
смысл в языке; знание системы семантич. отношений, в к-рые вступает данное
слово (в т. ч. и рубрик, куда оно входит), позволяет судить о смысле
этого слова.
В широком смысле Т. интерпретируют
как описание системы знаний о действительности, к-рыми располагает индивидуальный
носитель информации или группа носителей. Этот носитель может выполнять
функции приёмника дополнит, информации, вследствие чего изменяется и его
Т. Исходный Т. определяет при этом возможности приёмника при получении
им
семантической информации. В психологии и при изучении систем с искусств,
интеллектом рассматривают свойства Т. индивидуумов, проявляющиеся при восприятии
и понимании информации. В социологии и теории коммуникаций изучают свойства
Т. индивидуумов и коллективов, обеспечивающие возможность взаимопонимания
на основе общности Т. В этих ситуациях в Т. приходится включать сложные
высказывания и их семантич. связи, определяющие запас сведений, к-рыми
располагает сложная система. Т. фактически содержит не только информацию
о действительности, но и метаинформацию (сведения об информации),
обеспечивающую возможность приёма новых сообщений.
Лит.: Черный А. И., Общая
методика построения тезаурусов, "Научно-техническая информация. Сер. 2",
1968, Ns 5; Варга Д., Методика подготовки информационных тезаурусов,
пер. [с венг.], М., 1970; Шрейдер Ю.А., Тезаурусы в информатике и теоретической
семантике, "Научнотехническая информация. Сер. 2", 1971, № 3. Ю. А.
Шрейдер.
А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я