Теоретические основы анализа многомерных данных энтропийными методами

(Материалы к гранту по проекту РФФИ 05-08-65501-А)


 
Предлагается подход к решению проблемы построения процедур автоматической
классификации многомерных данных в медико-биологических и физико-технических 
задачах на основе использования  специальных мер различий, обладающих
энтропийными свойствами. Потребность использования таких мер обусловлена 
необходимостью выявления структурных отличий в многомерных признаках 
исследуемых объектов, которые содержат информацию об их состояниях. 
Отличительной особенностью таких мер является наличие метрических свойств, 
чувствительность к малым и большим значениям признаков и инвариантность 
к мультипликативным константам. Это позволяет использовать их для классификации 
объектов, описываемых признаками различной физической природы без их 
предварительной нормировки. Приведен явный вид предлагаемых мер, а эффективность 
их использования в алгоритмах автоматической классификации показана 
на кластеризации признаков цветов ириса.
 
Н.И. Куренков, д-р техн. наук, доц.
С.Н. Ананьев, канд. техн. наук, доц.
"Энтропийный подход к решению задач классификации многомерных данных"
 
_____________________________________________________________________________________
The approach to the decision of a problem of construction of procedures of automatic 
classification of large-scale, high-dimensional data sets in medical and biologic, 
physics and technical tasks on the basis of use of special divergence measures, 
possessing entropy properties is offered. The need of use of such measures is caused 
by necessity of revealing of structural differences for multidimensional attributes 
of investigated objects, which contain the information on their conditions. 
Distinctive feature of such measures is presence of metric properties, sensitivity 
to small both to great values of attributes and invariancy to multiplicate constants. 
It allows to use them for classification of objects with characteristics of the various 
physical nature without their preliminary norming. The obvious kind of offered measures 
is resulted, and efficiency of their use in algorithms of automatic classification 
is shown on clustering Benchmark Data Sets-IRIS
N.I. Кurenkov, Ph.D.
S.N. Аnaniev, Ph.D.
 
"Entropy approach to the decision of a classification problems
of a multidimensional data sets"