А.И.
Орлов
Математика случая
Вероятность и статистика – основные факты
Учебное пособие. М.: МЗ-Пресс, 2004.
Предыдущая |
6. Некоторые типовые задачи прикладной статистики и методы их решения
Снижение размерности
Третий раздел многомерного
статистического анализа – задачи снижения размерности с целью сжатия
информации. Цель их решения состоит в определении набора производных
показателей, полученных преобразованием исходных признаков, такого, что число
производных показателей значительно меньше числа исходных признаков, но они
содержат возможно большую часть информации, имеющейся в исходных статистических
данных. Задачи снижения размерности решают с помощью методов многомерного
шкалирования, главных компонент, факторного анализа и др. Например, в
простейшей модели многомерного шкалирования исходные данные – попарные
расстояния между k объектами, а цель расчетов состоит в
представлении объектов точками на плоскости. Это дает возможность в буквальном
смысле слова увидеть, как объекты соотносятся между собой. Для достижения этой
цели необходимо каждому объекту поставить в соответствие точку на плоскости
так, чтобы попарные расстояния sij между точками, соответствующими
объектам с номерами i и j, возможно точнее воспроизводили расстояния ρij между этими объектами. Согласно
основной идее метода наименьших квадратов находят точки на плоскости так, чтобы
величина
достигала своего наименьшего значения. Есть и многие другие постановки задач снижения размерности и визуализации данных.
Предыдущая |