Сборник тезисов докладов VIII Международной молодежной научной конференции
Разработка методов оценки плотности распределения методом вейвлет-анализа с учетом цензурированной информации
Ахметшина О.Р.
Обнинский государственный технический университет
атомной энергетики
Вопросам безопасности и надёжности функционирования объектов ядерной энергетики уделяется большое внимание. На атомных станциях организуются работы по сбору статистической информации о функционировании элементов подсистем и систем. Сбору подлежат отказы и дефекты объектов, порядок их обслуживания и другая информация.
Данная работа посвящена проекционному оцениванию. Проекционное оценивание является непараметрическим методом обработки статистической информации, который используют для определения параметров элементов, составных частей и подсистем сложных систем.
Параметрические методы анализа статистической информации в последнее время подвергаются критике специалистов по математической статистике. Дело в том, что применение параметрических методов требует предположений о виде закона распределения наблюдаемых случайных величин. Как правило, нельзя указать каких-либо веских причин, по которым конкретное распределение результатов наблюдений должно входить в то или иное параметрическое семейство.
В настоящее время все большее внимание исследователей уделяется развитию непараметрических методов. С их помощью можно решать тот же круг задач, что и с помощью параметрических моделей. Все большую роль играют непараметрические методы оценки плотности распределения, непараметрические подходы в решении задач регрессионного анализа и теории распознавания образов. Нас интересуют непараметрические методы оценки плотности распределения, поскольку, построив такую оценку, далее можно переходить к определению широкого круга статистических показателей.
Среди непараметрических методов построения плотности распределения широкое распространение находят гистограммные, проекционные, ядерные и вейвлет-оценки. Методы построения указанных оценок известны и хорошо изучены для случаев, когда в отношении результатов наблюдений выполняется предположение, что в каждом испытании реализуется наблюдаемый признак. Так, например, если речь идет об обработке статистических данных с целью определения характеристик надежности, то в качестве обрабатываемой информации используются наработки объектов до отказа. Такая схема является идеализацией реально проводимых исследований. В практических ситуациях информация, полученная при проведении обследования функционирующих объектов, крайне ограничена. В действительности, при эксплуатации объекты стараются не доводить до отказа. Таким образом, в процессе анализа надежности приходится сталкиваться с ситуациями, когда определенная часть объектов или систем не отказывает за период наблюдения, а другая часть отказывает, но моменты отказов точно неизвестны. В таких ситуациях возникает необходимость проведения статистического анализа надежности на основе специфических выборок, основной особенностью которых является отсутствие сведений о моментах отказов контролируемой части изделий. Данные, для которых имеется неопределенность в наблюдениях за реализацией исследуемого признака, называются цензурированными данными.
В данной работе рассматриваются проекционные и вейвлет методы построения оценок плотности распределения на основании информации, содержащей цензурированные данные. Суть проекционной оценки состоит в разложении неизвестной функции в ряд по некоторому конечному набору ортонормированных базисных функций. В процессе работы была разработана система экспресс-анализа данных, позволяющая строить такие оценки.
Система реализует следующие возможности:
· Построение проекционной оценки плотности. В качестве базиса для оценки использовалась функция Фурье. При реализации проекционного метода был разработан алгоритм определения оптимального числа гармоник, т.е. оптимального числа слагаемых в проекционных оценках;
Для каждого метода строится график оценки плотности распределения. Для удобства проведения тестовых расчетов реализована генерация случайных чисел с заданным законом распределения, которые используются в качестве входных данных.
Кроме линейных вейвлет-оценок существуют еще так называемые пороговые вейвлет-оценки. Таким образом, в дальнейшем предполагается работа по разработке методов построения пороговых вейвлет-оценок с учетом цензурированных данных.
Литература
1. Антонов А.В. Системный анализ. Методология. Построение моделей: Учебное пособие по курсу «Системный анализ». - Обнинск: ИАТЭ, 2001. - 272 с.
2. Деврой Л., Дъерфи Л. Непараметрическое оценивание плотности. L1 - подход: Пер. с англ. - М.: Мир, 1988. - 408 с.
3. Астафьева Н.М. Вейвлет-анализ: основы теории и примеры применения. Успехи физических наук, 1996.
4. Marina Vannucci. Nonparametric density estimation using wavelets. Discussion Paper 95-26, ISDS, Duke University, USA, 1998.
5. Marina Vannucci and Brani Vidacovic. Preventing the direct disaster: Wavelet based density estimation. Discussion Paper 95-26, ISDS, Duke University, USA, 1998.