Файлы Образовательный портал  НОЦ НТ  НИУ МГСУ Все файлы

Прикладная статистика и планирование эксперимента

  1. Цели и задачи курса.
  2. Теоретический блок.
  3. Практический блок.
  4. Рекомендуемая литература.
  5. Как сдаем.
  6. История курса.

Цели и задачи курса

Цель курса – способствовать формированию знаний и умений решения отдельных задач регрессионного анализа, возникающих при проведении эмпирических исследований в строительном материаловедении. Постановка и методы решения задач для математической теории эксперимента являются весьма общими, поэтому материалы курса могут оказаться полезными и в других областях. Но полезность не гарантируется.

Базой курса являются теория вероятностей и математическая статистика, основное содержание которых излагается на первой и второй лекциях (да, вся теория вероятностей – в одной лекции).

Содержание курса:


Содержание теоретического блока

Лекции одним файлом:

Последний вариант лекций 2018 года, рекомендую; лекции отдельными файлами по ссылкам ниже немного устарели.

Логин и пароль для доступа к библиотеке можно найти на страничке другого моего курса.

Лекция 1 - очное, лекция 2 - заочное. Элементы теории вероятностей

Основные определения теории вероятностей, раскрывающие содержание ее важнейших неопределяемых понятий – понятий события и вероятности. Дискретные и непрерывные случайные величины. Функция распределения (вероятность того, что случайная величина примет значение, меньшее заданного) как основная форма взаимосвязи между значением и вероятностью случайной величины. Свойства функции распределения и плотности вероятности. Начальные и центральные моменты. Математическое ожидание и дисперсия, их свойства. Центральная предельная теорема и нормальный закон распределения. Вероятности, связанные с нормально распределенными величинами. Статистики (Пирсона, Стьюдента, Фишера), наиболее часто встречающиеся в прикладных задачах.

Лекция 2 - очное, лекция 2 - заочное. Основные понятия математической статистики. Описательная статистика

Предмет математической статистики. Статистическая модель. Статистические оценки и предъявляемые к ним требования. Генеральная совокупность и выборка. Генеральные и выборочные характеристики. Частота и относительная частота. Дискретный вариационный ряд, оценки квантилей, оценка медианы. Оценки начальных и центральных моментов неизвестного распределения генеральной совокупности. Непрерывный вариационный ряд, правило Стерджеса, гистограмма, оценка моды.

Лекция 3 - очное, лекция 3 - заочное. Проверка статистических гипотез, ч. 1

Статистическая гипотеза, альтернатива. Содержание процедуры проверки статистической гипотезы. Критическое событие. Статистика – случайная величина с известным распределением, позволяющая ответить на центральный вопрос: какова вероятность при истинной гипотезе получить результаты, не лучшие реально полученных. Уровень значимости как вероятность события, которое на практике считается невозможным. Ошибка первого рода. Ошибка второго рода. Мощность статистического критерия. Состоятельные и несмещенные критерии. Проверка гипотезы о нормальном распределении генеральной совокупности.

Лекция 4 - очное, лекция 3 - заочное. Проверка статистических гипотез, ч. 2. Двухвыборочные задачи

Статистическая гипотеза о наличии эффекта обработки. Двухвыборочная задача сравнения средних для случаев известных равных, неизвестных равных и неизвестных дисперсий. Статистическая гипотеза о равной точности. Двухвыборочная задача сравнения дисперсий.

Лекция 5. Системы случайных величин. Линейный корреляционный анализ

Многомерные случайные величины, их функции распределения и плотности вероятности. Условный закон распределения многомерной случайной величины. Свойства функции распределения и плотности вероятности. Соотношения для начальных и центральных моментов. Второй смешанный центральный момент (ковариация) и связанный с ним коэффициент корреляции. Соотношение для оценки ковариации. Методика проверки статистической гипотезы о равенстве ковариации нулю. Статистическая значимость линейной связи между случайными величинами.

Лекция 6 - очное, лекция 4 - заочное. Регрессионный анализ, ч. 1

Задачи, решаемые в рамках регрессионного анализа и математической теории эксперимента. Кибернетический черный ящик. Отклик системы. Варьируемые факторы (входные переменные, предикторы). Регрессионная (экспериментально-статистическая) модель. Принцип максимального правдоподобия: наилучшим описанием системы является такое, при котором максимальна вероятность предсказания отклика. Условия Гаусса-Маркова. Метод наименьших квадратов.

Лекция 7 - очное, лекция 4 - заочное. Регрессионный анализ, ч. 2. Обобщенная линейная регрессия: отыскание параметров

Однофакторная линейная регрессия. Явная запись системы нормальных уравнений. Обобщенная линейная регрессия (модель, линейная по параметрам). Общий вид модели. Базисные функции. Матричная запись системы нормальных уравнений. Матрица ошибок. Понятие оптимальности плана эксперимента.

Лекция 8 - очное, лекция 5 - заочное. Регрессионный анализ, ч. 3. Обобщенная линейная регрессия: статистический анализ

Построение и статистический анализ линейной по параметрам модели. Повторение опытов. Проверка однородности дисперсий. Проверка гипотез о равенстве параметров модели нулю. Проверка адекватности модели опытным данным.


Содержание практического блока

Практическое занятие 1 - очное, лекция 1 - заочное. Эксперимент, статистика, инструментарий

Цель занятия: сформировать представление о роли статистических методов в прикладных задачах.

Содержание занятия: я показываю картинки и рассказываю сказки. Вы слушаете и задаете вопросы.

Ресурсы:
Каталог с материалами занятия.

Выводы по занятию:

Практическое занятие 2. Статистические возможности коммерческих и свободных табличных процессоров

Цель занятия: сформировать представление о перечне функций рабочего листа и возможностях визуализации данных табличных процессоров MS Excel и GNUmeric, позволяющих решать статистические задачи.

Содержание занятия: Графические возможности табличных процессоров MS Excel и Gnumeric. Распределения, важные для математической статистики. Табулирование функций распределений и генерация псевдослучайных чисел в MS Excel (пакет анализа) и Gnumeric.

Ресурсы:
Каталог с материалами занятия.

Выводы по занятию:

Практическое занятие 3 - очное, практическое занятие 1 - заочное. Описательная статистика

Цель занятия: сформировать умения использовать средства табличных процессоров MS Excel и GNUmeric для выполнения первичной статистической обработки значений одного признака.

Содержание занятия: построение дискретного и непрерывного вариационного ряда, нахождение оценок математического ожидания и дисперсии, построение гистограммы средствами MS Excel 2003/2013 и GNUmeric.

Ресурсы:
Руководство по выполнению практического задания.
Пример выполнения практического задания.
В каталоге с материалами занятия (см. src1, src2) находятся текстовые файлы с «сырыми» данными, из которых нужно предварительно извлечь подлежащие обработке числовые выборки.
Каталог с материалами занятия.

Выводы по занятию:

Практическое занятие 4 - очное, практическое занятие 2 - заочное. Проверка статистических гипотез

Цель занятия: сформировать умения использовать средства табличных процессоров Ms Excel и GNUmeric для проверки статистических гипотез о равенстве неизвестных математических ожиданий и дисперсий (двухвыборочные задачи сравнения).

Содержание занятия: Проверка статистических гипотез (нормальное распределение генеральной совокупности; равенство математических ожиданий для неизвестных равных дисперсий; равенство дисперсий) средствами MS Excel.

Ресурсы:
Краткая теория.
Руководство к выполнению практических заданий.
Выборки для самостоятельного анализа.
Каталог с материалами занятия.

Выводы по занятию:

Практическое занятие 5. Корреляционный анализ

Цель занятия: сформировать умение использовать средства табличных процессоров MS Excel и GNUmeric для выполнения линейного корреляционного анализа.

Содержание занятия: Корреляционный анализ. Значимость коэффициента корреляции. Доказательство зависимости курса национальной валюты РФ от фаз Луны (на примере периода с 4 по 18 февраля 2015 г).

Ресурсы:
Интерактивный пример решения задачи линейного корреляционного анализа средствами MS Excel.
Пример решения практической задачи линейного корреляционного анализа средствами MS Excel.
Каталог с материалами занятия.

Выводы по занятию:

Практическое занятие 6 - очное, практическое занятие 3 - заочное. Метод наименьших квадратов

Цели занятия: совершенствование знания терминологии регрессионного анализа; анализ возможностей табличных процессоров и системы символьной математики Octave в части матричных операций (на примере отыскания параметров системы нормальных уравнений МНК); анализ возможностей табличных процессоров и системы gnuplot в части визуализации данных, определенных на равномерной сетке.

Содержание занятия: терминология регрессионного анализа (предикторы, отклик, регрессионная модель, параметрическая модель), метод наименьших квадратов, система нормальных уравнений для однофакторной линейной регрессии. Матричные операции в MS Excel, GNUmeric и GNU Octave. Визуализация одномерных сеточных данных в MS Excel, GNUmeric и gnuplot.

Ресурсы:
Каталог с материалами занятия.
Краткие теоретические сведения по построению линейной однофакторной регрессионной модели.
Руководство по построению линейной однофакторной регрессионной модели средствами табличных процессоров.
Пример построения линейной однофакторной регрессионной модели средствами MS Excel.
Данные для самостоятельного построения однофакторных регрессионных моделей средствами табличных процессоров.

Выводы по занятию:

Практическое занятие 7 - очное, практическое занятие 4 - заочное. Модели, линейные по параметрам

Цель занятия: приобрести навык использования матричного соотношения, в явной форме выражающего вектор параметров модели через матрицу базисных функций и вектор откликов.

Содержание занятия: Матричная запись системы нормальных уравнений: двухфакторные линейная и квадратичная регрессии. Построение матрицы базисных функций на основе плана эксперимента и выбранного вида регрессионной модели. Отыскание параметров модели средствами табличных процессоров MS Excel и Gnumeric, а также открытыми средствами численной математики.

Ресурсы:
Каталог с материалами занятия.

Выводы по занятию:

Практическое занятие 8 - очное, практическое занятие 5 - заочное. Алгоритм построения линейной по параметрам регрессии

Цель занятия: сформировать представление об алгоритме построения и анализа линейной по параметрам регрессионной модели.

Содержание занятия: Место формальных и содержательных операций в алгоритме построения модели. Исходные данные. Порядок операций, логика перехода между отдельными этапами. Причины, по которым слишком хорошие измерения могут привести к отбраковке модели в целом. Причины, по которым слишком плохие измерения могут привести к отбраковке модели по частям. Реализация алгоритма средствами MS Excel, Gnumeric, и специализированного пакета Градиент.

Ресурсы:
Каталог с материалами занятия.

Выводы по занятию:

Практическое занятие 9. Табличный процессор Calc (пакеты OpenOffice/LibreOffice)

Цель занятия: завершить формирование представления о программах типа bloatware.

Содержание занятия: Идеология прикладного программного окружения среды POSIX. Пакет OpenOffice/LibreOffice как неактуальная попытка создания аналога для пакета MS Office, который в POSIX-среде неуловимый Джо. Неактуальность пакета как предпосылка неактуальности его эффективной реализации. Неактуальность пакета и мертвый ГОСТ Р ИСО/МЭК 26300-2010, строгость законов компенсируется их необязательностью, особенно если они бредовые, а за "разработку" ГОСТ ведь еще и бабла кто-то срубил. Графические возможности табличного процессора Calc. Статистические возможности табличного процессора Calc. OpenOffice и Microsoft Office: идеология одна, но ко второму уже привыкли. OOCalc и GNUmeric: визуальная функциональность без излишеств, за излишествами – к пакетам численной математики и проблемно-ориентированным средствам.

Ресурсы:
Каталог с материалами занятия.

Выводы по занятию:

Практическое занятие 10. Системы численной математики с MATLAB-подобным синтаксисом: пакет SciLab

Цель занятия: сформировать представление о ляля

Содержание занятия: Классификация математических пакетов. Системы численной и символьной математики. Система SciLab, ее графические и статистические возможности. Синтаксис языка. Построение регрессионных моделей средствами SciLab. Интеграция в свободное окружение: постобработка результатов средствами открытого векторного редактора InkScape. Особенности реализации SciLab: Java, или когда лекарство оказывается хуже болезни.

Ресурсы:
Каталог с материалами занятия.

Выводы по занятию:

Практическое занятие 11. Системы численной математики с MATLAB-подобным синтаксисом: пакет Octave

Цель занятия: сформировать представление о ляля

Содержание занятия: Система Octave, ее графические и статистические возможности. Синтаксис языка. Построение нелинейных регрессионных моделей средствами Octave. Интеграция в свободное окружение: использование совместно с системой научной визуализации Gnuplot.

Ресурсы:
Каталог с материалами занятия.

Выводы по занятию:

Практическое занятие 12. Проблемно-ориентированный язык R

Цель занятия: сформировать представление о ляля

Содержание занятия: Необходимость в алгоритмическом языке, ориентированном на статистические применения. Синтаксис языка. Графические и статистические возможности языка. Интеграция в свободное окружение: использование совместно с системой верстки LaTeX.

Ресурсы:
Каталог с материалами занятия.

Выводы по занятию:


Рекомендуемая литература

Инструкция для доступа к библиотеке есть здесь

Прикладная статистика, регрессионный анализ:

  1. Бендат Дж., Пирсол А. Прикладной анализ случайных данных. М.: Мир, 1989. 540 с.
  2. Mendenhall W., Sincich T. A Second Course in Statistics. Regression Analysis. Prentice Hall, 2011. 812 p.
  3. Pardoe I. Applied Regression Modeling. Wiley, 2012. 334 p.
  4. Rawlings J.O. Pantula S.G., Dickey D.A. Applied regression analysis: a research tool. Springer: 1998. 658 p.
  5. Cook R.D., Weisberg S. Applied Regression Including Computing and Graphics. Wiley, 1999. 594 p.
  6. Chatterjee S., Simonoff J.S. Handbook of Regression Analysis. Wiley, 2013. 236 p.
  7. Takezawa K. Learning Regression Analysis by Simulation. Springer Japan, 2014. 300 p.
  8. Yan X., Su X.G. Linear regression analysis. Theory and computing. World Scientific, 2009. 329 p.
  9. Seber G., Lee A. Linear regression analysis. Wiley, 2003. 565 p.
  10. Hocking R.R. Methods and applications of linear models: regression and the analysis of variance. Wiley, 2003. 776 p.
  11. Ryan T.P. Modern regression methods. Wiley, 1997. 529 p.
  12. Seber G., Wild C.J. Nonlinear Regression. N.Y.: Wiley, 2003. 781 p.
  13. Bates D.M., Watts D.G. Nonlinear Regression Analysis and its Applications. N.Y.: Wiley, 1988. 371 p.

Математическая теория эксперимента (включая прикладную статистику):

  1. Хартман К. Планирование эксперимента в исследовании технологических процессов. М.: Мир, 1977. 552 с.
  2. Cochran W.G. Planning and analysis of observational studies. New York: Wiley, 1983. 145p.
  3. Зедгинидзе И.Г. Планирование эксперимента для исследования многокомпонентных систем. М.: Наука, 1976. 390 с.
  4. Налимов В.В. Теория эксперимента. М.: Наука, 1971. 208 с.
  5. Налимов В.В., Голикова Т.И. Логические основания планирования эксперимента. М.: Металлургия, 1981. 152 с.
  6. Ахназарова С.Л., Кафаров В.В. Методы оптимизации эксперимента в химической технологии. М.: Высшая шк., 1985. 325 с.
  7. Zivorad R.L. Design of Experiments in Chemical Engineering. Weinheim: Wiley, 2004. 610 p.

Инструментальные средства прикладной статистики:

  1. Sheather S.J. A Modern Approach to Regression with R. Springer, 2009. 397 p.
  2. Fox J. An R and S Plus Companion to Applied Regression. Sage Publications, 2002. 325 p.
  3. Wright D.B., London K. Modern regression techniques using R: a practical guide. SAGE, 2009. 205 p.
  4. Ritz C., Streibig J.C. Nonlinear Regression with R. N.Y.: Springer, 2009. 148 p.
  5. Faraway J.J. Practical Regression and Anova using R. 2002. 212 p.

Оптимизация, многокритериальная оптимизация:

  1. Rao S.S. Engineering Optimization: Theory and Practice. New Jersey: Wiley, 2009. 813 p.
  2. Miettinen K. Nonlinear Multiobjective Optimization. Boston: Kluwer, 1999. 298 p.

Что будет на зачете

С 2015 г. форма аттестации – зачет в конце четвертого семестра. Вы приходите на зачет, случайным образом выбираете четыре бумажки, на каждой бумажке один вопрос (вопросы с ответами – см. ниже). Время на подготовку – весь четвертый семестр. Для зачета требуется верный ответ как минимум на три вопроса. Если верных ответов ровно два – я задаю дополнительный вопрос из числа основных определений теории вероятностей.

Перечень вопросов:

  1. Чем определяется целесообразность применения инструментальных (программных) средств математической статистики и математической теории эксперимента? (целесообразность применения определяется большим объемом встречающихся на практике выборок, необходимостью работы со специальными функциями, наличием смежных задач визуализации)
  2. Приведите какую-либо классификацию инструментальных средств, которые могут применяться при решении задач регрессионного анализа и статистической обработки результатов эксперимента (например: «специализированные пакеты; универсальные пакеты; пакеты, входящие в состав программных продуктов сходного назначения – табличных процессоров и т.п.»; «коммерческие и свободные»; «с самодостаточной документацией и плохо документированные»; возможны и другие классификации).
  3. Какие задачи прикладной статистики наиболее часто встречаются при обработке эмпирической информации? (дескриптивная статистика – первичная обработка опытных данных; нахождение оценок параметров распределений; проверка статистических гипотез; регрессионный анализ)
  4. Что называют генеральной совокупностью? (множество)
  5. Что называют выборкой? (подмножество генеральной совокупности)
  6. Как называют элементы выборки? (вариантами)
  7. Что называют объемом выборки? (число вариант)
  8. Что называют дискретным вариационным рядом? (упорядоченную по возрастанию последовательность вариант)
  9. Что называют частотой разряда? (число вариант, попавших в этот разряд)
  10. Что называют непрерывным вариационным рядом? (последовательность разрядов и соответствующих им частот)
  11. Что называют гистограммой? (ступенчатую фигуру, состоящую из прямоугольников, основания которых построены на соответствующих разрядах, а высоты равны частному от деления относительной частоты на длину разряда)
  12. Какие оценки называют точечными? (оценки, выражающиеся одним числом)
  13. Как найти оценку математического ожидания? (как выборочное среднее, т.е. среднее арифметическое)
  14. Как найти несмещенную оценку дисперсии? (как сумму квадратов отклонений вариант от оценки математического ожидания, деленную на объем выборки без единицы)
  15. Что называют стандартным отклонением? (корень из дисперсии)
  16. Как найти оценку стандартного отклонения? (как корень из оценки дисперсии)
  17. Как найти оценку стандартной ошибки? (как корень из частного от деления оценки дисперсии на объем выборки)
  18. Как найти оценку коэффициента вариации? (как частное от деления оценок стандартного отклонения и математического ожидания)
  19. Запишите выражение для плотности нормального распределения (\(f\left(x\right) = \frac{1}{\sigma\sqrt{2\pi}} \exp \left( -\frac{\left(x-m\right)^2}{2\sigma^2} \right)\)).
  20. Какое распределение называют стандартным нормальным? (нормальное распределение называют стандартным, если математическое ожидание и дисперсия подчиненной ему случайной величины равны нулю и единице, соответственно)
  21. Что называют кривой Гаусса? (график плотности нормального распределения)
  22. Запишите выражение функции Лапласа (\(\Phi\left(x\right) = \frac{1}{\sqrt{2\pi}} \int\limits_0^x\exp^{-\frac{t^2}{2}}dt\)).
  23. Как найти вероятность попадания нормально распределенной случайной величины на интервал от \alpha до \beta? (как разность значений функции Лапласа \(P\left(\alpha < X \leqslant \beta\right) = \Phi\left(\frac{\beta - m}{\sigma}\right) - \Phi\left(\frac{\alpha - m}{\sigma} \right)\))
  24. Что называют статистической гипотезой? (предположение о виде неизвестного распределения или о параметрах известного распределения)
  25. Приведите вероятностью формулировку основного вопроса проверки статистических гипотез («какова вероятность при верной гипотезе получить данные, не лучшие чем реально полученные в эксперименте?»).
  26. Что называют уровнем значимости? (уровень значимости можно понимать как вероятность события, которое в принятых условиях считается невозможным; по определению, уровень значимости – это вероятность ошибочно отвергнуть верную гипотезу)
  27. Что называют мощностью статистического критерия? (число, дополняющее до единицы вероятность ошибочного принятия неверной гипотезы)
  28. Что называют экспериментом? (действие, направленное на подтверждение или опровержение научной гипотезы)
  29. В чем отличие активного – controlled experiment, laboratory experiment – и пассивного – natural experiment, field experiment – эксперимента? (активный эксперимент предполагает планирование и создание специальных условий, при которых можно ожидать достижения цели; пассивный эксперимент этого не предполагает, хотя и может включать этап планирования)
  30. Что называют кибернетическим черным ящиком? (систему, для которой интерес представляет не внутреннее содержание, а только реакция на входные воздействия)
  31. Что называют варьируемым фактором? (варьируемым фактором, или входной переменной, или предиктором, называют доступную для изменения независимую переменную)
  32. Чем наблюдение отличается от пассивного эксперимента? (наблюдение не предполагает наличия варьируемых факторов)
  33. Что называют факторным пространством? (координатное пространство предикторов; пространство, по осям координат которого откладываются значения фарьируемых факторов)
  34. Что называют откликом системы? (отликом системы, или выходной переменной, называют доступную для измерения зависимую переменную)
  35. Что называют размахом варьирования? (разность наибольшего и наименьшего значений варьируемого фактора)
  36. Что называют интервалом варьирования? (половину размаха варьирования)
  37. Что называют основным уровнем фактора? (среднее арифметическое наибольшего и наименьшего значений варьируемого фактора;середину размаха варьирования)
  38. Что называют экспериментально-статистической (регрессионной) моделью? (подлежащую восстановлению по опытным данным аналитическую зависимость отклика от варьируемых факторов)
  39. Какую модель называют линейной по параметрам? (ЭС-модель называют линейной по параметрам, если она представляет собой сумму произведений искомых параметров на функции, не зависящие ни от одного из параметров).
  40. Что называют базисными функциями модели, линейной по параметрам? (функции, линейной комбинацией которых является модель)
  41. Почему в прикладных задачах регрессионного анализа предпочтение отдается моделям, линейным по параметрам? (это связано с вычислительной простотой анализа планов эксперимента для построения этих моделей; простотой поиска параметров таких моделей; простотой анализа построеннной модели)
  42. Приведите примеры ЭС-моделей, линейных по параметрам (\(y=b_0+b_1x_1+b_{11}x_1^2\) – однофакторная квадратичная модель; \(y=b_0+b_1x_1+b_2x_2+b_{12}x_1x_2\) – двухфакторная неполная квадратичная модель; \(y=b_0+b_1x_1+b_2x_2+b_3x_3\) – трехфакторная линейная модель; \(y=b_0+b_1e^{x_1}+b_2\sin(x_2)\) – без названия, но тоже линейная по параметрам).
  43. Что называют планом эксперимента? (множество значений предикторов; образ эксперимента в факторном пространстве)
  44. Какой план эксперимента называют оптимальным? (план, отвечающий выбранным требованиям в части затрат ресурсов и обеспечения достижения цели эксперимента, в т.ч. обеспечения точности предсказания регрессионной моделью значений отклика)
  45. Что называют планированием эксперимента? (обоснованный выбор плана эксперимента исходя из принятых критериев оптимальности плана)
  46. Какая из двух операций – выбор общего вида модели и выбор плана эксперимента – должна предварять другую? (первая: обоснованный выбор плана эксперимента возможен только после выбора общего вида регрессионной модели; общий вид модели является аналитическим выражением цели эксперимента)
  47. Сформулируйте принцип максимального правдоподобия («наилучшим описанием исследуемой системы является такое, для которого максимальна вероятность предсказания моделью эмпирических значений отклика»).
  48. При каких предположениях об опытных данных принцип максимального правдоподобия приводит к методу наименьших квадратов? (при предположениях о независимости, равной точности и нормальном распределении результатов измерений)
  49. Запишите матричное соотношение, в явной форме выражающее столбец искомых параметров линейной по параметрам модели через матрицу базисных функций и столбец откликов \(\mathbf B=\left(\mathbf X^T\mathbf X\right)^{-1}\mathbf X^T \mathbf Y\)).
  50. Как называется матрица \(\left(\mathbf X^T\mathbf X\right)^{-1}\), фигурирующая в соотношении, в явной форме выражающем столбец искомых параметров линейной по параметрам модели через матрицу базисных функций и столбец откликов? Матричным аналогом какой скалярной величины она является? (матрица ошибок, или ковариационная матрица; является матричным аналогом дисперсии)
  51. Запишите выражение, позволяющее для N экспериментов по M параллельных испытаний найти дисперсию воспроизводимости (\(s_e^2=\frac{1}{N(M-1)}\sum\limits_{u=1}^N\sum\limits_{i=1}^M \left(x_{ui}-\overline{x}_u\right)^2\)).

История курса

В 2011 г. сотрудников НОЦ НТ попросили представить для анализа примерное содержание нескольких факультативных курсов для аспирантов. В числе представленных курсов был и этот – и он был принят проректором О.О. Егорычевым. С 2012 по 2014 гг. курс читался аспирантам как факультативный – кто хочет, тот слушает и сдает (в аспирантуре все курсы такими должны быть). Содержание курса исходно отражало направление строительного материаловедения (05.23.05), и – когда у меня была возможность – я говорил об этом на установочном занятии аспирантов. Но приходили и с других специальностей.

Что хуже, уже в 2011 г. направленность курса не учитывалась при выборе рецензентов (выбирал не я). В частности, единственный хороший, содержательный отзыв был получен от Ашота Георгиевича Тамразяна и, вероятно, был дан исходя из вполне очевидного предположения о том, что курс ориентирован на конструкторов (05.23.01); несмотря на это, замечаний было на удивление мало. Замечания и мои ответы:

  1. Не представлены ... вопросы ... сравнения теоретических и экспериментальных данных; в каком разделе программы учат определять погрешность эксперимента, с которой и следует сравнивать разницу теоретического и опытного значений? Как это делать в случаях равноточных и неравноточных измерений?
    Для регрессионной модели формальная процедура сравнения невязок с ошибками эксперимента – это процедура проверки статистических гипотез о равенстве параметра нулю; она излагается для равноточных измерений. В целом, задача сравнения «теоретических» и «практических» значений почти всюду доводится до вероятности получения не лучших, чем реально полученные, экспериментальных данных, в предположении о справедливости какой-либо гипотезы – этим курс выгодно отличается от изложения, привлекающего значения квантилей распределений.
  2. Не затронута методика статистической оценки результатов расчёта в связи с задачей линейного регрессионного и корреляционного анализов.
    Вопросам построения линейных по параметрам регрессионных моделей исходно посвящено три лекции и практических занятия. Материал по корреляционному анализу, включая средства оценки значимости коэффициента корреляции, добавлен.
  3. Желательно включить в программу разделы, касающиеся вопросов теории подобия, размерностей, масштабных эффектов.
    Я не считаю себя достаточно компетентным в указанных разделах математики.
  4. Список рекомендуемых основных и дополнительных источников необходимо дополнить следующими классическими руководствами: Уорсинг А., Геффнер Дж. Методы обработки экспериментальных данных. М.: Изд-во иностранной литературы, 1949; Дж.Бендат, А.Пирсол. Прикладной анализ случайных данных. М.: Мир, 1989.
    Полностью согласен!
    Вторая книга добавлена. Первая (Worthing A.G., Geffner J. Treatment of Experimental Data. John Wiley & Sons, 1944) – сейчас библиографическая редкость.
  5. Программу следует изложить в более прикладном ключе, ориентирующемся на более узкий круг специальностей.
    Исходно именно это и предполагалось.

С 2015 г. курс становится обязательным. Не только для профиля «Строительное материаловедение» направления «Техника и технологии строительства», не только для других профилей этого направления, но и для других направлений. О чем мне им рассказывать и что с них спрашивать – я ума не приложу.


Последнее обновление: Комментарии & предложения? Valid XHTML 1.0 Transitional