Главная      Учебники - Разные     Лекции (разные) - часть 17

 

Поиск            

 

«Применение ит в исследованиии статистической автомодельности»

 

             

«Применение ит в исследованиии статистической автомодельности»

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Выпускная работа по
«Основам информационных технологий»

Магистрант

Механико-математического факультета

Камай Анны Михайловны

Руководители:

профессор, доктор физ.-мат. наук

Кротов В.Г.

старший преподаватель

Кожич Павел Павлович

Минск – 2009 г.

Оглавление

Оглавление. 2

Список обозначений ко всей выпускной работе. 3

на тему «Применение ИТ в исследованиии статистической автомодельности» 4

Введение. 4

Глава 1. Обзор литературы.. 6

Глава 2. Использование математических пакетов для исследования случайных процессов. 8

Глава 3 (основные результаты) 12

Глава 4 (обсуждение результатов) 19

Заключение. 20

Список литературы к у. 22

Предметный указатель к у. 23

Интернет ресурсы в предметной области исследования. 24

Действующий личный сайт в WWW... 26

Граф научных интересов. 27

Презентация магистерской диссертации. 28

Список литературы к выпускной работе. 29

Приложение 1. 30

Приложение 2. Презентация магистерской диссертации. 33

Список обозначений ко всей выпускной работе

ИТ – информационные технологии;

ФБД – фрактальное броуновское движение;

В случае повторения в диссертации специальных терминов, сокращений, аббревиатур, условных обозначений и тому подобного менее пяти раз их расшифровку приводят в тексте при первом упоминании

на тему «Применение ИТ в исследованиии статистической автомодельности»

(статья) по ИТ в предметной области (10-15 стр)

Введение

Современное развитие науки характеризуется потребностью сложного изучения всевозможных сложных процессов и явлений – физических, химических, биологических, экономических, социальных и других. Происходит значительное увеличение темпов математизации и расширение ее области действия. Теории математики широко применяются в других науках, казалось бы, совершенно от нее далеких – лингвистике, юриспруденции. Это вызвано естественным процессом развития научного знания, который потребовал привлечения нового и более совершенного математического аппарата, проявлением новых разделов математики, а также кибернетики, вычислительной техники и так далее, что значительно увеличило возможности ее применения.

Более точное математическое описание процессов и явлений, вызванное потребностями современной науки, приводит к появлению сложных систем интегральных, дифференциальных, интегральных, трансцендентных уравнений и неравенств, которые не удается решить аналитическими методами в явном виде. Для решения таких задач приходится прибегать к вычислительным алгоритмам, использовать какие-либо бесконечные процессы, сходящиеся к конечному результату. Приближенное решение задачи получается при выполнении определенного числа шагов.

Развитие ЭВМ стимулировало более интенсивное развитие вычислительных методов, создало предпосылки решения сложных задач науки, техники, экономики. Широкое применение при решении таких задач получили методы прикладной математики и математического моделирования.

В настоящее время прикладная математика и ЭВМ являются одним из определяющих факторов научно-технического прогресса. Они способствуют ускорению развития ведущих отраслей народного хозяйства, открывают принципиально новые возможности моделирования и проектирования сложных систем с выбором оптимальных параметров технологических процессов.

Двумя основными задачами, относящимися к компьютерному изучению случайных процессов, являются моделирование случайных процессов и нахождение характеристик случайного процесса по выборке данных. Выполнение обоих этих задач без использования специализированных пакетов является очень трудоемким, а иногда даже и невозможным. Первая из задач часто – моделирование случайных процессов – требует от используемого пакета только наличия функций генерации случайной величины по указанному закону распределения и графических инструментов для визуализации результатов, вторая же задача – нахождение характеричтик – часто требует наличия большого количества библиотек с реализованными алгоритмами анализа данных. И целью этой работы является изучение проблемы выбора различных пакетов для изучения случайных процессов.

Современную жизнь невозможно представить без использования информационных технологий. Любая отрасль знаний использует скорость и мощность компьютера. Так исторически сложилось, что информатика развивается неразрывно с другими областями науки, удовлетворяя их нужды и потребности. В частности, и для решения математических задач существует множество пакетов, как узкоспециализированных, так и для решения широкого класса проблем. Большинство пакетов являются узкопрофильными: анализ статистических данных, решение определенного типа уравнений. Только немногие способны решать широкий спектр задач. К таким относятся Mathematica, Mathcad, Maple, MathLab, Derive, Eureka. Эти системы содержат большой набор готовых к употреблению алгоритмов и программ, позволяющих решать задачи математического анализа, линейной алгебры, геометрии, дифференциальных уравнений. К настоящему моменту в лидерах оказались Mathematica и Maple из-за их действительно уникальных возможностей и MathCad, благодаря простоте в использовании и усвоении. Возможности этих трех пакетов отличаются не только между собой, но и между их версиями. Поэтому сравнивать эти пакеты достаточно сложно. Однако любая из программ не заменяет математического мышления. Прежде чем применять какую-либо формулу, нужно проанализировать выполнение условий ее применимости и, при необходимости, преобразовать задачу так, чтобы можно было ее употребить. Человек, использующий средства любого пакета, должен хорошо разбираться в математической постановке вопроса и владеть возможностями самой программы. Иначе можно получить совсем иной результат. Современные программные пакеты могут выполнять сложнейшие аналитические вычисления, но они не способны на гениальные догадки.

В данной работе более детально рассмотрен случайны процесс со свойствами статистической автомодельности, а именно модель ФБД и реализована программа нахождения параметра модели ФБД в пакете Mathematica.

В данной работе представлен краткий обзор пакетов Mathematica, MathСad, Maple, описаны их преимущества и недостатки. Также данный посвящен математическим финансовым моделям со свойствами статистической автомодельности (самоподобия), и их исследованию при помощи информационных технологий. Одним из широко распространенных примеров модели со свойствами самоподобия является фрактальное броуновское движение (ФБД). В е дано определение ФБД, описаны его основные свойства, построен алгоритм нахождения параметра ФБД, показан способ моделирования ФБД с помощью пакета Mathematica.

Показан пример нахождения параметра модели статистической автомодельности, а именно ФБД, в пакете Mathematica и возникающие при этом проблемы.

В разделе "Введение" дается обоснование круга вопросов, нуждающихся в дальнейшем изучении по научной проблематике, связанной с темой диссертации,

обосновывается ее актуальность,

показывается необходимость проведения исследований по данной теме для решения конкретной проблемы (задачи),

развития конкретных направлений в соответствующей отрасли науки,

отражается место диссертации среди других исследований в этой области.

Введение, как правило, - короткий раздел объемом до 6 страниц.

=========================================================

Основная часть материала диссертации излагается в главах, в которых приводятся:

аналитический обзор литературы по теме, развернутое обоснование выбора направления исследований и изложение общей концепции работы;

описание объектов исследования и используемых при проведении исследования методов, оборудования;

изложение выполненных в работе теоретических и (или) экспериментальных исследований.

Распределение основного материала диссертации по главам и структурирование по разделам определяются соискателем. В докторской диссертации, подготовленной в виде научного доклада, анализ научной литературы и описание объектов исследования, использованных методов и оборудования не следует оформлять в виде самостоятельных глав.

Глава 1. Обзор литературы

Применения ИТ при решении задач в настоящее время является актуальный вопросом. Достаточное количество книг посвящено этой тематике. В пособии Л.Л. Голубевой «Компютерная математика. Символьный пакет Matematica» изучаются вопросы идеологии символьных пакетов, на примере данного пакета, знание которых позволит отыскивать при необходимости нужные средства для теоретических исследований или решении конкретных задач. В «Электронном пособии по высшей математике на базе системы Mathematica» А.А. Кулешова изложен курс высшей математике. Приведено множество примеров решения в пакете Mathematica задач высшей математики и других дисциплин.

Нужно отметить также такие издания, как «Информационные технологии в математике» Ю.Ю. Тарасевич, где рассматриваются вопросы, касающиеся решения математических задач с использованием пакетов Maple и MathCAD, подготовки математических и естественнонаучных текстов с использованием издательской системы LaTeX. Так же в книге приводятся необходимые сведения по численным методам.

Что касается случайных процессов, то одной из наиболее интересных книг по компьютерному изучению случайных процессов является книга Тюрина Ю.Н. и Макарова А.А. “Статистический анализ данных на компьютере“. Эта книга является учебным пособием по анализу данных и статистике, рассчитанным на прикладных специалистов, менеджеров и студентов. В ней излагаются основные сведения, необходимые на практике для анализа данных (в том числе анализа временных рядов), на наглядных примерах рассматриваются основные постановки задач и методы их решения с использованием популярных статистических пакетов STADIA, SPSS и Эвриста. В приложении дается обзор других программных средств для анализа данных. Большое внимание в книге уделено средствам анализа временных рядов и другим методам, часто используемым в прикладных задачах.

Из более специализированных книг можно отметить много других книг. “Компьютерное моделирование физических процессов с использованием MATLAB” авторов Коткина Г.Л. и Черкасского В.С. является хорошим руководством для изучения случайных процессов в среде Matlab.

“SPSS 15: профессиональный статистический анализ данных” А. Наследова представляет собой практическое руководство по анализу данных с помощью мощной и популярной программы статистической обработки информации - SPSS версии 15. В издании подробно описываются основы работы с пакетом SPSS, рассматривается большинство методов обработки и анализа данных, а также способов табличного и графического представления полученных результатов. Материал книги организован таким образом, чтобы удовлетворить запросы как новичка, впервые приступающего к анализу данных на компьютере, так и опытного исследователя, желающего воспользоваться самыми современными методами. Основное содержание глав составляют пошаговые инструкции по реализации различных видов математико-статистического анализа в SPSS. Особое внимание уделяется получаемым результатам и их интерпретации. В конце книги приведен глоссарий, содержащий определения большинства статистических терминов. Издание адресовано исследователям в области статистики, маркетинга, социологии, психологии, а также широкому кругу читателей, желающих воспользоваться программой SPSS для профессионального анализа данных.

Не менее полезным при изучении случайных процессов будет и общее ознакомление с возможностями различных математических пакетов, для этого можно ознакомиться со следующими книгами:

· Mathematica 5.1/5.2/6 в математических и научно-технических расчетах, Дьяконов В.П.

В данной книге впервые описано применение трех версий системы Mathematica 5.1, 5.2 и 6.0 – мирового лидера среди универсальных систем компьютерной математики. Особое внимание уделено описанию возможностей новейшей системы Mathematica 6.0, в ядро которой добавлено около тысячи новых функций.

· MATLAB R2006/2007/2008 + Simulink 5/6/7. Основы применения,
Дьяконов В.П.

· Mathematica. Практический курс с примерами решения прикладных задач, Васильев А.Н

· Прикладная математика в системе MATHCAD, Охорзин В.А.

В учебном пособии представляются сведения об основных численных алгоритмах, применяемых в моделировании и оптимизации, также она может помочь в приобретении практических навыков в решении задач.
Программы системы MATHCAD позволят студентам выполнять расчеты с помощью так называемых «живых» формул — формул, в которые можно подставить свои данные и немедленно получить результат.

Ознакомившись с найденной литературой, можно сделать вывод, что до сих пор не хватает полноценного сравнения математических пакетов. По этой причине основной задачей для достижения поставленной цели а является:

выбор результативного символьного пакета для решения задач по функциональному анализу.

В аналитическом обзоре литературы соискатель приводит очерк основных этапов развития научных представлений по рассматриваемой проблеме.

На основе анализа работ, выполненных ранее другими исследователями, соискатель выявляет вопросы, которые остались неразрешенными,

и исходя из этого определяет предмет и задачи своих диссертационных исследований, указав их место в разработке данной проблематики.

Глава 2. Использование математических пакетов для исследования случайных процессов

Решение задачи статистического анализа случайных процессов, позволяющее сделать вывод о характере исследуемых данных, возможно с применением большого числа алгоритмов с помощью распространенных сегодня автоматизированных систем. Оно сводится к определению некоторого числа различных характеристик, которое варьируется от задачи к задаче и определяется спецификой предметной области.

Методы, используемые при анализе этих характеристик можно условно разделить на две группы: цифровые, связанные с численным получением решения и аналитические, основанные на построении зависимостей, формул или рядов. Аналитические решения обладают рядом преимуществ, включающих возможность исследования влияния физических параметров, начальных и конечных условий на характер решения. Результаты аналитических решений способствуют разработке адекватных математических моделей, они более информативны, устойчивы, обладают возможностью вычисления значения в любой точке с заданной точностью, не прибегая к вычислениям в других точках. Недостатки подобных решений заключаются в том, что на практике обрабатываемые данные принимаются в виде рядов, особенно это касается случайных процессов, поэтому получение аналитических выражений для данных или их характеристик связано с вычислительными и материальными затратами. Численные решения универсальны, применяются тогда, когда аналитическое решение невозможно, а высокая производительность современных вычислительных комплексов компенсирует их низкое быстродействие. Однако появление различных неустойчивостей, сложность использования результатов расчета, накопление ошибок округления существенно снижает ценность численных выражений.

Комбинирование указанных методов является очевидным и результативным шагом при анализе больших информационных массивов, включая случайные процессы. Оно позволяет повысить оперативность и объединить достоинства обоих методов, ликвидировав часть недостатков. Существуют подходы, основанные на аналитическом описании цифровых массивов с их последующей обработкой. При этом на подобное решение накладываются следующие требования: обеспечение заданной точности описания более простым аналитическим выражением, адаптивность аналитического описания к особенностям каждого сигнала, унифицированность структуры описания независимо от природы и особенностей сигнала, возможность реализации метода в отсутствие априорной информации о сигнале. Однако более преимущественным представляется подход, основанный на численном анализе информационных массивов, случайных процессов, заключающемся в определении функциональных характеристик, например характеристик взаимосвязи, с их дальнейшей аналитической обработкой. Таким образом, удается избежать существенных ошибок при выборе модели выражения, метода и алгоритма аппроксимации, получить априорную информацию об исследуемых процессах и в конечном итоге снять или уменьшить важность соблюдения указанных выше ограничений.

Итак, задача аппроксимативного анализа функциональных характеристик случайных процессов сводится к их численному определению и получению аналитического выражения характеристики. Отметим, что численное решение задачи важно при отсутствии информации об исследуемых процессах. В случае, когда известны какие-либо характеристики, например характеристика взаимосвязи двух процессов – взаимная корреляционная функция, и точность аналитического выражения удовлетворяет исследователя, возможно построение других аналитических характеристик на базе имеющейся информации, например, определение спектральной плотности мощности с использованием преобразования Фурье. Подобные алгоритмы могут быть автоматизированы с помощью известных математических систем, или путем реализации собственной автоматизированной системы.

В настоящий момент существует большое число современных математических систем обработки статистической информации, в составе которых имеются как стандартные функции численной обработки данных, так и средства получения аналитических выражений для функциональных характеристик. Для сравнения современных математических систем необходимо провести их классификацию и определить критерии выбора. При этом необходимо учитывать, что статистическая обработка данных обычно производится специалистом предметной области, не знакомым с нюансами анализа случайных процессов, и хотелось бы, чтобы она не требовала программирования качественно новых алгоритмов.

Навигация в пространстве современных математических систем достаточно тяжела, если с такими системами, как Mathcad, MATLAB, Mathematica знакомы практически все, то многие другие специализированные статистические системы приобрести достаточно тяжело. Хотя именно такие системы бывают наиболее удобными для решения узко специализированных задач; кроме этого, они разработаны для решения конкретных проблем, например из области прикладной физики, с учетом апробированных методик проведения всего цикла исследований, поэтому с потерей универсальности происходит улучшение качества обработки, в том числе и повышение ее быстродействия. Но такие пакеты часто абсолютно не предназначены для решения научно-исследовательских математических задач.

Статистические пакеты общего назначения отличаются отсутствием прямой ориентации на специфическую предметную область, широким диапазоном статистических методов, дружелюбным интерфейсом пользователей. Специализированные пакеты обычно реализуют методы, используемые в конкретной предметной области. Для анализа временных рядов используются Эвриста, МЕЗОЗАВР, ОЛИМП: СтатЭксперт, ForecastExpert. Такие пакеты содержат достаточно полный набор традиционных методов, а также оригинальные методы и алгоритмы, созданные разработчиками пакета. Их использование целесообразно, когда требуется систематическое решение задач узкой предметной области.

Наилучший выбор статистического пакета зависит от характера решаемых задач, объема и специфики обрабатываемых данных, квалификации пользователей и т.д.

Пакет SAS (Superior software and services) обладает наилучшими возможностями для работы с большими объемами данных. SPSS (Statistical Package for the Social Sciences) удобен для работы с данными сложной структуры. Собственную систему обработки данных можно построить с помощью библиотеки подпрограмм IMSL, содержащую программы на Фортране и Си, которые можно вставить в свою разработку.

С помощью стандартных пакетов можно обработать данные небольших объемов стандартными статистическими методами. Ряд пакетов (STATISTICA, SPSS) обладают возможностью настройки на узкоспециализированную задачу, которая решается регулярно по мере обновления данных. Существуют пакеты, специализированные именно на обработке временных рядов. В некоторых из них производится автоматический подбор модели временного ряда из заданного класса моделей, однако это может привести к излишне усложненным моделям или к ошибкам. Другие пакеты содержат алгоритмы подбора оптимальных моделей, причем имеется широкий набор инструментов предварительного и окончательного анализа данных и возможность их пошагового применения. При этом пользователь сам задает стратегию ряда.

Пакет ЭВРИСТА является одним из лучших специализированных пакетов для анализа временных рядов. Его функциональные возможности значительно шире стандартных процедур анализа временных рядов универсальных статистических пакетов.

Итак, наиболее распространенные математические системы могут быть разделены на следующие группы:

· универсальные математические системы (Mathcad, MatLab, Mathematica);

· системы символьной математики (Derive, Mathematica, Maple, MuPAD);

· статистические системы (Statistica, SPSS, NCSS (Number Cruncher Statistical System) and PASS, Statgraphics, SYSTAT, SAS);

· специализированные инструментальные средства (Stadia, Эвриста).

Все рассмотренные системы являются в разной степени мощными средствами статистического анализа, позволяют представлять результаты в численной форме и имеют эффективные средства аппроксимации функциональных характеристик. Однако все рассмотренные системы могут рассматриваться лишь как инструмент для реализации дополнительных алгоритмов и методов, необходимость которых определяется новыми подходами аппроксимативного анализа вероятностных характеристик случайных процессов. В частности, во многих математических системах существуют библиотеки специальных функций, также следует отметить отсутствие разработанных алгоритмов аппроксимации функциональных характеристик ортогональными функциями.

Глава 3. Примеры использования математических пакетов в исследовании статистической автомодельности

При описании собственного исследования соискатель должен выделить то новое, что он вносит в разработку проблемы (задачи) или развитие конкретных направлений в соответствующей отрасли науки. Соискатель должен оценить достоверность полученных результатов, сравнить их с аналогичными результатами отечественных и иностранных исследователей.

Весь порядок изложения в диссертации должен быть подчинен цели исследования, сформулированной автором. Дробление материала диссертации на главы, разделы, подразделы, а также их последовательность должны быть логически оправданными.

При написании диссертации следует избегать общих слов и рассуждений, бездоказательных утверждений. Результаты исследований необходимо излагать в диссертации сжато, логично и аргументировано.

24. При написании диссертации соискатель обязан делать ссылки на источники (в том числе на диссертации и собственные публикации), из которых он заимствует материалы или отдельные результаты. Не допускается пересказ текста других авторов без ссылок на них, а также его цитирование без использования кавычек.

25. Каждую главу диссертации следует завершать краткими выводами, которые подводят итоги этапов исследования и на которых базируется формулировка основных научных результатов и практических рекомендаций диссертационного исследования в целом, приводимые в разделе "Заключение".

Задача моделирования случайного процесса включает в себя задачу моделирования случайной величины.

При моделировании дискретных случайных величин наиболее часто используются два метода:

  • метод последовательных сравнений
  • метод интерпретации.

При моделировании непрерывных случайных величин с заданным законом распределения могут использоваться три метода:

  • метод нелинейных преобразований
  • метод композиций;
  • табличный метод.

Все эти методы, кроме метода нелинейных преобразований могут быть практически без труда реализованы во многих математических пакетах и языках программирования. Задача же определения характеристик случайного процесса более сложна и предъявляет большие требования к используемому пакету.

Наибольший интерес при изучении характеристик процесса представляет пакет Matlab и его приложение Statistics Toolbox. В нем реализовано большое число функций для различных задач статистики.

Оценка параметров закона распределения по экспериментальным данным в Matlab:

  • betafit - Оценка параметров бета распределения
  • binofit - Оценка параметров биномиального распределения
  • nbinfit - Оценка параметров отрицательного биномиального распределения
  • expfit - Оценка параметров экспоненциального распределения
  • gamfit - Оценка параметров гамма распределения
  • normfit - Оценка параметров нормального распределения
  • poissfit - Оценка параметров распределения Пуассона
  • raylfit - Оценка параметров распределения Релея
  • unifit - Оценка параметров равномерного распределения
  • weibfit - Оценка параметров распределения Вейбулла
  • mle - Расчет функции максимального правдоподобия

Законы распределения случайных величин в Matlab:

  • betacdf - Бета распределение
  • binocdf - Биномиальное распределение
  • cdf - Параметризованная функция распределения
  • chi2cdf - Функция распределения хи-квадрат
  • expcdf - Экспоненциальное распределение
  • ecdf - Эмпирическая функция распределения (на основе оценки Каплана-Мейера)
  • fcdf - Распределение Фишера
  • gamcdf - Гамма распределение
  • geocdf - Геометрическое распределение
  • hygecdf - Гипергеометрическое распределение
  • logncdf - Логнормальное распределение
  • nbincdf - Отрицательное биномиальное распределение
  • ncfcdf - Смещенное распределение Фишера
  • nctcdf - Смещенное распределение Стьюдента
  • ncx2cdf - Cмещенное хи-квадрат распределение
  • normcdf - Нормальное распределение
  • poisscdf - Распределение Пуассона
  • raylcdf - Распределение Релея
  • tcdf - Распределение Стьюдента
  • unidcdf - Дискретное равномерное распределение
  • unifcdf - Непрерывное равномерное распределение
  • weibcdf - Распределение Вейбулла

Обратные функции распределения случайных величин в Matlab:

  • betainv - Бета распределение
  • binoinv - Биномиальное распределение
  • chi2inv - Функция распределения хи-квадрат
  • expinv - Экспоненциальное распределение
  • finv - Распределение Фишера
  • gaminv - Гамма распределение
  • geoinv - Геометрическое распределение
  • hygeinv - Гипергеометрическое распределение
  • icdf - Параметризованная обратная функция распределения
  • logninv - Логнормальное распределение
  • nbininv - Отрицательное биномиальное распределение
  • ncfinv - Смещенное распределение Фишера
  • nctinv - Смещенное распределение Стьюдента
  • ncx2inv - Cмещенное хи-квадрат распределение
  • norminv - Нормальное распределение
  • poissinv - Распределение Пуассона
  • raylinv - Распределение Релея
  • tinv - Распределение Стьюдента
  • unidinv - Дискретное равномерное распределение
  • unifinv - Непрерывное равномерное распределение
  • weibinv - Распределение Вейбулла

Генерация псевдослучайных чисел по заданному закону распределения в Matlab:

  • betarnd - Бета распределение
  • binornd - Биномиальное распределение
  • chi2rnd - Функция распределения хи-квадрат
  • exprnd - Экспоненциальное распределение
  • frnd - Распределение Фишера
  • gamrnd - Гамма распределение
  • geornd - Геометрическое распределение
  • hygernd - Гипергеометрическое распределение
  • iwishrnd - Обратная матрица случайных чисел распределения Уишарта
  • lognrnd - Логнормальное распределение
  • mvnrnd - Многомерное нормальное распределение
  • mvtrnd - Многомерное распределение Стьюдента
  • nbinrnd - Отрицательное биномиальное распределение
  • ncfrnd - Смещенное распределение Фишера
  • nctrnd - Смещенное распределение Стьюдента
  • ncx2rnd - Cмещенное хи-квадрат распределение
  • normrnd - Нормальное распределение
  • poissrnd - Распределение Пуассона
  • random - Параметризованная функция генерации псевдослучайных чисел
  • raylrnd - Распределение Релея
  • trnd - Распределение Стьюдента
  • unidrnd - Дискретное равномерное распределение
  • unifrnd - Непрерывное равномерное распределение
  • weibrnd - Распределение Вейбулла
  • wishrnd - Матрица случайных чисел распределения Уишарта

Функции анализа многомерных случайных величин в Matlab:

  • barttest - Тест Бартлета
  • canoncorr - Канонический корреляционный анализ
  • cmdscale - Классическое многомерное шкалирование
  • classify - Линейный дискриминантый анализ
  • mahal - Функция определяет расстояния Махаланобиса между строками двух матриц, являющихся входными параметрами.
  • manova1 - Однофакторный многомерный дисперсионный анализ
  • procrustes - Ортогональное вращение, позволяющее поставить в прямое соответствие одно множество точек другому

Раздел, который заслуживает особого внимания для начинающего пользователя этого приложения, это раздел демонстрационных примеров.

  • aoctool - Интерактивное средство ковариационного анализа
  • disttool - Интерактивное средство для исследования функций распределения случайных величин
  • glmdemo - Пример использования обобщенной линейной модели
  • randtool - Интерактивное средство для генерации псевдослучайных чисел
  • polytool - Интерактивное определение параметров полиномиальной модели
  • rsmdemo - Интерактивное моделирование химическое реакции и нелинейный регрессионный анализ
  • robustdemo - Интерактивное средство для сравнения методов МНК и робастной регрессии

Mathcad также имеет развитый аппарат работы с задачами математической статистики и обработки эксперимента.

Во-первых, имеется большое количество встроенных специальных функций, позволяющих рассчитывать плотности вероятности и другие основные характеристики основных законов распределения случайных величин. Наряду с этим, в Mathcad запрограммировано соответствующее количество генераторов псевдослучайных чисел для каждого закона распределения, что позволяет эффективно проводить моделирование.

Во-вторых, предусмотрена возможность построения гистограмм и расчета статистических характеристик выборок случайных чисел и случайных процессов, таких как средние, дисперсии, корреляции и т. п. При этом случайные последовательности могут как создаваться генераторами случайных чисел, так и вводиться пользователем из файлов.

В-третьих, имеется целый арсенал средств, направленных на интерполяцию-экстраполяцию данных, построение регрессии по методу наименьших квадратов, фильтрацию сигналов. Наконец, реализован ряд численных алгоритмов, осуществляющих расчет различных интегральных преобразований, что позволяет организовать спектральный анализ различного типа.

В Mathcad имеется ряд встроенных функций, задающих используемые в математической статистике законы распределения. Они вычисляют как значение плотности вероятности различных распределений по значению случайной величины х, так и некоторые сопутствующие функции. Все они, по сути, являются либо встроенными аналитическими зависимостями, либо специальными функциями.

В Mathcad заложена информация о большом количестве разнообразных статистических распределений, включающая возможность генерации последовательности случайных чисел с соответствующим законом распределения. Для реализации этих возможностей имеются четыре основных категории встроенных функций. Их названия являются составными и устроены одинаковым образом: первая буква идентифицирует определенный закон распределения, а оставшаяся часть (ниже в списке функций она условно обозначена звездочкой) задает смысловую часть встроенной функции:

· d* (x,par) — плотность вероятности;

· р*(х,раг) — функция распределения;

· q*(P,par) — квантиль распределения;

· r* (M,раr) — вектор м независимых случайных чисел, каждое из которых имеет соответствующее распределение:

  • х — значение случайной величины (аргумент функции);
  • Р — значение вероятности;
  • par — список параметров распределения.

Чтобы получить функции, относящиеся, например, к равномерному распределению, вместо * надо поставить unif и ввести соответствующий список параметров par. Он будет состоять в данном случае из двух границ интервала распределения случайной величины.

Перечислим все типы распределения, реализованные в Mathcad, вместе с их параметрами, на этот раз обозначив звездочкой * недостающую первую букву встроенных функций.

· *beta (x, s1, s2) — бета-распределение (s1, s2>0 — параметры, 0<x<1).

· *binom(k,n,p) — биномиальное распределение (n — целый параметр, 0<k<n и 0<р<1 — параметр, равный вероятности успеха единичного испытания).

· *cauchy(x,l,s) — распределение Коши.

· *chisq(x,d) — χ2 ("хи-квадрат") распределение (d>0 — число степеней свободы).

· *ехр(х,r) — экспоненциальное распределение (r>0 — показатель экспоненты).

· *F(x,d1,d2) — распределение Фишера (d1,d2>0 — числа степеней свободы).

· *gamma(x,s) — гамма-распределение (s>0 — параметр формы).

· *geom(k,p) — геометрическое распределение (0<р<1 — параметр, равный вероятности успеха единичного испытания).

· *hypergeom(k,a,b,n) — гипергеометрическое распределение (а,b,n — целые параметры).

· *lnorm(х,µ, σ) — логарифмически нормальное распределение (µ— натуральный логарифм математического ожидания, σ>0 — натуральный логарифм среднеквадратичного отклонения).

· *logis (х,l,s) — логистическое распределение (1 — математическое ожидание, s>0 — параметр масштаба).

· *nbinom(k,n,p) — отрицательное биномиальное распределение (n>0 — целый параметр, 0<р<1).

· *norm(х,µ, σ) — нормальное распределение (µ— среднее значение, σ>0 — среднеквадратичное отклонение).

· *pois (k,λ) — распределение Пуассона (λ>0 — параметр).

· *t (x,d) — распределение Стьюдента (d>0 — число степеней свободы).

· *unif (х,а,b) — равномерное распределение (а<b — фаницы интервала).

· *weibuii (x, s) — распределение Вейбулла (s>0 — параметр).

В Mathcad применяются типичные алгоритмы генерации последовательностей псевдослучайных чисел, которые используют в качестве "отправной точки" некоторое начальное значение (seed value). Это начальное значение используется для того, чтобы совершить над ним определенные математические действия (к примеру, взять остаток от деления на некоторое другое число) и получить в итоге первое псевдослучайное число последовательности. Затем те же математические операции совершаются с первым числом для получения второго, и т. д.

Несложно догадаться, что если использовать все время одно и то же начальное значение генератора псевдослучайных чисел, то, открывая всякий раз новый документ со встроенной функцией получения тех или иных псевдослучайных чисел, будет выдаваться в точности одна и та же их последовательность. Сами числа внутри последовательности будут "почти" случайными (значимость этого "почти" будет зависеть только от качества алгоритма генерации), но вот сама последовательность при каждом открытии документа будет одной и той же.

Встроенные функции для генерации случайных чисел создают выборку из случайных данных Ai . Часто требуется создать непрерывную или дискретную случайную функцию A(t) одной или нескольких переменных (случайный процесс или случайное поле), значения которой будут упорядочены относительно своих переменных. В Mathcad, например, создать псевдослучайный процесс можно следующим достаточно простым

способом:

В результате получается случайный процесс A(t), радиус корреляции которого определяется расстоянием между точками, для которых строится интерполяция. Случайное поле можно создать несколько более сложным способом с помощью многомерной интерполяции.

В ядре системы Mathematica практически нет статистических функций. Зато пакет расширения Statistics дает сотни функций, охватывающих практически все разделы теоретической и прикладной статистики.

Пакет расширения Statistics содержит следующие подпакеты:

  • Confidencelntervals — функции доверительных интервалов;
  • ContinuousDistributions — функции непрерывных распределений;
  • DataManipulation — манипуляции с данными;
  • DataSmoothing — сглаживание данных;
  • DescriptiveStatistics — статистика распределений;
  • DiscreteDistributions — функции дискретных распределений;
  • HypothesisTests — проверка статистических гипотез;
  • LinearRegression — линейная регрессия;
  • MultiDescriptiveStatistics — статистика многомерных распределений;
  • MultinormalDistribution — функции многомерных нормальных распределений;
  • NonlinearFit — нелинейная регрессия;
  • NormalDistribution — функции нормального распределения;
  • Common — данные общего характера.

В подпакете DescriptiveStatistics сосредоточены наиболее важные функции по статистике распределений:

  • CentralMoment (data, r) — возвращает центральный момент данных data порядка r;
  • Mean [data] — возвращает среднее значение данных data;
  • MeanDeviation [data] — возвращает среднее отклонение данных;
  • Median [data] — возвращает центральное значение (медиану) данных;
  • MedianDeviation [data] — возвращает абсолютное отклонение (от медианы) данных;
  • Skewness [data] — возвращает коэффициент асимметрии данных;
  • StandardDeviation [data] — возвращает стандартное отклонение данных;
  • GeometricMean [data] — возвращает геометрическое среднее данных;
  • HarmonicMean [data] — возвращает гармоническое среднее данных;
  • RootMeanSquare [data] — возвращает среднеквадратичное значение данных;
  • Quantile [data, q] — возвращает q-й квантиль;
  • InterpolatingQuantile [data, q] — возвращает q-й квантиль, используя при вычислениях интерполяцию данных;
  • VarianceData [data] — возвращает среднеквадратичное отклонение данных.

Глава 4 (обсуждение результатов)

Статистические пакеты находят свое широкое применение в основном в стандартных задачах статистики и облегчают вычисление, часто они полностью освобождают пользователя от математических вычислений, такие пакеты полезны только при подсчетах огромных объемов данных. Но в научно-исследовательских математических работах такие вычисления носят только вспомогательный характер и не составляют главную сложность задачи. Поэтому при выборе пакета для изучения случайных процессов следует обратить внимание на универсальные математические пакеты.

Универсальные математические пакеты имеют достаточно большой набор функций для работы со случайными процессами, во всех из них реализованы качественные алгоритмы генерации случайных величин по заданному распределению. Специализированные библиотеки предоставляют также возможность использовать готовые алгоритмы для некоторых узкоспециализированных задач, но для реальных научно-исследовательских задач в области случайных процессов готовых функций практически нет. В этом случае при выборе пакета стоит обращать внимание на удобство использования готовых функций, удобство написания функций, наличие хороших возможностей визуализации и личный опыт написания программ в каждом из рассматриваемых пакетов. В среде Matlab больший набор функций, а Matlab Simulink предоставляет отличные возможности визуализации. Поэтому пакет Matlab наиболее предназначен для работы со случайными процессами, но использование остальных универсальных пакетов также может быть весьма продуктивно.

Заключение.

Раздел "Заключение", как правило, должен содержать два подраздела: "Основные научные результаты диссертации" и "Рекомендации по практическому использованию результатов".

В первом подразделе дается краткое изложение сущности научных результатов диссертации. В этом подразделе формулировка отличительных признаков новых научных результатов может быть представлена более подробно, чем в положениях, выносимых на защиту. В нем приводятся не только основные результаты, обладающие научной новизной, но и другие результаты (например, предложенные методики, созданные экспериментальные установки и другое), дополнительно характеризующие квалификацию соискателя. В каждом пункте этого подраздела должна быть ссылка на публикации соискателя, соответствующие пункту 18 Положения о присуждении ученых степеней и присвоении ученых званий в Республике Беларусь, в которых отражено содержание данного пункта.

Во втором подразделе обсуждаются возможности практического применения полученных результатов. В нем же могут быть обсуждены перспективы дальнейшего развития данного научного направления. При наличии актов, справок об использовании (внедрении) полученных результатов, авторских свидетельств, патентов, других материалов, относящихся к объектам интеллектуальной собственности, зарегистрированным в установленном порядке, в соответствующих пунктах этого подраздела следует делать ссылки на эти документы.

В данной работе изучается возможности универсальных математических пакетов при изучении случайных процессов. Можно отметить, что все основные математические пакеты имеют достаточное количество функций для моделирования и изучения случайных процессов. В данной работе подробно не рассматриваются узкоспециализированные статистические пакеты, но при решении экономических задач они могут очень плодотворно использоваться. Из рассмотренных пакетов пакет Matlab имеет самый широкий выбор инструментов для изучения случайных процессов, но при выборе универсального математического пакета имеет смысл также принимать во внимание личный опыт в его использовании.


Список литературы к у.

Раздел "Библиографический список" должен включать два подраздела: "Список использованных источников", содержащий перечень источников информации, на которые в диссертации приводятся ссылки, и "Список публикаций соискателя", в котором приводятся библиографические сведения о публикациях соискателя по теме диссертации.

1. Дьяконов, В. Mathematica 5.1/5.2/6 в математических и научно-технических расчетах / В. Дьяконов. – Солон-пресс, 2008. – 744 с.

2. Гандер, В. Решение задач в научных вычислениях с применением Maple и Matlab / В. Гандер, И. Гржебичек. – Москва: Вассамедина, 2005. – 520 с.

3. Тарасевич, Ю.Ю. Информационные технологии в математике / Ю.Ю. Тарасевич. – Москва: СОЛОН-Пресс, 2003. – 144 с.

4. Режим доступа: http:// www.matsoft.ru. – Дата доступа: 22.12.2009.

5. Иллюстрированный самоучитель по Maple [Электронный ресурс]/ Библиотека plusby.com. – Режим доступа: http://maple.plusby.com/. – Дата доступа: 12.12.2009.

6. Режим доступа: http://www.wolfram.com. – Дата доступа: 22.12.2009.

7. NoNaMe – С миру по нитке [Электронный ресурс] / Проект NoNaMe. – Режим доступа: http://nitki.nnm.ru/ – 25.12.2009.

8. CIT Forum [Электронный ресурс] / CIT Forum. – Режим доступа: http://www.citforum.ru/. – Дата доступа: 20.12.2009.

9. Коткин Г.Л., Черкасский В.С. Численное моделирование физических процессов. Новосибирск: НГУ, 1998. 123 с.

10. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. М.: ИНФРА-М, 2003. – 544 с.

11. Наследов А.Д. SPSS 15: профессиональный статистический анализ данных. СПб: Питер, 2008. – 416 с.

12. – Режим доступа: http://www.exponenta.ru. – Дата доступа: 24.12.2009.

13. – Режим доступа: http://www.wolfram.com. – Дата доступа: 24.12.2009.

14. Википедия, свободная энциклопедия, которую может редактировать каждый [Электронный ресурс] / Википедия. – 2009. – Режим доступа: http://ru.wikipedia.org/. – Дата доступа: 01.12.2009.

Предметный указатель к у.


Maple, 22

Mathcad, 15

Mathematica, 18, 22

Matlab, 12

SAS, 10

SPSS, 10

Statistics Toolbox, 12

ЭВРИСТА, 11


Интернет ресурсы в предметной области исследования

1. http://library.wolfram.com – на этом сайте вы найдете различные пособия в формате *.nb для начинающих. Также здесь собраны примеры использования программы Mathematica во взаимодействии с другими программами, которые разбиты на группы по областям применения.

2. http://vak.org.by – сайт Высшей аттестационной комиссии Республики Беларусь. Здесь собраны все нормативные акты, касающиеся оформления и защиты диссертаций. Сайт, без которого не может обойтись ни один научный деятель.

3. http://www.elbook.bsu.by – сайт научно-методического центра "Электронная книга БГУ". Здесь представлены материалы по системе Mathematica - информация о продуктах Wolfram Research, разработках на базе Mathematica, справочное пособие по Mathematica, статьи, примеры, литература.

4. http://mathtopia.ru/ - здесь собрано достаточное количество примеров моделирования различных процессов в среде MathCad.

5. http://elibrary.ru – научная электронная библиотека. Один из наиболее полезных источников информации. Теперь совсем необязательно выходить из дому, чтобы прочитать новую книжку, ведь ее можно найти на этом сайте.

6. http://www.exponenta.ru – сайт для математиков, которые только начинают изучение математики, продолжают учиться или углубляют свои знания – этот сайт полезен всем. Здесь можно найти электронные книги, статьи по популярным математическим пакетам, ознакомиться с примерами их применения, получит новую информацию. Если вы пользователь одного из математических пакетов, вы можете обсудить свои проблемы на форуме, посвящённом ему.

7. http://lib.mexmat.ru – в этом разделе вы увидите аннотации на различные книги, журналы и статьи. Существуют форумы по разным естественным дисциплинам, в том числе и по механике. На форуме можно обсудить имеющиеся у вас проблемы, посмотреть ссылки на литературу по интересующей теме. На сайт постоянно появляются свежие новости из мира науки.

8. http://library.wolfram.com/conferences/ – если вас интересуют материалы по всем конференциям, посвященным системе Mathematica, то вам сюда.

9. http://library.wolfram.com/graphics/ – ни один математик не может обойтись без рисования графиков, а пакет Mathematica справляется с этим просто отлично. Хороший помощник для создания двумерной, трехмерной графики, анимации, диаграмм и многого другого.

10. http://novamedium.infolib.mexmat.ru –решение типовых задач по различным разделам высшей и элементарной математики с помощью пакета Mathematica.

11. http://support.wolfram.com/ – этот сайт представляет для ознакомления ответы на часто встречающиеся вопросы по продукции Wolfram Research.

12. http://www.mathnet.ru – общероссийский математический портал, предоставляющий российским и зарубежным математикам различные возможности в поиске информации о математической жизни в России.

13. http://mathworld.wolfram.com – сайт с большим количеством математических ресурсов и приметами в пакете Mathematica.

14. http://planetmath.org – большая математическая энциклопедия.

15. http://arxiv.org - автоматический электронный архив статей по математике и физике.

Действующий личный сайт в WWW

http://anna-kamai.narod.ru/

Граф научных интересов

Магистранта Камай А.М. Механико-математический факультет

Специальность: математические методы в экономике

Смежные специальности

01.01.01 - математический анализ

1. Теория функций действительного и комплексного переменного, обобщенные функции.

2. Специальные функции и интегральные преобразования.

3. Выпуклый, негладкий и многозначный анализ.

4. Теория приближений и методы численного анализа.

5. Вариационное исчисление и общая теория экстремальных задач.

05.13.18 - математическое моделирование, численные методы и комплексы программ

1. Исследование и разработка методов и принципов построения математических моделей.

2. Рассмотрение вопросов точности, устойчивости и достоверности математического моделирования.

3. Развитие теоретических, прикладных и экспериментальных исследований в рамках создания, испытания и применения математических моделей для решения актуальных задач планирования и управления.

Основная специальность

01.01.05 – теория вероятностей и математическая статистика

1. Вероятностные пространства и случайные элементы.

2. Предельные теоремы.

3. Случайные процессы и поля.

4. Стохастический анализ и стохастические дифференциальные уравнения.

5. Случайные процессы специального вида, включая процессы массового обслуживания.

6. Статистические выводы и анализ данных.

7. Последовательный анализ.

8. Непараметрическая и робастная статистика.

9. Статистика случайных процессов, полей и временных рядов.

10. Вероятностно-статистическое моделирование.

Сопутствующие специальности

08.00.13 – математические и инструментальные методы экономики

1. Методы принятия оптимальных решений.

2. Использование математических методов в прогнозировании, конкретно-экономическом анализе, планировании и управлении.

08.00.10 – финансы, денежное обращение и кредит

1. Разработка теории финансов.

2. Разработка теории и практики кредита.менеджмент

Презентация магистерской диссертации

http://anna-kamai.narod.ru.ppt

Список литературы к выпускной работе.

1. Коткин Г.Л., Черкасский В.С. Численное моделирование физических процессов. Новосибирск: НГУ, 1998. 123 с.

2. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. М.: ИНФРА-М, 2003. – 544 с.

3. Булинский А.В., Ширяев А.Н. Теория случаных процессов. Москва: ФИЗМАТЛИТ, 2005. 347 c.

4. Волков И.К., Зуев С.М., Цветкова Г.М. Случайные процессы. Москва: Изд-во МГТУ им. Н.Э. Баумана, 1999. 243 c.

5. Сайт Высшей аттестационной комиссии Республики Беларусь. – Режим доступа: http://vac.org.by. – Дата доступа: 24.12.2008.

Приложени е 1

В раздел "Приложения" включается вспомогательный материал. Он формируется в случае необходимости более полного раскрытия содержания и результатов исследований, оценки их научной и практической значимости. Число приложений определяется автором диссертации.

Пример. Выполнить моделирование процесса броуновского движения, используя пакет Mathematica.

Решение.

Подключаем пакет, включающий в себя функции по работе с нормальным распределением:

<< Statistics`NormalDistribution`

Задаем нормальное распределение с математическим ожиданием 0 и дисперсией 0.1:

ndist = NormalDistribution[0, 0.1]

Строим график плотности данного распределения:

pdf = PDF[ndist, x]

Plot[pdf, {x, -3, 3}, {PlotRange -> {{-1, 1}, {0, 5}}}]

Строим график функции распределения данного случайного процесса:

cdf = CDF[ndist, x]

Plot[cdf, {x, -3, 3}, {PlotRange -> {{-1, 1}, {0, 1}}}]

Генерируем вектор случайных отклонений:

randPos = RandomArray[ndist, 50]

По случайному вектору высчитываем положения частицы в пространстве:

prevPosition = 0

positions = Table[{i*0.1, prevPosition = prevPosition + randPos[[i]]}, {i, 1, \

50}]

Строим траекторию движения частицы:

Траектория движения частицы при следующем запуске программы:

Траектории движения частицы на большем интервале времени:

Приложени