Анализ нейронные сети statistica 10. Альтернативы для замены STATISTICA

Главная / Не работает
Для создания набора обучающих данных используется встроенный редактор данных (File/New/Data Set ) либо загружается файл данных *.sta с диска. В случае создания файла в Microsoft Excel *.csv необходимо провести конвертирование формата данных в формат *.sta (операция проводится автоматически при открытии файла данных).

После открытия данных ST Neural Networks предложит функцию автоматического построения (окно Intelligent Problem Solver ). На данном этапе необходимо отказаться от данной функции (Cancel ).

При открытии нового файла в ST Neural Networks все переменные считаются входными. Необходимо указать выходные переменные. Щелкните правой кнопкой мыши в поле с названием выходных переменных в окне Data Set Editor , в появившемся контекстном меню выберите Output, цвет заголовка столбца изменится на голубой.

Все наблюдения необходимо поделить на два множества: обучающее (служит для обучения НС) и контрольное (необходимо для оценки хода обучения).

Во втором поле Cases окна Data Set Editor укажите размер контрольного множества (обычно на него отводится половина всего набора данных), нажмите Enter. Строки, содержащие контрольные наблюдения, отмечены красным цветом (находятся в конце списка наблюдений). Затем, командой перемешать (Shuffle) (Edit → Cases → Shuffle →Train and Verify ), все наблюдения случайным образом распределяются по различным типам.

Для создания сети используется пункт меню File → New → Network . При этом появляется окно редактора сети (рисунок 11).

Сеть с заданными параметрами и структурой создается после нажатия кнопки Create.

Параметры Steps и Lookahead используются только в задачах временных рядов и в данной работе не используются.

Обучение сети.

Для сетей каждого типа используются специальные алгоритмы обучения, которые находятся в пункте меню Train . При выборе алгоритма предлагается определить параметры обучения. Например, при обучении многослойного персептрона методом обратного распространения (Train → Multilayer Perceptrons → Back Propagation) задаются в соответствующем окне (рисунок 12).

Рисунок 12 – Окно редактора параметров обучения

Epochs - Эпохи. Задает число циклов обучения, которые проходятся при одном нажатии клавиши Train. Значение по умолчанию 100.

Learning rate - Скорость обучения, задает величину шага при изменении весов: при недостаточной скорости алгоритм медленно сходится, при увеличении скорости обучения алгоритм работает быстрее, но в некоторых задачах это может привести к неустойчивости (особенно если данные зашумлены). Для быстрого и грубого обучения подойдут значения от 0,1 до 0,6; для достижения точной сходимости требуются меньшие значения (например, 0,01 или даже 0,001, если эпох много тысяч). Иногда полезно уменьшать скорость в процессе обучения.

Momentum - Инерция. Этот параметр улучшает (ускоряет) обучение в ситуациях, когда ошибка мало меняется, а также придает алгоритму дополнительную устойчивость, помогает алгоритму не застревать в низинах и локальных минимумах. Значение этого параметра всегда должно лежать в интервале . Часто рекомендуется использовать высокую скорость обучения в сочетании с небольшим коэффициентом инерции и наоборот.

Shuffle Cases - Перемешивать наблюдения. При использовании этой функции порядок, в котором наблюдения подаются на вход сети, меняется в каждой новой итерации. Это добавляет в обучение некоторый шум, так что ошибка может испытывать небольшие колебания. Однако при этом меньше вероятность того, что алгоритм «застрянет», и общие показатели его работы обычно улучшаются.

Cross-verification (кросс-проверка) - Стандартный способ обучения нейронных сетей заключается в том, что сеть обучается на одном из множеств, а на другом проверяется результат; таким образом, контрольное множество для обучения не используется. Это дает независимый способ проверки того, научилась ли сеть чему-нибудь полезному.

Reinitialize - сброс настраиваемых параметров сети, полученных на предыдущем цикле обучения, или для предыдущей сети.

Запуск алгоритма обучения производится нажатием кнопки Train . Каждый раз при нажатии кнопки Train алгоритм совершает N циклов обучения, где N – количество циклов обучения, определяемое в Epochs.

На графике (Statistics → Training Error Graph ) можно наблюдать изменение ошибки сети в ходе обучения. Training Error Graph– это отображение среднеквадратичной ошибки выхода на всем обучающем множестве.

На графике можно наблюдать нежелательный эффект переобучения (когда сеть хорошо учится выдавать те же выходные значения, что и в обучающем множестве, но оказывается неспособной обобщить закономерность на новые данные). Поначалу и ошибка обучения, и контрольная ошибка убывают. С началом переобучения ошибка обучения продолжает убывать, а ошибка контроля (обычно красного цвета) начинает расти. Рост проверочной ошибки сигнализирует о начале переобучения и свидетельствует о том, что алгоритм обучения начинает быть деструктивным (и одновременно о том, что более подходящей может оказаться сеть меньшего размера).

При изменении параметров сети перед обучением необходимо сбросить весовые коэффициенты (настроенные параметры) предыдущей сети. Для MLP–сети кнопкой Reinitialize.

В пакете STATISTICA Neural Networks предусмотрено автоматическое запоминание лучшей сети во время эксперимента. Для восстановления значений наилучшей сети вызовите меню Train→ Auxiliary→ Best Network .

Для просмотра результатов обучения сети используется функция Options в окне Network Set Editor , в появившемся окне нужно нажать Add (добавить). При этом в окне Network Set Editor добавится информационная строка для сети: тип сети, среднеквадратичная ошибка сети (RMS error), количество входов сети, число скрытых элементов в сети, коэффициент регрессии, использованные методы обучения (если в списке Detail shown выбрано Verbose- подробный).

Для расчета данных с помощью сети используется пункт меню Run: Data Set – расчет для всех данных исходного файла;

Single Case – расчет одного наблюдений;

One-off – расчет для произвольного входного вектора.

Расчет производится при нажатии кнопки Run соответствующего окна.

Запускается, как и в предыдущем случае, но в таблицах выводится только фактическое выходное значение.

Откройте меню Run →One-off , введите входные значения, для которых необходимо спрогнозировать выходное, нажмите Run .

Просмотр весовых коэффициентов синаптических связей нейронов возможен в окне Network Editor (рисунок 13) (Edit→Network… ). Значение Theshold – пороговое значение, которое вычитается от входного значения нейрона. Значение VAR1 (на рисунке 13) – весовой коэффициент связи.

Номер слоя задается в поле Layer. В данном окне можно просмотреть (задать) функцию активации нейрона каждого слоя (поле Act fn).


Рисунок 13 – Окна просмотра параметров обученной сети

Просмотр выходных значений нейронов в слое в окне Network Activations (Run → Activations … ). Расчет для строки данных (указана в поле Case No ) по нажатию кнопки Run.

В пакете STATISTICA Neural Networks предусмотрена возможность автоматического определения структуры лучшей сети для набора обучающих данных (функция доступна через File→New→Intelleigent Problem Solver ).

Алгоритм работы сети в пакете STATISTICA Neural Networks .

1 Нормализация входных данных:

,

где - коэффициент нормализации; , максимальное и минимальное значения j- й переменной обучающей выборки; i – номер строки обучающей выборки.

Примечание - Для просмотра и анализа данных обучающей выборки удобно использовать функцию Edit → Cases → Shuffle →Group Sets.

2 Распределение входного вектора на следующий слой с соответствующим весовым коэффициентом (см. Edit→Network… ).

3 Вычитание порогового значения на каждом нейроне (см. Edit→Network… поле Theshold ).

4 Вычисление функции активации нейрона (результат см. Run → Activations … ).

5 Повтор шагов для всех слоев сети.

6 Вычисление выхода сети с учетом коэффициента нормализации:

, где - минимальное значение выходной переменной обучающей выборки, t – номер выходной переменной, - коэффициент нормализации выходной переменой t , - нормализованное значение выхода сети, рассчитанное для последнего слоя.

Контрольные вопросы

1 Что такое нейронная сеть и каковы ее основные свойства?

2 Какова структура нейрона?

3 Какие функции активации могут быть использованы в нейронных сетях?

4 Какие требования предъявляются к функциям активации?

5 Какие функции выполняет входной слой в многослойной сети?

6 Можно ли обучить нейронную сеть без скрытого слоя?

7 В чем заключается обучение нейронных сетей?

8 Почему один из алгоритмов обучения получил название «алгоритм обратного распространения»?

9 Чем отличается обучение с учителем от обучения без учителя?

10 Почему входные и выходные сигналы нейронной сети должны быть нормированы, т.е. приведены к диапазону ?

Список литературы

1 Fogelman Soulie F. Neural networks, state of the art, neural computing. -London: IBC Technical Services, 1991.

2 Горбань А. Нейроинформатика и ее приложения // Открытые системы. -1998. -№ 4 – 5. -С. 36 - 41.

3 Роберт Хехт-Нильсен. Нейрокомпьютинг: история, состояние, перспективы // Открытые системы. -1998. -№ 4-5. -С. 23 - 28.

4 Розенблатт Ф. Принципы нейродинамики. Персептроны и теория механизмов мозга. -М.: Мир, 1965.

5 Гордиенко Е.К., Лукьяница А.А. Искусственные нейронные сети. I Основные определения и модели// Изв. РАН. Техническая кибернетика. -1994. -№ 5. -С. 79 - 92.

6 Короткий С.Г. Нейронные сети: алгоритм обратного распространения. -BYTE/Россия. -2000. -№ 5. -С. 26-29.

7 Свешников С.В., Шквар А.М. Нейротехнические системы обработки информации. -Киев: Наукова думка, 1983. -222 с.

8 Интеллектуальные системы управления с использованием нейронных сетей: учеб. пособие. / В.И. Васильев, Б.Г. Ильясов, С.С. Валеев и др.; Уфимск. гос. авиац. техн. ун-т. Уфа, 1997. -92 с.

9 Куликов Г.Г., Брейкин Т.В., Арьков В.Ю. Интеллектуальные информационные системы: учеб. пособие / Уфимск. гос. авиац. техн. ун-т. -Уфа, 1999. -129 с.

10 Короткий С.Г. Нейронные сети: основные положения // BYTE/Россия. -2000. -№ 5. -С. 18-21.

11 Интеллектуальные системы обработки информации на основе нейросетевых технологий: учеб. пособие. / Ю.И. Зозуля, Уфимск. гос. авиац. техн. ун-т. –Уфа. -2000. -138 с.

ЗНАКОМСТВО С СОВРЕМЕННЫМ НЕЙРОСЕТЕВЫМ

Лабораторная работа № 1

ПРОГРАММНЫМ ПРОДУКТОМ STATISTICA NEURAL NETWORKS (SNN) ВЕРСИИ «SNN 7.0»

Цель работы – познакомиться с программным продуктом Statistica

Neural Networks (SNN), построить нейронную сеть с помощью мастера решений.

1. Открыть файл данных Вентилятор.stw (табл.П.1) с помощью команды Файл Открыть . В этом файле находятся данные о двух типах классах – 1 и 2, наличие и отсутствие перегрева.

2. Выбрать команду Нейронные сети в меню Анализ для вызова стартовой панели STATISTICA Нейронные сети.

Рис. 4. Выбор инструмента

3. На вкладке Быстрый стартовой панели Нейронные сети выбрать из списка тип задачи (в данном случаеКлассификация ) и метод решения (в данном случае – Мастеррешений ) и нажать кнопку OK (рис. 4). После этого будет отображен стандартный диалог выбора переменных.

4. Выбрать зависимую (выходную) переменную (в данном случае – переменная КЛАСС) (рис. 5).

Рис. 5. Входные данные

5. Для отображения Мастера решений нажать кнопку OK на стартовой панели.

На вкладке Быстрый (рис. 6) отменить выбор опции Выбрать подмножество независимых переменных , здесь определены только две независимые переменные, таким образом, обе переменные будут использоваться в качестве входов для всех проверяемых нейронных сетей. В группе Длительность анализа находятся опции, определяющие время, которое Мастер решений потратит на поиск эффективной нейронной сети. Чем дольше Мастер решений будет работать, тем эффективней будет найденное решение. Например, установить 25 сетей.

По результату проведенного анализа можно сохранить нейронные сети различных типов с различными показателями производительности и сложности для того, чтобы можно было в итоге выбрать наилучшую сеть самостоятельно.

6. Ввести число 10 для сохранения сетей, чтобы Мастер решений сохранил только 10 наилучших вариантов сетей.

Вкладка Мастер решений Быстрый будет иметь вид, отображенный на рис. 6.

Рис. 6. Настройки для проведения анализа

Нажать кнопку OK , чтобы Мастер решений начал построение

нейронных сетей. После этого будет отображен диалог Идет обучение (Мастер решений ). Каждый раз при обнаружении улучшенной нейронной сети будет добавлена новая строка в информационную таблицу. Кроме этого, в нижней части окна отображается время работы и процент выполненного задания. Если на протяжении длительного времени не произошло никаких улучшений, то нажать кнопку Готово в диалоге Идет обучение , чтобы завершить процесс поиска сетей. После окончания поиска будет отображен диалог Результаты , содержащий информацию о найденных сетях для дальнейшего анализа (рис. 7).



Рис. 7. Результаты обучения

7. Нажать кнопку Описательные стат . на вкладке Быстрый в диалоге Результаты , чтобы отобразить две итоговые таблицы: Классификация и Матрица ошибок.

В таблице классификаций (рис. 8) представлена полная информация о решении соответствующей задачи. В этой таблице для каждого выходного класса, предсказанной каждой моделью, существует несколько столбцов. Например, столбец, обозначенный КЛАСС.1.11, соответствует предсказаниям модели 1 в классе ПЕРЕГРЕВА для переменной КЛАСС . В первой строке приводится информация о количестве наблюдений различных типов перегревов в файле данных. Во второй (третьей) строке отображаются данные (для каждого класса) о количестве правильно (неправильно) классифицированных наблюдений. В четвертой строке приводятся «неизвестные» наблюдения. Матрица ошибок обычно используется в задачах с несколькими вы-

ходными классами.

8. Для отображения итоговой статистики необходимо открыть Анализ (кнопка Результаты в строке Анализа или команда Продолжить в меню Анализ ). В группе Выборки для вывода результатов выбрать опцию Все (отдельно). Затем нажать кнопку Описательные статистики . Итоговая таблица классификаций разделена на четыре части. Заголовки столбцов имеют различные префиксы: О, К, Т и И , которые соответствуют обучающей, контрольной, тестовой и игнорируемой выборкам соответственно. По умолчанию, наблюдения разделены на три подмножества в отношении 2:1:1. Таким образом, выделено 50 обучающих наблюдений, 25 контрольных наблюдений и 25 проверочных наблюдений. Результаты работы нейронной сети на этих множествах практически совпадают, то есть качество нейронной сети можно считать приемлемым.

Рис. 8. Таблица классификаций

9. Для завершения Анализа нажать кнопку OK в диалоге Результаты . На стартовой панели при нажатии на кнопку Отмена все построенные нейронные сети будут удалены. Сохранять нейронные сети необходимо для того, чтобы быстрее провести обучение нейронных сетей, соответственно перед этим найти сеть с наилучшей производительностью, и далее построенные нейронные сети сохраняются для дальнейшего использования. Для сохранения нейронной сети выбрать вкладку Сети/Ансамбли и нажать кнопку Сохранить файл сети как... . (файл имеет расширение.snn).

Задания

1. Построить и обучить нейронную сеть с помощью Мастера решений для автоматизации диагностики автомобиля, определяющей необходимость капитального ремонта двигателя на основе следующих параметров: компрессия двигателя, давление масла, расход бензина.

2. Ввести исходные данные в соответствии с табл. 1, конкретные значения переменных получить у преподавателя.

3. Построить нейронную сеть в соответствии с настройками:

Тип задачи: классификация;

Инструмент: мастер решений;

Количество сетей: 25;

5. Сделать анализ построения нейронной сети и отразить в отчете.

6. Оформить отчет о выполненной работе.

R - это свободная программная среда для статистических вычислений и графиков.
Это проект GNU, похожий на язык и среду S, который был разработан в Bell Laboratories (ранее AT & T, сейчас Lucent Technologies) Джоном Чамберсом и его коллегами. R может рассматриваться как другая реализация S. Есть некоторые важные различия, но большая часть кода, написанного для S, работает без изменений под R

Бесплатная Открытый код Mac Windows Linux BSD

  • RStudio

    RStudio ™ - это интегрированная среда разработки (IDE) для языка программирования R. RStudio сочетает в себе интуитивно понятный пользовательский интерфейс и мощные инструменты кодирования, которые помогут вам максимально использовать возможности R.

    Бесплатная Открытый код Mac Windows Linux Xfce

  • PSPP

    PSPP - это бесплатное программное приложение для анализа выборочных данных. Оно имеет графический интерфейс пользователя и обычный интерфейс командной строки. Он написан на C, использует научную библиотеку GNU для своих математических процедур и plotutils для генерации графов. Он предназначен для бесплатной замены проприетарной программы SPSS.

    Бесплатная Открытый код Mac Windows Linux

  • IBM SPSS Statistics

    Программная платформа IBM SPSS предлагает расширенный статистический анализ, обширную библиотеку алгоритмов машинного обучения, анализ текста, расширяемость с открытым исходным кодом, интеграцию с большими данными и плавное развертывание в приложениях.

    Платная Mac Windows Linux

  • SOFA Statistics

    SOFA Statistics - это статистический пакет с открытым исходным кодом, в котором особое внимание уделяется простоте использования, обучению по ходу работы и прекрасным результатам. Название расшифровывается как «Статистика, открытая для всех». Он имеет графический интерфейс пользователя и может напрямую подключаться к MySQL, SQLite, MS Access и MS SQL Server

    Бесплатная Открытый код Mac Windows Linux

  • Что в этом списке?

    В списке находится программы которые можно использовать для замены STATISTICA на платформах Windows. Этот список содержит 6 приложений, похожих на STATISTICA.

    и покажем, как организован диалог с пользователем системы.

    Обратим внимание на удобный интерфейс и наличие инструментов , и Метод многократных подвыборок , позволяющих пользователям конструировать собственные сети и выбирать наилучшие.

    Итак, прежде всего, запустим нейронные сети.

    Шаг 1. Вы начинаете со стартовой панели (посмотрите на рис. 1).

    В данной панели вы можете выбрать различные виды анализа, которые Вам необходимо выполнить: регрессию, классификацию, прогнозирование временных рядов (с непрерывной и категориальной зависимой переменной), кластерный анализ.

    Рис. 1. Стартовая панель STATISTICA Automated Neural Networks (SANN)

    Выберите, например, Временные ряды (регрессия) , если вы хотите построить прогноз, или Классификация , если решается задача классификации.

    Нажав кнопку ОК , перейдем к диалоговому окну выбора данных.

    Рис. 2. Диалоговое окно Нейронные сети - Отбор данных - вкладка Быстрый

    Шаг 2. На вкладке Быстрый следует выбрать необходимые переменные для анализа. Переменные могут быть непрерывными и категориальными, зависимыми и независимыми; кроме того, наблюдения могут принадлежать разным выборкам.


    Рис. 3. Окно выбора переменных

    Для начинающих пользователей рекомендуется выбирать стратегию Опытный пользователь может с легкостью использовать любую доступную стратегию: Автоматизированная нейронная сеть (АНС), Пользовательская нейронная сеть (ПНС) и Мы выберем Автоматизированная нейронная сеть (АНС).

    Рис. 4. Диалоговое окно Нейронные сети - Отбор данных - вкладка Быстрый

    На вкладке Подвыборки (ПНС и АНС) следует задать желаемое разбиение данных на подвыборки: обучающую, контрольную и тестовую. Разбиение можно задавать случайным образом, а можно фиксировать с помощью дополнительной переменной кодов.

    В данном случае будем использовать случайное разбиение.

    Рис. 5. Диалоговое окно Нейронные сети - Отбор данных - вкладка Подвыборки (АНС и ПНС)

    Вкладка Подвыборки (ПНС и АНС) предназначена для первых двух стратегий: Автоматизированная нейронная сеть (АНС) и Пользовательская нейронная сеть (ПНС) ; а вкладке Создание подвыборок используется для последней стратегии: Метод многократных подвыборок.

    Нажимаем ОК и переходим к шагу задания параметров архитектуры.

    Шаг 3. На вкладке Быстрый диалогового окна Автоматизированные нейронные сети необходимо указать тип сети, количество скрытых нейронов, количество обучаемых и сохраняемых сетей, а также тип используемых функций ошибок.

    Программа предлагает следующие типы сетей: многослойные персептроны и сети радиальных базисных функций.

    Рис. 6. Диалоговое окно Автоматизированные нейронные сети - вкладка Быстрый

    Рис. 7. Диалоговое окно Автоматизированные нейронные сети - вкладка Функции активации для МЛП

    На вкладке Затухание можно включить опцию регуляризации весов, которая будет регулировать сложность обучаемых сетей. Это полезно, когда задача имеет большое число входных переменных, а также задано большое число нейронов на скрытом слое.

    Но в нашем случае мы это использовать не будем.

    Рис. 8. Диалоговое окно Автоматизированные нейронные сети - вкладка Затухание

    Теперь можно перейти к шагу обучения нейронных сетей.

    Шаг 4. Запустите процедуру обучения нейронных сетей, нажав кнопку ОК .

    В диалоговом окне, приведенном на рис. 9, отображается некоторая информация о текущей обучаемой нейронной сети. Мы можем анализировать архитектуру сети, смотреть за ходом итераций алгоритма и фиксировать ошибки моделей. Для регрессии используется среднеквадратичная ошибка, для классификации используется процент правильной классификации наблюдений (как в нашем случае).

    Рис. 9. Диалоговое окно Обучение нейронной сети

    Программа автоматически переходит к следующему шагу.

    Шаг 5. Анализ результатов. В окне результатов вы можете проанализировать полученные решения. Программа отберет лучшие сети и покажет качество решения.

    Рис. 10. Диалоговое окно Нейронные сети - Результаты - вкладка Предсказанные

    Можно выбрать определенную сеть, лучшую на наш взгляд, с помощью кнопки Выбрать/Снять сети .

    Рис. 11. Диалоговое окно Активация модели

    Например, одним из способов проверки является сравнение наблюдаемых значений и предсказанных результатов. Сравнение наблюдаемых и предсказанных значений для выбранной сети, например, для обучающей и тестовой выборок.

    Рис. 12. Таблица наблюдаемых и предсказанных значений

    Или посмотреть матрицу ошибок классификации на тестовой выборке:

    Рис. 13. Матрица классификаций

    Шаг 6. Сохраните лучшие сети с целью дальнейшего использования, например, для автоматического построения прогнозов.

    Для дальнейшего запуска, сети сохраняются в формате PMML.

    Рис. 14. Диалоговое окно Нейронные сети - Результаты - Сохранение сетей

    Рис. 15. Стандартное окно сохранения файла сети

    Шаг 7. Запуск сохраненных моделей на новых данных. Итак загружаем новые данные, но чтобы переменные совпадали с переменными в моделях.

    Чтобы запустить модель на новых данных, можно на стартовой панели (рис. 1) выбрать опцию Загрузить модели из предыдущих анализов и нажить кнопу Загрузить сети.

    Рис. 16. Стандартное окно выбора файла сети

    Получаем:

    Рис. 17. Стартовая панель STATISTICA Automated Neural Networks (SANN)

    После выбора необходимого файла, все настройки автоматически определяются, поэтому можно сразу переходить к окну результатов (нажимая два раза кнопку ОК ) и анализировать полученные результаты.

    Именно таков типичный сценарий исследования в пакете

    Эти книги можно приобрести в офисе StatSoft .

    Популярное введение в современный анализ данных и машинное обучение на Statistica

    В.П. Боровиков

    Объем: 354 стр.

    Цена: 1000 руб.

    Популярно и увлекательно освещены современные возможности анализа данных и машинного обучения, являющегося трендом современной компьютерной аналитики. В изложении упор сделан на понимании методов и их применении к практическим задачам. "Делайте вслед за нами, и вы научитесь анализировать данные!" - основной лейтмотив книги.

    Подробно описаны классические статистические методы, включая многомерные методы: кластерный, дискриминантный анализ, множественная регрессия, факторный анализ, метод главных компонент, анализ выживаемости и регрессия Кокса. В отдельных главах изложены нейросетевые методы, методы добычи данных, деревья классификации и регрессии (CART - модели). Рассмотрены примеры из различных областей человеческой деятельности: промышленности, ритейла, инфокоммуникаций, бизнеса, медицины. Специальные главы посвящены теории вероятностей и методам оптимизации, лежащим в основе методов машинного обучения.

    Для широкого круга читателей: инженеров, технологов, менеджеров, аналитиков, врачей, исследователей, интересующихся современными аналитическими методами и технологиями анализа данных и машинного обучения и их применением на практике.

    Популярное введение в современный анализ данных в системе STATISTICA

    В.П. Боровиков

    Объем: 288 стр.

    В уникальной книге научного директора StatSoft Владимира Боровикова собрано все лучшее, что известно в области анализа данных.

    На простых, ясных примерах из бизнеса, маркетинга, медицины описаны современные методы анализа данных - визуальный анализ и графическое представление данных, описательные статистики, методы классификации и прогнозирования.

    Книга является образовательным стандартом в области анализа данных в ведущих вузах России: НИУ МИЭМ ВШЭ, МГУ, Кубанский государственный университет и др.

    Большое внимание уделяется систематике анализа данных, начиная от описательного анализа, чистки и верификации данных, визуального представления, группировки и методов классификации до новейших технологий нейронных сетей и data mining, позволяющих найти закономерности в ваших данных.

    Теория вероятностей, математическая статистика и анализ данных: Основы теории и практика на компьютере. STATISTICA. EXCEL. Более 150 примеров решения задач

    Халафян А.А., Боровиков В.П., Калайдина Г.В.

    Объем: 320 стр.

    Цена: 600 руб.

    Отправить заявку можно по адресу

    Современный уровень развития компьютерных технологий позволяет изучение теории вероятностей и математической статистики вывести на новый образовательный уровень, сделав упор на прикладную часть дисциплины – математическую статистику и компьютерный анализ данных.

    В учебном пособии изложены элементы комбинаторики, различные способы вычисления вероятностей, даны понятия случайной величины, ее функциональные и числовые характеристики. Теоретический материал сопровождается примерами и специально подобранными задачами, позволяющими глубже изучить материал. В отдельной главе описано использование Excel и STATISTICA для решения прикладных задач. Excel входит в состав Microsoft Office и на сегодняшний день является одним из наиболее популярных приложений в мире. STATISTICA занимает лидирующее положение среди программ анализа данных, имеет более миллиона пользователей по всему миру. Программа полностью русифицирована, создан Интеллектуальный портал знаний, который представляет глобальный мультимедийный ресурс для широкого круга пользователей: школьников, студентов, аспирантов – всех желающих развить свой интеллект, познакомиться с современными технологиями компьютерного анализа данных.

    Учебное пособие адресовано широкому кругу учащихся и преподавателей, студентам, бакалаврам гуманитарных и естественно-научных специальностей нематематического направления, изучающих высшую математику.

    Нейронные сети STATISTICA Neural Networks : Методология и технология современного анализа данных

    Под ред. В.П. Боровикова

    Объем: 392 стр.

    Отправить заявку можно по адресу

    В книге изложены нейросетевые методы анализа данных, основанные на использовании пакета STATISTICA Neural Networks , полностью адаптированного для русского пользователя.

    Даны основы теории нейронных сетей; большое внимание уделено решению практических задач, всесторонне рассмотрена методология и технология проведения исследований с помощью пакета STATISTICA Neural Networks мощного инструмента анализа данных, построения зависимостей, прогнозирования, классификации.

    В настоящее время нейронные сети интенсивно используются в банках, промышленности, маркетинге, экономике, медицине и других областях, где требуется прогнозирование и углубленное понимание данных. Общепризнанно, что нейронные сети являются естественным дополнением классических методов анализа и применяются там, где стандартные процедуры не дают нужного эффекта.

    Книга содержит множество примеров анализа данных, практические рекомендации по проведению анализа, прогнозирования, классификации, распознавания образов, управления производственными процессами с помощью нейронных сетей.

    Книга будет полезна для широкого круга читателей, занимающегося исследованиями в банковской сфере, промышленности, бизнесе, геологоразведке, управлении, транспорте и других областях.

    STATISTICA : искусство анализа данных на компьютере (2-ое издание)

    + Мультимедийный Учебник StatSoft

    В. П. Боровиков

    Объем: 700 стр.

    В настоящее время книга отсутствует в продаже. В ближайшее время планируется новое издание книги. Ваши заявки, пожалуйста, направляйте по адресу:

    Книга является самым фундаментальным текстом по современному анализу данных и включает около 700 страниц описания методов и процедур анализа данных. Второе издание книги дополнено новыми материалами, не включенными в предыдущую версию книги, в частности: описан анализ мощности, оценка объема выборки, частные корреляции, анализ главных компонент, дана новая интерпретация нейронных сетей и многое другое. К книге прилагается компакт-диск, на котором Вы найдете демо-версии программных продуктов StatSoft, примеры анализа данных, знаменитый электронный учебник StatSoft, учебник по промышленной статистике, материалы обучающих курсов, а также огромное количество данных для обучения и проведения самостоятельных исследований.

    Главную особенность второго издания представляет новая глава о языке STATISTICA Visual Basic (SVB), расширяющем возможности системы STATISTICA и позволяющем пользователям создавать собственные приложения.

    В книге на примере реальных данных подробно описаны основные понятия анализа данных в системе STATISTICA : дескриптивный и визуальный анализ, анализ таблиц сопряженности, построение зависимостей, множественная регрессия, анализ выживаемости, непараметрические методы, анализ соответствий, нейронные сети, классификация и прогнозирование с помощью нейронных сетей, контроль качества, планирование экспериментов, включая самые разнообразные планы и многое другое.

    Особенность книги состоит в том, что Вы не только видите результаты анализа, но и можете повторить их вслед за нами на системе STATISTICA , таким образом, используя новейшие компьютерные технологии анализа данных от StatSoft, Вы учитесь шаг за шагом анализировать и понимать данные.

    Данное фундаментальное издание рассчитано на самый широкий круг читателей и пользователей системы STATISTICA , желающих стать профессионалами в анализе данных в различных областях: бизнесе, маркетинге, финансах, управлении, экономике, промышленности, страховании, медицине и других приложениях.

    Прогнозирование в системе STATISTICA в среде WINDOWS

    В.П. Боровиков, Г.И. Ивченко

    Объем: 368 стр.

    В настоящее время книга отсутствует в продаже.

    Секреты прогнозирования из первых рук.

    Особенностью книги является сочетание двух взаимосвязанных и взаимодополняющих друг друга частей: практической, в которой подробно, с переводом основных опций и диалоговых окон, описано прогнозирование в современной версии системы STATISTICA , и теоретической, в которой изложены основные идеи, методы и результаты теории стохастического прогнозирования.

    По мнению авторов, синтез теории и практики должен привести к тому, что читатель не только механически осваивает методы и приемы прогнозирования, а получает связанное представление о них: от знакомства с математическими основами до приобретения практических навыков в системе STATISTICA .

    В основе книги лежит курс, читаемый авторами в Московском государственном институте электроники и математики (МГИЭМ - Технический Университет). Приложение содержит исчерпывающий англо-русский словарь основных терминов по прогнозированию.
    Книга ориентирована на научных работников, аналитиков и специалистов, использующих методы прогнозирования в повседневной деятельности, а также может быть использована преподавателями высших учебных заведений при чтении курсов по прогнозированию и математической статистике.

    Геостатистика. Теория и практика

    В.В. Демьянов, Е.А. Савельева

    Объем: 327 стр.

    В настоящее время книга отсутствует в продаже.


    Эта книга ответит на вопросы:
    - что такое геостатистика?
    - какие существуют методы пространственной интерполяции?
    - что такое кригинг?
    - чем полезна вариограмма?
    - зачем нужно стохастическое моделирование?
    и многие другие

    В монографии подробно изложены методы геостатистики и смежных разделов пространственного моделирования. Изложение теории сопровождается примерами использования моделей в различных областях: экологии, геологии, гидрогеологии, нефтедобыче, энергетике, оценке рыбных запасов и т. п. В заключительном разделе очерчены основные направления развития современной геостатистической теории. Издание может быть использовано в качестве учебного пособия.

    Материал книги излагается с постепенным усложнением. Для закрепления полученных знаний имеются вопросы и упражнения. В книгу включены приложения, позволяющие использовать её как справочник по геостатистике.


    Академия Анализа Данных StatSoft также предлагает широкий выбор курсов по современным методам и технологиям анализа данных в области геоаналитики.

    Промышленная статистика. Контроль качества, анализ процессов, планирование экспериментов в пакете STATISTICA

    Халафян А.А.

    Объем: 384 стр.

    В настоящее время книга отсутствует в продаже.


    Настоящее издание посвящено описанию статистических методов, которые позволяют при ограниченных объемах анализируемых изделий с заданной степенью точности и достоверности судить о состоянии качества выпускаемой продукции. Статистический анализ качества продукции обеспечивает принятие верных управленческих решений не на основе интуиции, а при помощи научных методов выявления закономерностей в накапливаемых массивах числовой информации.

    В учебнике рассмотрены такие разделы промышленной статистики, как: карты контроля качества; анализ процессов; шесть сигма; планирование экспериментов в среде широко известного во всем мире пакета STATISTICA . Дано подробное описание технологии работы с модулями программы.

    Издание адресовано студентам направлений "Экономика", "Управление качеством", "Стандартизация и метрология", "Метрология, стандартизация и сертификация", аспирантам, научным работникам, преподавателям вузов, аналитикам и управленцам, а также всем, кто интересуется статистическими методами в управлении качеством.

    Как выиграть мировой чемпионат. Методы математической статистики в управлении национальным футболом

    Петрунин Ю.Ю., Рязанов М.А.

    Объем: 56 стр.

    В настоящее время книга отсутствует в продаже.


    Современные методы статистики и анализа данных привели к созданию новых научных дисциплин – футболономики и футболометрии. Используя разработанный в них аппарат, можно оценить качество работы государственных (Министерство спорта) и некоммерческих организаций (футбольных ассоциаций и союзов), разработать и применить методы регулирующих воздействий, способных поднять уровень национального футбола и его престиж на мировой арене.

    STATISTICA – Краткое руководство пользователя

    Объем: 250 стр.

    В настоящее время книга отсутствует в продаже.

    В книге изложены основные принципы работы с системой, рассматриваются панели инструментов, пользовательский интерфейс, файлы данных, практические примеры использования пакета. Отдельная глава посвящена настройке системы. Также книга содержит исчерпывающий справочник, который представляет собой краткие сведения о наиболее часто используемых соглашениях, функциях и возможностях системы STATISTICA , и предметный указатель.

    © 2024 ermake.ru -- Про ремонт ПК - Информационный портал