Analiza rețelelor neuronale statistica 10. Alternative pentru înlocuirea STATISTICA

Acasă / Nu merge
Pentru a crea un set de date de antrenament, utilizați editorul de date încorporat ( Fișier/Nou/Set de date) sau fișierul de date *.sta este încărcat de pe disc. Dacă creați un fișier în Microsoft Excel *.csv este necesară convertirea formatului de date în formatul *.sta (operația se realizează automat la deschiderea fișierului de date).

După deschiderea datelor ST rețele neuronale va oferi o funcție de construcție automată (fereastră Rezolvator inteligent de probleme). În această etapă este necesar să renunțați la această funcție ( Anula).

Când deschideți un fișier nou în ST Neural Networks, toate variabilele sunt considerate intrare. Trebuie specificate variabilele de ieșire. Clic clic dreapta mouse-ul în câmpul cu numele variabilelor de ieșire din fereastră Editor de set de date, în a apărut meniul contextual selectați Ieșire, culoarea antetului coloanei se va schimba în albastru.

Toate observațiile trebuie împărțite în două seturi: antrenament (utilizat pentru antrenarea rețelei neuronale) și control (necesar pentru evaluarea progresului antrenamentului).

În al doilea domeniu Cazuri ferestre Editor de set de date specificați dimensiunea setului de control (de obicei, jumătate din întregul set de date îi este alocat), apăsați Enter. Rândurile care conțin observații de control sunt marcate cu roșu (situate la sfârșitul listei de observații). Apoi, utilizați comanda Shuffle ( Editare → Cazuri → Amestecare → Antrenați și verificați), toate observațiile la întâmplare sunt repartizate în diferite tipuri.

Pentru a crea o rețea, utilizați elementul de meniu Fișier → Nou → Rețea. Apare fereastra editorului de rețea (Figura 11).

Rețea cu parametrii dați iar structura este creată după ce faceți clic pe butonul Creare.

Opțiuni PașiŞi Privește înainte sunt utilizate numai în probleme de serie de timp și nu sunt utilizate în această lucrare.

Instruire în rețea.

Pentru fiecare tip de rețea, sunt utilizați algoritmi speciali de învățare, care se află în elementul de meniu Tren. La alegerea unui algoritm, se propune determinarea parametrilor de antrenament. De exemplu, atunci când antrenați un perceptron multistrat folosind metoda de propagare inversă (Tren → Perceptroni multistrat → Propagare înapoi) sunt specificate în fereastra corespunzătoare (Figura 12).

Figura 12 – Fereastra editorului parametrilor de antrenament

Epoci- Epoci. Setează numărul de cicluri de antrenament care sunt finalizate la apăsarea tastei Train. Valoarea implicită este 100.

Rata de învățare- Rata de învățare, stabilește dimensiunea pasului la schimbarea greutăților: dacă viteza este insuficientă, algoritmul converge lent, dacă rata de învățare crește, algoritmul funcționează mai repede, dar în unele probleme acest lucru poate duce la instabilitate (mai ales dacă datele sunt zgomotos). Pentru o învățare rapidă și brută, valorile de la 0,1 la 0,6 sunt potrivite; sunt necesare valori mai mici pentru a obține o convergență precisă (de exemplu, 0,01 sau chiar 0,001 dacă există multe mii de epoci). Uneori este util să reduceți viteza în timp ce învățați.

Impuls- Inerție. Acest parametru îmbunătățește (accelerează) învățarea în situațiile în care eroarea se modifică puțin și, de asemenea, oferă algoritmului stabilitate suplimentară, ajutând algoritmul să nu se blocheze în minime și minime locale. Valoarea acestui parametru trebuie să fie întotdeauna în interval. Deseori se recomandă utilizarea de mare vitezăînvăţarea în combinaţie cu un mic coeficient de inerţie şi invers.

Amestecă cazurile- Amestecați observațiile. Când utilizați această funcție, ordinea în care observațiile sunt introduse în intrarea în rețea se modifică la fiecare nouă iterație. Acest lucru adaugă ceva zgomot antrenamentului, astfel încât eroarea poate experimenta ușoare fluctuații. Cu toate acestea, este mai puțin probabil ca algoritmul să se blocheze, iar performanța sa generală se îmbunătățește de obicei.

Verificare încrucișată(validare încrucișată) - Modul standard de antrenament al rețelelor neuronale este ca rețeaua să fie antrenată pe unul dintre seturi, iar rezultatul să fie verificat pe celălalt; astfel, nici un set de control nu este utilizat pentru antrenament. Aceasta oferă o modalitate independentă de a verifica dacă rețeaua a învățat ceva util.

Reinițializați- resetarea parametrilor de retea configurabili obtinuti in ciclul de pregatire anterior, sau pentru reteaua precedenta.

Algoritmul de învățare este lansat prin apăsarea unui buton Tren. De fiecare dată când apăsați butonul Tren algoritmul efectuează N cicluri de antrenament, unde N este numărul de cicluri de antrenament, determinat în Epoci.

Pe grafic ( Statistici → Grafic eroare antrenament) se poate observa modificarea erorii de rețea în timpul antrenamentului. Training Error Graph este o afișare a erorii pătratice medii a rezultatului pe întregul set de antrenament.

În grafic, puteți observa efectul nedorit al supraajustării (când rețeaua învață bine să producă aceleași valori de ieșire ca în setul de antrenament, dar nu este în măsură să generalizeze modelul la date noi). Inițial, atât eroarea de învățare, cât și eroarea de control scad. Pe măsură ce începe reantrenarea, eroarea de antrenament continuă să scadă, iar eroarea de control (de obicei roșie) începe să crească. O creștere a erorii de verificare semnalează începutul reantrenării și indică faptul că algoritmul de învățare începe să fie distructiv (și în același timp că o rețea mai mică poate fi mai potrivită).

Când schimbați parametrii rețelei înainte de antrenament, trebuie să resetați coeficienții de ponderare (parametrii configurați) ai rețelei anterioare. Pentru o rețea MLP, utilizați butonul Reinițializare.

In pachet STATISTICA Rețele neuronale este asigurată memorarea automată a celei mai bune rețele în timpul experimentului. Pentru a restabili valorile celei mai bune rețele, apelați meniul Tren→ Auxiliar→ Cea mai bună rețea.

Pentru a vizualiza rezultatele antrenamentului în rețea, utilizați funcția Opțiuniîn fereastră Editor de set de rețea, în fereastra care apare, faceți clic pe Adăugați. În același timp, în fereastră Editor de set de rețea se va adăuga o linie de informare pentru rețea: tipul rețelei, eroarea pătrată medie a rețelei (eroare RMS), numărul de intrări în rețea, numărul de elemente ascunse în rețea, coeficientul de regresie, metodele de antrenament utilizate (dacă este selectat Verbose în lista Detaliu afișată).

Pentru a calcula datele folosind rețeaua, utilizați elementul de meniu Run: set de date– calcul pentru toate datele fișier sursă;

Caz unic – calculul unei observații;

O singură dată– calcul pentru un vector de intrare arbitrar.

Calculul se efectuează făcând clic pe butonul Run din fereastra corespunzătoare.

Funcționează ca în cazul precedent, dar numai valoarea reală de ieșire este afișată în tabele.

Deschide meniul Run →On-off, introduceți valorile de intrare pentru care doriți să preziceți rezultatul, faceți clic Fugi.

Puteți vizualiza coeficienții de ponderare a conexiunilor sinaptice ale neuronilor în fereastra Editor de rețea (Figura 13) ( Editare→Rețea...). Valoarea prag este o valoare prag care este scăzută din valoarea de intrare a neuronului. Valoarea lui VAR1 (în Figura 13) este coeficientul de ponderare al conexiunii.

Numărul stratului este specificat în câmp Strat.În această fereastră puteți vizualiza (seta) funcția de activare a neuronului fiecărui strat (câmpul Act fn).


Figura 13 – Ferestre pentru vizualizarea parametrilor rețelei antrenate

Vizualizați valorile de ieșire ale neuronilor într-un strat în fereastra Activari de rețea ( Run → Activari...). Calcul pentru linia de date (specificat în câmp Cazul nr) prin apăsarea butonului Run.

In pachet STATISTICA Rețele neuronale se prevede posibilitatea detecție automată structuri ale celei mai bune rețele pentru setul de date de antrenament (funcție disponibilă prin Fișier→Nou→Rezolvare inteligentă a problemelor).

Algoritm pentru funcționarea în rețea într-un pachet STATISTICA Rețele neuronale.

1 Normalizarea datelor de intrare:

,

Unde - coeficient de normalizare; , valori maxime si minime j- variabila a eșantionului de antrenament; i– numărul rândului eșantionului de antrenament.

Notă - Pentru a vizualiza și analiza datele eșantioane de antrenament, este convenabil să utilizați funcția Editare → Cazuri → Aleatoriu → Seturi de grup.

2 Distribuția vectorului de intrare la stratul următor cu coeficientul de ponderare corespunzător (vezi. Editare→Rețea...).

3 Scăderea valorii prag pentru fiecare neuron (vezi. Editare→Rețea... domeniu Theshold).

4 Calculul funcției de activare a neuronilor (pentru rezultat, vezi Run → Activari...).

5 Repetați pașii pentru toate straturile de rețea.

6 Calculul ieșirii rețelei ținând cont de coeficientul de normalizare:

, unde este valoarea minimă a variabilei de ieșire a eșantionului de antrenament, t– numărul variabilei de ieșire, - coeficientul de normalizare al variabilei de ieșire t, este valoarea normalizată de ieșire a rețelei calculată pentru ultimul strat.

Întrebări de securitate

1 Ce este o rețea neuronală și care sunt principalele ei proprietăți?

2 Care este structura unui neuron?

3 Ce ​​funcții de activare pot fi utilizate în rețelele neuronale?

4 Care sunt cerințele pentru funcțiile de activare?

5 Ce funcții îndeplinește stratul de intrare într-o rețea multistrat?

6 Este posibil să antrenezi o rețea neuronală fără un strat ascuns?

7 Ce este antrenamentul rețelelor neuronale?

8 De ce unul dintre algoritmii de învățare este numit „algoritm de propagare inversă”?

9 Care este diferența dintre învățarea supravegheată și învățarea nesupravegheată?

10 De ce trebuie normalizate semnalele de intrare și de ieșire ale unei rețele neuronale, adică redus la interval?

Referințe

1 Fogelman Soulie F. Rețele neuronale, stadiul tehnicii, calcul neuronal. -Londra: IBC Technical Services, 1991.

2 Gorban A. Neuroinformatica și aplicațiile sale // Sisteme deschise. -1998. -Nr 4 – 5. -S. 36 - 41.

3 Robert Hecht-Nielsen. Neurocomputing: istoric, status, perspective // ​​Open Systems. -1998. -Nr 4-5. -CU. 23 - 28.

4 Rosenblatt F. Principiile neurodinamicii. Perceptronii și teoria mecanismelor creierului. -M.: Mir, 1965.

5 Gordienko E.K., Lukyanitsa A.A. Rețele neuronale artificiale. I Definiții și modele de bază // Izv. RAS. Cibernetică tehnică. -1994. -Nu 5. -S. 79 - 92.

6 Korotky S.G. Rețele neuronale: algoritm de backpropagation. -BYTE/Rusia. -2000. -Nu 5. -S. 26-29.

7 Sveshnikov S.V., Shkvar A.M. Sisteme de prelucrare a informației neurotehnice. -Kiev: Naukova Dumka, 1983. -222 p.

8 Sisteme de control inteligente folosind rețele neuronale: manual. indemnizatie. / V.I. Vasiliev, B.G. Ilyasov, S.S. Valeev şi colab.; Ufimsk. stat aviaţie tehnologie. univ. Ufa, 1997. -92 p.

9 Kulikov G.G., Breikin T.V., Arkov V.Yu. Inteligent sisteme informatice: manual indemnizație / Ufimsk. stat aviaţie tehnologie. univ. -Ufa, 1999. -129 p.

10 Korotky S.G. Rețele neuronale: prevederi de bază // BYTE/Rusia. -2000. -Nu 5. -S. 18-21.

11 Sisteme inteligente de procesare a informațiilor bazate pe tehnologii de rețele neuronale: manual. indemnizatie. / Yu.I. Zozulya, Ufimsk. stat aviaţie tehnologie. univ. -Ufa. -2000. -138 p.

INTRODUCERE ÎN REȚELEA NEURALĂ MODERNĂ

Lucrare de laborator nr 1

PRODUS SOFTWARE STATISTICA REȚELE NEURALE (SNN) VERSIUNEA „SNN 7.0”

Scopul lucrării este familiarizați-vă cu produsul software Statistica

Rețele neuronale (SNN), construiți o rețea neuronală folosind vrăjitorul de soluții.

1. Deschideți fișierul de date Fan.stw(Tabelul A.1) folosind comanda FişierDeschide. Acest fișier conține date despre două tipuri de clase - 1 și 2, prezența și absența supraîncălzirii.

2. Selectați o echipă Rețele neuronaleîn meniu Analiză pentru a deschide rampa de lansare a rețelelor neuronale STATISTICA.

Orez. 4. Selectarea sculei

3. Pe fila Rapid rampa de lansare Rețele neuronale selectați un tip de activitate din listă (în în acest caz,Clasificare) și metoda de rezolvare (în acest caz - Maestru de soluții) și apăsați butonul Bine(Fig. 4). După aceasta, va fi afișat dialogul standard de selecție a variabilelor.

4. Selectați variabila dependentă (de ieșire) (în acest caz, variabila CLASS) (Fig. 5).

Orez. 5. Date de intrare

5. Pentru afișare Vrăjitorii de soluții apăsați butonul Bine pe rampa de lansare.

Pe fila Rapid(Fig. 6) deselectați opțiunea Selectați un subset de variabile independente, aici sunt definite doar două variabile independente, astfel încât ambele variabile vor fi folosite ca intrări pentru toate rețelele neuronale testate. Într-un grup Durata analizei există opţiuni care determină timpul în care Expert soluție va cheltui pentru găsirea unei rețele neuronale eficiente. Cu cât este mai lungă Expert soluție va funcționa, cu atât soluția găsită va fi mai eficientă. De exemplu, instalați 25 de rețele.

Pe baza rezultatelor analizei, rețelele neuronale pot fi salvate diverse tipuri cu indicatori diferiți de performanță și complexitate, astfel încât să puteți alege singur cea mai bună rețea.

6. Introduceți numărul 10 în care să salvați rețelele Expert soluție a salvat doar cele mai bune 10 opțiuni de rețea.

Tab Expert soluțieRapid va avea aspectul prezentat în Fig. 6.

Orez. 6. Setări pentru analiză

Apăsați butonul Bine, la Expert soluție a început să construiască

rețele neuronale. După aceasta, va fi afișat un dialog Antrenament în curs(Expert soluție). De fiecare dată când este descoperită o rețea neuronală îmbunătățită, un nou rând va fi adăugat la tabelul de informații. În plus, timpul de funcționare și procentul sarcinii finalizate sunt afișate în partea de jos a ferestrei. Dacă nu s-a produs nicio îmbunătățire pe o perioadă lungă de timp, apăsați butonul Gataîn dialog Antrenament în curs pentru a finaliza procesul de căutare în rețea. După finalizarea căutării, va fi afișat un dialog Rezultate, care conține informații despre rețelele găsite pentru analize ulterioare (Fig. 7).



Orez. 7. Rezultatele învăţării

7. Apăsați butonul Statistici descriptive. pe filă Rapidîn dialog Rezultate pentru a afișa două tabele rezumative: Clasificare și Matrice de erori.

Tabelul de clasificare (Fig. 8) arată informatii complete despre rezolvarea problemei corespunzătoare. În acest tabel, există mai multe coloane pentru fiecare clasă de ieșire prezisă de fiecare model. De exemplu, coloana etichetată CLASS.1.11 corespunde predicțiilor modelului 1 din clasa OVERHEAT pentru variabila CLASĂ. Prima linie oferă informații despre numărul de observații ale diferitelor tipuri de supraîncălzire din fișierul de date. A doua (a treia) linie afișează date (pentru fiecare clasă) privind numărul de observații clasificate corect (incorect). A patra linie enumeră observațiile „necunoscute”. Matricea de erori este utilizată de obicei în probleme cu mai multe

cursuri de conducere.

8. Pentru a afișa statisticile finale, trebuie să deschideți Analiză(buton Rezultateîn linie Analiză sau comanda Continuaîn meniu Analiză). Într-un grup Selecții pentru afișarea rezultatelor selectați opțiunea Toate(separat). Apoi apăsați butonul Statistica descriptivă. Tabelul final de clasificare este împărțit în patru părți. Titlurile coloanelor au prefixe diferite: O, K, TŞi ŞI, care corespund probelor de antrenament, control, test și, respectiv, ignorate. În mod implicit, observațiile sunt împărțite în trei subseturi într-un raport de 2:1:1. Astfel, au fost alocate 50 de observații de antrenament, 25 de observații de control și 25 de observații de testare. Rezultatele rețelei neuronale pe aceste seturi sunt aproape aceleași, adică calitatea rețelei neuronale poate fi considerată acceptabilă.

Orez. 8. Tabel de clasificare

9. Pentru a finaliza Analiză apăsați butonul Bineîn dialog Rezultate. Pe rampa de lansare când apăsați butonul Anula toate rețelele neuronale construite vor fi șterse. Este necesar să salvați rețelele neuronale pentru a antrena rapid rețelele neuronale în consecință, mai întâi găsiți o rețea cu cea mai bună performanță, iar apoi rețelele neuronale construite sunt salvate pentru utilizare ulterioară; Pentru a salva rețeaua neuronală, selectați fila Rețele/Ansambluriși apăsați butonul Salvați fișierul de rețea ca.... (fișierul are extensia .snn).

Misiuni

1. Construiți și antrenați o rețea neuronală folosind Vrăjitorii de soluții pentru a automatiza diagnosticarea vehiculelor, determinând necesitatea reviziei motorului pe baza următorilor parametri: compresia motorului, presiunea uleiului, consumul de benzină.

2. Introduceți datele inițiale în conformitate cu tabelul. 1, obțineți valori specifice ale variabilelor de la profesor.

3. Construiți o rețea neuronală în conformitate cu setările:

Tipul problemei: clasificare;

Instrument: Solution Wizard;

Numar de retele: 25;

5. Analizați construcția unei rețele neuronale și reflectați-o în raport.

6. Întocmește un raport asupra lucrărilor efectuate.

R este un mediu software gratuit pentru calcul statistic și grafică.
Este un proiect GNU, similar limbajului și mediului S, care a fost dezvoltat la Bell Laboratories (fost AT&T, acum Lucent Technologies) de John Chambers și colegii săi. R poate fi considerat o implementare diferită a lui S. Există câteva diferențe importante, dar majoritatea codului scris pentru S rulează neschimbat sub R

Sursă deschisă gratuită Mac Windows Linux BSD

  • RStudio

    RStudio™ este un mediu de dezvoltare integrat (IDE) pentru limbajul de programare R RStudio combină un sistem intuitiv interfata utilizatorși instrumente de codare puternice pentru a vă ajuta să profitați la maximum de R.

    Sursă deschisă gratuită Mac Windows Linux Xfce

  • PSPP

    PSPP este gratuit aplicație software pentru analiza datelor eșantionului. Are GUI utilizator și interfață normală linie de comandă. Este scris în C, folosește Biblioteca științifică GNU pentru rutinele sale matematice și plotutile pentru generarea de grafice. Este destinat să fie un înlocuitor gratuit pentru programul proprietar SPSS.

    Sursă deschisă gratuită Mac Windows Linux

  • IBM SPSS Statistics

    Platforma software IBM SPSS oferă analiză statistică avansată, o bibliotecă extinsă de algoritmi de învățare automată, text mining, extensibilitate open-source cod sursă, integrarea datelor mari și implementarea fără întreruperi a aplicațiilor.

    Plătit Mac Windows Linux

  • Statistici SOFA

    SOFA Statistics este un pachet de statistici open source care pune accent pe ușurința în utilizare, învățarea pe măsură ce mergeți și rezultatele excelente. Numele înseamnă „Statistici deschise tuturor”. Are o interfață grafică și se poate conecta direct la MySQL, SQLite, MS Access și MS SQL Server

    Sursă deschisă gratuită Mac Windows Linux

  • Ce este pe lista asta?

    Lista conține programe care pot fi folosite pentru a înlocui STATISTICA cu Platforme Windows. Această listă conține 6 aplicații similare cu STATISTICA.

    și arată cum este organizat dialogul cu utilizatorul sistemului.

    Acordați atenție interfeței ușor de utilizat și disponibilității instrumentelor , Şi Metoda de subeșantionare multiplă, permițând utilizatorilor să își proiecteze propriile rețele și să aleagă pe cele mai bune.

    Deci, în primul rând, să lansăm rețele neuronale.

    Pasul 1.Începeți cu rampa de lansare (uitați-vă la Figura 1).

    În acest panou, puteți selecta diferite tipuri de analiză pe care trebuie să le efectuați: regresie, clasificare, prognoză în serie de timp (cu variabilă dependentă continuă și categorială), analiză cluster.

    Orez. 1. Pad de lansare STATISTICA Rețele neuronale automatizate (SANN)

    Selectați de exemplu Serii temporale (regresie), dacă doriți să faceți o prognoză, sau Clasificare, dacă se rezolvă problema de clasificare.

    Prin apăsarea butonului Bine, să trecem la caseta de dialog de selecție a datelor.

    Orez. 2. Caseta de dialog Rețele neuronale - Selectare date - Filă rapidă

    Pasul 2. Pe fila Rapid ar trebui să selectați variabilele necesare pentru analiză. Variabilele pot fi continue sau categorice, dependente sau independente; în plus, observațiile pot aparține unor eșantioane diferite.


    Orez. 3. Fereastra de selecție a variabilelor

    Pentru utilizatorii începători, se recomandă alegerea unei strategii Un utilizator experimentat poate folosi cu ușurință orice strategie disponibilă: Rețea neuronală automată (ANN), Rețea neuronală personalizată (CNN)Şi Vom alege Rețea neuronală automată (ANN).

    Orez. 4. Caseta de dialog Rețele neuronale - Selectare date - Filă rapidă

    Pe fila Subprobele (PNS și ANS) ar trebui să setați împărțirea dorită a datelor în subeșantioane: antrenament, control și testare. Partiția poate fi setată aleatoriu sau poate fi fixată folosind o variabilă suplimentară de cod.

    În acest caz, vom folosi partiţionarea aleatorie.

    Orez. 5. Caseta de dialog Rețele neuronale - Selecția datelor - Fila Subprobleme (ANS și PNS)

    Tab Subprobele (PNS și ANS) conceput pentru primele două strategii: Rețea neuronală automată (ANN)Şi Rețea neuronală personalizată (CNN); în filă Crearea de subprobele utilizat pentru ultima strategie: Metoda de subeșantionare multiplă.

    Clic Bineși treceți la pasul de specificare a parametrilor arhitecturii.

    Pasul 3. Pe fila Rapid caseta de dialog Rețele neuronale automatizate trebuie să specificați tipul de rețea, numărul de neuroni ascunși, numărul de rețele antrenate și stocate și tipul de funcții de eroare utilizate.

    Programul oferă următoarele tipuri de rețele: perceptroni multistrat și rețele cu funcție de bază radială.

    Orez. 6. Caseta de dialog Rețele neuronale automate - filă Quick

    Orez. 7. Caseta de dialog Rețele neuronale automate - Funcții de activare pentru fila MLP

    Pe fila Atenuare Puteți activa opțiunea de regularizare a greutății, care va ajusta complexitatea rețelelor antrenate. Acest lucru este util atunci când problema are un număr mare de variabile de intrare și, de asemenea, un număr mare de neuroni în stratul ascuns.

    Dar în cazul nostru nu vom folosi acest lucru.

    Orez. 8. Caseta de dialog Rețele neuronale automate - fila Atenuare

    Acum putem trece la pasul de antrenament al rețelei neuronale.

    Pasul 4.Începeți procedura de formare a rețelei neuronale făcând clic pe butonul Bine.

    În caseta de dialog prezentată în Fig. 9, sunt afișate câteva informații despre rețeaua neuronală pregătită în prezent. Putem analiza arhitectura rețelei, monitoriza progresul iterațiilor algoritmului și înregistra erorile de model. Pentru regresie se folosește eroarea pătratică medie, pentru clasificare se folosește procentul de clasificare corectă a observațiilor (ca și în cazul nostru).

    Orez. 9. Caseta de dialog Antrenarea unei rețele neuronale

    Programul trece automat la pasul următor.

    Pasul 5. Analiza rezultatelor. În fereastra de rezultate puteți analiza soluțiile obținute. Programul va selecta cele mai bune rețeleși va arăta calitatea soluției.

    Orez. 10. Caseta de dialog Rețele neuronale - Rezultate - fila Predicte

    Puteți selecta o anumită rețea, cea mai bună în opinia noastră, folosind butonul Selectați/Debifați rețelele.

    Orez. 11. Caseta de dialog Activare model

    De exemplu, o modalitate de a verifica este de a compara valorile observate și rezultatele prezise. Comparația valorilor observate și prezise pentru o rețea selectată, de exemplu, seturi de antrenament și de testare.

    Orez. 12. Tabelul valorilor observate și prezise

    Sau uitați-vă la matricea erorilor de clasificare de pe proba de testare:

    Orez. 13. Matricea de clasificare

    Pasul 6. Salvați cele mai bune rețele pentru utilizare ulterioară, de exemplu, pentru prognoza automată.

    Pentru lansare ulterioară, rețelele sunt salvate în format PMML.

    Orez. 14. Caseta de dialog Rețele neuronale - Rezultate - Salvarea rețelelor

    Orez. 15. Fereastra standard de salvare a fișierelor de rețea

    Pasul 7 Rulați modele salvate pe date noi. Deci încărcăm date noi, dar astfel încât variabilele să se potrivească cu variabilele din modele.

    Pentru a rula modelul pe date noi, puteți selecta opțiunea din panoul de lansare (Fig. 1) Încărcați modele din analizele anterioareși apăsați butonul Încărcați rețele.

    Orez. 16. Fereastra standard de selecție a fișierelor de rețea

    Primim:

    Orez. 17. rampa de lansare STATISTICA Automated Neural Networks (SANN).

    După selecție fișierul necesar, toate setările sunt determinate automat, astfel încât să puteți accesa imediat fereastra de rezultate (apăsând butonul de două ori Bine) și analizați rezultatele obținute.

    Acesta este exact scenariul de cercetare tipic din pachet

    Aceste cărți pot fi achiziționate de la biroul StatSoft.

    Introducere populară în analiza modernă a datelor și învățarea automată pe Statistica

    V.P. Borovikov

    Volum: 354 pagini.

    Pret: 1000 ruble.

    Capacitățile moderne de analiză a datelor și învățarea automată, care este o tendință în analiza computerizată modernă, sunt acoperite într-un mod popular și fascinant. Prezentarea pune accent pe înțelegerea metodelor și aplicarea lor la probleme practice. „Urmăriți-ne și veți învăța să analizați datele!” - principalul laitmotiv al cărții.

    Metodele statistice clasice sunt descrise în detaliu, inclusiv metode multivariate: analiza cluster, analiza discriminantă, regresia multiplă, analiza factorială, analiza componentelor principale, analiza supraviețuirii și regresia Cox. Capitolele separate acoperă metode de rețele neuronale, metode de extragere a datelor, arbori de clasificare și regresie (modele CART). Sunt luate în considerare exemple din diverse domenii ale activității umane: industrie, retail, infocomunicații, afaceri, medicină. Capitole speciale sunt dedicate teoriei probabilităților și metodelor de optimizare care stau la baza metodelor de învățare automată.

    Pentru o gamă largă de cititori: ingineri, tehnologi, manageri, analiști, medici, cercetători interesați de metodele și tehnologiile analitice moderne pentru analiza datelor și învățarea automată și aplicarea lor în practică.

    O introducere populară în sistemele moderne de analiză a datelor STATISTICA

    V.P. Borovikov

    Volum: 288 pagini.

    Cartea unică a directorului științific al StatSoft, Vladimir Borovikov, conține tot ce este mai bun cunoscut în domeniul analizei datelor.

    Folosind exemple simple și clare din afaceri, marketing și medicină, sunt descrise metode moderne de analiză a datelor - analiza vizuală și prezentarea grafică a datelor, statistici descriptive, metode de clasificare și prognoză.

    Cartea este un standard educațional în domeniul analizei datelor în universitățile de top din Rusia: MIEM HSE, Universitatea de Stat din Moscova, Universitatea de Stat Kuban etc.

    Se acordă multă atenție sistematicii analizei datelor, variind de la analiza descriptivă, curățarea și verificarea datelor, prezentarea vizuală, metodele de grupare și clasificare la cele mai noi tehnologii rețele neuronale și extragerea datelor pentru a găsi modele în datele dvs.

    Teoria probabilității, statistică matematică și analiza datelor: Fundamente ale teoriei și practicii pe un computer. STATISTICA. EXCELA. Peste 150 de exemple de rezolvare a problemelor

    Khalafyan A.A., Borovikov V.P., Kalaidina G.V.

    Volum: 320 pagini.

    Preț: 600 ruble.

    Puteți trimite cererea dvs. la:

    Nivelul actual de dezvoltare a tehnologiei informatice permite ca studiul teoriei probabilităților și al statisticii matematice să fie adus la un nou nivel educațional, concentrându-se pe partea aplicată a disciplinei - statistica matematică și analiza datelor computerizate.

    Manualul conturează elementele combinatoriei, diverse moduri sunt date calculele probabilităților, conceptele unei variabile aleatoare, caracteristicile sale funcționale și numerice. Materialul teoretic este însoțit de exemple și sarcini special selectate care vă permit să studiați materialul în profunzime. Un capitol separat descrie folosind ExcelŞi STATISTICA pentru rezolvarea problemelor aplicate. Excel este inclus Microsoft Office iar astăzi este una dintre cele mai populare aplicații din lume. STATISTICA ocupă o poziție de lider în rândul programelor de analiză a datelor, are peste un milion de utilizatori în întreaga lume. Programul este complet rusificat, a fost creat un portal de cunoștințe intelectuale, care reprezintă o resursă multimedia globală pentru o gamă largă de utilizatori: școlari, studenți, absolvenți - toți cei care doresc să-și dezvolte intelectul, să se familiarizeze cu tehnologii moderne analiza computerizată date.

    Manualul se adresează unei game largi de studenți și profesori, studenți, licențiați în științe umaniste și științe ale naturii din domenii non-matematice, care studiază matematica superioară.

    Rețele neuronale STATISTICA Rețele neuronale: Metodologia și tehnologia analizei moderne a datelor

    Ed. V.P. Borovikova

    Volum: 392 pagini.

    Puteți trimite cererea dvs. la:

    Cartea prezintă metodele rețelei neuronale de analiză a datelor bazate pe utilizarea pachetului STATISTICA Rețele neuronale, complet adaptat pentru utilizatorul rus.

    Sunt date bazele teoriei rețelelor neuronale; Se acordă multă atenție rezolvării problemelor practice, metodologia și tehnologia efectuării cercetării folosind pachetul sunt luate în considerare în mod cuprinzător STATISTICA Rețele neuronaleinstrument puternic analiza datelor, construirea dependenței, prognoză, clasificare.

    În prezent, rețelele neuronale sunt utilizate intens în domeniul bancar, industrie, marketing, economie, medicină și alte domenii în care sunt necesare prognoze și înțelegere aprofundată a datelor. Este în general acceptat că rețelele neuronale sunt o completare naturală a metodelor clasice de analiză și sunt folosite acolo unde proceduri standard nu dau efectul dorit.

    Cartea conține multe exemple de analiză a datelor, recomandari practice pentru analiză, prognoză, clasificare, recunoaștere a modelelor, managementul procesului de producție folosind rețele neuronale.

    Cartea va fi utilă pentru o gamă largă de cititori implicați în cercetare în domeniul bancar, industrie, afaceri, explorare geologică, management, transport și alte domenii.

    STATISTICA: Arta analizei datelor pe computer (ediția a doua)

    + Manual Multimedia StatSoft

    V. P. Borovikov

    Volum: 700 pagini.

    Cartea este momentan epuizată. O nouă ediție a cărții este planificată în viitorul apropiat. Vă rugăm să trimiteți aplicațiile la:

    Cartea este cel mai fundamental text despre analiza modernă a datelor și include aproximativ 700 de pagini cu descrieri ale metodelor și procedurilor de analiză a datelor. A doua ediție a cărții este completată cu materiale noi care nu sunt incluse în versiunea anterioară cărți, în special: descrie analiza puterii, estimarea dimensiunii eșantionului, corelații parțiale, analiza componentelor principale, oferă o nouă interpretare a rețelelor neuronale și multe altele. Cartea vine cu un CD pe care veți găsi versiuni demo. produse software StatSoft, exemple de analiză a datelor, celebrul manual electronic StatSoft, un manual de statistică industrială, materiale de curs de formare, precum și o cantitate imensă de date pentru formare și cercetare independentă.

    Principala caracteristică a celei de-a doua ediții este noul capitol despre limbaj STATISTICA Visual Basic (SVB), care extinde capacitățile sistemului STATISTICAși permițând utilizatorilor să-și creeze propriile aplicații.

    Folosind date reale ca exemplu, cartea descrie în detaliu conceptele de bază ale analizei datelor în sistem. STATISTICA: analiză descriptivă și vizuală, analiza tabelului de contingență, construirea de relații, regresie multiplă, analiză de supraviețuire, metode neparametrice, analiza corespondenței, rețele neuronale, clasificare și predicție folosind rețele neuronale, controlul calității, planificare experimentală, inclusiv o mare varietate de modele și multe altele .

    Particularitatea cărții este că nu numai că vedeți rezultatele analizei, dar le puteți și repeta după noi pe sistem. STATISTICA Astfel, folosind cele mai noi tehnologii informatice de analiză a datelor de la StatSoft, înveți pas cu pas să analizezi și să înțelegi datele.

    Această publicație fundamentală este destinată celei mai largi game de cititori și utilizatori ai sistemului. STATISTICA care doresc să devină profesioniști în analiza datelor în diverse domenii: afaceri, marketing, finanțe, management, economie, industrie, asigurări, medicină și alte aplicații.

    Prognoza în sistem STATISTICAîn mediul WINDOWS

    V.P. Borovikov, G.I. Ivcenko

    Volum: 368 pagini.

    Cartea este momentan epuizată.

    Secretele previziunii directe.

    Particularitatea cărții este combinarea a două părți interdependente și complementare: practică, în care în detaliu, cu traducerea principalelor opțiuni și casete de dialog, este descrisă prognoza în versiunea modernă a sistemului STATISTICA, și teoretic, care prezintă principalele idei, metode și rezultate ale teoriei previziunii stocastice.

    Potrivit autorilor, sinteza teoriei și practicii ar trebui să conducă la faptul că cititorul nu numai că stăpânește mecanic metodele și tehnicile de prognoză, dar primește și o înțelegere conexă a acestora: de la familiarizarea cu fundamentele matematice până la dobândirea de practici practice. abilități în sistem STATISTICA.

    Cartea se bazează pe un curs susținut de autori la Institutul de Stat de Electronică și Matematică din Moscova (MGIEM - Universitatea Tehnică). Aplicația conține un dicționar cuprinzător englez-rus de termeni de bază de prognoză.
    Cartea se adresează oamenilor de știință, analiștilor și specialiștilor care folosesc metode de prognoză în activitățile de zi cu zi și poate fi folosită și de profesorii instituțiilor de învățământ superior atunci când predau cursuri de prognoză și statistică matematică.

    Geostatistica. Teorie și practică

    V.V. Demyanov, E.A. Saveleva

    Volum: 327 pagini.

    Cartea este momentan epuizată.


    Această carte va răspunde la întrebările:
    - ce este geostatistica?
    - ce metode de interpolare spatiala exista?
    - ce este kriging-ul?
    - Cum este utilă o variogramă?
    - de ce avem nevoie de modelare stocastică?
    si multi altii

    Monografia descrie în detaliu metodele de geostatistică și domeniile conexe ale modelării spațiale. Prezentarea teoriei este însoțită de exemple de utilizare a modelelor în diverse domenii: ecologie, geologie, hidrogeologie, producție de petrol, energie, evaluarea pescuitului etc. Secțiunea finală prezintă principalele direcții de dezvoltare ale teoriei geostatistice moderne. Publicația poate fi folosită ca suport didactic.

    Materialul din carte este prezentat cu o complicație treptată. Există întrebări și exerciții pentru consolidarea cunoștințelor acumulate. Cartea include anexe care îi permit să fie folosit ca o carte de referință în geostatistică.


    StatSoft Data Analysis Academy oferă, de asemenea, o gamă largă de cursuri despre metode și tehnologii moderne de analiză a datelor în domeniul geoanaliticii.

    Statistica industriala. Controlul calitatii, analiza procesului, planificarea experimentelor in pachet STATISTICA

    Khalafyan A.A.

    Volum: 384 pagini.

    Cartea este momentan epuizată.


    Această publicație este dedicată descrierii metodelor statistice care permit, cu volume limitate de produse analizate, să se judece starea calității produselor fabricate cu un anumit grad de acuratețe și fiabilitate. Analiza statistică a calității produsului asigură că este corect decizii de management nu pe baza intuiției, ci cu ajutorul metodelor științifice de identificare a tiparelor în rețele acumulate de informații numerice.

    Manualul acoperă astfel de secțiuni de statistică industrială precum: carduri de control al calității; analiza procesului; six sigma; planificarea experimentelor într-un pachet de renume mondial STATISTICA. Dat descriere detaliată tehnologii pentru lucrul cu module de program.

    Publicația se adresează studenților din domeniile „Economie”, „Managementul calității”, „Standardizare și Metrologie”, „Metrologie, Standardizare și Certificare”, absolvenți, cercetători, cadre didactice universitare, analiști și manageri, precum și oricărei persoane interesate. în metode statistice în managementul calităţii .

    Cum să câștigi campionatul mondial. Metode de statistică matematică în managementul fotbalului național

    Petrunin Yu.Yu., Ryazanov M.A.

    Volum: 56 pagini.

    Cartea este momentan epuizată.


    Metodele moderne de statistică și analiză a datelor au condus la crearea de noi discipline științifice - fotbalonomics și fotbalometrie. Folosind aparatul dezvoltat în ele, este posibil să se evalueze calitatea muncii de stat (Ministerul Sportului) și organizațiilor non-profit (asociații și sindicate de fotbal), să dezvolte și să aplice metode de influență de reglementare care pot ridica nivelul fotbalului național. și prestigiul său pe scena mondială.

    STATISTICA– Ghid de pornire rapidă

    Volum: 250 pagini.

    Cartea este momentan epuizată.

    Cartea prezintă principiile de bază ale lucrului cu sistemul, discută barele de instrumente, interfața cu utilizatorul, fișierele de date și exemple practice de utilizare a pachetului. Un capitol separat este dedicat configurarii sistemului. Cartea conține, de asemenea, o carte de referință cuprinzătoare, care oferă informații scurte despre convențiile, funcțiile și capacitățile cele mai frecvent utilizate ale sistemului. STATISTICA, și un index de subiecte.

    © 2024 ermake.ru -- Despre repararea PC-ului - Portal de informații