Lecția de informatică vizualizarea informațiilor în documente text. Vizualizarea informațiilor în documente text planul lecției de informatică și TIC (clasa a VII-a) pe tema

Acasă / Instalarea dispozitivului

REPETARE Nr. 1. Stabiliți cărei grupe de operații (editare sau formatare) aparțin următoarele acțiuni: formatare Înlocuirea unui caracter cu altul; Introduceți cuvântul lipsă; Schimbarea fontului; Ștergerea unei porțiuni de text; Aliniați textul la lățime; Verificare ortografică automată; Schimbarea spațierii liniilor; Modificarea dimensiunilor marginilor paginii; Eliminarea unui caracter eronat; Căutați și înlocuiți; Mutarea fragmentelor de text.

REPETARE Nr. 2. Stabiliți cărui grup (proprietăți ale caracterelor sau Nr. 2 proprietăți ale paragrafelor) aparțin următoarele proprietăți: paragrafe Font Aliniere Spațiere după prima linie Stil Culoare Spațiere între linii Inclinare stânga Înainte de indentare Dimensiunea fontului (punct) Indentare dreapta

REVIZIA #3: Care dintre următoarele propoziții #3 au spații între cuvinte și semne de punctuație corect? Unde au fost făcute greșelile? 1) 2) 3) 4) Din țara ta natală - mori, nu pleca. A conduce un discurs nu înseamnă a țese pantofi de bast. Acolo unde s-a născut, s-a potrivit. A vorbi este amuzant, a ascunde este păcătos.

REPEAT Nr. 4. Selectați opțiunile de setat atunci când setați pagina Setup Nr. 4: Stil orientare Dimensiune font Dimensiune hârtie Numere pagini Margini Spațiere între linii Indentări Stil aliniere paragraf

Vizualizare – prezentarea informațiilor într-o formă vizuală. Informațiile text sunt prezentate sub formă de liste, tabele, diagrame și sunt prevăzute cu ilustrații (fotografii, diagrame, desene). Vizualizarea informațiilor Listă Tabel Diagramă Ilustrație Lista subiectelor clasa a VIII-a 1. Algebră 2. Limba engleză Clasa 3. Biologie 4. Student. Geografie Matematică Informatică 5. Geometrie 6. Informatică și TIC Ivanov 7. Istorie 5 Sasha 4 8. Literatură 9. Siguranța vieții Orlova Katya 4 5 10. Științe sociale 11. Rus Petrov 12. Fizică Vitya 5 5 13. Chimie 14. Desen diagrama culorilor

LISTE Toate tipurile de liste din documente sunt întocmite cu ajutorul listelor. Elementele din listă sunt considerate paragrafe formatate conform unui singur model. Structura listei cu marcatori 1. 2. 3. 4. 5. 6. Limba rusa Algebra Siguranta vietii Studii sociale Biologie Tehnologie Programul lectiei - exemplu de lista numerotata Limba rusa numerotata Literatura Algebra Geometrie Fizica Lista disciplinelor studiate in clasa a 7-a - exemplu de a lista cu marcatori

Structura face distincția între listele cu un singur nivel și listele cu mai multe niveluri. O listă al cărei element este el însuși o listă se numește pe mai multe niveluri Exemplu: Capitolul 1. Procesele informaționale și informaționale § 1. 1. Informația și proprietățile ei 1. 1. 1. Informație și semnal 1. 1. 2. Tipuri de informații 1 1. 3 Proprietățile informațiilor § 1. 2. Procesele informaționale 1. 2. 1. Conceptul de proces informațional 1. 2. 2. Colectarea informațiilor

INSTRUMENTE DE CREARE A LISTEI Puteți crea rapid liste cu marcaje și numerotare folosind butoanele din bara de instrumente:

SCHIMBAREA LISTELOR DE MARCĂTORI: Pentru a schimba tipul de marcatori, puteți folosi butonul Modificare. Apare fereastra Editați lista marcatori, care conține note suplimentare. Când faceți clic pe butonul Marker, apare caseta de dialog Simbol, în care puteți selecta oricare dintre simboluri ca marcator de listă.

SCHIMBAREA LISTELOR NUMERATE: Pentru a vă crea propria listă numerotată, faceți clic pe butonul Editare. Apare fereastra Editare listă numerotată. Câmpul Format număr specifică textul înainte și după numărul articolului din listă, de exemplu). În câmpul Numerotare - stil de numerotare. Câmpul Începe cu... specifică numărul (sau litera) cu care ar trebui să înceapă lista. Pentru a schimba fontul numerelor articolelor din listă, utilizați butonul Font.

SĂ PREZENTĂM LISTA DISPOZITIVELOR COMPUTERICE SUB FORMA LISTEI MULTI NIVELURI CU PATRU NIVELURI DE IMPRIMARE. Dispozitive calculator modern Procesor Memorie RAM Memoria pe termen lung Unitate HDD Dischetă Memorie flash Discuri optice Dispozitive de intrare CD DVD Tastatură Mouse Scanner Tableta grafica Cameră digitală Microfon Joystick Dispozitive de ieșire Monitor LCD Monitor CRT Imprimantă Imprimantă matriceală Imprimantă cu jet de cerneală Imprimanta laser

Să dăm la prima linie un stil de formatare, de exemplu, Titlul 1. Dispozitive ale unui computer modern Procesor Memoria RAM Memoria pe termen lung Disc magnetic dur Dischetă Memorie flash Discuri optice CD DVD Dispozitive de intrare Tastatură Mouse Scanner Tabletă grafică

Să transformăm liniile rămase într-o listă § § cu mai multe niveluri. Pentru a face acest lucru, trebuie să: selectați toate liniile rămase; lansați comanda Format-List. În caseta de dialog Listă, accesați fila Multi-level și selectați o listă de tipul de acolo:

Lista va lua următoarea formă: Dispozitive ale unui computer modern 1. Procesor 2. Memorie 3. RAM 4. Memoria pe termen lung 5. Hard disc magnetic 6. Floppy disk 7. Memorie flash 8. Discuri optice 9. CD 10. DVD 11. Dispozitive de intrare 12 Tastatură 13. Mouse 14. Scanner 15. Tabletă grafică 16. Cameră digitală 17. Microfon 18. Joystick 19. Dispozitive de ieșire 20. Monitor 21. Monitor LCD 22. Monitor CRT 23. Imprimantă 24. Imprimantă matricială 25. Imprimanta cu jet de cerneala 26. Imprimanta laser

Să evidențiem punctele 3 – 10 și să le coborâm nivelul. Pentru a face acest lucru, utilizați butonul Mărește indentarea Dispozitivele unui computer modern 1. Procesor 2. Memorie 3. RAM 4. Memoria pe termen lung 5. Disc magnetic dur 6. Dischetă 7. Memorie flash 8. Discuri optice 9. CD 10 . DVD 11. Dispozitive de intrare 12. Tastatură 13. Mouse 14. Scanner 15. Tabletă grafică 16. Cameră digitală 17. Microfon 18. Joystick

Lista va lua următoarea formă: Dispozitive ale unui computer modern 1. Procesor 2. Memorie 2. 1. RAM 2. 2. Memoria de lungă durată 2. 3. Hard disc magnetic 2. 4. Floppy disk 2. 5. Flash memorie 2. 6. Discuri optice 2. 7. CD 2. 8. DVD 3. Dispozitive de intrare 4. Tastatură 5. Mouse 6. Scanner 7. Tabletă grafică 8. Cameră digitală 9. Microfon 10. Joystick

Să evidențiem punctele 2.3 – 2.8 și să le coborâm nivelul. Pentru a face acest lucru, utilizați butonul Mărește indentarea Dispozitivele unui computer modern 1. Procesor 2. Memorie 2. 1. RAM 2. 2. Memoria pe termen lung 2. 3. Hard disc magnetic 2. 4. Dischetă 2. 5. Memorie flash 2. 6. Discuri optice 2. 7. CD 2. 8. DVD 3. Dispozitive de intrare 4. Tastatură 5. Mouse 6. Scanner 7. Tabletă grafică 8. Cameră digitală 9. Microfon 10. Joystick

Lista va lua următoarea formă: Dispozitive ale unui computer modern 1. Procesor 2. Memorie 2. 1. RAM 2. 2. Memoria pe termen lung 2. 2. 1. Hard disc magnetic 2. 2. 2. Dischetă 2 2. 3. Memorie flash 2. 2. 4. Discuri optice 2. 2. 5. CD 2. 2. 6. DVD 3. Dispozitive de intrare 4. Tastatură 5. Mouse 6. Scanner 7. Tabletă grafică 8. Cameră digitală 9. Microfon 10. Joystick

Selectați punctele 2. 2. 5 – 2. 2. 6 și coborâți-le nivelul. Dispozitivele unui computer modern 1. Procesor 2. Memorie 2. 1. RAM 2. 2. Memoria pe termen lung 2. 2. 1. Hard disc magnetic 2. 2. 2. Floppy disk 2. 2. 3. Memorie flash 2 2. 4. Discuri optice 2. 2. 4. 1. CD 2. 2. 4. 2. DVD 3. Dispozitive de intrare 4. Tastatură 5. Mouse 6. Scanner 7. Tabletă grafică 8. Cameră digitală 9. Microfon 10 . Joystick

Să repetăm operațiuni similare pentru alte elemente din listă: 3. Dispozitive de intrare 3. 1. Tastatură 3. 2. Mouse 3. 3. Scanner 3. 4. Tabletă grafică 3. 5. Cameră digitală 3. 6. Microfon 3. 7 . Joystick 4 . Dispozitive de ieșire 4. 1. Monitor 4. 1. 1. Monitor LCD 4. 1. 2. Monitor CRT 4. 2. Imprimantă 4. 2. 1. Imprimantă cu jet de cerneală 4. 2. 3. Imprimanta laser

Lucrare practică pe tema „Vizualizarea informațiilor în documente text».

Textul dat:

Cei mai faimoși astronauți.

Au trecut 55 de ani de când primul om a intrat în spațiu. De atunci, peste 500 de persoane au vizitat acolo, peste 50 dintre ele fiind femei. Reprezentanții a 36 de țări au vizitat planeta noastră pe orbită.

Yuri Gagarin (1934-1968). Pe 12 aprilie 1961, nava spațială Vostok-1 s-a lansat de la Baikonur cu primul cosmonaut din istorie la bord. Pe orbită, Gagarin a făcut experimente simple - a mâncat, a băut, a luat notițe. Astronautul a efectuat 1 revoluție în jurul Pământului, care a durat 108 minute. Ziua zborului istoric a început să fie sărbătorită ca Ziua Cosmonauticii. 12 aprilie 1961 a schimbat pentru totdeauna viața omenirii și a lui Gagarin însuși. A devenit un simbol viu.

Valentina Tereshkova (născută în 1937). Primele zboruri de succes ale cosmonauților sovietici au dat naștere ideii designerului șef Serghei Korolev de a lansa o femeie în spațiu. Din 1962, solicitanții au fost selectați în toată țara. Dintre cei cinci candidați pregătiți, a fost aleasă Tereshkova, tot din cauza experienței profesionale. Femeia cosmonaută și-a făcut primul zbor pe 16 iunie 1963 cu nava spațială Vostok-6. Şederea în spaţiu a durat trei zile.

Alexey Leonov (născut în 1934). El este numărul 11 pe lista cosmonauților sovietici. Faima lui Leonov i-a fost adusă de zborul său în spațiu ca copilot pe nava spațială Voskhod-2 în perioada 18-19 martie 1961. Astronautul a efectuat prima plimbare spațială din istorie, care a durat 12 minute și 9 secunde. În acele momente istorice, Leonov a dat dovadă de un calm excepțional - la urma urmei, costumul său spațial era umflat, ceea ce a făcut dificilă plecarea în spațiu. Nava a aterizat în taiga îndepărtată, iar cosmonauții au petrecut două zile în frig.

Neil Armstrong (născut în 1930). Pe 20 iulie, Neil Armstrong și pilotul Edwin Aldrin și-au aterizat modulul lunar în zona Sea of Tranquility. Şederea pe suprafaţa Lunii a durat 21,5 ore. De asemenea, astronauții au făcut o plimbare pe suprafața lunară, care a durat 2,5 ore. Prima persoană care a pus piciorul acolo a fost Neil Armstrong. Stând la suprafață, astronautul a rostit fraza istorică: „Acesta este doar un pas mic pentru o persoană, dar un salt uriaș pentru întreaga omenire”.

Serghei Krikalev (născut în 1958). Doi oameni, Jerry Ross și Franklin Chang-Diaz, au fost în spațiu de 7 ori. Dar recordul pentru timpul petrecut pe orbită aparține cosmonauților sovietici și ruși. S-a lansat pe cer de 6 ori, petrecând un total de 803 zile în spațiu. Astronautul a făcut ultimul său zbor în 2005, după ce a locuit pe ISS timp de șase luni.

Valery Polyakov (născut în 1942). Profesia lui Polyakov este medic, a devenit doctor în științe medicale și profesor. În istoria URSS și a Rusiei, Polyakov a devenit cosmonautul nr. 66. El deține recordul pentru cea mai lungă ședere în spațiu. Polyakov a petrecut 437 de zile și 18 ore pe orbita Pământului în perioada 1994-1995. Iar astronautul a făcut primul său zbor înapoi în 1988, fiind deasupra Pământului din 29 august 1988 până în 27 aprilie 1989. Acel zbor a durat 240 de zile, pentru care Valery Polyakov a primit titlul de Erou al Uniunii Sovietice. În total, Polyakov a petrecut 678 de zile în spațiu.

Conform textului, compune:

O listă numerotată a persoanelor care au fost în spațiu, în funcție de data zborului lor (de la cea mai veche);

Ilustrați textul cu imagini (Desktop - folder Space);

Pe baza textului, creați un tabel ca:

4) Din folderul „Evaluare”, selectați o imagine și evaluați-vă munca practică inserând imaginea sub lucrarea finalizată.

În sectorul de limbă rusă al internetului există foarte puține exemple practice educaționale (și chiar mai puține cu exemplu de cod) de analiză a mesajelor text în limba rusă. Prin urmare, am decis să adun datele împreună și să privesc un exemplu de grupare, deoarece nu este nevoie să pregătesc datele pentru instruire.

Majoritatea bibliotecilor folosite sunt deja incluse în distribuția Anaconda 3, așa că vă sfătuiesc să o utilizați. Modulele/bibliotecile lipsă pot fi instalate ca standard prin pip install „nume pachet”.
Includem următoarele biblioteci:

Import numpy ca np import panda ca pd import nltk import re import os import codec-uri din sklearn import feature_extraction import mpld3 import matplotlib.pyplot ca plt import matplotlib ca mpl
Puteți lua orice date pentru analiză. Apoi mi-a atras atenția această sarcină: Statistica interogărilor de căutare pentru proiectul cheltuielilor guvernamentale. Au trebuit să împartă datele în trei grupuri: organizații private, guvernamentale și comerciale. Nu am vrut să vin cu nimic extraordinar, așa că am decis să verific cum va funcționa gruparea în acest caz,(privind înainte - nu chiar). Dar puteți descărca date din VK ale unora dintre publicul:

Import vk #pass the session id session = vk.Session(access_token="") # URL pentru a primi access_token, în loc de tvoi_id introduceți id-ul aplicației VK create: # https://oauth.vk.com/authorize?client_id =tvoi_id&scope=prieteni, pagini, grupuri, offline&redirect_uri=https://oauth.vk.com/blank.html&display=page&v=5.21&response_type=token api = vk.API(session) poss= id_pab=-59229916 #ID-urile publice încep cu un minus, ID de perete utilizator fără minus info=api.wall.get(owner_id=id_pab, offset=0, count=1) kolvo = (info//100)+1 shag=100 sdvig=0 h=0 import time while h 70): print(h) #nu condiție prealabilă, doar pentru a controla sfârșitul aproximativ al procesului pubpost=api.wall.get(owner_id=id_pab, offset=sdvig, count=100) i=1 în timp ce i< len(pubpost): b=pubpost[i]["text"] poss.append(b) i=i+1 h=h+1 sdvig=sdvig+shag time.sleep(1) len(poss) import io with io.open("public.txt", "w", encoding="utf-8", errors="ignore") as file: for line in poss: file.write("%s\n" % line) file.close() titles = open("public.txt", encoding="utf-8", errors="ignore").read().split("\n") print(str(len(titles)) + " постов считано") import re posti= #удалим все знаки препинания и цифры for line in titles: chis = re.sub(r"(\<(/?[^>]+)>)", " ", linie) #chis = re.sub() chis = re.sub("[^а-яА-Я ]", "", chis) posti.append(chis)
Voi folosi datele interogării de căutare pentru a arăta cât de scurte sunt grupele de date text. Am șters textul de caractere speciale și semne de punctuație în avans, plus abrevierile înlocuite (de exemplu, antreprenor individual - antreprenor individual). Rezultatul a fost un text în care fiecare rând conținea o interogare de căutare.

Citim datele într-o matrice și trecem la normalizare - aducând cuvântul la forma sa originală. Acest lucru se poate face în mai multe moduri folosind Porter Stemmer, MyStem Stemmer și PyMorphy2. Aș dori să vă avertizez - MyStem funcționează printr-un wrapper, deci viteza operațiunilor este foarte lentă. Să ne concentrăm pe stemmer-ul lui Porter, deși nimeni nu te împiedică să-i folosești pe alții și să le combini unul cu celălalt (de exemplu, treci prin PyMorphy2 și apoi pe stemmer-ul lui Porter).

Titluri = open("material4.csv", "r", encoding="utf-8", errors="ignore").read().split("\n") print(str(len(titluri)) + „cereri citite”) din nltk.stem.snowball import SnowballStemmer stemmer = SnowballStemmer(„rusă”) def token_and_stem(text): tokens = filtered_tokens = pentru token în tokens: if re.search(„[a-zA-Z]” , token): filtered_tokens.append(token) stems = returnează stems def token_only(text): tokens = filtered_tokens = pentru token în tokens: if re.search("[A-Z]", token): filtered_tokens.append (TOKEN) RETURN FILThed_TOKENS #Creați dicționare (matrice) din bazele lui Totalvocab_STEM = TOTALVOCAB_TOKEN = Pentru I în Titluri: Allwords_SteMed = TOKEN_AND_STEM (I) #PRINT (Allwords_STAMM Ed) Totalvocab_Stem.Extend (Allwords_tokens)Token_token_S_Token .exten allwords_tokenized)

Pimorfia 2

import pymorphy2 morph = pymorphy2.MorphAnalyzer() G= pentru i în titluri: h=i.split(" ") #print(h) s="" pentru k în h: #print(k) p = morph.parse( k).forma_normală #print(p) s+=" " s += p #print(e) #G.append(p) #print(e) G.append(s) pymof = open("pymof_pod.txt", "w", encoding="utf-8", errors="ignore") pymofcsv = open("pymofcsv_pod.csv", "w", encoding="utf-8", errors="ignore") pentru elementul din G : pymof.write("%s\n" % articol) pymofcsv.write("%s\n" % articol) pymof.close() pymofcsv.close()

pymystem3

Fișiere executabile ale analizorului pentru curent sistem de operare va fi descărcat și instalat automat la prima utilizare a bibliotecii.

Din importul pymystem3 Mystem m = Mystem() A = pentru i în titluri: #print(i) lemmes = m.lemmatize(i) A.append(lemmes) #Această matrice poate fi salvată într-un fișier sau import cu „backup” pickle with open ("mystem.pkl", "wb") ca mâner: pickle.dump(A, handle)

Să creăm o matrice de greutate TF-IDF. Vom considera fiecare interogare de căutare ca un document (acest lucru se face atunci când se analizează postările pe Twitter, unde fiecare tweet este un document). Vom lua tfidf_vectorizer din pachetul sklearn și vom lua cuvintele stop din corpus ntlk (inițial va trebui să-l descărcam prin nltk.download()). Parametrii pot fi ajustați după cum credeți de cuviință - de la limitele superioare și inferioare până la numărul de n-grame (în acest caz, să luăm 3).

Stopwords = nltk.corpus.stopwords.words(„rusă”) #puți extinde lista de cuvinte stopwords.extend([„ce”, „acest”, „deci”, „aici”, „a fi”, „cum” ", "in", "k", "on"]) din sklearn.feature_extraction.text import TfidfVectorizer, CountVectorizer n_featur=200000 tfidf_vectorizer = TfidfVectorizer(max_df=0.8, max_features=10000, min_df=stopword, min_df=0word=0. Adevărat, tokenizer=token_and_stem, ngram_range=(1,3)) get_ipython().magic("time tfidf_matrix = tfidf_vectorizer.fit_transform(titles)") print(tfidf_matrix.shape)
Pe matricea rezultată începem să aplicăm diverse metode grupare:

Num_clusters = 5 # Metoda K-means - KMeans din sklearn.cluster import KMeans km = KMeans(n_clusters=num_clusters) get_ipython().magic("time km.fit(tfidf_matrix)") idx = km.fit(tfidf_matrix) clusters km.labels_.tolist() print(clusters) print (km.labels_) # MiniBatchKMeans din sklearn.cluster import MiniBatchKMeans mbk = MiniBatchKMeans(init="random", n_clusters=num_clusters) #(init="k-means++", ' random' sau un ndarray) mbk.fit_transform(tfidf_matrix) %time mbk.fit(tfidf_matrix) miniclusters = mbk.labels_.tolist() print (mbk.labels_) # DBSCAN din sklearn.cluster import DBSCAN get_ipython("(). time db = DBSCAN(eps=0.3, min_samples=10).fit(tfidf_matrix)") labels = db.labels_ labels.shape print(labels) # Agglomerative clustering from sklearn.cluster import AgglomerativeClustering agglo1 = AgglomerativeClustering=(nglomerative_clusters,(nglomerative_clustering), ="euclidean") #affinity puteți alege orice sau încercați totul pe rând: cosinus, l1, l2, manhattan get_ipython().magic("time answer = agglo1.fit_predict(tfidf_matrix.toarray())") answer.shape
Datele primite pot fi grupate într-un cadru de date și numărul de cereri incluse în fiecare cluster poate fi numărat.

#k-means clusterkm = km.labels_.tolist() #minikmeans clustermbk = mbk.labels_.tolist() #dbscan clusters3 = etichete #agglo #clusters4 = answer.tolist() frame = pd.DataFrame(titluri, index = ) #k-înseamnă afară = ( "titlu": titluri, "cluster": clusterkm ) frame1 = pd.DataFrame(out, index = , coloane = ["titlu", "cluster"]) #mini out = ( "titlu" : titluri, "cluster": clustermbk ) frame_minik = pd.DataFrame(out, index = , columns = ["titlu", "cluster"]) frame1["cluster"].value_counts() frame_minik["cluster"].value_counts ()
Din cauza cantitate mare interogările nu sunt foarte convenabile pentru a te uita la tabele și aș dori mai multă interactivitate pentru înțelegere. Prin urmare, vom realiza grafice ale pozițiilor relative ale cererilor una față de cealaltă.

Mai întâi trebuie să calculați distanța dintre vectori. În acest scop, se va folosi distanța cosinus. Articolele sugerează utilizarea scăderii de la unu, astfel încât să nu existe valori negative și să fie în intervalul de la 0 la 1, așa că vom face același lucru:

Din sklearn.metrics.pairwise import cosine_similarity dist = 1 - cosine_similarity(tfidf_matrix) dist.shape
Deoarece graficele vor fi bidimensionale și tridimensionale, iar matricea de distanță originală va fi n-dimensională, vor trebui utilizați algoritmi de reducere a dimensionalității. Există mulți algoritmi din care să alegeți (MDS, PCA, t-SNE), dar să alegem Incremental PCA. Această alegere a fost făcută datorită aplicației practice - am încercat MDS și PCA, dar RAM Nu aveam suficient (8 gigaocteți) și când fișierul de pagină a început să fie folosit, am putut reporni imediat computerul.

PCA incremental este utilizat ca înlocuitor pentru Analiza componentelor principale (PCA) atunci când setul de date care urmează să fie descompus este prea mare pentru a se potrivi în memorie. IPCA creează o aproximare la nivel scăzut a datelor de intrare folosind o amprentă de memorie care este independentă de numărul de mostre de date de intrare.

# Metoda componentei principale - PCA din importul sklearn.decomposition IncrementalPCA icpa = IncrementalPCA(n_components=2, batch_size=16) get_ipython().magic("time icpa.fit(dist) #demo =") get_ipython().magic(" time demo2 = icpa.transform(dist)") xs, ys = demo2[:, 0], demo2[:, 1] # PCA 3D din sklearn.decomposition import IncrementalPCA icpa = IncrementalPCA(n_components=3, batch_size=16) get_ipython ().magic("time icpa.fit(dist) #demo =") get_ipython().magic("time ddd = icpa.transform(dist)") xs, ys, zs = ddd[:, 0], ddd [:, 1], ddd[:, 2] #Puteți vedea imediat care va fi rezultatul final #din mpl_toolkits.mplot3d import Axes3D #fig = plt.figure() #ax = fig.add_subplot(111, projection= "3d ") #ax.scatter(xs, ys, zs) #ax.set_xlabel("X") #ax.set_ylabel("Y") #ax.set_zlabel("Z") #plt.show()
Să trecem direct la vizualizarea în sine:

Din matplotlib import rc #include simboluri rusești pe diagramă font = ("familie": "Verdana")#, "greutate": "normal") rc("font", **font) #puți genera culori pentru importul clusterelor random def generate_colors(n): color_list = pentru c în interval(0,n): r = lambda: random.randint(0,255) color_list.append("#%02X%02X%02X" % (r(),r() ), r())) returnează lista de culori #set colors cluster_colors = (0: „#ff0000”, 1: „#ff0066”, 2: „#ff0099”, 3: „#ff00cc”, 4: „#ff00ff”, ) # dăm nume clusterelor, dar din cauza caracterului aleatoriu, să fie doar 01234 cluster_names = (0: "0", 1: "1", 2: "2", 3: "3", 4: " 4",) #matplotlib inline #creați un cadru de date care conține coordonate (din PCA) + numere de cluster și interogările în sine df = pd.DataFrame(dict(x=xs, y=ys, label=clusterkm, title=titles) ) #group by clusters groups = df .groupby("label") fig, ax = plt.subplots(figsize=(72, 36)) #figsize pentru a se potrivi gusturilor dvs. pentru nume, grupați în grupuri: ax.plot(group. x, group.y, marker= "o", linestyle="", ms=12, label=cluster_names, color=cluster_colors, mec="none") ax.set_aspect("auto") ax.tick_params(axis= " x", which="both" , bottom="off", top="off", labelbottom="off") ax.tick_params(axis= "y", which="both", left="off", sus ="off", labelleft="off") ax.legend(numpoints=1) #afișați legenda de doar 1 punct #adăugați etichete/nume la pozițiile x,y cu interogare de căutare#pentru i în interval(len(df)): # ax.text(df.ix[i]["x"], df.ix[i]["y"], df.ix[i]["titlu "], dimensiune=6) #arată grafic plt.show() plt.close()
Dacă decomentați linia adăugând nume, va arăta cam așa:

Exemplu cu 10 clustere

Nu tocmai ce m-as fi asteptat. Să folosim mpld3 pentru a converti figura într-un grafic interactiv.

# Plot fig, ax = plt.subplots(figsize=(25,27)) ax.margins(0.03) for name, group in groups_mbk: points = ax.plot(group.x, group.y, marker="o" , linestyle="", ms=12, #ms=18 label=cluster_names, mec="none", color=cluster_colors) ax.set_aspect("auto") labels = tooltip = mpld3.plugins.PointHTMLTooltip(puncte, etichete, voffset=10, hoffset=10, #css=css) mpld3.plugins.connect(fig, tooltip) # , TopToolbar() ax.axes.get_xaxis().set_ticks() ax.axes.get_yaxis().set_ticks() #ax.axes.get_xaxis().set_visible(False) #ax.axes.get_yaxis().set_visible(False) ax.set_title("Mini K-Means", size=20) #groups_mbk ax.legend(numpoints=1 ) mpld3.disable_notebook() #mpld3.display() mpld3.save_html(fig, "mbk.html") mpld3.show() #mpld3.save_json(fig, "vivod.json") #mpld3.fig_to_html(fig) fig , ax = plt.subplots(figsize=(51,25)) scatter = ax.scatter(np.random.normal(size=N), np.random.normal(size=N), c=np.random.random (dimensiune=N), s=1000 * np.random.random(size=N), alpha=0,3, cmap=plt.cm.jet) ax.grid(color="white", linestyle="solid") ax .set_title("Clusters", size=20) fig, ax = plt.subplots(figsize=(51,25)) labels = ["punct (0)".format(i + 1) for i in range(N) ] tooltip = mpld3.plugins.PointLabelTooltip(scatter, labels=labels) mpld3.plugins.connect(fig, tooltip) mpld3.show()fig, ax = plt.subplots(figsize=(72,36)) pentru nume, grup în grupuri: puncte = ax.plot(group.x, group.y, marker="o", linestyle="", ms=18, label=cluster_names, mec="none", color=cluster_colors) ax.set_aspect( „auto”) labels = tooltip = mpld3.plugins.PointLabelTooltip(puncte, labels=labels) mpld3.plugins.connect(fig, tooltip) ax.set_title(„K-means”, size=20) mpld3.display()
Acum, când treceți cu mouse-ul peste orice punct din grafic, apare textul cu interogarea de căutare corespunzătoare. Un exemplu de fișier html finalizat poate fi vizualizat aici: Mini K-Means

Dacă îl doriți în 3D și cu o scară redimensionabilă, atunci există un serviciu numit Plotly, care are un plugin pentru Python.

Complot 3D

#de exemplu, doar un grafic 3D din valorile obținute import plotly plotly.__version__ import plotly.plotly ca py import plotly.graph_objs as go trace1 = go.Scatter3d(x=xs, y=ys, z=zs, mode ="marcatori", marker=dict(dimensiune=12, linie=dict(culoare="rgba(217, 217, 217, 0,14)", lățime=0,5), opacitate=0,8)) date = aspect = go.Layout( margin=dict(l =0, r=0, b=0, t=0)) fig = go.Figure(data=data, layout=layout) py.iplot(fig, filename="cluster-3d-plot" )

Rezultatele pot fi văzute aici: Exemplu

Și, ca punct final, să realizăm gruparea ierarhică (aglomerativă) folosind metoda lui Ward pentru a crea o dendogramă.

În: din scipy.cluster.hierarchy import ward, dendrogram linkage_matrix = ward(dist) fig, ax = plt.subplots(figsize=(15, 20)) ax = dendrogram(linkage_matrix, orientation="right", labels=titles) ; plt.tick_params(\ axis= "x", which="both", bottom="off", top="off", labelbottom="off") plt.tight_layout() #salvați desenul plt.savefig("ward_clusters2 . png", dpi=200)
Concluzii

Din păcate, există o mulțime de întrebări nerezolvate în domeniul cercetării limbajului natural și nu toate datele pot fi grupate ușor și simplu în grupuri specifice. Dar sper că acest ghid va crește interesul pentru acest subiect și va oferi o bază pentru experimente ulterioare.

Abstract lectie deschisa pe subiect

" Vizualizarea informațiilor în documente text. Mesele"

Obiectivul lecției:

Educațional : promovează formarea conceptelor - tabel, celulă, rând, coloană a unui tabel, editarea și formatarea tabelelor, învață cum să inserezi un tabel într-un document, să-l editezi și să-l formatezi.

De dezvoltare : pentru a dezvolta gândirea logică și rațională a elevilor, pentru a dezvolta independența în stăpânirea capacităților unui PC în timpul execuției munca practica.

Educațional : să cultive o atitudine grijulie față de echipamentele orelor de informatică, să promoveze activarea abilităților creative ale elevilor, să cultive o stime de sine adecvată a rezultatelor activităților lor.

Tipul de lecție : lecție de învățare a materialelor noi

Structura unei sesiuni de antrenament:

Moment organizatoric;

Actualizare și motivare;

Învățarea de materiale noi;

Consolidare primară;

Rezumarea lecției;

Teme pentru acasă.

Forme de organizare a activității cognitive:

colectiv;

frontal;

individual.

Metode de predare:

explicativ și ilustrativ;

căutare parțială;

reproductivă.

Progresul lecției

Subtitrările diapozitivelor:

PROGRAM Luni: algebră, chimie, rusă, educație fizică; Marți: informatică, literatură, geometrie, istorie; miercuri: fizică, biologie, rusă, algebră; Joi: literatură, siguranța vieții, informatică, algebră, educație fizică; Vineri: chimie, geometrie, istorie

Rând coloană tabel

Celulă de tabel Celulele de tabel pot conține diverse tipuri date (text, numere, imagini etc.)

Puteți insera un tabel gol în document, pentru aceasta, în Microsoft Word utilizați meniul Inserare – Tabel:

Specificați numărul necesar de rânduri și coloane

Deplasarea în jurul mesei: Prin apăsarea tastei Tab Prin apăsarea tastelor cursor Prin utilizarea mouse-ului Selectarea elementelor tabelului:

În viitor, parametrii tabelului pot fi modificați folosind meniul contextual(RMB): Inserați sau ștergeți rânduri, coloane și celule; Modificați lățimea coloanei și înălțimea rândului; Împărțiți celulele sau îmbinați cu cele învecinate.

Puteți modifica aspectul tabelului: Lucrul cu tabele - Designer

Lucrare practică: Sarcina 1: Creați un tabel în funcție de eșantion, completați-l cu date folosind copierea: Luni Marți Miercuri Joi 1 lecție biologie algebră istorie fizică 2 lecție algebră biologie algebră istorie 3 lecție istorie fizică biologie algebră orarul clasei clasa a VIII-a

Sarcina 2: Creați un tabel pe baza eșantionului. Bilanțul unui elev de clasa a VIII-a Semestru I II Trimestru I II III IV Algebră 5 4 4 5 Geometrie 3 4 3 4 Fizică 4 5 4 5 Istorie 5 4 5 4 Biologie 4 5 3 5 Chimie 5 4 4 4 Informatică 4 5 5 5 Literatură 4 4 3 4

Sarcină suplimentară: Creați un tabel conform exemplului: Bilanț pentru un elev de clasa a VIII-a

Criterii de evaluare: Sarcina 1 – „2-3” puncte Sarcina 2 – „2-3” puncte Sarcina suplimentară – „1” punct „5” – 6-7 puncte „4” – 5 puncte „3” – 3-4 puncte

Vă mulțumim pentru atenție!

Previzualizare:

Lucrări practicepe tema „Inserarea tabelelor într-un document”

Sarcina 1: Lucrul cu o masă

Creați un tabel conform eșantionului, completați-l cu date utilizând copierea:

Programul clasei de clasa a VIII-a

	luni	marţi	miercuri	joi
1 lectie	biologie	algebră	poveste	fizică
Lecția 2	algebră	biologie	algebră	poveste
Lecția 3	poveste	fizică	biologie	algebră

Introduceți o coloană din dreapta în tabel (vineri), completați-o.

Sarcina 2: Creați un tabel ca acesta:

buletinul elevului de clasa a VIII-a

Jumătate de an
Trimestru
Algebră
Geometrie
Fizică
Poveste
Biologie
Chimie

Harta lectiei tehnologice

Clasă: 7 "A"

UMK: Informatica: manual pentru clasa a VII-a / L.L. Bosova, A.Yu. Bosova. – ed. a 5-a. - M.: BINOM. Laboratorul de cunoștințe, 2016. - 224 p. : bolnav.

Subiect: Vizualizarea informațiilor în documente text.

Obiectivul lecției: Formarea de idei despre varietatea și oportunitatea vizualizării informațiilor în procesoarele de text.

Obiectivele lecției:

1. Subiect

Prezintă elevilor instrumentele de structurare și vizualizare informații text;

Pentru a vă forma o idee despre cum să creați liste și despre posibilitățile de utilizare a acestora în documente text;

Pentru a vă forma o idee despre cum să creați tabele și despre posibilitățile de utilizare a acestora în documente text;

Aflați cum să creați liste numerotate și cu marcatori pe mai multe niveluri.

Crearea unei nevoi de cunoștințe asupra subiectului;

Să învețe cum să aleagă instrumentele de tehnologie a informației și comunicațiilor pentru crearea documentelor text;

Dezvoltați abilitățile de utilizare rațională a instrumentelor disponibile.

3. Personal

Să dezvolte la elevi pregătirea și capacitatea de autoeducare bazată pe motivația pentru învățare și cunoaștere;

Creați o nevoie de autoexprimare și autorealizare;

Insuflați abilitățile de autocontrol și stima de sine.

1. Moment organizatoric (inițiere)

Salută elevii, verifică pregătirea pentru lecție, organizează atenția copiilor.

Salutați profesorii, verificați disponibilitatea materialului educațional pe mese, organizați-le locul de munca.

Comunicativ: planificarea colaborării educaționale cu colegii

Personal : pregătirea psihologică a elevilor pentru lecție, autodeterminare

2. Verificați teme pentru acasă

Verificarea temelor (pe perechi, verificare reciprocă)

Verificați temele (în perechi, aleatoriu)

Cognitiv: structurarea cunoștințelor, reflecția asupra metodelor și condițiilor de acțiune, controlul și evaluarea procesului și a rezultatelor activităților

Personal : capacitatea de a lucra în perechi

3. Actualizarea cunoștințelor și formularea temei și a obiectivelor lecției

În ultima lecție, v-ați familiarizat cu noul concept de „formatare” a textului. Ce este asta?

Ce puteți schimba atunci când formatați caractere?

Paragrafe?

Ce setări de pagină puteți seta pentru o foaie de lucru? editor de text?

Pentru a afla subiectul lecției noastre, să ne uităm la diapozitivele 1 (pe diapozitiv există text care listează dispozitivul computerului, separat prin virgule și aranjat într-o listă; pe diapozitiv de

lista microdistrictelor orașului Stavropol, diagramă, fragment dintr-un jurnal de clasă cu note).

Ce informații este mai ușor de perceput pentru noi?

Ce tip de informații conform metodei de percepție pot include liste, diagrame, tabele?

Încercați să formulați subiectul lecției noastre.

Răspunde la întrebările:

Decorare text

Font, dimensiunea fontului, stilul, culoarea;

Aliniere, indentație pe prima linie, spațiere între rânduri, indentări stânga și dreapta, spații înainte și după;

Margini, orientare, dimensiune hârtie.

Lista, diagrama, tabelul;

vizual (vizual).

Formulați subiectul lecției „Vizualizarea informațiilor în documente text”.

Cognitiv: structurarea cunoștințelor, reflecția asupra metodelor și condițiilor de acțiune, controlul și evaluarea procesului și a rezultatelor activitățilorde reglementare: dezvoltarea abilității de a formula tema și scopul lecției în conformitate cu sarcinile și normele limbii ruse

Comunicativ: Orientare către un partener de comunicare, capacitatea de a asculta interlocutorul, capacitatea de a-și argumenta opinia, de a convinge și de a ceda

Personal: dezvoltarea gândirii logice, cunoașterea normelor morale de bază

4. Asimilarea noilor cunoștințe

Se știe că informațiile text sunt percepute de o persoană mai bine dacă aceastavizualizat - organizate sub forma de liste, diagrame, tabele, insotite de imagini grafice (desene, fotografii). După metoda de proiectare se distingnumerotate Şi marcat liste (exemplu de pe diapozitivul 2).

Dupa structura: cu un singur nivel Şi pe mai multe niveluri .

Pentru a descrie un număr de obiecte care au aceleași seturi de proprietăți, cel mai adesea

sunt folosite mesele , format din rânduri și coloane (structura tabelului de pe slide 3).

Tabelele pot conține texte, numere,imagini (pe diapozitivul 4 există un exemplu de tabel care conține texte, numere și imagini). Puteți crea propriile desene folosind editori grafici, le puteți folosi pe cele deja create sau găsite pe Internet. În multe procesoare de text puteți crea imagini din autoshape (pe diapozitivul 5 există un exemplu de primitive grafice în Word).

Urmărește o prezentare pe această temă, notează pe scurt aspectele importante ale materialului în registrul tău de lucru.

Cognitiv: dezvoltarea activității cognitive

de reglementare: planificarea activităților dumneavoastră pentru a rezolva o problemă dată, monitorizarea rezultatului obținut, corectarea rezultatului obținut

Personal: dezvoltarea memoriei, atenției, memoriei vizuale și auditive, capacitatea de a desfășura în mod independent activități de învățare

Comunicativ: dezvoltarea vorbirii dialogice

5. Consolidarea primară a materialului

Și pentru a vă consolida cunoștințele pe această temă, vă sugerez să faceți un test asupra opțiunilor. (Anexa 1)

Ei finalizează testul (după opțiuni) și îl trimit profesorului pentru verificare.

Cognitiv: alegerea cel mai mult moduri eficiente finalizarea sarcinii

Personal: dezvoltarea capacității de a atinge obiective și de a evalua rezultatele muncii cuiva

Comunicativ: capacitatea de a lucra în grup, dezvoltarea vorbirii dialogice

6. Atelier de calculatoare

Pentru a consolida cunoștințele acumulate, vă sugerez să faceți lucrări practice pe calculator (Anexa 2)

Faceți lucrări practice pe computer.

Personal: dezvoltarea capacității de a atinge obiectivele și de a evalua rezultatele muncii proprii; formarea si dezvoltarea

gândire analitică

7. Rezumatul lecției, reflecție

Evaluarea lucrărilor practice ale studenților (notele sunt postate într-un jurnal).

Reflecţie:

Rezumați-vă munca.

Oferiți o evaluare emoțională a lucrării dvs. alegând imaginea potrivită (pe cartonașe) și desenați-o în marginile caietului de lucru vizavi de subiectul lecției.

Prezentați profesorului lucrarea practică finalizată.

Ei efectuează o evaluare psiho-emoțională a muncii lor, desenează pictograme corespunzătoare emoțiilor din caietul de lucru vizavi de subiectul lecției.

Cognitiv: construirea unui enunț verbal, monitorizarea și evaluarea procesului și a rezultatelor activităților

de reglementare: monitorizarea și evaluarea activităților dumneavoastră în cadrul lecției

Comunicare : capacitatea de a asculta și de a se angaja în dialog, de a formula și de a-și argumenta opinia

Personal: reflecție asupra metodelor și condițiilor de acțiune, controlul și evaluarea procesului și a rezultatelor activităților

Anexa 1

1 opțiune

1. O listă numerotată trebuie utilizată atunci când:

3) descrierea obiectelor din cameră
4) enumerarea echipamentelor din sala de clasă

2. Proprietățile datelor din celule sunt determinate de:

1) proprietățile limitelor
2) dimensiunea fontului
3) dimensiunile celulelor
4) tipul de date numerice din celule

3. Gata imagini grafice pot fi editate folosind procesoare de text:

1) schimbarea luminozității
2) crearea de noi straturi
3) schimbarea culorilor bitmap-urilor
4) crearea de animație

4. Pentru a recunoaște textul de pe suporturi tipărite și a-l introduce în memoria computerului pentru editare, este recomandabil să utilizați:

1) camera video
2) tastatura
3) scaner
4) microfon

Dispozitiv automat a recodat un mesaj în rusă dintr-un cod de 8 biți într-un cod de 4 biți. În același timp, volumul mesajului recodat a scăzut cu 128 de octeți. Lungimea mesajului original în caractere este de _____ caractere.

6. Efectuați calculele și introduceți valoarea numerică.

Volumul de informații al unui cuvânt de 24 de caractere în codificare Unicode este de _____ octeți.

Opțiunea 2

1. Lista cu marcatori ar trebui utilizat atunci când:

1) elaborarea unui algoritm de acţiune
2) enumerarea tipurilor de flori din patul de flori
3) descrierea secvenței de acțiuni pentru lucrul cu dispozitivul
4) descrierea oricărei secvențe

2. Aspect tabelele definesc(e):

3. Folosind un procesor de text într-o imagine finită nu puteți:

1) schimbați luminozitatea
2) redimensionați imaginea
3) schimbați contrastul
4) introduceți noi straturi

4. Pentru traducerea automată a documentelor text utilizați:

1) scaner
2) procesor de text
3) scaner
4) programe de traducere

5. Efectuați calculele și introduceți valoarea numerică.

Dispozitivul automat a recodat mesajul în limba rusă de la un cod de 16 biți la un cod de 8 biți. În același timp, volumul mesajului recodat a scăzut cu 128 de octeți. Lungimea mesajului original în caractere este de _____ caractere.

6. Efectuați calculele și introduceți valoarea numerică.

Volumul de informații al unui cuvânt de 16 caractere în codificarea Unicode este de _____ octeți.

Anexa 2

Vizualizarea informațiilor: lucrul cu un tabel

Sarcina 1: Creați un tabel

Programul lecției:

Progresul lucrării:

Utilizați fila „Inserare”.

Selectați tabelul (4 rânduri, 5 coloane). Completați tabelul cu date (font –Times Nou român , dimensiune12) folosind copierea (Tab –Ctrl+ Ins – Schimbare+ Ins):

Introduceți coloana din dreapta în tabel (vineri) și completați-o și ea.

Adăugați o linie „ziua săptămânii” făcând clic clic dreapta mouse-ul în orice celulă din primul rând.