Prelegere: Măsuri ale informației (sintactice, semantice, pragmatice). Măsuri informaționale la nivel semantic

17.08.2019 Photoshop 3D

care apar în medie pe stare se numește entropia unei surse discrete de informații

mation.

H p i log p i

eu 1 N

Dacă ne concentrăm din nou pe măsurarea incertitudinii în unități binare, atunci baza logaritmului ar trebui luată egală cu doi.

H p ilog 2 p i

eu 1 N

În alegeri equiprobabile, toate

p log

iar formula (5) este transformată în formula (2) a lui R. Hartley:

1 log2

Nlog2

Măsura propusă a fost numită entropie nu întâmplător. Faptul este că structura formală a expresiei (4) coincide cu entropia sistem fizic, definit anterior de Boltzmann. Conform celei de-a doua legi a termodinamicii, entropia unui spațiu închis este determinată de

P i 1

creste atunci

poate fi scris ca

piln

eu 1 N

Această formulă coincide complet cu (4)

În ambele cazuri, valoarea caracterizează gradul de diversitate a sistemului.

Folosind formulele (3) și (5), este posibil să se determine redundanța alfabetului sursei mesajului.

Care arată cât de rațional sunt folosite simbolurile a acestui alfabet:

) este entropia maximă posibilă, determinată de formula (3);

() - entropie

sursă, determinată prin formula (5).

Esența acestei măsuri este că, cu o alegere la fel de probabilă, aceeași încărcare informațională pe un semn poate fi asigurată prin utilizarea unui alfabet mai mic decât în ​​cazul unei alegeri inegale.

Măsuri informaționale la nivel semantic

Pentru a măsura conținutul semantic al informațiilor, i.e. cantitatea sa per nivel semantic, cea mai răspândită este măsura tezaurului, care leagă proprietățile semantice ale informațiilor cu capacitatea utilizatorului de a accepta mesajul primit. Într-adevăr, pentru a înțelege și utiliza informațiile primite, destinatarul trebuie să aibă o anumită cantitate de cunoștințe. Necunoașterea completă a subiectului nu ne permite să extragem informații utile din mesajul primit despre acest subiect. Pe măsură ce cunoștințele despre un subiect cresc, la fel crește și numărul informatii utile, extras din mesaj.

Dacă numim cunoștințele destinatarului despre un anumit subiect „tezaur” (adică un anumit set de cuvinte, concepte, nume de obiecte legate prin conexiuni semantice), atunci cantitatea de informații conținute într-un anumit mesaj poate fi evaluată în funcție de grad. de schimbare în tezaurul individual sub influenţa acestui mesaj .

Tezaurul este o colecție de informații disponibile unui utilizator sau unui sistem.

Cu alte cuvinte, numărul informație semantică, extras de destinatar din mesajele primite, depinde de gradul de pregătire al tezaurului său pentru a percepe astfel de informații.

În funcție de relația dintre conținutul semantic al informațiilor și tezaurul utilizatorului, cantitatea de informații semantice percepută de utilizator și inclusă ulterior de acesta în tezaurul său se modifică. Natura acestei dependențe este prezentată în Figura 3. Să luăm în considerare două cazuri limită când cantitatea de informații semantice este egală cu

Figura 3 - Dependența cantității de informații semantice percepute de consumator de tezaurul său ()

Consumatorul dobândește cantitatea maximă de informații semantice prin acord

combinând conținutul său semantic cu tezaurul său (), atunci când informațiile primite sunt de înțeles utilizatorului și îi aduc acestuia informații necunoscute anterior (nu în tezaurul său).

În consecință, cantitatea de informații semantice dintr-un mesaj, cantitatea de cunoștințe noi primite de utilizator, este o valoare relativă. Același mesaj poate avea conținut semnificativ pentru un utilizator competent și poate fi lipsit de sens pentru un utilizator incompetent.

Atunci când se evaluează aspectul semantic (conținut) al informațiilor, este necesar să se depună eforturi pentru a armoniza valorile și.

O măsură relativă a cantității de informații semantice poate fi coeficientul de conținut, care este definit ca raportul dintre cantitatea de informații semantice și volumul acesteia:

O altă abordare a evaluărilor semantice ale informațiilor, dezvoltată în cadrul unor studii științifice, este aceea că numărul de legături către aceasta în alte documente este luat ca principal indicator al valorii semantice a informațiilor conținute în documentul analizat (mesaj, publicație) . Indicatorii specifici se formează pe baza prelucrare statistică numărul de link-uri în mostre diferite.

Măsuri de informare la nivel pragmatic

Această măsură determină utilitatea informațiilor (valorii) pentru ca utilizatorul să își atingă scopul. Este, de asemenea, o valoare relativă, determinată de particularitățile utilizării acestor informații într-un anumit sistem.

Unul dintre primii oameni de știință autohtoni care a abordat această problemă a fost A. A. Kharkevich, care a propus luarea ca măsură a valorii informațiilor cantității de informații necesare atingerii scopului, adică. calculați creșterea probabilității de atingere a scopului. Deci, dacă

Astfel, valoarea informației se măsoară în unități de informație, în în acest caz,în biți.

Expresia (7) poate fi considerată ca rezultat al normalizării numărului de rezultate. Pentru explicație, Figura 4 prezintă trei diagrame în care sunt luate aceleași valori pentru numărul de rezultate: 2 și 6 pentru punctele 0 și, respectiv, 1. Poziția de pornire- punctul 0. Pe baza informațiilor primite se face o trecere la punctul 1. Golul este marcat cu o cruce. Rezultatele favorabile sunt descrise prin linii care conduc la obiectiv. Să determinăm valoarea informațiilor primite în toate cele trei cazuri:

a) numărul de rezultate favorabile este de trei:

şi prin urmare

b) există un rezultat favorabil:

c) numărul de rezultate favorabile este de patru:

În exemplul b) s-a obţinut o valoare a informaţiei negative (informaţii negative). O astfel de informație, care crește incertitudinea inițială și reduce probabilitatea de a atinge un obiectiv, se numește dezinformare. Astfel, în exemplul b) am primit informații greșite de 1,58 unități binare.

Informații - ce este? Pe ce se bazează? Ce obiective urmărește și ce sarcini îndeplinește? Despre toate acestea vom vorbi în acest articol.

Informații generale

In ce cazuri se foloseste? metoda semantică măsurarea informațiilor? Este folosită esența informațiilor, partea de conținut a mesajului primit este de interes - acestea sunt indicațiile pentru utilizarea acestuia. Dar mai întâi, să dăm o explicație despre ce este. Trebuie remarcat faptul că metoda semantică de măsurare a informațiilor este o abordare formalizată dificilă, care nu a fost încă pe deplin formată. Este folosit pentru a măsura cantitatea de semnificație a datelor care au fost primite. Cu alte cuvinte, cât de mult din informațiile primite sunt necesare în acest caz. Această abordare este utilizată pentru a determina conținutul informațiilor primite. Și dacă vorbim despre un mod semantic de măsurare a informațiilor, folosim conceptul de tezaur, care este indisolubil legat de subiectul luat în considerare. Ce reprezintă?

Tezaur

Aș dori să fac o scurtă introducere și să răspund la o întrebare despre metoda semantică de măsurare a informațiilor. Cine a prezentat-o? Fondatorul ciberneticii, Norbert Wiener, a propus utilizarea acestei metode, dar a primit o dezvoltare semnificativă sub influența compatriotului nostru A. Yu. Care este denumirea folosită pentru a desemna totalitatea informațiilor pe care le are destinatarul informațiilor. Dacă corelezi tezaurul cu conținutul mesajului primit, poți afla cât de mult a redus incertitudinea. Aș dori să corectez o greșeală care cade adesea sub influența număr mare oameni. Astfel, ei cred că metoda semantică de măsurare a informațiilor a fost introdusă de Claude Shannon. Nu se știe exact cum a apărut această concepție greșită, dar această opinie este incorectă. Claude Shannon a introdus o metodă statistică de măsurare a informațiilor, al cărei „succesor” este metoda semantică.

Abordare grafică pentru determinarea cantității de informații semantice dintr-un mesaj primit

De ce trebuie să desenezi ceva? Măsurarea semantică folosește această capacitate de a comunica vizual utilitatea datelor în grafice ușor de înțeles. Ce înseamnă asta în practică? Pentru a explica starea de fapt, o relație este reprezentată sub forma unui grafic. Dacă utilizatorul nu are cunoștințe despre esența mesajului care a fost primit (egal cu zero), atunci cantitatea de informații semantice va fi egală cu aceeași valoare. Este posibil de găsit valoare optimă? Da! Acesta este numele unui tezaur, unde volumul de informații semantice este maxim. Să ne uităm la un mic exemplu. Să presupunem că un utilizator primește un mesaj scris într-o limbă necunoscută. limba straina, sau o persoană poate citi ceea ce este scris acolo, dar aceasta nu mai este o știre pentru el, deoarece toate acestea sunt cunoscute. În astfel de cazuri, ei spun că mesajul conține zero informații semantice.

Dezvoltare istorică

Probabil că acest lucru ar fi trebuit să fie discutat puțin mai sus, dar nu este prea târziu pentru a ajunge din urmă. Metoda semantică de măsurare a informațiilor a fost introdusă inițial de Ralph Hartley în 1928. S-a menționat anterior că Claude Shannon este adesea citat drept fondator. De ce a existat o asemenea confuzie? Cert este că, deși metoda semantică de măsurare a informațiilor a fost introdusă de Ralph Hartley în 1928, Claude Shannon și Warren Weaver au fost cei care au generalizat-o în 1948. După aceasta, fondatorul ciberneticii, Norbert Wiener, și-a format ideea metodei tezaurului, care a primit cea mai mare recunoaștere sub forma unei măsuri dezvoltate de Yu I. Schneider. Trebuie remarcat faptul că pentru a înțelege acest lucru, aveți nevoie de suficient nivel înalt cunoştinţe.

Eficienţă

Ce ne oferă în practică metoda tezaurului? Este o confirmare reală a tezei că informația are o proprietate precum relativitatea. De remarcat că are o valoare relativă (sau subiectivă). Pentru a putea evalua obiectiv informatii stiintifice, a introdus conceptul de tezaur universal. Gradul său de schimbare arată semnificația cunoștințelor pe care le primește umanitatea. În același timp, este imposibil de spus exact ce rezultat final (sau intermediar) se poate obține din informații. Să luăm computerele de exemplu. Tehnologia informatică a fost creată pe baza tehnologiei lămpii și a stării de biți a fiecăreia element structuralși a fost folosit inițial pentru a efectua calcule. Acum aproape fiecare persoană are ceva care funcționează pe baza acestei tehnologii: radio, telefon, computer, televizor, laptop. Chiar frigidere moderne, sobele și lavoarele conțin unele componente electronice, a căror bază este informații despre facilitarea utilizării acestor dispozitive de uz casnic de către o persoană.

Abordare științifică

Unde este studiată metoda semantică de măsurare a informațiilor? Informatica este stiinta care se ocupa de diverse aspecte ale acestei probleme. Care este particularitatea? Metoda se bazează pe utilizarea sistemului „adevărat/fals” sau a sistemului de biți „un/zero”. Când sosesc anumite informații, acestea sunt împărțite în blocuri separate, care sunt denumite ca unități de vorbire: cuvinte, silabe și altele asemenea. Fiecare bloc primește o anumită valoare. Să ne uităm la un mic exemplu. Doi prieteni stau în apropiere. Unul se întoarce la al doilea cu cuvintele: „Avem o zi liberă mâine”. Toată lumea știe când sunt zilele de odihnă. Prin urmare, valoarea acestei informații este zero. Dar dacă al doilea spune că lucrează mâine, atunci pentru primul va fi o surpriză. Într-adevăr, în acest caz, se poate dovedi că planurile pe care le-a făcut o persoană, de exemplu, să meargă la bowling sau să scormonească într-un atelier, vor fi perturbate. Fiecare parte a exemplului descris poate fi descrisă folosind unu și zerouri.

Operarea cu concepte

Dar ce se mai folosește în afară de tezaur? Ce altceva trebuie să știți pentru a înțelege modul semantic de măsurare a informațiilor? Conceptele de bază care pot fi studiate în continuare sunt sistemele de semne. Ele sunt înțelese ca mijloace de exprimare a sensului, cum ar fi regulile de interpretare a semnelor sau a combinațiilor lor. Să ne uităm la un alt exemplu din informatică. Calculatoarele funcționează cu zerouri și unuri convenționale. În esență este scăzut și înaltă tensiune, care este furnizat componentelor echipamentelor. Mai mult, ei transmit acestea și zerourile la nesfârșit. Cum poate tehnologia să facă diferența între ele? S-a găsit răspunsul la aceasta - întreruperi. Când se transmit aceleași informații, se obțin diverse blocuri precum cuvinte, fraze și semnificații individuale. În vorbirea umană vorbită, pauzele sunt, de asemenea, folosite pentru a împărți datele în blocuri separate. Sunt atât de invizibile încât majoritatea le observăm automat. În scris, punctele și virgulele sunt folosite în acest scop.

Particularități

Să atingem și tema proprietăților pe care le are metoda semantică de măsurare a informațiilor. Știm deja că acesta este numele unei abordări speciale care evaluează importanța informațiilor. Putem spune că datele care vor fi evaluate în acest fel vor fi obiective? Nu, nu este adevărat. Informația este subiectivă. Să ne uităm la asta folosind o școală ca exemplu. Există un student excelent care este înaintea programului aprobat și un student mediu care studiază ceea ce este predat la clasă. Pentru prima, majoritatea informațiilor pe care le va primi la școală vor fi destul de puțin interesate, deoarece le știe deja și nu le aude/citește pentru prima dată. Prin urmare, la nivel subiectiv, nu va fi foarte valoros pentru el (poate datorită unor comentarii ale profesorului pe care le-a observat în timpul prezentării materiei sale). În timp ce media informații noi A auzit ceva doar de la distanță, așa că pentru el valoarea datelor care vor fi prezentate în lecții este cu un ordin de mărime mai mare.

Concluzie

De remarcat că în informatică, metoda semantică de măsurare a informației nu este singura opțiune în cadrul căreia pot fi rezolvate problemele existente. Alegerea ar trebui să depindă de obiectivele stabilite și de oportunitățile prezente. Prin urmare, dacă te interesează subiectul sau este nevoie de ea, atunci nu putem decât să recomandăm insistent să o studiezi mai detaliat și să aflăm ce alte metode de măsurare a informațiilor există, în afară de semantică.

Unitățile cantității informaționale, definite în cadrul abordărilor probabilistice și volumetrice, sunt varietăți ale măsurii sintactice a informațiilor utilizate în abordarea cea mai generală, atunci când subiectul luat în considerare nu este doar informația în sens restrâns (de exemplu, prelucrată de un computer), dar toate tipurile sale, inclusiv informațiile sociale.

Măsura sintactică operează cu informații impersonale care nu exprimă o relație semantică cu obiectul. Volumul de date dintr-un mesaj informativ este măsurat prin numărul de caractere (cifre). ÎN diverse sisteme Cifrele de notație au greutăți diferite, iar unitățile de date se modifică în consecință. Exemplele sunt bit, nat, trit, dit. În cadrul abordării probabilistice, măsura sintactică a cantității de informații este determinată de gradul de modificare a incertitudinii stării sistemului în cadrul abordării volumetrice, caracterizează volumul de informații;

Măsura semantică folosit pentru a caracteriza informația în ceea ce privește semnificația acesteia. Analiza semantică face posibilă dezvăluirea conținutului informației și arătarea relațiilor dintre semnificațiile semantice ale elementelor sale constitutive. În combinație cu conceptul de „tezaur”, se numește măsura semantică măsura tezaurului informaţii. Măsura tezaurului a fost propusă de Yu.I Schneider și s-a răspândit. Tezaur este o colecție de informații disponibile unui utilizator sau unui sistem. O altă definiție care nu o contrazice pe prima: tezaurul este completitudinea unui set sistematic de date despre subiectul informației. În timpul procesului de informare, în funcție de relația dintre conținutul semantic al informațiilor și tezaurul utilizatorului, cantitatea de informații semantice percepută de utilizator și inclusă ulterior de acesta în tezaurul său se modifică. Utilizatorul primește cantitatea maximă de informații semantice atunci când informația este de înțeles pentru el și poartă informații necunoscute anterior pentru el (nu în tezaur). Dobândit în timpul proces de informare cantitatea de informație semantică este o valoare relativă, deoarece același mesaj poate avea conținut semantic pentru un utilizator competent și poate fi lipsit de sens (zgomot semantic) pentru unul incompetent. O măsură a informației semantice poate fi coeficientul de conținut, definit ca raportul dintre cantitatea de informații semantice și volumul total al acesteia.

Măsură pragmatică caracterizează utilitatea (valoarea) informaţiei pentru ca utilizatorul să-şi atingă scopul. Această măsură este și o valoare relativă, în funcție de nevoile specifice ale utilizatorului și de condițiile procesului de informare. Într-un sistem tehnic, proprietățile pragmatice ale informațiilor determină posibilitatea de a îmbunătăți calitatea funcționării sistemului.

Formulare pentru prezentarea informațiilor pe computer. Sisteme numerice

În baza fizică a muncii tehnologie informatică consta in generarea, procesarea si transmiterea semnalelor electrice. Semnalele electrice sunt împărțite în analogic(continuu) și digital(discret). Folosit în calcul semnale digitale. Fiecărui nivel de tensiune (curent) i se atribuie un anumit număr. Corelarea parametrilor semnalului electric cu numere reflectă legătura dintre tehnologie și matematică. Calculatoarele moderne se bazează pe sistem binar un sistem de numere în care există doar două cifre - 0 și 1. Alegerea în favoarea acestui sistem se datorează faptului că este mai ușor de implementat din punct de vedere tehnic decât sistemul de numere zecimal cunoscut oamenilor.

Elementul principal al electronicii computerului este un tranzistor care funcționează în modul cheie. În acest mod, tranzistorul, în funcție de tensiunea aplicată acestuia, implementează două stări logice conform principiului comutatorului: deschis - închis sau pornit - oprit. Aceste două stări compară 0 și 1 din sistemul de numere binar - acele obiecte matematice cu ajutorul cărora este codificată orice informație procesată de un computer. La nivelul caracteristicilor unui semnal electric, „zero” poate corespunde, de exemplu, unei tensiuni de minus 5 volți, iar „unu” la plus 5 volți. Sau – 15 V și + 15 V. Valorile absolute ale tensiunilor, care sunt asociate stărilor logice 0 și 1, nu sunt semnificative pentru procesarea software-ului a informațiilor și sunt determinate de condițiile optime de funcționare ale plăcilor electronice. În dispozitivele de stocare a datelor, informațiile „zerourile” și „unurile” pot fi implementate diferit: de exemplu, pe un disc magnetic, stările 0 și 1 corespund diferitelor direcții ale vectorului de magnetizare; în unități flash – absența sau prezența unei sarcini electrice într-o anumită regiune microscopică a unei substanțe; în cipuri RAM - un condensator neîncărcat sau încărcat.

Deci, reprezentarea internă a oricărei informații dintr-un computer este binară. Sistemele de numere octale și hexazecimale sunt de asemenea folosite în programare. În plus, întrucât utilizatorul computerului este o persoană, conexiunea sistemelor numerice menționate cu zecimală este importantă.

Notaţie– un mod acceptat de scriere a numerelor – caracterizat prin numărul de cifre cu care poate fi exprimat orice număr. Toate sistemele de numere pot fi împărțite în două clase: poziționalŞi nepozițională. Sistemele numerice poziționale sunt acelea în care greutatea cifrelor depinde de locația lor în înregistrarea numerelor. Numărul de cifre în sistem pozițional numit baza sistemului de numere. Mai jos într-un singur bloc sunt adunate definiții importante legate de sistemele numerice.

Numerele– simboluri folosite la scrierea numerelor și la alcătuirea unui alfabet.

Număr– o anumită cantitate care este alcătuită din numere după anumite reguli.

Notaţie- o modalitate de a scrie numere folosind cifre.

Sistemul numeric pozițional– un sistem numeric în care greutatea unei cifre depinde de locația acesteia în înregistrare.

Descarcare– poziția unei cifre într-un număr.

Baza– numărul de cifre folosit pentru a scrie numere.

Calculatoarele folosesc sisteme numerice poziționale.

Sisteme numerice

cel mai utilizat în calcul

Baza

Notaţie

binar

octal

0, 1, 2, 3, 4, 5, 6, 7

zecimal

0, 1, 2, 3, 4, 5, 6, 7, 8, 9

hexazecimal

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F

Un exemplu de sistem de numere non-pozițional este cel roman. Acest sistem folosește 7 caractere (I, V, X, L, C, D, M), care corespund următoarelor valori: I – 1, V – 5, X – 10, L – 50, C – 100, D – 500 , M – 1000. De obicei, cifrele romane sunt folosite la numerotarea capitolelor din cărți sau a secolelor din istorie. Dezavantajul sistemelor de numere nepoziționale, care exclude posibilitatea utilizării lor în calcul, este lipsa regulilor formale de scriere a numerelor și, în consecință, imposibilitatea efectuării operațiilor aritmetice asupra acestora.

Să luăm în considerare reprezentarea unui număr în sistemul numeric pozițional. Să începem cu un exemplu simplu. Fie N – întreg număr. Poate fi prezentat ca o intrare scurtă sau extinsă. Scurtă înregistrare a numărului:

N = (a n a n -1 …a 1 a 0) p

Aici a 0 , a 1 , ... , a n -1 , a n sunt cifrele situate, respectiv, la pozițiile zero, prima, ... , (n-1)-a, a n-a din înregistrarea numerelor. Numerotarea pozițiilor, sau a cifrelor, începe de la zero și merge de la dreapta la stânga. 0 este cifra cea mai puțin semnificativă a numărului, care are cea mai mică pondere; n – cea mai semnificativă cifră cu cea mai mare pondere. Numărul p este baza sistemului numeric.

De exemplu, în numărul N = (6874) 10, cifra 4 reprezintă cifra zero, 7 prima cifră, 8 a doua cifră, 6 a treia cifră. Greutatea cifrelor crește de la dreapta la stânga, de la unități la mii: 4 unitati – 7 zeci – 8 sute – 6 mie. 10 – baza sistemului numeric – indică faptul că acest număr este scris în sistemul numeric zecimal familiar oamenilor și este citit ca şase mii opt sute şaptezeci şi patru.

Numărul N poate fi reprezentat prin notație extinsă:

N = a n p n + a n-1 p n-1 + … + a 1 p 1 + a 0 p 0

Aici numărul N este exprimat ca o sumă, fiecare termen al căruia reprezintă produsul cifrei de baza sistemului numeric, ridicat la o putere egală cu numărul de poziție (cifra) acestei cifre în număr:

număr  (baza) număr de cifre

Revenind la exemplul discutat mai sus, dăm o notație extinsă a numărului N = (6874) 10:

(6874) 10 = 610 3 + 810 2 + 710 1 + 410 0 .

Asociată cu forma extinsă de scriere a unui număr este o metodă universală de conversie a numerelor din orice sistem numeric în zecimal.

De exemplu, doriți să convertiți numărul hexazecimal (E7B) 16 în sistemul numeric zecimal.

În primul rând, numerotăm cifrele numărului - de la dreapta la stânga, de la cea mai puțin semnificativă la cea mai semnificativă. Luăm în considerare că numerotarea cifrelor începe de la zero.

Să luăm în considerare corespondența dintre cifrele sistemelor numerice hexazecimal și zecimal: E – 14, B – 11. Apoi

Deci, problema este rezolvată: (E7B) 16 = (3707) 10.

O metodă similară este utilizată pentru a converti numerele fracționale. Numerele din dreapta punctului zecimal corespund cifrelor cu numere negative.

N = (a n a n-1 …a 1 a 0 ,a -1 a -2 …a -k) p

Să luăm în considerare traducerea fracțională număr octal(725.46) 8 la sistemul numeric zecimal.

Numerotăm categoriile.

Să efectuăm calculele și să obținem rezultatul sistem zecimal Socoteala.

(725,46) 8 = 78 2 + 28 1 + 58 0 + 48 -1 + 68 -2 = 448 + 16 + 5 + 4/8 + 6/64 =

448 + 16 + 5 + 0,5 + 0,09375 = 469,59375

Deci, (725,46) 8 = (469,59375) 10.

Este ceva mai dificil să convertiți numerele din zecimal în alte sisteme de numere.

Tehnica se bazează pe secvențial întregîmpărțirea cu selecția resturilor ca cifre ale numărului dorit. Numărul inițial este împărțit la baza sistemului numeric în care se efectuează conversia. Rezultatul împărțirii întregilor este câtul, reprezentat printr-un număr întreg și un rest. Acest rest va fi cifra cea mai puțin semnificativă a numărului dorit. Coeficientul obținut în prima etapă este din nou împărțit la baza sistemului numeric necesar, iar câtul și restul sunt obținute din nou. Restul este stocat ca următoarea cifră a numărului dorit. Împărțirea continuă până când următorul cât este mai mic decât baza sistemului numeric necesar. Acest coeficient va fi cea mai semnificativă cifră a numărului dorit. Din ea și resturile obținute în ultimii pași și anteriori, se formează numărul necesar.

Să ne uităm la această tehnică cu un exemplu. Vă permite să convertiți numărul (894) 10 în sistemul de numere septale.

894: 7 = 127, rest 5

127: 7 = 18, rest 1

18: 7 = 2 , rest 4

Ultimul cât - 2 - este mai mic decât baza sistemului numeric în care se efectuează conversia - 7. Acum puteți scrie numărul necesar: (2415) 7.

Deci, (894) 10 = (2415) 7.

Bazele logice ale calculatoarelor

Algebra logicii.

Declarații logice Predecesor și parte integrantă

algebra, conform regulilor cărora funcționează dispozitivele digitale, este algebra logicii. Această algebră operează cu afirmații logice, al căror conținut poate fi evaluat ca fiind corespunzător realității (adevărat) sau inconsecvent cu realitatea (fals).

O afirmație logică este o propoziție declarativă a cărei adevăr sau falsitate poate fi evaluată. Exemple de afirmații adevărate: „apa este un lichid”, „primăvara va veni după iarnă”, „numărul 48 este de 8 ori 6". Exemple de afirmații false: „râul Kama se varsă în Lacul Baikal”, „o vrabie este un șoim”, „numărul 2 este mai mare decât numărul 3”.

În prima propoziție verbul este folosit la modul imperativ. O propoziție stimulativă nu poate fi o declarație logică.

A doua propoziție nu este o afirmație logică din cauza absurdității conceptelor „aria unui segment” și „lungimea unui cub”.

A treia propoziție este interogativă, deci nu poate fi nici o afirmație logică.

A patra propoziție este o afirmație logică și una falsă.

Prima propoziție este o afirmație logică. Este fals, deoarece în realitate planeta cea mai apropiată de Soare este Mercur.

A doua propoziție nu este declarativă, ci exclamativă, deci nu este o afirmație logică.

A treia propoziție ar putea fi o afirmație logică dacă informațiile pe care le conținea erau suficiente pentru a-și judeca adevărul sau falsitatea. Cu toate acestea, este imposibil să se judece dacă numărul X aparține intervalului specificat, deoarece acest număr în sine este necunoscut. Prin urmare, a treia propoziție nu este, de asemenea, o afirmație logică.

algebră booleană.

Operații logice de bază Dispozitivele logice ale computerelor sunt proiectate pe baza aparatului matematic al algebrei booleene, numit după matematicianul englez George Boole, care a formulat conceptele și regulile sale de bază. Aceasta este o algebră de variabile binare, constante și funcții care iau doar două valori - unitate (în algebra logicii corespunde valorii TRUE) și zero

(în algebra logicii - FALS). Operațiile de bază ale algebrei booleene sunt, inversiune, conjuncţie disjuncție . Numele lor rusești sunt, respectiv, negare, înmulțire logică adaos logic . În caz contrar - operațiuni, NU, ŞI.

SAU

Notarea operațiilor logice ale algebrei booleene

A și B sunt afirmații logice.

Tabelele de adevăr sunt folosite pentru a reprezenta vizual și a efectua calcule logice.

Mai jos sunt tabelele de adevăr ale operațiilor logice de bază.

Inversiunea

Inversarea este o funcție a unui argument, care este afirmația logică A. Dacă A este fals, atunci  este adevărat și invers.

Conjuncția și disjuncția sunt funcții a două sau mai multe argumente. Rezultatul lor este o declarație logică complexă (compozită), care, în funcție de valorile argumentelor funcției, ia valoarea 1 sau 0. Tabelul de adevăr trebuie să includă toate combinațiile posibile de valori ale argumentului - logice simple sau complexe. declarații. Există 2 n astfel de combinații, unde n este numărul de argumente. În cel mai simplu caz, când operăm cu două afirmații logice A și B, tabelele de adevăr arată așa.

Conjuncție Disjuncție

Argumente

Rezultat

Argumente

Rezultat

Pentru un număr arbitrar de argumente, două reguli sunt adevărate.

1. Dacă printre argumente conjuncţii Dacă există cel puțin unul care ia întotdeauna valoarea 0 (FALSE), atunci rezultatul conjuncției, indiferent de valorile celorlalte argumente, este tot 0 (FALSE).

2. Dacă printre argumente disjuncții Dacă există cel puțin unul care ia întotdeauna valoarea 1 (TRUE), atunci rezultatul disjuncției, indiferent de valorile celorlalte argumente, este tot 1 (TRUE).

Următoarele tabele de adevăr confirmă aceste reguli.

Unele afirmații ale limbajului uman obișnuit pot fi comparate cu funcții logice. De exemplu, afirmația „Pentru a obține o notă excelentă la un examen necesită Cum disponibilitatea creditului de practică, deci si bună cunoaștere a materialului teoretic” corespunde conjuncției. Citat: „Pentru ca pielea ta să se bronzeze, trebuie să petreci câteva zile pe plajă, sub soarele fierbinte.” sau vizitați solarul de mai multe ori” reprezintă o disjuncție. Un alt exemplu de disjuncție: „Pentru a pierde în greutate, trebuie să muncești mai mult fizic și să mănânci mai puțin.” Să ilustrăm ultima afirmație cu un tabel de adevăr.

Enunțurile care reprezintă o conjuncție corespund de obicei construcției „ OŞiB», « CumO,deci siB», « Oîmpreună cuB"; reprezentând disjuncția – „ OsauB" Pot exista si exceptii: exemplu - discutat la final pagina anterioară oferi.

Constructii ca " sauO,sauB», « OsauB», « sauO,sauB» corespunde unei funcţii numite disjuncție strictă. Diferența sa față de o disjuncție obișnuită este că este egală cu 1 numai dacă valorile argumentelor sale sunt diferite. Denumirea disjuncției stricte este –A  B, celelalte denumiri ale acesteia sunt disparitate,exclusiv SAU (XOR în limbaje de programare), adiție modulo 2. Mai jos este tabelul de adevăr pentru disjuncția strictă.

Disjuncție strictă (neechivalență)

În algebra modernă a logicii, sunt definite încă două operații de bază - echivalenţăŞi implicare.

Echivalența (echivalența, echivalența) este o funcție opusă disjuncției stricte. Se evaluează la TRUE atunci când toate argumentele sale sunt fie adevărate, fie false. Denumirea sa: A  B.

Echivalență (echivalență)

Implicația este o funcție a două argumente logice. Denumirea sa este: A  B. Tabelul de adevăr al funcției „implicație” este următorul.

Implicare

Implicația poate fi exprimată prin operațiile de bază ale algebrei booleene: A  B = A  B.

În limbajele de programare, echivalentul corespunde funcției EQV, iar implicația - IMP.

Funcțiile „echivalență” și „implicație” pot fi, de asemenea, corelate cu declarații individuale ale limbii ruse. Echivalențe corespund afirmațiilor ca: „ O echivalent B» ; « O atunci și numai când B» ; « O necesar si suficient pentru B" Implicațiile corespund construcției: „ Dacă O, B» ; « B, Dacă O» ; « B necesar pentru O» ; « O suficient pentru B» ; « O numai când B» ; « B când O". Un exemplu clasic de implicare este expresia „Dacă plouă, atunci sunt nori pe cer”. Să notăm O= „Plouă” B= „Sunt nori pe cer” și creați un tabel de adevăr.

„Nu plouă, nu sunt nori pe cer” - o zi senină și însorită,

enunț compus adevărat

„Nu plouă, sunt nori pe cer” - o zi uscată și înnorată,

enunț compus adevărat

„Plouă, nu sunt nori pe cer” - acest lucru nu se întâmplă,

enunț compus fals

„Plouă, sunt nori pe cer” - o zi ploioasă înnorată,

enunț compus adevărat

Trebuie subliniat faptul că formalizarea enunțurilor în limbajul uman este foarte limitată. Cele mai multe fraze și propoziții ale limbii ruse, atât colocviale, cât și literare, nu sunt deloc afirmații din punctul de vedere al algebrei logicii. Acest lucru se datorează prezenței multor nuanțe de scris și vorbire care nu pot fi surprinse în cadrul logicii formale, cu colorarea emoțională și subiectivitatea judecăților, precum și faptului imuabil că există mult mai multe adevăruri relative în lume decât cele absolute. Prin urmare, experimentele de corelare a operațiunilor logicii formale cu enunțuri ale limbajului uman sunt aplicabile numai propozițiilor percepute fără ambiguitate care afirmă faptele cele mai generale și simple.

Deci, baza algebrei moderne a logicii sunt cinci operații logice de bază: inversare, conjuncție, disjuncție, implicație, echivalență. Toate celelalte operații pot fi exprimate prin combinații ale celor trei operații ale algebrei booleene: inversare, conjuncție și disjuncție.

Când se analizează enunțuri logice complexe, este necesar să ne amintim prioritatea operațiilor logice: în absența parantezelor, se efectuează mai întâi negația, apoi în ordinea descrescătoare a priorității sunt conjuncția, disjuncția strictă, disjuncția, implicația și, nu în ultimul rând, echivalenţă. Parantezele pot schimba această ordine.

În tehnologia digitală, microcircuitele construite pe elemente logice AND-NOT și NOR-NOT au devenit larg răspândite. Din punct de vedere tehnologic, acestea sunt implementate cel mai simplu. Au existat chiar și încercări de a construi computere care constau numai din aceste elemente. Cu ele sunt asociate încă două algebre binare – algebra Schaeffer și algebra Peirce. Operația ȘI-NU se numește „trăvire Schaeffer”, operația SAU-NU se numește „Săgeată Pierce”. Denumiri: A  B și, respectiv, A  B Din punctul de vedere al algebrei booleene, ambele operații sunt compuse.

A  B = A  B

A  B = A  B

Tabele de adevăr pentru aceste funcții:

Lovitura lui Schaeffer Arrow Peirce

Argumente

Rezultat

Argumente

Rezultat

Notații în tehnologia digitală.

Clasificarea măsurilor

Măsuri de informare

Formulare de adecvare a informațiilor

Adecvarea informaţiei poate fi exprimată în trei forme: semantică, sintactică, pragmatică.

Adecvarea sintactică. Afișează caracteristicile formale și structurale ale informațiilor și nu afectează conținutul semantic al acesteia. Pe nivel sintactic sunt luate în considerare tipul suportului și metoda de prezentare a informațiilor, viteza de transmitere și prelucrare, dimensiunea codurilor pentru reprezentarea acesteia, fiabilitatea și acuratețea conversiei acestor coduri etc punct de vedere sintactic se numește de obicei date, deoarece latura semantică nu contează.

Adecvarea semantică (noțională). Această formă determină gradul de corespondență dintre imaginea obiectului și obiectul însuși. Aspectul semantic presupune luarea în considerare a conținutului semantic al informației. La acest nivel se analizează informația pe care o reflectă informația și se iau în considerare conexiunile semantice. În informatică se stabilesc conexiuni semantice între codurile de reprezentare a informaţiei. Această formă servește la formarea conceptelor și ideilor, la identificarea sensului, conținutului informațiilor și generalizării acesteia.

Adecvarea pragmatică (consumator). reflectă relația dintre informație și consumatorul acesteia, corespondența informațiilor cu scopul de management, care este implementat pe baza acesteia. Proprietăți pragmatice informațiile apar numai dacă există unitate de informație (obiect), utilizator și scop de control. Aspectul pragmatic al considerației este asociat cu valoarea, utilitatea utilizării informațiilor atunci când consumatorul dezvoltă o soluție pentru a-și atinge scopul.

Pentru măsurarea informaţiei se introduc doi parametri: cantitatea de informaţie I şi cantitatea de date V. Aceşti parametri au expresii şi interpretări diferite în funcţie de forma de adecvare luată în considerare. Fiecare formă de adecvare corespunde propriei sale măsurători a cantității de informații și a volumului de date (Fig. 2.1).

Volumul datelor V d dintr-un mesaj este măsurat prin numărul de caractere (biți) din acest mesaj. În diferite sisteme de numere, o cifră are o greutate diferită și unitatea de măsură a datelor se modifică în consecință:

  • în sistemul numeric binar, unitatea de măsură este un bit (bit - cifră binară - cifră binară);
  • În sistemul numeric zecimal, unitatea de măsură este dit (locul zecimal).


Orez. 2.1. Măsuri de informare

Cantitatea de informații I la nivel sintactic nu poate fi determinat fără a lua în considerare conceptul de incertitudine a stării sistemului (entropia sistemului). Într-adevăr, obținerea de informații despre un sistem este întotdeauna asociată cu o modificare a gradului de ignoranță a destinatarului cu privire la starea acestui sistem. Să luăm în considerare acest concept.


Lăsați consumatorului să aibă câteva informații preliminare (a priori) despre sistem a înainte de a primi informații. Măsura ignoranței sale asupra sistemului este funcția H(a), care servește, în același timp, ca măsură a incertitudinii stării sistemului.

După ce a primit un mesaj b, destinatarul a dobândit ceva Informații suplimentare I b (a), care i-a redus ignoranța a priori astfel încât incertitudinea a posteriori (după primirea mesajului b) a stării sistemului a devenit H b (a).

Apoi cantitatea de informații I b (a) despre sistemul primită în mesajul b va fi determinată ca

I b (a) = H(a)-H b (a),

aceste. cantitatea de informaţie este măsurată printr-o modificare (reducere) a incertitudinii stării sistemului.

Dacă incertitudinea finală a sistemului H b (a) devine zero, atunci cunoștințele inițiale incomplete vor fi înlocuite cunoastere deplina iar cantitatea de informație I b (a) = H(a). Cu alte cuvinte, entropia sistemului H(a) poate fi privit ca o măsură a informațiilor lipsă.

Entropia unui sistem H(a) având N stări posibile, conform formulei lui Shannon, este egal cu

,

unde P i este probabilitatea ca sistemul să fie în starea i-a.

Pentru cazul în care toate stările sistemului sunt la fel de probabile, i.e. probabilitățile lor sunt egale cu P i = , entropia sa este determinată de relația

.

Adesea, informațiile sunt codificate cu coduri numerice într-unul sau altul sistem numeric, acest lucru este valabil mai ales atunci când se prezintă informații pe un computer. Desigur, același număr de cifre în sisteme diferite notația poate transmite un număr diferit de stări ale obiectului afișat, care poate fi reprezentat ca un raport

unde N este numărul tuturor stărilor posibile afișate;

m - baza sistemului numeric (varietatea de simboluri utilizate în alfabet);

n este numărul de biți (caractere) din mesaj.

Cele mai utilizate sunt logaritmii binari și zecimali. Unitățile de măsură în aceste cazuri vor fi bit și, respectiv, dit.

Coeficientul (gradul) conținutului informațional(concizia) unui mesaj este determinată de raportul dintre cantitatea de informații și cantitatea de date, adică

Y=1/V d și 0

Pe măsură ce Y crește, cantitatea de muncă necesară pentru a converti informațiile (date din sistem) scade. Prin urmare, se străduiesc să crească conținutul informațional, pentru care se dezvoltă metode speciale de codificare optimă a informațiilor.


Pentru a măsura conținutul semantic al informațiilor, i.e. cantitatea sa la nivel semantic, cea mai recunoscută este măsura tezaurului, care leagă proprietățile semantice ale informațiilor cu capacitatea utilizatorului de a accepta mesajul primit. În acest scop este folosit conceptul tezaur utilizator.

Tezaur este o colecție de informații disponibile unui utilizator sau unui sistem.

În funcție de relația dintre conținutul semantic al informației S și tezaurul utilizatorului S p , cantitatea de informație semantică I c percepută de utilizator și inclusă ulterior de acesta în tezaurul său se modifică. Natura acestei dependențe este prezentată în Fig. 2.2.



Orez. 2.2. Dependența cantității de informații semantice percepute de consumator

Să luăm în considerare două cazuri limitative când cantitatea de informație semantică I c
este egal cu 0:

  • când S p = 0, utilizatorul nu percepe sau înțelege informațiile primite;
  • cu S p ® ¥ utilizatorul știe totul și nu are nevoie de informațiile primite.

Consumatorul dobândește cantitatea maximă de informație semantică I c atunci când își coordonează conținutul semantic S cu tezaurul său S p (S p = S p opt), când informația primită este de înțeles utilizatorului și îl poartă necunoscut anterior (nu în tezaurul său). ) informații.

În consecință, cantitatea de informații semantice dintr-un mesaj, cantitatea de cunoștințe noi primite de utilizator, este o valoare relativă. Același mesaj poate avea conținut semnificativ pentru un utilizator competent și poate fi lipsit de sens (zgomot semantic) pentru un utilizator incompetent.

Atunci când se evaluează aspectul semantic (conținut) al informațiilor, este necesar să se depună eforturi pentru a armoniza valorile lui S și S p.

O măsură relativă a cantității de informații semantice poate fi coeficientul de conținut C, care este definit ca raportul dintre cantitatea de informații semantice și volumul acesteia:


Pentru măsurarea informaţiei se introduc doi parametri: cantitatea de informaţie I şi cantitatea de date V d.

Acești parametri au expresii și interpretări diferite în funcție de forma de adecvare luată în considerare.

Adecvarea sintactică. Afișează caracteristicile formale și structurale ale informațiilor și nu afectează conținutul semantic al acesteia. La nivel sintactic se ține cont de tipul de mediu și metoda de prezentare a informațiilor, viteza de transmitere și procesare, dimensiunea codurilor pentru prezentarea informațiilor, fiabilitatea și acuratețea conversiei acestor coduri etc.

Informația considerată doar dintr-o poziție sintactică se numește de obicei date, deoarece latura semantică nu contează.

Adecvarea semantică (noțională). Această formă determină gradul de corespondență dintre imaginea obiectului și obiectul însuși. Aspectul semantic presupune luarea în considerare a conținutului semantic al informației. La acest nivel se analizează informația pe care o reflectă informația și se iau în considerare conexiunile semantice. În informatică se stabilesc conexiuni semantice între codurile de reprezentare a informaţiei. Această formă servește la formarea conceptelor și ideilor, la identificarea sensului, conținutului informațiilor și generalizării acesteia.

Adecvarea pragmatică (consumator). Ea reflectă relația dintre informație și consumatorul acesteia, corespondența informațiilor cu scopul de management, care este implementat pe baza acesteia. Proprietățile pragmatice ale informațiilor apar numai dacă există unitate de informație (obiect), utilizator și scop de management.

Aspect pragmatic considerația este asociată cu valoarea, utilitatea utilizării informațiilor atunci când consumatorul dezvoltă o soluție pentru a-și atinge scopul. Din acest punct de vedere, sunt analizate proprietățile de consum ale informațiilor. Această formă de adecvare este direct legată de utilizarea practică a informației, de conformitatea acesteia cu funcția țintă a sistemului.

Fiecare formă de adecvare corespunde propriei sale măsurători a cantității de informații și a volumului de date (Fig. 2.1).

Orez. 2.1.

Măsuri de informare

2.2.1. Măsura sintactică a informațiilor Măsura sintactică

cantitatea de informații operează cu informații impersonale care nu exprimă o relație semantică cu obiectul.

  • Volumul de date V d dintr-un mesaj este măsurat prin numărul de caractere (biți) din acest mesaj. În diferite sisteme de numere, o cifră are o greutate diferită și unitatea de măsură a datelor se modifică în consecință:în sistemul de numere binar unitatea de măsură este bit ( pic
  • - cifra binara - cifra binara);

În sistemul numeric zecimal, unitatea de măsură este dit (locul zecimal).

Exemplu. Un mesaj din sistemul binar sub forma unui cod binar de opt biți 10111011 are un volum de date V d = 8 biți.

Un mesaj în sistemul zecimal sub forma unui număr de șase cifre 275903 are un volum de date de V d = 6 dit.

Cantitatea de informații este determinată de formula:

unde H (α) este entropia, i.e. cantitatea de informaţie este măsurată printr-o modificare (reducere) a incertitudinii stării sistemului.

Entropia unui sistem H (α), având N stări posibile, conform formulei lui Shannon, este egală cu:

unde p i este probabilitatea ca sistemul să fie în starea i-a.

Pentru cazul în care toate stările sistemului sunt la fel de probabile, entropia acestuia este determinată de relație

unde N este numărul tuturor stărilor posibile afișate;

m - baza sistemului numeric (varietatea de simboluri utilizate în alfabet);

n este numărul de biți (caractere) din mesaj.

Pentru a măsura conținutul semantic al informațiilor, i.e. cantitatea sa la nivel semantic, cea mai recunoscută este măsura tezaurului, care leagă proprietățile semantice ale informațiilor cu capacitatea utilizatorului de a accepta mesajul primit. În acest scop este folosit conceptul 2.2.2. Măsura semantică a informațiilor.

tezaurul utilizatorului

Un tezaur este o colecție de informații disponibile unui utilizator sau unui sistem.

  • În funcție de relația dintre conținutul semantic al informației S și tezaurul utilizatorului S p , cantitatea de informație semantică I c percepută de utilizator și inclusă ulterior de acesta în tezaurul său se modifică. Natura acestei dependențe este prezentată în Fig. 2.2:
  • când S p =0 utilizatorul nu percepe sau înțelege informațiile primite;

când S p → ∞ utilizatorul știe totul, nu are nevoie de informațiile primite.

Orez. 2.2.

Dependența cantității de informații semantice percepute de consumator de tezaurul său I с = f (S p)

Atunci când se evaluează aspectul semantic (conținut) al informațiilor, este necesar să se depună eforturi pentru a armoniza valorile lui S și S p.

Această măsură determină utilitatea informațiilor (valorii) pentru ca utilizatorul să își atingă scopul. Această măsură este, de asemenea, o valoare relativă, determinată de particularitățile utilizării informațiilor într-un anumit sistem. Este recomandabil să se măsoare valoarea informației în aceleași unități (sau aproape de acestea) în care se măsoară funcția obiectiv.

Pentru comparație, prezentăm măsurile de informații introduse în tabel. 2.1.

Tabelul 2.1. Unități de informare și exemple

Măsurarea informațiilor Unități de măsură Exemple (pentru domeniul computerului)
Sintactic:

se apropie de Shannon

abordare computerizată

Gradul de reducere a incertitudinii Probabilitatea evenimentului
Unități de prezentare a informațiilor Biți, octeți, KB etc.
Semantic Tezaur Pachetul de aplicații software, computer personal, rețele de calculatoare etc.
Indicatori economici Rentabilitatea, productivitatea, rata de amortizare etc.
Pragmatic Valoare de utilizare Valoarea monetară
Capacitatea memoriei, performanța computerului, viteza de transfer de date etc. Timp pentru procesarea informațiilor și luarea deciziilor