Aká je sila abecedy

Abeceda v informatike sa nazýva systém znakov, pomocou ktorého môžete odoslať informačnú správu. Aby sme pochopili podstatu tejto definície, uvádzame niekoľko ďalších teoretických faktov:

  • Všetky správy pozostávajú z abecedy. Tento článok je napríklad správou. Potom tvoria znaky n abecedy.
  • Pod symbolom môžeme porozumieť najmenej významnej časti abecedy. Aj nedeliteľné častice sa nazývajú atómy. Symboly v ruskej abecede sú "a", "b", "in" a tak ďalej.
  • Teoreticky abeceda nemusí byť už zakódovaná. Napríklad v tlačenej knihe znamenajú znaky v abecede, čo znamená, že nemajú žiadne kódovanie.
  • Ale v praxi máme nasledovné: počítač nechápe, čo sú písmená. Preto na prenos informačnej správy musí byť najskôr kódovaná v jazyku, ktorý je pre počítač pochopiteľný. Ak chcete prejsť ďalej, musíte zadať ďalšie výrazy.

    Aká je sila abecedy

    Pod mocou abecedy máme na mysli celkový počet znakov v nej. Ak chcete zistiť, akú moc abecedy, stačí počítať počet znakov v nej. Poďme pochopiť. Pre ruskú abecedu je síla abecedy 33 alebo 32 znakov, ak nepoužívate "e". Predpokladajme, že všetky symboly v našej abecede sú rovnako pravdepodobné. Tento predpoklad možno chápať ako: Predpokladajme, že máme vrece s podpísanýmikocky. Počet kociek v ňom je nekonečný a každý z nich je podpísaný iba s jedným znakom. Potom, rovnomerné rozloženie, ako sme sa dostať žiadne kocky z tašky, počet kociek s rôznymi znakmi bude rovnaký, bude usilovať o čo do činenia s rastúcou počet blokov, ktoré sme vytiahnuť z vrecka.

    Odhadovaná informácie Hmotnosť správy

    Takmer pred sto rokmi, americký inžinier Ralph Hartley odvodil vzorec môžete použiť na odhad množstvo informácií v správe. Jeho vzorec funguje rovnako pravdepodobných udalostí a vyzerá takto: i = log 2 m, kde som - počet nedeliteľných atómov informácií (bitov) v správe, "M" - sila abecedy. Poďme ďalej. Použitie matematických transformáciou môže určiť, že sila abecedy sa môže vypočítať nasledujúcim spôsobom:

    M = 2 i Táto rovnica definuje všeobecne vzťah medzi počtom rovnako pravdepodobných udalostí "M" a množstvo informácií, "i".

    Očakávame, že výkon

    Naopak, už viete z School Course, že v moderných počítačových systémov postavených na architektúre von Neumann používané binárne informácie kódovacieho systému. Kóduje aplikácie aj údaje. Aby ste mohli reprezentovať text vo výpočtovom systéme, použite jednotný kód osem číslic. Jednotný kód sa preto považuje za obsahujúci pevnú sadu prvkov - 0 a 1. Hodnoty v takomto kóde sú špecifikované určitým poradím týchto prvkov. S osmibitovým kódom môžeme kódovať správy o 256 bitoch podľa vzorcaHartley: M 8 = 2 8 = 256 bitov informácií. Takáto situácia s kódovaním binárneho kódu sa historicky vytvorila. Teoreticky by sme mohli použiť iné abecedy na zobrazovanie údajov. Napríklad v štvormiestnej abecede by každá postava mala hmotnosť nie jednu, ale dva bity, v osemcifernom - 3 bitoch a tak ďalej. Toto sa vypočíta pomocou vyššie uvedeného binárneho logaritmu (i = log 2 M).
    Vzhľadom na to abecedy kapacitou 256 bitov na označenie jedného znaku je daná osem bitov, bolo rozhodnuté zaviesť ďalšie opatrenia informácií - bytov. Jeden bajt obsahuje jeden znak tabuľky kódov ASCII a obsahuje osem bitov.

    Ako sa meria údaje

    Vosmibit Island kódovanie textových správ používané v kóde ASCII tabuľky, až základnej znakovej sady v Latinskej a cyrilika malými písmenami a rade verzií, čísel, interpunkčných znamienok a ďalších základných symbolov. Na meranie veľkých objemov dát používajte špeciálne predpony na bajty a bity. Takéto konzoly sú uvedené v nasledujúcej tabuľke:
    Mnoho ľudí, ktorí študovali fyziku namietnuť, že primerane by bolo použiť klasické konzoly pre indikáciu jednotiek informácií (ako kilo - a hrozne), ale to nie je úplne správne, pretože tieto predpony naznačovať hodnoty násobenie pre konkrétny stupeň desiatich, keď sa v informatike všade používa binárny systém meraní.

    Správne názvy jednotiek merania údajov

    S cieľom odstrániťnesprávnosti a nepríjemnosti, Medzinárodná komisia pre elektrotechniku ​​schválila v marci 1999 nové jednotky pre jednotky, ktoré sa používajú na určenie množstva informácií v elektronickom výpočte. Takéto predpony sú mebia, kibi, gibi, tebi, eksby, pety. Kým sa tieto jednotky ešte nedarí realizovať, je pravdepodobné, že na implementáciu tohto štandardu a na jeho rozšírenie je potrebný čas. Ako urobiť prechod z klasických jednotiek na novo schválené, môžete definovať v nasledujúcej tabuľke:

    Predpokladajme, že máme text obsahujúci znaky K. Potom pomocou abecedného prístupu môžete vypočítať množstvo informácií V, ktoré sú v ňom obsiahnuté. Bude sa rovnať výkonu výrobku abecedy na informačnú váhu jedného znaku v ňom. Podľa vzorca Hartley vieme, ako vypočítať množstvo informácií prostredníctvom binárneho logaritmu. Za predpokladu, že počet znakov v abecede je N a počet znakov v zázname informácií o správe je K, získame nasledujúci vzorec na výpočet objemu správy: V = K? log 2 N Abecedný prístup ukazuje, že objem informácií bude závisieť len od kapacity abecedy a veľkosti správ (tj počet znakov v ňom), ale nebude súvisieť so sémantickým obsahom pre osobu.

    Príklady výpočtu výkonu

    Triedy informatiky často dávajú úlohu nájsť silu abecedy, dĺžku správy alebo objem informácií. Tu je jedna z nasledujúcich úloh:"Textový súbor zaberá 11 kilobajtov voľného miesta na disku a obsahuje 11264 znakov. Určite silu abecedy tohto textového súboru." Aké riešenie bude možné vidieť na obrázku nižšie.
    Abeceda s kapacitou 256 znakov nesie iba 8 bitov informácií, ktoré sa v informatike nazývajú jeden byte. Bajt popisuje 1 znak tabuľky ASCII, čo, ak si myslíte, nie je veľa.

    Jeden byte - je to veľa alebo nie?

    Moderné dátové sklady Vzorové dátové centrá Google a Facebook obsahujú nie menej ako desiatky petabajtov informácií. Presné množstvo údajov je však ťažké vypočítať aj pre seba, pretože potom budete musieť zastaviť všetky procesy na serveroch a blízkym používateľom, aby ste mali prístup k záznamu a úpravám svojich osobných informácií.
    Ale aby sme si predstavili také nepredstaviteľné množstvo údajov, musíme jasne pochopiť, že všetko pozostáva z malých detailov. Je potrebné pochopiť, prečo je sila abecedy rovná (256) a koľko bitov obsahuje 1 bajt informácií (ako si spomínate, 8).

    Súvisiace publikácie