Regresia v programe Excel: rovnice, príklady. Lineárna regresia

Regresná analýza je štatistická metóda výskumu, ktorá umožňuje zobraziť závislosť jedného alebo iného parametra na jednej alebo viacerých nezávislých premenných. V období pred počítačom bolo jeho použitie pomerne náročné, najmä pokiaľ ide o veľké objemy údajov. Dnes, keď sa naučíte, ako vytvoriť regresiu v programe Excel, môžete vyriešiť zložité štatistické problémy doslova za pár minút. Nižšie sú uvedené konkrétne príklady z oblasti ekonomiky.

Typy regresie

Tento koncept bol zavedený do matematiky Francis Galton v roku 1886. Regresia sa stáva:
  • lineárna;
  • parabolický;
  • stupeň;
  • exponenciálne;
  • hyperbolické;
  • orientačné;
  • logaritmický.
  • Príklad 1

    Zvážte úlohu určiť závislosť počtu prepustených členov tímu od priemernej mzdy v 6 priemyselných podnikoch.


    Úlohy. Šesť spoločností analyzovalo priemernú mesačnú mzdu a počet zamestnancov, ktorí odišli na dôchodok. V tabuľkovej forme máme:




    A



    B









    1



    43) mzdy



    2





    58)




    1



    60
    73)

    4



    2



    3



    20



    45000 rubľov



    6



    4



    20



    50,000 rubľov



    7
    ,
    ,
    ,
    5



    15



    55,000 rubľov


    ,
    8
    ,
    ,
    ,
    6



    15



    60,000 rubľov

    na vymedzenie problému počtu prepustených pracovníkov priemernej mzdy o 6 spoločností regresnej model vyzerá rovnice Y = 0 + 1 x 1 ++ a kxk, kde xi sú ovplyvnené premennými, ai - regresnými koeficientmi, ak - počtom faktorov. Pre túto úlohu Y - opatrenia prepustil zamestnanca a ovplyvňujúce faktory - plat, ktoré označujú X.

    Využitie energie z tabuľkového procesora Excel ""

    regresnej analýzy v Exceli musí predchádzať použitie existujúcich tabuľkových dát vložených funkcií. Na tieto účely je však lepšie použiť veľmi užitočný doplnok "Balík analýz". Ak ju chcete aktivovať, potrebujete:


  • zo záložky Súbor prejdite na časť "Možnosti";
  • v okne vyberte riadok "Doplnky";
  • kliknite na tlačidlo "Choď" umiestnené nižšie, napravo od riadku "Správa".
  • začiarknite políčko vedľa názvu "Analysis package" a potvrďte svoje akcie kliknutím na "Ok".
  • Ak je všetko vykonané správne, zobrazí sa pravé tlačidlo na pravej strane karty Údaje umiestnené nad pracovným hárkom programu Excel.

    lineárna regresia v Exceli

    Teraz, keď je po ruke všetky potrebné nástroje na vykonanie virtuálnych ekonometrických výpočtov môžu začať riešiť náš problém. natoto:
  • kliknite na tlačidlo "Analýza dát";
  • V okne stlačte tlačidlo "Regresie"; Y (počet prepustených pracovníkov) a X (ich platy)
  • na karte, ktorá sa zobrazí zadať rozsah hodnôt;
  • potvrdíme naše akcie stlačením tlačidla "Ok".
  • V dôsledku toho program automaticky vyplní nový list stolového procesora s údajmi z regresnej analýzy. Venujte pozornosť! Program Excel dokáže nezávisle určiť miesto, ktoré uprednostňujete pre tento účel. Napríklad to môže byť rovnaké písmeno, ktoré obsahuje hodnoty Y a X, alebo dokonca novú knihu špeciálne určenú na ukladanie takýchto údajov.

    Analýza R-kvadrát regresia

    v dát Exceli získaných počas spracovania tohto príkladu sú nasledujúce:
    Najprv by ste mali venovať pozornosť hodnotemu štvorca R. Je to určujúci koeficient. V tomto príklade je R-kvadrát = 0755 (755%), tj odhadovaných parametrov modelu vysvetliť vzťah medzi uvažovaných parametrov do 755%. Čím vyššia je hodnota určovacieho koeficientu, zvolený model sa považuje za vhodnejší pre konkrétnu úlohu. Predpokladá sa, že je správne opisuje aktuálnu situáciu v hodnote R-kvadrát nad 08. V prípade, že R-kvadrát koeficient analýza Number 641428 ukazuje, ako je hodnota Y, ak sú všetky premenné xi modeloch pred nami obnulyatsya. Inými slovami, dá sa tvrdiť, že hodnoty analyzovaného parametra sú ovplyvnené inými faktormi, ktoré nie sú opísané v konkrétnom modeli. Ďalším faktorom -016285 umiestneným v bunke B18 je hmotnosťVplyv premenné X Y. To znamená, že priemerný plat pracovníkov v rámci modelov ovplyvnená počtom prepustených hmotnosti -016,285, že miera vplyvu pomerne malý. Znak "-" znamená, že koeficient má zápornú hodnotu. To je zrejmé, pretože každý vie, že vyššie mzdy v podniku, tým menej ľudí vyjadrili želanie ukončiť pracovnú zmluvu alebo odmietnuť.

    s viacerými regresie

    V tento termín odkazuje na komunikačné rovnice s niekoľkými nezávislými premennými tvoria: y = f (x 1 + x 2 + xm) +?, Kde y - výsledná premenná (závisle premenná) a x 1, x 2, xm sú atributové faktory (nezávislé premenné).

    Vyhodnotenie

    V viacnásobné regresie (MR) jeho pohybu, za použitia metódy najmenších štvorcov (OLS). Pri lineárnych rovniciach tvaru Y = a + b 1 x 1 ++ b m x m + Vybudujeme systém normálnych rovníc (pozri nižšie)
    Aby ste pochopili princíp metódy, zvážte dvojfaktorový prípad. Potom máme situáciu opísanú vzorcom
    Odtiaľto získame:
    kde? - je rozptyl zodpovedajúceho označenia, ktorý sa odráža v indexe. MNC sa použijú na rovnicu MR v štandardnej mierke. V tomto prípade získame rovnicu:
    , kde t y, t x 1 t xm - standartyzyruemыe Premenné, pre ktoré priemery sú 0; ? i - štandardizované regresné koeficienty a stredná štvorcová odchýlka - 1. Všimnite si, že všetky? aj v tomto prípade definovaný ako normalizované a tsentralyzyruemыe, takže ich porovnanie so sebou, je správny a platný. Okrem toho,Je prijaté vykonať odpočítanie faktorov, ktoré odmietajú tie, ktoré majú najmenšie hodnoty?

    Úlohy používajúce rovnicu lineárnej regresie

    Napríklad existuje tabuľka cenovej dynamiky pre konkrétny produkt N za posledných 8 mesiacov. Je potrebné rozhodnúť o vhodnosti nákupu jeho strany za cenu 1850 rubľov za tonu.





    , A
    ,
    ,
    ,
    , B



    C
    (198 )

    1



    číslo mesiaca



    meno mesiaca



    cena tovaru N



    2



    1



    , január



    , 1750 rubľov za tonu



    3



    2



    februára
    (242 )

    , 1755 rubľov za tonu



    4



    3



    marec



    1,767 rubľov za tonu



    , 5



    4

    (271 )
    apríl



    1760 rubľov z ton



    6
    ,
    ,
    ,
    5



    , môže



    , 1770 rubľov za tonu



    7
    ,
    ,
    ,
    6



    jún

    ,
    ,
    , 1790 rubľov za tonu


    ,
    8



    7



    júla



    1,810 rubľov za tonu



    , 9
    ,
    ,
    ,
    8


    ,
    auguste



    , 1.840 rubľov za tonu

















    , pre riešenie tohto problému v tabuľke "Excel" sú povinní používať IDOM ľudia prezentované vo vyššie uvedenom príklade nástroj "analýza dát". Ďalej vyberte sekciu Regresie a opýtajte saNastavenia. Musíme si uvedomiť, že do vstupného poľa intervalu Y »zaviedla rad hodnôt závislých premenných (v tomto prípade cenu tovaru v určitom mesiaci roka), a" Input interval X »- pre nezávislé (niekoľko mesiacov). Akcie potvrďte kliknutím na tlačidlo "Ok". Nový list (ak je tak uvedené) získame vašu regresie. Postaviť ho lineárna rovnica tvaru y = ax + b, kde ako parametre a a b sú koeficienty jednať reťazec s menom a číslom mesiace a faktorov riadok «Y-križovatke" s písmenom výsledkov regresnej analýzy. To znamená, že lineárnej regresnej rovnice (SD) Problém 3 je zapísaná ako: cena tovaru * N = 11714 + číslo 172754. mesiac alebo algebraický zápis y = x + 11 714 172 754

    Analýza

    Pri rozhodovaní, či získal dostatočnú lineárnej regresnej rovnice používa viac korelačné koeficienty (CCM) a stanovenie a kritérium Fisher a Studentovho testu. V tabuľke "uzavretý" regresné výsledky, ktoré pôsobia pod menami viac R R-kvadrát, F-štatistiky a t-štatistiky resp. CCM R poskytuje odhad pravdepodobnosti obmedzenosti komunikácie medzi nezávislých a závislých premenných. Jeho vysoká hodnota vykazujú silnú súvislosť medzi Premenná "počet mesiacov" a "N cena tovaru v rubľov za 1 tonu." Povaha tohto spojenia však zostáva neznáma. Štvorcový R2 Koeficient determinácie (RI) je numerická opis celkovom rozmedzí podiel a ukazuje, že šírenie časť experimentálnych dát, ktorá zodpovedá hodnotám závislej premennejlineárna regresná rovnica. Pri posudzovanom probléme sa táto hodnota rovná 848%, to znamená, že štatistické údaje s vysokým stupňom presnosti sú opísané prijatým SD. F-štatistika, tiež nazývaná Fisherovo kritérium, sa používa na vyhodnotenie významu lineárnej závislosti, vyvrátenie alebo potvrdenie hypotézy o jej existencii. Hodnota t-štatistiky (študentské kritérium) pomáha hodnotiť význam koeficientu pre neznámu alebo voľného člena lineárnej závislosti. Ak hodnota t kritéria & gt; t cr, potom sa hypotéza o bezvýznamnosti voľného člena lineárnej rovnice odmieta. V uvažovanom probléme pre bezplatného člena pomocou nástrojov programu Excel sa zistilo, že t = 16920903 a p = 289 E-12, tj máme nulovú pravdepodobnosť, že správna hypotéza o nevýznamnosti voľného termínu bude zamietnutá. Pre koeficient s neznámym t = 579405 a p = 0001158. Inými slovami, pravdepodobnosť odmietnutia správnej hypotézy o nevýznamnosti koeficientu pod neznámym je 012%. Možno teda tvrdiť, že získaná lineárna regresná rovnica je adekvátna.

    Účel nadobudnutia podielu

    Viacnásobná regresia v programe Excel sa vykonáva pomocou rovnakého nástroja na analýzu údajov. Zvážte konkrétny problém s aplikáciou. Vedenie spoločnosti "NNN" musí rozhodnúť o účelnosti nákupu 20% podiel v JSC "MMM". Náklady na balík (JV) sú 70 miliónov USD. Špecialisti na "NNN" zbierali údaje o podobných dohodách. Bolo rozhodnuté odhadnúť hodnotu podielu akcií podľa parametrov vyjadrených v%milióny amerických dolárov, ako:
  • Záväzky (VK);
  • ročný obrat (VO);
  • pohľadávky (VD);
  • hodnota fixných aktív (SOF).
  • Okrem toho je parameter nedoplatky spoločnosti (V3 P) tisíce amerických dolárov.

    Riešenia pre tabuľkový procesor Excel

    Najprv musíte zostaviť tabuľku výstupných údajov. Má nasledujúcu formu:
    Ďalej:
  • zavolajte okno "Analýza údajov";
  • vyberte časť "Regresia";
  • v okne "Input rozmedzí Y» zavedený rozsah závislej premennej stĺpci G;
  • na ikonu s červenou šípkou na pravej strane okna "Vstup intervale X» a uvoľniť rad hárku hodnoty stĺpca B, C, D a F.
  • Všimnite si položku, Nový list 'a tlačidlo, OK' , Získajte regresnú analýzu pre túto úlohu.

    Štúdia výsledky a závery

    "Collect" sa predstavil zaoblenými údaje zhora na liste Excelu, regresné rovnice: SP = 0103 + 0541 OFA * * VO - 0031 + 0405 * VK * VD 0691 * VZP - 265844. vo viac obvyklé matematickej forme môže byť zapísaný ako: y = 0103 * x1 + 0541 * x2 - 0031 * x3 + 0405 * x4 + x5 0691 * - 265 844 dáta pre JSC "MMM", uvedené v nasledujúcej tabuľke:
    ,
    , OFA, USD



    , VO, USD



    VK, USD



    VD, USD



    VšZP, USD



    spoločný podnik, USD



    1025

    ,
    ,
    , 5355
    ,
    ,
    ,
    , 452



    , 415



    , 2155
    ,
    ,
    ,
    , 6472
    ,
    tak, že je do regresnej rovnice získanejčíslo 6472 miliónov amerických dolárov. To znamená, že akcie spoločnosti "MMM" JSC by sa nemali kupovať, pretože ich hodnota v 70 miliónoch amerických dolárov je pomerne predražená. Ako vidíte, využitie tabuľky programu Excel a regresnej rovnice nám umožnili urobiť rozumné rozhodnutie o uskutočniteľnosti úplne konkrétnej transakcie. Teraz už viete, aký druh regresie je. Príklady v programe Excel, uvedené vyššie, vám pomôžu vyriešiť praktické problémy v oblasti ekonometrie.

    Súvisiace publikácie