Multivarijantni model korelacione i regresione analize. Korelaciona i regresijska analiza u Excelu: upute za izvršenje

Regresiona i korelaciona analiza - statističke metode istraživanja. Ovo su najčešći načini da se pokaže zavisnost parametra od jedne ili više nezavisnih varijabli.

U nastavku ćemo, koristeći konkretne praktične primjere, razmotriti ove dvije vrlo popularne analize među ekonomistima. Navest ćemo i primjer dobijanja rezultata kada se kombinuju.

Regresiona analiza u Excelu

Pokazuje uticaj nekih vrednosti (nezavisnih, nezavisnih) na zavisnu varijablu. Na primjer, kako broj ekonomski aktivnog stanovništva zavisi od broja preduzeća, plata i drugih parametara. Ili: kako strane investicije, cijene energije itd. utiču na nivo BDP-a.

Rezultat analize vam omogućava da odredite prioritete. I na osnovu glavnih faktora, predviđati, planirati razvoj prioritetnih oblasti, donositi upravljačke odluke.

Regresija se dešava:

  • linearni (y = a + bx);
  • parabolični (y = a + bx + cx 2);
  • eksponencijalni (y = a * exp(bx));
  • snaga (y = a*x^b);
  • hiperbolično (y = b/x + a);
  • logaritamski (y = b * 1n(x) + a);
  • eksponencijalni (y = a * b^x).

Razmotrite primjer izgradnje regresijskog modela u Excelu i interpretacije rezultata. Uzmimo linearni tip regresije.

Zadatak. U 6 preduzeća analizirana je prosječna mjesečna plata i broj zaposlenih koji su otišli. Potrebno je utvrditi zavisnost broja zaposlenih u penziji od prosječne plate.

Model linearne regresije ima sljedeći oblik:

Y \u003d a 0 + a 1 x 1 + ... + a k x k.

Gdje su a koeficijenti regresije, x su varijable koje utiču, a k je broj faktora.

U našem primjeru, Y je indikator radnika koji su dali otkaz. Faktor uticaja su plate (x).

Excel ima ugrađene funkcije koje se mogu koristiti za izračunavanje parametara modela linearne regresije. Ali dodatak Analysis ToolPak će to učiniti brže.

Aktivirajte moćan analitički alat:

Kada se aktivira, dodatak će biti dostupan na kartici Podaci.

Sada ćemo se direktno pozabaviti regresijskom analizom.



Prije svega, obraćamo pažnju na R-kvadrat i koeficijente.

R-kvadrat je koeficijent determinacije. U našem primjeru to je 0,755, odnosno 75,5%. To znači da izračunati parametri modela objašnjavaju odnos između proučavanih parametara za 75,5%. Što je veći koeficijent determinacije, to je model bolji. Dobro - iznad 0,8. Loše - manje od 0,5 (ovakva analiza se teško može smatrati razumnom). U našem primjeru - "nije loše".

Koeficijent 64,1428 pokazuje koliki će biti Y ako su sve varijable u modelu koji se razmatraju jednake 0. Odnosno, na vrijednost analiziranog parametra utiču i drugi faktori koji nisu opisani u modelu.

Koeficijent -0,16285 pokazuje težinu varijable X na Y. Odnosno, prosječna mjesečna plata u okviru ovog modela utiče na broj onih koji odustaju sa ponderom od -0,16285 (ovo je mali stepen uticaja). Znak “-” ukazuje na negativan uticaj: što je veća plata, to je manje odustajanja. Što je pošteno.



Korelaciona analiza u Excel-u

Korelaciona analiza pomaže da se utvrdi da li postoji veza između indikatora u jednom ili dva uzorka. Na primjer, između vremena rada mašine i troškova popravki, cijene opreme i trajanja rada, visine i težine djece itd.

Ako postoji veza, onda da li povećanje jednog parametra dovodi do povećanja (pozitivna korelacija) ili smanjenja (negativna) u drugom. Analiza korelacije pomaže analitičaru da utvrdi da li vrijednost jednog indikatora može predvidjeti moguću vrijednost drugog.

Koeficijent korelacije označava se r. Varira od +1 do -1. Klasifikacija korelacija za različita područja bit će različita. Kada je vrijednost koeficijenta 0, ne postoji linearna veza između uzoraka.

Razmislite kako koristiti Excel za pronalaženje koeficijenta korelacije.

Funkcija CORREL se koristi za pronalaženje uparenih koeficijenata.

Zadatak: Utvrditi postoji li veza između vremena rada tokarilice i troškova njenog održavanja.

Stavite kursor u bilo koju ćeliju i pritisnite dugme fx.

  1. U kategoriji "Statistički" odaberite funkciju CORREL.
  2. Argument "Niz 1" - prvi raspon vrijednosti - vrijeme mašine: A2: A14.
  3. Argument "Niz 2" - drugi raspon vrijednosti - cijena popravka: B2:B14. Kliknite OK.

Da biste odredili vrstu veze, potrebno je pogledati apsolutni broj koeficijenta (svako polje aktivnosti ima svoju skalu).

Za korelacione analize nekoliko parametara (više od 2) pogodnije je koristiti "Analizu podataka" (dodatak "Paket analize"). Na listi morate odabrati korelaciju i odrediti niz. Sve.

Dobijeni koeficijenti će biti prikazani u korelacionoj matrici. kao ovaj:

Korelaciono-regresiona analiza

U praksi se ove dvije tehnike često koriste zajedno.

primjer:


Sada su vidljivi podaci regresione analize.

Glavni cilj regresione analize sastoji se u određivanju analitičkog oblika odnosa, u kojem je promjena rezultantnog atributa posljedica utjecaja jednog ili više faktorskih znakova, a skup svih ostalih faktora koji također utiču na rezultantni atribut uzima se kao konstantne i prosječne vrijednosti. .
Zadaci regresione analize:
a) Utvrđivanje oblika zavisnosti. S obzirom na prirodu i oblik odnosa između pojava, razlikuju se pozitivna linearna i nelinearna i negativna linearna i nelinearna regresija.
b) Definisanje funkcije regresije u obliku matematičke jednačine ovog ili drugog tipa i utvrđivanje uticaja eksplanatornih varijabli na zavisnu varijablu.
c) Procjena nepoznatih vrijednosti zavisne varijable. Pomoću funkcije regresije možete reproducirati vrijednosti zavisne varijable unutar intervala datih vrijednosti varijabli koje objašnjavaju (tj. riješiti problem interpolacije) ili procijeniti tok procesa izvan navedenog intervala (tj. riješiti problem ekstrapolacije). Rezultat je procjena vrijednosti zavisne varijable.

Regresija para - jednačina odnosa dvije varijable y i x: , gdje je y zavisna varijabla (efektivni predznak); x - nezavisna, eksplanatorna varijabla (faktor karakteristika).

Postoje linearne i nelinearne regresije.
Linearna regresija: y = a + bx + ε
Nelinearne regresije se dijele u dvije klase: regresije koje su nelinearne u odnosu na eksplanatorne varijable uključene u analizu, ali linearne u odnosu na procijenjene parametre, i regresije koje su nelinearne u odnosu na procijenjene parametre.
Regresije koje su nelinearne u eksplanatornim varijablama:

Regresije koje su nelinearne u smislu procijenjenih parametara: Izgradnja regresione jednačine se svodi na procjenu njenih parametara. Za procjenu parametara regresije koji su linearni po parametrima, koristi se metoda najmanjih kvadrata (LSM). LSM omogućava da se dobiju takve procjene parametara pod kojima je zbroj kvadrata odstupanja stvarnih vrijednosti rezultirajuće karakteristike y od teorijskih minimalan, tj.
.
Za linearne i nelinearne jednadžbe koje se svode na linearne, sljedeći sistem je riješen za a i b:

Možete koristiti gotove formule koje slijede iz ovog sistema:

Bliskost veze između proučavanih pojava procjenjuje se linearnim koeficijentom korelacije parova za linearnu regresiju:

i indeks korelacije - za nelinearnu regresiju:

Ocjenu kvaliteta izgrađenog modela dat će koeficijent (indeks) determiniranosti, kao i prosječna greška aproksimacije.
Prosječna greška aproksimacije je prosječno odstupanje izračunatih vrijednosti od stvarnih:
.
Dozvoljena granica vrijednosti - ne više od 8-10%.
Prosječni koeficijent elastičnosti pokazuje za koliko procenata će se u prosjeku rezultat y promijeniti od svoje prosječne vrijednosti kada se faktor x promijeni za 1% od svoje prosječne vrijednosti:
.

Zadatak analize varijanse je analizirati varijansu zavisne varijable:
,
gdje je ukupan zbir kvadrata odstupanja;
- zbir kvadrata odstupanja zbog regresije („objašnjeno“ ili „faktorsko“);
- rezidualni zbir kvadrata odstupanja.
Udio varijanse objašnjene regresijom u ukupnoj varijansi efektivne karakteristike y karakterizira koeficijent (indeks) determinacije R2:

Koeficijent determinacije je kvadrat koeficijenta ili indeksa korelacije.

F-test - evaluacija kvaliteta regresione jednačine - sastoji se u testiranju hipoteze Ali o statističkoj beznačajnosti regresione jednačine i indikatora bliskosti veze. Za to se vrši poređenje stvarne F činjenice i kritične (tabelarne) F tablice vrijednosti Fisherovog F-kriterija. F činjenica se utvrđuje iz omjera vrijednosti faktorijalne i rezidualne varijanse izračunate za jedan stepen slobode:
,
gdje je n broj jedinica stanovništva; m je broj parametara za varijable x.
F tabela je maksimalna moguća vrijednost kriterijuma pod uticajem slučajnih faktora za date stepene slobode i nivo značajnosti a. Nivo značajnosti a - vjerovatnoća odbacivanja tačne hipoteze, pod uslovom da je tačna. Obično se a uzima jednakim 0,05 ili 0,01.
Ako je F tabela< F факт, то Н о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F табл >F je činjenica, tada se hipoteza H o ne odbacuje i priznaje se statistička beznačajnost, nepouzdanost jednačine regresije.
Za procjenu statističke značajnosti koeficijenata regresije i korelacije, izračunava se Studentov t-test i intervali povjerenja za svaki od indikatora. Postavlja se hipoteza H o slučajnoj prirodi indikatora, tj. o njihovoj neznatnoj razlici od nule. Procjena značajnosti koeficijenata regresije i korelacije pomoću Studentovog t-testa vrši se poređenjem njihovih vrijednosti sa veličinom slučajne greške:
; ; .
Slučajne greške parametara linearne regresije i koeficijenta korelacije određene su formulama:



Upoređujući stvarne i kritične (tabelarne) vrijednosti t-statistike - t tabl i t fact - prihvatamo ili odbacujemo hipotezu H o.
Odnos između Fišerovog F-testa i Studentove t-statistike izražava se jednakošću

Ako t tabela< t факт то H o отклоняется, т.е. a, b и не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если t табл >t činjenica da se hipoteza H o ne odbacuje i da se prepoznaje slučajna priroda formiranja a, b ili.
Da bismo izračunali interval pouzdanosti, određujemo marginalnu grešku D za svaki indikator:
, .
Formule za izračunavanje intervala povjerenja su sljedeće:
; ;
; ;
Ako nula spada u granice intervala povjerenja, tj. Ako je donja granica negativna, a gornja pozitivna, tada se pretpostavlja da je procijenjeni parametar nula, jer ne može istovremeno poprimiti i pozitivne i negativne vrijednosti.
Predviđena vrijednost se određuje zamjenom odgovarajuće (prognozirane) vrijednosti u regresionu jednačinu. Prosječna standardna greška prognoze se izračunava:
,
gdje
a gradi se interval pouzdanosti prognoze:
; ;
gdje .

Primjer rješenja

Zadatak broj 1. Za sedam teritorija Uralske regije Za 199X poznate su vrijednosti dva znaka.
Tabela 1.
Obavezno: 1. Da biste okarakterizirali ovisnost y od x, izračunajte parametre sljedećih funkcija:
a) linearni;
b) zakon stepena (prethodno je potrebno izvršiti postupak linearizacije varijabli uzimanjem logaritma oba dijela);
c) demonstrativna;
d) jednakostranična hiperbola (također morate smisliti kako unaprijed linearizirati ovaj model).
2. Procijenite svaki model kroz srednju grešku aproksimacije i Fišerov F-test.

Rješenje (opcija #1)

Za izračunavanje parametara a i b linearne regresije (izračun se može obaviti pomoću kalkulatora).
riješiti sistem normalnih jednačina u odnosu na a i b:
Na osnovu početnih podataka izračunavamo :
y x yx x2 y2 A i
l 68,8 45,1 3102,88 2034,01 4733,44 61,3 7,5 10,9
2 61,2 59,0 3610,80 3481,00 3745,44 56,5 4,7 7,7
3 59,9 57,2 3426,28 3271,84 3588,01 57,1 2,8 4,7
4 56,7 61,8 3504,06 3819,24 3214,89 55,5 1,2 2,1
5 55,0 58,8 3234,00 3457,44 3025,00 56,5 -1,5 2,7
6 54,3 47,2 2562,96 2227,84 2948,49 60,5 -6,2 11,4
7 49,3 55,2 2721,36 3047,04 2430,49 57,8 -8,5 17,2
Ukupno 405,2 384,3 22162,34 21338,41 23685,76 405,2 0,0 56,7
sri vrijednost (Ukupno/n) 57,89 54,90 3166,05 3048,34 3383,68 X X 8,1
s 5,74 5,86 X X X X X X
s2 32,92 34,34 X X X X X X


Regresijska jednadžba: y= 76,88 - 0,35X. Uz povećanje prosječne dnevne plaće za 1 rub. udio izdataka za kupovinu prehrambenih proizvoda smanjen je u prosjeku za 0,35% poena.
Izračunajte linearni koeficijent korelacije parova:

Komunikacija je umjerena, obrnuta.
Definirajmo koeficijent determinacije:

Varijacija rezultata od 12,7% objašnjava se varijacijom faktora x. Zamjena stvarnih vrijednosti u jednadžbu regresije X, odrediti teorijske (izračunate) vrijednosti . Pronađite vrijednost prosječne greške aproksimacije:

U prosjeku, izračunate vrijednosti odstupaju od stvarnih za 8,1%.
Izračunajmo F-kriterijum:

od 1< F < ¥ , treba uzeti u obzir F -1 .
Rezultirajuća vrijednost ukazuje na potrebu prihvaćanja hipoteze Ali oh slučajna priroda otkrivene zavisnosti i statistička beznačajnost parametara jednačine i indikatora nepropusnosti veze.
1b. Izgradnji energetskog modela prethodi postupak linearizacije varijabli. U primjeru, linearizacija se vrši uzimanjem logaritma obje strane jednačine:


gdjeY=lg(y), X=lg(x), C=lg(a).

Za proračune koristimo podatke u tabeli. 1.3.

Tabela 1.3

Y X YX Y2 x2 A i
1 1,8376 1,6542 3,0398 3,3768 2,7364 61,0 7,8 60,8 11,3
2 1,7868 1,7709 3,1642 3,1927 3,1361 56,3 4,9 24,0 8,0
3 1,7774 1,7574 3,1236 3,1592 3,0885 56,8 3,1 9,6 5,2
4 1,7536 1,7910 3,1407 3,0751 3,2077 55,5 1,2 1,4 2,1
5 1,7404 1,7694 3,0795 3,0290 3,1308 56,3 -1,3 1,7 2,4
6 1,7348 1,6739 2,9039 3,0095 2,8019 60,2 -5,9 34,8 10,9
7 1,6928 1,7419 2,9487 2,8656 3,0342 57,4 -8,1 65,6 16,4
Ukupno 12,3234 12,1587 21,4003 21,7078 21,1355 403,5 1,7 197,9 56,3
Zlo 1,7605 1,7370 3,0572 3,1011 3,0194 X X 28,27 8,0
σ 0,0425 0,0484 X X X X X X X
σ2 0,0018 0,0023 X X X X X X X

Izračunajte C i b:


Dobijamo linearnu jednačinu: .
Njegovim potenciranjem dobijamo:

Zamjena u ovoj jednačini stvarnih vrijednosti X, dobijamo teorijske vrijednosti rezultata. Na osnovu njih izračunavamo indikatore: čvrstoću veze - indeks korelacije i prosječnu grešku aproksimacije

Karakteristike modela snage pokazuju da on opisuje odnos nešto bolje od linearne funkcije.

1c. Konstrukcija jednadžbe eksponencijalne krive

kojoj prethodi procedura za linearizaciju varijabli kada se uzima logaritam oba dijela jednačine:

Za proračune koristimo podatke iz tabele.

Y x Yx Y2 x2 A i
1 1,8376 45,1 82,8758 3,3768 2034,01 60,7 8,1 65,61 11,8
2 1,7868 59,0 105,4212 3,1927 3481,00 56,4 4,8 23,04 7,8
3 1,7774 57,2 101,6673 3,1592 3271,84 56,9 3,0 9,00 5,0
4 1,7536 61,8 108,3725 3,0751 3819,24 55,5 1,2 1,44 2,1
5 1,7404 58,8 102,3355 3,0290 3457,44 56,4 -1,4 1,96 2,5
6 1,7348 47,2 81,8826 3,0095 2227,84 60,0 -5,7 32,49 10,5
7 1,6928 55,2 93,4426 2,8656 3047,04 57,5 -8,2 67,24 16,6
Ukupno 12,3234 384,3 675,9974 21,7078 21338,41 403,4 -1,8 200,78 56,3
sri zn. 1,7605 54,9 96,5711 3,1011 3048,34 X X 28,68 8,0
σ 0,0425 5,86 X X X X X X X
σ2 0,0018 34,339 X X X X X X X

Vrijednosti parametara regresije A i AT iznosio:


Dobija se linearna jednačina: . Dobivenu jednačinu potenciramo i zapišemo je u uobičajenom obliku:

Bliskost veze procjenjujemo kroz indeks korelacije:

U stvarnosti, po pravilu, na efektivno svojstvo ne utiče jedan faktor, već mnogo različitih faktora koji istovremeno deluju. Dakle, jedinični trošak proizvodnje zavisi od količine proizvedenih proizvoda, nabavne cijene sirovina, plata radnika i njihove produktivnosti, režijskih troškova.

Kvantifikovati uticaj različitih faktora na rezultat, odrediti oblik i bliskost odnosa između efektivnog obeležja at i faktorskih znakova x it x 2,...» X* možeš koristiti multivarijantna regresijska analiza, koji se svodi na rješavanje sljedećih problema:

  • - izrada višestruke regresijske jednačine;
  • - utvrđivanje stepena uticaja svakog faktora na efektivno obeležje;
  • - kvantitativna procjena čvrstoće odnosa između efektivne karakteristike i faktora;
  • - procjena pouzdanosti konstruisanog regresijskog modela;
  • - prognoza efektivne karakteristike.

Jednačina višestruka regresija karakteriše prosječnu promjenu at sa promjenom dva ili više znakova-faktora: at= /(lg str xvxk).

Prilikom odabira karakteristika-faktora uključenih u jednadžbu višestruke regresije, prije svega se moraju uzeti u obzir matrice koeficijenata korelacije i odabrati one varijable za koje je korelacija sa rezultirajućom varijablom veća od korelacije sa drugim faktorima, tj. za koje je nejednakost

objašnjavajuće varijable koje su usko povezane jedna s drugom: kada G > 0,7

Y "j

varijable i X ) dupliraju jedni druge, a njihovo uključivanje u jednadžbu regresije ne daje dodatne informacije za objašnjenje varijacije y. Linearno povezane varijable se pozivaju kolinearno.

Preporučljivo je uključiti u krug varijabli objašnjenja znakove predstavljene kao apsolutne i kao prosječne ili relativne vrijednosti. Karakteristike koje su funkcionalno povezane sa zavisnom varijablom ne mogu se uključiti u regresiju. at, na primjer, one koje su dio at(recimo, ukupni prihodi i plate).

Najjednostavnija za konstrukciju i analizu je linearna jednadžba višestruke regresije:

Interpretacija koeficijenata regresije linearne jednadžbe višestruke regresije je sljedeća: svaki od njih pokazuje za koliko jedinica se prosjek mijenja at kada se mijenja.g, vlastitom mjernom jedinicom i fiksira druge varijable koje se objašnjavaju uvedene u jednačinu na prosječnom nivou.

Pošto su sve uključene varijable x x imaju svoju dimenziju, a zatim uporedite koeficijente regresije b ( nemoguće je, tj. u veličini b x ne može se zaključiti da jedna varijabla jače utiče na r/, a druga manje.

Parametri linearne višestruke regresijske jednačine procjenjuju se metodom najmanjih kvadrata (LSM). LSM uvjet: ili

Uslov ekstremuma funkcije je jednakost nuli parcijalnih izvoda prvog reda ove funkcije:

Odavde dobijamo sistem normalnih jednadžbi čije rešenje daje vrednosti parametara jednačine višestruke regresije:


Kada pišete sistem jednadžbi, možete se voditi sljedećim jednostavnim pravilom: prva jednačina se dobija kao zbir P regresijske jednačine; drugi i sljedeći - kao zbir P jednadžbe regresije, čiji su svi članovi pomnoženi sa tada x 2 itd.

Parametri jednačine višestruke regresije dobijaju se omjerom parcijalnih determinanti i determinante sistema:

Razmotrimo konstrukciju jednadžbe višestruke regresije na primjeru linearnog dvofaktorskog modela:

Predstavimo sve varijable kao centrirane i normalizovane, tj. izraženo kao odstupanja od srednje vrijednosti, podijeljena sa standardnom devijacijom. Ovako transformisane varijable označimo slovom t

Tada će jednadžba višestruke regresije imati sljedeći oblik:

gdje je p t i p 2 - standardizovani koeficijenti regresije(bs ga-koeficijenti), koji određuju za koji će se dio njegove standardne devijacije promijeniti at kada se promeni Xj jedno standardno odstupanje.

Regresijska jednačina(8.20) se zove jednadžba na standardiziranoj skali(ili standardizovana jednačina regresije). Nema slobodnog termina, jer su sve varijable izražene u vidu odstupanja od prosječnih vrijednosti, a kao što je poznato, a = y-b ( x x -b 2 x 2 ili u k objašnjavajuće varijable

Za razliku od koeficijenata regresije prirodne skale bp koji se ne mogu porediti, standardizovani koeficijenti regresije P; može se porediti, donoseći zaključak o uticaju kog faktora na at značajnije.

Standardizirani koeficijenti regresije također se nalaze korištenjem metode najmanjih kvadrata:

Prve parcijalne izvode izjednačavamo sa nulom i dobijamo sistem normalnih jednačina

Zbog


Sistem se može napisati drugačije:


Odavde nalazimo p-koeficijente i upoređujemo ih. Ako je P,> P 2, tada faktor Xj ima jači učinak na rezultat od faktora x 2 .

Od standardizovane regresije se može preći na regresionu jednačinu prirodne skale, tj. dobiti regresiju

Koeficijenti regresije prirodne skale zasnovani su na ^-koeficijentima:

Nakon toga se izračunava kumulativni koeficijent determinacije:

koji pokazuje proporciju varijacije rezultujuće osobine pod uticajem proučavanih faktorskih osobina. Važno je znati doprinos svake eksplanatorne varijable. Mjeri se koeficijentom odvojene determinacije:

Utjecaj pojedinačnih faktora u jednadžbi višestruke regresije može se okarakterizirati korištenjem parcijalnih koeficijenata elastičnosti. U slučaju linearne regresije s dva faktora, koeficijenti elastičnosti se izračunavaju prema formulama i mjere u postocima:

Analizirali smo tehniku ​​konstruisanja jednačine višestruke regresije. Očigledno je da se procjene parametara regresione jednadžbe mogu dobiti samo pomoću mikrokalkulatora. U savremenim uslovima, konstrukcija regresije i izračunavanje korelacionih indikatora vrši se korišćenjem računara i paketa aplikacija kao što su Excel ili specijalizovaniji: Statgraphics ili Statistica itd.

Da biste izgradili jednadžbu višestruke regresije koristeći Microsoft Office Excel, trebate koristiti alat za analizu podataka regresije. Radnje se izvode slično izračunavanju parametara uparene linearne regresije, o kojoj se raspravljalo gore, samo za razliku od uparene regresije kada se popunjava parametar ulaznog intervala X u dijaloškom okviru treba navesti sve kolone koje sadrže vrijednosti faktorskih karakteristika.

Razmotrimo konstrukciju jednačine višestruke regresije sa dvije objašnjavajuće varijable (model sa dva faktora). Nastavljajući primjer, uvedemo drugi faktor – vrijeme koje student provede tokom sedmice da bi zaradio novac, u satima. Podaci su prikazani u tabeli. 8.5.

Tablica proračuna

Tabela 8.5

Studentski broj

(y-y) 2

(I- y) 2

Tabela 8.6

Regresiona analiza izvedena na dvosmjernom modelu koristeći Microsoft Office Excel

ODDRICANJE ODGOVORNOSTI

Statistika regresije

Višestruko R

Ja sam kvadrat

Normalizovan I-kvadrat

standardna greška

Zapažanja

Analiza varijanse

Značaj F

Regresija

Koeficijent s

Standard

greška

t-statistika

p-vrijednost

donjih 95%

Top 95%

Y-raskrsnica

  • 1. Unesimo početne podatke u Excel tabelu, kao što je opisano u paragrafu 8.3.
  • 2. Koristimo alat za analizu podataka regresije.

Dobijeni rezultati prikazani su u tabeli. 8.6.

Kao što slijedi iz finalnog stola. 8.6, jednačina regresije ima sljedeći oblik:

F= 25; značaj F= 0,002, tj. šansa za grešku je mala.

Prema regresiji, rezultat ispita će se povećati u prosjeku za 0,058 bodova uz povećanje bodova prikupljenih po semestru za jedan bod kada je druga eksplanatorna varijabla fiksirana na prosječnom nivou; ocjena ispita će se smanjiti u prosjeku za 0,026 bodova uz povećanje vremena utrošenog na zaradu za jedan sat kada je faktor fiksiran X na srednjem nivou.

3. Pređimo na jednadžbu na standardiziranoj skali. Da bismo to učinili, definiramo 0-koeficijente;

Matrica parnih koeficijenata korelacije varijabli može se izračunati pomoću alata za analizu podataka o korelaciji. Za ovo:

  • 1) izaberite Podaci -> Analiza podataka -> Korelacija;
  • 2) popuniti dijaloški okvir za unos podataka i izlazne parametre.

Rezultati proračuna su prikazani u tabeli. 8.7.

Tabela 8.7

Matrica koeficijenata korelacije parova


Dobio sam standardiziranu jednadžbu regresije

Budući da |P,|>|P 2 1» m0 faktor x i(zbir akumuliranih bodova za semestar) jače utiče na rezultat (ispitnu ocjenu) od faktora x 2(vrijeme koje student provede tokom sedmice da bi zaradio novac). Imajte na umu da je odnos između rezultata at i faktor x 2 suprotno: što više vremena student potroši da zaradi novac, to je niža ocjena na ispitu.

  • 4. Ukupni koeficijent determinacije se utvrđuje iz regresijska statistika(Tabela 8.6): R2= 0,911, tj. 91,1% varijacije mogućeg rezultata na ispitu zavisi od varijacije trenutnih bodova prikupljenih tokom semestra i varijacije vremena koje student tokom sedmice provede na zaradi.
  • 5. Naći koeficijente odvojene determinacije:


Tako se 72,3% varijacije u ocjenama na ispitima objašnjava varijacijom trenutnih bodova prikupljenih tokom semestra, a 18,8% se objašnjava vremenom utrošenim na zarade tokom sedmice. Zbir koeficijenata odvojene determinacije jednak je R2.

6. Izračunajte parcijalne linearne koeficijente elastičnosti:


To znači da sa povećanjem bodova sakupljenih po semestru za 1% od njihovog prosječnog nivoa, ispitna ocjena se povećava za 10,97% svog prosječnog nivoa, uz povećanje vremena za zaradu za 1% njegove prosječne vrijednosti, rezultat se smanjuje za 0,07%. Očigledno je da je jačina uticaja faktora x x jači od faktora x 2 . Slične zaključke o jačini veze dobili smo poređenjem P-koeficijenata.

7. Izračunajte očekivanu ocjenu koju će student dobiti na ispitu, ako je zbir bodova prikupljenih tokom semestra (n,) 85, i vrijeme koje je student u sedmici potrošio da zaradi (x 2) je 5 sati. Koristimo rezultirajuću regresijsku jednadžbu u prirodnoj skali:

Dakle, očekivana ocjena ispita je četiri boda.

Pošaljite svoj dobar rad u bazu znanja je jednostavno. Koristite obrazac ispod

Studenti, postdiplomci, mladi naučnici koji koriste bazu znanja u svom studiranju i radu biće vam veoma zahvalni.

Objavljeno na http://site

Multivarijantni model korelacije-regresije anaLisa

Uz pomoć korelaciono-regresijske analize moći ćemo utvrditi dinamiku vrijednosti nekretnina, te utjecaj pojedinih faktora na vrijednost nekretnine, kao i utvrditi koji od ovih faktora imaju najveći uticaj na vrijednost nekretnine.

Sistem faktora se uvijek formira u fazi logičke analize. Specifična konstrukcija modela vrši se na osnovu prikupljenih početnih informacija sa kvantitativnim procjenama faktora.

Indikatori uključeni u statistički model moraju biti kvalitativno homogeni, nezavisni jedan od drugog, dovoljni u smislu broja mjerača za statističku valjanost rezultata regresione analize. Broj mjerenja bi trebao biti veći od broja faktora najmanje 2 puta.

Faze rada:

1. Unos početnih podataka;

2. Proračun korelacijske matrice;

3. Odrediti kolinearnost;

4. Odrediti parametre regresione jednačine;

5. Analiza faktora prema koeficijentu elastičnosti;

6. Procjena parametara regresione jednadžbe;

7. Procijeniti značaj indikatora bliskosti veze r;

8. Procjena značajnosti koeficijenta determinacije R 2 ;

9. Intervali povjerenja za koeficijente regresione jednačine;

10. Intervali povjerenja za prosječne vrijednosti predznaka faktora;

11. Autokorelacija

Primjer izračuna

1. Unos početnih podataka

U fazi logičke analize formiramo sistem funkcionalnih indikatora.

Prilikom izgradnje multifaktorskog modela za predviđanje vrijednosti nekretnine, mogu se uključiti sljedeći faktori:

Znak rezultata: Y - vrijednost nekretnine, $;

Znakovi faktora:

X 1 - cijena jednog kvadratnog metra objekta, $;

X 2 - kurs;

X 3 - nivo prihoda stanovništva, $;

X 4 - društveno-politička situacija, bodovi;

X 5 - infrastruktura, punktovi;

X 6 - stanje objekta, popravka, bodovi;

X 7 - broj telefona, komada;

X 8 - broj telefona

Budući da je za statističku analizu potrebno uvesti faktore za određeni vremenski period, sastavili smo tabelu ovih faktora za nekoliko posmatranja tokom 10 godina, koja je predstavljena u nastavku:

2. Proračun korelacijske matrice

Unesimo sastavljenu matricu u Excel. Koristeći dodatak Analiza podataka u meniju Alati, izračunavamo matricu korelacije. Da biste to učinili, u prozoru "Analiza podataka" koji se pojavi, u polju "Alati za analizu" aktivirajte liniju "Korelacija". U prozoru "Korelacija" ući ćemo u interval unosa, birajući mišem kolone i redove izvorne tabele, uključujući naslove (osim kolone godina); postavite zastavicu na “Labels in the first line”; zatim u polju "Izlazni interval" označavamo gornju lijevu ćeliju, počevši od koje treba da se pojavi matrica rezultata - matrica korelacije.

Korelaciona matrica:

Korelaciona matrica - simetrična matrica, u kojoj se u odnosu na glavnu dijagonalu, na preseku i-tog reda i j-te kolone, nalaze parni koeficijenti korelacije između i-og i j-tog faktora. Koeficijenti na glavnoj dijagonali su 1.

Zadnji red matrice korelacije sadrži koeficijente parne korelacije između faktora i rezultirajućih karakteristika.

S obzirom na to, za r< 0 связь обратная, при r >0 - direktna veza.

Analizirajući prvi stupac korelacijske matrice, biramo faktore koji utječu na rezultirajući atribut.

Ako je koeficijent korelacije, onda je veza između i-tog faktora i rezultirajuće karakteristike bliska, onda ovaj faktor utiče na prosječnu mjesečnu platu i ostaje u modelu. U skladu s tim ispisujemo odgovarajuće koeficijente korelacije:

zaključak: Analiza posljednje linije korelacijske matrice pokazuje da su faktori X2, X4, X5, X6, X8 isključeni iz modela, kao koeficijent korelacije, a faktori X1, X3, X7 ostaju u ovom modelu za dalje razmatranje.

3 . Definicija kolinearnosti

Kolinearnost je odnos između faktora. Odnos između faktora i rezultirajućih karakteristika treba da bude bliži od odnosa između samih faktora, to jest, za bilo koji par odabranih faktora, odnos treba da ispunjava:

Ako su relacije ovog sistema zadovoljene, onda oba faktora ostaju u modelu. Ako omjeri nisu ispunjeni, tada se jedan od faktora mora isključiti iz modela. Obično se isključuju faktori sa nižim koeficijentom korelacije, čija je zavisnost od rezultante manja. Ali prilikom uklanjanja faktora u svakom konkretnom zadatku, potrebno je sagledati semantički sadržaj faktora. Formalni pristup nije prihvatljiv.

Određujemo kolinearnost između faktora:

uslov je ispunjen, oba faktora ostaju u modelu;

uslov nije ispunjen, faktor X 7 je isključen, pošto;

zaključak: Dakle, kao rezultat analize, za kompilaciju predviđene funkcije ostavljamo faktor X 1 , X 3 . Tada jednačina regresije ima sljedeći oblik:

Y =a 0 + a 1 x 1 + a 2 x 3

4 . Određivanje parametara regresijske jednačine.

U radnom prostoru Excela, koristeći naredbu za kopiranje, kreirat ćemo novu tablicu s početnim podacima iz preostalih faktora i pronaći prosječne vrijednosti po stupcima:

Da bismo riješili rezultirajuću jednadžbu regresije, nakon aktiviranja servisnog programa Data Analysis u meniju Servis, koristićemo alat za analizu - Regresija. U ovom dijaloškom okviru, koristite miša da unesete interval unosa Y i X-s; postavite zastavu na Oznake; odredite početnu ćeliju za izlazni interval i potvrdite početak proračuna tipkom OK. U trećoj od rezultujućih tabela SAŽETKA, nalazimo koeficijente Y-presjeka i X 1 , X 3 i zamjenjujemo dobijene vrijednosti, zajedno sa prosječnim vrijednostima X-s, u regresionu jednadžbu:

Deskriptivna statistika

standardna greška

Standardna devijacija

Asimetrija

Interval

Maksimum

Analiza varijanse

Značaj F

Regresija

Odds

standardna greška

t-statistika

P-vrijednost

donjih 95%

Top 95%

Y-raskrsnica

elastičnost matrice korelacije regresije

zaključak:

1. Jednačina regresije ima sljedeći oblik:

2. Odnos između vrijednosti nekretnine (Y) i cijene jednog kvadratnog metra (X 1), između vrijednosti nekretnine (Y) i nivoa prihoda stanovništva (X 3), bliži je od između vrijednosti nekretnine i drugih faktora.

5 . Analiza faktora po koeficijentu elastičnosti

Značaj faktora se ne može suditi po vrijednosti koeficijenta regresije. Analiza se vrši koeficijentom elastičnosti.

Koeficijent elastičnosti pokazuje za koji se postotak mijenja rezultat Uređivanje znaka kada se predznak faktora promijeni za 1%. Obično se uzima 10%. Predznak koeficijenta elastičnosti uvijek se poklapa sa predznakom koeficijenata regresije. Što je veća modulo vrijednost koeficijenta elastičnosti, veći je utjecaj ovog faktora na rezultirajuću osobinu.

.

Povećajmo svaki faktor za 10%:

Zamjenom prosječnih vrijednosti faktora X 1, X 3, kao i njihovih sukcesivno uvećanih vrijednosti za 10% u odgovarajuće regresijske jednadžbe, izračunavamo koeficijente elastičnosti:

Koeficijent elastičnosti se obično prikazuje grafički.

Odnos između X 1 (cijena jednog kvadratnog metra) i Y (vrijednost objekta nekretnine):

zaključak: sa povećanjem predznaka faktora X 1 za 10%, efektivni predznak raste za 11,91%.

Odnos između X 3 (nivo prihoda stanovništva) i Y (vrijednost imovine objekta)

zaključak: sa povećanjem predznaka faktora X 3 za 10%, efektivni predznak se smanjuje za 3,42%.

ZAKLJUČAK: Analiza faktora po koeficijentu elastičnosti pokazala je da cijena jednog kvadratnog metra ima najveći uticaj na vrijednost nekretnine (faktor X 1), zatim na nivo prihoda stanovništva (faktor X 3).

6 . Procjena parametara jednadžbe regresije

Za procjenu parametara jednačine regresije koristi se Studentov t-test. U tabeli "analiza disperzije", u koloni "t-statistika" nalaze se podaci izračunati na računaru:

Ove vrijednosti se upoređuju sa t - kritičnim, uzimajući u obzir prihvaćeni nivo značajnosti b = 0,05 i k - broj stupnjeva slobode k = n-m-1; k = 10-2-1 = 7, a zatim pomoću Studentove tablice utvrđujemo da: t cr = 2.365, ili ovu vrijednost izračunavamo u Excelu pomoću funkcije insert < fx > u polju "kategorija" izabrati Statistički u polju "odaberi funkciju" aktivirati liniju STUDRASPOBR, s kojim računar vraća t-vrijednost Studentove distribucije kao funkciju vjerovatnoće i broja stupnjeva slobode, a zatim pritisnite "UREDU". Računar traži argumente funkcije: u polje vjerovatnoće stavljamo vrijednost 0,05, a u polje za stepen slobode -7

Parametri regresione jednadžbe se prepoznaju kao tipični ako su zadovoljene sljedeće nejednakosti:

Zamijenite podatke za poređenje:

Uslov nije ispunjen

Uslov nije ispunjen.

zaključak: Analiza parametara jednačine regresije pokazala je da kompjuterski izračunati podaci ne zadovoljavaju uslov poređenja. Stoga se formula matematičke regresije ne može koristiti za predviđanje vrijednosti nekretnine, već se može koristiti samo za praktične proračune.

7. Procijeniti značaj indikatora bliskosti veze r

Za to se koristi Studentov t-test. Izračunate vrijednosti t r za faktore X 1 , X 3 određene su formulom:

gdje su r vrijednosti izračunate u korelacionoj matrici (kolona Y) za faktore objašnjenja

n je broj zapažanja.

Zamjenom dostupnih podataka u formulu dobijamo:

Izračunate vrijednosti treba uporediti sa t-kritičnim jednakim 2,365. Indikatori bliskosti veze prepoznati su kao tipični if

Zamjenom dobijenih podataka dobijamo:

Uslov ispunjen

Uslov ispunjen

zaključak: svi koeficijenti korelacije koji odgovaraju preostalim faktorima smatraju se tipičnim, pošto je uslov nejednakosti zadovoljen.

8 . Procjena značaja koeficijenta determinacije R 2

Za to se koristi Fisherov F-kriterijum, čija se vrijednost uzima iz Fisherove tablice sa stupnjevima slobode:

k 1 = m = 2 - broj faktora koji objašnjavaju.

do 2 \u003d n-m-1 \u003d 10-2-1 \u003d 7

Ili izračunamo ovu vrijednost u Excelu koristeći funkciju insert < fx > u polju "kategorija" izabrati Statistički u polju "odaberi funkciju" aktivirati liniju FDISTRIBUCIJA, sa kojim računar vraća inverznu distribuciju F vjerovatnoće, a zatim pritisnite "UREDU". Računar traži argumente funkcije: u polje vjerovatnoće stavljamo vrijednost 0,05, u polje stepen slobode1 upisujemo broj faktora objašnjenja, tj. 2, a u polje stepen slobode2 unesite k 2 = 7

Za određivanje statističke značajnosti koeficijenta determinacije R 2 koristi se sljedeća nejednakost:

Vrijednost F R se izračunava pomoću formule:

Zamjenom podataka u nejednačinu dobijamo: F calc =337,55 F krit. =4.737

zaključak:

Koeficijent determinacije R 2 je značajan, jer je nejednakost zadovoljena;

Vrijednost R 2 = 0,990 - to znači da se 99% ukupne varijacije efektivnog atributa objašnjava promjenom znakova faktora X 1, X 3, a 1% se objašnjava promjenama drugih faktora.

9. Intervali povjerenja za koeficijente regresione jednadžbe

Intervali povjerenja za višestruke regresijske koeficijente određuju se:

a=499,986; Sa=29.254; tcrit.= 2.365

a 2 \u003d -779,762; Sa 2 =644,425; tcrit.= 2.365

zaključak:

95% koeficijenta regresije a 1 leži u intervalu, a 5% je izvan ovog intervala.

95% koeficijenta regresije a 2 leži u intervalu, a 5% je izvan ovog intervala.

10 . Intervali povjerenja za srednje vrijednosti faktorskih prepoznavanja a kov

Intervali povjerenja za prosječne vrijednosti faktorskih karakteristika određuju se:

gdje je standardna devijacija (standardna devijacija);

n je broj zapažanja;

t se nalazi iz funkcije Laplaceove tablice

95% predznaka faktora (cijena 1 m 2) leži u intervalu, a 5% je izvan ovog intervala.

95% predznaka faktora (nivo prihoda stanovništva) leži u intervalu, a 5% je izvan ovog intervala.

1 1 . autokorelacija

A) Za određivanje vrijednosti koeficijenta autokorelacije koriste se preostale vrijednosti koje imaju sljedeći oblik:

PREOSTALO POVLAČENJE

Dodatni proračuni

Opservation

Predviđeno Y

Ostaje i

Za određivanje vrijednosti koeficijenta autokorelacije koristi se Darwin-Outsonova formula:

korištenje, što je povezano s dodatnim proračunima. Zamijenite podatke u formuli i dobijete:

Koeficijent korelacije varira unutar 0?dw?4.

To znači da veličina autokorelacionog polja mora imati iste granice.

B) Autokorelacija sadrži (s lijeva na desno):

1. Zona pozitivne autokorelacije

2. Zona neizvjesnosti

3. Zona bez autokorelacije

4. Zona neizvjesnosti

5. Zona negativne autokorelacije.

Veličina zona nesigurnosti zavisi od indikatora Darwin-Outsonove tabele.

Da biste pronašli potrebne indikatore u tabeli, morate znati broj kolone i reda.

Broj tražene kolone je broj faktora objašnjenja regresione jednačine: k=m=2;

Broj reda je broj opažanja: n=10.

Tabela sadrži indikatore d l i d u:

U lijevoj polovini polja za autokorelaciju:

Donja granica zone je jednaka d l =0,697

Gornja granica zone je jednaka d u = 1,641

Za desnu polovinu autokorelacionog polja granice nesigurnosti se moraju izračunati:

Gornja granica zone je 4-d u = 4-1.641= 2.359

Donja granica zone je jednaka 4-d l = 4-0,697= 3,303

Ukupna slika autokorelacionog polja može se predstaviti kao:

C) Koeficijent autokorelacije, njegova vrijednost odgovara zoni odsustva autokorelacije.

Objavljeno na stranici

Slični dokumenti

    Suština korelaciono-regresione analize i njena upotreba u poljoprivrednoj proizvodnji. Faze korelaciono-regresione analize. Područja njegove primjene. Analiza objekta i izrada numeričkog ekonomsko-matematičkog modela.

    seminarski rad, dodan 27.03.2009

    Proračun troškova opreme korištenjem metoda korelacionog modeliranja. Metoda parne i višestruke korelacije. Izgradnja matrice parnih koeficijenata korelacije. Provjera preostalih faktorskih karakteristika za svojstvo multikolinearnosti.

    zadatak, dodan 20.01.2010

    Proračun parametara jednadžbe linearne regresije. Procjena jednačine regresije kroz srednju grešku aproksimacije, Fišerov F-test, Studentov t-test. Analiza korelacione matrice. Proračun koeficijenata višestruke determinacije i korelacije.

    test, dodano 29.08.2013

    Suština korelaciono-regresijske analize i ekonomsko-matematički model. Osiguravanje volumena i slučajnog sastava uzorka. Mjerenje stepena bliskosti odnosa između varijabli. Sastavljanje regresionih jednačina, njihova ekonomska i statistička analiza.

    seminarski rad, dodan 27.07.2015

    Izgradnja regresijskih modela. Značenje regresione analize. Varijanca uzorka. Karakteristike opšte populacije. Provjera statističke značajnosti regresijske jednačine. Procjena koeficijenata regresione jednadžbe. Varijance slučajnih reziduala.

    sažetak, dodan 25.01.2009

    Izgradnja matematičkog modela odabranog ekonomskog fenomena metodama regresione analize. Model linearne regresije. Koeficijent korelacije uzorka. Najmanji kvadrati za model višestruke regresije, statističke hipoteze.

    seminarski rad, dodan 22.05.2015

    Uvod u osnove jednostavnog regresijskog modela. Razmatranje glavnih elemenata ekonometrijskog modela. Karakterizacija procjena koeficijenata regresione jednadžbe. Izgradnja intervala povjerenja. Autokorelacija i heteroskedastičnost reziduala.

    predavanje, dodano 23.12.2014

    Statistička analiza po uzorku. Izvođenje regresione analize početnih podataka i odabir analitičkog oblika za evidentiranje proizvodne funkcije. Izvršiti ekonomsku analizu na odabranom modelu regresije na osnovu koeficijenata elastičnosti.

    seminarski rad, dodan 22.07.2015

    Procjena korelacijske matrice faktorskih znakova. Procjene svojstvenih vrijednosti matrice parnih koeficijenata korelacije. Analiza dobijene regresione jednačine, određivanje značaja jednačine i regresionih koeficijenata, njihova ekonomska interpretacija.

    test, dodano 29.06.2013

    Proračun parametara linearne regresije. Komparativna procjena čvrstoće odnosa pomoću indikatora korelacije, determinacije, koeficijenta elastičnosti. Konstrukcija korelacionog polja. Određivanje statističke pouzdanosti rezultata regresijskog modeliranja.

Linearna multivarijantna regresiona analiza U praksi, prilikom analize rezultata naučnog istraživanja, često se javlja situacija kada kvantitativna promjena u proučavanoj pojavi (funkcija odgovora) ne zavisi od jednog, već od više razloga (faktora). Prilikom provođenja eksperimenata u takvoj višestrukoj situaciji, istraživač bilježi očitanja instrumenta o stanju funkcije odgovora (y) i svim faktorima od kojih ona ovisi (x). Rezultati opservacija više nisu dva vektora stupca (x i y), kao u jednosmjernoj regresionoj analizi, već matrica rezultata posmatranja. gdje je yi vrijednost funkcije odgovora u i-tom eksperimentu, Xij je vrijednost j-tog faktora u i-tom eksperimentu, n je broj eksperimenata, p je broj faktora )-dimenzionalni prostor , odstupanja rezultata posmatranja yi od kojih bi bila minimalna.

Ili, drugim riječima, potrebno je izračunati vrijednosti koeficijenata b 0, bj u jednadžbi na kojoj se postiže minimum. Za pronalaženje minimuma potrebno je pronaći parcijalne izvode u odnosu na sve nepoznanice b 0, bj i izjednačiti ih sa nulom. Rezultirajuće jednačine formiraju sistem normalnih jednačina, koji u matričnom obliku ima oblik gdje Iz ove jednačine možemo pronaći vektor stupca koeficijenata regresije: , čiji se svaki element može naći po formuli:

Provjera značaja regresijskih koeficijenata Provjera značaja jednačine regresije se malo razlikuje od odgovarajuće provjere jednosmjerne regresije. Preostala varijansa se izračunava prema formuli: koja se upoređuje sa Fisherovom srednjom varijansom: korištenjem kriterija sa brojem stupnjeva slobode u brojiocu (n-1) i u nazivniku (n-p-1). Značajnost koeficijenata regresije b 0, bj provjerava se Studentovim kriterijem: (, gdje su dijagonalni elementi matrice).

Parni koeficijenti korelacije Analiza korelacije počinje izračunavanjem koeficijenata uparene korelacije koji karakteriziraju bliskost odnosa između dvije veličine. U multifaktorskoj situaciji izračunavaju se dvije vrste parnih koeficijenata korelacije: 1) - koeficijenti koji određuju čvrstoću veze između funkcije odgovora i jednog od faktora; 2) - koeficijenti koji pokazuju bliskost odnosa između jednog od faktora i faktora (). , gdje

Matrica korelacije Vrijednost koeficijenta korelacije para varira od -1 do +1. Ako je, na primjer, koeficijent negativna vrijednost, to znači da se smanjuje s povećanjem. Ako je pozitivan, povećava se s povećanjem. Ako se pokaže da je jedan od koeficijenata jednak 1, to znači da su faktori i funkcionalno povezani jedni s drugima, te je tada preporučljivo jedan od njih isključiti iz razmatranja, a ostaviti faktor čiji je koeficijent veći. Nakon izračunavanja svih uparenih koeficijenata korelacije i isključivanja jednog ili drugog faktora iz razmatranja, moguće je konstruirati matricu koeficijenata korelacije oblika:

Parcijalni koeficijenti korelacije Pomoću matrice parnih koeficijenata korelacije mogu se izračunati parcijalni koeficijenti korelacije, koji pokazuju stepen uticaja jednog od faktora na funkciju odziva, pod uslovom da su ostali faktori fiksirani na konstantnom nivou. Parcijalni koeficijenti korelacije se izračunavaju po formuli gdje je determinanta matrice formirane iz matrice uparenih koeficijenata korelacije brisanjem 1. reda j-te kolone, determinanta je j-ti red j-te kolone. Kao i koeficijenti para, parcijalni koeficijenti korelacije variraju od -1 do +1. Interval značajnosti i pouzdanosti za parcijalne koeficijente korelacije određuju se na isti način kao i za par koeficijente korelacije sa brojem stupnjeva slobode v = n - k - 2, gdje je k = p - 1 red parcijalnog koeficijenta korelacije .

Koeficijent višestruke korelacije i njegov značaj Za proučavanje bliskosti veze između funkcije odgovora i nekoliko faktora, koristi se koeficijent višestruke korelacije R. Koeficijent višestruke korelacije takođe služi za procjenu kvaliteta predviđanja; R je uvijek pozitivan i varira od 0 do 1. Što je veći R, bolji je kvalitet predviđanja ovim modelom eksperimentalnih podataka. Koeficijent višestruke korelacije izračunava se po formuli. Značajnost koeficijenta višestruke korelacije provjerava se Studentovim t-testom: n - p - 1 i v 2 \u003d p. Ako izračunata vrijednost premašuje tabelarnu vrijednost, tada se hipoteza da je koeficijent višestruke korelacije jednak nuli odbacuje i odnos se smatra statistički značajnom.

Multivarijantna nelinearna regresijska analiza Prvi korak nelinearne multivarijantne regresione analize je dobijanje punog kvadratnog oblika. Da biste to uradili, odredite koeficijente regresije b 0, bk i bjk u polinomu, stepen jednačine se može povećavati sve dok se rezidualna varijansa ne smanji. Problem nelinearne regresije svodi se na problem linearne regresije promjenom varijabli itd. Mjera zategnutosti veze u nelinearnoj zavisnosti je višestruki korelacijski omjer, ali korištenjem nelinearne forme jednadžba za izračunavanje y. Poređenje omjera višestruke korelacije sa koeficijentom višestruke korelacije izračunatim u linearnom obliku daje neku ideju o "zakrivljenosti" ovisnosti koja se proučava.

Odabir optimalnog oblika regresije 1) metoda iscrpnog pretraživanja 2) metoda skrining faktora Kod korištenja metode eliminacije varijabli, jednačina regresije se odmah proširuje na puni kvadrat ili, ako je moguće, na puni kubni oblik. Eliminacija počinje sa faktorom koji ima najmanji Studentov kriterijum. U svakom koraku, nakon eliminisanja svakog faktora za novu jednadžbu regresije, izračunavaju se koeficijent višestruke korelacije, rezidualna varijansa i Fišerov F-test. Najveća poteškoća je odlučivanje o pitanju u kojoj fazi zaustaviti isključivanje faktora. Ovdje su mogući sljedeći pristupi: a) isključenje stop faktora kada rezidualna varijansa počne da raste; b) dodijeliti nivo značajnosti (0,05) prilikom izračunavanja Studentovog t-testa za posljednji preostali faktor. U drugom slučaju, prije početka skrining faktora, za sve faktore proširenog modela se gradi Studentov t-test rangiranja grafikona.

3) Metoda uključivanja faktora Kada se koristi metoda faktorskog uključivanja, faktori (najznačajniji) se sukcesivno uključuju u jednačinu regresije sve dok se rezidualna varijansa ne poveća.

Primjer regresione analize Razmotrimo primjer multivarijantne regresione i korelacijske analize sa izborom optimalnog oblika regresije metodom eliminacije efekata (faktora i interakcija parova) na primjeru izgradnje modela za proračun puzanja betona. U ovom zadatku konstruirana je ovisnost specifičnih relativnih deformacija puzanja betona S(t, t) o deset faktora: . Početna matrica podataka uključuje rezultate 367 eksperimenata na uzorcima betona, u kojima su zabilježene vrijednosti y = C (t, t) i sljedećih 10 faktora: - omjer mase cementa i masa agregata u 1 m 3 betona (C / 3); - potrošnja cementa po 1 m 3 betona (C); - vlažnost okoline (W); - faktor skale (M); - vodocementni odnos (W/C); - starost betona u trenutku opterećenja (t); - vrijeme djelovanja opterećenja (t - t); - normalna gustina cementne paste (NG); - vrijednost naprezanja (); - modul elastičnosti punila (E 3).

Rješenje Koeficijent korelacije je blizu jedinice, pa je faktor isključen iz razmatranja; U prvoj fazi izgrađen je potpuni kvadratni model sa 54 efekta. Fišerov kriterijum za ovaj model se pokazao sledećim: Zatim je izvršena eliminacija beznačajnih efekata u 11 faza, pri čemu je isključeno 28 statistički beznačajnih efekata prema Studentovom kriterijumu, kao rezultat je dobijen model sa 26 efekata, za koje se Fisherov kriterij neznatno povećao: a preostali parametri su se pokazali dobrima. Značajno, veze radi jasnoće, zgodno je prikazati u obliku grafikona. Koristeći metode teorije grafova, možete napraviti tabelu koja jasno pokazuje broj statistički značajnih odnosa između funkcije odgovora i faktora. Takva tabela se naziva i matrica susjednosti vrhova.