Pristup osnovnim statistikama za analizu kvantitativnih podataka
Linearni regresijski modeli koriste se za prikaz ili predviđanje odnosa između dvije varijable ili čimbenika . Čimbenik koji se predviđa (faktor za koji se jednadžba rješava ) naziva se zavisna varijabla. Čimbenici koji se koriste za predviđanje vrijednosti zavisne varijable nazivaju se neovisne varijable.
Dobri podaci ne govore uvijek cjelovitu priču. Regresijska analiza se obično koristi u istraživanju jer utvrđuje da postoji korelacija između varijabli.
No, korelacija nije ista kao uzročnost . Čak i linija u jednostavnoj linearnoj regresiji koja dobro odgovara podatkovnim točkama ne može reći nešto definitivno o uzročno-posljedičnom odnosu.
U jednostavnoj linearnoj regresiji, svaka promatranja sastoji se od dvije vrijednosti. Jedna je vrijednost za zavisnu varijablu, a jedna je vrijednost za nezavisnu varijablu.
- Jednostavna linearna regresijska analiza Najjednostavniji oblik regresijske analize koristi se na zavisnoj varijabli i jednoj nezavisnoj varijabli. U ovom jednostavnom modelu ravna crta približava odnos između zavisne varijable i nezavisne varijable.
- Višestruka regresijska analiza Kada se u regresijskoj analizi upotrebljava dvije ili više neovisnih varijabli, model više nije jednostavan linearan.
Jednostavan linearni regresijski model
Jednostavan linearni regresijski model predstavljen je ovako: y = ( β0 + β1 + Ε
Prema matematičkoj konvenciji, dva čimbenika koji su uključeni u jednostavnu linearnu regresijsku analizu su označeni kao x i y .
Jednadžba koja opisuje kako je y povezana s x poznata je kao regresijski model . Model linearne regresije također sadrži izraz pogreške koji je predstavljen s Ε ili grčkim slovom epsilon. Pojam pogreške koristi se za izračunavanje varijabilnosti y koja se ne može objasniti linearnim odnosom x i y .
Tu su i parametri koji predstavljaju stanovništvo koje se proučava. Ovi parametri modela koji su predstavljeni ( β 0+ β 1 x ).
Jednostavan linearni regresijski model
Jednostavna linearna regresijska jednadžba predstavljena je ovako: Ε ( y ) = ( β 0 + β 1 x ).
Jednostavna linearna regresijska jednadžba grafirana je kao ravna crta.
( β 0 je y presretanje regresijske linije.
β 1 je nagib.
Ε ( y ) je srednja ili očekivana vrijednost y za dane vrijednosti x .
Regresijska linija može pokazati pozitivan linearni odnos, negativni linearni odnos ili nikakav odnos. Ako je grafikon linija u jednostavnoj linearnoj regresiji ravna (nije nagnuta), nema veze između dvije varijable. Ako se regresijska crta spušta prema gore s donjim krajem linije na presjeku y (osi) grafikona, a gornji kraj linije koji se proteže prema gore u polje grafikona, udaljena od osi x, postoji pozitivan linearni odnos , Ako se regresijska crta spušta prema dolje s gornjim krajem linije na presjeku y (osi) grafikona, a donji kraj linije koji se proteže prema dolje u polje grafikona, prema x presjeku (osi) postoji negativni linearni odnos.
Procjena jednadžbe linearne regresije
Ako su poznati parametri stanovništva , jednostavna linearna regresijska jednadžba (prikazana dolje) može se koristiti za izračunavanje srednje vrijednosti y za poznatu vrijednost x .
Ε ( y ) = ( β0 + β1 x ).
Međutim, u praksi vrijednosti parametara nisu poznate pa se moraju procijeniti korištenjem podataka iz uzorka stanovništva. Parametri populacije procjenjuju se pomoću uzorka statistike . Statistika uzorka predstavljena je b 0 + b 1. Kada su statistike uzoraka zamijenjene za parametre populacije, formirana je procijenjena regresijska jednadžba.
Procijenjena regresijska jednadžba prikazana je dolje.
( ŷ ) = ( β0 + β1 x
( ŷ ) izgovara se y šešir .
Grafikon procijenjene jednostavne regresijske jednadžbe naziva se procijenjenom regresijskom linijom.
B 0 je preslikavanje y.
B 1 je nagib.
Ŷ ) je procijenjena vrijednost y za dane vrijednosti x .
Važna napomena: Regresijska analiza se ne koristi za tumačenje uzročno-posljedičnih odnosa između varijabli. Međutim, regresijska analiza može pokazati kako su povezane varijable ili koliko su varijable međusobno povezane .
U tom smislu, regresijska analiza ima tendenciju stvaranja značajnih odnosa koji jamče da se istraživači koji se bave znanjima bliže pogledaju .
Također poznat kao: regresijska bivarijata, regresijska analiza
Primjeri: Metoda najmanjih kvadrata statistička je procedura za upotrebu uzorka za pronalaženje vrijednosti procijenjene regresijske jednadžbe. Metoda najmanje kvadrata predložila je Carl Friedrich Gauss, rođen 1777. godine i umro 1855. godine. Metoda Najmanji kvadratići još je uvijek naširoko koristi.
izvori:
Anderson, DR, Sweeney, DJ i Williams, TA (2003). Osnove statistike za poslovanje i ekonomiju (3. izd.) Mason, Ohio: Southwestern, Thompson Learning.
______. (2010). Objasnio: Regresijska analiza. MIT vijesti.
McIntyre, L. (1994). Korištenje podataka o cigaretama za uvod u višestruku regresiju. Časopis za statistiku obrazovanja, 2 (1).
Mendenhall, W. i Sincich, T. (1992). Statistika za inženjerstvo i znanost (3. izd.), New York, NY: Dellen Publishing Co.
Panchenko, D. 18.443 Statistika za aplikacije, jesen 2006, odjeljak 14, Jednostavna linearna regresija. (Massachusetts Institute of Technology: MIT OpenCourseWare)