Analýza rozptylu

 

Pomocí analýzy rozptylu lze využít při zkoumání vztahu mezi nezávislými a závislými proměnnými, zejména při vyhodnocování experimentálních dal. Zkoumáme-li vliv jediného faktoru na jednu či více závislých proměn­ných, jde o jednofaktorovou analýzu rozptylu. Při více faktorech mluvíme o vícefaktorové analýze rozptylu. Jednorozměrná analýza rozptylu (ANOVA) předpokládá jedinou vy­světlovanou proměnnou, při vícerozměrné analýze rozptylu (MANOVA) můžeme mít i více vysvětlovaných proměnných současně.

Pro zjištění, zda pozorovaná variabilita proměnné Y závisí na příslušnosti hodnot ve skupinách rozkládáme celkovou variabilitu na složky odpovídající různým zdrojům variability (odtud název analýza rozptylu). Variabilitu vyjadřujeme v jednorozměrném případě pomocí součtů čtverců, ve vícerozměrném případě pomocí matic, u nichž součty čtverců tvoří hlavní diagonálu. Model analýzy rozptylu je speciálním případem obecného lineárního modelu (GLM) a hypotézy o vlivu faktorů, jsou speciálním případem obecné lineární hypotézy o parametrech modelu (Hebák a kol., Vícerozměrné statistické metody 1, s. 160).

Elementární popis závislosti

Základní představu o závislosti mezi dvěma jevy charakterizovanými znaky X a Y získáme uspořádáním empirických údajů, tj. dvojic [xi, yi], do dvourozměrné tabulky. Údaje můžeme uspořádat podle variant znaku X, tak podle variant znaku Y a dostaneme klasickou korelační tabulku - viz tab. 3 - kde nij jsou sdružené četnosti, ni. a n.j jsou okrajové četnosti.

Tab. 3 Schéma klasické korelační tabulky

xi

   

yj

     

ni.

y1

y2

yj

ys

x1

n11

n12

n1j

n1s

n1.

x2

n21

n22

n2j

n2s

n2.

xi

ni1

ni2

nij

nis

ni.

xk

nk1

nk2

nkj

nks

nk.

n.j

n.1

n.2

n.j

n.s

n

Podobně jako u jednorozměrného rozdělení četností počítáme z dvourozměrné tabulky následující průměry a rozptyly:

podmíněný průměr                                                                   (1.1)

podmíněný rozptyl                                          (1.2)

celkový průměr                                    (1.3)

celkový rozptyl                             (1.4)

rozptyl podmíněných průměrů                                          (1.5)

průměr podmíněných rozptylů                                                   (1.6)

Jednofaktorová ANOVA

ANOVA (z anglického Analysis of Variance), se v praxi používá buď jako samostatná technika nebo jako postup umožňující analýzu zdrojů variability u lineárních statistických modelů. Ze statistického hlediska lze analýzu rozptylu chápat jako speciální případ regresní analýzy, kdy vysvětlující (nezávisle) proměnná má pouze binární charakter, čili může nabývat pouze hodnot 0 nebo 1. Podle konkrétního uspořádání experimentu existuje celá řada variant analýzy rozptylu - viz např. Meloun, Militký (2004).

Podkladem pro jednofaktorovou analýzu rozptylu jsou hodnoty yij (i = 1, …, k a j = 1, …, s) proměnné Y roztříděné do k skupin podle úrovní (variant) x1, x2, …, xk faktoru X. Podstatou analýzy rozptylu je rozklad celkového rozptylu na složku objasněnou (známý zdroj variability) a složku neobjasněnou (reziduální, chybovou), o níž se předpokládá, že je náhodná.

Ze vztahu (1.4) pro celkový rozptyl plyne, že celkovou variabilitu charakterizuje součet

,                                                 (1.7)

jemuž přísluší (n – 1) stupňů volnosti,  je celkový průměr (1.3).

Ze vztahu (1.2) plyne, že variabilitu uvnitř skupin charakterizuje součet

,                                                 (1.8)

jemuž přísluší (n - k) stupňů volnosti,  je podmíněný průměr (1.1).

Variabilitu (1.5) podmíněných průměrů, čili variabilitu mezi skupinami, charakterizuje součet

,                                              (1.9)

jemuž přísluší (k – 1) stupňů volnosti.

Mezi uvedenými součty platí vztah

.                                                         (1.10)

Při malých rozdílech mezi výběrovými podmíněnými rozptyly (1.2) lze předpokládat, že variabilita (1.5) podmíněných průměrů kolem celkového průměru (1.3) je způsobena závislostí Y na X. Základním předpokladem použití analýzy rozptylu je, že každý z k nezávislých výběrů znaku Y pochází z normálního rozdělení N(mi, si2) se stejným rozptylem s2. Předpoklad normality lze ověřit např. testem dobré shody. V praxi se od toho často upouští a posuzuje se pouze, zda se ve skupinách hodnot proměnné Y, zjištěných na jednotlivých úrovních faktoru X, nevyskytují vysloveně extrémní hodnoty a zda se hodnoty blízké podmíněným průměrům vyskytují častěji než hodnoty, jejichž vzdálenost od podmíněných průměrů je větší.

K ověření hypotézy o stejných rozptylech k normálních rozdělení lze použít Bartlettův test. Nevýhodou Bartlettova testu je to, že je velmi citlivý na porušení předpokladu normality. Jsou-li četnosti všech tříd stejné, tj. n1 = n2 = … = nk, používá se k testování hypotézy o rovnosti rozptylů také Hartleyův nebo Cochranův test. I od něj se v praxi často upouští a vychází se pouze z intuitivního posuzování rozdílnosti podmíněných rozptylů. Nejsou-li hodnoty si2 příliš rozdílné a nevykazují-li s rostoucím X vzestupnou ani sestupnou tendenci, považujeme předpoklad o stejných rozptylech normálních rozdělení N(mi, si2), kde i = 1, … k, za přijatelný.

Při testování hypotézy H, že znak (faktor) X neovlivňuje znak Y vlastně testujeme hypotézu, že rozdělení proměnné Y mají na různých úrovních faktoru X stejné střední hodnoty mi. Alternativní hypotéza tvrdí, že alespoň jedna ze středních hodnot mi se liší od ostatních, čili H: X neovlivňuje Y, A: H neplatí.

K testu hypotézy H se používá testové kritérium

.                                                                   (1.11)

Kritický obor je vymezen nerovností

Wa: F > F1-a(k-1, n-k),                                                 (1.12)

kde F1-a(k-1, n-k) je 100(1-a)% kvantil F-rozdělení o n1 = k – 1 a n2 = n - k a stupních volnosti.

Padne-li hodnota testového kritéria do tohoto kritického oboru, přijímáme na hladině významnosti a hypotézu o statisticky významné závislosti proměnné Y na proměnné X.

Místo porovnání vypočtené hodnoty testového kritéria F s hodnotou kvantilu F1-a(k-1, n-k) nabízí statistický software minimální hladina významnosti p, při které lze hypotézu H ještě zamítnout. Je-li p £ a, zamítáme testovanou hypotézu H o nezávislosti proměnné Y na proměnné X.

Tab. 4 Tabulka pro jednofaktorovou analýzu rozptylu

Variabilita

Součty
čtverců

Počty stupňů
volnosti

Průměrné
čtverce

Testové
kritérium

Hladina
významnosti

Meziskupinová
(vysvětlená)

p

Vnitroskupinová
(reziduální,
chybová)

---

---

Celková

---

---

---

Jak již bylo výše uvedeno, při jednofaktorové analýze rozptylu se předpokládá, že k nezávislých výběrů hodnot znaku Y pochází z normálních rozdělení se stejnými rozptyly. To znamená, že před vlastním testem by měl být ověřen předpoklad o normalitě a předpoklad o stejných rozptylech.

Předpoklad normality rozdělení a shody rozptylů v různých skupinách lze ověřovat pomocí testů, v praxi se často užívají grafy, které jsou součásti výstupu počítačových procedur. F-test není příliš citlivý na poruše­ní předpokladu normality (určité opatrnosti je třeba jen při existenci odlehlých hodnot), a pokud jsou data vyvážená, tj. v každé skupině je stejný počet hodnot, není příliš citlivý ani na porušení předpokladu homoskedasticity (Hebák a kol., Vícerozměrné statistické metody 1, s. 162)

Prokážeme-li existenci vlivu faktoru, následuje hlubší analýza výsledků, při níž zjišťujeme, mezi kterými skupinami existují rozdíly. Porovnáváme dvojice středních hodnot, tj. testujeme hypotézy H: mi - mj = 0 pro různá i, j.

Bylo odvozeno mnoho metod, které umožňují kontrolu chyby I. druhu a které se označují jako metody mnohonásobného porovnávání. Uvedeme zde metody nejčastěji zastoupené ve statistických paketech. Může se také stát, že výsledky mnohonásobného porovnávání jsou v konfliktu s výsledky F-testu analýzy rozptylu. Např. všechny intervaly při párovém porovnávání mohou ob­sahovat nulu, ačkoliv F-test složené hypotézy H: m1 = m2 = … = mk zamítnul testovanou hypotézu.

LSD (Fisher)

Použijeme-li metodu nejmenšího významného rozdílu (LSD) při porovnávání různých dvojic hodnot současně, není již riziko chyby I. druhu a dodrženo. Nejedná se tedy vlastně o metodu mnohonásobného porov­návání. Protože jsou intervaly spolehlivosti úzké, stává se, že porovnání vyjde významné i v případě, kdy F-test analýzy rozptylu nezamítnul hypo­tézu H: m1 = m2 = … = mk. Proto Fisher doporučuje konstruovat interval jen v případě, kdy hypotéza H byla F-testem zamítnuta.

Bonferroni

Bonferroniho metoda patří ke konzervativním testům, zvláště při větším počtu porovnávání, to znamená, že intervaly jsou široké a celková chyba I. druhu je menší než a.

Scheffé

Test je odvozen pro porovnání všech možných kontrastů a proto je rovněž kon­zervativní.

Jednorozměrné úlohy s více faktory

Při analýze experimentálních výsledků se často výsledky třídí podle více než jednoho faktoru, buď přímo zkoumáme vliv několika faktorů na závislou kvanti­tativní proměnnou, nebo můžeme mít zkoumaný faktor jen jeden, ale vzhledem ke způsobu realizace experimentu vstupuje do modelu jeden nebo více blokových faktorů. Zde se omezíme jen na případ dvou faktorů. Pro zkoumání vlivu jednoho faktoru použijeme model bez interakce. Vyhodnocení úplného faktoriálního experimentu provedeme po­mocí modelu s interakcí.

Model pro dva faktory s interakcí má tvar

ykgi = m + ak + bg + (ab)kg + ekgi,

k= 1, 2, …, K, g = 1, 2 …, G, i = 1, 2, …, r,

v něm m vyjadřuje obecnou konstantu, ak efekt k-té úrovně jednoho faktoru, bg efekt g-té úrovně druhého faktoru, (ab)kg efekt interakce, tj. efekt kombinace daných úrovní obou faktorů a ekgi náhodnou složku splňují cí obvyklé předpoklady.

Testujeme jednak hypotézy o tzv. hlavních efektech faktorů, tj. hypotézy o tom, že efekty všech úrovní daného faktoru (bez ohledu na úroveň druhého faktoru) jsou nulové

H: al = a2 = … = ak = 0, resp. H: bl = b2 = … = bk = 0

jednak hypotézu o efektu interakce

H: (ab)11 = (ab)12 = … = (ab)ij = 0

to znamená hypotézu o tom, že velikost efektu změny úrovně jednoho faktoru nezávisí na konkrétní úrovni druhého faktoru

Tab. 5 Dvoufaktorová analýza rozptylu, model s interakcí

Zdroj variability

Součet čtverců

Stupně volnosti

Průměrný čtverec

Faktor A

QB-A

vA = K-1

QB,A / vA

Faktor B

QB-B

vB = G-1

QB,B / vB

Interakce

QB-AB

vAB = (K-1)*(G-1)

QB,AB / vAB

Reziduální

QE

vE = KG(r-1)

QE / vE

Celkový

QT

n-1

 

Vícerozměrné úlohy s jedním faktorem

Místo jednoho pozorování na experimentální jednotce budeme nyní uvažovat vektor p pozorování a úvahy zobecníme pro p-rozměrný případ. Pro vícerozměrnou analýzu rozptylu použijeme model

yki = mk + eki

Testovanou hypotézu zamítneme na hladině významnosti a, překročí-li hod­nota testové statistiky F kvantil fl-a (v1, v2). Výpočet hodnot statistik včetně uvedených transformací a příslušných p-hodnot je běžnou součás­tí počítačových programů pro vícerozměrnou analýzu rozptylu, např. ve statistic­kých paketech SPSS nebo STATISTICA. Podrobný teoretický popis přesahuje rámec tohoto studijního textu, čtenáře odkážeme na (Hebák a kol., Vícerozměrné statistické metody 1, s. 178).

Obecný postup při analýze rozptylu

V úvodu má výzkumník určit na základě dat a povahy problému o jaký model ANOVY se bude jednat: s pevnými, náhodnými nebo smíšenými efekty. Jsou definovány hypotézy a vypočítány parametry ANOVY. Následuje interpretace:

  1. Odhadu parametrů základního modelu ANOVA.
  2. Ověřování významnosti a konstrukce různých submodelů u modelů s pevnými efekty.
  3. Vyjádření složek rozptylů u modelů s náhodnými efekty a testování jejich významnosti.
  4. Ověření předpokladů normality, homogenity rozptylů a přítomnosti silně vybočujících pozorování.
  5. Interpretace výsledků s ohledem na zadání dat a jejich případné úpravy.

(Meloun, Militký, 2004, s. 560).

 

* * * * * * * * * * * * * * * * * * * * *
* * * * * * * * * * * * * * * * * * * * *
* * * * * * * * * * * * * * * * * * * * *

Otázky k procvičení (přístupné v informačním systému)

Vstoupit

* * * * * * * * * * * * * * * * * * * * *
* * * * * * * * * * * * * * * * * * * * *
* * * * * * * * * * * * * * * * * * * * *

Příklad 1 Jednorozměrná ANOVA

Zadání: Pro porovnání tří hodnotitelů A1, A2, A3 byl proveden tento experiment: Každé respondent byl změřen 3 hodnotiteli. V tabulce 6 jsou uvedeny naměřené hodnoty motorického testu v běhu na 1 km. Hodnoty jsou uvedené v sekundách. Zjistěte, zda existují významné rozdíly mezi výsledky jednotlivých hodnotitelů.

Data: n = 10.

Tab. 6 Vstupní data

A1

A2

A3

194,6

190,2

194,5

193,5

191,3

195,2

194,6

192,4

194,5

194,6

191,3

195,2

192,4

192,4

193,6

194,6

190,2

194,7

194,6

190,2

193,6

192,4

191,3

194,3

194,6

190,2

194,5

194,6

191,3

193,4

Řešení: Z údajů v tabulce 6 byly určeny následující sloupcové charakteristiky (tab. 7):

Tab. 7 Sloupcové základní charakteristiky

 

Krabicový graf nedetekuje žádné odlehlé body

Obr. 3 Krabicový graf

Splnění předpokladů:

  • Nezávislost výběrů – je dána podstatou experimentu
  • Normalita – ANOVA není citlivá na porušení předpokladu normality, pokud se jedná o vyvážená data (stejný počet hodnot ve skupinách). Pozn. v případě porušení normality můžeme použít Kruskall-Walissův test
  • Shoda rozptylů – nezamítáme hypotézu o rovnosti rozptylů – tab. 8

Statistiky → ANOVA → Jednofaktorová ANOVA → více výsledků → Předpoklady

Tab. 8 Testování shody rozptylů

Jednotlivé součty čtverců a složky rozptylu jsou uvedeny v tabulkách 9.

Statistiky → ANOVA → Jednofaktorová ANOVA→ Velikost efektů

Tab. 9 Výsledky analýzy rozptylu

Zdroj
rozptylu

Součet
čtverců
S

Stupně
volnosti
n

Průměrný
čtverec
S / n

Testovací
kritérium
Fe

Zkušebny

SA = 65,345

2

32,673

48,190

Reziduální

SR = 18,306

27

0,678

-

Celkový

SC = 83,652

29

2,885

-

Protože podíl Fe = 32,673 / 0,678 = 48,190 vysoko překračuje kvantil F0,95 (2, 27) = 5,448, zamítáme hypotézu o rovnosti efektů úrovní A1, A2, A3. Scheffého procedura vícenásobného porovnání (tab. 10) ukázala, že rozdíly mezi průměry  jsou významné. Rovněž rozdíly mezi průměry  nemůžeme považovat za statisticky nevýznamné..

Tab. 10 Výsledek Scheffeho metody mnohonásobného pozorování

Závěr: Jednofaktorová analýza rozptylu s pevnými efekty ukázala, že rozdíly mezi výsledky jednotlivých hodnotitelů jsou statisticky významné. Zatímco rozdíly mezi výsledky hodnotitelů A1 a A3 jsou náhodné, hodnotitel A2 měří systematicky odlišné (nižší) hodnoty než hodnotitelé A1 a A3.


Příklad 2. Dvojrozměrná ANOVA bez opakování

Zadání: Bylo sledováno, zda čas potřebný k vyřešení určité úlohy závisí na době a na hlučnosti okolí. Dvanáct vybraných studentů majících stejné studijní výsledky bylo rozděleno do tří skupin. První skupina řešila úlohu ráno, druhá v poledne a třetí večer. V každé skupině vždy jeden student pracoval v tichém prostředí, druhý poslouchal reprodukovanou hudbu, třetí rozhlasovou hru a čtvrtý silný pouliční hluk. Počet minut potřebných k vyřešení úlohy je uveden v tabulce 11. Zjistěte, zda doba potřebná k vyřešení úlohy závisí na denní době a na hlučnosti okolí.

Tento příklad byl zařazen z důvodu, že na něm statistický software STATISTICA 10 „havaruje“. Tzn. nedokáže ve svých výstupech provést vyhodnocení požadovaného modelu.

Tab. 11 Počet minut potřebných k vyřešení úlohy

 

faktor B

faktor A

ticho

hudba

hra

hluk

ráno

6

7

8

6

v poledne

8

5

10

5

večer

7

6

12

7

Řešení:

            Nejprve vypočítáme základní statistické charakteristiky a graficky znázorníme průměry jednotlivých efektů (tab. 12 a 13).

Tab. 12 Základní statistické charakteristiky faktoru A

Tab. 13 Základní statistické charakteristiky faktoru B

Obr. 4 Grafické znázorněn vlivu faktoru A

Obr. 5 Grafické znázorněn vlivu faktoru B

Obr. 6 Grafické znázorněn vlivu interakce faktorů A a B

Tab. 14 Výstup analýzy rozptylu v počtu minut potřebných k vyřešení úlohy

Zdroj
rozptylu

Součet
čtverců
S

Stupně
volnosti
n

Průměrný
čtverec
S / n

Testovací
kritérium
Fe

Úrovně faktoru A

SA = 3,50

2

1,75

0,833

Úrovně faktoru B

SB = 32,25

3

10,75

5,119

Interakce Tukey

ST = 3,67

1

3,67

1,747

Reziduální

SR = 10,50

5

2,10

-

Celkový

SC = 46,25

11

4,20

-

Statistiky → ANOVA → Vícefaktorová ANOVA→ Velikost efektů

Byly testovány hypotézy (tab. 14) o nulovosti efektů faktoru A. Srovnání kvantilu F0,95(2, 5) = 5,787 s hodnotou F = 0,833 vede k závěru, že efekt faktoru A je nevýznamný. Efekt faktoru B, F0,95(3, 5) = 5,409 > 5,119, je sice nevýznamný, ale blízkost hodnot 5,409 a 5,119 signalizuje, že hlučnost z části ovlivňuje dobu potřebnou k vyřešení úlohy. Nevýznamný je rovněž efekt interakce, neboť F0,95(1, 5) = 6,608 > 1,747.

Závěr: Dvoufaktorová analýza rozptylu bez opakování pozorování ukázala, že denní doba neovlivňuje čas potřebný k vyřešení úlohy. Na druhé straně se nepodařilo prokázat, že hlučnost okolí ovlivňuje dobu potřebnou k řešení příkladu.


Příklad 3 Dvojrozměrná ANOVA s opakováním

Zadání: Byl zkoumán výsledný čas v motorickém testu v závislosti na typu suplementace sportovce (faktor A) a na způsobu tréninku (faktor B). Každá kombinace byla realizována čtyřikrát nezávisle na sobě. Výsledky jsou uvedeny v tabulce 15. Zjistěte, jak ovlivňuje výsledný čas druh suplementace a způsob tréninku.

Data: n = 24

Tab. 15 Výsledný čas

 

Způsob tréninku

Suplementace

Bez tréninku

Aerobní

Anaerobní

výrobce 1

2,8

3,2

3,0

3,0

3,7

3,6

3,9

3,6

3,4

3,8

3,7

3,6

 

výrobce 2

3,1

2,7

3,0

2,9

3,4

3,4

3,0

3,8

4,2

4,0

4,1

3,9

 

Řešení:

Na základě výsledků z programu Statistica 10 byla sestavena tabulka 16 a ručním výpočtem tabulka 17

.

Statistiky → ANOVA → Vícefaktorová ANOVA→ Velikost efektů

Tab. 16 Analýza rozptylu výsledku motorického testu

Tab. 17 Analýza rozptylu výsledku motorického testu

Zdroj
rozptylu

Součet
čtverců
S

Stupně
volnosti
n

Průměrný
čtverec
S / n

Testovací
kritérium
Fe

Úrovně faktoru A

SA = 0,0017

1

0,0017

0,044

Úrovně faktoru B

SB = 3,1825

2

1,5912

41,814

Interakce AB

SAB = 0,5508

2

0,2754

7,237

Reziduální

SR = 0,6850

17

0,0381

-

Celkový

SC = 4,4200

23

0,1922

-

Srovnáme-li hodnoty testovacích kritérií z tabulky 16 a 17 s příslušnými kvantily F-rozdělení zjistíme, že efekt faktoru A je nevýznamný (0,004 < 4,414 = F0,95(1, 17)). Vliv faktoru B je statisticky významný (41,814 > 3,555 = F0,95(2, 17)). Rovněž vliv interakce AB je významný (7,237 > 3,555 = F0,95(2, 17)).

Obr. 7 Grafické znázorněné vlivu efektu „trénink“

Obr. 8 Grafické znázorněné vlivu interakce efektů „trénink“ a „suplementace“

Závěr: Nepodařilo se prokázat závislost výsledného času na druhu suplementace. Je však prokázán vliv tréninku (obr. 7). Rovněž byla prokázána přítomnost interakcí. To znamená, že všechny způsoby tréninku neovlivňují oba typy suplementace stejným způsobem (obr. 8).