Table of Contents
Tisztelt Hallgatóink, ez a segédlet – többek között – azzal a céllal jött létre, hogy eloszlassuk azt a félelmet, előítéletet, amely gyakori a matematikával szemben. A biológia vagy a környezetvédelem bármely területét is vizsgáljuk meg, magas szintű műveléséhez elengedhetetlenek bizonyos matematikai ismeretek.
A jegyzetben olyan matematikai vonatkozások (alkalmazások) bemutatására kerül sor, amelyek ismeretére a későbbi tanulmányok során is szükségük lehet a biológia és a környezetvédelem szakos hallgatóknak.
A matematika elvontságától való félelmet csökkentendő, az elméleti alapokat mintapéldák (részletes megoldásokkal) és gyakorlati alkalmazások követik – olykor még azon az áron is, hogy a matematikai háttér bemutatása hiányosságokat szenved.
Szeretnénk bebizonyítani, hogy a matematika nem egy, a valóságtól teljesen elszigetelt tudomány, amelynek egyetlen célja a hallgatók elbizonytalanítása megoldhatatlan, elvont feladatokkal. Éppen ellenkezőleg. A környezetünkben található dolgok, jelenségek a matematika segítségével leírhatók. Ahogy Theoni Pappas írja: “A matematika tudomány, nyelv, művészet, gondolkodási mód. Megjelenik a muvészetben, zenében, építészetben, történelemben, tudományban, irodalomban - hatása jelen van az Univerzum minden szegletében...” - ezt elhitetni azokkal a hallgatókkal, akik alapvetően nem matematikai érdeklődésűek, nagyon nehéz feladat, pedig azt is mondhatnánk, a matematika benne foglaltatik az élő sejt szerkezetében. Reméljük ennek felfedezéséhez és a matematikai eszközök helyes és hatékony használatához, segítséget tudunk adni.
Table of Contents
Kísérleti eredményeink bemutatásához használhatnánk adatközlő táblázatokat is, melyekben a számszerű értékeket tüntetjük fel, az esetek jó részében azonban könnyebben értékelhetők a grafikonon szemléltetett adatok, amelyek vizuális benyomást adnak az eredményeink tartalmáról és értelméről.
Table of Contents
Az értéket megjelenítő felület nagysága megközelítőleg arányos az adattal.
![]() |
A tehéntej kémiai összetétele.
![]() |
A tehéntej kémiai összetétele (másképp megjelenítve).
Az egyforma szélességű (függőleges vagy vízszintes elrendezésű) oszlopoknak csak a hossza fontos, elrendezése önkényes.
![]() |
C-vitamin mennyisége (mg/100 g) különböző élelmiszerekben.
![]() |
Felnőttek és újszülöttek teljes testtömegének százalékos eloszlása.
Egy meghatározható egész részeinek megjelenítésére használjuk. Bár erre a célra megfelelne egy arányosan darabolt szakasz is, a kördiagram látványosabb. Nem előnyös azonban azokban az esetekben, amikor túl sok, vagy túl keskeny részekre kell felosztanunk. A pontos beosztást segíti a milliméterpapírhoz hasonló körlap.
Ha ilyen nem áll rendelkezésünkre, használhatunk szögmérőt is: ahányad része az ábrázolandó terület a 100 %-nak, annyiad része a kimérendő szög a 360°-nak. Például: 36 % „A” vércsoportú ábrázolása esetén:
![]() |
Kördiagramok készítését segítő, 100 egyenlő részre osztott körlap.
![]() |
Vércsoporteloszlás egy angliai mintában.
A területekhez tartozó információt kívülre is írhatjuk, arra azonban minden esetben vigyáznunk kell, hogy jelöléseink pontosak, világosak és esztétikusak legyenek.
![]() |
Elemeloszlás élő szervezetekben.
Lehet lineáris vagy logaritmikus beosztású, egyetlen skálát tartalmaz - akár végeset is - amelynek értékeihez vagy intervallumaihoz rendeljük a megjeleníteni kívánt információkat.
![]() |
Biológiai aktivitás és tartósítási módok bizonyos hőmérsékleteken.
![]() |
Néhány ismert mikroszkopikus méret.
![]() |
Növény és talaj kölcsönhatásának változása a talaj pH-változásával.
A kétváltozós vonaldiagram (a Descartes-i koordináta-rendszerben) részei: x-tengely (vagy OX-tengely, vagy abszcissza), erre merőlegesen az y-tengely (vagy OY-tengely, vagy ordináta), origó (a (0, 0) koordinátájú pont). A sík bármely P(xP, yP) pontjához tartozik egy xP és egy yP koordináta, amelyek egyértelműen meghatározzák a pont helyzetét.
Az abszcisszán általában a független változót ábrázoljuk (amely egy kísérlet során általunk beállított), az ordinátán pedig a függő változót, amely az általunk beállított független változótól függ.
Például: Ábrázoljuk a hőmérséklet függvényében egy vízibolha percenként mért szívdobbanásainak számát:
hőmérséklet (C) |
5 |
10 |
15 |
20 |
25 |
30 |
szívverés (db.) |
112 |
198 |
240 |
298 |
380 |
400 |
![]() |
Vízibolha percenkénti szívveréseinek átlaga a hőmérséklet függvényében.
Megjegyzés
Minden esetben el kell döntenünk, hogy folytonos vagy diszkrét-e a változó, s így az ábrázolt pontokat folytonos vonallal összeköthetjük-e vagy sem.
Egy diagramon több változás ábrázolása lehetővé teszi a változások egymás közötti összehasonlítását.
![]() |
Antibiotikum hatása egy érzékeny (o) és egy rezisztens (x) baktérium-izolátumra.
Mindig könnyebb feladat már, mint a kísérlet helyes megtervezése és kivitelezése. Ha már megkaptuk az adatokat, látványos 3D grafikont szerkeszthetünk valamelyik számítógépes program segítségével.
![]() |
A pH és a hőmérséklet változásának együttes hatása egy baktériumtörzs növekedésére.
Keressünk a szakirodalomban olyan diagramokat, ahol egyik vagy mindkét tengelyen ábrázolt változó szorzat formájában van megadva! Értelmezzük a grafikont annak tudatában, hogy a tengelyfelirat azt mutatja meg, mit ábrázoltunk az illető tengelyen!
![]() |
Egy állatcsoport testtömeg-eloszlása.
A jó grafikon egyszerű, pontos, világos és célszerű.
Célszerűségéhez a legmegfelelőbb típust kell kiválasztanunk, adataink jellegének és számának megfelelően. Pontos kell legyen, olyannyira, hogy a szövegkörnyezete elolvasása nélkül, önállóan megállja a helyét, minden, az értelmezéséhez szükséges információt tartalmaz. Mindezekhez összefoglaló címmel rendelkezik, valamint jelmagyarázattal, ha ez szükséges. Világos a grafikon akkor, ha a tengelyeket (amennyiben léteznek) azonosítottuk jellel vagy számmal és mértékegységgel, és olyan a tengelybeosztás, hogy minden ábrázolni kívánt adat elfér rajta, s ezek egyben kitöltik a grafikonnak szánt helyet. Nagyon kis, vagy nagyon nagy számok esetén jelölhetünk szorzást a tengelyen, távoli ábrázolandó értékek esetén pedig tengelymegszakítást alkalmazhatunk.
Az eddigiek alapján könnyen tudjuk követni a grafikonkészítés lépéseit, és olyan ábrákat tudunk készíteni, amelyek mind szakmailag, mind pedig esztétikailag megállják a helyüket.
összegyűjtjük és könnyen kezelhető táblázatba rendezzük az adatokat,
eldöntjük, melyik megjelenítési mód lesz a legmegfelelőbb,
megfogalmazunk egy tömör, világos címet,
meghatározzuk melyik a függő, és melyik a független változó, s melyiket milyen tengelyen ábrázoljuk,
skálázzuk a tengelyeket,
megnevezzük a tengelyeket és SI mértékegységet írunk, ahol szükséges,
több változás ábrázolása esetén kiválasztjuk a követendő jelöléseket (több grafikon esetén következetesség!),
berajzoljuk a pontokat,
összekötjük őket (ha szükséges és szabad),
megírjuk a jelmagyarázatot,
ellenőrizzük a munkát.
![]() |
A jégmező kiterjedésének változása különböző évek hónapjaiban.
A grafikonok értelmezésekor hajlamosak vagyunk csupán felületes értelmezésükre, pedig gyakran sokkal többel elmondanak, mint az, első látásra tűnik.
Az ábramagyarázat legfontosabb lépései:
milyen típusú diagramot látunk (pl. kördiagram, vonaldiagram stb.)
vonaldiagram esetén: milyen változókat milyen tengelyeken ábrázolunk (pl. a hónapok függvényében látható a jégmező kiterjedése millió négyzetkilométerben kifejezve)
több változás ábrázolása esetén az egyes jelölések mire vonatkoznak (pl. a folytonos fekete vonal az 1979-2000 évek átlagát, a szaggatott zöld vonal a 2007-es, míg a kék vonal a 2008-as értékeket mutatja)
milyen az egyes változók alakulása (pl. mindhárom változó csökkenő jégmezőt mutat, ahogy a nyári hónapok felé haladunk, szeptemberben érve el a minimumot)
milyen az egyes változók egymáshoz viszonyított helyzete (pl. az 1979-2000-es átlaghoz képest jóval kisebb az egyes hónapokban a 2007-es kiterjedés, és a 2007-esnél valamivel magasabb ugyan a 2008-as, de meredeksége nagyobb)
a látható trendek oka (pl. a jégmező kiterjedésének időbeli csökkenése bizonyára összefüggésben van a klímaváltozással)
a látható trendek lehetséges következményei (pl. ha a jelenlegi tendencia folytatódik, további 20 év múlva jégmentes területek is előfordulhatnak a vizsgált területen a nyári hónapokban)
a lehetséges következmények értékelése (pl. a jégmentes időszak komoly változásokat hozhat a vegetációban).
Tudománynépszerűsítő cikkekben, napilapokban, vagy olyan tájékoztató kiadványokban, ahol nincs mód (vagy szándék!) diagramokat közzétenni, gyakran találkozunk bizonyos adatok szöveges összefoglalásával, magyarázatával. Ezek a magyarázatok gyakran nem kellően átláthatók, ugyanakkor egy-egy jelenségre, megfigyelésre fokozottan rá tudják irányítani a figyelmet. Ahhoz, hogy teljes képet kapjunk, megkísérelhetjük a leírt adatok alapján az eredeti diagram elkészítését. Amennyiben minden szükséges adat rendelkezésünkre áll, ezt sikerrel megtehetjük, de előfordulnak olyan esetek is, amikor bizonyos, a teljes diagram elkészítéséhez feltétlenül szükséges adatokat nem találjuk meg a cikkben.
Az első lépés mindenképpen az adatok kigyűjtése legyen, majd annak eldöntése, hogy tulajdonképpen hány diagramról – hány összetartozó adatsorról – lesz szó. Ezt követi a diagramkészítés a már ismert lépések szerint.
1. Ábrázoljuk grafikusan (a legmegfelelőbb típussal) a következő adatsorokat:
(Használható mm-papír vagy számítógép.)
Feketerigó fészekben talált tojások számának gyakorisága.
Tojások száma (db.) |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
Fészkek száma, amelyekben a fenti számú tojást találták (db.) |
0 |
0 |
0 |
1 |
4 |
11 |
9 |
5 |
2. Ábrázoljuk grafikusan (a legmegfelelőbb típussal) a következő adatsorokat:
Rovarok előfordulása szín szerinti százalékos bontásban különböző élőhelyeken.
|
Élőhely | |||||
Szín |
fakéreg |
fű |
fehér virágok |
sárga virágok |
lila virágok |
szemét |
fekete szürke barna zöld kék piros narancs sárga fehér |
42 11 27 15 1 1 3 0 0 |
53 13 3 10 0 2 0 19 0 |
81 0 9 3 3 0 0 2 2 |
16 0 0 61 0 1 21 1 0 |
95 0 0 1 0 2 0 2 0 |
0 10 10 0 0 10 7 13 50 |
3. Ábrázoljuk grafikusan (a legmegfelelőbb típussal) a következő adatsorokat:
Kapillaritás különböző talajokban.
Idő |
Emelkedés (cm) | |||
óra |
perc |
homok |
agyag |
termőtalaj |
0 0 0 1 1 2 3 4 5 6 7 20 |
00 02 30 00 30 30 30 30 30 30 30 30 |
0.00 13.00 21.50 22.75 23.50 25.00 25.00 25.00 25.00 25.25 25.25 25.25 |
0.00 3.00 8.00 10.50 12.50 15.50 17.75 19.50 21.25 22.50 23.50 32.50 |
0.00 5.50 9.25 10.00 10.50 12.50 13.25 13.25 13.25 14.00 14.50 17.50 |
4. Állapítsuk meg, hogy az alábbiak közül melyeket lehet diszkrét, és melyeket folytonos adatokkal jellemezni.
a. egy városban, az egy év különböző hónapjai folyamán lehullott eső mennyisége milliméterben,
b. egy gépkocsi sebessége kilométer/órában,
c. az Egyesült Államok területén egy adott időben forgalomban lévő 20 dolláros bankjegyek mennyisége,
d. egy egyetemen a több év alatt beiratkozott hallgatók száma.
5. Adjuk meg a következő változók értékkészletét, és állapítsuk meg, hogy diszkrét-e vagy folytonos a változó!
a. egy farmon a hektáronként, több éven keresztül termett burgonya mennyisége tonnában,
b. egy család tagjainak száma,
c. egy személy családi állapota,
d. egy rakéta repülési ideje,
e. egy adott virágon található szirmok száma.
6. A táblázat az Egyesült Államok népességét mutatja (millió főben). Ábrázoljuk ezeket az adatokat!
Év |
1860 |
1870 |
1880 |
1890 |
1900 |
1910 |
1920 |
Népesség |
31.4 |
39.8 |
50.2 |
62.9 |
76.0 |
92.0 |
105.7 |
folytatás:
Év |
1930 |
1940 |
1950 |
1960 |
1970 |
1980 |
Népesség |
122.8 |
131.7 |
151.1 |
179.3 |
203.3 |
226.5 |
7. Ábrázoljuk a következő táblázat adatai a. oszlopdiagram, b. vonaldiagram segítségével!
P farmon az 1975 és 1985 közötti időszakban termesztett burgonya és szalma mennyisége:
Év |
Burgonya mennyisége (tonnában 5 tonnára kerekítve) |
Szalma mennyisége (tonnában, 5 tonnára kerekítve) |
1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 |
200 185 225 250 240 195 210 225 250 230 235 |
75 90 100 85 80 100 110 105 95 110 100 |
8. Az egyes földrészek területeit (millió km-ben) tartalmazza a következő táblázat. Ábrázoljuk az adatokat!
Földrész |
Terület (millió km2) |
Afrika Ázsia (teljes Törökországgal) Európa (Törökország nélkül) Észak-Amerika Óceánia Dél-Amerika SZU (a volt Szovjetunió országai) |
30.3 26.9 4.9 24.3 8.5 17.9 20.5 |
Összesen 133.3 |
9. A táblázat az Egyesült Államok területén 1840 és 1980 között dolgozott mezőgazdasági és nem-mezőgazdasági munkások számát mutatja.
Év |
1840 |
1860 |
1880 |
1900 |
1920 |
Mezőgazdasági munkások (millió fő) |
3.72 |
6.20 |
8.59 |
10.90 |
11.46 |
Nem-mezőgazdasági munkások (millió fő) |
1.70 |
4.33 |
8.80 |
18.17 |
30.97 |
folytatás:
Év |
1940 |
1960 |
1980 |
Mezőgazdasági munkások (millió fő) |
9.22 |
4.19 |
2.33 |
Nem-mezőgazdasági munkások (millió fő) |
43.75 |
65.70 |
103.76 |
10. Magyarázzuk a következő ábrát:
![]() |
Háztartások átlagos energiafogyasztása.
11. Magyarázzuk a következő ábrát:
![]() |
Háztartások melegvíz-ellátottsága.
12. Magyarázzuk a következő ábrát:
![]() |
Egy lakásra jutó energiafogyasztás.
13. Magyarázzuk a következő ábrát:
![]() |
Uniós kiadások megoszlása.
14. Ábrázoljuk az adatokat más diagramtípussal!
![]() |
Szén-dioxid kibocsátás megoszlása.
15. Lehet-e piktogramnak tekinteni a következő ábrákat?
![]() |
Gleccserváltozás.
16. Ábrázoljuk diagramon az alábbi cikk által megfogalmazottakat:
Elindult a Kapcsold k(i) kampány |
2009. febr. |
Kapcsold k(i) kampány arra hívja fel a figyelmet, hogy mindennapi szokásaink apró változtatásával megállíthatjuk az éghajlatváltozást. Ehhez szemléletváltásra, összefogásra, a civil szervezetekkel és helyi közösségekkel való együttműködésre van szükség. |
A hazánkban elfogyasztott energia 38 százalékát a lakosság használja fel, ennek is több mint kétharmadát az épületek fűtéséhez és a meleg víz előállításához. A kampány keretében a főváros és 10 vidéki város forgalmas pontjain „Kapcsold k(i)” figurák adnak energiatakarékossági tippeket az állampolgároknak. A négy hetes kampány az ország lakosságát személyes találkozások, rendezvények, tájékoztató anyagok, és az internet segítségével szeretné mozgósítani.„A Kapcsold k(i) kampánnyal fel szeretnénk hívni a magyar lakosság figyelmét, hogy a környezet védelme nagyrészt tudatosság kérdése. Tudatos energiafelhasználással, nagyobb odafigyeléssel minden egyes háztartásban csökkenthető a pazarló energiafogyasztás, ráadásul hosszú távon jelentős összegeket takaríthatunk meg” - ismertette a kampány üzenetét Gyárfásné dr. Fekete Judit, a Külügyminisztérium főosztályvezető-helyettese. „Az éghajlatváltozás elleni küzdelem az Európai Bizottság és egyben a magyarországi EU-kommunikáció egyik legfontosabb prioritása. A kampányt szoros együttműködésben indítottuk el a többi érintett tárcával és a Bizottsággal. Célunk, hogy a lakosságot is összefogásra ösztönözzük, és a kampány üzenetének továbbítására, valamint az éghajlatváltozás elleni küzdelembe bevonjuk a civil szervezeteket és a helyi közösségeket is.” - tette hozzá. Az EU tagállamai 2008 decemberében fogadták el az ún. klímacsomagot, amelyben vállalták, hogy 2020-ra 20 százalékkal - szélesebb körű nemzetközi megállapodás esetén 30 százalékkal - csökkentik széndioxid kibocsátásukat, hogy 20 százalékkal mérséklik energiafogyasztásukat, valamint, hogy 2020-ra az EU energiafogyasztásának legalább 20 százalékát a megújuló energiaforrások teszik majd ki. A Kapcsold k(i) országos éghajlatváltozás elleni kampány budapesti és vidéki helyszíneken szervezett Zöld Infónapokon és gerilla akciók keretében játékos formában tájékoztatja a lakosságot az energia-megtakarításról. A Zöld Infónapok keretében az érdeklődők kipróbálhatnak egy energia-kerékpárt, amely szemlélteti, hogy saját izomerőnkkel milyen háztartási gépet tudnánk működtetni. Egy lakás makett pedig segít felfedezni egy helység energiapazarló pontjait. A gerilla akciók keretében Kapcsold k(i) jelmezbe öltözött figura ad személyes tájékoztatást a járókelőknek az energia-takarékosság jelentőségéről. A játékos kedvűek a www.euvonal.hu/kapcsoldki honlapon elérhető online játékot is kipróbálhatják, amelyben meg kell találni egy lakás azon pontjait, ahol kis odafigyeléssel megszüntethető az energiapazarlás. |
17. Ábrázoljuk diagramon az alábbi cikk által megfogalmazottakat: |
12 százalékkal nőtt az ásványvízfogyasztás |
2008. febr. |
Magyarországon évek óta folyamatosan nő ásványvíz kiskereskedelmi forgalma, amely a múlt évben mennyiségben 12 százalékkal volt több a tavalyelőtthöz képest, és meghaladta a 880 millió litert - tartalmazza a Nielsen piackutató cég legfrissebb összegzése. |
A bolti eladás értékben meghaladta a 43 milliárd forintot, ami 15 százalékos forgalomnövekedés 2006-ról 2007-re. Az eladott mennyiség közel kétharmada szénsav-dús, ám érzékelhetően emelkedik a szénsavmentes ásványvíz iránti kereslet is. A legtöbb ásványvizet másfél literes palackban vásárolják a fogyasztók. A forgalom mintegy 80 százaléka jut erre a csomagolásra. Ugyanakkor egyre nagyobb a 2 literes palack iránti kereslet. A Magyarországon tavaly keletkezett 885 ezer tonna csomagolási hulladék mintegy 53 százalékát hasznosították újra - mondta Viszkei György, az ÖKO-Pannon Kht ügyvezető igazgatója az ÖKO-Pannon Kht. és az Italoskarton Környezetvédelmi Egyesülés közös sajtótájékoztatóján. A keletkezett hulladék 45 százaléka ipari, 55 százaléka lakossági eredetű. Az ÖKO-Pannon által koordinált lakossági szelektív hulladékgyűjtési rendszerben tavaly 4,7 millió lakosnak 4.500 gyűjtőszigetben volt lehetősége a szelektív gyűjtésre. Viszkei György szerint ezer lakosra egy gyűjtősziget kell. |
18. Ábrázoljuk diagramon az alábbi cikk által megfogalmazottakat:
Rekordütemben olvad az északi-sarki jégmező |
2008. aug. |
A 30 éve folyó műholdas megfigyelés kezdete óta idén nyáron tapasztalták az északi-sarki jégmezők második legnagyobb mértékű olvadását - közölték amerikai tudósok. |
Az augusztus 26-i állapot szerint a jégmező területe ezen a napon csak 5,26 millió négyzetkilométer volt, ami azt jelenti, hogy augusztus 1-től 2,06 millió négyzetkilométernyi területről tűnt el a jégmező. Még több hét telik el addig, amíg a sarki tenger ismét elkezd befagyni az időjárás lehűlése nyomán, addig viszont tovább zsugorodik a jégvilág. Előfordulhat, hogy még az eddigi rekordnál, a 2007 szeptemberében mért 4,25 millió négyzetkilométernél is kisebbre csökken a jégmező. Az adatokat az amerikai országos hó- és jégadatközpont ismertette. A korábbi második legrosszabb értéket 2005-ben mérték, amikor 5,32 millió négyzetkilométerre zsugorodott a jégmező, de akkor augusztusban lelassult az olvadás. Idén ezzel szemben gyors olvadás volt tapasztalható augusztusban. 1979 és 2000 között a jégmezők átlagos területe 7,23 millió négyzetkilométer volt, tavaly ez a szám már 40 százalékkal volt kisebb. Egy "normális" évben az olvadás június közepén kezdődik, szeptember közepén csökken a legkisebbre a jégmező, maximális kiterjedését pedig a lehűlés kezdete után március közepére éri el. Évről évre kisebb területen fagy vissza télre az északi jégmező. Előfordulhat, hogy az idei nyár végére maga az Északi-sark is jégmentes lesz egy időre, amire még nem volt példa a modern időkben, és a vitorlások Alaszkából egyenesen az Északi-sarkra suhanhatnak a hullámokon. Az AFP-t tájékoztató jégszakértő azt sem tartja elképzelhetetlennek, hogy 2030 körül nyáron teljesen eltűnik a jég a Jeges-tengerről. Alig néhány éve ezt még csak 2050-re helyezték kilátásába. A jelenség elsősorban a Csukcs-tenger olvadásának tudható be Alaszka és Szibéria partjainál. Az ottani jégmezők a jegesmedve természetes élőhelyét képezik: eltűnése kihalással fenyegeti a sarki ragadozót, amely a jégmezőkön vadászik a természetes táplálékát képező fókákra. Az olvadás kellemes hozadéka lehet viszont, hogy megnyílik az Észak-nyugati átjáró az Atlanti-óceán és a Csendes-óceán között és könnyebben hozzáférhetővé válnak a térségben a víz alatti szénhidrogén-tartalékok, amelyekre főleg az oroszok és a kanadaiak fenik a fogukat. |
19. Ábrázoljuk, majd magyarázzuk a következő táblázat adatait:
|
Millió autó |
|
|
Idő (év) |
Autók összesen |
Személyautók |
Haszonjárművek |
1935 |
40 |
30 |
10 |
1940 |
50 |
40 |
17 |
1945 |
52 |
45 |
25 |
1950 |
70 |
60 |
32 |
1955 |
90 |
80 |
40 |
1960 |
125 |
110 |
47 |
1965 |
170 |
130 |
54 |
1970 |
240 |
190 |
61 |
1975 |
320 |
250 |
70 |
1980 |
400 |
310 |
90 |
1985 |
480 |
360 |
110 |
1990 |
590 |
430 |
120 |
1995 |
630 |
470 |
140 |
20. Ábrázoljuk, majd magyarázzuk a következő táblázat adatait:
év |
USA népessége (millió fő) |
Föld össz-népessége (millió fő) |
1800 |
|
900 |
1850 |
|
1100 |
1860 |
31,4 |
|
1870 |
39,8 |
|
1880 |
50,2 |
|
1890 |
62,9 |
|
1900 |
76,0 |
1500 |
1910 |
92,0 |
|
1920 |
105,7 |
|
1930 |
122,8 |
|
1940 |
131,7 |
|
1950 |
151,1 |
2400 |
1960 |
179,3 |
|
1970 |
203,3 |
|
1980 |
226,5 |
|
1990 |
|
5200 |
21. Ábrázoljuk diagramon az alábbi cikk által megfogalmazottakat:
Napenergia: Németország a nyerő |
2009. ápr. |
Már csak a negyedik helyen szerepel Japán a különböző országokat az elektromos hálózatba kötött napelemek mennyisége alapján összehasonlító listán. A legtöbb elektromos áramot ma Németországban nyerik a napból. |
Sok éven keresztül Japánban használták a legtöbb napenergiát, de az ázsiai ország a jelek szerint az utóbbi idők során nem fejlesztette jelentős mértékben a megújuló energiákat felhasználó elektromos hálózatát. A Megújuló Energia Szövetség (REN) jelentése szerint, Japán csak a negyedik volt tavaly napenergia használatban a világ országai közül. A legtöbb napelemet, meglepő módon nem a sivatagban, hanem Németországban használták 2008-ban, ott 5400 MWh elektromos energiát nyertek a segítségükkel egy év alatt. Németország után Spanyolországban alakítják át a legtöbb napenergiát elektromos árammá, ott 2300 MWh áramot termeltek ezen a módon tavaly, ami közel 400 MWh-val több, mint a korábban a listát vezető Japán tavalyi teljesítménye. Németország egyébként szélenergiában is európai listavezető (bár világszinten az Egyesült Államok megelőzi): több mint 20 ezer szélturbinája az előállított elektromos energia 8 százalékát termeli, ami nagyjából 25 000 MWh elektromos energiát jelent. |
Table of Contents
Table of Contents
Feladat
Ábrázoljuk, a legmegfelelőbb típusú diagramon:
1. Egy osztályban 30 gyerek magasságát mérték meg. Az adatok cm-ben, a mérés sorrendjében kapott értékeket mutatják.
135, 127, 135, 147, 130, 138, 140, 136, 142, 135, 124, 147, 137, 133, 140, 144, 132, 140, 135, 132, 145, 136, 142, 134, 140, 145, 150, 122, 142, 124.
2. Szirmokat számoltunk a Ranunculus ficaria virágán.
Szirom-szám |
azon virágok száma, amelyen az adott számú szirmot találták |
az összes virág %-ában |
5 6 7 8 9 |
90 550 270 40 10 |
9.38 57.29 28.13 4.17 1.04 |
Biológiai kísérleteink, méréseink és felméréseink során gyakran találkozunk ilyen jellegű adatokkal. Közös jellemzőjük, hogy egy bizonyos tárgy, élőlény, jelenség vagy tulajdonság előfordulásának gyakoriságát mutatják be a vizsgált mintában.
A gyakoriság értékeket gyakorisági táblázatba rendezzük, és gyakorisági diagramban ábrázoljuk.
A gyakorisági diagram olyan oszlopdiagram, ahol az OY-tengelyen gyakoriságot (vagy relatív, vagy százalékos gyakoriságot) ábrázolunk.
A relatív gyakoriság kifejezi, hányad része egy bizonyos gyakoriság az összmintának.
relatív gyakoriság = gyakoriság : minta elemszáma
A százalékos gyakoriságot a relatív gyakoriságból kapjuk, annak százalékban kifejezett értékével egyenlő:
százalékos gyakoriság = relatív gyakoriság . 100 (%)
Azt a gyakorisági diagramot, amelynek OX-tengelye skála, oszlopai egymás mellettiek és azonos vastagságúak, hisztogramnak nevezzük.
A hisztogram oszlopainak területe megmutatja a gyakoriságok eloszlását egy bizonyos mintában. Ugyanekkora területet zár be a vízszintes tengellyel a gyakorisági poligon (gyakorisági görbe) is, tehát ugyancsak a gyakoriságok eloszlását adja meg.
A gyakorisági poligont (gyakorisági görbét) megkapjuk, ha a hisztogramot alkotó téglalapok fedőlapjainak középpontját összekötjük.
Mintapélda
A következő táblázatban azokat az időket adjuk meg a legközelebbi másodpercre (mp) kerekítve, amelyekre 40 egyetemista fiúnak egy feladat megoldásához szüksége volt. Készítsünk gyakorisági eloszlást, hisztogramot és gyakorisági görbét (poligont)!
138, 146, 168, 146, 161, 164, 158, 126, 173, 145, 150, 140, 138, 142, 135, 132, 147, 176, 147, 142, 144, 136, 163, 135, 150, 125, 148, 119, 153, 156, 149, 152, 154, 140, 145, 157, 144, 165, 135, 128.
Megoldás
A leghosszabb idő 176 mp, a legrövidebb 119 mp, így a
terjedelem 176 - 119 = 57 (mp).
Csoportosítsuk a 40 adatot célszerűen 5 másodpercenként a 120, 125, 130, ... értékek köré.
Így közelítőleg
57 / 5 ≅ 11 osztályközt alkotunk,
amely a hisztogram oszlopainak alapja lesz.
A kapott osztályközök 118-122, 123-127, 128-132, ..., de az osztályok valódi határai 117.5, 122.5, 127.5, ... annak érdekében, hogy az OX-tengelyen valódi skálát használhassunk, és a határok ne eshessenek egybe az adatokkal.
Ezen meggondolások alapján rendezzük át adatainkat a következő gyakorisági táblázatba:
idő (mp) |
gyakoriság | |
vonalkák |
szám | |
118-122 123-127 128-132 133-137 138-142 143-147 148-152 153-157 158-162 163-167 168-172 173-177 |
I II II IIII IIIII I IIIII III IIIII IIII II III I II |
1 2 2 4 6 8 5 4 2 3 1 2 |
összesen: 40
Az így elkészített gyakorisági táblázat adatait használjuk fel a hisztogram elkészítéséhez.
![]() |
Az egyetemista fiúk feladatmegoldáshoz szükséges ideje gyakorisági eloszlásának hisztogramja és gyakorisági poligonja.
Megjegyzés
Természetesen léteznek más lehetséges gyakorisági eloszlások is. Hét osztályt és 9 mp-es hosszúságú osztályközt választva kapjuk:
Idő (mp) |
gyakoriság | |
vonalkák |
szám | |
118-126 127-135 136-144 145-153 154-162 163-171 172-180 |
III IIIII IIIII IIII IIIII IIIII II IIIII IIII II |
3 5 9 12 5 4 2 |
összesen: 40
1. Bizonyítsuk be, hogy a hisztogram téglalapjainak területösszege egyenlő a megfelelő gyakorisági görbe (poligon) és az X-tengely által határolt területtel.
2. Ranunculus repens növények hossza (mm-re kerekítve) adott a gyakorisági táblázatban. Ábrázoljuk a gyakorisági eloszlást hisztogrammal és gyakorisági poligonnal!
növényhossz (mm) |
gyakoriság (növények száma) |
1-10 11-20 21-30 31-40 41-50 51-60 61-70 71-80 81-90 |
7 25 63 52 36 27 9 12 1 |
összesen: 232
3. Egy kukoricaföldön található kukorica növények magasságát szeretnénk megtudni egy meghatározott napon, hogy majd összehasonlíthassuk a várható betakarítási időt a jövő évivel. Ehhez 714, véletlenszerűen kiválasztott növény magasságát mértük meg (az adatok a legközelebbi cm-re kerekítve adottak).
Ábrázoljuk a gyakoriságok eloszlását hisztogramon!
osztályszélesség (cm) |
gyakoriság |
24-25 22-23 20-21 18-19 16-17 14-15 12-13 10-11 |
11 45 80 190 220 100 60 8 |
4. Ábrázoljuk hisztogrammal a következő gyakorisági táblázattal adott, nőstény legyek petéinek számát!
nőstényenkénti peteszám |
nőstények száma |
0-49 50-99 100-149 150-199 200-400 |
10 15 15 5 12 |
5. Az Állami Egyetem 80 hallgatójának matematika vizsgáján a következő táblázatban található pontszámok születtek:
68 |
84 |
75 |
82 |
68 |
90 |
62 |
88 |
76 |
93 |
73 |
79 |
88 |
73 |
60 |
93 |
71 |
59 |
85 |
75 |
61 |
65 |
75 |
87 |
74 |
62 |
95 |
78 |
63 |
72 |
66 |
78 |
82 |
75 |
94 |
77 |
69 |
74 |
68 |
60 |
96 |
78 |
89 |
61 |
75 |
95 |
60 |
79 |
83 |
71 |
79 |
62 |
67 |
97 |
78 |
85 |
76 |
65 |
71 |
75 |
65 |
80 |
73 |
57 |
88 |
78 |
62 |
76 |
53 |
74 |
86 |
67 |
73 |
81 |
72 |
63 |
76 |
75 |
85 |
77 |
Rendezzük az adatokat gyakorisági táblázatba, és megfelelő osztályközöket választva ábrázoljuk a gyakoriság eloszlását hisztogramon!
A gyakorisági táblázatban felvett osztályok száma és szélessége önkényesen választható. Ha kellően sok adat áll rendelkezésünkre, egyre keskenyebb osztályokat vehetünk fel, így a hisztogram téglalapjai egyre keskenyebbek lesznek, a gyakorisági poligon „kisimul”. Folytonos görbét azonban csak végtelen sok adat esetén, infinitezimálisan kicsi osztályokat véve kapnánk. Mivel a gyakorlatban ez az ideális eset csak megközelíthető, de el nem érhető, ezt a folytonos görbét elméleti eloszlásnak nevezzük. Többféle elméleti eloszlás ismeretes, a legáltalánosabban ismert (és használt) a normális eloszlás (a Poisson-eloszlás, a binomiális eloszlás stb. mellett).
A normális eloszlás Gauss-görbéje (haranggörbe):
![]() |
Normális eloszlások haranggörbéi.
Közös jellemzőjük, hogy a magasságukra szimmetrikusak, folytonosak és egycsúcsúak.
A görbe jellemző pontjai:
- az eloszlás tipikus értéke (az eloszlás maximumának helye az X-tengelyen), (elméletileg minden entitást lemérve, azok átlagát kiszámítva: , gyakorlatilag egy n elemszámú mintát lemérve, azok átlagát kiszámítva),
- szórás vagy standard deviáció (az eloszlás szélessége), (az inflexiós pontok helye az X-tengelyen), (elméleti, valódi: , gyakorlatban mintából számított: S).
A valóságban a biológiai gyakorisági eloszlások csak ritkán (ha egyáltalán) mutatnak szabályos alakot.
![]() |
Normális eloszláshoz hasonló, valamint „hegyesebb” és „laposabb” eloszlások.
Ha az OX-tengely egységnyi szakaszára eső gyakoriság-csökkenés nem egyforma mértékű a görbe magasságának mindkét oldalán (a tipikus értéknél nagyobbakra és kisebbekre), ferde eloszlásról beszélünk.
![]() |
Ferde eloszlások.
Ha egy eloszlásban több tipikus érték található, többcsúcsú eloszlásról beszélünk.
![]() |
Kétcsúcsú eloszlás.
A szabályos haranggörbe a következő egyenlettel írható le:
![]() |
Az egyenlet általános alakja a normális eloszlás sűrűségfüggvénye:
![]() |
Amely görbe leírható ezzel az egyenlettel, azt normális eloszlásúnak nevezzük. Más szavakkal: azok a görbék mutatnak normális eloszlást, amelyek bármely (x, f(x)) pontjára igaz a fenti (Gauss-) egyenlőség.
Megjegyzés
Annak tesztelésére, hogy egy adatsor normális eloszlást követ-e, a Kolmogorov-Smirnov-próbát használjuk.
Table of Contents
Számtani középérték (közönséges átlag), (átlag).
Kiszámítása:
![]() |
Geometriai értelme: alátámasztási pont.
Módusz (modus): az eloszlás tipikus értéke, a legnagyobb gyakorisággal előforduló érték.
Nem biztos, hogy létezik, és ha létezik sem biztos, hogy egyetlen.
Geometriai értelme: a gyakorisági eloszlás csúcsának megfelelő érték.
Medián: a nagyság szerint sorba állított adatok közül a középsővel (páros számú adat esetén a középső kettő számtani közepével egyenlő.
Geometriai értelme: a mediánban emelt függőleges felezi a görbe alatti területet.
Súlyozott átlag: ha az adatok „nem egyformán fontosak”.
Kiszámítása (wi a súlyozási faktor):
![]() |
Terjedelemközép: a legnagyobb és a legkisebb adat számtani közepe (a „talp” felezőpontja).
1. Egy tudós egy henger átmérőjének tízszeri mérésekor a következő adatokat kapta: 38.8, 40.9, 39.2, 39.7, 40.2, 39.5, 40.3, 39.2, 39.8, 40.6 milliméter. Határozzuk meg a mérések számtani átlagát!
2. Határozzuk meg az 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5 és 4 számok számtani átlagát!
3. 100 számból 20 négyes, 40 ötös, 30 hatos, a maradék pedig hetes. Határozzuk meg az átlagukat!
4. Egy diák záróvizsgán elért eredményei matematikából, fizikából, angolból és egészségtanból rendre 82, 86, 90 és 70 pont. Ha ezekért az eredményekért rendre 3, 5, 3 és 1 kreditpontot kap, határozzuk meg a megfelelő átlagot!
5. A táblázatban közölt adatok alapján számítsuk ki a P&R vállalat 65 alkalmazottjának heti átlagbérét!
Bérek (dollár) |
Alkalmazottak száma (fő) |
250.00 - 259.99 260.00 - 269.99 270.00 - 279.99 280.00 - 289.99 290.00 - 299.99 300.00 - 309.99 310.00 - 319.99 |
8 10 16 14 10 5 2 |
6. Egy diák hat vizsgán elért eredményei 84, 91, 72, 68, 87 és 78 pont voltak. Határozzuk meg a pontszámok mediánját!
7. Hogyan határozzuk meg (a) 85 és (b) 150 sorbarendezett szám mediánját?
8. Határozzuk meg az (a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 és (b) 51.6, 48.7, 50.3, 49.5, 48.9 számhalmazok átlagát, mediánját és móduszát!
Feladat
Rajzoljunk két virágcsokrot (csoportot)! Az elsőben a szálmagasság szórása kicsi legyen, a második rajzolt csokorban a szálmagasság szórása nagy legyen!
Feladat
Rajzoljuk meg a normális eloszlás haranggörbéjét kis szórás esetén, és nagy szórás esetén (hangsúlyozzuk a kettő közötti különbözőséget!
Feladat
Jelöljük be a normális eloszlás haranggörbéjén a következő adatokat:
az átlagtól 1 szórásnyi távolságba eső értékek közé ( m − s s m + s size 12{m-s"s"m+s} {} közé) az adatok 68 %-a esik, illetve 68 % a valószínűsége annak, hogy egy találomra kiválasztott entitás vizsgált változója e két érték közé essen
az átlagtól 2 szórásnyi távolságba eső értékek közé 95 %-a esik az adatoknak
az átlagtól 3 szórásnyi távolságba eső értékek közé 99 %-a esik az adatoknak.
A szórásszámítás menetének megismeréséhez kövessük végig a mintapélda megoldását!
Mintapélda
Számítsuk ki a következő eloszlásban a szórást, ha a táblázat a Monodonta lineata legközelebbi mm-re kerekített szélességét (X) és az értékekhez tartozó gyakoriságokat (f) tartalmazza!
X |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
f |
1 |
1 |
3 |
5 |
11 |
14 |
26 |
18 |
13 |
4 |
1 |
Megoldás
Kiszámítjuk:
az átlagot
az átlagtól való eltéréseket (munkatáblázatot használunk)
az átlagtól való eltérések négyzetét
ezek összegét képezzük (négyzetösszeg: Q, SQ, SS, Σx2)
a variancia (S2) a négyzetösszeg (n-1)-ed része:
![]() |
a szórás a variancia négyzetgyöke:
{}
![]() |
Számításaink eredményét munkatáblázatban rögzítve:
![]() |
Feladat
Egy pékségbe kiflik érkeznek. Találomra kiválasztunk belőlük 20-at. Számítsuk ki a kiflik hosszának átlagát, szórását, és ábrázoljuk hisztogramon is mindezeket!
x |
átl-x |
négyzet | ||
Sorszám |
Kifli (cm) |
átlagtól való eltérés |
(x-átl)2 | |
1. |
7 |
3,3 |
10,5625 | |
2. |
8 |
2,3 |
5,0625 | |
3. |
9 |
1,3 |
1,5625 | |
4. |
9 |
1,3 |
1,5625 | |
5. |
9 |
1,3 |
1,5625 | |
6. |
9 |
1,3 |
1,5625 | |
7. |
9 |
1,3 |
1,5625 | |
8. |
10 |
0,3 |
0,0625 | |
9. |
10 |
0,3 |
0,0625 | |
10. |
10 |
0,3 |
0,0625 | |
11. |
10 |
0,3 |
0,0625 | |
12. |
10 |
0,3 |
0,0625 | |
13. |
10 |
0,3 |
0,0625 | |
14. |
11 |
-0,8 |
0,5625 | |
15. |
11 |
-0,8 |
0,5625 | |
16. |
11 |
-0,8 |
0,5625 | |
17. |
12 |
-1,8 |
3,0625 | |
18. |
13 |
-2,8 |
7,5625 | |
19. |
13 |
-2,8 |
7,5625 | |
20. |
14 |
-3,8 |
14,0625 | |
összesen: |
205 |
57,75 | ||
átlag: |
10,3 |
osztás: |
3,0 |
variancia |
gyökvonás: |
1,7 |
szórás | ||
tehát: 1,7 cm a kiflik szórása | ||||
Ezt a feladatot megoldhatjuk gyakorisági táblázatba rendezett adatokkal is. Figyeljük meg a megoldás menetében azt, hogy amikor az adatok összeadására kerül a sor, a gyakorisággal felszorzott értékekkel kell dolgoznunk (annyiszor kell az adatot hozzáadni, ahány van belőle)!
x |
f | ||||
kiflihossz (cm) |
gyakoriság |
x*f |
átlagtól való eltérés |
(x-átl)2 |
(x-átl)2 *f |
7 |
1 |
7 |
3,3 |
10,5625 |
10,5625 |
8 |
1 |
8 |
2,3 |
5,0625 |
5,0625 |
9 |
5 |
45 |
1,3 |
1,5625 |
7,8125 |
10 |
6 |
60 |
0,3 |
0,0625 |
0,375 |
11 |
3 |
33 |
-0,8 |
0,5625 |
1,6875 |
12 |
1 |
12 |
-1,8 |
3,0625 |
3,0625 |
13 |
2 |
26 |
-2,8 |
7,5625 |
15,125 |
14 |
1 |
14 |
-3,8 |
14,0625 |
14,0625 |
összesen: |
205 |
összesen: |
57,75 | ||
átlag. |
10,3 |
variancia: |
3,0 | ||
szórás: |
1,7 |
Most, hogy már ismerjük a szórás jelentését és kiszámítási módját – azaz lényegét – ellenőrizzük eredményeinket az Excel-program függvényvarázslója segítségével (statisztikai függvények közül válasszuk a szórást)!
Table of Contents
A hibahatárok kiszámításához el kell döntenünk a kívánt biztonsági százalékot, amelyre a konfidenciahatárok vonatkoznak majd. Biológiai mintáknál a 95 % (ritkábban 99 %) biztonság (azaz 5 % illetve 1 % esély megengedett a véletlenre) - ezek az ún. szignifikanciaszintek) használata terjedt el.
A statisztikai t-táblázat segítségével dolgozunk, első lépésként kikeresve innen a kívánt P %-hoz és a mintánk elemszáma által meghatározott FG = n-1 érétékpárhoz tartozó t-értéket.
Ezután az átlag szórását (más néven standard hiba) a következő képlettel számítjuk ki:
![]() |
A számított (gyakorlati) átlag ( X ¯ size 12{ {overline {X}} } {} ) körül P % biztonsággal h1 és h2 értékek között található a valódi (elméleti) átlag.
A h1 és h2 hibahatárok kiszámítása, a
![]() |
képlettel történik.
Mintapélda
Számítsuk ki az előző feladatban megadott adatokból a Monodonta lineata átlagos szélességének 99 %-os biztonsággal állítható konfidenciahatárait!
1. Határozzuk meg az XYZ egyetemen tanuló 100 fiú hallgató testtömegének szórását!
Testtömeg (kg) |
Hallgatók száma |
60-62 63-65 66-68 69-71 72-74 |
5 18 42 27 8 |
2. A táblázat egy általános iskola 480 tanulójának intelligenciahányadosát (IQ) mutatja. Határozzuk meg az átlagot és a szórást!
Osztály-közép (X) |
70 |
74 |
78 |
82 |
86 |
90 |
94 |
98 |
Gyakori-ság (f) |
4 |
9 |
16 |
28 |
45 |
66 |
85 |
72 |
folyt.:
Osztály-közép (X) |
102 |
106 |
110 |
114 |
118 |
122 |
126 |
Gyakori-ság (f) |
54 |
38 |
27 |
18 |
11 |
5 |
2 |
3. Egy egyén reakcióidejének vizsgálatára tíz mérést végeztünk, melynek eredményei 0.27, 0.26, 0.31, 0.33, 0.28, 0.30, 0.27, 0.34, 0.33 és 0.31 mp. Számítsuk ki az átlagot és a szórást!
Határozzuk meg a tényleges reakcióidő (a) 95 %-os és (b) 99 %-os konfidenciaintervallumát (t-táblázat értékeire lesz szükségünk)!
4. Egy borsótáblából tíz, egyenként 1 négyzetméteres véletlenszerűen kiválasztott mintatérről lemérjük a termés tömegét. Számítsuk ki az átlagot és a szórást!
Mekkora a borsótábla várható termése t/ha-ban (milyen értékek közé fog esni a termés hektáronkénti tömege 90 % ill. 99 % biztonsággal)?
A tíz adat (dkg / m2): 13, 16, 10, 14, 15, 13, 11, 14, 17, 11.
Table of Contents
Feladat
Virágszálak hossza, páros cm-re kerekítve:
1. csokor |
|
2. csokor | ||
gyakoriság |
hossz |
gyakoriság |
hossz | |
1 |
30 |
0 |
30 | |
3 |
32 |
1 |
32 | |
4 |
34 |
3 |
34 | |
8 |
36 |
4 |
36 | |
6 |
38 |
10 |
38 | |
3 |
40 |
6 |
40 | |
2 |
42 |
3 |
42 | |
1 |
44 |
2 |
44 | |
1 |
46 |
0 |
46 |
Készítsünk hisztogramot az adatsorokból! (Megoldás)
Számítsuk ki és jelöljük be a két átlagot a hisztogramon! (Megoldás)
Rajzoljuk meg egy általános esetben hogyan néz ki a két minta által meghatározott gyakorisági görbe egymáshoz viszonyított helyzete:
a két átlag nem különbözik lényegesen egymástól,
a két átlag lényegesen különbözik egymástól.
Használjuk a megkezdett ábrát, ahol a két általános helyzetű gyakorisági görbe helyzetét ill. alakját kell az adott kívánalmaknak megfelelően (A és B eset) változtatni, de a két átlag értéke azonos marad mindkét esetben! (Megoldás)
Láthatjuk tehát a két határesetet: a minták átlaga, szórásaiktól függően tekinthető lényegében egyformának vagy lényegesen („szignifikánsan”) különbözőnek:
![]() |
A két egyértelműen eldönthető határeset között szubjektív lehet a döntés, hogy mikortól kezdjük egyformának vagy különbözőnek ítélni az (egyébként matematikailag nem egyenlő) átlagokat. Ennek egzakt eldöntését segíti a t-próba. Olyan paraméteres (a változók normális eloszlását megkövetelő) statisztikai próba, amely annak valószínűségét adja meg, hogy az átlagok egymástól való eltérése csak véletlenül adódott. Amennyiben ez a valószínűség (p) kisebb, mint 5 % (0,05) arra a következtetésre jutunk, hogy szignifikáns eltérés van a két vizsgált átlag között (5 %-os szignifikancia-szinten).
![]() |
Két átlag különbözik-e szignifikánsan vagy sem? Hogyan dolgozik a t-próba?
Tanulmányozzuk át a Wikipédián található információkat a t-próbáról! Az itt található képletek és a t-értékek táblázata segítségével abban az esetben is tudjuk használni a t-próbát, amikor nem ismerjük az egyes változókat, csak az átlagot és a szórást. A számított t-érték meghatározásának képlete:
![]() |
Feladat
Állapítsuk meg az Excel-program segítségével, hogy van-e szignifikáns különbség két pékségből érkező kiflik hossza között! Számítsuk ki az átlagot és a szórást is, valamint ábrázoljuk az adatokat!
kifli hossza cm-ben | ||
sorszám |
x1 |
x2 |
1 |
7 |
8 |
2 |
8 |
9 |
3 |
9 |
10 |
4 |
9 |
10 |
5 |
9 |
11 |
6 |
9 |
11 |
7 |
9 |
11 |
8 |
10 |
11 |
9 |
10 |
11 |
10 |
10 |
11 |
11 |
10 |
12 |
12 |
10 |
12 |
13 |
10 |
12 |
14 |
11 |
12 |
15 |
11 |
12 |
16 |
11 |
12 |
17 |
12 |
12 |
18 |
13 |
12 |
19 |
13 |
13 |
20 |
14 |
14 |
![]() |
Átlag meghatározása Excel-programmal.
![]() |
Szórás meghatározása Excel-programmal.
![]() |
Az adatok ábrázolása Excel-programban.
A t-próba sajátos esetének tekinthetjük az egymintás t-próbát, melynek célja a minta átlagának összehasonlítása egy elméleti (fix) értékkel.
A számításhoz használt képlet:
![]() |
Ismernünk kell az átlagot és a fix értéket – ezek különbsége ha „elég nagy”, akkor kapjuk a próba eredményéül, hogy szignifikánsan eltérnek egymástól. A próba az átlag szórásának (szórás és négyzetgyök mintaelemszám hányadosa) figyelembe vételével állapítja meg, hogy a különbség „elég nagy-e”. A képlet alapján tehát meghatározzuk a számított t-értéket, leolvassuk a táblázati t-értéket, és végül ezeket összehasonlítjuk.
Szignifikáns az átlag eltérése az elméleti értéktől, ha:
tszámított > tP% (táblázati, mely választott P%-hoz és FG = n-1-hez tartozik)
A t-próba egy másik sajátos esetének tekinthetjük a páros t-próbát, melynek célja két olyan minta átlagának összehasonlítása, amelyek esetén az adatok meghatározott párokba rendezettek.
Mintapélda
Állapítsuk meg az adatok alapján, hogy a női és férfi megbetegedések száma között van-e szignifikáns különbség!
Megjegyzés: A feladatnak didaktikai jelentősége van, jegyezzük meg, hogy sem szórásszámítást, sem statisztikai próbát nem végezhetünk n=10 mintaelemszám ill. vizsgálati adat alatt!
Felfedezett és bejelentett új melanoma esetek száma 100 000 főre Magyarországon (rosszindulatú melanoma és melanoma in situ, BNO-10: C43, D03)
év |
nő |
férfi |
2003 |
20,0 |
16,5 |
2004 |
20,5 |
18,5 |
2005 |
23,0 |
20,4 |
2006 |
22,1 |
20,9 |
2007 |
22,7 |
21,0 |
2008 |
26,3 |
25,2 |
Mivel adataink az évek szerint szigorúan párokba rendezettek, páros t-próbát alkalmazunk az Excel-program segítségével:
![]() |
1. Egy fejlesztés alatt álló lázcsillapító hatását tesztelték. A táblázat a bevétel előtti és a bevétel utáni testhőmérsékleteket tartalmazza az egyes betegek esetén, rendre. 5 % szignifikanciaszinten igaz-e, hogy a lázcsillapító hatásos?
Bevétel előtti testhőmérséklet (C) |
38.4 |
38.5 |
39.8 |
38.3 |
39.2 |
38.4 |
38.5 |
39.1 |
39,4 |
38,7 |
Bevétel utáni testhőmérséklet (C) |
37.6 |
37.8 |
37.8 |
38.4 |
37.3 |
38.8 |
37.1 |
38.4 |
39,0 |
37,2 |
2. A múltban egy gép 0.5 mm vastag alátéteket gyártott. Annak eldöntéséhez, hogy a gép megfelelően működik-e most is, egy 10 alátétből álló, 0.53 mm átlagú és 0.03 mm szórású minta áll rendelkezésünkre. Ellenőrizzük (a) 5 %-os, és (b) 1 %-os szignifikanciaszinteken azt a hipotézist, miszerint a gép jól működik.
3. Egy gyár által előállított 6 kötél szakítószilárdságát vizsgálva, az átlag 7750 N, a szórás 145 N, míg a gyártó állítása szerint a kötelek átlagos szakítószilárdsága átlagosan 8000 N.
Alátámasztható-e a gyártó állítása (a) 5 %-os és (b) 1 %-os szignifikanciaszinteken?
4. Egy mezőgazdasági állomáson meg kívánták vizsgálni, hogy egy műtrágya alkalmazása milyen hatással van a búzatermésre. Ennek elvégzésére 24 azonos nagyságú földterületet választottak ki, melyek felét műtrágyával kezelték, a másik felét pedig (ez játszotta a kontrollcsoport szerepét) nem, míg az összes többi feltétel azonos volt. A műtrágyával nem kezelt területek termésátlaga 4.8 kg, szórása pedig 0.40 kg búza volt, míg a műtrágyával kezelt földterületen átlagosan 5.1 kg búza termett, a szórás pedig 0.36 kg volt.
Következtethetünk-e arra (a) 1 %-os, és (b) 5 %-os szignifikanciaszinten, hogy a műtrágya használata lényegesen javítja a termés mennyiségét?
5. Egy ötvözetnek a gyártási előírás szerint 23.2 % rezet kell tartalmaznia. A termék vizsgálatakor 10 elemű mintát vettünk, melyben a réztartalom átlaga 23.5 %, szórása pedig 0.24 % volt. Következtethetünk-e (a) 1 %-os, és (b) 5 %-os szignifikanciaszinten arra, hogy a termék megfelel az előírásnak?
6. Egy szakember azt állítja, hogy egy új berendezés munkába állítása lényegesen csökkentené a termeléshez szükséges időt. A berendezés karbantartásának nagy költségei miatt a vezetőség szerint ahhoz, hogy a berendezést munkába állítsák, annak legalább 8.0 %-kal csökkentenie kell a termeléshez szükséges időt. Ennek vizsgálatára hat kísérletet végeztek, melyek szerint a termeléshez szükséges idő 8.4 %-kal csökkent, 0.32 % szórással. Teszteljük (a) 1 %-os, és (b) 5 %-os szignifikanciaszinten, hogy a berendezés beállítható-e!
7. Egy liter A márkájú benzin felhasználásával öt hasonló gépkocsi azonos feltételek mellett átlagosan 11.3 km-t ment 0.24 km szórással. A másik, B márkájú benzinből egy literrel ugyanezek az autók átlagosan 10.7 km utat tettek meg 0.27 km szórással. Vizsgáljuk meg 5 %-os szignifikanciaszinten azt, hogy az egy literrel megtehető kilométerek számát tekintve az A márka jobb-e mint a B!
8. Egy pszichológia vizsgán egy osztály 12 tanulója átlagosan 78 pontot ért el 6 pont szórással, míg egy másik osztály 15 tanulója átlagosan 74 pontot ért el 8 pont szórással. 5 %-os szignifikanciaszinten döntsük el, hogy az első osztály jobb-e a másodiknál!
9. Egy város egyik kerületében élő 16 tanuló intelligenciahányadosának (IQ) átlaga 107, szórása pedig 10, míg egy másik kerületből való 14 tanuló IQ-jának átlaga 112, szórása 8. Van-e szignifikáns (lényeges) különbség a két csoport IQ-értékei között (a) 1 %-os, és (b) 5 % -os szignifikanciaszinten?
10. Betegség hatását vizsgáljuk a sárgavirágú csillagfürt magasságára. A növényállományból véletlenszerűen kiválasztunk 10 egészséges és 10 beteg növényt. Van-e hatása a betegségnek a növény magasságára, s ha igen, mekkora a hatás?
Beteg (cm) (Xi1) |
87 |
105 |
92 |
81 |
102 |
78 |
94 |
98 |
83 |
96 |
Egészséges (cm) (Xi2) |
72 |
83 |
65 |
94 |
75 |
62 |
81 |
73 |
90 |
66 |
11. Gyűjtsünk még adatokat és egészítsük ki az alábbi táblázatot! Tegyünk fel kérdéseket, amelyeket jelenlegi ismereteink alapján meg tudunk válaszolni! Végezzük el a statisztikai vizsgálatokat és vonjuk le a következtetéseket!
(µg/m3) |
Átlag immisszió | ||||
Város |
2003 |
2004 |
2005 |
2006 |
2007 |
Budapest |
7,4 |
6,7 |
6,6 |
6,9 |
6,4 |
Pécs |
7,9 |
7,1 |
5,8 |
5,5 |
7,3 |
Miskolc |
5 |
3,7 |
4,9 |
5,2 |
4,6 |
Szeged |
7,2 |
4,9 |
5,1 |
7,6 |
4,8 |
Győr |
13,4 |
8,5 |
9,5 |
12,3 |
7,9 |
Debrecen |
5,6 |
6,1 |
6,5 |
6,5 |
6,1 |
Eger |
4,7 |
3,6 |
4,5 |
4,2 |
4,7 |
Nyíregyháza |
5,7 |
6,3 |
7,3 |
6,9 |
6,7 |
Veszprém |
4,9 |
3,1 |
4,4 |
3,6 |
4,5 |
Table of Contents
A Dixon-próbát normális eloszlású sokaság esetén alkalmazhatjuk, az extrém értékek kizárására. A próba eldönti, hogy származhatott-e az illető adat a vizsgált sokaságból.
Mintapélda
Fiatal hízott bikák vágáskori átlagos szívtömegét kívánjuk meghatározni 8 bika szívének tömegéből. Az adatok kilogrammban:
2.2, 2.2, 2.3, 2.1, 1.4, 2.3, 2.0, 2.1.
Van-e az adatok között olyan kiugró érték, amelyet célszerű kizárni az átlagolásból, hogy el ne torzítsa azt?
Megoldás
Megállapítjuk, hogy az 1.4 érték "gyanúsan" kilóg a sorból, ezért erre az adatra végezzük el a próbát. Az adatokat nagyságrendben felsorakoztatjuk, mindig a kiugrótól kezdve:
![]() |
összehasonlítjuk a táblázati r-értékkel:
Ha a számított r-érték meghaladja a táblázatban szabadon választott P %-ra megadott kritikus r-értéket, a kiugró értéket kizárjuk.
rtáblázati (0.554) < rszámított (0.667), ami azt jelenti, hogy kisebb, mint 5 % az esélye annak, hogy a vizsgált érték az illető sokasághoz tartozik.
A vizsgált kiugró értéket tehát ki kell zárni az átlagolásból, mert az eltérésnek kivizsgálandó oka van.
Ez az ok lehet mérési, feljegyzési, vagy egyéb ok, de minden esetben figyelmesnek kell lennünk a kizáráskor, mert lehet, hogy éppen egy ilyen kiugró érték hívja fel a figyelmünket egy, a kísérletek végzésekor elkövetett szisztematikus hibára, vagy valamilyen fontos biológiai jelenségre. A kiugró érték kizárását tehát sohasem szabad mechanikusan végeznünk a Dixon-próba eredménye alapján.
Megjegyzés
Ha több kiugró értékünk van, a módszert folytatólagosan alkalmazhatjuk.
11 mérési adatunk van, két kiugró értékkel. Vizsgáljuk P = 5 %-on a Dixon-próba segítségével, hogy származattak-e ezek az adatok a vizsgált sokaságból, vagy ki kell zárni őket az átlagolásból.
A mérési adatok: 9, 10, 14, 8, 11, 20, 11, 8, 3, 10, 11.
Gyakorló feladat eredménye
Mindkét adatot ki kell zárni, és megvizsgálni az eltérés okát.
Table of Contents
A gyakorlatban két (vagy több) változó között sokszor létezik valamiféle kapcsolat. Például egy légszennyező anyag koncentrációja valamilyen mértékben függ az illető helynek az emittáló forrástól való távolságától, vagy a felnőtt férfiak testtömege függ testmagasságuktól (is). Szükségünk lehet arra, hogy ezt a kapcsolatot a változókat összekötő valamilyen egyenlet felírásával matematikai formába öntsük.
A változókat összekapcsoló egyenlet meghatározásához első lépésben összegyűjtjük az adatokat, és pontdiagramon ábrázoljuk. A pontdiagram alapján gyakran be tudunk rajzolni az ábrába egy olyan sima görbét, amely jól közelíti az adatokat. Ezt a görbét közelítő görbének nevezzük. Az ábrán látható esetben a változók között lineáris kapcsolat:
![]() |
A változók között lineáris kapcsolat van.
A következő ábrán látható esetben pedig nemlineáris kapcsolat fedezhető fel:
![]() |
A változók között a kapcsolat nemlineáris
Görbeillesztésnek azt az általános feladatot nevezzük, amely során egy adott ponthalmazt közelítő görbe egyenletét határozzuk meg.
Ha X a független és Y a függő változó, a közelítő görbék általános egyenletei közül néhány:
![]() |
Görbeillesztéskor meg kell fogalmaznunk sejtésünket a görbe típusára vonatkozóan. Ezt a változók pontdiagramja, vagy a transzformált változók pontdiagramja alapján végezzük (ha pl. log Y-t X függvényében ábrázolva egyeneshez jutunk, az X és Y közötti összefüggés exponenciális).
Egy adathalmazra sokszor egyéni megfontolás alapján is illeszthetünk közelítő görbét. Ezt nevezzük a szabadkézi görbeillesztés módszerének. Ha ismerjük a görbe típusát, akkor az így megrajzolt görbén annyi pontot felvéve, ahány paraméter van az egyenletben, megkaphatjuk a paraméterek értékét, s ezzel az illesztett görbe egyenletét. Egyenes esetén például két, parabola esetén három pontra (tehát összetartozó adatpárra) van szükségünk. A módszernek az a hátránya, hogy a különböző megfigyelők, különböző görbékhez (és nyilván egyenletekhez) jutnak.
A legegyszerűbb közelítő görbe az egyenes, amelynek egyenlete
![]() |
Annak érdekében, hogy az egyenes illesztésénél jelentkező szubjektivitást elkerüljük, egységesen kell definiálni a "legjobban illeszkedő egyenes" fogalmát. Ehhez tekintsük a következő ábrát. Az C n , U n size 12{ left (C rSub { size 8{n} } ,U rSub { size 8{n} } right )} {} adatpontoknak a görbétől való távolsága D n size 12{D rSub { size 8{n} } } {} .
![]() |
Az adatpontoknak a közelítő görbétől való távolsága.
A C görbének az adatokhoz való illeszkedésének jóságát a
![]() |
mennyiséggel mérhetjük. (Ha ez kicsi, az illeszkedés jó, ha nagy, az illeszkedés rossz.) Az összes lehetséges közelítő görbék közül egy meghatározott adathalmazra legjobban illeszkedő görbének azt nevezzük, amelyre
![]() |
értéke minimális.
Az ilyen tulajdonsággal rendelkező egyenest a legkisebb négyzetek módszerével illesztett egyenesnek nevezzük.
Az N adatpárból álló ponthalmazra illeszkedő egyenes egyenletét (melyet Y-nak X-re vonatkozó regressziós egyenesének nevezünk) a következő módon határozzuk meg:
- az egyenlet általános alakja:
![]() |
- ahol a 0 size 12{a rSub { size 8{0} } } {} és a 1 size 12{a rSub { size 8{1} } } {} paramétereket az alábbi egyenletrendszer megoldásával kapjuk :
![]() |
Megjegyzés
Az egyenes egyenletének meghatározásának munkáját lerövidíthetjük, ha az
![]() |
transzformált változókkal dolgozunk. Ekkor az egyenes egyenlete az alábbi módon irható fel:
![]() |
Mintapélda
Szerkesszünk a táblázatban szereplő adatokat közelítő egyenest, és határozzuk meg annak egyenletét.
X |
1 3 4 6 8 9 11 14 |
Y |
1 2 4 4 5 7 8 9 |
Megoldás
- ábrázoljuk derékszögű koordinátarendszerben az (X, Y) pontpárokat, és húzzuk be a pontokat közelítő egyenest.
![]() |
A pontokat közelítő egyenest “szemre” is kihúzhatjuk. Ez a szabadkézi egyenes.
![]() |
- az összegek kiszámításához munkatáblázatot készítünk:
X |
Y |
X2 |
1 3 4 6 8 9 11 14 |
1 2 4 4 5 7 8 9 |
1 9 16 36 64 81 121 196 |
ΣX=56 |
ΣY=40 |
ΣX2 =524 |
![]() |
1. a. Szerkesszünk közelítő egyenest a táblázat adataihoz.
b. írjuk fel az egyenes egyenletét!
c. Határozzuk meg Yi-t, ha X1 = 4, X2 = 15, X3 = 0, valamint
Xj-t Y4 = 7.5 és Y5 = 0 esetben!
d. Határozzuk meg az egységnyi X növekedésének megfelelő
Y változást!
X |
2 3 5 7 9 10 |
Y |
1 3 7 11 15 17 |
2. Határozzuk meg az (l, 5) és (4, -1) pontokon átmenő egyenes (a) egyenletét, (b) Y tengelymetszetét és (c) X tengelymetszetét.
3. Szerkesszünk grafikont, mely az (a) Y = 3X - 5 és a (b) X + 2Y = 4 egyenleteket ábrázolja egy koordinátarendszerben. Melyik pontban metszi egymást a két egyenes?
4. 100 Celsius fokos hőmérséklet 212 Fahrenheitnek felel meg, 0 Celsius fok pedig 32 Fahrenheitnek. Feltéve, hogy a Celsius és a Fahrenheit-skála között lineáris összefüggés áll fenn, határozzuk meg (a) a Celsius és a Fahrenheit-értékek közötti összefüggést leíró egyenletet, (b) a 80 Celsius foknak megfelelő Fahrenheit-értéket, végül (c) a 68 Fahrenheitnak megfelelő Celsius fokot.
Egy növényfajta leveleiből véletlenszerűen vett 12 elemű mintában a levelek milliméterben megadott szélességét és hosszúságát mutatja a táblázat. (Az adatok a legközelebbi egész milliméterre vannak kerekítve.) Rajzoljuk meg az adatok pontdiagramját, szerkesszünk az adatokat közelítő egyenest, határozzuk meg ennek a szabadkézi egyenesnek az egyenletét, valamint a legkisebb négyzetek módszerével illesztett egyenes egyenletét!
szélesség (X mm) |
70 |
63 |
72 |
60 |
66 |
70 |
74 |
hosszúság (Y mm) |
155 |
150 |
180 |
135 |
156 |
168 |
178 |
folyt.:
65 |
62 |
67 |
65 |
68 |
160 |
132 |
145 |
139 |
152 |
Egy 12 elemű mintában az apák (X) és legidősebb fiaik (Y) testtömegét mutatja a táblázat. Készítsünk pontdiagramot, és határozzuk meg Y-nak X-re vonatkozó regressziós egyenesét!
apa (X kg) |
65 |
63 |
67 |
64 |
68 |
62 |
70 |
fiú (Y kg) |
68 |
66 |
68 |
65 |
69 |
66 |
68 |
folyt.:
66 |
68 |
67 |
69 |
71 |
65 |
71 |
67 |
68 |
70 |
7. Illesszen a legkisebb négyzetek módszerével egyenest a táblázat adataira:
X |
3 5 6 8 9 11 |
Y |
2 3 4 6 5 8 |
8. Sok diák közül véletlenszerűen kiválasztott 10 hallgató algebra és fizika vizsgáinak eredményeit tartalmazza a táblázat.
a. Melyik a függő és melyik a független változó?
b. Ábrázoljuk az adatokat!
c. Határozzuk meg az adatokra a legkisebb négyzetek
módszerével illesztett egyenes egyenletét!
Fizika Algebra |
75 80 93 65 87 71 98 68 84 77 82 78 86 72 91 80 95 72 89 74 |
9. A táblázat az Amerikai Egyesült Államok 1000 lakosra jutó születési arányszámának alakulását mutatja 1920 és 1980 között, 10 éves periódusokban.
a. Ábrázoljuk az adatokat, és határozzuk meg az adatokra a legkisebb négyzetek módszerével illesztett egyenes egyenletét.
b. Próbáljuk meg az adatok alapján jelezni a születési arányszámot 2020-ra. Melyek az előrejelzési hiba lehetséges forrásai?
Év |
1920 1930 1940 1950 1960 1970 1980 |
1000 főre jutó születések száma |
27.7 21.3 19.4 24.1 23.7 18.4 15.9 |
10. A táblázat az Amerikai Egyesült Államok 65 éves és idősebb népességének a teljes népességen belüli százalékos arányát mutatja az 1890 - 1980 időszakban.
a. Ábrázoljuk az adatokat, és határozzuk meg az adatokra a legkisebb négyzetek módszerével illesztett egyenes egyenletét.
b. Számítsuk ki az adatokból a 65 éves és annál idősebb lakosság arányát 2020-ra. Melyek az előrejelzési hiba lehetséges okai?
c. Mikorra várható, hogy ez az arány eléri a 25, 35 és 50 százalékot?
Év |
1890 1900 1910 1920 1930 1940 1950 1960 1970 1980 |
Százalék |
3.84 4.05 4.29 4.67 5.40 6.85 8.12 9.30 9.89 11.35 |
Table of Contents
A változók közötti összefüggés szorosságát mutatja a korreláció, aminek segítségével azt akarjuk meghatározni, hogy egy lineáris (vagy más típusú) egyenlet milyen jól magyarázza a változók között fennálló kapcsolatot.
Ha a változók minden értéke pontosan kielégít egy egyenletet, akkor azt mondjuk, hogy a változók tökéletesen korreláltak, vagy azt, hogy tökéletes korreláció van közöttük. Így például a körök C kerülete valamint r sugara között tökéletes korreláció van, hiszen C = 2 ⋅ p ⋅ r size 12{C=2 cdot p cdot r} {} . Ha két kockát százszor feldobunk, akkor a két kockán lévő számok között nincs összefüggés (feltéve, hogy nem cinkelt kockákat használunk), azaz korrelálatlanok. Az olyan változók pedig, mint az emberek magassága és testtömege "valamilyen" mértékű korrelációt mutathatnak.
Két változó esetén egyszerű vagy kétváltozós korrelációról, illetve regresszióról beszélünk.
Ha X és Y jelöli a két vizsgált változót, akkor az (Xi, Yi) pontok elhelyezkedését a derékszögű koordinátarendszerben pontdiagramon vizsgálhatjuk. Ha a diagram összes pontja megközelítőleg egy egyenesre esik, ahogy az ábrán is látható, a korrelációt lineárisnak nevezzük. Ilyen esetekben lineáris egyenlet felel meg a regressziószámítás céljainak.
![]() |
Pozitív lineáris (direkt) korreláció, negatív lineáris (fordított irányú) korreláció.
Ha a pontok valamilyen görbe mentén helyezkednek el, a korrelációt nemlineárisnak nevezzük, és akkor valamilyen nemlineáris egyenlet írja le a regressziót. Ha semmilyen kapcsolat sem mutatkozik a változók között, azt mondjuk, hogy nincs korreláció közöttük:
![]() |
Nincs korreláció a változók között.
Ha számszerűsíteni akarjuk a mintaadatok egyenestől (vagy görbétől) való eltérését, ki kell számolnunk a korreláció mérőszámát. Így kapunk majd információt arra vonatkozóan, hogy milyen szoros korrelációban vannak a változók egymással.
Y-nak X-re vonatkozó, a legkisebb négyzetek módszerével illesztett regressziós egyenese:
![]() |
Ha valamennyi mintapont erre az egyenesre esik, X és Y között tökéletes lineáris korreláció van. Az r mutatót a korreláció együtthatójának (röviden korrelációs együtthatónak) nevezzük, és ebben az esetben értéke +/- 1.
A korrelációs együttható (r) értéke -1 és +1 között változhat, a + és - jelek pozitív illetve negatív lineáris korrelációra utalnak.
1. Megjegyzés
r-nek nincs mértékegysége, így értéke nem függ az alkalmazott egységektől.
2. Megjegyzés
r számított értéke minden esetben csak a feltételezett egyenletre vonatkozólag mutatja a kapcsolat erősségét. Ezért ha lineáris egyenletet feltételezünk, és 0-hoz közeli értéket kapunk, ez azt jelenti, hogy szinte nincs lineáris korreláció a változók között. Ugyanakkor ez nem jelenti azt, hogy egyáltalán nincs korreláció, hiszen ettől még erős nemlineáris korrelációs kapcsolat lehet a változók között. Más szavakkal, a korrelációs együttható a feltételezett egyenlet és az adatok közötti illeszkedés jóságát méri.
3. Megjegyzés
Ha mást nem kötünk ki, a korrelációs együttható kifejezés általában lineáris korrelációs együtthatót jelöl.
4. Megjegyzés
Egy erős korrelációs együttható (+1-hez vagy -1-hez közeli) nem szükségszerűen jelenti a változók közvetlen összefüggését. Előfordulhat például, hogy erős korreláció mutatkozik a kiadott könyvek és a felvett utcaseprők száma között. Az ilyen esetekre azt mondjuk, hogy képtelen vagy hamis a korreláció.
Mintapélda
a. Számítsuk ki a táblázatban adott X és Y változók közötti lineáris korrelációs együtthatót!
b. Számítsuk ki X szórását és Y szórását!
X |
1 3 4 6 8 9 11 14 |
Y |
1 2 4 4 5 7 8 9 |
Megoldás
![]() |
l. A táblázat az Amerikai Egyesült Államok élelmiszerekre és az egészségügyi ellátás kiadásaira vonatkozó fogyasztói árindexeit tartalmazza 1975 és 1983 között, 1967-hez, mint bázisévhez viszonyítva (1967 = 100). Számítsuk ki a két index közötti korrelációs együtthatót!
Év |
1975 |
1976 |
1977 |
1978 |
1979 |
1980 |
1981 |
1982 |
1983 |
Élelmiszer |
175 |
181 |
192 |
211 |
235 |
255 |
275 |
286 |
292 |
Egészség-ügyi ellátás |
169 |
185 |
202 |
219 |
240 |
266 |
295 |
329 |
357 |
2. Végezzük el a korrelációs együttható kiszámítását a legkisebb négyzetek módszerével illesztett egyenesekhez kapcsolódó feladatok esetén (l. előző fejezet).
Table of Contents
A sokaságokra vonatkozó különféle feltevéseket hipotéziseknek, az azok helyességének mintavételi eredményekre alapozott vizsgálatát pedig hipotézisvizsgálatnak nevezzük. A hipotézisek a vizsgált sokaság(ok) eloszlására, vagy az adott eloszlás(ok) egy vagy több paraméterére vonatkozhatnak. A különféle hipotézisek vizsgálatára szolgáló eljárásokat próbáknak - más néven teszteknek - hívjuk. A hipotézisvizsgálat lényegében mindig annak mérlegelése, hogy a vizsgálat tárgyának megfelelő sokaságra vonatkozó valamely állítás mennyire hihető a mintavétel eredményeinek tükrében.
A hipotézis- és szignifikanciatesztek legtöbbje különböző feltevéseket követel meg azon sokaság eloszlására, amelyből a mintát vettük (például a sokasági eloszlásnak normálisnak kell lennie). A gyakorlatban előfordulnak olyan esetek, amikor ilyen feltételezésekkel nem élhetünk, vagy érvényességük kétséges (például amikor a sokaság eloszlása nagyon ferde). Emiatt a statisztikusok különböző próbákat és módszereket dolgoztak ki, amelyek függetlenek a sokaság eloszlásától és az eloszlás paramétereitől. Ezeket hívjuk nemparaméteres próbáknak. A nemparaméteres próbák jóval szélesebb körben olyan esetekben is használhatók, amikor nem teljesülnek az egy-egy adott hipotézis helyességének ellenőrzésére használható paraméteres próbák alkalmazási feltételei. Ennek természetesen ára is van. Az, hogy a nemparaméters próbák ereje általában kisebb az ugyanazon hipotézis helyességének ellenőrzéséhez használható, de több alkalmazási feltételt támasztó paraméteres próbák erejénél. De a nemparaméters próbák használata sok esetben nem egyszerűen szabad elhatározás kérdése, hanem igen gyakran a paraméteres próbák alkalmazási feltételeinek nem teljesülése miatti kényszerűség. (Időnként előfordul, hogy a nemparaméteres próbákat bonyolultabb próbák helyett egyszerűbb megoldásként használjuk.)
Amikor ki kell választanunk a hipotézis ellenőrzésére használható próbát, akkor a szóba jövő próbák közül mindig azt válasszuk ki, amely az adott esetben ténylegesen teljesülő feltételek mindegyikét hasznosítja. Hacsak lehet, paraméteres próbát válasszunk! A szigorúbb alkalmazási feltételeket támasztó, illetve a paraméteres próbák ugyanis nagyobb erővel bírnak, mint a kevesebb feltétel teljesülését igénylő nemparaméteres próbák.
Ilyen választási lehetőség a gyakorlatban azonban ritkán fordul elő (inkább csak akkor, ha valamely - egyébként teljesülő - alkalmazási feltételt tudatosan kihasználatlanul hagyunk a hipotézisvizsgálat során).
A próbák - szigorúan véve - csak akkor használhatók, ha alkalmazásuk feltételei mindegyike teljesül. Egy próbát valamely feltétel szempontjából akkor szokás robusztusnak nevezni, ha az adott feltétel teljesülésének hiánya vagy nem pontos teljesülése nem gyakorol lényeges befolyást a próbával elkövethető hiba elkövetési valószínűségére. Ezért a próbák robusztusságának vizsgálata igen nagy gyakorlati jelentőségű kérdés. Ugyanakkor - legalábbis teljes általánosságban - csak igen nehezen vizsgálható. Az effajta vizsgálatok ugyanis szinte kizárólag csak mesterségesen létrehozott mintákkal vagy mesterséges mintaismétlésekkel nyert eredmények tanulmányozására alapozhatók. Ebből adódóan az eredmények csak nehezen általánosíthatók.
Néhány próba, és alkalmazási területe:
- Egymintás t-próba - paraméteres próba, normális eloszlást követel meg. Vizsgálja, hogy a minta várható értéke egyenlő-e egy bizonyos értékkel (vajon: μ=μ0) (például a margarinos dobozokban található termék tömege szignifikánsan eltér-e a dobozra nyomtatott adattól).
- Khi-négyzet-próba - illeszkedésvizsgálathoz használt nemparaméteres próba (például: szignifikánsan eltérnek-e a gyakorlatban kapott eredmények egy bizonyos genetikai modell elméletileg számítható értékeitől).
- Kétmintás t-próba - paraméteres próba. Két minta várható értékét hasonlítja össze (vajon: 1=2). Megállapítható segítségével, hogy a két minta szignifikánsan eltér-e egymástól (például: az újfajta gyógyszerrel kezelt betegek hamarabb meggyógyulnak-e, mint a hagyományos módszerrel kezelt betegek).
- Mann-Whitney-féle U-próba - nemparaméteres próba. Segítségével eldönthető, van-e különbség a minták között, azaz ugyanabból a sokaságból származnak-e. Kettőnél több sokaság összehasonlítására az ún. Kruskal-Wallis-próbát használjuk.
- A Kruskal-Wallis-féle H-próba (röviden H-próba) az U-próba általánosítása k számú mintára. Olyan nemparaméteres próba, amely segítségével eldönthetjük, hogy k számú minta ugyanabból a sokaságból származik-e, tehát van-e különbség a minták között.
- F-próba - paraméters próba, ugyanis normális eloszlást feltételez. Két sokaság varianciáját (szórását) hasonlítja össze (vajon: s X 2 = s Y 2 size 12{s"" lSub { size 8{X} } lSup { size 8{2} } =s"" lSub { size 8{Y} } lSup { size 8{2} } } {} ). Kettőnél több sokaság esetén a Bartlett-próbát használjuk.
- Bartlett-próba - paraméteres próba, több normális eloszlású sokaság varianciájának (szórásának) egyenlőségét vizsgálja (vajon: s 1 2 = s 2 2 = K = s n 2 size 12{s"" lSub { size 8{1} } lSup { size 8{2} } =s"" lSub { size 8{2} } lSup { size 8{2} } =K=s"" lSub { size 8{n} } lSup { size 8{2} } } {} ) .
- Varianciaanalízis: Sok esetben szükség lehet annak vizsgálatára, hogy három vagy több mintaátlag között szignifikáns-e az eltérés. Ennek eldöntése a varianciaanalízis célja. Több normális eloszlású, azonos varianciájú sokaság várható értékének összehasonlítására alkalmazzuk (vajon: m 1 = m 2 = K = m n size 12{m rSub { size 8{1} } =m rSub { size 8{2} } =K=m rSub { size 8{n} } } {} ). Eredménye lehet: "a várható értékek egyformák", illetve "nem minden várható érték egyforma". (Például: a hét különböző napjain eladott kenyérmennyiség egy boltban egyforma-e?)
Befejezésképpen néhány szót arról, hogy a hipotézisvizsgálat milyen szerepet tölthet be a gyakorlatban.
A próbák legkézenfekvőbb hasznosítása talán a mintavételen alapuló minőségellenőrzés, melynek alapvető formái a méréses és minősítéses ellenőrzés. Mindkét esetben a termelésből vett véletlen minták elemei kerülnek ellenőrzésre. Az első esetben azok valamilyen számszerű jellemzőjének megmérése, a másodikban pedig az egyes mintaelemek selejtesnek vagy hibátlannak minősítése útján.
A próbák annak eldöntésére is igen jól használhatók, hogy a két vagy több mintavétel révén nyert adat, mutatószám egymástól való eltérése, vagy egy sokaság egyetlen mintából becsült számszerű jellemzőjének valamilyen bázisnak tekinthető értéktől való eltérése nem csak a véletlen játéka-e, azaz nem csak a mintavételi ingadozások következménye-e. Az adatok egymástól vagy egy valamilyen szempontból kívánatosnak tartott szinttől való eltérése ugyanis nyilván csak akkor igényel külön magyarázatot, további elemzést, ha az nem a mintavétellel szükségszerűen együtt járó véletlenszerű ingadozásoknak tulajdonítható. E kérdés tisztázása különösen akkor fontos, ha az eredmények kis mintákból származnak. A próbák pedig éppen ennek az eldöntésére szolgáló eszközök.
ALGORITMUSOK A STATISZTIKAI MÓDSZER KIVÁLASZTÁSÁRA
(forrás: gdfinfo3.ingyenweb.hu/3mappa/statisztikai/stat.szoft_könyv.doc)
Néhány kiválasztási módszert ismertetünk az alkalmazandó statisztikai módszer kiválasztására. A rengeteg ismert módszer miatt nem törekedtünk teljességre, inkább csak a leggyakrabban előforduló eljárásokat érintjük.
SZÖVEGES ALGORITMUS
1. Egy minta van
1.1 Minden változónak egy mért értéke van
1.1.1 Két változó kapcsolatának vizsgálata
a. Mindkét változó hányados típusú
Korreláció
Regresszió
b. Egyik változó ordinális típusú
Spearmann-féle rangkorreláció
c. Egyik változó nominális típusú
Kontingencia együttható
Asszociációs együttható (2x2-es)
Fisher próba (2x2-es)
1.1.2 Több változó kapcsolatának vizsgálata
Regresszió
1.1.3 Irodalomban talált vagy sejtett értékkel való összehasonlítás
a. Normalitásvizsgálat
Kolmogorov-Szmirnov próba
b. Eloszlásvizsgálat
Homogenitás vizsgálat
Illeszkedés vizsgálat
c. Adott átlaggal való összevetés
t-próba (1. pont)
1.1.4 Kiugró érték ellenőrzése
Dixon próba
1.2 Minden változónak két vagy több mért értéke van (pl kezelés előtt-után vagy 1. asszisztens mérése, 2. asszisztens mérése,...)
1.2.1 Páros értékek összehasonlítása
Előjel próba 1. eset
1.2.2 Páros értékek mediánjának összehasonlítása
Előjel próba 2. eset
1.2.3 Eloszlásvizsgálat
Friedman-Kendall próba
1.2.4 Két középérték összehasonlítása
páros, normális: Páros t-próba
páros, nem normális: Wilcoxon féle előjeles rangpróba
2. Kettő vagy több független minta van
2.1 Minták átlagainak összehasonlítása
2.1.1 Két minta, ordinális változók esetén
Mann-Whitney féle U próba
2.1.2 Két minta, normális esetben
t-próba 2. eset
2.1.3 Párosított minták
Páros t-próba
Wilcoxon féle előjeles rangpróba
2.1.4 Több minta
- normális esetben
Variancia analízis
- nem normális esetben
Kruskal-Wallis próba
2.2 Minták szórásainak összehasonlítása
a. Két minta esetén
F-próba
b. Több minta esetén
Bartlett próba
2.3 Két minta eloszlásának összehasonlítása
a. Mindkét minta ugyanannyi
csoportra van osztva
Homogenitás vizsgálat
b. Mint előző, csak két csoporttal
Valószínűségek összehasonlítása
Fisher próba
c. Nem kell csoport beosztás
Wald-Wolfovitz próba
3. Valamely minta csoportokra való osztása
Cluster analízis
4. Meglévő csoportokba besorolás
Diszkriminancia analízis
5. Véletlenszerűség vizsgálata
Iteráció próba
6. Konfidenciaintervallum megadása
Középérték, Medián, Szórás,
Variációs együttható,
Relatív gyakoriság
7. Vizsgálati módszerek összehasonlítása:
a. két módszer esetén
McNemar próba
b. több módszer esetén
Cochran féle Q-próba
8. Tulajdonság előfordulásának gyakorisága
Binomiális próba
9. Egyéb
Forduljon matematikushoz!