Lineární regrese - kurz 4900 rub. od Otevřené vzdělávání, školení 5 týdnů, cca 2 hodiny týdně, Datum 29. listopadu 2023.
Různé / / November 29, 2023
Pokud korelační analýza umožňuje kvantifikovat sílu a směr vztahu mezi dvěma veličinami, pak konstrukce regresních modelů poskytuje větší příležitosti. Pomocí regresní analýzy je možné kvantitativně popsat chování studovaných veličin v závislosti na prediktorových proměnných a získat predikce na nových datech. Naučíte se vytvářet jednoduché a vícenásobné lineární modely pomocí jazyka R. Každá metoda má svá omezení, proto vám pomůžeme pochopit, v jakých situacích lineární regresi lze a nelze použít a my vás naučíme metody diagnostiky vybraných modely. Zvláštní místo v kurzu je věnováno hloubkové anatomii regresní analýzy: zvládnete operace s maticemi, které jsou základem lineární regrese, aby bylo možné porozumět složitějším varietám lineárních modely.
Pokud stojíte před potřebou hledat a popsat vztahy mezi určitými jevy, které lze kvantitativně měřit, pak je tento kurz dobrou příležitostí pochopit, jak jednoduchá a vícenásobná lineární regrese funguje, dozvědět se o jejích možnostech a omezeních metody.
Kurz je určen pro ty, kteří již znají základní techniky analýzy dat pomocí jazyka R a s tvorbou jednoduchých .html dokumentů pomocí rmarkdown a knitr.
Vědecké zájmy: struktura a dynamika společenstev mořského bentosu, prostorová měřítka, sukcese, mezidruhové a vnitrodruhové biotické interakce, růst a rozmnožování mořských bezobratlých, demografická struktura populací, mikroevoluce, biostatistika.
Kurz se skládá z 5 modulů:
1. Korelační analýza. Jednoduchá lineární regrese
Začneme rozhovor o metodách numerického popisu vztahů mezi kvantitativními veličinami s kovariančními a korelačními koeficienty, které nám umožňují odhadnout sílu a směr vztahu. Poté se dozvíte, jaké další informace o vztazích lze získat sestrojením lineárního modelu vztahu mezi veličinami. Naučíte se interpretovat regresní koeficienty a naučíte se, kdy a jak lze lineární modely použít k předpovědím nových dat. Na konci tohoto modulu se naučíte, jak sestavit rovnici lineárního modelu a vykreslit ji s oblastí spolehlivosti.
2. Testování významnosti a platnosti lineárních modelů
Sestavení lineárního modelu a zapsání jeho rovnice je pouze úplným začátkem analýzy. V tomto modulu se naučíte, jak popsat výsledky regresní analýzy: jak otestovat statistickou významnost celkového modelu nebo jeho koeficientů a posoudit kvalitu shody. Lineární modely (nebo spíše statistické testy, které se k nim používají), jako každá metoda, mají svá omezení. Dozvíte se, jaká jsou tato omezení a odkud pocházejí. Grafické diagnostické metody, které budeme používat, jsou univerzální pro různé lineární modely – více praxe vám pomůže rozhodovat se jistěji. Jakmile tomu všemu porozumíte, můžete napsat kompletní skript v R tak, aby vyhovoval, diagnostikoval a prezentoval výsledky jednoduché lineární regrese.
3. Stručný úvod do světa lineární algebry
V tomto modulu se ponoříme do srdce lineárních modelů. K tomu se budete muset naučit nebo si zapamatovat základy lineární algebry. Probereme různé typy matic, jak je vytvořit v R a základní operace s nimi. To vše budeme potřebovat, abychom pochopili, jak lineární regrese funguje zevnitř. Dozvíte se, co je to modelová matice, naučíte se napsat lineární regresní rovnici ve formě matic a najít její koeficienty. Na vlastní oči uvidíte kloboukovou matici, která umožňuje získat predikované hodnoty, a dokonce si ji budete moci ručně spočítat. Nakonec se naučíte vypočítat zbytkový rozptyl, matici rozptylu-kovariance a toto vše využít k vybudování regresní zóny spolehlivosti. Pak vám tyto znalosti pomohou pochopit strukturu složitějších modelů: s diskrétními prediktory, s různými distribucemi reziduí, s jinou strukturou variační-kovarianční matice.
4. Vícenásobná lineární regrese
Nejčastěji jsou vztahy mezi veličinami složitější, než je možné popsat pomocí jednoduché lineární regrese. Vícenásobná lineární regrese se používá k popisu toho, jak proměnná odezvy závisí na více prediktorech. S výskytem více prediktorů v modelu má lineární regrese novou podmínku použitelnosti - požadavek absence multikolinearity. V tomto modulu se naučíte identifikovat multikolinearitu a jak se jí vyhnout. A konečně, ve více modelech je často více proměnných, než je možné znázornit na rovině, Proto vás naučíme jednoduché techniky, které vám i v tomto pomohou vytvořit informativní grafiku pouzdro.
5. Porovnání lineárních modelů
Více lineárních modelů je jako stavebnice: složitější modely lze rozebrat a zjednodušit. Dozvíte se, jak se vnořené modelové srovnání pomocí parciálního F testu používá k testování významnosti jednotlivých prediktorů nebo skupin prediktorů. Složitější modely lépe popisují původní data, ale přílišné komplikace jsou nebezpečné, protože takové modely začnou dělat špatné předpovědi nových dat. Pomocí dílčích F testů můžete zjednodušit modely postupným odstraňováním nevýznamných prediktorů. Zjednodušené modely se snáze používají k interpretaci a prezentaci výsledků. Vše, co jste se dosud o lineární regresi naučili, lze použít dokončením projektu analýzy dat tam, kde to potřebujete správně sestavit optimální vícenásobný lineární model a prezentovat jeho výsledky ve zprávě napsané pomocí rmarkdown a pletař.