Zobecněné lineární modely - kurz 3600 rub. od Otevřené vzdělávání, školení 3 týdny, cca 6 hodin týdně, Datum 29. listopadu 2023.
Různé / / December 01, 2023
Jednou z podmínek použitelnosti konvenčních lineárních modelů je nezávislost pozorování na sobě, na základě kterých je model vybrán. V praxi však často nastávají situace, kdy je uspořádání sbírky materiálu takové, že porušení této podmínky je nevyhnutelné. Představte si, že jste se rozhodli sestavit model, který popisuje vztah mezi výkonem v tělesné výchově a výsledky IQ testů mezi studenty. K vyřešení tohoto problému jste vytvořili řadu vzorků v několika institucích. Je možné taková data spojit do jedné analýzy sestavené podle tradičního schématu? Samozřejmě že ne. Studenti na každé univerzitě si mohou být v některých ohledech podobní. I povaha vztahu mezi zkoumanými veličinami může být poněkud odlišná. Tento typ dat, ve kterých existují vnitroskupinové korelace, by měl být analyzován pomocí lineárních smíšených modelů. Ukážeme, že některé prediktory by měly být zahrnuty do modelu jako tzv. „náhodné faktory“. Dozvíte se, že náhodné faktory mohou být hierarchicky podřízeny. Probereme, jak lze takové smíšené modely sestavit pro závislé proměnné, které sledují různé typy distribucí. Navíc si ukážeme, že náhodná část modelu může být ještě složitější – může mít složku, která modeluje chování rozptylu v reakci na vliv kovariátu. Na konci kurzu najdete projekt, ve kterém si můžete procvičit vytváření smíšených modelů výběrem jednoho z několika datových sad. Na základě analýzy těchto dat můžete vytvořit zprávu v tradici reprodukovatelného výzkumu.
Docent, Katedra zoologie bezobratlých, Fakulta biologie, St. Petersburg State University, Ph.D.
Vědecké zájmy: struktura a dynamika společenstev mořského bentosu, prostorová měřítka, sukcese, mezidruhové a vnitrodruhové biotické interakce, růst a rozmnožování mořských bezobratlých, demografická struktura populací, mikroevoluce, biostatistika.
Kurz se skládá ze 4 modulů:
1) Úvod do zobecněných lineárních modelů
Zobecněné lineární modely (GLM) umožňují modelovat chování veličin, které nesledují normální rozdělení. Abychom vám usnadnili první krůčky ve světě GLM, analyzujeme jejich strukturu na příkladu GLM pro normálně rozložené veličiny – můžete tak kreslit paralely s jednoduchými lineárními modely. Dozvíte se, co je to funkce odkazu, jak funguje maximální pravděpodobnost a jak testovat hypotézy GLM pomocí Waldových testů a testů poměru pravděpodobnosti.
2) Problém výběru modelu
V tomto modulu budeme hovořit o metodických otázkách spojených s budováním modelů. Model je zjednodušenou reprezentací reality a volba mezi různými konkurenčními metodami takového zjednodušení je pro analytika častým úkolem. V tomto modulu se naučíte porovnávat modely pomocí informačních kritérií. Probereme hlavní možnosti analýzy při výběru modelů a pohovoříme o potížích vznikajících v souvislosti se skrytou mnohostí modelů. Nakonec vás naučíme rozpoznat hlavní typy zneužití výběru modelu (data-fishing, p-hacking).
3) Zobecněné lineární modely pro počítání dat
V tomto modulu probereme základní metody pro modelování spočetných veličin. Nejprve si probereme, proč běžné lineární modely nejsou vhodné pro počítání dat. Vlastnosti počitatelných distribucí vám pomohou pochopit rozdíly mezi typy GLM pro počitatelná data a funkcemi jejich diagnostiky. Funkci odkazu uvidíte v práci, když si vizualizujete předpovědi GLM na stupnici funkce odkazu a na stupnici proměnné odezvy.
4) Zobecněné lineární modely s binární odezvou
Někdy je potřeba simulovat, zda k nějaké události došlo nebo ne, zda se fotbalový tým nebo prohrál, zda se pacient po léčbě uzdravil či nikoli, zda se klient dopustil koupit nebo ne. Konvenční lineární modely nejsou vhodné pro modelování takových binárních dat (událostí se dvěma výsledky), ale to lze snadno provést pomocí zobecněných lineárních modelů. V tomto modulu se naučíte modelovat pravděpodobnosti výskytu událostí tak, že je budete reprezentovat jako šance. Podíváme se, jak funguje funkce logit link a jak se při jejím použití interpretují koeficienty GLM. Nakonec si budete moci procvičit analýzu zobecněných lineárních modelů s různými distribucemi dokončením projektu analýzy dat. Výsledky této analýzy bude třeba prezentovat jako zprávu ve formátu html napsanou pomocí rmarkdown/knitr.
• Zjistěte, jaké dovednosti jsou potřeba, abyste mohli začít s analytikou a datovou vědou• Naučte se pracovat s Excelem, SQL, Power BI, Google Data Studio data a napište svůj první kód v Pythonu• Získejte průvodce krok za krokem a naučte se, jak vstoupit do oboru datové vědy a vybrat si roli v Data Science
4,4
1 490 ₽