Matematika a strojové učení pro datovou vědu - kurz 50 040 RUB. ze SkillFactory, školení 5,5 měsíce, Datum: 13. srpna 2023.
Různé / / November 29, 2023
Budete moci studovat odkudkoli na světě. Nové moduly budou otevřeny jednou týdně. Speciálně navržený obsah a další materiály vám pomohou porozumět tématu.
Cvičení se skládá ze tří částí: provedení jednoduchých výpočtových cvičení; provádění cvičení založených na Pythonu; řešení životních problémů v oblasti analýzy dat, prognózování a optimalizace.
Se svými spolužáky budete neustále komunikovat na soukromých kanálech Slack. Pokud něčemu nerozumíte nebo si s nějakým úkolem nevíte rady, pomůžeme vám na to přijít.
Na konci kurzu dostanete speciální úkol, ve kterém budete moci uplatnit všechny získané dovednosti a potvrdit své úspěšné naučení látky.
Program kurzu matematiky
Část 1 - Lineární algebra
- Studujeme vektory a typy matic
- Naučit se provádět operace s maticemi
- Určení lineární závislosti pomocí matic
- Studujeme inverzní, singulární a nesingulární matice
- Studujeme soustavy lineárních rovnic, vlastních a komplexních čísel
- Zvládnutí matice a singulární dekompozice
- Řešení úloh lineární závislosti pomocí matic
- Optimalizace pomocí metody hlavních komponent
- Posílení matematických základů lineární regrese
Část 2 - Základy matematické analýzy
- Studujeme funkce jedné a mnoha proměnných a derivací
- Zvládnutí pojmu gradient a gradient sestupu
- Školení v optimalizačních problémech
- Studujeme Lagrangeovu multiplikační metodu, Newtonovu metodu a simulované žíhání
- Problémy predikce a hledání vítězné strategie řešíme pomocí derivačních a numerických optimalizačních metod
- Posílení matematiky za gradientním klesáním a simulovaným žíháním
Část 3 - Základy pravděpodobnosti a statistiky
- Studujeme obecné pojmy deskriptivní a matematické statistiky
- Zvládnutí kombinatoriky
- Studujeme hlavní typy distribucí a korelací
- Pochopení Bayesova teorému
- Naučte se naivní Bayesův klasifikátor
- Řešíme problémy kombinatoriky, validity a prognózování pomocí statistiky a teorie pravděpodobnosti
- Upevňujeme matematické základy klasifikace a logistické regrese
4. část - Časové řady a další matematické metody
- Představujeme analýzu časových řad
- Zvládnutí složitějších typů regresí
- Prognóza rozpočtu pomocí časových řad
- Posílení matematických základů klasických modelů strojového učení
Stručný program kurzu o strojovém učení
Asistence lektora během školení
Modul 1 - Úvod do strojového učení
Seznamujeme se s hlavními úkoly a metodami strojového učení, studujeme praktické případy a aplikujeme základní algoritmus pro práci na projektu ML
Řešíme více než 50 problémů, abychom téma posílili
Modul 2 - Metody předběžného zpracování dat
Studujeme datové typy, učíme se čistit a obohacovat data, používáme vizualizaci pro předběžné zpracování a ovládáme inženýrství funkcí
Pro posílení tématu řešíme více než 60 problémů
Modul 3 - Regrese
Ovládáme lineární a logistickou regresi, studujeme meze použitelnosti, analytickou inferenci a regularizaci. Tréninkové regresní modely
Pro posílení tématu řešíme více než 40 problémů
Modul 4 - Shlukování
Zvládáme učení bez učitele, procvičujeme jeho různé metody, pracujeme s texty pomocí ML
Řešíme více než 50 problémů, abychom téma posílili
Modul 5 - Stromové algoritmy: úvod do stromů
Pojďme se seznámit s rozhodovacími stromy a jejich vlastnostmi, osvojit si stromy z knihovny sklearn a pomocí stromů vyřešit regresní problém
Pro posílení tématu řešíme více než 40 problémů
Modul 6 - Stromové algoritmy: soubory
Studujeme vlastnosti stromových souborů, cvičíme posilování, používáme soubor k budování logistické regrese
Pro posílení tématu řešíme více než 40 problémů
Účastníme se soutěže na kaggle pro výcvik stromového modelu
Modul 7 - Hodnocení kvality algoritmů
Studujeme principy dělení vzorků, pod- a overfitting, hodnotíme modely pomocí různých měřítek kvality, učíme se vizualizovat proces učení
Hodnocení kvality několika ML modelů
Pro posílení tématu řešíme více než 40 problémů
Modul 8 – Časové řady ve strojovém učení
Seznámíme se s analýzou časových řad v ML, zvládneme lineární modely a XGBoost, prostudujeme si principy křížové validace a výběru parametrů
Řešíme více než 50 problémů, abychom téma posílili
Modul 9 – Systémy doporučení
Studujeme metody pro konstrukci doporučovacích systémů, ovládáme algoritmus SVD, hodnotíme kvalitu doporučení trénovaného modelu
Řešíme více než 50 problémů, abychom téma posílili
Modul 10 – Závěrečný Hackathon
Všechny studované metody aplikujeme k získání maximální přesnosti modelových predikcí na Kaggle