Strojové učení v praxi - kurz 41 500 rub. z IBS Training Center, školení 24 hodin, Datum 26. listopadu 2023.
Různé / / December 02, 2023
Kurz je postaven na několika praktických případech obsahujících tabulky s výchozími daty.
V každém případě procházíme celým životním cyklem projektu strojového učení:
výzkum, čištění a příprava dat,
výběr trénovací metody vhodné pro daný úkol (lineární regrese pro regresi, náhodný les pro klasifikaci, K-means a DBSCAN pro shlukování),
trénink pomocí zvolené metody,
vyhodnocení výsledků,
optimalizace modelu,
prezentace výsledku zákazníkovi.
V diskusní části kurzu diskutujeme o praktických problémech, se kterými se studenti potýkají a které lze řešit probíranými metodami.
Pokrytá témata:
1. Kontrola úkolu (teorie – 1 hodina)
Jaké problémy se strojovým učením dobře vyřeší a jaké problémy se snaží vyřešit?
Co se stane, když místo Data Scientist najmete nespecialistu v oboru (pouze vývojáře/analytika/manažera) s očekáváním, že se to během procesu naučí.
2. Příprava, úklid, průzkum dat (teorie – 1 hodina, praxe – 1 hodina)
Jak porozumět zdrojovým obchodním datům (a obecně v nich detekovat jakoukoli objednávku).
Sekvence zpracování.
Co může a mělo by být delegováno na doménové analytiky a co nejlépe udělá samotný Data Scientist.
Priority řešení konkrétního problému.
3. Klasifikátory a regresory (teorie – 2 hodiny, praxe – 2 hodiny)
Praktická část - dobře zpracované úlohy s připravenými daty.
Rozdíl mezi úkoly (binární/nebinární/pravděpodobnostní klasifikace, regrese), přerozdělení úkolů mezi třídy.
Příklady klasifikace praktických problémů.
4. Shlukování (teorie – 1 hodina, praxe – 2 hodiny)
Kde a jak provádět shlukování: výzkum dat, kontrola zadání problému, kontrola výsledků.
Jaké případy lze redukovat na shlukování.
5. Vyhodnocení modelu (teorie – 1 hodina, praxe – 1 hodina)
Obchodní metriky a technické metriky.
Metriky pro klasifikační a regresní problémy, matice chyb.
Interní a externí metriky kvality shlukování.
Křížová validace.
Posuzování rekvalifikace.
6. Optimalizace (teorie – 5 hodin, praxe – 3 hodiny)
Co dělá jeden model lepší než druhý: parametry, vlastnosti, sestavy.
Správa nastavení.
Nácvik výběru funkcí.
Recenze nástrojů pro nalezení nejlepších parametrů, vlastností a metod.
7. Grafy, reporty, práce s živými úkoly (teorie – 2 hodiny, praxe – 2 hodiny)
Jak jasně vysvětlit, co se děje: sobě, týmu, klientovi.
Krásnější odpovědi na nesmyslné otázky.
Jak prezentovat tři terabajty výsledků na jednom snímku.
Poloautomatické testy, které kontrolní body procesu jsou skutečně potřeba.
Od živých úkolů až po celý proces výzkumu a vývoje („VaV v praxi“) – analýza a analýza úkolů od publika.