Data Scientist od nuly po PRO - kurz 233 640 RUB. ze SkillFactory, školení 24 měsíců, Datum 15. srpna 2023.
Různé / / November 29, 2023
Po základním kurzu si budete moci vybrat užší specializaci Data Science - ML Engineer, CV Engineer nebo NLP Engineer
inženýr M.L — Vývojář strojového učení
Vytvořte model predikce úvěrového ratingu
Vyřešte problém klasifikace spamových SMS zpráv
Vyvinout systém pro doporučení vhodných produktů při nákupu
Vytvořte model pro zvýšení prodeje v maloobchodě
Vytvářejte obrázky na základě textového popisu pomocí neuronové sítě DALL-E
CV inženýr — Specialista na počítačové vidění
Naučte se řešit všechny základní problémy v oblasti počítačového vidění
Získáte znalosti o reálném toku práce s modely CV, aktuálních přístupech a pokročilých nástrojích nezbytných pro tvorbu CV služeb
V závěrečném projektu vytvořte virtuálního trenéra schopného posoudit správnost cviků na videu
inženýr NLP — Specialista na zpracování přirozeného jazyka
Seznamte se se zpracováním přirozeného jazyka
Porozumět úlohám NLP - klasifikace, sumarizace a generování textu, vytváření systémů pro strojový překlad a systémy pro zodpovídání otázek
V závěrečném projektu budete samostatně vyvíjet nástroje pro automatizované vyhledávání souvislostí k daným tématům.
ZÁKLADNA
V této fázi se naučíte základy programování v Pythonu, naučíte se předzpracovávat a analyzovat data a také se seznámíte s hlavními úkoly datového vědce.
Úvod - 1 týden
Budete schopni sami formulovat skutečné vzdělávací cíle, zjistíte, jakou hodnotu má DS pro podnikání, seznámit se s hlavními úkoly datového vědce a pochopit, jak se vyvíjí jakýkoli projekt DS.
ÚVOD-1. Jak se efektivně učit - onboarding v tréninku
ÚVOD-2. Přehled profese. Typy problémů v datové vědě. Fáze a přístupy k vývoji projektu Data Science
Vývojový design - 5 týdnů
Naučíte se pracovat se základními datovými typy pomocí Pythonu a budete schopni používat smyčkové konstrukce, podmíněné příkazy a funkce ve své každodenní práci.
PYTHON-1. Základy Pythonu
PYTHON-2. Ponoření do datových typů
PYTHON-3. Podmíněné výroky
PYTHON-4. Cykly
PYTHON-5. Funkce a funkcionální programování
PYTHON-6. Praxe
PYTHON-7. Průvodce stylem Pythonu (bonus)
Základní matematika - 7 týdnů
MATEMATIKA-1. Čísla a výrazy
MATEMATIKA-2. Rovnice a nerovnice
MATEMATIKA-3. Základní pojmy teorie funkcí
MATEMATIKA-4. Základy geometrie: planimetrie, trigonometrie a stereometrie
MATEMATIKA-5. Množiny, logika a prvky statistiky
MATEMATIKA-6. Kombinatorika a základy teorie pravděpodobnosti
MATEMATIKA-7. Řešení problému
Práce s daty - 8 týdnů
V této fázi si osvojíte základní datové dovednosti: jak připravit, vyčistit a transformovat data tak, aby byla vhodná pro analýzu. Když už jsme u analýzy: data budete analyzovat pomocí populárních knihoven Matplotlib, Seaborn, Plotly.
PYTHON-8. Nástroje datové vědy
PYTHON-9. Knihovna NumPy
PYTHON-10. Úvod do Pandy
PYTHON-11. Základní techniky pro práci s daty v Pandas
PYTHON-12. Pokročilé datové techniky v Pandách
PYTHON-13. Čištění dat
PYTHON-14. Vizualizace dat
PYTHON-15. Principy OOP v Pythonu a ladicí kód (volitelný modul)
Projekt 1. Analytika datových souborů o uzavřených problémech
Načítání dat - 6 týdnů
Budete moci stahovat data z různých formátů a zdrojů. A SQL, strukturovaný dotazovací jazyk, vám s tím pomůže. Naučíte se používat agregační funkce, spojení tabulek a komplexní spojení.
PYTHON-16. Jak stahovat data ze souborů různých formátů
PYTHON-17. Načítání dat z webových zdrojů a API
SQL-0. Ahoj SQL!
SQL-1. Základy SQL
SQL-2. Agregační funkce
SQL-3. Spojování stolů
SQL-4. Komplexní spoje
Projekt 2. Načítání nových dat. Zpřesnění analýzy
Statistická analýza dat - 7 týdnů
Intelligence Data Analysis (EDA) je to, na co se zaměříte. Seznámíte se se všemi fázemi takové analýzy a naučíte se, jak ji provádět pomocí knihoven Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas. Kromě toho budete moci pracovat na Kaggle, oblíbené službě pro účast v soutěžích.
EDA-1. Úvod do analýzy zpravodajských dat. Algoritmy a metody EDA
EDA-2. Matematická statistika v kontextu EDA. Typy funkcí
EDA-3. Feature Engineering
EDA-4. Statistická analýza dat v Pythonu
EDA-5. Statistická analýza dat v Pythonu. Část 2
EDA-6. Návrh experimentů
EDA-7. Platforma Kaggle
Projekt 2
Úvod do strojového učení – 9 týdnů
Seznámíte se s knihovnami ML pro modelování závislostí dat. Budete schopni trénovat hlavní typy modelů ML, provádět validaci, interpretovat výsledky práce a vybírat důležité vlastnosti (důležitost funkce).
ML-1. Teorie strojového učení
ML-2. Učení pod dohledem: Regrese
ML-3. Řízená výuka: Klasifikace
ML-4. Učení bez dozoru: Techniky shlukování a redukce rozměrů
ML-5. Validace dat a vyhodnocení modelu
ML-6. Výběr a výběr vlastností
ML-7. Optimalizace hyperparametrů modelu
ML-8. Kuchařka ML
Projekt 3. Klasifikační problém
HLAVNÍ JEDNOTKA
Lineární algebra, matematická analýza, diskrétní matematika – zní to děsivě, ale nelekejte se: všechny tyto předměty analyzujeme a naučíme vás s nimi pracovat! Ve druhé fázi se ponoříte do matematiky a základů strojového učení, dozvíte se více o profesích DS a prostřednictvím kariérového poradenství si vyberete druhý ročník studia.
Matematika a strojové učení. Část 1 - 6 týdnů
Budete schopni řešit praktické úlohy pomocí ručního výpočtu a Pythonu (vektorové a maticové výpočty, práce s množinami, studium funkcí pomocí diferenciální analýzy).
MATH&ML-1. Lineární algebra v kontextu lineárních metod. Část 1
MATH&ML-2. Lineární algebra v kontextu lineárních metod. Část 2
MATH&ML-3. Matematická analýza v kontextu optimalizačního problému 1. část
MATH&ML-4. Matematická analýza v kontextu optimalizační úlohy. Část 2
MATH&ML-5. Matematická analýza v kontextu optimalizační úlohy. Část 3
Projekt 4. Regresní problém
Matematika a strojové učení. Část 2 - 6 týdnů
Seznámíte se se základními pojmy teorie pravděpodobnosti a matematické statistiky, algoritmy shlukování, a také se naučit hodnotit kvalitu provedeného shlukování a prezentovat výsledky v grafické podobě.
MATH&ML-6. Teorie pravděpodobnosti v kontextu naivního Bayesova klasifikátoru
MATH&ML-7. Algoritmy založené na rozhodovacích stromech
MATH&ML-8. Boosting & Stacking
MATH&ML-9. Techniky shlukování a redukce rozměrů. Část 1
MATH&ML-10. Techniky shlukování a redukce rozměrů. Část 2
Projekt 5. Souborové metody
Diskrétní matematika - 4 týdny
MATH&MGU-1 Sady a kombinatorika
Logika MATH&MGU-2
Grafy MATH&MGU-3. Část 1
Grafy MATH&MGU-4. Část 2
ML v podnikání - 8 týdnů
Naučíte se používat ML knihovny k řešení problémů s časovými řadami a doporučovacích systémů. Budete moci trénovat ML model a ověřovat jej, stejně jako vytvořit funkční prototyp a spustit model ve webovém rozhraní. A také získat dovednosti A/B testování, abyste mohli model hodnotit.
MATH&ML-11. Časové řady. Část 1
MATH&ML-12. Časové řady. Část 2
MATH&ML-13. Systémy doporučení. Část 1
MATH&ML-14. Systémy doporučení. Část 2
PROD-1. Příprava modelu pro výrobu
PROD-2. PrototypeStreamlit+Heroku
PROD-3. Obchodní porozumění. Pouzdro
Projekt 6. Téma na výběr: Časové řady nebo Systémy doporučení
PRO ÚROVEŇ
Ve třetí etapě se seznámíte s jednou z metod strojového učení – deep learning (DL). A také na vás čeká plnohodnotný blok zvolené specializace: zvládnete dovednosti strojového učení (ML), seznámit se s rutinou CV (počítačové vidění) nebo se zdokonalit v NLP*, přirozeném zpracování Jazyk.
Druhý rok studia - 3 specializace na výběr
Kariérní poradenství
ML, CV nebo NLP: v této fázi se musíte konečně rozhodnout, kterou cestou se vydat dál. Řekneme vám o každé specializaci a nabídneme vám řešení několika praktických problémů, které vám usnadní rozhodování.
Trať ML - inženýr
V ML trati se naučíte řešit hloubkové problémy strojového učení, osvojíte si kompetence datového inženýra a zdokonalíte své dovednosti v práci s knihovnami Pythonu. Dozvíte se také, jak vytvořit MVP (minimální životaschopnou verzi produktu), naučíte se všechny složitosti výstupu modelu ML do výroby a dozvíte se, jak inženýři ML pracují v reálném životě.
Úvod do hlubokého učení
Základy datového inženýrství
Další kapitoly Pythonu a ML
Ekonomické hodnocení efektů a vývoj MVP
ML do výroby
Hloubkové studium vývoje ML a absolventského projektu na zvolené téma
Dráha CV - inženýr
Na stopě CV se naučíte řešit problémy s počítačovým viděním, jako je klasifikace obrázků, segmentace a detekce, generování a stylizace obrazu, restaurování a zlepšování kvality fotografie. Kromě toho se naučíte, jak zavést neuronové sítě do výroby.
Úvod do hlubokého učení
Základy datového inženýrství
Další kapitoly Pythonu a ML
Ekonomické hodnocení efektů a vývoj MVP
ML do výroby
Hloubkové studium vývoje ML a absolventského projektu na zvolené téma
Dráha NLP - inženýr
Během tréninku na NLP dráze se naučíte řešit hlavní problémy zpracování přirozeného jazyka, in včetně klasifikace, sumarizace a generování textu, strojového překladu a vytváření dialogu systémy
Úvod do hlubokého učení
Matematika neuronových sítí pro NLP
Hard & Software pro řešení problémů NLP
NLP úlohy a algoritmy
Neuronové sítě ve výrobě
Hloubkové studium vývoje NLP a absolventského projektu na zvolené téma
Pokud si vyberete specializaci CV nebo ML, můžete kurz NLP absolvovat bez podpory mentora zdarma.
Hluboké učení a neuronové sítě
Kde se používají neuronové sítě? Jak trénovat neuronovou síť? Co je hluboké učení? Odpovědi na tyto otázky se dozvíte v bonusové sekci DL.
Úvod do datového inženýrství
Dozvíte se, jaký je rozdíl mezi rolemi datového vědce a datového inženýra, jaké nástroje tento při své práci používá a jaké úkoly denně řeší. Slova „sněhová vločka“, „hvězda“ a „jezero“ získají nový význam :)