Kurz „Data Science Specialist“ - kurz 112 000 rub. z Yandex Workshop, školení 8 měsíců, datum 30. listopadu 2023.
Různé / / November 28, 2023
Co dělají Data Scientists?
Analyzujte velké množství dat, vyvíjejte modely a aplikujte strojové učení k předpovědím a identifikaci vzorců. Jsou potřeba v různých oblastech, kde je potřeba ukládat a zpracovávat data.
V bankách
Analyzujte data o klientech a zjistěte, jaké ukazatele ovlivňují jejich bonitu, predikujte pravděpodobnost odchodu klienta z banky
V průmyslu
Pomocí strojového učení předpovídají, kdy zařízení selže a na kterém ložisku těžba přinese největší zisk.
V marketingu a obchodu
Pomáhají najít body růstu analýzou sezónnosti, dnů s nejvyšším prodejem a vytvořením systému doporučení
V sektoru dopravy
Optimalizujte provoz semaforů, vyhodnoťte zatížení komunikací a pomozte upravit plány oprav
Kompletní kurz datové vědy
Pravidelně jej aktualizujeme, abychom zajistili, že splňuje potřeby průmyslu a zaměstnavatelů. Jinými slovy, učíte se jen to, co se vám ve vaší práci bude určitě hodit.
Základy Pythonu a analýza dat: Úvodní kurz zdarma:
Naučte se základní koncepty analýzy dat a pochopte, co dělají datoví analytici a datoví vědci. Vyřešte pět případů práce s daty z různých oblastí:
- zjistit důvod masivního rozpadu gadgetů,
- zkontrolovat návratnost reklamy v mobilních aplikacích,
- najít nejlepší místo pro nový obchod,
- pomůžeme vám vybrat strategii rozvoje pro startup s umělou inteligencí,
- vyhodnotit efektivitu robotů v podpůrné službě.
Řešením případů se naučíte základy Pythonu a knihovny pandas, naučíte se sestavit některé grafy a správně je interpretovat.
Úvod do profese „Data Science Specialist“
Co je specialista na datovou vědu?
Jak učíme.
Základní Python:
Ponořte se hlouběji do programovacího jazyka Python a knihovny pandas.
+1 projekt v portfoliu
Porovnejte uživatelská data Yandex. Hudba podle města a dne v týdnu.
Předzpracování dat:
Naučte se čistit data od odlehlých hodnot, opomenutí a duplikátů a také převádět různé datové formáty.
+1 projekt v portfoliu
Analyzujte data o klientech bank a určete podíl těch bonitních.
Průzkumná analýza dat:
Naučte se základy pravděpodobnosti a statistiky. Použijte je k prozkoumání základních vlastností dat, hledání vzorců, distribucí a anomálií. Seznamte se s knihovnami scipy a matplotlib. Kreslit diagramy a procvičovat analýzu grafů.
+1 projekt v portfoliu
Prozkoumejte archiv inzerátů na prodej nemovitostí v Petrohradě a Leningradské oblasti.
Teorie pravděpodobnosti. Doplňkový kurz
Zapamatujte si nebo rozpoznejte základní pojmy teorie pravděpodobnosti: nezávislé, opačné, neslučitelné události atd. Na jednoduchých příkladech a zábavných úlohách si procvičíte práci s čísly a budování logiky řešení.
Toto je volitelný sprint. To znamená, že si každý student sám vybere jednu z možností:
- Absolvujte doplňkový kurz o deseti krátkých lekcích, oprášte teorii a řešte problémy.
- Otevřete pouze blok s úkoly na pohovor, zapamatujte si praxi bez teorie.
- Kurz úplně přeskočte nebo se k němu vraťte, když je čas a potřeba.
Závěrečný projekt prvního modulu
Naučte se provádět předběžný výzkum dat a formulovat a testovat hypotézy.
+1 projekt v portfoliu
Najděte vzory, které určují úspěch hry.
Úvod do strojového učení:
Osvojte si základní koncepty strojového učení. Seznamte se s knihovnou Scikit-Learn a použijte ji k vytvoření svého prvního projektu strojového učení.
+1 projekt v portfoliu
Vyvinout systém doporučení tarifů pro mobilního operátora.
Školený výcvik:
Ponořte se hlouběji do nejžhavější oblasti strojového učení: učení pod dohledem. Naučte se, jak se vypořádat s nevyváženými daty.
+1 projekt v portfoliu
Předvídat pravděpodobnost odchodu klienta z banky.
Strojové učení v podnikání:
Přečtěte si, jak strojové učení (zkr. MO) pomáhá podniku s tím, jak shromažďovat data a jak souvisí metriky produktu s metrikami MO. Naučte se spouštět nové funkce služby pomocí ML. Zjistěte, co jsou obchodní metriky, KPI a A/B testování.
+1 projekt v portfoliu
Vycvičte si model, který pomůže identifikovat nové místo pro těžbu ropy s nejmenším rizikem ztráty.
Závěrečný projekt druhého modulu:
Připravte data pro strojové učení. Pomocí modelu zhodnoťte jeho kvalitu.
+1 projekt v portfoliu
Simulujte proces tavení zlaté rudy, abyste zlepšili provoz podniku.
Lineární algebra:
Podívejte se do nitra některých algoritmů, které jste se dosud naučili, a získejte lepší představu o tom, jak je používat. V praxi si od začátku osvojte hlavní pojmy lineární algebry: lineární prostory, lineární operátory, euklidovské prostory.
+1 projekt v portfoliu
Použijte metodu konverze dat k ochraně osobních údajů klientů pojišťoven.
Numerické metody:
Budete analyzovat řadu algoritmů a upravit je pro řešení praktických problémů pomocí numerických metod. Zvládněte přibližné výpočty, odhady složitosti algoritmu a sestup gradientu. Zjistěte, jak se trénují neuronové sítě a co je zesílení gradientu.
+1 projekt v portfoliu
Vytvořte model pro určení ceny ojetého vozu.
Časové řady:
Časové řady popisují, jak se v čase mění parametry, jako je spotřeba elektřiny nebo počet objednávek taxi. Naučíte se analyzovat série, hledat trendy a identifikovat sezónnost. Naučte se vytvářet tabulková data a problém regrese časové řady.
+1 projekt v portfoliu
Sestavte model a předpovězte maximální zatížení taxi.
Strojové učení pro texty:
Naučte se vytvářet číselné vektory z textů a řešit pro ně klasifikační a regresní úlohy. Naučte se, jak se počítají funkce TF-IDF, a seznamte se s reprezentacemi jazyků word2vec a BERT.
+1 projekt v portfoliu
Urychlete moderování komentářů ve vaší komunitě automatizací hodnocení toxicity.
Základní SQL:
Naučte se základy dotazovacího jazyka SQL a relační algebry pro práci s databázemi. Seznamte se s funkcemi práce v PostgreSQL, oblíbeném systému pro správu databází (zkr. DBMS). Naučte se psát dotazy různé úrovně složitosti a překládat obchodní problémy do SQL.
Budete pracovat s databází internetového obchodu, který se specializuje na filmy a hudbu.
+1 projekt v portfoliu
Napište řadu dotazů různé složitosti do databáze, která ukládá data o venture investorech, startupech a investicích do nich.
Počítačové vidění:
Naučte se řešit jednoduché problémy s počítačovým viděním pomocí hotových neuronových sítí a knihovny Keras. Seznamte se s Hlubokým učením.
+1 projekt v portfoliu
Sestavte model, abyste z fotografie určili přibližný věk osoby.
Učení bez dozoru:
Unsupervised learning je jednou z metod strojového učení, ve které systém řeší problém bez předem označených dat na základě jeho vlastností a struktury. Přečtěte si o problémech se shlukováním a detekcí anomálií.
Absolventský projekt:
V posledním projektu potvrďte, že jste zvládli nové povolání. Vyjasněte úkol zákazníka a projděte všemi fázemi analýzy dat a strojového učení. Nyní nejsou žádné lekce ani domácí úkoly - vše je jako ve skutečné práci.
+1 projekt v portfoliu
Projekt na výběr:
- Vytvořte model, který předpovídá odchod zákazníků od telekomunikační společnosti.
- Sestavit model, který předpovídá parametry technologického procesu v hutnickém závodě.
D
darjamanannikovová
01.10.2020 G.
Příklad ideálních online kurzů
V Yandexu. Během workshopu studuji profesi DataScience, nyní poměrně módní směr, a jak se ukázalo, je docela těžké, jak se říká, těžké se naučit - snadno bojovat. (adsbygoogle = window.adsbygoogle || []).push({}); Na mé cestě bylo mnoho potíží, neměl jsem dost času (bral jsem diplom a pracoval), síla rozumět statistikám mě pravidelně opouštěla, koronavirus nás všechny zamkl doma...
S
sergen355
14.07.2021 G.
Skvělý vzdělávací projekt
Výhody: vlastní simulátor, recenze projektů, konzultace, komunita ve Slacku, pomoc s každým problémem. Nevýhody: jediné negativum je, že u některých témat není v simulátoru kompletní materiál, na samostatné vyhledávání informací je potřeba více času Studoval jsem na datové fakultě. Dobrý formát školení. Někdo přijde, někdo ne. Ale pro mě je to maximum...