Data Engineer - kurz 89 000 rub. od Otus, školení 4 měsíce, datum 30.11.2023.
Různé / / December 03, 2023
Co vám tento kurz dá?
- Pochopení klíčových způsobů integrace, zpracování a ukládání velkých dat
- Schopnost pracovat s komponentami ekosystému Hadoop, distribuovaným úložištěm a cloudovými řešeními
- Praktické dovednosti ve vývoji datových služeb, výkladů a aplikací
- Znalost principů organizace monitoringu, orchestrace, testování
Kurz je řešen vývojáři, správci DBMS a všichni, kdo se snaží zlepšit svou profesionální úroveň, ovládat nové nástroje a věnovat se zajímavým úkolům v oblasti práce s daty.
Po studiu datového inženýrství se stanete vyhledávaným specialistou, který:
- nasazuje, upravuje a optimalizuje nástroje pro zpracování dat
- přizpůsobuje datové sady pro další práci a analýzy
- vytváří služby, které využívají výsledky zpracování velkého množství dat
- zodpovědný za datovou architekturu ve firmě
Reálné případové studie: příklady implementací, použití nástrojů, optimalizace výkonu, problémy, chyby a aplikované výsledky
Vysoce praktická orientace:
V průběhu kurzu postupně vytvoříme funkční produkt řešící aplikované problémy
Holistický obraz výzev a úkolů moderního podnikání a role datového inženýra při jejich řešení
Poptávka mezi zaměstnavateli
Již 40 zaměstnavatelů je připraveno pozvat absolventy kurzů k pohovoru
6
kurzyDatový inženýr ve společnosti Wildberries, řečník kurzu DE Junior. Více než 7 let v IT
Absolvent Voroněžské státní univerzity s vyznamenáním. V současné době student magisterského programu HSE "Systémové a softwarové inženýrství". Odborná praxe - 2 roky práce jako datový analytik a datový inženýr. Nyní pracuje s 5 populárními databázemi, vyvíjí se v Pythonu a rychle rozvíjí své dovednosti. Připraven se podělit o své zkušenosti.
1
studnaRozvíjí analytiku ve společnosti již více než 10 let. Mezi úspěchy patří: - Vybudování vlastního komplexního systému webové analýzy; - Vybudování analytického skladu na bázi MPP Vertica; - Organizace zpracování dat na bázi Spark, Kafka, HDFS; -...
Rozvíjí analytiku ve společnosti již více než 10 let. Mezi úspěchy patří: - vybudování vlastního komplexního webového analytického systému; - vybudování analytického skladu na bázi MPP Vertica; - organizace zpracování dat na bázi Spark, Kafka, HDFS;- budování procesů pro práci s daty včetně kvality dat;- tvorba několika interních nástrojů pro práci a strukturování metadat (Data Catalog);- Výstavba firemního reportingového systému včetně realtime; - více než 5 let zvyšuje datovou gramotnost v rámci společnosti, vede různá školení na práci s daty, nástroje, SQL; Vyvinul také několik vedoucích analytiků, kteří nyní pracují ve velkých společnostech. Hlavní důraz je kladen na pochopení obchodních problémů při práci s daty a jejich řešení.
1
studnaVedoucí oddělení, Sberbank 8 let zkušeností v průmyslovém vývoji včetně tvorby a údržby webových aplikací jak ve velkých společnostech, tak ve startupech. 3 roky vývoje distribuovaných systémů pro velkou státní správu...
Vedoucí oddělení, Sberbank 8 let zkušeností v průmyslovém vývoji včetně tvorby a údržby webových aplikací jak ve velkých společnostech, tak ve startupech. 3 roky vývoje distribuovaných systémů pro velké vládní zákazníky. Implementoval tři projekty od nuly, od prototypu po připravené pro průmyslové použití. V současné době se v bance zabýváme fullstack developmentem pro interní zákazníky, řešením problémů souvisejících s analýzou dat a inženýrstvím. Zkušenosti s programováním v Javě, Scale, Pythonu, Javascriptu. Široká škála profesních zájmů, od budování distribuovaných systémů po prediktivní analytiku a analýzu záměrů. Vzdělání: Bakalářský titul z UrFU pojmenovaný po. B.N. Jelcin „informační technologie“.
datová architektura
-Téma 1.Datový inženýr. Úkoly, dovednosti, nástroje, potřeby trhu
-Téma 2.Architektura analytických aplikací: základní komponenty a principy
-Téma 3. V prostorách / Cloudová řešení
-Téma 4. Automatizace a orchestrace potrubí – 1
-Téma 5. Automatizace a orchestrace potrubí – 2
Datové jezero
-Téma 6. Distribuované systémy souborů. HDFS/S3
-Topic 7.SQL přístup k Hadoop. Apache Hive/Presto
-Téma 8. Formáty datových úložišť a jejich vlastnosti
-Téma 9. Analýza dálkového ovládání pro 1 případ
-Téma 10. Fronty zpráv. Kafkův přehled.
-Téma 11.Stahování dat z externích systémů
-Téma 12.Apache Spark – 1
-Téma 13.Apache Spark – 2
DWH
-Téma 14.Analytické DBMS. MPP databáze
-Téma 15.DWH Modelování – 1. základy dbt
-Téma 16.DWH Modelování – 2. Datový trezor 2.0
-Téma 17. Praktiky DevOps v analytických aplikacích. CI+CD
-Téma 18. Analýza dálkového ovládání pro případ 2
-Téma 19.Kvalita dat. Řízení kvality dat
-Téma 20. Nasazení BI řešení
-Téma 21.Monitorování / Metadata
NoSQL/NewSQL
-Téma 22. NoSQL Storage. Široký sloupec a pár klíč–hodnota
-Téma 23. NoSQL Storage. Orientace na dokumenty
-Téma 24.ELK
-Téma 25.ClickHouse
-Téma 26. Analýza dálkového ovládání pro případ 3
MLOps
-Téma 27. Organizace a balení kódu
-Téma 28. Docker a REST architektura
-Téma 29.MLFlow + DVC
-Téma 30. Nasazení modelů
-Téma 31. Analýza dálkového ovládání pro případ 4
-Téma 32. Analýza dálkového ovládání pro případ 5
Absolventský projekt
-Téma 33. Výběr tématu a organizace projektové práce
-Téma 34.Konzultace
-Téma 35.Ochrana