ID 2030 - Middle Data Science
π ΠΠΎΠΊΠ°ΡΠΈΡ: Π Π€
πΌ
Π£Π΄Π°Π»Π΅Π½Π½ΠΎ
π
ΠΠ°Π½ΡΡΠΎΡΡΡ: ΡΡΠ»Π» ΡΠ°ΠΉΠΌ
π’
ΠΡΠΎΠ΅ΠΊΡ: ΠΠ°Π½ΠΊ
π‘
Π’ΡΠ΅Π±ΠΎΠ²Π°Π½ΠΈΡ:
β’ ΠΡΡΡΠ΅Π΅ ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΠ΅. Π‘ΠΏΠ΅ΡΠΈΠ°Π»ΡΠ½ΠΎΡΡΡ: ΡΠΊΠΎΠ½ΠΎΠΌΠΈΠΊΠ°, ΠΌΠ°ΡΠ΅ΠΌΠ°ΡΠΈΠΊΠ°.
β’ ΠΠΏΡΡ ΡΠ°Π±ΠΎΡΡ: ΠΎΡ ΠΎΠ΄Π½ΠΎΠ³ΠΎ Π³ΠΎΠ΄Π°.
β’ ΠΡΠΎΠΌΡΡΠ»Π΅Π½Π½ΡΠΉ ΠΎΠΏΡΡ ΡΠ°Π·ΡΠ°Π±ΠΎΡΠΊΠΈ ΠΈ Π²Π½Π΅Π΄ΡΠ΅Π½ΠΈΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° ΡΠ°Π±Π»ΠΈΡΠ½ΡΡ
Π΄Π°Π½Π½ΡΡ
.
β’ Π£Π²Π΅ΡΠ΅Π½Π½ΠΎΠ΅ Π·Π½Π°Π½ΠΈΠ΅ SQL, PL/SQL.
β’ Π£Π²Π΅ΡΠ΅Π½Π½ΠΎΠ΅ Π²Π»Π°Π΄Π΅Π½ΠΈΠ΅ ML-ΡΡΠ΅ΠΊΠΎΠΌ Python: lightgbm/xgboost/catboost, Scikit-Learn, Pandas, NumPy.
β’ Π£ΠΌΠ΅Π½ΠΈΠ΅ ΡΠ°Π±ΠΎΡΠ°ΡΡ Ρ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠ°ΠΌΠΈ Spark, Hadoop, Hive.
β’ ΠΠΏΡΡ ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ ΠΈ Π°Π²ΡΠΎΠΌΠ°ΡΠΈΠ·Π°ΡΠΈΠΈ ETL-ΠΏΠ°ΠΉΠΏΠ»Π°ΠΉΠ½ΠΎΠ² Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ Apache Airflow: ΡΠΎΠ·Π΄Π°Π½ΠΈΠ΅ DAG-ΡΠ°ΠΉΠ»ΠΎΠ², Π½Π°ΡΡΡΠΎΠΉΠΊΠ° ΡΠ°ΡΠΏΠΈΡΠ°Π½ΠΈΠΉ, ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠ° ΠΎΡΠΈΠ±ΠΎΠΊ, ΠΌΠΎΠ½ΠΈΡΠΎΡΠΈΠ½Π³ Π²ΡΠΏΠΎΠ»Π½Π΅Π½ΠΈΡ Π·Π°Π΄Π°Ρ.
β’ ΠΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ ΠΏΡΠΈΠ½ΡΠΈΠΏΠΎΠ² ΠΏΠΎΡΡΡΠΎΠ΅Π½ΠΈΡ ΡΠ»ΠΎΠΈΡΡΠΎΠΉ Π°ΡΡ
ΠΈΡΠ΅ΠΊΡΡΡΡ Ρ
ΡΠ°Π½ΠΈΠ»ΠΈΡΠ° Π΄Π°Π½Π½ΡΡ
(ODS, DWH, DM).
β’ ΠΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅ ΠΏΡΠΈΠ½ΡΠΈΠΏΠΎΠ² ΠΌΠ°ΡΡΡΠ°Π±ΠΈΡΡΠ΅ΠΌΠΎΠΉ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ Π±ΠΎΠ»ΡΡΠΈΡ
ΠΎΠ±ΡΡΠΌΠΎΠ² Π΄Π°Π½Π½ΡΡ
.
β’ Π£ΠΌΠ΅Π½ΠΈΠ΅ ΡΠΎΡΠΌΠΈΡΠΎΠ²Π°ΡΡ ΡΡΡΡΠΊΡΡΡΠΈΡΠΎΠ²Π°Π½Π½ΡΠ΅ Π½Π°Π±ΠΎΡΡ Π΄Π°Π½Π½ΡΡ
, ΠΏΡΠΈΠ³ΠΎΠ΄Π½ΡΠ΅ Π΄Π»Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ Π² Π·Π°Π΄Π°ΡΠ°Ρ
ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ, Π²ΠΊΠ»ΡΡΠ°Ρ ΡΠ°Π·ΡΠ°Π±ΠΎΡΠΊΡ ΡΠΈΡΠ΅ΠΉ Π΄Π»Ρ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ ML-ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.
β’ ΠΡΠ°ΠΉΠ½Π΅ Π²Π°ΠΆΠ½Ρ Π·Π°ΠΈΠ½ΡΠ΅ΡΠ΅ΡΠΎΠ²Π°Π½Π½ΠΎΡΡΡ, ΠΏΡΠΎΠ°ΠΊΡΠΈΠ²Π½ΠΎΡΡΡ, ΠΈΠ½ΠΈΡΠΈΠ°ΡΠΈΠ²Π½ΠΎΡΡΡ, ΡΡΡΠ΅ΠΌΠ»Π΅Π½ΠΈΠ΅ ΠΊ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΡ Π±ΠΈΠ·Π½Π΅Ρ ΡΠΌΡΡΠ»Π° ΠΈ Π΄ΠΎΡΡΠΈΠΆΠ΅Π½ΠΈΡ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ°
β’ ΠΠ±Π»Π°Π΄Π°Π½ΠΈΠ΅ ΡΠΈΡΡΠ΅ΠΌΠ½ΡΠΌ, ΠΊΡΠΈΡΠΈΡΠ΅ΡΠΊΠΈΠΌ ΠΌΡΡΠ»Π΅Π½ΠΈΠ΅ΠΌ.
β’ ΠΠ΅Π»Π°Π½ΠΈΠ΅ ΠΈ ΡΠΌΠ΅Π½ΠΈΠ΅ ΡΠ°Π±ΠΎΡΠ°ΡΡ Π² ΠΊΠΎΠΌΠ°Π½Π΄Π΅.
π¨ ΠΡΡΠ°Π²ΠΈΡΡ ΠΎΡΠΊΠ»ΠΈΠΊ ΠΌΠΎΠΆΠ½ΠΎ
ΠΏΠΎ
ΠΊΠΎΡΠΎΡΠΊΠΎΠΉ Π³ΡΠ³Π» ΡΠΎΡΠΌΠ΅.
ΠΈΠ»ΠΈ Π½Π°ΠΏΡΡΠΌΡΡ ΠΎΡΠ²Π΅ΡΡΡΠ²Π΅Π½Π½ΠΎΠΌΡ ΠΌΠ΅Π½Π΅Π΄ΠΆΠ΅ΡΡ
#Data #Science #Π£Π΄Π°Π»Π΅Π½Π½ΠΎ #Π²Π°ΠΊΠ°Π½ΡΠΈΡ