koolitaja pilt

Koolitaja:

Kaarel Moppel

Aeg:

24.03 - 26.03, kell 05:30-12:45

Teised toimumiskuupäevad:

20.10 - 22.10

Hind: 1 290.00 EUR + km

Sissejuhatus andmeteadusesse SQL-i ja Pythoni abil

Andmeteaduse mõistet on kõik IT- ga tegelevad inimesed tänaseks päevaks kuulnud. Aga mis see tegelikult on ja kus seda peaks üldse rakendama? Kuidas andmeteadusega ise algust teha? Mis oskusi on edukaks andmeanalüüsiks vaja? Kuidas sünnib praktiline andmeteaduse lahendus?

Kõikidele nendele küsimustele saab vastused koolitusel “Sissejuhatus andmeteadusesse Pythoni ja SQL abil”, kus teooria ja praktika on omavahel läbivalt seotud.

24.-26.03.2021 KOOLITUS TOIMUB VEEBIS

Koolituse eesmärk on osalejatele lahti seletada andmeteaduse põhilised mõisted ning tutvustada selle kasutusvaldkondasid. Kursuse käigus saab ülevaate levinumatest andmeteaduse algoritmiklassidest, õpitakse praktiliselt andmekogusid käsitlema failide ja SQL abil ning viiakse läbi lihtsam andmeanalüüs ja visualiseerimine Pythoni abil.

Sihtgrupp:

Kursus on mõeldud algtasemel programmeerimisoskustega (kindlasti Python) analüütikutele ja arendajatele, kes on valmis tegema oma esimesed sammud andmeteaduse vallas.

Koolituse tulemusena osaleja:

  • Mõistab andmeteaduse peamisi mõisteid ja saab aru, millal andmeteadus aitab konkreetseid probleeme lahendada
  • Oskab andmeid pärida / „avastada”, analüüsiks ette valmistada ja sisendit ning tulemusi visualiseerida
  • Tunneb statistika ja andmeanalüüsi lihtsamaid võtteid
  • Teab levinumaid  algoritmide klasse ja oskab vahet teha juhendatud ja juhendamata õppel
  • Teab levinumaid tarkvarapakette Python-i jaoks

 

Koolitusel osalemise eeldused:

Praktilised harjutused eeldavad vähemalt algtasemel kokkupuudet Pythonis programmeerimise, käsurea ning SQL päringukeelega. Samuti on osalejatel vajalik Google’i konto olemasolu, et kasutada Colab keskkonda!

Koolituse läbiviimise põhimõtted:

Teemapeatükkide järjestikune läbimine ja harjutused. Kursuse alguses selgitab koolitaja välja osalejate senised teadmised ja erihuvid ning saadud info põhjal on vastavalt võimalik osade teemaplokkide spetsiifilisem käsitlus.

Kursusel on teooria ja praktika omavahel läbivalt seotud. Tutvustatakse levinumaid tööriistu, mis sobivad ka algajatele. Enamik „käed-külge“ harjutusi tehakse Pythonis Google’ i Colabi kaudu.

Õpiväljundite omandamist hinnatakse peale igat teooriaplokki tehtavate praktiliste harjutuste kaudu.

Tunnistuse väljastamise eelduseks on koolitusel osalemine terves mahus.

Maht: 24 akadeemilist tundi

 

Koolitushind sisaldab lisaks:

  • õppematerjale;
  • koolitaja konsultatsiooni õpitud teemade kohta e-posti teel pärast koolitust;
  • tunnistust.

Lisaväärtusena pakume:

  • sooje jooke koos küpsiste ja puuviljadega;
  • lõunasööki igal koolituspäeval;
  • tasuta parkimist.

 

Loe koolitaja artiklit: Õppige, kuidas kogutud andmete põhjal teha äris kasulikke otsuseid  

 

Koolitusel saab osaleda Töötukassa koolituskaardiga. 

Näeme koolitusel! 

Ajakava

1. päev
2. päev
3. päev
9:15 - 9:30
Kogunemine
9:30 - 11:00
Sissejuhatus andmeteadusesse
• Kursuse ülevaade
• Andmeteaduse ajalugu
• Andmed, suurandmed, programmeerimine ja mõisted nagu AI, ML, süvaõpe ja neuraalvõrgud
• Praktiliste kasutusalade näited

Kasutatavad meetodid: loeng
11:00 - 11:15
Kohvipaus
11:15 - 12:45
Andmekogude praktiline käsitlemine
• Andmete pärimine SQL abil ja analüüsiks ettevalmistamine
• Levinud failiformaadid ja transformatsioonid
• EDA - Exploratory Data Analysis
• Testandmekogude leidmine

Kasutatavad meetodid: loeng
12:45 - 13:30
Lõuna
13:30 - 15:00
Statistika ja SQL andmeanalüüsi lihtsamad võtted
• Grupipõhised agregaatfunktsioonid
• Järjestusfunktsioonid
• Kvantiilanalüüs
• Jooksvad keskmised ning SQL aknafunktsioonide tutvustus

Kasutatavad meetodid: loeng + harjutus
15:00 - 15:15
Kohvipaus
15:15 - 16:45
Python andmeteaduse maailmas
• Kiirtutvus Pythoniga (v3) läbi IPython konsooli
• Ülevaade Jupyter-i interaktiivsest demokeskkonna tehnoloogiast (Jupyter Notebooks)
• Google Colabi Jupyter keskkond

Kasutatavad meetodid: loeng + harjutus
11:00 - 11:15
Kohvipaus
11:15 - 12:45
Andmekaeve ja masinõppe võtted
• Andmeteaduse / masinõppe praktiline rakendamine
• Algoritmide tüüpklassid ja õige algoritmi valimine / valideerimine

Kasutatavad meetodid: loeng
12:45 - 13:30
Lõuna
13:30 - 15:00
Juhitud õpe
• Regressioonianalüüsi meetodid

Kasutatavad meetodid: loeng + harjutus
15:00 - 15:15
Kohvipaus
15:15 - 16:45
Juhitud õpe
• Klassifikatsioon

Kasutatavad meetodid: loeng
09:00 - 9:30
Kogunemine, eelmise päeva küsimused ja kordamine, puhver
9:30 - 11:00
Andmete visualiseerimine
• Matplotlib tutvustus
• Ad-hoc graafikud läbi Jupyiter-i / IPython-i
• Levinumate vabavaraliste visualiseerimiskeskkondade tutvustus

Kasutatavad meetodid: loeng + harjutus
09:00 - 9:30
Kogunemine, eelmise päeva küsimused ja kordamine, puhver
9:30 - 11:00
Juhendamata õpe
• Klasterdamine
• K-Means

Kasutatavad meetodid: loeng + harjutus
11:00 - 11:15
Kohvipaus
11:15 - 12:45
Juhendamata õpe
• PCA analüüs
• Anomaaliate avastamine

Kasutatavad meetodid: loeng
12:45 - 13:30
Lõuna
13:30 - 15:00
Populaarsete Python tarkvarapakettide tutvustus
• NumPy
• Pandas
• Scikit-learn

Kasutatavad meetodid: loeng + harjutus
15:00 - 15:15
Kohvipaus
15:15 - 16:45
Teemad edasijõudnutele
• Pilve API-d
• Tekstikaeve ja hägusotsing
• Reaalelu masinõppe lahenduste problemaatika

Kasutatavad meetodid: loeng