Web scraping pro datovou analýzu v Pythonu

,
Praha
— učí Nasťa Sedláková, Filip Sedlák

Náš kurz Vás naučí jak lze snadno získávat data z webových stránek, které můžete používat k následné analýze anebo reportingu. Příkladem může být analýza kurzu měn, recenzí kaváren nebo cen zboží. Náš kurz Vám ukáže celý postup od identifikace datového zdroje, navržení vhodného scrapingu a přípravy dat pro následnou analýzu včetně krátké explorativní analýzy.

Nedílnou součástí všech našich kurzů je práce na vlastním projektu (buď budete mít svůj nápad anebo Vám pomůžeme s vymyšlením projektu) pomocí které si ještě prohloubíte a posílíte získané znalosti.

Naučíte se, jak:

  • Strukturu HTML
  • Jak získat obsah webových stránek (knihovna requests)
  • Jak vybrat z tohoto obsahu jenom to, co nás zajímá (knihovna BeautifulSoup)
  • Jak následně data zpracovat (knihovna pandas) a vizualizovat (knihovna matplotlib)

Naučíte se pracovat s: Requests, BeautifulSoup, Pandas, Matplotlib
Co bych měl(a) umět? Základy pythonu (skvělé materiály od pyladies zde).
Co s sebou? Hlavně dobrou náladu, ale taky notebook (po přijetí do kurzu vám pomůžeme nainstalovat všechny potřebné nástroje)
Cena

4 200 Kč za víkend

V ceně jsou návody a lehké občerstvení.

Napište nám kurzy@sedlakovi.org

Každá cesta začíná prvním krokem

Každý se může naučit nové triky. Neustále se rozvíjejte!

Přihlásit se

O lektorech

Nasťa Sedláková Nasťa Sedláková dělá machine learning a datovou vědu, učí Python. Má doktorát ze statistické genetiky, v současné době se zabývá analýzou finančních dat v Twistu.

Filip Sedlák Filip Sedlák se zabývá dev-ops a je spoluzakladatel machine-learningového startupu Neuron SoundWare, učí rychlý vývoj aplikací.

Společně se starají o malého zenového mistra (rozumějte syna). Nasťa a Filip během své kariéry pracovali s velkým množstvím různorodých dat: genetická, zvuková, burzovní a finanční.

Proběhlé kurzy a workshopy

Interaktivní vizualizace a dashboardy

Dashboard ,
Praha
Nasťa Sedláková, Filip Sedlák
Plot.ly, Dash, Python, Pandas

Kurz pro analytiky a data scientisty, během kterého se učíme vytvářet interaktivní grafy. Poté z nich vytváříme webový dashboard. Grafy na sebe reagují, načítají si aktuální data. To vše v Pythonu.

Vyprávíme příběh s daty

Délka života podle HDP státu v různých letech ,
Na Dolinách 30/8, Praha
Nasťa Sedláková, Filip Sedlák
Matplotlib, Seaborn, Python, Pandas, Jupyter Notebook

Jak přesvědčivě ukázat ostatním fakta?

Žijeme ve světě, kde jsme obklopeni daty. Jak ale zjistit, co nám data chtějí povědět? Naučíme vás, jak se dá datům porozumět a jak je ukázat. Společně odhalíme data story. Budeme používat Python a během víkendového workshopu se naučíme jak napsat data story v Jupyter Notebooku.

Odhalení podvodů pomocí grafových databází

Zobrazit prezentaci ,
hotel Golf, Praha 5
Nasťa Sedláková
Neo4j, Gephi

Workshop zaměřený na návrh a používání grafových databází.

Datová analýza v Pythonu

pyladies ,
budova CZ.NIC, Milešovská 5, Praha 3
Nasťa Sedláková
Python, Pandas, Jupyter Notebook

Pokročilý kurz pyladies zaměřený na datovou analýzu a vizualizace.

Programování pro biology

,
Přírodovědecká fakulta UK
Nasťa Sedláková Semestrální kurz

Python a příkazová řádka v Linuxu

Semestrální kurz pro studenty Univerzity Karlovy.

Programování pro biology

,
Přírodovědecká fakulta UK
Nasťa Sedláková Semestrální kurz

Python a příkazová řádka v Linuxu

Semestrální kurz pro studenty Univerzity Karlovy.

Software for scientists

,
Ústav molekulární genetiky, Praha
Nasťa Sedláková, Filip Sedlák, Petr Šimeček, Libor Mořkovský (English)
vědci z Lega

R, ggplot and RMarkdown

This course will help you to use the computer more efficiently during your research. We'll show you how to automate repetitive procedures like manipulating files, computing statistics and creating charts from your data. This will help you make your analyses less error prone and reproducible.

If you're eager to learn but you don't see the use of such skills in your research, don't worry. The more you know, the more cases you'll see where you can apply your newly acquired skills.

Software for scientists

,
Ústav molekulární genetiky, Praha
Nasťa Sedláková, Filip Sedlák, Mira Hédl, Stefan Negru (English)

Python and Linux command line

This course will help you to use the computer more efficiently during your research. We'll show you how to automate repetitive procedures like manipulating files, computing statistics and creating charts from your data. This will help you make your analyses less error prone and reproducible.

If you're eager to learn but you don't see the use of such skills in your research, don't worry. The more you know, the more cases you'll see where you can apply your newly acquired skills.