Web scraping pro datovou analýzu v Pythonu

Ilustrační obrázek ,
Praha
— učí Nasťa Sedláková, Filip Sedlák

Náš kurz Vás naučí jak lze snadno získávat data z webových stránek, které můžete používat k následné analýze anebo reportingu. Příkladem může být analýza kurzu měn, recenzí kaváren nebo cen zboží. Náš kurz Vám ukáže celý postup od identifikace datového zdroje, navržení vhodného scrapingu a přípravy dat pro následnou analýzu.

Nedílnou součástí všech našich kurzů je práce na vlastním projektu (buď budete mít svůj nápad anebo Vám pomůžeme s vymyšlením projektu) pomocí které si ještě prohloubíte a posílíte získané znalosti.

Naučíte se:

  • Strukturu HTML
  • Jak získat obsah webových stránek (knihovna requests)
  • Jak vybrat z tohoto obsahu jenom to, co nás zajímá (knihovna BeautifulSoup)
  • Jak následně data zpracovat (knihovna pandas)

Naučím se pracovat s: Requests, BeautifulSoup, Pandas
Co bych měl(a) umět? Základy pythonu (skvělé materiály od pyladies zde).
Co s sebou? Hlavně dobrou náladu, ale taky notebook (po přijetí do kurzu vám pomůžeme nainstalovat všechny potřebné nástroje)
Cena

4 200 Kč za víkend

V ceně jsou návody a lehké občerstvení.

Napište nám kurzy@sedlakovi.org

Každá cesta začíná prvním krokem

Každý se může naučit nové triky. Neustále se rozvíjejte!

Přihlásit se

O lektorech

Nasťa Sedláková Nasťa Sedláková dělá machine learning a datovou vědu, učí Python. Má doktorát ze statistické genetiky, v současné době se zabývá analýzou finančních dat v Twistu.

Filip Sedlák Filip Sedlák se zabývá dev-ops a je spoluzakladatel machine-learningového startupu Neuron SoundWare, učí rychlý vývoj aplikací.

Společně se starají o malého zenového mistra (rozumějte syna). Nasťa a Filip během své kariéry pracovali s velkým množstvím různorodých dat: genetická, zvuková, burzovní a finanční.