List of talks at PyCon SK 2018

All Machine Learning / AI Community / Diversity / Social Data Science DevOps Documentation Education Python General Security Soft Skills Hardware Web Development Other

Around the World in 30 minutes
Czech flag Talk Data Science

Štěpán Tomsa (CZ)

Lidé mluví různými jazyky. Ba co hůř, oni jimi i píší a to i na počítači. Tyto jazyky se nepíší vždy latinkou. A i když ano, není ani ta vždy stejná. Tito lidé mají navíc v těchto jazycích a znakových sadách dokonce i jména, poštovní adresy atd. a vyplňují je třeba do webových formulářů. A to vše je jen začátek boje s řetězci…

To, že v řetězcích se většinou ukrývá text v nějakém lidském jazyce, asi všichni tušíme. Snad jsme se každý i pokusili někdy nějaký takový zpracovat, porovnávat, řadit, ti odvážnější třeba i skloňovat. Odhrňme závěs a posviťme si na některé z těch unicodových nestvůr. Nakonec budeme rádi, že se nám takový text aspoň zobrazí na obrazovce; a někdy dokonce i správně. Alespoň dokud se nám na webu nezaregistruje někdo z Klingonské říše…

Getting started with HDF5 and PyTables
English flag Talk Data Science

Giacomo Debidda (IT)

HDF5 is a data model, a library, a file format for storing and managing big and complex data. PyTables is a Python package built on top of the HDF5 library and NumPy. It provides a high-level interface with advanced indexing and database-like query capabilities. PyTables is both easy to use and extremely fast, so it might be an invaluable tool if you need to work with large, hierarchical datasets. At the end of this talk you will learn what HDF5 is, why it might be the right file format for you, and where PyTables fits in the Python data ecosystem.

Outline:
- What is HDF5 and who uses it?
- Brief overview of the HDF5 data model
- First steps with PyTables
- PyTables tools
- Search big data with PyTables and NumExpr
- Additional resources to learn more
- Q&A

How to create interactive maps in Python / R
Slovak flag Workshop Data Science

Martin Bago (SK)

- Prečo je interaktívna mapa infografikou budúcnosti
- Ako vytvárať praktické interaktívne .html mapy v prostredí Python a R
- Ktoré knižnice sú pri výrobe nevyhnutné
- Čo sú kľúčové problémy pri výrobe interaktívnych máp - ako integrovať polygóny okresov, ako svoju mapu vyfarbiť a podobne...
- Akými dátami mapy plniť
- A čo sú typické príklady použitia interaktívnych máp

Meet the pandas
Slovak flag Workshop Data Science

Michal Nalevanko (SK)

Workshop s pandami, presnejšie s pandas - flexibilným nástrojom Pythonu na manipuláciu s dátami, ich analýzu a vizualizáciu.

Michal Nalevanko bude mať pre vás pripravené nielen predstavenie tejto populárnej knižnice, ale aj praktické zadania, s ktorými si pandas sami vyskúšate. Prineste si preto aj vlastné notebooky, určite ich využijete.

Meteo data in Python. Effectively.
Slovak flag Talk Data Science

Miloš Korenčiak & Branislav Cief (SK)

Ako v Solargis-e spracovávame veľké maticové meteodáta v Pythone (desiatky TB pri najväčších úlohách).

Meteodáta pre náš Python backend priniesli viacero výziev: od harmonizácie vysoko špecializovaných formátov do niečoho zrozumiteľnejšieho, cez optimalizáciu operácií v numpy, po efektívne ukladanie / čítanie / archiváciu numpy matíc v netCDF4 formáte.

Prednáška sa zameriava na praktické použitie netCDF4 - ako optimalizovať tieto súbory pre rôzne druhy čítaní / zápisov, kde sú praktické limity týchto súborov a prečo je vhodné segmentovať archív.

Testing Essentials for Scientists and Engineers
English flag Workshop Data Science

Claus Aichinger (AT)

Please find the complete workshop description as well as installation instructions in the following GitHub repository:

https://github.com/caichinger/pyconsk18_testing

The Truth about Mastering Big Data
English flag Talk Data Science

Anton Caceres (UA)

What do you think is the most essential skill a data scientist should master? Knowledge of deep learning tools? Hadoop? SciPy?

This talk reveals the cornerstone of data science: nothing is as important as asking data the right questions. To make it work, we need some tools and curiosity.

While focusing on tools, we will first go over the data science subject as a whole, define our goals, continue with an overview of the essential Python packages like Pandas and Jupyter Notebook, and conclude with a live demo. The purpose of this talk is to understand our data: read it, visualize, and formulate right questions, as well as to endorse your imagination as a data scientist.