PavelŠmíd
Custom Colors
O Poznejte mě.
Ahoj,
jmenuji se Pavel Šmíd a jsem absolventem Python Akademie ENGETO.

Abych získal certifikát ENGETO CERTIFIED PYTHON BEGINNER, musel jsem úspěšně dokončit tři projekty podle zadání, které jsou nyní k dispozici na mém GitHubu.
S programovacím jazykem Python se zabývám od května 2022. Mým hlavním zaměřením je datová analýza, která mě fascinuje z několika důvodů. Zbožňuji historii, která je často ukryta v datech, a zajímá mě, jak můžeme prostřednictvím správné analýzy dat získat vhled do minulosti i budoucnosti. Rovněž mě zajímají faktory, které ovlivňují výsledky analýzy.
Programování a datová analýza mě oslovily svou univerzálností, ale také náročností. I ta nejmenší chyba může mít velký dopad, a proto dbám na preciznost při psaní kódu.
Při práci s daty využívám následující nástroje a technologie:

- Programovací jazyk Python
- Knihovny Pandas a Seaborn
- Editor zdrojového kódu Visual Studio Code
- Jupyter Notebook
- Dotazovací jazyk Postgre SQL pgAdmin4 dále MS SQL Azure Data Studio
- MS Excel pro analýzu a manipulaci s daty
- ML klasifikace KNN
- Pro vizualizaci dat používám nástroj Microsoft Power BI.

Rád bych se v budoucnu plně věnoval datové analýze, získával více zkušeností a prohluboval své znalosti.

Your Image
Custom Colors
Custom Colors
Portfolio Něco z mé Práce
portfolio-first

Deskriptivní analýza stížností finančních spotřebitelů

Deskriptivní analýza stížností finančních spotřebitelů se zaměřuje na identifikaci nejběžnějších problémů spojených s finančními produkty, jako jsou například kreditní karty, vymáhání pohledávek a bankovní účty. Tato analýza využívá programovací jazyk Python, Jupyter Notebook a hlavní knihovnu Pandas. K vizualizaci dat jsou použity knihovny Seaborn a Power BI.

Data jsou získávána prostřednictvím URL a následně jsou upravena a převedena do formátu CSV. Dále jsou exportována do relační databáze PostgreSQL. Je důležité poznamenat, že se jedná o cvičný dataset s fiktivními daty, který simuluje reálné data z USA. Všechny výsledné reporty a analýzy mají za cíl pomoci řešit problémy spojené s finančními produkty a zlepšit kvalitu služeb pro spotřebitele

portfolio-second

Interaktivní databáze vozidel v PostgreSQL

Tento projekt představuje moji práci s databází PostgreSQL a Pythonem. Cílem tohoto projektu je vytvořit interaktivní databázi vozidel, která umožní uživatelům zaznamenávat a prohlížet si informace o různých vozidlech.

Projekt obsahuje následující klíčové prvky:
Tabulka PostgreSQL:
Vytvoření tabulky v PostgreSQL pro ukládání informací o vozidlech.

Skripty Pythonu:
Použití Pythonu ve verzi 3.11.0 a knihovny psycopg2 ve verzi 2.9.5 pro manipulaci s databází.

Uživatelské rozhraní v terminálu:
Uživatelé mohou interaktivně zadávat informace o vozidlech, jako je značka, stáří a cena, prostřednictvím terminálu.

Zobrazování dat:
Po zadání dat se zobrazí aktuální stav tabulky s novými hodnotami.

Kontrola spojení:
Projekt zahrnuje kontrolu stavu spojení s databází. Pokud je spojení uzavřeno (hodnota 1), znamená to úspěšné provedení operací.

Tento projekt slouží jako ukázka mé schopnosti práce s databází PostgreSQL, programovacím jazykem Python a interaktivním uživatelským rozhraním v terminálu. Je to jen jedna z mnoha možností, jak mohu využít své dovednosti v oblasti datové analýzy a programování pro efektivní správu a manipulaci s daty. Věřím, že tento projekt je jen začátek a mám v plánu rozvíjet své dovednosti a projekty ještě více v budoucnosti.

portfolio-third

Volební webscraping

Projekt "Volební webscraping" je nástroj pro získávání výsledků voleb z roku 2017 z odkazu ' https://volby.cz/pls/ps2017nss/ps3?xjazyk=CZ '. Tento nástroj pracuje na základě zadaného územního celku, který uživatel specifikuje jako první argument v příkazovém řádku. Dále je třeba zadat druhý argument, což je název souboru ve formátu .csv, do kterého budou získané výsledky uloženy.

Instalace:
Před použitím projektu je třeba nainstalovat potřebné závislosti. Tyto závislosti jsou uvedeny v souboru "requirements.txt". Pro jejich instalaci můžete použít nástroj jako "pip" a příkaz pip install -r requirements.txt.

Použití:
Projekt lze spustit z příkazového řádku. Uživatelé by měli specifikovat územní celek jako první argument a název výstupního souboru ve formátu .csv jako druhý argument. Postupujte dle README.md

Vizualizace dat:
Kromě získávání dat obsahuje tento projekt také soubor "vizualizace_volby2017.ipynb", který slouží k vizualizaci a analýze dat z voleb 2017. Tento soubor může být užitečný pro detailní zkoumání výsledků a jejich prezentaci.

Celkově je tento projekt určen k efektivnímu získávání a zpracování volebních výsledků a poskytuje uživatelům možnost vizualizovat a analyzovat tato data pro různé územní celky.

portfolio-fourth

Textový analyzátor

Pogram, který se bude umět prokousat libovolně dlouhým textem a zjistit o něm různé informace.

1. program si vyžádá od uživatele přihlašovací jméno a heslo
2. zjistí, jestli zadané údaje odpovídají někomu z registrovaných uživatelů
3. pokud je registrovaný, pozdraví jej a umožní mu analyzovat texty
4. pokud není registrovaný, upozorní jej a ukonči program

Program nechá uživatele vybrat mezi třemi texty, uloženými v proměnné TEXTS:
Pokud uživatel vybere takové číslo textu, které není v zadání, program jej upozorní a skončí, pokud uživatel zadá jiný vstup než číslo, program jej rovněž upozorní a skončí. Pro vybraný text spočítá následující statistiky:

- počet slov
- počet slov začínajících velkým písmenem
- počet slov psaných velkými písmeny
- počet slov psaných malými písmeny
- počet čísel (ne cifer)
- sumu všech čísel (ne cifer) v textu

Program zobrazí jednoduchý sloupcový graf, který bude reprezentovat četnost různých délek slov v textu.

portfolio-fourth

SQL projekt

Datové podklady, ve kterých bude možné vidět porovnání dostupnosti potravin na základě průměrných příjmů za určité časové období.

Zde jsou připraveny datové podklady pro definované výzkumné otázky, které adresují dostupnost základních potravin široké veřejnosti. V těchto datových podkladech je možné vidět porovnání dostupnosti potravin na základě průměrných příjmů za určité časové období, dále HDP, GINI koeficient a počet populace dalších evropských států ve stejném období, jako primární přehled pro ČR.

Výzkumné otázky:

1. Rostou v průběhu let mzdy ve všech odvětvích, nebo v některých klesají?

2. Kolik je možné si koupit litrů mléka a kilogramů chleba za první a poslední srovnatelné období v dostupných datech cen a mezd?

3. Která kategorie potravin zdražuje nejpomaleji (je u ní nejnižší percentuální meziroční nárůst)?

4. Existuje rok, ve kterém byl meziroční nárůst cen potravin výrazně vyšší než růst mezd (větší než 10 %)?

5. Má výška HDP vliv na změny ve mzdách a cenách potravin? Neboli, pokud HDP vzroste výrazněji v jednom roce, projeví se to na cenách potravin či mzdách ve stejném nebo násdujícím roce výraznějším růstem?

Custom Colors
Studijní materiály Tištěné a digitální materiály.
Custom Colors
Kontaktuj te
name-icon
Jméno:

Pavel Šmíd

location-icon
Bydliště:

Netovice, Slaný

phone-icon
Telefoní číslo:

+420739677372

email-icon
Email:

smidpavel.py@gmail.com