Michal Rjaško

Kontakt:

rjasko (zavinac) dcs.fmph.uniba.sk

Praktické cvičenia z databáz 2022/2023 ZS

Ján Mazák, M255, mazak at dcs.fmph.uniba.sk
Michal Rjaško, rjasko at dcs.fmph.uniba.sk

Domáce ulohy

Budú 3 a budú zverejnené na tomto mieste.

Domáca úloha č. 1

zadanie
testovacia databáza
odovzdať do 3. 11. 2022

Domáca úloha č. 2

Zadanie
odovzdať do 8. 12. 2022

Domáca úloha č. 3

Zadanie
odovzdať do 13.1.2023

Cvičenie 12

Množstvo úloh na tomto cvičení je pomerne veľké, preto sú za 2 body: 1 bod za úlohy na vkladanie veľkých objemov dát a create function / trigger; 1 bod za úlohy v časti Transakcie a izolácia. Všetko stačí odovzdať do 19. 12.

Vkladanie veľkých objemov dát

Pozrite si PostgreSQL príkaz COPY: https://www.postgresql.org/docs/current/sql-copy.html
Stiahnite si CSV súbor obsahujúci dáta všetkých miest: https://simplemaps.com/data/world-cities
Vytvorte JAVA aplikáciu, ktorá inicializuje tabuľku miest world_cities(city,city_ascii,lat,lng,country,iso2,iso3,admin_name,capital,population,id) v PSQL dátami z vyššie uvedeného súboru

Najskôr skúste dáta vkladať pomocou príkazu COPY

Aby fungoval príkaz COPY s cestou k súboru, t.j. COPY world_cities FROM 'world_cities.csv', museli by ste byť prihlásený ako administrátor serveru (root v linuxe), inak PosgreSQL nevie čítať daný súbor. Toto teda nepôjde
Z javy však môžeme využiť CopyManager: https://stackoverflow.com/questions/46988855/correct-way-to-use-copy-postgres-jdbc

Neskôr skúste vložiť dáta cez bulk INSERT (viac riadkov, povedzme 100 v jednom inserte - prípadne vyskúšajte, koľko riadkov Vám prejde, popis viacerých spôsobov vkladania dát nájdete na https://www.postgresqltutorial.com/postgresql-jdbc/insert/, skúste napr. PreparedStatement.addBatch()).
V tabuľke vytvorte indexy, ktoré umožnia vyhľadať mesto podľa jeho názvu, krajiny alebo zemepisnej šírky a dĺžky (napr. cez operátor BETWEEN).
Porovnajte rýchlosti napĺňania tabuľky cez COPY a INSERT. Skúste napĺňať tabuľku bez indexov (pričom sa vytvoria až po vložení všetkých riadkov), porovnajte rýchlosť s tým, keď sú indexy vytvorené ešte pred vkladaním dát.

Create function / trigger

Pozrite si dokumentáciu:

Vytvorte funkciu, ktorá z tabuľky word_cities vytvorí tabuľku world_countries(name, iso2, iso3, population, lat, lng), kde name bude názov krajiny, population bude súčtom populácie všetkých miest v krajine a lat,lng bude stredový bod zo všetkých pozícií miest.
Vytvorte trigger, ktorý pri zmene populácie nejakého mesta upraví aj veľkosť populácie danej krajiny (podobne pri vložení alebo zmazaní nového mesta)
Z Vašej JAVA aplikácie vyskúšajte zmeniť populáciu niektorých náhodných miest (alebo načítajte údaje o meste a novej populácii z konzoly - pozor na SQL injection) a skontrolujte (resp. naprogramujte v JAVE kontrolu), či trigger to prepočítal správne

Transakcie a izolácia

Pozrite si dokumentáciu:

BEGIN, COMMIT, ABORT / ROLLBACK
Transakcie v JDBC: conn.setAutoCommit(false); conn.commit(); conn.rollback();
Transaction isolation
Transaction isolation v JDBC

Vo Vašej JAVA aplikácii si vytvorte dve spojenia na databázu (t.j. máte dva objekty typu Connection - Connection c1; Connection c2)
Vytvorte tabuľku population_changes(country text, year int, population_in int, population_out int) - population_in znamená koľko nových ľudí pribudlo v danej krajine (narodenia + migrácia) a population_out znamená koľko ľudí odbudlo (smrť + migrácia).
Vyskúšame, ako fungujú paralelne bežiace transakcie. Vytvorte dve JAVA funkcie:
1. covidPandemic(Connection c, String country): funkcia vypíše na konzolu názov a aktuálnu populáciu danej krajiny, zníži populáciu o 0.1%, zmenu zapíše do tabuľky population_changes a následne zase vypíše na konzolu novú hodnotu populácie (s využitím SELECT dotazu). Vo funkcii nevolajte ani setAutoCommit(false), ani commit() - budeme ich volať v inej časti kódu
2. migrationCrisis(Connection c, String srcCountry, String dstCountry): funkcia vypíše na konzolu názov a aktuálnu populáciu obidvoch krajín, zníži populáciu srcCountry o 1%, a o danú hodnotu zvýši populáciu cieľovej krajiny. Zmeny zapíše do tabuľky population_changes a následne zase vypíše na konzolu nové hodnoty populácie obidvoch krajín (s využitím SELECT dotazu). Vo funkcii nevolajte ani setAutoCommit(false), ani commit() - budeme ich volať v inej časti kódu
V hlavnej časti programu následne skúste použiť vyššie uvedené funkcie tak, aby bežali v dvoch prelínajúcich sa transakciách.
- napr. zavoláte c1.setAutoCommit(false);c2.setAutoCommit(false); covidPandemic(c1, 'Slovakia'); migrationCrisis(c2, 'Ukraine','Slovakia');c1.commit();c2.commit();- skúste to pre viacero krajín za sebou
- pozorujte, ako sa transakcie správajú - kedy zmeny vykonané jednou transakciu vidí druhá transakcia
- Skúste použiť aj rôzne spôsoby izolácie transakcií napr. BEGIN TRANSACTION ISOLATION LEVEL SERIALIZABLE - v JAVE con.setTransactionIsolation(Connection.TRANSACTION_SERIALIZABLE);
Skúste pomocou niekoľkých vlákien vykonávať transakcie paralelne - niektoré vlákna budú volať funkciu covidPandemic(c1, country), iné migrationCrisis(c2, srcCountry, dstCountry)
- Prípadne môžete vyskúšať do transakcií zakomponovať aj "SELECT pg_sleep(random())", aby transakcie trvali dlhší čas.
- Pozorujte či na seba jednotlivé transakcie "čakajú", ak pristupujú k tým istým riadkom (pozrite aj httpAs://www.citusdata.com/blog/2018/02/15/when-postgresql-blocks/)

Cvičenie 12

Indexy a query planner (EXPLAIN / ANALYZE)

Napriek tomu, že dotazy sa formulujú v deklaratívnych jazykoch (nevieme špecifikovať postup výpočtu), možno sa relačnej databázy opýtať, aký postup bol zvolený. Toto dáva zmysel najmä v prípadoch, keď je výpočet dotazu podstatne pomalší, než by sme očakávali. Zapamätajte si však raz a navždy: v prvom rade sa vždy snažíme o vysokú rýchlosť pochopenia zápisu dotazu ľudmi, až potom nás zaujíma rýchlosť výpočtu (a aj to zvyčajne len pri dotazoch, ktoré sú kritické, napr. sa vykonávajú veľmi často).
"Premature optimization is the root of all evil." (D. Knuth)
(Aby sme však príliš nezjednodušovali, pozrite si tiež jeden či dva ďalšie pohľady.)
Systém PostgreSQL a tiež niektoré iné umožňujú sledovať plán a rýchlosť výpočtu dotazu pomocou príkazov EXPLAIN a ANALYZE.
Plánovač dotazov (query planner) kladie primárny dôraz na diskové operácie. Podkladom pre jeho prácu je množstvo dát v jednotlivých tabuľkách a spôsob uloženia dát na disku. Databáza si tieto údaje uchováva v pomocných tabuľkách, ktoré nereflektujú okamžitý stav, ale len jeho aproximáciu (ak by sme ich updatovali zakaždým, neúmerne by sa natiahol čas pre príkazy INSERT, UPDATE a DELETE). Tieto údaje získame takto:
```
SELECT relpages, reltuples FROM pg_class WHERE relname = 'ab';
```
Zadajte do psql na serveri cvika.dcs.fmph.uniba.sk
```
        EXPLAIN SELECT name, deptno, COUNT(empno) OVER (PARTITION BY deptno) FROM emp;
        EXPLAIN SELECT emp.name, dept.name, COUNT(empno) OVER (PARTITION BY emp.deptno) FROM emp JOIN dept ON emp.deptno = dept.deptno;
        
```
a skúste pochopiť, aké činnosti ide vykonať databáza. Tieto činnosti sú popísané pomocou fyzických operátorov, ktoré sú "podrobnejšie" ako operátory relačnej algebry (napr. join je možné spraviť naivným spôsobom "každý s každým" alebo ho urýchliť cez triedenie či hašovanie --- toto plán výpočtu dotazu v relačnej algebre nerozlišuje). Porovnávať plány výpočtu v relačnej algebre je možné, až keď sú jej operátory namapované na fyzické operátory.

Stiahnite si na server cvika súbor explain.sql (napr. pomocou wget) a spusťte psql -f explain.sql. Potom spusťte psql, postupne vykonávajte nasledujúce príkazy a analyzujte plány, ktoré vytvoril plánovač. Skúste pochopiť, prečo bol daný plán zvolený.


    explain analyze select * from ab;
    explain analyze select * from ab where b < 4 order by b;
    explain analyze select * from ab where b = 4 order by b;
    create index i1 on ab (b);    -- we hope that adding an index will shorten running time
    explain analyze select * from ab where b < 4 order by b;
    explain analyze select * from ab where b = 4 order by b;
    create index i1h on ab using hash(b);   -- the default index type is btree, we want to try hash index too
    explain analyze select * from ab where b < 4 order by b;
    explain analyze select * from ab where b = 4 order by b;

Vykonajte posledný príkaz desaťkrát po sebe a sledujte, ako sa mení reálny spotrebovaný čas.


    drop index i1;
    drop index i1h;
    explain select * from ab, bc;    -- materialize stores the result in memory so that we can look at it more than once
    explain select * from ab, bc where ab.b = bc.b;
    
    insert into bc select x.id, x.id + 1 from generate_series(1, 1000000) as x(id);
    explain select * from ab, bc where ab.b = bc.b;
    
    explain select b, count(distinct c) from bc where not exists (select 1 from ab, cd where ab.b = bc.b and cd.c < bc.c) group by b having count(distinct c) < 3;

Pozor na použitie analyze: môže to trvať veľmi dlho.

Materiály k databázovým indexom:

Spusťte psql -f explain.sql. Ideme porovnať plány pre nižšie uvedené dotazy A, B, C, D v niekoľkých rôznych situáciách (líšia sa existenciou indexov a množstvom dát v tabuľkách); odporúčame uložiť si plány pre jednotlivé opakované dotazy do osobitných súborov, aby sa vám ľahko porovnávali.


    (A) explain select * from ab, bc where ab.b = bc.b;
    (B) explain select * from ab, bc where ab.b = bc.b order by ab.b;
    (C) explain select * from ab, bc where ab.b < bc.b;
    (D) explain select * from ab, bc where ab.b < bc.b order by ab.b;

Teraz budeme postupne vytvárať indexy a napĺňať tabuľky.


    create index i1 on ab (b);
    /* run all of A, B, C, D */
    
    create index i2 on bc (b);
    /* run all of A, B, C, D */
    
    insert into bc select x.id, x.id + 1 from generate_series(1, 1000000) as x(id);
    insert into bc select x.id, x.id + 1 from generate_series(1, 1000000) as x(id);
    insert into bc select x.id, x.id + 1 from generate_series(1, 1000000) as x(id);
    /* run all of A, B, C, D */
    
    drop index i2;
    create index i2composite on bc (b, c);
    /* run all of A, B, C, D */
    
    create index i1h on ab using hash(b);
    create index i2h on bc using hash(b);
    /* run all of A, B, C, D */

    drop index i1;
    drop index i2composite;
    /* run all of A, B, C, D */

Všimnite si, ako "čas" vypočítaný plánovačom rastie, ak index obsahuje nepotrebné stĺpce.

Spusťte psql -f explain.sql a analyzujte plány, ktoré vytvorí plánovač pri nasledujúcich príkazoch.


    explain select * from ab, bc, cd where ab.b = bc.b and bc.c = cd.c;
        explain select * from ab, bc, cd where ab.b = bc.b and bc.c < cd.c;
    explain select * from ab, bc, cd where ab.b < bc.b and bc.c < cd.c;

    create index i3 on cd(c);
    explain select * from ab, bc, cd where ab.b = bc.b and bc.c = cd.c;
    explain select * from ab, bc, cd where ab.b = bc.b and bc.c < cd.c;
    explain select * from ab, bc, cd where ab.b < bc.b and bc.c < cd.c;

    create index i4 on bc (b, c);
    explain select * from ab, bc, cd where ab.b = bc.b and bc.c = cd.c;
    explain select * from ab, bc, cd where ab.b = bc.b and bc.c < cd.c;
    explain select * from ab, bc, cd where ab.b < bc.b and bc.c < cd.c;
    
    create index i3h on cd using hash(c);
    create index i4h on bc using hash(c);

    explain select * from ab, bc, cd where ab.b = bc.b and bc.c = cd.c;
    explain select * from ab, bc, cd where ab.b = bc.b and bc.c < cd.c;
    explain select * from ab, bc, cd where ab.b < bc.b and bc.c < cd.c;

    insert into ab select x.id, x.id + 1 from generate_series(1, 100000) as x(id);
    insert into bc select x.id, x.id + 1 from generate_series(1, 100000) as x(id);
    insert into cd select x.id, x.id + 1 from generate_series(1, 100000) as x(id);

    explain select * from ab, bc, cd where ab.b = bc.b and bc.c = cd.c;
    explain select * from ab, bc, cd where ab.b = bc.b and bc.c = cd.c order by cd.c;

    explain select cd.c, count(*) from ab, bc, cd where ab.b = bc.b and bc.c = cd.c group by cd.c;

Úloha na odovzdanie: vyberte si 2 plány, ktoré pokladáte za najzaujímavejšie, a popíšte, čo a prečo na nich pokladáte za zaujímavé; pridajte tiež jeden vlastný netriviálny príklad toho, ako indexy zmenili plán a skrátili výpočet (nezabudnite uviesť tiež dotaz a prípadne schému/obsah databázy).

Cvičenie 11

Dokončenie predošlého cvičenia.

Cvičenie 10

SQLite

SQLite je databázový systém, ktorý nevyžaduje samostatný server --- beží v rámci výpočtového procesu Vašej aplikácie. Ak chcete vo Vašej aplikácii využiť relačnú databázu a nepotrebujete centralizované úložisko (ktoré by zbieralo dáta z viacerých aplikácií), SQLite je zvyčajne vhodné riešenie. Taktiež sa vo veľkom využíva na testovanie, pri tvorbe prototypov a v úvodnej fáze vývoja aj v prípadoch, keď v produkčnej verzii softvéru bude použitý iný databázový systém. Vhodné je aj pre zariadenia s obmedzenou výpočtovou či pamäťovou kapacitou (bežne sa využíva napr. v aplikáciách pre Android).
prezentácia

Pripojenie k databáze z prostredia programovacieho jazyka Java

prezentácia
Vytvorte si nový projekt. Stiahnite si SQLite JDBC driver a pridajte ho do projektu.
Pozrite si tutoriál k používaniu SQLite v Jave.
Na cvičení budeme používať databázu známok, ktorú sme vytvárali na predchádzajúcich cvičeniach.
Úlohy:
1. Napíšte program, ktorý sa pripojí na databázu a vypíšte na konzolu mená študentov.
2. Naplňte tabuľky náhodnými dátami. Vytvorte si sadu niekoľkých mien a niekoľkých priezvisk (napr. 20-30 mien a 20-30 priezvisk). Nezdržujte sa dlho vymýšľaním mien (radšej použite "AAA", "BBB",...)
  - Naplňte tabuľky tak, aby ste mali cca 100 učiteľov, 600 študentov, 20 predmetov, a aby mal každý študent okolo 200 známok (cca 10-15 z každého predmetu, t.j. spolu okolo 120 000 známok).
  - Zmerajte koľko trvá naplnenie tabuľky známok dátami (vypíšte na konzolu, koľko milisekúnd operácia trvala).
3. Pri napĺňaní tabuliek vyskúšajte rôzne spôsoby optimalizácie a porovnajte ich rýchlosti (viď http://www.postgresql.org/docs/9.1/static/populate.html):
  1. Každý riadok najprv vkladajte jedným insertom bez použitia prepared statementu
  2. Každý riadok najprv vkladajte jedným insertom s použitím prepared statementu
  3. Spojte niekoľko riadkov do jedného insertu - pravdepodobne nebudeme môcť urobiť INSERT so všetkými riadkami, ktoré chcete vložiť, kvôli obmedzeniam na maximálnu veľkosť dotazu (cca niekoľko MB). Vhodné je preto spojiť do jedného INSERT dotazu od 100 do 1000 riadkov. Môžete vyskúšať, koľko Vám systém dovolí
  4. Vykonajte všetky INSERT dotazy v jednej transakcii
  5. Pred vkladaním zrušte všetky indexy tabuľky a po vložení ich vytvorte
  6. Pred vkladaním zrušte všetky CONSTRAINTy tabuľky a po vložení ich vytvorte
4. Napíšte program, ktorý z konzoly načíta Meno a Priezvisko a triedu študenta a vypíšte jeho známky (nazov predmetu: známky z predmetu oddelené čiarkov). Ak je študentov s daným menom a triedou viac, vypíšte prvého z nich. Použite prepared statement. Zabezpečte, aby pri písaní mena nezáležalo na veľkých a malých písmenách.
5. Upravte program z predchádzajúcej úlohy tak, aby systém vyhľadal študenta, ak používateľ napíšte len časť jeho mena / priezviska. Ak sa nájde viac študentov spĺňajúcich vyhľadávacie kritéria, dajte používateľovi možnosť vybrať si (napr. vypísaním zoznamu a používateľ bude musieť zadať por. číslo / ID, ktorého študenta myslel).
Vyskúšajte pripojiť sa na databázu PostgreSQL (cez TCP/IP) miesto SQLite. Ak ju nemáte spustenú lokálne, môžete využiť server cvika.dcs.fmph.uniba.sk, prístup však treba nastaviť (ukážeme si využitie SSH tunela, čiže port forwarding):
1. Pripojte sa cez SSH na cvika.dcs.fmph.uniba.sk a spusťte psql.
2. Nastavte si heslo pomocou
```
ALTER USER {vase_prihlasovacie_meno} WITH PASSWORD '{vase_nove_heslo}'
```
  Funkčnosť hesla možno otestovať príkazom
```
psql -h 127.0.0.1 test {vase_prihlasovacie_meno}
```
3. Aby sme sa mohli pripájať na Postgres bežiaci na cvika.dcs.fmph.uniba.sk zo vzdialeného počítača, vytvoríme SSH tunel:
  - LINUX: ssh -L15432:127.0.0.1:5432 meno_pouzivatela@cvika.dcs.fmph.uniba.sk
  - WINDOWS: v Putty treba nastaviť "local port forwarding" z portu 15432 na 127.0.0.1:5432
4. Stiahnite si PostgreSQL JDBC driver a pridajte ho do projektu.
5. Podľa tutoriálu sa pripojte k databáze.
Otestujte rýchlosť vykonávania dotazov a porovnajte ju s výsledkami pre SQLite.

Cvičenie 9

Constraints

prezentácia
Pokračujeme v práci s tabuľkami vytvorenými v predošlom cvičení.
Úlohy:
1. Pre každú tabuľku zvoľte primárny kľúč.
2. Pomocou UNIQUE zabezpečte, aby trieda mohla mať predmet pridelený len raz (vyhýbame sa duplicitným záznamom).
3. Zakážte NULL v stĺpcoch, kde je nutné evidovať hodnotu (napr. nie je nutné, aby študent mal evidované pohlavie, ale musí mať meno).
4. Obmedzte pomocou CHECK možné hodnoty pre pohlavie a dátum narodenia (zvoľte si nejaký zmysluplný rozsah). Vyskúšajte, či vaše obmedzenie funguje pri INSERT aj pri UPDATE.
5. Doplňte cudzie kľúče do tabuľky známok: hodnoty v stĺpcoch musia odkazovať na existujúceho študenta, učiteľa a predmet. Overte funkčnosť pri INSERT, kde odkaz na predmet je neexistujúci alebo NULL.
6. Ku všetkým cudzím kľúčom doplňte zmysluplné hodnoty pre ON DELETE: pri zmazaní študenta treba zmazať záznamy o jeho známkach; učiteľa alebo predmet nie je možné zmazať, ak sa ich týkajú nejaké záznamy o známkach. Overte, či vaše nastavenia fungujú pri pokuse o zmazanie všetkých učiteľov, všetkých predmetov či jednotlivých študentov.
7. Ku všetkým cudzím kľúčom doplňte zmysluplné hodnoty pre ON UPDATE a nastavte okamžité vyhodnocovanie s možnosťou zmeniť ho v rámci transakcie (DEFERRABLE INITIALLY IMMEDIATE).
8. Napíšte dotaz, ktorý presunie všetky známky z biológie pre študentov z 1.A z jedného učiteľa na iného. Preverte, že dotaz funguje správne.

Views

Pozrite si dokumentáciu k VIEW.
Pokračujeme v práci s tabuľkami vytvorenými v predošlom cvičení.
Vytvorte pohľad (VIEW), ktorý pre každého študenta a predmet, ktorý je priradený jeho triede, zobrazuje priemer známok. Záznamy by mali byť zoradené podľa mena študenta, potom podľa názvu predmetu, a nakoniec podľa priemeru známok (všetko vzostupne, čiže ASC).
Overte, že vytvorený pohľad sa zachová aj po odhlásení a opätovnom prihlásení.
Overte, že vytvorený pohľad reflektuje zmeny v podkladových dátach.

Cvičenie 8

DDL, DML

prezentácia
Postgres dokumentácia:
- CREATE TABLE
- DROP TABLE
- ALTER TABLE
- INSERT
- UPDATE
- DELETE
- CREATE DATABASE
- DROP DATABASE
Chceme založiť databázu pre evidenciu známok, študentov a učiteľov na strednej škole. Potrebujeme evidovať nasledovné:
- Študent --- meno, priezvisko, pohlavie, trieda, dátum narodenia
- Učiteľ --- meno, priezvisko, pohlavie
- Predmet --- názov predmetu, skratka
- Známka --- samotná známka (text), študent, ktorý učiteľ ju zadal, z akého je predmetu, čas zadania, z čoho bola (napr. že z domácej úlohy), váha známky (do priemeru)
- Nie všetky triedy majú všetky predmety, preto potrebujeme evidovať, ktorá trieda má ktorý predmet.
Navrhnite štruktúru tabuliek vyššie uvedenej databázy --- vytvorte súbor znamky.sql, ktorý bude obsahovať SQL definície tabuliek (CREATE TABLE). Na začiatok súboru pridajte príkaz DROP TABLE IF EXISTS, aby ste súbor znamky.sql mohli spúšťať viackrát. (Integritu databázy, čiže veci ako cudzie kľúče, budeme riešiť až na ďalšom cvičení.)
Súbor znamky.sql doplňte o údaje --- do každej tabuľky pridajte pomocou INSERT niekoľko riadkov (opäť --- príkazy chceme mať spísané v súbore, aby sme ich mohli vykonať opakovane; môže to byť súbor znamky.sql).
Skúste použiť aj diakritiku --- pozor na kódovanie súboru znamky.sql.
Rozhodli sme sa sprístupniť zadávanie a prezeranie známok cez internet. Pomocou ALTER TABLE doplňte do tabuliek študent a učiteľ stĺpce na evidenciu prihlasovacích mien (heslá pre jednoduchosť nepoužijeme, z bezpečnostných dôvodov sa nesmú v databáze ukladať v odkrytej podobe). Vytvorte index na vyhľadávanie podľa prihlasovacieho mena.
- vytvorte index tak, aby vyhľadávanie fungovalo case-insensitive
Jeden z učiteľov sa rozhodol odísť zo školy a chceme ho vymazať z databázy. Známky však musia ostať, t.j. jeho známky sa presunú na iného učiteľa.
- Napíšte dotaz, ktorý presunie známky z jedného učiteľa na druhého (poznáme ID oboch učiteľov).
- Napíšte dotaz, ktorý vymaže učiteľa z databázy (na základe jeho ID).
(Evidencia historických dát je jeden z najotravnejších praktických problémov, s ktorými sa pri návrhu databáz stretávame. Pozrite si, hoci len zbežne, jedno z možných riešení.)
Ďalšie úlohy:
1. Zdvojnásobte váhu všetkých známok, ktorých hodnota začína na "5" --- napíšte dotaz.
2. Vypíšte meno študenta, predmet, počet študentových známok z daného predmetu a zoznam týchto známok oddelených čiarkami (skúste použiť funkciu array_agg, prípadne aj array_to_string).
3. Vypíšte zoznam študentov a ku každému z nich mená predmetov takých, že z nich študent nemá známku, ale mal by mať (tento predmet je v zozname predmetov jeho triedy). Doplňte zoznam o priemerný počet známok z daného predmetu pre danú triedu.
4. Pre každý predmet spočítajte celkový počet a priemerný počet známok na žiaka. Výsledok usporiadajte podľa celkového počtu známok a zobrazte len prvých 10 riadkov.
5. Pre každého učiteľa vypočítajte priemer prirodzeno-číselných známok, ktore zadal. Pozor, funkcia AVG potrebuje na vstupe číslo --- potrebujete použiť CAST(... AS INTEGER). Ak to číslo však nebude číslo, vyhlási to chybu. Nečíselné známky odfiltrujte napr. pomocou regulárnych výrazov (napr. konštrukcia WHERE znamka ~ '^[0-9]*$').
6. O študentoch často potrebujeme evidovať veľmi špecifické údaje - evidujú sa len pre malé množstvo študentov. Vytvorne v tabuľke študentov JSON pole "moredata", v ktorom bude takéto údaje možné evidovať. Vyplnťe niektorým študentom zrakové postihnutie a následne napíšte dotaz, ktorý zobrazí študentov so zrakovým postihnutím.

Cvičenie 7

Window functions

prezentácia
Vytvorte si lokálnu databázu (SQLite/PostgreSQL) alebo sa pripojte na cvika.dcs.fmph.uniba.sk (návod viď predchádzajúce cvičenia).
Pracujeme s databázou zamestnancov (emp.sql). Napíšte (napr. do nového súboru window_emp.sql) nasledovné SQL dotazy využívajúce window functions:
1. Pre každého zamestnanca nájdite jeho poradové číslo podľa jeho platu (stĺpec salary). Zamestnanci s rovnakým platom majú mať rovnaké poradové číslo.
2. Pre každého zamestnanca vypíšte rozdiel jeho platu od priemerného platu v jeho departmente.
3. Pre každého zamestnanca vypíšte jeho poradové číslo podľa jeho platu v rámci zamestnancov z toho istého mesta, rozdiel od priemerného platu v danom meste a počet zamestnancov v tomto meste.
4. Firma potrebuje ušetriť na platoch mesačne 8000 USD. Zobrazte najdlhší možný zoznam zamestnancov s najnižším platom, ktorých súčet platov je menší ako 8000 (t.j. počínajúc zamestnancom s najmenším platom, až po zamestnanca, ktorého plat spolu s predošlými zamestnancami je najbližšie pod hranicou 8000).
5. Podobne ako v predošlom cvičení, ale chceme skončiť tesne nad 8000 eur (t.j. zoznam skončí akonáhle suma platov presiahne 8000).
6. Nájdite mediánový plat pre jednotlivé oddelenia. (Návod; pred zavedením PERCENTILE_CONT v PostgreSQL 9.4 v r. 2014 bolo počítanie mediánu vysoko netriviálne.)

Prístupové práva

dokumentácia: GRANT, REVOKE
Prihláste sa na cvika.dcs.fmph.uniba.sk (návod viď predchádzajúce cvičenia) a pripojte sa na databázu "test" (psql test).

Užitočné príkazy v psql:

        \du
        \z tablename
        SELECT grantee, privilege_type FROM information_schema.role_table_grants WHERE table_name='test';

Vytvorte novú tabuľku príkazom

CREATE TABLE test_vasemeno (i INTEGER, t TEXT);

a doplňte do nej niekoľko riadkov:

    INSERT INTO test_vasemeno VALUES (1, 'a');
    INSERT INTO test_vasemeno VALUES (2, 'b');

Prideľte právo na SELECT z tejto tabuľky role "test" (ďalej testovacia rola) a overte pomocou \z, či je naozaj pridelené. Spustite psql -U test test, skúste si prezrieť obsah tabuľky test_vasemeno a skúste do nej vložiť nový riadok.
Upravte testovacej role práva na SELECT tak, aby mala možnosť prezerať si v tabuľke test_vasemeno len obsah stĺpca t.
Povoľte spolužiakovi vkladať do tabuľky test_vasemeno riadky tak, aby mohol toto oprávnenie prideliť iným. Vyskúšajte: nech pridelí toto oprávnenie role test. Potom mu odoberte možnosť prideliť toto oprávnenie iným (REVOKE GRANT OPTION FOR) tak, aby stále sám mohol vkladať riadky. Požiadajte ho, nech vyskúša, či to funguje.
Vyskúšajte možnosť kaskádovitého odobratia oprávnenia (pozri CASCADE na stránke http://www.postgresql.org/docs/9.1/static/sql-revoke.html).
Odoberte spolužiakom a testovacej role všetky oprávnenia, ktoré ste im udelili (REVOKE ALL PRIVILEGES FROM).
Zbežne si pozrite možnosti autentifikácie pri prihlasovaní k databáze, aby ste si vytvorili predstavu o súčasných technológiách. (Nie, nebudeme to vyžadovať na žiadnej skúške.)

Cvičenie 6

Rekurzia v SQL

prezentácia
príklady vhodného a nevhodného použitia
Vytvorte si lokálnu databázu (SQLite/PostgreSQL) alebo sa pripojte na cvika.dcs.fmph.uniba.sk (návod viď predchádzajúce cvičenia).
Napíšte rekurzívny dotaz, ktorý vypočíta hodnotu n! (faktoriál) pre n = 10.
Napíšte rekurzívny dotaz, ktorý vypočíta hodnotu 30. Fibonacciho čísla.
Uvažujme databázu zamestnancov, ktorú sme používali na predošlých cvičeniach. Nájdite ku každému manažérovi zoznam jeho podriadených a ku každému podriadenému uveďte, či je priamy alebo nepriamy.
Vytvorte si databázu ciest medzi mestami (roads.sql) a napíšte dotaz, ktorý zistí:
1. odkiaľ sa dá dostať do Ríma
2. odkiaľ sa dá dostať do Ríma po prejdení najviac 1000 km
3. Kamionista prejde za jeden deň maximálne 720km. Vytvorte tabuľku dvojíc [mesto, pocet_dni, pocet_miest], kde pocet_miest určuje počet miest do ktorých za dá dostať z mesta mesto za pocet_dni dní.

Agregácia v SQL

Vytvorte si lokálnu databázu (SQLite/PostgreSQL) alebo sa pripojte na cvika.dcs.fmph.uniba.sk (návod viď predchádzajúce cvičenia).
Stiahnite si nasledujúce súbory:
- world.sql --- definícia databázovej schémy a dáta
- queries_world.sql --- zoznam dotazov, ktoré máte vypracovať; tento súbor budete editovať
Naimportujte si databázu world:
```
psql -f world.sql
```
Vyriešte všetky zadané úlohy.

Cvičenie 5

Agregácia v SQL

prezentácia
Vytvorte si lokálnu databázu (SQLite/PostgreSQL) alebo sa pripojte na cvika.dcs.fmph.uniba.sk (návod viď predchádzajúce cvičenia).
Stiahnite si nasledujúci súbor:
- queries_agg.sql --- zoznam dotazov, ktoré máte vypracovať; tento súbor budete editovať
Vyriešte všetky zadané úlohy.

Agregácia v datalogu (nie je súčasťou hodnotenia na tomto predmete, ale je to užitočné cvičenie pre Úvod do databázových systémov)

Stiahnite si do jedného adresára nasledujúce súbory:
- emp.pl --- databáza zamestnancov
- subtotal.pl --- pomocný súbor obsahujúci implementáciu predikátu subtotal v SWI-prologu
- query.pl --- pomocný súbor obsahujúci definíciu príkazu q(_) na formátovanie výsledkov dotazov
- queries_agg.pl --- zoznam dotazov, ktoré máte vypracovať; tento súbor budete editovať
Vyriešte všetky zadané úlohy.

Cvičenie 4

SQL

prezentácia
Stiahnite si do jedného adresára nasledujúce súbory:
- emp.sql --- príkazy v SQL vytvárajúce databázu zamestnancov
- queries.sql --- zoznam dotazov, ktoré máte vypracovať; tento súbor budete editovať

SQLite

Najprv vyskúšame pracovať s databázou SQLite, ktorá sa celá nachádza v jednom súbore na disku a nevyžaduje žiadnu konfiguráciu.
1. Vytvorte databázu príkazom
```
sqlite3 --init emp.sql emp.db
```
2. Overte, že databáza vznikla a obsahuje zmysluplné dáta:
```
sqlitebrowser emp.db &
```
  alebo spustením
```
sqlite3 emp.db
```
```
SELECT * FROM emp;
```
3. Vyskúšajte výpočet dotazov:
```
sqlite3 emp.db < queries.sql
```
  (Na výpočet dotazu môžete tiež využiť záložku Execute SQL v sqlitebrowseri.)
4. Postupne do súboru queries.sql dopĺňajte požadované dotazy a priebežne kontrolujte ich správnosť.
Po vyriešení niekoľkých úloh vyskúšajte prácu s databázou PostgreSQL (pozri inštrukcie ďalej).
Porovnajte, či v oboch databázových systémoch vedú vaše dotazy k rovnakému výsledku.
Po vyskúšaní práce s PostgreSQL si vyberte jeden z databázových systémov a pokračujte v riešení zvyšných úloh.

PostgreSQL

Ako databázový server budeme používať PostgreSQL. Môžete si ho nainštalovať na vlastnom počítači alebo využiť server cvika.dcs.fmph.uniba.sk, kde je databáza emp už vytvorená (jej názov je zhodný s prihlasovacím menom užívateľa).
Dokumentácia PostgreSQL: http://www.postgresql.org/docs/current/interactive/index.html
Pripojte sa cez ssh na cvika.dcs.fmph.uniba.sk (username aj password ako do AISu) v dvoch oknách.
V jednom okne editujeme súbor so zadaním, napr. vim queries.sql. Tento súbor si stiahnite napr. pomocou wget <url>.
V druhom okne spúšťame výpočet dotazov príkazom
```
            psql -f queries.sql
		
```

Práca s interaktívnym terminálom PostgreSQL

Terminál spustíte príkazom psql.
Následne môžete písať dotazy (ukončovať bodkočiarkou) a príkazy. Napr.
```
SELECT * FROM emp;
```
Príkazy:
- \db --- zobrazí zoznam databáz
- \d --- zobrazí zoznam tabuliek v databáze
- \d dept, \d+ dept --- zobrazí štruktúru tabuľky
- dokumentácia k psql: http://www.postgresql.org/docs/current/static/app-psql.html
Tento nástroj je užitočný pre rýchle preverenie stavu databázy a debugovanie (napr. vytvorenie a prezeranie dočasných tabuliek).

Cvičenie 3

Datalog

Stiahnite si do jedného adresára nasledujúce súbory:
- queries_library.pl --- zoznam dotazov, ktoré máte vypracovať; tento súbor budete editovať
- query.pl --- pomocný súbor obsahujúci definíciu príkazu q(_) na formátovanie výsledkov dotazov
Postupujte podľa pokynov v súbore queries_library.pl. Začnite tvorbou databázy library.pl (ako vzor vám poslúži emp.pl z predošlého cvičenia). Do databázy pridávajte riadky tak, aby vám to umožnilo otestovať správnosť vašich riešení pre jednotlivé dotazy.
Môžete mať aj viac verzií databázy --- použitá databáza sa mení v riadku
:- consult('library.pl').
Odporúčame sústrediť sa na vyriešenie úloh 1, 3, 6, 7, 8 už počas cvičenia a úloh 10, 11, 15, 16 počas cvičenia alebo doma.

Cvičenie 2

Datalog

prezentácia
Stiahnite si do jedného adresára nasledujúce súbory:
- emp.pl --- databáza zamestnancov
- queries.pl --- zoznam dotazov, ktoré máte vypracovať; tento súbor budete editovať
- query.pl --- pomocný súbor obsahujúci definíciu príkazu q(_) na formátovanie výsledkov dotazov
Podľa návodu z minulého cvičenia (alebo "Práca s datalogom" v prezentácii) vyriešte úlohy v queries.pl.

Cvičenie 1

Prolog

Na prvé pokusy využijeme online prostredie pre SWI-Prolog.
prezentácia (prelistujte si prípadne aj obsiahlejší nenáročný materiál)
Úlohy:
1. Zadefinujte niekoľko faktov o rodinných vzťahoch pomocou predikátov male/1, female/1, parent/2 (číslo udáva aritu).
2. Zapíšte pravidlá pre predikáty vyjadrujúce otca, sestru, starú mamu, bratranca.
3. Vytvorte predikát ancestor/2 pre vzťah "byť predkom".
4. Vytvorte predikát related/2 pre vzťah "byť pokrvným príbuzným".

Datalog na serveri cvika

Prihláste sa na server cvika.dcs.fmph.uniba.sk pomocou ssh (linux, windows (PuTTY)).
Pomocou wget si stiahnite potrebné súbory:
- query.pl --- pomocný súbor obsahujúci definíciu príkazu q(_) na formátovanie výsledkov dotazov
- emp.pl --- databáza zamestnancov EMP
- queries.pl --- Súbor obsahujúci zoznam dotazov, ktoré máte vypracovať. Tento súbor budete editovať.
Aj keď to na týchto cvičeniach nebudeme potrebovať, silne odporúčame naučiť sa tiež pracovať s nástrojmi scp, rsync a vyskúšať si prihlasovanie pomocou súboru s kľúčom miesto hesla.
Na interpretáciu datalogových dotazov budeme používať SWI-prolog: spusťte
swipl -s queries.pl
V inom okne editujte súbor queries.pl; odporúčame editory vim (pre konzolové prostredie) alebo kwrite (grafický mód, ak pracujete na lokálnom počítači v M217).
Odporúčame mať v ďalšom okne otvorenú databázu (súbor emp.pl so zoznamom faktov), aby ste mohli kontrolovať výsledky dotazov.
Po každej úprave súboru queries.pl (nezabudnite uložiť zmeny) spusťte v bežiacom SWI-prologu príkaz
make.
(aj s bodkou na konci, príkazy píšeme za otáznik). Preverte, či kompilátor nehlási chyby.
Výpočet dotazu (v tomto príklade pre predikát job) spustíme takto:
q(job(J)).
Na názve premenných nezáleží, miesto J možno použiť trebárs _, musí však sedieť arita (počet argumentov). Predikát q() slúži na "pekné" formátovanie výstupu a elimináciu zdanlivých duplikátov.
Praktické rady k SWI-prologu:
- Reťazce začínajúce veľkým písmenom systém pokladá za premenné. Konštanty sa začínajú malými písmenami. Ak to popletiete, bude to dávať podivne zlé výsledky.
- Na vyhodnocovanie aritmetických výrazov slúži operátor is, čiže napr. X is 2+3, nie X = 2+3 (v tom druhom prípade symbol = bude interpretovaný ako unifikácia termov a nedôjde k žiadnej aritmetickej operácii).
- Na porovnávanie čísel slúžia operátory <, =<, >, >=.

Hodnotenie

Za každú z 3 domácich úloh je max. 30 bodov.

Ďalšie body sa získavajú za riešenie úloh jednotlivých cvičení: za každé z 12 cvičení 0 alebo 1 bod. Z bodov udeľovaných za jednotlivé cvičenia je potrebné na úspešné absolvovanie predmetu získať aspoň 9.

Do 3 dní po každom cvičení treba riešenia zadaných úloh odoslať e-mailom na adresu mazak.fmfi (zavinac) gmail.com. Následne budú riešenia zbežne zhodnotené: v prípade dostatočnosti bude udelený 1 bod, v prípade nedostatočnosti bude študent vyzvaný riešenie doplniť (ak odovzdal aspoň niečo zmysluplné), na čo má ďalšie 3 dni, a potom dostane definitívne hodnotenie.

Nie je potrebné riešiť všetky úlohy; kritérium je mať (aspoň ako-tak správne) vyriešených cca 40% úloh z každej témy. Ak je sada úloh rozsiahlejšia, zvyčajne sú aspoň približne zoradené podľa obtiažnosti; ak chcete riešiť minimum úloh, vyberte si aj nejaké náročnejšie z druhej polovice. Odporúčaný postup je ísť zaradom a preskakovať úlohy, pri ktorých je jasné, že ich už vyriešiť viete (napr. sú podobné už vyriešeným úlohám a vidíte, v čom spočíva rozdiel a ako sa s ním vysporiadať).

A --- 92 a viac bodov

B --- 84 až 91 bodov

C --- 76 až 83 bodov

D --- 68 až 75 bodov

E --- 60 až 67 bodov

Fx --- menej ako 60 bodov