|
Uvod do databazovych systemov 2014/2015 Zima
Oznamy (tie najviac aktualne su na prvych miestach)
- Terminy skusok (na termin sa treba vopred elektronicky prihlasit, od 30.12.2014
do 24 hodin pred skuskou):
- Znamky sa zapisuju do indexov v skuskovych terminoch, na zaciatku
pisomky.
- Na skusku treba priniest index, ISIC kartu, dostatok cistych
papierov a pero. Ziadne ine pomocky nie su dovolene. Vsetky elektronicke
zariadenia, vratane mobilnych telefonov, budu pocas testu vypnute. Opisovanie,
akakolvek komunikacia pocas testu alebo iny pokus o podvod znamena neuspesne
absolvovanie kurzu (Fx). Jedinou vynimkou je komunikacia s ucitelom za
ucelom upresnenia zadania ulohy.
- Skuska prebieha formou pisomneho testu, podmienkou prihlasenia
sa na skusku je aspon 40% hodnotenie prace pocas
semestra. Na test sa treba najneskor 1 den vopred elektronicky prihlasit. Ak sa Vam
z nejakeho dovodu nedari prihlasit, poslite mi email.
Prihlasenie na test je zavazne (t.j. termin, na ktory ste prihlaseny, sa
pocita aj ked ten test nepisete). Ak viete ze na termin nepridete,
prosim odhlaste sa z neho (ak mate problem s odhlasenim, dajte mi vediet cim
skor cez email).
- Pri hodnoteni sa berie do uvahy len posledny termin skusky.
- Hodnotenia skuskovych testov budu priebezne zverejnovane na tejto web
stranke. Ak s tym nesuhlasite, dajte mi prosim vediet.
- V dnoch 12.11. a 13.11. budu cvicenia v terminalkach, v rovnakom case
ako cvicenia v akvariach. Cvicenie DB4 Stvrtok 14:00, bude v terminalke I-H6,
ostatne cvicenia budu v terminalke M-208 (tiez oznacovana ako T4).
- Nutnou podmienkou kvalifikacie na skusku je praca pocas
semestra, ktora sa hodnoti priebezne ("zapocet", vyjadreny v percentach).
Hodnoti sa najma priprava na
cvicenia, formou kratkych testov na zaciatku kazdeho
cvicenia. (V priebehu
semestra pribudnu mozno dalsie hodnotene povinnosti, napr. domace ulohy.)
"Zapoctove" hodnotenie ma pre vypocet znamky rovnaku vahu ako skuska, ktora
ma formu pisomneho testu. Na uspesne absolvovanie kurzu treba ziskat z
kazdeho ciastkoveho hodnotenia (zapocet, skuska) aspon 40% a zaroven z oboch v
priemere aspon 50%. Znamku pocita tento program v C.
- Ak ste studentom tohto kurzu, prihlaste sa do
rozvrhovacieho systemu cviceni, zmente svoje heslo (zvolte si heslo,
ktore nezabudnete) a najdite svoj rozvrh pre teoreticke a prakticke
cvicenia. Ak ste spokojny so zaradenim do skupiny, nerobte nic. Ked je to
nutne, tak skupinu zmente (pozor, pokus o zmenu moze viest k strate miesta v
povodnej skupine). System nedovoli okamzity presun do skupiny s naplnenou
kapacitou, ale pamata si Vase preferencie. Prihlasovacie meno (login) je Vase
priezvisko (ASCII), vsetky pismena male; pociatocne heslo je zhodne s
prihlasovacim menom. Ak neviete ako sa prihlasit, alebo ak sa Vam to nedari,
dajte mi vediet cez email. Tiez mi prosim dajte vediet, ak v systeme objavite
nejaku chybu.
- Cvicenia su vzdy v akvariach - s vynimkou jedneho "praktickeho tyzdna",
ktory bude vopred oznameny na prednaske a na tejto web stranke.
Prednaska
T. Plachetka: Streda 11:30, 2h, B
-
Uvodna prednaska, 24/9/2014
- Organizacia kurzu
- Historia, motivacia
- Knihy, casopisy, konferencie
- Ucel databaz, charakteristika DB aplikacii
- Trojstupnova ANSI/SPARC architektura, koncepcne datove modely
- Entitno-relacny, relacny a navigacny datovy model
-
Relacny kalkul, Datalog, SQL,
1/10/2014
- Relacie a predikaty
- Dotazy
- Relacny kalkul
- Datalog
- SQL ("kanonicka" forma vznikajuca prekladom z Datalogu)
-
Viac o SQL, 15/10/2014, 22/10/2014
- DDL (Data Definition Language) a DML (Data Manipulation Language)
- DML: Syntax a semantika SELECT
- SELECT: selekcia, projekcia, premenovanie, ORDER BY,
UNION/INTERSECT/EXCEPT, INNER JOIN, OUTER JOIN, NULL hodnoty a 3-hodnotova
logika, poddotazy, GROUP BY/HAVING, duplikaty v tabulkach
- DDL: typy/DOMAIN, vytvorenie/odstranenie/modifikacia tabulky, default
hodnoty, indexy, VIEW, aktualizacia cez VIEW
Relacna algebra, 22/10/2014
- Zakladne operatory nad mnozinami
- Niektore zakony relacnej algebry
- Optimalizacia na urovni relacnej algebry
- Multimnoziny (bags) a operatory nad multimnozinami
- Grupovanie a agregacia
- Semantika SELECT... FROM... WHERE... GROUP BY... HAVING
Agregacia a rekurzia v dotazovacich jazykoch,
29/10/2014, 5/11/2014
- Grupovanie a agregacia v SQL, relacnej algebre, relacnom kalkule a
Datalogu
- Rekurzia v SQL, relacnej algebre, relacnom kalkule a
Datalogu
- Vypocet dotazov: iteracia (naivna a seminaivna evaluacia)
- Stratifikovana negacia
- Simulacia rekurzie s fixnou hlbkou v SQL bez WITH RECURSIVE
Navrhovanie databaz, 12/11/2014
- Ciel a metodologia navrhovania databaz
- Entitno-relacne diagramy, pravidla dobreho navrhu, primary keys,
surrogate keys, foreign keys
- Preklad ER diagramov do SQL (DDL)
- Identifikacia funkcnych zavislosti
Funkcne zavislosti, 19/11/2014
- Motivacia normalizacie
- Funkcne zavislosti, Armstrongove axiomy
- Uzaver mnoziny atributov, uzaver mnoziny funkcnych zavislosti
- Uplnost Armstrongovych axiom
- Pokrytie a minimalne pokrytie mnoziny funkcnych zavislosti
- Nadkluce a kluce
- Relacne schemy, dekompozicia relacnych schem, bezstratovost
dekompozicie
Normalne formy, 26/11/2014-3/12/2014
- Algoritmus testovania bezstratovosti dekompozicie do 2 relacii
- Algoritmus testovania bezstratovosti dekompozicie do N relacii
- Prva, druha a tretia normalna forma (1NF, 2NF, 3NF), BCNF
- Naivna dekompozicia do 3NF, resp. BCNF
- Bezstratova dekompozicia do 3NF zachovavajuca funkcne zavislosti
- Bezstratova dekompozicia do BCNF z 3NF dekompozicie
- Vyssie normalne formy, pravidla rozumnej dekompozicie
Transakcie, 3/12/2014, 10/12/2014
- Definicia transakcie z pohladu centralizovaneho transakcneho systemu
- Elementarne transakcne operacie
- Poziadavky na transakcny system (ACID)
- Architektura transakcneho databazoveho systemu
- Rozvrhy
- Seriove a konflikt-seriovatelne rozvrhy
- Testovanie konflikt-seriovatelnosti, precedencny graf
- View-seriovatelne rozvrhy
- Generovanie seriovatelnych rozvrhov
- Dvojfazove zamykanie, casove peciatky, validacia, MVCC
- Obnova (recovery), log-file
- Vseobecny dvojprechodovy algoritmus obnovy, algoritmy obnovy so
specifickymi predpokladmi
- Checkpointing
- Backup
- Triedy obnovitelnosti: recoverable, ACA, strict
- Diagram hierarchie tried obnovitelnosti a seriovatelnosti
- Striktne dvojfazove zamykanie
- Deadlock, wait-for-graf, pristupy k rieseniu deadlockov
- Konzervativne strategie riesenia deadlockov: wait-die a kill-wait
- Fyzicka organizacia, 17/12/2014
- Typy externych (trvacnych) medii
- Fyzicka algebra, fyzicke plany
- Zlozitost fyzickych operatorov
- Vybrane operatory: Merge-sort, Nested-loop-join
- Sekvencne indexy (ISAM)
- Husty a riedky sekvencny index, operacie vynechavania a vkladania
- B stromy a B+ stromy
- Rozsiritelne hashovanie, rozsiritelne hashovanie
- Cena reorganizacie indexov
Starsie (uplnejsie a v podstatnych veciach presnejsie) materialy k tomuto
kurzu:
RNDr. J.
Sturc
Cvicenia
J. Mazak, T. Plachetka, M. Rjasko
Priebezne hodnotenie prace pocas semestra. (Ak
Vase hodnotenie chyba, nemate tento predmet zapisany v AIS.)
Teoria
DB1 Str 14:50 M.XII, DB2 Str 16:30 M.XII, DB3 Stv 12:20 M.IV,
DB4 Stv 14:00 M.IV. Aktualne zaradenie studentov do skupin:
rozvrhovaci system cviceni.
Tu su zadania a riesenia niektorych
"rozcvickovych" uloh.
Praktikum
Cielom praktickych cviceni je naucit sa pracovat s Datalogom a SQL v
praktickych systemoch. Za tymto ucelom su na swerveri cvika k dispozicii
systemy SWI-Prolog (pre pisanie a
testovanie Datalogovych programov) a PostgreSQL. Oba si viete instalovat
aj na svojom domacom pocitaci. Ak oblubujete graficke prostredie,
doporucujem instalovat najma SWI-Prolog (instalacia PostgreSQL je
zlozitejsia).
Na server cvika.dcs.fmph.uniba.sk sa viete prihlasit z verejnej
Internetovej siete protokolom SSH (v Linuxe typicky staci z terminalu urobit
"ssh cvika.dcs.fmph.uniba.sk"; do Windows treba najskor instalovat ssh
klienta, napr. Bitvise SSH Client ci
PuTTY). Autentifikaciu robi univerzitny
informacny system.
DATALOG
Treba skopirovat subory emp.pl,
queries_emp.pl,
queries_emp_sub.pl,
query.pl,
subtotal.pl
do nejakeho directory a pisat/testovat dotazy v queries_emp.pl (data su v
emp.pl).
Doporucujem vyrobit si samostatne aj inu databazu (napr. pijansku),
vymysliet vlastne dotazy a otestovat ich nad vlastnym naplnenim
databazy.
Co treba urobit ako prve: NAKONFIGUROVAT PROSTREDIE
- Prihlasit sa na PC v terminalke. Autentifikaciu robi univerzitny
informacny system.
- Urobit ssh na pocitac cvika (cvika.dcs.fmph.uniba.sk). To znamena
pod Linuxom otvorit terminalove okno a urobit
ssh username@cvika,
pod Windowsami treba pouzit putty. V tomto okne sa odohrava vsetko
ostatne (je rozumne vyrobit ca. 3 take okna a v kazdom byt prihlaseny na
pocitaci cvika). Username a heslo su
identicke s tymi v terminalke.
- Na pocitaci cvika, skopirovat subory emp.pl,
queries_emp.pl,
queries_emp.sql,
queries_emp_sub.pl,
queries_emp_sub.sql,
query.pl,
subtotal.pl
z ~plachetk/pub/DB do svojho home-directory na pocitaci cvika:
cp -r ~plachetk/pub/DB ~; cd ~/DB
Co treba urobit ako druhe: OBOZNAMIT SA S DATABAZOU EMP
Co treba urobit ako tretie: CVICIT PISANIE DOTAZOV V DATALOGU (nad
databazou EMP)
- Mat otvorene 2 okna (terminalove sessions) na pocitaci cvika. V browseri sa
divate na obsah databazy emp.pl. V OKNE1 pisete dotazy,
t.j. bezite
joe queries_emp.pl
V OKNE2 bezite
swipl -s queries_emp.pl.
- Po vpisani dotazu do suboru v OKNE1 treba subor queries_emp.pl ulozit na
disk (v editore joe sa tak urobi postupnym stlacenim "CTRL+K D" a "ENTER").
Nasledne v OKNE2 skompilujete novu verziu suboru prikazom
make.
(Je dobre pozriet sa, ci kompilator hlasi nejake errors. Ak ano, treba
sa vratit do editora, odstranit chyby a kompilaciu zopakovat. Kompilator dost
dobre napoveda, kde ste urobili chybu.)
Potom sa za ten otaznik v OKNE2 daju pisat dotazy ako napriklad
?- q(jobs(J)).
Predikat "q(_)" sluzi na pekne formatovanie vystupu a eliminaciu
"duplikatov" (ktore v skutocnosti nie su duplikatmi, len tymi istymi
viacnasobne najdenymi N-ticami)
- Negacia sa pise ako \+, definicia sa pise ako :-.
SQL
Co treba urobit ako stvrte: CVICIT PISANIE DOTAZOV V SQL (nad databazou
EMP)
- Otvorit 2 okna (terminalove sessions) na pocitaci cvika. V OKNE1 pisete
dotazy:
joe queries_emp.sql
Zmeny v editovanom subore queries_emp.sql
ulozite postupnym
stlacenim "CTRL+K D" a "ENTER". V OKNE2 ten subor (t.j. vsetky dotazy v nom)
spustate prikazom
psql -f queries_emp.sql
- Tu je zoznam uloh v queries_emp.sql. Nepovinne ulohy (ktore
mozno vyzaduju studium manualu SQL) su oznacene kurzivou. Tazsie (ale
doporucene) ulohy su oznacene tucnym pismom. Pri tazsich dotazoch moze
byt dobrou pomockou formulacia dotazu v Datalogu a nasledny preklad do SQL
podla navodu z prednasky. Na cviceni treba napisat a otestovat aspon jeden
"lahky" a aspon jeden "tazky" dotaz. Do dalsieho tyzdna (nie nutne na
cviceni) treba napisat a otestovat aspon vsetky tie dotazy, ktore su
oznacene ako "tazke".
- Print all jobs (each job once).
- Print names and jobs of employees with salary at least 2000.
- Print names and jobs of employees who work in department 30.
- Print the number of department in which the president works.
- Print jobs of employees who work in Chicago.
- Print tuples [Name, City, Coworker] which stand for all employees, their
working places and names of their co-workers (employees who work in the same
department).
- Print names of employees together with names of their managers.
- Which departments are empty (have no employees)?
- Which employees manage only clerks?
- Print names, department names and salaries of all employees whose
salaries are greater than the lowest salary in department 20.
- Which departments contain all job positions?
- Which departments employ no salesmen?
- Find names of all employees who are subsidiaries of Blake - both
direct and indirect subsidiaries.
- Print names of employees who were hired between 1 September 1981 and 31
October 1981.
- Print names and salaries of managers, sort the output in the descending
order of salaries.
- Print names, brutto incomes, national insurance contributions,
income taxes and netto incomes of employees (subtract 13.4% for national
insurance and 19% for income tax).
- Print names and the number of working years (since hired) of all
employees.
- Print names of all employees with the first letters of their
department names.
- Print name and "total salary" (total salary = salary + comm) of each
employee. (Warning: the column comm may contain NULL values.)
Tu je instalacny script databazy EMP pre PostgreSQL, ktory si viete instalovat
aj na svojom domacom pocitaci.
Co dalej: CVICIT PISANIE SUBTOTALOVYCH DOTAZOV V DATALOGU A V SQL (nad
databazou EMP)
- V suboroch queries_emp_sub.pl a queries_emp_sub.sql su
nasledujuce dotazy, ktore treba riesit a testovat horeuvedenym sposobom.
- Find average salary of employees who work in Dallas.
- For each department (including departments with no employees), find the
sum of salaries of employees who work in that department.
- Find departments (deptno) with more than 3 employees.
- For each department, find the number of analysts who work in that
department (the result consists of tuples [D, N]).
- Find the job position(s) with the maximal standard deviation of
salaries.
- Find tuples [Deptno, Job, Sum, Average] which for each [Deptno, Job]
state the sum of salaries and average salary of employees who work in department
Deptno and do job Job.
- For each employee, find the number of subsidiaries (direct
and indirect) of that employee. Include employees with no subsidiaries.
- Otestujte (nad databazou EMP, pripadne nejakou vlastnou databazou)
dotazy, ktorych vysledkom ste si nie celkom isti.
Literatura
Online materialy ku kurzu Introduction
to Databases na Stanford University. Odporucam pozriet si najma videa od
J.Widom. Online kurz:
Stanford's Databases MOOC
- H. Garcia-Molina, J.D. Ullman, J. Widom: Database Systems, The Complete
Book, Prentice Hall, 2003
- S. Abiteboul, R. Hull, V. Vianu:
Foundations of Databases
- R. Elmasri, S.B. Navathe: Fundamentals of Database Systems,
Addison-Wesley, 2006
- M. Kifer, P.A. Bernstein, P.M. Lewis: Database Systems, An
Application-Oriented Approach, Addison-Wesley, 2006
- J. D. Ullman, J.Widom: A First Course in Database Systems, Prentice
Hall, 1997
- S. Krishna:
Introduction to Database and Knowledge-Based Systems,
World-Scientific, 1992
- T.M. Connolly, C.E. Begg:
Database Systems: A Practical Approach to Design, Pearson Education,
2005
- C. Zaniolo:
Advanced Database Systems, Morgan Kaufmann, 1997
- S. Lightstone, T.J. Teorey, T. Nadeau:
Physical Database Design, Morgan Kaufmann, 2007
- P.A. Bernstein, V. Hadzilacos, N. Goodman:
Concurrency Control and Recovery in Database Systems, Addison-Wesley, 1987
Updated by
Tomas Plachetka,
Feb/12/2015
|