0
Gegevensbanken 2010 Begrippen van transactieverwerking Bettina Berendt www.cs.kuleuven.be/~berendt
Begrippen van transactieverwerking :  Motivatie & Samenvatting
Waar zijn we? query processing indexing II and higher-dimensional structures Les Nr. wie wat 1 ED intro, ER 2 ED EER 3 ED ...
Dat willen wij niet! t reserveer! Nog een plaats! U heeft hem U heeft hem reserveer!
Agenda Inleiding tot concurrentie en herstel Transacties: begrippen Transactieroosters Serialiseren van roosters Transacti...
Agenda Inleiding tot concurrentie en herstel Transacties: begrippen Transactieroosters Serialiseren van roosters Transacti...
Inleiding tot concurrentie en herstel <ul><ul><li>transactie  </li></ul></ul><ul><ul><ul><li>= de uitvoering van een progr...
interleaved - 1 processor simultaneous - 2 processors Interleaved en simultaneous verwerking
Concurrentie <ul><li>gelijktijdige verwerking van transacties kan problemen veroorzaken </li></ul><ul><li>vb: vliegtuigres...
<ul><ul><li>Zij X #reservaties op V1, Y #reservaties op V2 voor de transacties </li></ul></ul><ul><li>Verloren aanpassing:...
Tijdelijke aanpassing  (dirty read) <ul><li>tijdens de uitvoering wordt T1 door een of andere faling  afgebroken;  </li></...
Foutieve sommering <ul><li>gebruik van inconsistente waarden door aggregaatfunctie  </li></ul><ul><ul><ul><li>bv. sommige ...
Niet herhaalbare lezing  (nonrepeatable read) <ul><ul><li>Gerelateerd aan &quot;foutieve sommering&quot;: </li></ul></ul><...
Herstel <ul><li>Waarom herstel nodig is </li></ul><ul><ul><li>Een transactie moet  </li></ul></ul><ul><ul><ul><li>ofwel vo...
Mogelijke falingen  die tijdens de uitvoering van een transactie kunnen optreden <ul><ul><li>1.  computer-crash </li></ul>...
Agenda Inleiding tot concurrentie en herstel Transacties: begrippen Transactieroosters Serialiseren van roosters Transacti...
Transacties: begrippen <ul><li>transacties: </li></ul><ul><ul><li>&quot;read-only&quot; transactie: </li></ul></ul><ul><ul...
Lezen en schrijven <ul><ul><li>read_item(X): </li></ul></ul><ul><ul><ul><li>vind adres van blok dat X bevat </li></ul></ul...
Status van de transactie <ul><li>wordt bijgehouden om zo nodig te kunnen herstellen </li></ul><ul><li>status wordt bepaald...
Andere bewerkingen <ul><li>ROLLBACK ( of ABORT) </li></ul><ul><ul><li>geen succesvol einde van de transactie; alle wijzigi...
Overgangsdiagram tussen de statussen van de uitvoering van een transactie
Systeemlog <ul><li>Systeemlog </li></ul><ul><ul><li>noteert alle transacties die waarden in de gegevensbank wijzigen </li>...
Herstellen na faling <ul><li>twee mogelijkheden </li></ul><ul><ul><li>transactie volledig ongedaan maken:  </li></ul></ul>...
Commit points  (bindpunten) <ul><li>een transactie bereikt een commit point wanneer </li></ul><ul><ul><li>alle bewerkingen...
Bij faling <ul><li>voor transacties die gestart zijn maar niet gecommit: rollback </li></ul><ul><li>voor gecommitte transa...
Checkpoints  (controlepunten) <ul><li>op geregelde tijdstippen (gemeten in tijd of in aantal committed transacties): </li>...
Gewenste eigenschappen van transacties  (“ACID properties”) <ul><ul><li>Atomicity : ondeelbaarheid </li></ul></ul><ul><ul>...
Agenda Inleiding tot concurrentie en herstel Transacties: begrippen Transactieroosters Serialiseren van roosters Transacti...
Transactieroosters  (schedules) <ul><li>Operaties van meerdere transacties in chronologische volgorde opgeschreven </li></...
 
Eigenschappen van transactieroosters <ul><ul><li>2  operaties conflicteren  indien </li></ul></ul><ul><ul><ul><li>ze bij v...
Herstelbaarheid van roosters <ul><ul><li>Een  rooster  is  herstelbaar  a.s.a. een transactie die gecommit is nooit meer o...
Voorbeeld T1   T2 read (X) read(X) write(X) read(Y) write(Y) write(X) commit write(Y) commit T1   T2 read (X) write(X) rea...
Cascadeloze roosters <ul><li>garanderen dat geen cascading rollbacks nodig zijn </li></ul><ul><li>voldoende voorwaarde: </...
Strikte roosters <ul><li>elke transactie T   leest en schrijft   enkel items na commit (of abort) van de laatste transacti...
In volgorde van restrictiefheid: herstelbaar – cascadeloos - strikt <ul><li>herstelbaar rooster </li></ul><ul><li>casacade...
Agenda Inleiding tot concurrentie en herstel Transacties: begrippen Transactieroosters Serialiseren van roosters Transacti...
Serialiseren van roosters <ul><li>Serieel rooster :  </li></ul><ul><ul><ul><li>tussen eerste en laatste opdracht van een t...
Serialiseerbaarheid <ul><li>een rooster S van n transacties is serialiseerbaar  </li></ul><ul><ul><ul><li>a.s.a. het equiv...
Conflict-equivalentie <ul><ul><li>twee roosters S 1  en S 2  zijn  conflict-equivalent   </li></ul></ul><ul><ul><ul><li>a....
Testen van conflict-serialiseerbaarheid <ul><li>maak voor elke transactie T i  een knoop </li></ul><ul><li>maak een boog v...
Voorbeeld (1)
Voorbeeld (2)
Nog een voorbeeld (1)
Nog een voorbeeld (2)
(roooster E op p. 44)   (roooster F op p. 45)   Nog een voorbeeld (3)
View-equivalentie <ul><ul><ul><li>een andere, minder restrictieve definitie van equivalente roosters: </li></ul></ul></ul>...
Verschil tussen view-equivalentie en conflict-equivalentie? <ul><li>zijn allebei hetzelfde indien “constrained write” aann...
Voorbeeld van view-equivalente maar niet conflict-equivalente roosters _ T1  T2  T3 ____   X := a schrijf(X) X := b schrij...
In volgorde van restrictiefheid: serieel – conflict-serialiseerbar – view-serialiseerbar <ul><li>in volgorde van restricti...
Testen of verzekeren van serialiseerbarheid <ul><li>Problemen met testen van serialiseerbaarheid: </li></ul><ul><ul><ul><l...
Agenda Inleiding tot concurrentie en herstel Transacties: begrippen Transactieroosters Serialiseren van roosters Transacti...
SQL biedt mogelijkheid  om transacties te definiëren <ul><li>uitvoering van één query is gegarandeerd atomair </li></ul><u...
SQL “serializable” (1) <ul><li>&quot;serializable&quot;    onze definities van serialiseerbaar </li></ul><ul><ul><li>geba...
SQL “serializable” (2)
Voorbeeld EXEC SQL WHENEVER SQLERROR GOTO UNDO; EXEC SQL SET TRANSACTION READ WRITE DIAGNOSTICS SIZE 5 ISOLATION LEVEL SER...
Vooruitblik Inleiding tot concurrentie en herstel Transacties: begrippen Transactieroosters Serialiseren van roosters Tran...
Bronnen <ul><li>Deze slides zijn gebaseerd op Henk Olivié‘s slides voor Gegevensbanken 2009 en op  Elmasri & Navathe, Fund...
Upcoming SlideShare
Loading in...5
×

Gegevensbanken 2010 les15

337

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
337
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
26
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • http://a1.phobos.apple.com/us/r1000/036/Purple/b8/86/d6/mzl.wdgryvsi.320x480-75.jpg
  • Transcript of "Gegevensbanken 2010 les15"

    1. 1. Gegevensbanken 2010 Begrippen van transactieverwerking Bettina Berendt www.cs.kuleuven.be/~berendt
    2. 2. Begrippen van transactieverwerking : Motivatie & Samenvatting
    3. 3. Waar zijn we? query processing indexing II and higher-dimensional structures Les Nr. wie wat 1 ED intro, ER 2 ED EER 3 ED relational model 4 ED mapping EER2relational 5 KV relational algebra, relational calculus 6 KV SQL 7 KV vervolg SQL 8 KV demo Access, QBE, JDBC 9 KV functional dependencies and normalisation 10 KV functional dependencies and normalisation 11 BB file structures and hashing 12 BB indexing I 13 BB 14 BB 15 BB transactions 16 BB transactions II: concurrentie & herstel 17 BB Data warehousing and mining 18 ED XML, oodb, multimedia db Fysisch model / vragen
    4. 4. Dat willen wij niet! t reserveer! Nog een plaats! U heeft hem U heeft hem reserveer!
    5. 5. Agenda Inleiding tot concurrentie en herstel Transacties: begrippen Transactieroosters Serialiseren van roosters Transacties in SQL
    6. 6. Agenda Inleiding tot concurrentie en herstel Transacties: begrippen Transactieroosters Serialiseren van roosters Transacties in SQL
    7. 7. Inleiding tot concurrentie en herstel <ul><ul><li>transactie </li></ul></ul><ul><ul><ul><li>= de uitvoering van een programma dat de gegevensbank raadpleegt of haar inhoud wijzigt </li></ul></ul></ul><ul><ul><li>gelijktijdige verwerking van transacties is wenselijk, vaak noodzakelijk </li></ul></ul><ul><ul><ul><li>vnl. voor gegevensbanksystemen met meerdere gebruikers </li></ul></ul></ul><ul><ul><li>twee mogelijkheden voor implementatie: </li></ul></ul><ul><ul><ul><li>interleaved uitvoering: </li></ul></ul></ul><ul><ul><ul><ul><li>1 processor behandelt afwisselend verschillende transacties </li></ul></ul></ul></ul><ul><ul><ul><li>simultane uitvoering: </li></ul></ul></ul><ul><ul><ul><ul><li>meerdere processoren werken in parallel </li></ul></ul></ul></ul><ul><ul><li>wij veronderstellen &quot;interleaved&quot; model </li></ul></ul>
    8. 8. interleaved - 1 processor simultaneous - 2 processors Interleaved en simultaneous verwerking
    9. 9. Concurrentie <ul><li>gelijktijdige verwerking van transacties kan problemen veroorzaken </li></ul><ul><li>vb: vliegtuigreservatiesysteem </li></ul><ul><ul><li>transactie T1 schrapt reservatie van N plaatsen op vlucht V1 en reserveert N plaatsen op vlucht V2 </li></ul></ul><ul><ul><li>transactie T2 reserveert M plaatsen op vlucht V1 </li></ul></ul><ul><ul><li>mogelijke problemen: </li></ul></ul><ul><ul><ul><li>verloren aanpassing </li></ul></ul></ul><ul><ul><ul><li>tijdelijke aanpassing </li></ul></ul></ul><ul><ul><ul><li>foutieve sommering </li></ul></ul></ul><ul><ul><li>vermijden d.m.v. </li></ul></ul><ul><ul><li>concurrentiecontrole </li></ul></ul>
    10. 10. <ul><ul><li>Zij X #reservaties op V1, Y #reservaties op V2 voor de transacties </li></ul></ul><ul><li>Verloren aanpassing: </li></ul><ul><ul><ul><li>wijziging van T1 wordt per ongeluk teniet gedaan door T2 </li></ul></ul></ul>Verloren aanpassing T1 T2 lees(X) X := X-N lees(X) X := X+M schrijf(X) lees(Y) schrijf(X) Y := Y+N schrijf(Y) vb: X = 84 N = 5 M = 4 resultaat: X = 88 i.p.v. 83
    11. 11. Tijdelijke aanpassing (dirty read) <ul><li>tijdens de uitvoering wordt T1 door een of andere faling afgebroken; </li></ul><ul><li>de gewijzigde waarden worden hersteld in oorspronkelijke toestand, maar T2 heeft intussen zo'n tijdelijk gewijzigde (ongeldige) waarde gebruikt </li></ul>T1 T2 lees(X) X := X-N schrijf(X) lees(X) X := X+M schrijf(X) lees(Y) Y := Y+N schrijf(Y) T1 afgebroken  aan X wordt terug de oorspronkelijke waarde toegekend
    12. 12. Foutieve sommering <ul><li>gebruik van inconsistente waarden door aggregaatfunctie </li></ul><ul><ul><ul><li>bv. sommige van voor een wijziging en andere van erna </li></ul></ul></ul>T1 T3 som := 0 lees(A) som := som+A ... lees(X) X := X-N schrijf(X) lees(X) som := som+X lees(Y) som := som+Y lees(Y) Y := Y+N schrijf(Y) T3 berekent het totaal aantal reservaties op vluchten terwijl T1 wordt uitgevoerd
    13. 13. Niet herhaalbare lezing (nonrepeatable read) <ul><ul><li>Gerelateerd aan &quot;foutieve sommering&quot;: </li></ul></ul><ul><ul><ul><li>Lees zelfde item 2x kort na elkaar, waarde blijkt intussen gewijzigd (door een andere transactie) </li></ul></ul></ul><ul><ul><ul><li>bv. reservatie vliegtuigtickets: </li></ul></ul></ul><ul><ul><ul><ul><li>controleer of er vrije plaatsen zijn </li></ul></ul></ul></ul><ul><ul><ul><ul><li>indien ja: reserveer ze </li></ul></ul></ul></ul><ul><ul><ul><ul><li>reservatie mislukt: plaatsen blijken niet meer vrij </li></ul></ul></ul></ul>
    14. 14. Herstel <ul><li>Waarom herstel nodig is </li></ul><ul><ul><li>Een transactie moet </li></ul></ul><ul><ul><ul><li>ofwel volledig uitgevoerd worden </li></ul></ul></ul><ul><ul><ul><li>ofwel helemaal niet </li></ul></ul></ul><ul><ul><li>Bij een fout (software/hardware) tijdens een transactie: </li></ul></ul><ul><ul><ul><li>ze kan niet helemaal uitgevoerd worden </li></ul></ul></ul><ul><ul><ul><li> oorspronkelijke toestand moet hersteld worden (transactie is dan helemaal niet uitgevoerd) </li></ul></ul></ul>
    15. 15. Mogelijke falingen die tijdens de uitvoering van een transactie kunnen optreden <ul><ul><li>1. computer-crash </li></ul></ul><ul><ul><ul><li>inhoud van geheugen kan verloren zijn </li></ul></ul></ul><ul><ul><li>2. transactie- of systeemfout </li></ul></ul><ul><ul><ul><li>verkeerde parameter, overflow, deling door 0, logische programmeerfout,.. </li></ul></ul></ul><ul><ul><li>3. uitzonderingscondities </li></ul></ul><ul><ul><ul><li>bv. bestand kan niet gelezen worden, ... </li></ul></ul></ul><ul><ul><li>4. opgelegd door concurrentiecontrole </li></ul></ul><ul><ul><ul><li>bv. transactie afgebroken wegens deadlock </li></ul></ul></ul><ul><ul><li>5. schijf-fout </li></ul></ul><ul><ul><ul><li>bv. beschadigd spoor </li></ul></ul></ul><ul><ul><li>6. fysieke problemen, catastrofes </li></ul></ul><ul><ul><ul><li>brand, stroomonderbreking, ... </li></ul></ul></ul><ul><ul><li>Bij falingen van de types 1 tot 4 moet de oorspronkelijke toestand hersteld kunnen worden </li></ul></ul>
    16. 16. Agenda Inleiding tot concurrentie en herstel Transacties: begrippen Transactieroosters Serialiseren van roosters Transacties in SQL
    17. 17. Transacties: begrippen <ul><li>transacties: </li></ul><ul><ul><li>&quot;read-only&quot; transactie: </li></ul></ul><ul><ul><ul><li>alleen ophalen (raadplegen) van gegevens </li></ul></ul></ul><ul><ul><li>&quot;update&quot; transactie:  deze interesseren ons </li></ul></ul><ul><ul><ul><li>met aanpassing van gegevens </li></ul></ul></ul><ul><li>lees- en schrijfbewerkingen van een transactie: </li></ul><ul><ul><li>niveau van beschouwing van transacties: </li></ul></ul><ul><ul><ul><li>gegevenselementen en blokken of schijf </li></ul></ul></ul><ul><ul><ul><li>op dit niveau zijn de bewerkingen van een transactie: </li></ul></ul></ul><ul><ul><ul><ul><li>read_item(X) </li></ul></ul></ul></ul><ul><ul><ul><ul><li>write_item(X) </li></ul></ul></ul></ul><ul><ul><ul><li>kopieer programmavariabele X naar buffer </li></ul></ul></ul><ul><ul><ul><li>schrijf buffer (onmiddellijk of later) </li></ul></ul></ul>
    18. 18. Lezen en schrijven <ul><ul><li>read_item(X): </li></ul></ul><ul><ul><ul><li>vind adres van blok dat X bevat </li></ul></ul></ul><ul><ul><ul><li>kopieer dat blok in een buffer </li></ul></ul></ul><ul><ul><ul><li>kopieer X in programmavariabele X </li></ul></ul></ul><ul><ul><li>write_item(X): </li></ul></ul><ul><ul><ul><li>vind adres van blok dat X bevat </li></ul></ul></ul><ul><ul><ul><li>kopieer dat blok in een buffer </li></ul></ul></ul><ul><ul><ul><li>kopieer de programmavariable X op de juiste plaats in die buffer </li></ul></ul></ul><ul><ul><ul><li>bewaar het aangepaste blok terug op schijf (onmiddellijk of later) </li></ul></ul></ul>
    19. 19. Status van de transactie <ul><li>wordt bijgehouden om zo nodig te kunnen herstellen </li></ul><ul><li>status wordt bepaald door operaties : </li></ul><ul><ul><li>BEGIN_TRANSACTION </li></ul></ul><ul><ul><ul><li>geeft begin van de transactie aan </li></ul></ul></ul><ul><ul><li>READ / WRITE </li></ul></ul><ul><ul><ul><li>alle lees- en schrijfoperaties </li></ul></ul></ul><ul><ul><li>END_TRANSACTION </li></ul></ul><ul><ul><ul><li>geeft einde van een transactie aan </li></ul></ul></ul><ul><ul><ul><li>dan moet worden gecontroleerd of </li></ul></ul></ul><ul><ul><ul><ul><li>de wijzigingen veroorzaakt door de transactie definitief doorgevoerd kunnen worden op de gegevensbank ( = committed ) </li></ul></ul></ul></ul><ul><ul><ul><ul><li>de transactie ongedaan moet worden gemaakt vanwege de concurrentiecontrole </li></ul></ul></ul></ul><ul><ul><li>COMMIT_TRANSACTION </li></ul></ul><ul><ul><ul><li>succesvol einde van de transactie: alle wijzigingen aangebracht door de transactie zijn definitief </li></ul></ul></ul>
    20. 20. Andere bewerkingen <ul><li>ROLLBACK ( of ABORT) </li></ul><ul><ul><li>geen succesvol einde van de transactie; alle wijzigingen worden ongedaan gemaakt </li></ul></ul><ul><li>UNDO </li></ul><ul><ul><li>één bewerking wordt ongedaan gemaakt </li></ul></ul><ul><li>REDO </li></ul><ul><ul><li>één bewerking wordt opnieuw uitgevoerd </li></ul></ul>
    21. 21. Overgangsdiagram tussen de statussen van de uitvoering van een transactie
    22. 22. Systeemlog <ul><li>Systeemlog </li></ul><ul><ul><li>noteert alle transacties die waarden in de gegevensbank wijzigen </li></ul></ul><ul><ul><li>nodig bij herstelprocedures na falen </li></ul></ul><ul><ul><li>bijgehouden op schijf (met geregelde backup) </li></ul></ul><ul><li>Wat wordt geregistreerd: (T = een transactie-ID) </li></ul><ul><ul><li>[ start_transaction, T ] </li></ul></ul><ul><ul><li>[ write_item, T, X, oude waarde, nieuwe waarde ] </li></ul></ul><ul><ul><li>[ read_item, T, X ] </li></ul></ul><ul><ul><li>[ commit, T ] </li></ul></ul><ul><ul><li>[ abort, T ] </li></ul></ul>
    23. 23. Herstellen na faling <ul><li>twee mogelijkheden </li></ul><ul><ul><li>transactie volledig ongedaan maken: </li></ul></ul><ul><ul><li>= effect van write-opdrachten ongedaan maken </li></ul></ul><ul><ul><ul><li>log achterwaarts doorlopen, UNDO alle writes </li></ul></ul></ul><ul><ul><li>transactie goed afwerken: </li></ul></ul><ul><ul><li>= effect van write-opdrachten herstellen / herhalen </li></ul></ul><ul><ul><ul><li>log voorwaarts doorlopen, REDO alle writes </li></ul></ul></ul><ul><li>Welk van beide kiezen? </li></ul><ul><ul><li>commit point: </li></ul></ul><ul><ul><ul><li>punt waarop beslist wordt dat transactie goed afgewerkt moet worden i.p.v. ongedaan gemaakt </li></ul></ul></ul>
    24. 24. Commit points (bindpunten) <ul><li>een transactie bereikt een commit point wanneer </li></ul><ul><ul><li>alle bewerkingen van de transactie met succes zijn uitgevoerd </li></ul></ul><ul><ul><li>en </li></ul></ul><ul><ul><li>al die bewerkingen zijn geregistreerd op de log </li></ul></ul><ul><li>na commit point is resultaat van transactie definitief </li></ul><ul><ul><li> verplichting om aanpassingen werkelijk op schijf door te voeren indien nog niet gebeurd </li></ul></ul><ul><li>volgorde van acties tijdens commit </li></ul><ul><ul><li>op log noteren: [ commit, T ] </li></ul></ul><ul><ul><li>log definitief op schijf zetten (vanuit buffer)  &quot;force writing&quot; </li></ul></ul><ul><ul><li>nu is transactie gecommit </li></ul></ul>
    25. 25. Bij faling <ul><li>voor transacties die gestart zijn maar niet gecommit: rollback </li></ul><ul><li>voor gecommitte transacties: REDO alle writes </li></ul><ul><li>Meer details: zie volgende les </li></ul>
    26. 26. Checkpoints (controlepunten) <ul><li>op geregelde tijdstippen (gemeten in tijd of in aantal committed transacties): </li></ul><ul><ul><li>effecten van wijzigingen worden op schijf gezet </li></ul></ul><ul><li>Acties: </li></ul><ul><ul><li>1. onderbreek tijdelijk alle transacties </li></ul></ul><ul><ul><li>2. schrijf alle aangepaste gegevensbankblokken van buffer naar schijf </li></ul></ul><ul><ul><li>3. schrijf een checkpoint op de log en schrijf de log naar schijf </li></ul></ul><ul><ul><li>4. hervat de transactie-uitvoering </li></ul></ul><ul><li>Mogelijke extra informatie in checkpoint-record: </li></ul><ul><ul><li>lijst van actieve transacties op dat moment </li></ul></ul><ul><ul><li>voor elke transactie: adres van 1-ste en meest recente records in de log </li></ul></ul>
    27. 27. Gewenste eigenschappen van transacties (“ACID properties”) <ul><ul><li>Atomicity : ondeelbaarheid </li></ul></ul><ul><ul><ul><li>transactie wordt volledig uitgevoerd, of helemaal niet </li></ul></ul></ul><ul><ul><li>Consistency preservation: </li></ul></ul><ul><ul><ul><li>consistente gegevensbank moet na transactie nog steeds consistent zijn </li></ul></ul></ul><ul><ul><li>Isolation : geïsoleerdheid </li></ul></ul><ul><ul><ul><li>effect van transactie moet zijn alsof het de enige transactie is die uitgevoerd werd (geen interferentie met andere transacties) </li></ul></ul></ul><ul><ul><ul><ul><li>er worden meestal 4 isolatieniveaus gedefineerd, naargelang van de graad van isolatie: </li></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>niveau 0: geen overschrijven van een ‘dirty read’ van een transactie op hoger niveau </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>niveau 1: geen verloren aanpassingen </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>niveau 2: geen verloren aanpassingen en geen ‘dirty reads’ </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>niveau 3: niveau 2 + ‘repeatable reads’ </li></ul></ul></ul></ul></ul><ul><ul><li>Durability : duurzaamheid </li></ul></ul><ul><ul><ul><li>effect van transactie moet persistent zijn, mag niet verloren gaan </li></ul></ul></ul>
    28. 28. Agenda Inleiding tot concurrentie en herstel Transacties: begrippen Transactieroosters Serialiseren van roosters Transacties in SQL
    29. 29. Transactieroosters (schedules) <ul><li>Operaties van meerdere transacties in chronologische volgorde opgeschreven </li></ul><ul><ul><li>zie eerdere voorbeelden met T1 en T2 </li></ul></ul><ul><ul><li>Ander voorbeeld: Fig. 17.5 </li></ul></ul><ul><ul><ul><li>4 roosters, 1 ervan is duidelijk fout </li></ul></ul></ul>
    30. 31. Eigenschappen van transactieroosters <ul><ul><li>2 operaties conflicteren indien </li></ul></ul><ul><ul><ul><li>ze bij verschillende transacties horen </li></ul></ul></ul><ul><ul><ul><li>ze hetzelfde gegevenselement gebruiken </li></ul></ul></ul><ul><ul><ul><li>minstens een ervan een write_item is </li></ul></ul></ul><ul><ul><li>een rooster S voor n transacties T i is volledig indien </li></ul></ul><ul><ul><ul><li>S alle operaties van de transacties T 1 ,… , T i , …, T n bevat (met inbegrip van een commit of abort operartie als laatste operatie van elke transactie, en geen andere </li></ul></ul></ul><ul><ul><ul><li>elk paar operaties van één transactie T i in dezelfde volgorde voorkomt in S als in T i </li></ul></ul></ul><ul><ul><ul><li>voor elk paar conflicterende operaties geldt dat de volgorde eenduidig vastligt </li></ul></ul></ul>
    31. 32. Herstelbaarheid van roosters <ul><ul><li>Een rooster is herstelbaar a.s.a. een transactie die gecommit is nooit meer ongedaan gemaakt moet worden </li></ul></ul><ul><ul><ul><li>Voldoende voorwaarde: </li></ul></ul></ul><ul><ul><ul><ul><li>T commit enkel na commit van elke transactie die een waarde schrijft die T leest </li></ul></ul></ul></ul><ul><ul><li>Herstelbaar impliceert niet &quot;eenvoudig herstelbaar&quot; </li></ul></ul><ul><ul><ul><li>mogelijk &quot;cascading rollback&quot; </li></ul></ul></ul><ul><ul><ul><ul><li>één transactie T terugrollen kan het nodig maken om een andere (die iets las dat door T geschreven werd) ook terug te rollen, enz. </li></ul></ul></ul></ul><ul><ul><ul><li>cascading rollback is tijdrovend </li></ul></ul></ul>
    32. 33. Voorbeeld T1 T2 read (X) read(X) write(X) read(Y) write(Y) write(X) commit write(Y) commit T1 T2 read (X) write(X) read(X) read(Y) write(X) commit abort T1 T2 read (X) write(X) read(X) read(Y) write(X) write(Y) commit commit T1 T2 read (X) write(X) read(X) read(Y) write(X) write(Y) abort abort schema a schema e schema d schema c herstelbaar, maar wel probleem van verloren aanpassing niet herstelbaar, T2 leest item X geschreven door T1, en commit vooraleer T1 commit, abort van T1 daarna maakt die waarde van X ongeldig wel herstelbaar: commit van T2 is uitgesteld tot na commit van T1 wel herstelbaar: indien T1 abort, moet ook T2 een abort uitvoeren
    33. 34. Cascadeloze roosters <ul><li>garanderen dat geen cascading rollbacks nodig zijn </li></ul><ul><li>voldoende voorwaarde: </li></ul><ul><ul><li>elke transactie T leest enkel waarden geschreven door transacties die al gecommit hebben </li></ul></ul><ul><li>meer restrictief ! </li></ul><ul><ul><li>minder verschillende mogelijkheden om transacties gelijktijdig uit te voeren </li></ul></ul>
    34. 35. Strikte roosters <ul><li>elke transactie T leest en schrijft enkel items na commit (of abort) van de laatste transactie die dat item geschreven heeft </li></ul><ul><li>UNDO write_item: </li></ul><ul><ul><li>gewoon oorspronkelijke waarde terugzetten </li></ul></ul><ul><li>meest restrictief </li></ul><ul><ul><li>relatief weinig roosters mogelijk </li></ul></ul><ul><ul><li>maar eenvoudigst herstelbaar </li></ul></ul>
    35. 36. In volgorde van restrictiefheid: herstelbaar – cascadeloos - strikt <ul><li>herstelbaar rooster </li></ul><ul><li>casacadeloos rooster ; impliceert 1 </li></ul><ul><li>strikt rooster ; impliceert 2 en 1 </li></ul>
    36. 37. Agenda Inleiding tot concurrentie en herstel Transacties: begrippen Transactieroosters Serialiseren van roosters Transacties in SQL
    37. 38. Serialiseren van roosters <ul><li>Serieel rooster : </li></ul><ul><ul><ul><li>tussen eerste en laatste opdracht van een transactie T worden geen opdrachten van eender welke andere transactie uitgevoerd </li></ul></ul></ul><ul><ul><ul><li>m.a.w. transacties worden na elkaar uitgevoerd </li></ul></ul></ul><ul><ul><ul><ul><li>er kan dus geen interferentie zijn </li></ul></ul></ul></ul><ul><ul><li>indien transacties onafhankelijk zijn, is elk serieel rooster correct </li></ul></ul><ul><ul><li>nadeel van seriële roosters: </li></ul></ul><ul><ul><ul><li>beperking op concurrentie </li></ul></ul></ul>
    38. 39. Serialiseerbaarheid <ul><li>een rooster S van n transacties is serialiseerbaar </li></ul><ul><ul><ul><li>a.s.a. het equivalent is met een serieel rooster met dezelfde n transacties </li></ul></ul></ul><ul><ul><li>er zijn meerdere soorten equivalentie definieerbaar </li></ul></ul><ul><ul><ul><li>resultaat-equivalentie </li></ul></ul></ul><ul><ul><ul><ul><li>gegeven beginvoorwaarden, zelfde resultaat </li></ul></ul></ul></ul><ul><ul><ul><ul><li>te zwak: voor andere beginvoorwaarden misschien niet equivalent </li></ul></ul></ul></ul><ul><ul><ul><li>beter: conflict-equivalentie </li></ul></ul></ul>
    39. 40. Conflict-equivalentie <ul><ul><li>twee roosters S 1 en S 2 zijn conflict-equivalent </li></ul></ul><ul><ul><ul><li>a.s.a. volgorde van 2 conflicterende operaties steeds dezelfde is in beide roosters </li></ul></ul></ul><ul><ul><li>een rooster is conflict-serialiseerbaar </li></ul></ul><ul><ul><ul><li>a.s.a. conflict-equivalent met een serieel rooster </li></ul></ul></ul><ul><ul><li>testen van conflict-serialiseerbaarheid: d.m.v. &quot;precedence graph&quot; </li></ul></ul><ul><ul><ul><li>graaf die volgorde van transacties aanduidt </li></ul></ul></ul><ul><ul><ul><li>knopen = transacties, gerichte bogen = &quot;komt voor&quot; </li></ul></ul></ul>
    40. 41. Testen van conflict-serialiseerbaarheid <ul><li>maak voor elke transactie T i een knoop </li></ul><ul><li>maak een boog van T i naar T j a.s.a. </li></ul><ul><ul><li>T j voert een read_item(X) uit na een write_item(X) van T i </li></ul></ul><ul><ul><li>of T j voert een write_item(X) uit na een read_item(X) van T i </li></ul></ul><ul><ul><li>of T j voert een write_item(X) uit na een write_item(X) van T i </li></ul></ul><ul><li>het rooster is serialiseerbaar a.s.a. de graaf geen cycli bevat </li></ul><ul><li>Equivalent serieel rooster S' te bekomen door topologisch sorteren </li></ul><ul><ul><li>als er een boog ( T i ,T j ) bestaat moet T i voor T j komen </li></ul></ul>schrijf(X)  lees(X) lees(X)  schrijf(X) schrijf(X)  schrijf(X) i j
    41. 42. Voorbeeld (1)
    42. 43. Voorbeeld (2)
    43. 44. Nog een voorbeeld (1)
    44. 45. Nog een voorbeeld (2)
    45. 46. (roooster E op p. 44) (roooster F op p. 45) Nog een voorbeeld (3)
    46. 47. View-equivalentie <ul><ul><ul><li>een andere, minder restrictieve definitie van equivalente roosters: </li></ul></ul></ul><ul><ul><li>Roosters S 1 en S 2 zijn view equivalent als </li></ul></ul><ul><ul><ul><li>voor elke read_item(X) in T i in S 1 geldt: </li></ul></ul></ul><ul><ul><ul><ul><li>de laatste write_item(X) voor die read_item(X) moet in beide roosters dezelfde write_item van dezelfde transactie T j zijn </li></ul></ul></ul></ul><ul><ul><ul><li>voor elke X waarvoor een write_item(X) voorkomt: </li></ul></ul></ul><ul><ul><ul><ul><li>de laatste write_item(X) moet dezelfde write_item van dezelfde transactie T k zijn in beide roosters </li></ul></ul></ul></ul><ul><ul><ul><li>m.a.w.: </li></ul></ul></ul><ul><ul><ul><ul><li>elke leesopdracht in S 1 leest (ziet) dezelfde waarde als overeenkomstige leesopdracht in S 2 </li></ul></ul></ul></ul><ul><ul><ul><ul><li>laatst geschreven waarde voor een item is dezelfde in beide roosters </li></ul></ul></ul></ul><ul><ul><li>een rooster is view serialiseerbaar als het view-equivalent is met een serieel rooster </li></ul></ul>
    47. 48. Verschil tussen view-equivalentie en conflict-equivalentie? <ul><li>zijn allebei hetzelfde indien “constrained write” aanname geldt </li></ul><ul><ul><li>CWA: aan elke write_item(X) gaat een read_item(X) vooraf, en de geschreven waarde hangt enkel af van de gelezen waarde </li></ul></ul><ul><li>bij “unconstrained write” aanname is view-equivalentie minder restrictief dan conflict-equivalentie </li></ul><ul><li>maar: testen van view-equivalentie is NP-compleet </li></ul>T1 T2 T3 read (X) write(X) write(X) write(X) commit commit commit “ blinde” aanpassingen: er gaat geen lezen van X aan vooraf dit rooster is view-serialiseerbaar, want view equivalent met serieel rooster T1 T2 T3 maar het is niet conflict-serialiseerbaar
    48. 49. Voorbeeld van view-equivalente maar niet conflict-equivalente roosters _ T1 T2 T3 ____ X := a schrijf(X) X := b schrijf(X) lees(X) X := a schrijf(X) X := c schrijf(X) verplaatsing behoudt view-equivalentie (T2 leest waarde van X geschreven door T3, laatste geschreven waarde van X is geschreven door T3 ) maar niet conflict-equivalentie
    49. 50. In volgorde van restrictiefheid: serieel – conflict-serialiseerbar – view-serialiseerbar <ul><li>in volgorde van restrictiefheid: </li></ul><ul><ul><ul><li>serieel meest restrictief </li></ul></ul></ul><ul><ul><ul><li>conflict-serialiseerbaar </li></ul></ul></ul><ul><ul><ul><li>view-serialiseerbaar minst restrictief </li></ul></ul></ul><ul><ul><li>minder restrictief betekent: </li></ul></ul><ul><ul><ul><li>flexibeler qua concurrentiemogelijkheden </li></ul></ul></ul><ul><ul><ul><li>moeilijker te testen of rooster serialiseerbaar is </li></ul></ul></ul>
    50. 51. Testen of verzekeren van serialiseerbarheid <ul><li>Problemen met testen van serialiseerbaarheid: </li></ul><ul><ul><ul><li>interleaving van operaties wordt bepaald door het besturingssysteem, niet vooraf te voorspellen </li></ul></ul></ul><ul><ul><ul><li>transacties worden continu aangeboden </li></ul></ul></ul><ul><ul><ul><ul><li>begin en einde van roosters moeilijk te voorspellen </li></ul></ul></ul></ul><ul><ul><ul><li>Indien rooster niet serialiseerbaar blijkt: </li></ul></ul></ul><ul><ul><ul><ul><li>herstel nodig  duur </li></ul></ul></ul></ul><ul><li>om deze problemen te vermijden: </li></ul><ul><ul><ul><li>test niet op serialiseerbaarheid </li></ul></ul></ul><ul><ul><ul><li>gebruik bij opstellen van transacties regels (protocols) om serialiseerbaarheid te verzekeren </li></ul></ul></ul><ul><ul><ul><li> volgende les </li></ul></ul></ul>
    51. 52. Agenda Inleiding tot concurrentie en herstel Transacties: begrippen Transactieroosters Serialiseren van roosters Transacties in SQL
    52. 53. SQL biedt mogelijkheid om transacties te definiëren <ul><li>uitvoering van één query is gegarandeerd atomair </li></ul><ul><li>transacties bestaande uit meerdere SQL-queries: </li></ul><ul><ul><li>gebruiker bepaalt eigenschappen van transactie: </li></ul></ul><ul><ul><ul><li>toegangsmodus: </li></ul></ul></ul><ul><ul><ul><ul><li>read-write of read-only </li></ul></ul></ul></ul><ul><ul><ul><li>diagnoseruimte </li></ul></ul></ul><ul><ul><ul><ul><li>de grootte geeft aan hoeveel foutmeldingen opgeslagen kunnen worden </li></ul></ul></ul></ul><ul><ul><ul><ul><li>geeft feedback aan de gebruiker over fouten en uitzonderingen opgetreden tijdens de meest recent uitgevoerde SQL opdrachten </li></ul></ul></ul></ul><ul><ul><ul><li>isolatieniveau: </li></ul></ul></ul><ul><ul><ul><ul><li>READ UNCOMMITTED </li></ul></ul></ul></ul><ul><ul><ul><ul><li>READ COMMITTED </li></ul></ul></ul></ul><ul><ul><ul><ul><li>REPEATEABLE READ </li></ul></ul></ul></ul><ul><ul><ul><ul><li>SERIALIZABLE default waarde </li></ul></ul></ul></ul>
    53. 54. SQL “serializable” (1) <ul><li>&quot;serializable&quot;  onze definities van serialiseerbaar </li></ul><ul><ul><li>gebaseerd op vermijden van bepaalde problemen </li></ul></ul><ul><ul><ul><li>dirty read </li></ul></ul></ul><ul><ul><ul><ul><li>gebruik van een &quot;tijdelijke aanpassing”, uitgevoerd door een nog niet gecommitte transactie </li></ul></ul></ul></ul><ul><ul><ul><li>nonrepeatable read </li></ul></ul></ul><ul><ul><ul><ul><li>opnieuw lezen van een waarde kan een ander resultaat geven </li></ul></ul></ul></ul><ul><ul><ul><li>phantom </li></ul></ul></ul><ul><ul><ul><ul><li>een record wordt zichtbaar bij een tweede maal lezen van een tabel </li></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>bv. T1 begint een scan van een tabel, T2 voegt intussen een rij toe </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>als T1 herbegint ziet het een “phantom” tupel dat eerst niet bestond </li></ul></ul></ul></ul></ul>
    54. 55. SQL “serializable” (2)
    55. 56. Voorbeeld EXEC SQL WHENEVER SQLERROR GOTO UNDO; EXEC SQL SET TRANSACTION READ WRITE DIAGNOSTICS SIZE 5 ISOLATION LEVEL SERIALIZABLE; EXEC SQL INSERT INTO EMPLOYEE (Fname, Lname, Ssn, Dno, Salary) VALUES('Robert', 'Smith', '991004321', 2, 35000); EXEC SQL UPDATE EMPLOYEE SET Salary = Salary * 1.1 WHERE Dno = 2; EXEC SQL COMMIT; GOTO THE_END; UNDO: EXEC SQL ROLLBACK; THE_END: ...; Een nieuwe rij wordt toegevoegd in de tabel EMPLOYEE daarna worden de salarissen van alle werknemers van dept 2 aangepast Indien ergens een fout optreedt, wordt de hele transactie teruggerold.
    56. 57. Vooruitblik Inleiding tot concurrentie en herstel Transacties: begrippen Transactieroosters Serialiseren van roosters Transacties in SQL Transacties II: Concurrentie-controle en herstel
    57. 58. Bronnen <ul><li>Deze slides zijn gebaseerd op Henk Olivié‘s slides voor Gegevensbanken 2009 en op Elmasri & Navathe, Fundamentals of Database Systems, Addison Wesley / Pearson, 5e editie 2007. </li></ul><ul><li>Alle kopie ën zonder bronspecificatie: Elmasri & Navathe, Fundamentals of Database Systems, Addison Wesley / Pearson, 5e editie 2007. </li></ul><ul><li>Verdere figuren: bronnen zie “Powerpoint comments field” </li></ul><ul><li>Bedankt iedereen! </li></ul>
    1. A particular slide catching your eye?

      Clipping is a handy way to collect important slides you want to go back to later.

    ×