SlideShare a Scribd company logo
Präfix-Addierer
Hritam Dutta
Überblick
• Präfix-Addierer als schneller Addierer
• Der Addierer ist ein grundlegender Baustein des digitalen Entwurfs
(ALUs, Programmzähler, Adressgeneratoren).
• Es gibt viele verschiedene Arten von Addierern. Der Entwickler sollte
die Kompromisse verstehen und je nach Anwendungsfall auswählen.
Inhärent schneller bei breiten
Addierern (>16 bits)
Grundlagen
1
Der Entwurf der Addiererlogik basiert auf
der „schriftlichen Addition".
Volladdierer
1-Bit-Volladdierer-Funktionalität wird mit
Logikgattern implementiert
Wie hoch ist die Verzögerung durch einen
Volladdierer?
Carry-Ripple-Addierer
Der Engpass für die
Geschwindigkeit des Ripple-
Carry-Addierers ist die
sequentielle Erzeugung des
Übertragbits. Dies bedeutet,
dass der längste Pfad in der
Schaltung die
Übertragsleitungen
durchläuft .
Wie hoch ist die
Verzögerung durch einen n-
bit Volladdierer?
Volladdierer erneut besucht
Jeder Addierer gibt an einem speziellen Ausgang an, ob er den
eingehenden Übertrag absorbiert, weiterleitet oder erzeugt.
Volladdierer mit Propagate und Generate
Die Berechnung des
Generierungs- und
Propagierungssignals hat
keinen zusätzlichen
Hardware-Aufwand
Carry-Ripple-Addierer
Verzögerung
4-bit Carry-Look-Ahead-Addierer
Für jede Summe muss man wissen,
was der Übertrag ist. Diese
Berechnung kann schneller
gemacht werden.
der Ausgangsübertrag eines 4-Bit-Addierers hängt
direkt vom Eingangsübertrag ab und nicht vom
Zwischenergebnis des Übertrags
Die Übertragsberechnung ist hier
viermal schneller als beim Carry-Ripple-
Addierer.
32-bit Carry-Look-Ahead-Addierer
können wir die Übertragsberechnung n-mal schneller machen als die n-Bit Carry-Ripple-Adder-Version? Mit anderen Worten, ist die
Verzögerung des Addierers O(1)?
die Gruppe als Ganzes propagiert einen Übertrag
nach dem Ausgang, wenn alle Spalten den Übertrag
weiterleiten
die Gruppe als Ganzes generiert
einen Übertrag nach dem
Ausgang, wenn Spalte 3 einen
Übertrag erzeugt(g3=1) oder
propagiert einen Übertrag, der in
Spalte 2 erzeugt wurde (p3.g2=1)
oder …
Der Übertrag wird als Vielfaches von 4 in den nächsten Block übertragen, daher
ist die Verzögerung durch N-bit carry-lookahead Addierer mit 4-Bit Blöcken:
Präfixoperationen
2 5 4 3
7 7
9
14
11
2 5 4 3
7 7
14
11
Hochparallele 16-Parallele-Präfixoperation. O(log N)
Arbeitseffiziente parallele Präfixsumme mit 16 Eingängen. O(2log N)
Präfix-Addierer
Präfixaddierer haben drei Stufen
• Vorverarbeitung
• Übertragsübertragung (mit Präfix)
• Nachbearbeitung
• Addierer unterscheiden sich nur in der Art und Weise, wie die
Übertragsübertragung berechnet wird. Das Problem der
Übertragung kann jedoch parallel behandelt werden, indem ein
paralleles Präfix verwendet wird.
Paralleler Präfix-Addierer
1. Vorverarbeitung
2. Übertragsübertragung
3. Nachverarbeitung
Initiale
Propagate/Generate
Signale
Übertragsübertragung
Wie kann ich die folgende Präfix-Logik effizient umsetzen?
?
Parallele Präfix-Operationen
Block z erzeugt einen Übertrag, wenn
• ein Übertrag in Block x erzeugt wird oder
• Block x einen Übertrag weitergibt, der in Block y
erzeugt wurde
Block z gibt einen Übertrag weiter, wenn
sowohl Block x als auch Block y den
Übertrag weitergeben
Effiziente Präfixberechnung
• Parallele Präfixschaltungen verwenden ein Baumnetzwerk, um die
Latenz zu verringern
Beispiel
• 8-bit Präfix Addierer
(7:6)
(7:4)
(7:0)
Kogge-Stone
• Vorteil
• Stufen(=log(16)=4)
• Fan-out(2)
• Nachteil
• Anzahl Merge Blöcke
(49)
• horizontale
Verdrahtungsschienen
(34)
Bestimmt den Platzbedarf der Schaltung.
Bestimmt den kritischen Pfad
Fan-out ist proportional zur Verzögerung der Schaltung
Brent-Kung
• Vorteil
• Stufen(=2*log(16)-2=6)
• horizontale
Verdrahtungsschienen
(11)
• Nachteil
• Anzahl Merge Blöcke
(26)
• Fan-out(4)
Sklansky
• Vorteil
• Stufen(=log(16)=4
)
• horizontale
Verdrahtungsschi
enen (24)
• Nachteil
• Fan-out(8)
• Anzahl Merge
Blöcke (32)
Zusammenfassung
• Carry-Ripple-Addierer ist ein sehr effizienter Addierer für kleine
Bitbreiten
• Der Engpass für die Geschwindigkeit des Ripple-Carry-Addierers ist die
sequentielle Erzeugung der Übertragbits.
• Parallele Präfixschaltungen verwenden ein Baumnetzwerk zur
Übertragsberechnung, um die Latenz zu verringern
• Addierer-Architekturen bieten Kompromisse bei Fläche,
Stromverbrauch, und Verzögerung
• „pick two“ für Ihre Anwendung
Quellenangaben
• https://inst.eecs.berkeley.edu/~eecs151/sp18/files/Lecture20.pdf
• https://cseweb.ucsd.edu/classes/fa12/cse140-a/slides/lec14.pdf
• https://syssec.ethz.ch/content/dam/ethz/special-interest/infk/inst-
infsec/system-security-group-
dam/education/Digitaltechnik_14/13_AdvancedAdders.pdf
• https://web.stanford.edu/class/archive/ee/ee371/ee371.1066/lectures/lect_0
4.2up.pdf
• https://www.cerc.utexas.edu/~jaa/vlsi/lectures/8-1.pdf
• https://www.esa.informatik.tu-
darmstadt.de/archive/twiki/pub/Lectures/Digitaltechnik15De/Kapitel05komm
entiert.pdf

More Related Content

What's hot

Noise
NoiseNoise
Noise
Syeda
 
10 color image processing
10 color image processing10 color image processing
10 color image processing
babak danyal
 
Amplitude Modulation and Frequency Modulation
Amplitude Modulation and Frequency ModulationAmplitude Modulation and Frequency Modulation
Amplitude Modulation and Frequency Modulation
KavitaGiri5
 
ADDITTIVE WHITE GAUSIAN NOIS ( AWGN)
ADDITTIVE WHITE GAUSIAN NOIS ( AWGN)ADDITTIVE WHITE GAUSIAN NOIS ( AWGN)
ADDITTIVE WHITE GAUSIAN NOIS ( AWGN)
mohammedalimahdi
 
PSK (PHASE SHIFT KEYING )
PSK (PHASE SHIFT KEYING )PSK (PHASE SHIFT KEYING )
PSK (PHASE SHIFT KEYING )
vijidhivi
 
Channel capacity
Channel capacityChannel capacity
Channel capacity
PALLAB DAS
 
Switching - data communication
Switching - data communicationSwitching - data communication
Switching - data communication
Rubaya Mim
 
Manet
ManetManet
Delta modulation
Delta modulationDelta modulation
Delta modulation
Hanu Kavi
 
Pulse Code Modulation
Pulse Code Modulation Pulse Code Modulation
Pulse Code Modulation
ZunAib Ali
 
Frequency Domain FIltering.pdf
Frequency Domain FIltering.pdfFrequency Domain FIltering.pdf
Frequency Domain FIltering.pdf
Muhammad_Ilham_21
 
The H.264 Integer Transform
The H.264 Integer TransformThe H.264 Integer Transform
The H.264 Integer Transform
Iain Richardson
 
Rf power amplifier design
Rf power amplifier designRf power amplifier design
Rf power amplifier design
venkateshp100
 
finite word length effects.ppt
finite word length effects.pptfinite word length effects.ppt
finite word length effects.ppt
manojn87
 
Computer vision - two view geometry
Computer vision -  two view geometryComputer vision -  two view geometry
Computer vision - two view geometry
Wael Badawy
 
Creación y tratamiento de imágenes digitales: definición y tipos de imágenes
Creación y tratamiento de imágenes digitales: definición y tipos de imágenesCreación y tratamiento de imágenes digitales: definición y tipos de imágenes
Creación y tratamiento de imágenes digitales: definición y tipos de imágenes
Aplicaciones Gráficas
 
Digital modulation techniques
Digital modulation techniquesDigital modulation techniques
Digital modulation techniques
Harish N Nayak
 

What's hot (17)

Noise
NoiseNoise
Noise
 
10 color image processing
10 color image processing10 color image processing
10 color image processing
 
Amplitude Modulation and Frequency Modulation
Amplitude Modulation and Frequency ModulationAmplitude Modulation and Frequency Modulation
Amplitude Modulation and Frequency Modulation
 
ADDITTIVE WHITE GAUSIAN NOIS ( AWGN)
ADDITTIVE WHITE GAUSIAN NOIS ( AWGN)ADDITTIVE WHITE GAUSIAN NOIS ( AWGN)
ADDITTIVE WHITE GAUSIAN NOIS ( AWGN)
 
PSK (PHASE SHIFT KEYING )
PSK (PHASE SHIFT KEYING )PSK (PHASE SHIFT KEYING )
PSK (PHASE SHIFT KEYING )
 
Channel capacity
Channel capacityChannel capacity
Channel capacity
 
Switching - data communication
Switching - data communicationSwitching - data communication
Switching - data communication
 
Manet
ManetManet
Manet
 
Delta modulation
Delta modulationDelta modulation
Delta modulation
 
Pulse Code Modulation
Pulse Code Modulation Pulse Code Modulation
Pulse Code Modulation
 
Frequency Domain FIltering.pdf
Frequency Domain FIltering.pdfFrequency Domain FIltering.pdf
Frequency Domain FIltering.pdf
 
The H.264 Integer Transform
The H.264 Integer TransformThe H.264 Integer Transform
The H.264 Integer Transform
 
Rf power amplifier design
Rf power amplifier designRf power amplifier design
Rf power amplifier design
 
finite word length effects.ppt
finite word length effects.pptfinite word length effects.ppt
finite word length effects.ppt
 
Computer vision - two view geometry
Computer vision -  two view geometryComputer vision -  two view geometry
Computer vision - two view geometry
 
Creación y tratamiento de imágenes digitales: definición y tipos de imágenes
Creación y tratamiento de imágenes digitales: definición y tipos de imágenesCreación y tratamiento de imágenes digitales: definición y tipos de imágenes
Creación y tratamiento de imágenes digitales: definición y tipos de imágenes
 
Digital modulation techniques
Digital modulation techniquesDigital modulation techniques
Digital modulation techniques
 

Prefix adder german

  • 2. Überblick • Präfix-Addierer als schneller Addierer • Der Addierer ist ein grundlegender Baustein des digitalen Entwurfs (ALUs, Programmzähler, Adressgeneratoren). • Es gibt viele verschiedene Arten von Addierern. Der Entwickler sollte die Kompromisse verstehen und je nach Anwendungsfall auswählen. Inhärent schneller bei breiten Addierern (>16 bits)
  • 3. Grundlagen 1 Der Entwurf der Addiererlogik basiert auf der „schriftlichen Addition".
  • 4. Volladdierer 1-Bit-Volladdierer-Funktionalität wird mit Logikgattern implementiert Wie hoch ist die Verzögerung durch einen Volladdierer?
  • 5. Carry-Ripple-Addierer Der Engpass für die Geschwindigkeit des Ripple- Carry-Addierers ist die sequentielle Erzeugung des Übertragbits. Dies bedeutet, dass der längste Pfad in der Schaltung die Übertragsleitungen durchläuft . Wie hoch ist die Verzögerung durch einen n- bit Volladdierer?
  • 6. Volladdierer erneut besucht Jeder Addierer gibt an einem speziellen Ausgang an, ob er den eingehenden Übertrag absorbiert, weiterleitet oder erzeugt.
  • 7. Volladdierer mit Propagate und Generate Die Berechnung des Generierungs- und Propagierungssignals hat keinen zusätzlichen Hardware-Aufwand
  • 9. 4-bit Carry-Look-Ahead-Addierer Für jede Summe muss man wissen, was der Übertrag ist. Diese Berechnung kann schneller gemacht werden. der Ausgangsübertrag eines 4-Bit-Addierers hängt direkt vom Eingangsübertrag ab und nicht vom Zwischenergebnis des Übertrags Die Übertragsberechnung ist hier viermal schneller als beim Carry-Ripple- Addierer.
  • 10. 32-bit Carry-Look-Ahead-Addierer können wir die Übertragsberechnung n-mal schneller machen als die n-Bit Carry-Ripple-Adder-Version? Mit anderen Worten, ist die Verzögerung des Addierers O(1)? die Gruppe als Ganzes propagiert einen Übertrag nach dem Ausgang, wenn alle Spalten den Übertrag weiterleiten die Gruppe als Ganzes generiert einen Übertrag nach dem Ausgang, wenn Spalte 3 einen Übertrag erzeugt(g3=1) oder propagiert einen Übertrag, der in Spalte 2 erzeugt wurde (p3.g2=1) oder … Der Übertrag wird als Vielfaches von 4 in den nächsten Block übertragen, daher ist die Verzögerung durch N-bit carry-lookahead Addierer mit 4-Bit Blöcken:
  • 11. Präfixoperationen 2 5 4 3 7 7 9 14 11 2 5 4 3 7 7 14 11 Hochparallele 16-Parallele-Präfixoperation. O(log N) Arbeitseffiziente parallele Präfixsumme mit 16 Eingängen. O(2log N)
  • 12. Präfix-Addierer Präfixaddierer haben drei Stufen • Vorverarbeitung • Übertragsübertragung (mit Präfix) • Nachbearbeitung • Addierer unterscheiden sich nur in der Art und Weise, wie die Übertragsübertragung berechnet wird. Das Problem der Übertragung kann jedoch parallel behandelt werden, indem ein paralleles Präfix verwendet wird.
  • 13. Paralleler Präfix-Addierer 1. Vorverarbeitung 2. Übertragsübertragung 3. Nachverarbeitung Initiale Propagate/Generate Signale
  • 14. Übertragsübertragung Wie kann ich die folgende Präfix-Logik effizient umsetzen? ?
  • 15. Parallele Präfix-Operationen Block z erzeugt einen Übertrag, wenn • ein Übertrag in Block x erzeugt wird oder • Block x einen Übertrag weitergibt, der in Block y erzeugt wurde Block z gibt einen Übertrag weiter, wenn sowohl Block x als auch Block y den Übertrag weitergeben
  • 16. Effiziente Präfixberechnung • Parallele Präfixschaltungen verwenden ein Baumnetzwerk, um die Latenz zu verringern
  • 17. Beispiel • 8-bit Präfix Addierer (7:6) (7:4) (7:0)
  • 18. Kogge-Stone • Vorteil • Stufen(=log(16)=4) • Fan-out(2) • Nachteil • Anzahl Merge Blöcke (49) • horizontale Verdrahtungsschienen (34) Bestimmt den Platzbedarf der Schaltung. Bestimmt den kritischen Pfad Fan-out ist proportional zur Verzögerung der Schaltung
  • 19. Brent-Kung • Vorteil • Stufen(=2*log(16)-2=6) • horizontale Verdrahtungsschienen (11) • Nachteil • Anzahl Merge Blöcke (26) • Fan-out(4)
  • 20. Sklansky • Vorteil • Stufen(=log(16)=4 ) • horizontale Verdrahtungsschi enen (24) • Nachteil • Fan-out(8) • Anzahl Merge Blöcke (32)
  • 21. Zusammenfassung • Carry-Ripple-Addierer ist ein sehr effizienter Addierer für kleine Bitbreiten • Der Engpass für die Geschwindigkeit des Ripple-Carry-Addierers ist die sequentielle Erzeugung der Übertragbits. • Parallele Präfixschaltungen verwenden ein Baumnetzwerk zur Übertragsberechnung, um die Latenz zu verringern • Addierer-Architekturen bieten Kompromisse bei Fläche, Stromverbrauch, und Verzögerung • „pick two“ für Ihre Anwendung
  • 22. Quellenangaben • https://inst.eecs.berkeley.edu/~eecs151/sp18/files/Lecture20.pdf • https://cseweb.ucsd.edu/classes/fa12/cse140-a/slides/lec14.pdf • https://syssec.ethz.ch/content/dam/ethz/special-interest/infk/inst- infsec/system-security-group- dam/education/Digitaltechnik_14/13_AdvancedAdders.pdf • https://web.stanford.edu/class/archive/ee/ee371/ee371.1066/lectures/lect_0 4.2up.pdf • https://www.cerc.utexas.edu/~jaa/vlsi/lectures/8-1.pdf • https://www.esa.informatik.tu- darmstadt.de/archive/twiki/pub/Lectures/Digitaltechnik15De/Kapitel05komm entiert.pdf

Editor's Notes

  1. -sportliches Lernziel: 8-bit Addierer vorausgesetzt voll… Vor Tieftauchgang in das Thema, Motivation Von Taschenrechnern bis DSPs für Totewinkelerkennung in Fahrerassistenz
  2. Addition für n-binärzahlen basiert sich auf schriftlen Addition Links nach Rechts Illustrate: dd a0 and b0 to obtain s0, process a1,b1, c1 to obtain sum a1 and carry a1 Wahrheietstabelle: Alle möglichen Kombinationen von Eingängen und Übertrag und deren Ausgang Komprimierte Darstellung: Gleichungen, die disjunktive Normalform aus den Wahrheitswerten der Tabelle bildet und dann vereinfacht
  3. Mit einem Volladdierer kann man drei einstellige Binärzahlen addieren Dabei liefert der Ausgang summe und übertrag Abbildung zeigt aufbau eines VA mit logikgattern Grundbaustein für Addierwerk und Multiplizierer
  4. CRA dient der Addition mehrstellige n-bit zahl Eingang: 2 n bit Zahlen + carry, summe und ausgang Kette von n 1-bit VA Der Übertrags-Ausgang der Addierer wird jeweils an einen Eingang des nächsten Volladdierers angeschlossen. da der Volladdierer das korrekte Ergebnis erst dann ausgeben kann, wenn der vorhergehende Volladdierer das Übertragsbit geliefert hat. Es ist von Natur aus seriell(langsam), da zwei Zahlen von links nach rechts addiert werden. Im schlimmsten Fall s7 auf c7 warten muss, das auf c6 warten muss Zuse Wie können wir es schneller machen, vielleicht mit mehr Kosten? durch Verkürzung der für die Ermittlung von Übertragsbits erforderlichen Zeit.
  5. Neuformulierung der Basisaddierer-Stufe zwei Signale: Generate (erzeuge neuen Übertrag) Propagate (leite eventuellen Übertrag weiter)
  6. Die Funktion des Volladdierers kann durch Propagate und Generate Signale ausgedrückt werden Volladdier hat bereits die implementierung um propagate und generate signal zu generieren (2 gatter bilden in Halbaddierer) Kein zusätzliche Aufwand
  7. Carry ripple adder mit propagate und generate signal (anders dargestellt) Carry bits sind immer noch abhängig auf voherige Stufe daher noch kein Vorteil dass man parallel propagate und generate bits berechnet Verzögerung
  8. Gleichung erklaren: Schaltung: Zeigen Sie, dass der Übertrag nicht in die nächste Stufe, sondern direkt in die Summenlogik geht. Sondern, carry bit wird mit eingang übertrag berechnet Kritische Pfad
  9. Ein Fan-in von mehr als 4 ist für einzelne CMOS-Gattern unpraktisch, da die Rauschimmunität und die Anstiegs- und Abfallzeiten schlecht sind und daher schlechte Verzögerung. 32-bit CLA, 4-bit Concept: Group generate /propagate (also known as prefix)
  10. Präfix sum mit liste von zahlen Seriel: n-Schritte Parallel prefix log n oder 2 log n schritte 1024
  11. Stufe Ripple carry adder auch als prefix adder darstell
  12. Annahme: eingang carry ist null Formeln vereinfacht, Interpretation: Was erzählt der Präfix: Stufe 1 und 0 generieren ein Carry-bit So schnell wie möglich berechnen mit präfix logik
  13. Interpretation Präfix Logik: für gruppe ist ähnich wie für einzeln stufen Erste formeln Zweite formeln Ergebnis (1,0) Blocks?? Intuitiv??
  14. Man drosselt die Formeln auf in Blöcke von Bits Eingang: einzelne pg bits (gruppe besteht aus 1-bit) Erste stufe: berechne g und p für gruppen von 2 spalten, also Zweite stufe: größer block, nutzt zwischen ergebnis als preficx End ergebnis 4-bit KS Adder
  15. Eingang Erste stufe: erklären Zweite stufe: pg block for spalte 7:4 Dritte stufe: spalte 7:0 Ausgang carra plus propagate ergibt die summen bit
  16. Schnellste addierer Log(n) Erkläre die Performanz Parametern Höhe hardware Aufwand, routing aufwand,
  17. B-K, Kompromiss (2logN) dafür weniger