PEMROSESAN PARALE
Contoh
Kebutuhan pengolahan
paralel
 Motivasi :
 Pengolahan data numerik dalam jumlah yang
sangat besar.
 Kebutuhan akan ketersediaan data yang
senantiasa up to date.
 Contoh :
 Simulasi sirkulasi global laut di Oregon State
University.
Lautan dibagi ke dalam 4096 daerah membentang
dari
timur ke barat, 1024 daerah membentang dari utara
ke
selatan dan 12 lapisan. Berarti terdapat sekitar 50
juta
daerah berdimensi tiga. Satu iterasi mampu
mensimulasikan
sirkulasi lautan untuk jangka waktu 10 menit dan
membutuhkan sekitar 30 milyar kalkulasi floating
 Pengolahan Paralel :
 Pengolahan informasi yang menekankan
pada
manipulasi data-data elemen secara
simultan.
 Dimaksudkan untuk mempercepat komputasi dari
sistem komputer dan menambah jumlah keluaran
yang dapat dihasilkan dalam jangka waktu
tertentu.
Paradigma Pengolahan
Paralel
M. J. FLYNN
Pengklasifikasian oleh Flynn, dikenal sebagai
Taksonomi Flynn, membedakan komputer
paralel ke dalam empat kelas berdasarkan
konsep aliran
1.
data (data stream) dan aliran instruksi
(instruction
stream), sebagai : SISD, SIMD, MISD,
MIMD.
1.
SISD
(Single Instruction stream, Single Data
stream)
 Komputer tunggal yang mempunyai satu unit
kontrol, satu unit prosesor dan satu unit
memori
 Instruksi dilaksanakan secara berurut tetapi
boleh juga overlap dalam tahapan eksekusi
(overlap)
 Satu alur instruksi
didecode
untuk alur data
tunggal
Instructi
on
Stream
Control Processor Memory
Data
Stream
berbeda
2.
SIMD
(Single Instruction
stream,
Multiple Data
stream)
 Komputer yang mempunyai beberapa unit
prosesor
di bawah satu supervisi satu unit common
control. Setiap prosesor menerima instruksi
yang sama dari
unit
kontrol,
tetapi beroperasi
pada
data yang
berbeda.
Processor Data
Shared
Stream
Memory
Instruction
Stream
Control Processor Data
Stream or
Processor Data
Interconnection
Stream
Network
3.
MISD
(Multiple Instruction stream, Single Data
stream)
 Sampai saat ini struktur ini masih
merupakan
struktur teoritis
dan
model ini.
belu
m
ada
komputer
denga
n
Instruction
Stream
Control 1 Processor 1
Instruction
Stream
Control 2 Processor 2
Memory
Data
.
.
Stream
.
.
.
Processor N
.
Control N Instruction
Stream
4. MIM
D
(Multiple Instruction stream, Multiple Data
stream)
 Organisasi komputer yang memiliki
kemampuan
untuk memproses beberapa program dalam
waktu yang sama. Pada umumnya
multiprosesor dan multikomputer termasuk
dalam kategori ini.
Instruction
Stream
Control 1 Processor 1 Data
Stream Shared
Instruction
Stream
Memory
Control 2 Processor 2 Data
Stream
.
. or
.
.
.
Processor N
.
Control N
Interconnection
Instruction
Stream
Data
Network
Stream
 MIMD dibagi menjadi 2 grup:
 Multiprocessor yang menggunakan
memory
bersama.
 Multicomputer.
yang dimili prose a p U CPU
Multiprosess
or

 Sistem multiprocessor adalah suatu komputer
yang mempunyai lebih dari satu CPU pada
motherboardnya. Jika sistem operasi dibangun
untuk memanfaatkan kelebihan ini, maka SO
tersebut dapat menjalankan proses-proses
berbeda (atau thread-thread berbeda yang dimiliki
oleh proses yang sama) pada CPU-CPU
berbeda.
Processors are
connected with
memory via the
memory bus
(which
is fast), or
switches
P
P
P
Shared
Memory
P
Share
d
Memor
y
Multiprocesso
rs
 3 Model Shared Memory
Multiprocessors:
 Uniform Memory Access (UMA)
 Nonuniform Memory Access (NUMA)
 Cache Only Memory Architecture
(COMA)
 Yang membedakan dari ketiga model diatas
adalah bagaimana memori dan pheripheral
device di shared atau didistribusikan
Unifor
m
Memor
y
Acces
s
(UMA
)
 Terlihat
bahwa
memori dibagi secara merata ke semua
prosesor
 Semua prosesor mempunyai waktu akses yang sama ke
semua word
 Setiap prosesor menggunakan private cache
 Dan untuk peripheral juga dishare dengan cara yang sama
memo
ri
 UMA cocok untuk general purpose dan aplikasi time sharing oleh
multiple user
 UMA dapat digunakan untuk meningkatkan ekseskusi dari program
tunggal yang besar pada aplikasi time-critical
No
n
Unifor
m
Memor
y
Acces
s
(NUMA
)
 NUMA Multiprocessor adalah sebuah sistem
shared
memory dimana waktu aksesnya
bervariasi ke lokasi memori word
Shared memory yang secara fisik didistribusikan ke semua
processor disebut lokal memori dan kumpulan dari lokal memori
membentuk ruang alamat global yang dapat diakses oleh semua
processor
NUMA dapat mengakses lokal memori lebih cepat dengan lokal
processor, sedangkan akses ke memori yang jauh diberikan ke proc.
Lain yang kapasitasnya lebih besar untuk ditambah delay melalui
interkoneksi jaringan
Disamping distribusi memori, secara umum shared memory dapat
ditambahkan ke multiprosessror syste,, dalam hal ini ada tiga pola
akses memory, dimana yang tgerdepat adalah akses ke lokal
memori, akses ke global memori dan yang paling lambat adalah
akses dari memory yang jauh (hierarchical Cluster Model (Chedar
System))



memory ke
Cache Only
Memory
Acce
ss
(COMA
)
COMA adalah
multiprocessor yang hanya
menggunakan cache
memory
COMA dapat ditemukan
pada NUMA machines,
dimana pendistribusioan
main memory dirubah ke
cache.


Disini tidak ada hirarki
memori pada setiap
node computer
 Semua cache berasal dari
ruang
alamat
global.
Akses ke cache
jauh
dibantu oleh direktori cache yang didistribusikan. Tergantung
kepada interkoneksi jaringan yang digunakan, terkadang
direktori digunakan untuk membantu penempatan copian dari
blok-blok cache

 Penempatan awak data tidak penting karena data akan
menempati tempat dimana data tersebut akan digunakan
Multicomput
er
 Sistem Multicomputer
Multicomputer dapat dianggap berupa suatu komputer
NUMA
loosely atau cluster yang tightly coupled.

 Multicomputer biasanya digunakan ketika diperlukan
power komputasi tinggi tetapi lingkungan mempunyai
ruang fisik atau tenaga listrik terbatas.
Processors have
private
address space.
Interprocess
communication via
message passing
only
In clusters, computers
are
connected via LAN
M
P
M
M
P
Interconnecti
on
Networ
k
P
M
P
Scalability Issue
Major Issu
es
in MIM
D
Processor-memory
Interconnection
Cache Coherence
Synchronization Support
Scalability Issue
1.
2.
3.
4.
Distributed Shared
Memory
5.
Sistem
Multicore
CPU-CPU Intel dari era Pentium 4 terbaru
(Northwood
dan Prescott) menerapkan suatu teknologi
bernama
Hyper-threading yang memungkinkan lebih dari
satu
thread (biasanya dua) untuk berjalan pada CPU
yang
sama.

Produk processor yang lebih baru seperti Sun
UltraSPARC T1, AMD Athlon 64 X2, AMD Athlon
FX,
AMD Opteron, Intel Pentium D, Intel Core, Intel
Core 2
dan Intel Xeon menyertakan banyak core
processor
juga untuk meningkatkan jumlah thread yang
dapat
dieksekusi.

A Taxonom
y
of ParallelComputer
s
Message
Passing
Shared
Memory
Cube
Grid
NC-
NUM
A
CC-
NUM
A
Switched
Bus
COW
MPP
NUMA
COMA
UMA
Multicomputers
Multiprocessor
s
Array
Vector
MIMD
MISD
SIMD
SISD
Parallel Architectures

Keterangan:
 UMA
 NUMA
 COMA
:
:
:
Uniform Memory Access
Non Uniform Memory
Access
Cache Only Memory
Access
 MPP
 COW
 CC-
NUMA
 NC-
NUMA
:
:
:
:
Massively Parallel
Processor
Cluster of
Workstations Cache
Coherent NUMA Non
Cache NUMA
Terminolo
gi
 Pengolahan Paralel :
Pengolahan informasi yang ditekankan pada
manipulasi elemen data yang dimiliki oleh satu
atau
lebih dari satu
proses
secara bersamaan
dalam
rangka menyelesaikan sebuah problem.
 Komputer Paralel :
Komputer multi-prosesor dengan
kemampuan melakukan pengolahan
paralel.
adalah paralel Beberapa antaranya
Supercomputer :
sebuah general-purpose computer yang
mampu me- nyelesaikan problem dengan
kecepatan komputasi sangat tinggi. Semua
superkomputer kontemporer

adalah komputer paralel. Beberapa di antaranya
memiliki prosesor yang sangat kuat dalam jumlah
yang
relatif sedikit, sementara yang
lainnya
dibangun
oleh
mikroprosesor dalam jumlah yang cukup
besar.
Throughput :
banyaknya keluaran yang dihasilkan per unit
waktu

perawatannya
 Semakin banyak prosesor yang digunakan
semakin
tinggi biaya untuk memperoleh solusi
sebuah problem. Hal ini terjadi karena
perlu
dipertimbangkan
biaya
pengadaan
prosesor
dan
perawatannya.
 Jumlah prosesor yang tergantung
dari
n ,
p(n)
.
n=ukuran problem, dinyatakan
sebagai
Kadang-kadang jumlah prosesor tidak
tergantung
pada ukuran problem.
atau -
Contoh
SIMD:
 Perhatikan n
bilangan
x1,x2,…,xn yang
akan
dijumlahkan. Dengan
menggunakan
kompute
r n/2
tree-connected SIMD dengan
log
n level
dan
daun, dibutuhkan
pohon
denga
n
ukura
n
(n-
1)
atau p(n) =
n
-1 .
n =
P1
 Ilustrasi
untuk
8
P2 P3
P4 P5 P6 P7
x1 x2 x3 x4 x5 x6 x7 x8
INPUT
Jaringan Interkoneksi
 Penggunaan jaringan interkoneksi
 Hubungkan prosessor ke memori bersama
 Hubungkan prosessor satu sama lain
 Jenis media interkoneksi
 Media bersama
 Media yang dialihkan
nodes (node can be a processing unit, a memory
Network topology:
 Static Networks
 Dynamic Networks
Static networks provide fixed connections
between nodes (node can be a processing
unit, a memory


module, I/O Module). Links between
nodes are
unchangeable and cannot be easily
reconfigured.
Dynamic networks provide reconfigurable
connections between nodes. The switch box is
the basic component
of the dynamic network. The connections between
nodes are established by the setting of a set of

Mos
t
commo
n
network
s
Topologi Jaringan
Interkoneksi
MIM
D
 Ada beberapa topologi
dasar:
 Ring
 Mesh
 Tree

Hypercube
 Topologi Ring
 Apabila komunikasinya dua arah disepanjang
ring,
maka jarak maksimum
antara
dengan n simpul adalah
n/2
dua simpul
pada
ring
 Paket-paket pesan
berukuran
tetap digunakan
dengan
melibatkan alamat tujuan yang diinginkan
 Topologi ini cocok untuk jumlah prosesor yang
relatif sedikit dengan komunikasi data minimal
 Topologi
Mesh
Bentuk mesh yang paling
sederhana
adalah array dua dimensi
tempat
masing-masing simpul saling
terhubung dengan keempat
tetangganya.

Diameter komunikasi sebuah
mesh
yang sederhana adalah 2(n-1)
Koneksi wraparround pada
bagian- bagian ujung akan
mengurangi ukuran diameter
menjadi 2(n/s)
Topologi mesh ini cocok untuk
hal-hal yang berkaitan dengan
algoritma yang berorientasi
matriks



bottom : leaf (or
 Topologi Tree
 Jaringan topologi
tree digunakan
untuk mendukung
algoritma
Top node: root
Four nodes at
the bottom :
leaf (or


searching dan
sorting. terminal) nodes
The rest of the
nodes are called
intermediate
nodes.

 Topologi
Hypercube
Topologi ini
menggunakan
N=2n prosesor yang
disusun
dalam sebuah kubus
berdimensi n, dimana
setiap

simpul mempunyai n =
log2N
link bidirectional dengan
simpul yang berdekatan
Diameter komunikasi
hiperkubus seperti itu
sama dengan n

Terima kasih

pemprosesan data secara paralel pada big data.pptx

  • 1.
  • 2.
    Contoh Kebutuhan pengolahan paralel  Motivasi:  Pengolahan data numerik dalam jumlah yang sangat besar.  Kebutuhan akan ketersediaan data yang senantiasa up to date.  Contoh :  Simulasi sirkulasi global laut di Oregon State University. Lautan dibagi ke dalam 4096 daerah membentang dari timur ke barat, 1024 daerah membentang dari utara ke selatan dan 12 lapisan. Berarti terdapat sekitar 50 juta daerah berdimensi tiga. Satu iterasi mampu mensimulasikan sirkulasi lautan untuk jangka waktu 10 menit dan membutuhkan sekitar 30 milyar kalkulasi floating
  • 3.
     Pengolahan Paralel:  Pengolahan informasi yang menekankan pada manipulasi data-data elemen secara simultan.  Dimaksudkan untuk mempercepat komputasi dari sistem komputer dan menambah jumlah keluaran yang dapat dihasilkan dalam jangka waktu tertentu.
  • 4.
    Paradigma Pengolahan Paralel M. J.FLYNN Pengklasifikasian oleh Flynn, dikenal sebagai Taksonomi Flynn, membedakan komputer paralel ke dalam empat kelas berdasarkan konsep aliran 1. data (data stream) dan aliran instruksi (instruction stream), sebagai : SISD, SIMD, MISD, MIMD.
  • 5.
    1. SISD (Single Instruction stream,Single Data stream)  Komputer tunggal yang mempunyai satu unit kontrol, satu unit prosesor dan satu unit memori  Instruksi dilaksanakan secara berurut tetapi boleh juga overlap dalam tahapan eksekusi (overlap)  Satu alur instruksi didecode untuk alur data tunggal Instructi on Stream Control Processor Memory Data Stream
  • 6.
    berbeda 2. SIMD (Single Instruction stream, Multiple Data stream) Komputer yang mempunyai beberapa unit prosesor di bawah satu supervisi satu unit common control. Setiap prosesor menerima instruksi yang sama dari unit kontrol, tetapi beroperasi pada data yang berbeda. Processor Data Shared Stream Memory Instruction Stream Control Processor Data Stream or Processor Data Interconnection Stream Network
  • 7.
    3. MISD (Multiple Instruction stream,Single Data stream)  Sampai saat ini struktur ini masih merupakan struktur teoritis dan model ini. belu m ada komputer denga n Instruction Stream Control 1 Processor 1 Instruction Stream Control 2 Processor 2 Memory Data . . Stream . . . Processor N . Control N Instruction Stream
  • 8.
    4. MIM D (Multiple Instructionstream, Multiple Data stream)  Organisasi komputer yang memiliki kemampuan untuk memproses beberapa program dalam waktu yang sama. Pada umumnya multiprosesor dan multikomputer termasuk dalam kategori ini. Instruction Stream Control 1 Processor 1 Data Stream Shared Instruction Stream Memory Control 2 Processor 2 Data Stream . . or . . . Processor N . Control N Interconnection Instruction Stream Data Network Stream
  • 9.
     MIMD dibagimenjadi 2 grup:  Multiprocessor yang menggunakan memory bersama.  Multicomputer.
  • 10.
    yang dimili prosea p U CPU Multiprosess or   Sistem multiprocessor adalah suatu komputer yang mempunyai lebih dari satu CPU pada motherboardnya. Jika sistem operasi dibangun untuk memanfaatkan kelebihan ini, maka SO tersebut dapat menjalankan proses-proses berbeda (atau thread-thread berbeda yang dimiliki oleh proses yang sama) pada CPU-CPU berbeda. Processors are connected with memory via the memory bus (which is fast), or switches P P P Shared Memory P
  • 11.
    Share d Memor y Multiprocesso rs  3 ModelShared Memory Multiprocessors:  Uniform Memory Access (UMA)  Nonuniform Memory Access (NUMA)  Cache Only Memory Architecture (COMA)  Yang membedakan dari ketiga model diatas adalah bagaimana memori dan pheripheral device di shared atau didistribusikan
  • 12.
    Unifor m Memor y Acces s (UMA )  Terlihat bahwa memori dibagisecara merata ke semua prosesor  Semua prosesor mempunyai waktu akses yang sama ke semua word  Setiap prosesor menggunakan private cache  Dan untuk peripheral juga dishare dengan cara yang sama memo ri  UMA cocok untuk general purpose dan aplikasi time sharing oleh multiple user  UMA dapat digunakan untuk meningkatkan ekseskusi dari program tunggal yang besar pada aplikasi time-critical
  • 13.
    No n Unifor m Memor y Acces s (NUMA )  NUMA Multiprocessoradalah sebuah sistem shared memory dimana waktu aksesnya bervariasi ke lokasi memori word
  • 14.
    Shared memory yangsecara fisik didistribusikan ke semua processor disebut lokal memori dan kumpulan dari lokal memori membentuk ruang alamat global yang dapat diakses oleh semua processor NUMA dapat mengakses lokal memori lebih cepat dengan lokal processor, sedangkan akses ke memori yang jauh diberikan ke proc. Lain yang kapasitasnya lebih besar untuk ditambah delay melalui interkoneksi jaringan Disamping distribusi memori, secara umum shared memory dapat ditambahkan ke multiprosessror syste,, dalam hal ini ada tiga pola akses memory, dimana yang tgerdepat adalah akses ke lokal memori, akses ke global memori dan yang paling lambat adalah akses dari memory yang jauh (hierarchical Cluster Model (Chedar System))   
  • 15.
    memory ke Cache Only Memory Acce ss (COMA ) COMAadalah multiprocessor yang hanya menggunakan cache memory COMA dapat ditemukan pada NUMA machines, dimana pendistribusioan main memory dirubah ke cache.   Disini tidak ada hirarki memori pada setiap node computer  Semua cache berasal dari ruang alamat global. Akses ke cache jauh dibantu oleh direktori cache yang didistribusikan. Tergantung kepada interkoneksi jaringan yang digunakan, terkadang direktori digunakan untuk membantu penempatan copian dari blok-blok cache   Penempatan awak data tidak penting karena data akan menempati tempat dimana data tersebut akan digunakan
  • 16.
    Multicomput er  Sistem Multicomputer Multicomputerdapat dianggap berupa suatu komputer NUMA loosely atau cluster yang tightly coupled.   Multicomputer biasanya digunakan ketika diperlukan power komputasi tinggi tetapi lingkungan mempunyai ruang fisik atau tenaga listrik terbatas. Processors have private address space. Interprocess communication via message passing only In clusters, computers are connected via LAN M P M M P Interconnecti on Networ k P M P
  • 17.
    Scalability Issue Major Issu es inMIM D Processor-memory Interconnection Cache Coherence Synchronization Support Scalability Issue 1. 2. 3. 4. Distributed Shared Memory 5.
  • 18.
    Sistem Multicore CPU-CPU Intel dariera Pentium 4 terbaru (Northwood dan Prescott) menerapkan suatu teknologi bernama Hyper-threading yang memungkinkan lebih dari satu thread (biasanya dua) untuk berjalan pada CPU yang sama.  Produk processor yang lebih baru seperti Sun UltraSPARC T1, AMD Athlon 64 X2, AMD Athlon FX, AMD Opteron, Intel Pentium D, Intel Core, Intel Core 2 dan Intel Xeon menyertakan banyak core processor juga untuk meningkatkan jumlah thread yang dapat dieksekusi. 
  • 19.
  • 20.
     Keterangan:  UMA  NUMA COMA : : : Uniform Memory Access Non Uniform Memory Access Cache Only Memory Access  MPP  COW  CC- NUMA  NC- NUMA : : : : Massively Parallel Processor Cluster of Workstations Cache Coherent NUMA Non Cache NUMA
  • 21.
    Terminolo gi  Pengolahan Paralel: Pengolahan informasi yang ditekankan pada manipulasi elemen data yang dimiliki oleh satu atau lebih dari satu proses secara bersamaan dalam rangka menyelesaikan sebuah problem.  Komputer Paralel : Komputer multi-prosesor dengan kemampuan melakukan pengolahan paralel.
  • 22.
    adalah paralel Beberapaantaranya Supercomputer : sebuah general-purpose computer yang mampu me- nyelesaikan problem dengan kecepatan komputasi sangat tinggi. Semua superkomputer kontemporer  adalah komputer paralel. Beberapa di antaranya memiliki prosesor yang sangat kuat dalam jumlah yang relatif sedikit, sementara yang lainnya dibangun oleh mikroprosesor dalam jumlah yang cukup besar. Throughput : banyaknya keluaran yang dihasilkan per unit waktu 
  • 23.
    perawatannya  Semakin banyakprosesor yang digunakan semakin tinggi biaya untuk memperoleh solusi sebuah problem. Hal ini terjadi karena perlu dipertimbangkan biaya pengadaan prosesor dan perawatannya.  Jumlah prosesor yang tergantung dari n , p(n) . n=ukuran problem, dinyatakan sebagai Kadang-kadang jumlah prosesor tidak tergantung pada ukuran problem.
  • 24.
    atau - Contoh SIMD:  Perhatikann bilangan x1,x2,…,xn yang akan dijumlahkan. Dengan menggunakan kompute r n/2 tree-connected SIMD dengan log n level dan daun, dibutuhkan pohon denga n ukura n (n- 1) atau p(n) = n -1 . n = P1  Ilustrasi untuk 8 P2 P3 P4 P5 P6 P7 x1 x2 x3 x4 x5 x6 x7 x8 INPUT
  • 25.
    Jaringan Interkoneksi  Penggunaanjaringan interkoneksi  Hubungkan prosessor ke memori bersama  Hubungkan prosessor satu sama lain  Jenis media interkoneksi  Media bersama  Media yang dialihkan
  • 26.
    nodes (node canbe a processing unit, a memory Network topology:  Static Networks  Dynamic Networks Static networks provide fixed connections between nodes (node can be a processing unit, a memory   module, I/O Module). Links between nodes are unchangeable and cannot be easily reconfigured. Dynamic networks provide reconfigurable connections between nodes. The switch box is the basic component of the dynamic network. The connections between nodes are established by the setting of a set of 
  • 27.
  • 28.
    Topologi Jaringan Interkoneksi MIM D  Adabeberapa topologi dasar:  Ring  Mesh  Tree  Hypercube
  • 29.
     Topologi Ring Apabila komunikasinya dua arah disepanjang ring, maka jarak maksimum antara dengan n simpul adalah n/2 dua simpul pada ring  Paket-paket pesan berukuran tetap digunakan dengan melibatkan alamat tujuan yang diinginkan  Topologi ini cocok untuk jumlah prosesor yang relatif sedikit dengan komunikasi data minimal
  • 30.
     Topologi Mesh Bentuk meshyang paling sederhana adalah array dua dimensi tempat masing-masing simpul saling terhubung dengan keempat tetangganya.  Diameter komunikasi sebuah mesh yang sederhana adalah 2(n-1) Koneksi wraparround pada bagian- bagian ujung akan mengurangi ukuran diameter menjadi 2(n/s) Topologi mesh ini cocok untuk hal-hal yang berkaitan dengan algoritma yang berorientasi matriks   
  • 31.
    bottom : leaf(or  Topologi Tree  Jaringan topologi tree digunakan untuk mendukung algoritma Top node: root Four nodes at the bottom : leaf (or   searching dan sorting. terminal) nodes The rest of the nodes are called intermediate nodes. 
  • 32.
     Topologi Hypercube Topologi ini menggunakan N=2nprosesor yang disusun dalam sebuah kubus berdimensi n, dimana setiap  simpul mempunyai n = log2N link bidirectional dengan simpul yang berdekatan Diameter komunikasi hiperkubus seperti itu sama dengan n 
  • 33.