Có hai cách để thực hiện xử lý song song: cách 1 là sử dụng phần cứng (bộ xử lý superscalar) để tự động xác định các thao tác có thể xử lý đồng thời, và cách 2 là dựa vào phần mềm (trình biên dịch VLIW) để phân tích và lên lịch các thao tác đó. VLIW processors có cấu trúc gồm 5 khối và lợi thế là đơn giản hóa phần cứng, giảm năng lượng tiêu thụ, nhưng cần lượng lớn thanh ghi và băng thông. Cả hai phương pháp đều có ưu điểm và khuyết điểm riêng, ảnh hưởng đến thiết kế và hiệu suất của bộ xử lý.