IBM BlueGene/L Super Komputer



Faradika, Ade Iswara, Markus Bangun - Azwar Anas


Universitas Putra Indonesia “YPTK” Padang
Jl. Raya Lubuk Begalung, Padang, SumBar, Indonesia

Abstrak
BlueGene/L merupakan paralel super komputer yang dibuat IBM berdasarkan sistem on-chip yang dibangun dengan skala dual-prosesor dengan 65,536 node. Kinerja puncak dapat mencapai 360 teraflops. Dalam tulisan ini menggambarkan arsitektur yang dihasilkan dengan pendekatan berbasis aplikasi, daya yang rendah, dan desain. Fitur yang dikenalkan dalam tulisan ini mencakup komponen, lima jaringan BlueGene/L, inti Power PC 440, dan distribusi memori on-chip dan off-chip, desain dan kehandalan, dan memperkecil kesalahan.


Latar Belakang

Perusahaan IBM beberapa tahun lalu sudah mempunyai rencana untuk membangun sebuah super komputer berdasarkan skala petaflops dengan tujuan untuk digunakan dalam dibidang ilmu pengetahuan. Hal ini diumumkan oleh IBM pada bulan Desember 1999 yang ditandai dengan dilahirkannya dengan generasi awal dengan nama BlueGene/L [1].

Secara umum, BlueGene/L dibuat berbasiskan prosesor PowerPC yang mendukung ukuran memory yang lebih besar dengan standar lingkungan yang sama dengan penambahan dan modifikasi yang cukup banyak dari standar sistem PowerPC biasanya [1].

Pembuatan BlueGene/L merupakan kerjasama antara IBM dengan Lawrence Livermore National Laboratory. Proyek ini juga akan menandingi super komputer yang ada sebelumnya yaitu Earth Simulator yang dibuat oleh NEC di Yokohama, Jepang [2].

Pada tanggal 29 September 203 walaupun pemasangan BlueGene/L belum selesai, namun kecepatan prototipenya sudah mencapai 36,01 teraflops dan sudah melampaui Earth Simulator dengan kecepatan 35,86 teraflops [2]. Tak lama setelah itu, kecepatan BlueGene/L telah mencapai 70,72 teraflops [2].

Pada tanggal 24 Maret 2005, Departemen Energi Amerika Serikat membeli super komputer BlueGene/L dengan kecepatan 135,5 teraflops [2] itupun masih setengah pengerjaan untuk mencapai hasil akhir.

Sistem BlueGene/L dibuat dengan menggunakan jumlah node (periperal yang terhubung/simpul) yang banyak dengan clock rate yang sederhana dengan konsumsi daya yang serendah mungkin sehingga biaya yang ditimbulkan juga dapat dikurangi. BlueGene/L menggunakan prosesor PowerPC yang tertanam dalam perangkat CMOS, DRAM, dengan sistem on-chip yang memungkinkan semua fungsi sistem dimasukan ke dalam prosesor pengolahan, prosesor komunikasi, 3 level cache, dan hubungan jaringan dengan kecepatan tinggi [1], dan dengan dual-prosesor, dual-prosesor salah satunya didesain untuk proses komputasi dan yang lainnya untuk melakukan komunikasi agar dapat melakukan komunikasi dengan dengan kecepatan yang lebih cepat [2]. Kecepatan mencapai 360 teraflops hanya bisa dicapai jika menggunakan ke dua prosesor, jika hanya setengah maka kecepatannya hanya mencapai 180 teraflops [2].
Komponen Sistem

BlueGene/L merupakan salah satu super komputer untuk skala besar. Setelah selesai, sistem ini mempunyai 65.536 node yang terdapat dalam 130 nm IBM CMOS 8SFG [1].

Masing-masing node sangat sederhana hanya mempunyai dua prosesor dengan memori bertipe cip SDRAM [1]. Masing-masing node juga dibuat dengan 18 buah cip SDRAM per sirkuitnya. Dua node terdapat dalam satu kartu pengolahan yang masing-masingnya memiliki dua prosesor. Ada 16 node dalam satu papan node dan 16 buah papan node per bagiannya [2] seperti ditunjukan pada gambar 1.


Gambar 1. Sebagian komponen sistem BG/L [1]

Berdasarkan gambar, secara logikanya, jika rak ditambah maka sistem akan mempunyai kecepatan yang lebih tinggi lagi. Setiap prosesor dapat melakuakan sekitar 4 operasi persiklusnya dan mencapai kinerja kecepatan 1,4 teraflops untuk setiap setengah bagiannya. Secara teorinya, setiap kabinet mampu memberikan kinerja kecepatan mencapai 2,8 terflops walaupun dalam kenyataanya tidak sepenuhnya tercapai. Penambahan jumlah rak yang dilakukuan menyebabkan keseluruhan sistem dapat mencapai kinerja kecepatan mencapai 135,5 teraflops [2] yang jauh lebih besar dari yang sebelumnya dan mampu melampai kinerja super komputer sebelumnya yaitu Earth Simulator.

Selain mempunyai sual prosesor sebanyak 65.536 untuk pengolahan, BlueGene/L juga mempunyai prosesor perangkat keras sebanyak 1024 atau dalam setiap satu titik mempunyai 64 titik simpul pengolahan. Bagian simpul perangkat (I/O) mempunyai sirkuit yang hampir sama dengan simpul pengolahan, tetapi dengan tambahan memori eksternal yang lebih besar. Masing-masing simpul pengolahan menangani tugasnya untuk fungsi komunikasi dasar dengan file sistem dan fungsi untuk kinerja tinggi bagi yang membutuhkan.

Masing-masing simpul pengolahan mempunyai sebuah sistem operasi sederhana yang mengatur fungsi dasar perangkat masukan dan keluaran dan semua fungsi untuk kinerja paling tinggi [1].

Bagian penting lainnya dari sistem BlueGene/L adalah kemampuannya untuk melayani beberapa pengguna dalam waktu yang bersamaan. Hal ini bisa terjadi dengan membagi setiap bagiannya sehingga setiap pengguna mempunyai satu set khusus dari setiap simpul untuk aplikasi pengguna termasuk sumber daya untuk jaringan. Pembagian partisi ini diatur melalui program sesuai dengan kebutuhan aplikasi pengguna. Bagian partisi inilah yang dialokasikan sistem.

Hubungan Cip Link

Setiap batas bagian, semua jaringan BG/L akan melalui cip penghubung. Sama dengan cip pengolahan BlueGene/L (BLC cip), cip ini juga merupakan cip dalam bentuk sirkut berteknologi Cu-11 IBM [1]. Untuk fungsi jaringan dan fungsi umum lainnya, kedua cip ini menggunakan fungsi logika yang sama. Cip link ini mempunya dua fungis yaitu:
1.      Menghubungkan sinyal antara setengah bagian dengan setengah bagiannya dalam satu tempat, mengembalikan kecepatan sinyal ke kecepatan yang tinggi. [2]
2.      Mengarahkan sinyal-sinyal ke port yang berbeda. [2]

Cip link ini merupakan fitur yang handal dalam sistem BG/L yang akan menjalankan kembali konfigurasi ulang sistem jika terjadi kesalahan dalam perangkat keras sehingga setiap simpul yang rusak yang terdapat dalam setengah bagiannya tidak digunakan pengguna. Pengaturan ulang ini dilakukan dengan mengalihkan koneksi port dalam link penghubung. Ini akan membuat aplikasi pengguna melakukan pemulaian kembali ke konfigurasi awal. Kemampuan dari cip penghubung ini untuk menghubungkan setiap setengah bagiannya membuat pengguna akan lebih mudah dalam melakukan pengaturan.

Jaringan BlueGene/L

Komputer ini menggunakan lima jaringan penghubung untuk perangkat keras masukan dan keluaran dan berbagai jenis sietem komunikasi.

Hal ini akan menghubungkan 5 jaringan yang berbeda:
1.      Sebuah jaringan torus 3D untuk penyampaian pesan pada setiap titik simpul.
2.      Kombinasi secara keseluruhan untuk operasi yang menghubungkan semua titip simpul.
3.      Penghubung global dan gangguan jaringan.
4.      Gigabit Ethernet sebagai jaringan yang digunakan untuk mesin kontrol.
5.      Jaringan Ethernet tambahan untuk untuk melakukan koneksi ke sistem lainnya. [2]

Gigabit Ethernet digunakan untuk untuk memberikan dukungan terhadap pengaksesan file sistem, melakukan diagnosa, proses debug, dan beberapa aspek inisialisasi. [1]

Jaringan Torus Tiga-Dimensi

Jaringan torus merupakan jaringan yang digunakan untuk penyampaian  pesan aplikasi [1]. Torus merupakan salah satu jaringan terpenting selain aliran jaringan. Jaringan ini mendukung latenci yang kecil dan bandwidth yang tinggi dalam penyampaian pesan dari suatu titik ke titik lainnya. Melalui jaringan ini setiap simpul dapat berkomunikasi dengan simpul lain tanpa ada pembatas. [1]

Pesan yang dilewatkan akan dipecah menjadi paket yang berbeda dengan ukuran antara 32 bite sampai 256 bite secara bertahap. [2]

Antara setengah bagian, link melayani dua tujuan:
1.      Memperkuat sinyal antara tiap setengah bagian.
2.      Mengarahkan sinyal ke port yang berbeda. [2]

Fitur-Fitur Node (Titik Simpul)

FPU (Floating Point Unit) merupakan unit eksekusi khusus yang melakukan operasi pada setiap bilangan yang bukan bilangan bulat. BlueGene/L mempunyai FPU ganda dalam arsitekturnya yang didapat dengan penggabungan FPU dengan FPU lainnya. FPU ini dibagi dua yaitu FPU primer dan FPU sekunder. FPU sekunder merukan salinan dari FPU primer (FPU utama) namun mempunyai instruksi sendiri yang dapat melakukan operasi penambahan secara paralel, pengalian, dan operasi selain aritmatika komplek.

Setiap simpul atau node dalam BG/L memiliki dua prosesor PowerPC 440 dengan dengan targer kecepatan 700 MHz. Prosesor mempunyai dua mode eksekusi yaitu:
1.      Mode standar yaitu mode komunikasi yang membuat satu prosesor melakukan semua komunikasi sementara prosesor lainnya melakukan proses pengolahan umum.
2.      Mode virtual, setiap prosesor mendapatkan sumber daya yang dibagi untuk penggunaan jaringan dan memori. [2]

Sistem Operasi

Simpul pengolahan menggunakan sistem operasi Linux, dan simpul perangkat masukan keluaran menggunakan sistem berdasarkan sistem Linux.

Simpul perangkat masukan dan keluaran menyediakan antarmuka fisik ke sistem file dan berbagai proses yang memberatkan simpul penghitung sesuai filosofi BG/L yaitu mendistribusikan instruksi ke banyak prosesor. [2]

Sistem Memori

Setiap inti prosesor memiliki 16 bite untuk membaca dan menulis bus data dan 16 instruksi independen. Garis lebar L2 dan L3 adalah 128 byte. L2 mendeteksi pola akses data secara otomatis dan dan secara simultan. L3 terdiri dari DRAM tertanam yang data diatur dan dapat ditambah untuk meningkatkan efisiensi sistem secara keseluruhan [1]

Model Pemograman

Karena BlueGene/L dijalankan secara paralel maka implementasi pesan-pesan yang disampaikan untuk komunikasi lebih efektif.

Aplikasi

Tidak semua aplikasi dapat dijalankan karena sistem BG/L yang hanya untuk pengolahan umum seperti aplikasi ilmiah.

Arsitektur Blue Gene/L
Jika versi terakhir BlueGene/L selesai, superkomputer ini akan menggunakan 65.536 prosesor dan memiliki kemampuan yang sangat dasyat hingga 360 teraflop. Kemampuan ini belum pernah dimiliki oleh superkomputer di era terdahulu. Sebelumnya, Earth Simulator hanya terdiri dari 5.120 prosesor, sedangkan Columbia terdiri dari 10.240 prosesor.
Nick Donofrio, Presiden Direktur Bidang Teknologi dan Manufaktur IBM hakul yakin, pada 2006 BlueGene/L akan mampu menghitung hingga petaflop. Artinya, komputer itu akan mampu mengerjakan 1.000 triliun operasi dalam satu detik.

Bentuk Blue Gene/L

Kesimpulan

Super komputer BlueGene/L atau BG/L dirancang untuk meningkatkat kinerja dari super komputer yang ada sebelumnya, kinerja yang lebih luas dan dibuat dengan kinerja paralel, serta dibuat dengan biaya yang lebih rendah dari pada super komputer lainnya dalam hal tempat, pendinginan, pelayanan, dan pengembangan aplikasi [1]. BG/L dapat menjalankan aplikasi tertentu secara lebih cepat.

Teknologi ini memberikan dua manfaat utama yaitu kinerja yang lebih tinggi dan penggunaan jaringan yang ditimbulkan dari DDR cip memori eksternal. Ke dua, memiliki kinerja yang lebih baik, lebih efisien dengan mempunyai banyak core untuk kinerja tinggi dengan prosesor inti PowerPC 440. [1]

Daftar Pustaka
[1]        The BlueGene/L Team. “An Overview of the BlueGene/L Supercomputer”, U.S.
[2]        David Gregg, Jake Johnson. “The BlueGene/L Supercomputer: Architecture and Implementation”.


wdcfawqafwef