Search for collections on PNUP Repository

Analisis Replikasi Dalam Hadoop Distributed File System (Hdfs) Pada Teknologi Big Data

Wardihan, Asriyani (2019) Analisis Replikasi Dalam Hadoop Distributed File System (Hdfs) Pada Teknologi Big Data. Diploma thesis, Politeknik Negeri Ujung Pandang.

[thumbnail of Skripsi] Text (Skripsi)
ANALISIS REPLIKASI DALAM HADOOP DISTRIBUTED FILE .pdf - Published Version
Restricted to Registered users only

Download (3MB)

Abstract

Teknologi big data merupakan suatu manajemen aset informasi dengan kecepatan dan volume tinggi serta kompleks. Apache Hadoop sebagai aplikasi pada teknologi big data dapat mengolah dan memproses data yang besar secara paralel. Salah satu bagian inti dalam Hadoop yaitu Hadoop Distributed File System (HDFS) sebagai sistem penyimpanan data terdistribusi. Dalam mendistribusikan data, HDFS memiliki mekanisme replikasi terhadap datanode yang aktif.
Penelitian dilakukan analisis mekanisme replikasi file pada HDFS dalam sebuah cluster dengan menggunakan satu mesin yang berperan sebagai master (namenode) dan empat mesin yang berperan sebagai slave (datanode) dengan faktor replikasi 3. Dalam penelitian ini, digunakan file video berukuran 5 GB yang didistribusikan ke setiap datanode yang aktif dengan jumlah block sebanyak 40, dimana masing-masing block memiliki 3 replika. Jika kondisi 4 dan 3 datanode yang aktif, maka file didistribusikan ke setiap datanode aktif dan memiliki 3 replika block. Sedangkan jika untuk kondisi 2 datanode yang tidak aktif dan 2 datanode yang aktif maka akan terjadi missing replica sebanyak 33,33% namun masih tetap memiliki 2 replika block, serta jika untuk 3 datanode yang aktif dan 1 datanode yang aktif maka akan terjadi missing replica 66,66% namun masih tetap memiliki 1 replika block. Missing replica terjadi saat datanode tidak aktif, namun masih terdapat ketersediaan replica block yang menyebabkan performansi fault tolerant pada Hadoop dimana datanode yang tidak berfungsi tidak akan mempengaruhi kestabilan sistem sehingga sistem tetap berfungsi secara normal. Adapun jumlah datanode dalam replikasi akan mempengaruhi kecepatan eksekusi proses penulisan file pada HDFS. Kecepatan eksekusi jika file video 5 GB pada 1 datanode yang aktif menunjukkan 2.599 s, kemudian mengalami penurunan kecepatan sebesar 0,03% pada 2 datanode yang aktif menjadi 2.603 s, dan 1,02% pada 3 datanode yang aktif menjadi 2.712 s serta 2,1% pada 4 datanode yang aktif menjadi 2.830 s. Peningkatan jumlah datanode yang digunakan dalam lingkungan virtual machine menyebabkan kecepatan eksekusi penulisan file mengalami penurunan.
Hasil dari analisis penelitian ini telah diimplementasikan menjadi suatu modul praktikum yang terbagi dalam 2 (dua) jobsheet. Modul ini dapat digunakan dengan baik untuk membangun dan memahami tentang sistem HDFS.

Item Type: Thesis (Diploma)
Subjects: Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Q Science > QA Mathematics > QA76 Computer software
Divisions: Jurusan Teknik Elektro > D4 Teknik Komputer dan Jaringan
Depositing User: Unnamed user with username 197103102001121001
Date Deposited: 03 Aug 2023 00:52
Last Modified: 03 Aug 2023 00:52
URI: https://repository.poliupg.ac.id/id/eprint/4663

Actions (login required)

View Item
View Item