Algoritma Pemampatan: Di Sebalik Tabir Dunia DIgital | FAKULTI SAINS
» ARTIKEL » Algoritma Pemampatan: Di Sebalik Tabir Dunia DIgital

Algoritma Pemampatan: Di Sebalik Tabir Dunia DIgital

Pernahkah anda menonton rancangan TV, Silicon Valley? Ia adalah sebuah siri komedi yang meneroka cabaran yang perlu ditempuhi oleh sekumpulan pengaturcara komputer yang berlatar belakangkan Silicon Valley di California, Amerika Syarikat. Premis rancangan itu secara lucu memaparkan bagaimana watak utamanya membangunkan algoritma pemampatan data yang mencetuskan pertempuran sengit untuk mengawal harta intelek algoritma tersebut dalam dunia startup yang kompetitif. Tetapi, apakah itu algoritma pemampatan data yang menjadi tema utama rancangan TV Hollywood ini?

Algoritma pemampatan merujuk kepada teknik untuk mengurangkan saiz data dengan kaedah pengekodan yang lebih cekap. Objektif utamanya adalah untuk mewakili data asal dengan menggunakan bilangan bit digital yang dikurangkan, seterusnya membantu menjimatkan ruang storan dan meningkatkan kelajuan penghantaran data. Algoritma pemampatan secara amnya boleh dikelaskan kepada dua kategori: lossless dan lossy.

Algoritma pemampatan lossless ialah teknik yang meminimumkan saiz data tanpa kehilangan maklumat. Ia memastikan data asal boleh dibina semula dengan tepat daripada data yang telah dimampatkan. Algoritma ini berfungsi dengan mengesan dan mengeluarkan lebihan pola statistik yang terdapat dalam data asal. Pemampatan tanpa kehilangan maklumat (lossless) ini adalah penting dalam keadaan di mana integriti data sentiasa diutamakan seperti dalam dokumen teks, fail boleh laku serta imej dan audio berketepatan tinggi. Fail atau data dengan format ZIP, PNG dan FLAC menggunakan algoritma kategori ini bagi mengekalkan kualiti asal data sambil mencapai pengurangan saiz.

Dalam hal yang lain, algoritma pemampatan lossy ialah teknik yang mengurangkan saiz data dengan membuang secara kekal maklumat tertentu, yang membawa kepada pengurangan kualiti yang selalunya tidak dapat disedari oleh pancaindera manusia. Algoritma ini beroperasi dengan menghapuskan data yang kurang kritikal, seperti variasi warna kecil di dalam imej atau frekuensi bunyi yang tidak dapat didengari di dalam audio. Ia dapat mengurangkan saiz fail secara signifikan. Mampatan lossy biasanya digunakan dalam konteks multimedia di mana saiz fail yang lebih kecil diutamakan daripada ketepatan yang sempurna, menjadikannya sesuai untuk fail imej, audio dan video yang direka bentuk untuk kegunaan dan penstriman dalam talian. Contoh terkenal format mampatan lossy termasuk JPEG untuk imej, MP3 untuk audio dan MPEG untuk video.

 

Aspek

Mampatan lossless

Mampatan Lossy

Definisi

Mengurangkan saiz fail tanpa kehilangan sebarang data.

Mengurangkan saiz fail dengan mengalih keluar beberapa data secara kekal.

Pembinaan Semula Data

Data asal boleh dibina semula dengan sempurna.

Data asal tidak boleh dibina semula dengan sempurna.

Teknik Biasa

Pengekodan Huffman, LZW, RLE, DEFLATE

JPEG, MP3, MPEG, AAC

Aplikasi

Fail teks, perisian, sandaran, imej PNG, fail audio FLAC

Imej, audio, video untuk kegunaan web, imej JPEG, audio MP3

Kelebihan

Tiada kehilangan kualiti, sesuai untuk data kritikal

Saiz fail yang jauh lebih kecil, cekap untuk kegunaan web

Keburukan

Secara amnya saiz fail yang lebih besar berbanding dengan pemampatan lossy

Kemerosotan kualiti, terutamanya pada kadar mampatan yang lebih tinggi

Contoh

ZIP, PNG, FLAC

JPEG, MP3, MPEG

Jadual 1: Perbezaan antara algoritma pemampatan lossless dan  algoritma pemampatan lossy

 

Konsep Matematik Di Sebalik Algoritma Mampatan

Algoritma pemampatan menggunakan pelbagai prinsip matematik untuk meminimumkan saiz data yang diubahsuai di samping mengekalkan sebanyak mungkin kandungan dari sumber asal. Entropi dan teori maklumat, adalah dua konsep penting dalam mengenal pasti kaedah pengekodan yang paling berkesan. Entropi mengukur tahap ketidakpastian atau rawak dalam set data. Sebagai contoh, teknik pengekodan Huffman memanfaatkan prinsip ini dengan memberikan kod yang lebih pendek kepada simbol yang lebih kerap berlaku dalam suatu untaian kod. Ia sekaligus mengurangkan jumlah data keseluruhan. Teorem Pengekodan Sumber Shannon pula menetapkan sempadan teoretikal bagi pemampatan optimum, dengan mengenakan syarat tiada teknik pemampatan boleh melebihi entropi set data.

Satu lagi prinsip matematik penting melibatkan penggunaan transformasi, termasuk Transformasi Kosinus Diskret (DCT) dan Transformasi Fourier, yang penting dalam kaedah mampatan lossy. Transformasi ini memudahkan penukaran data daripada domain masa atau ruang kepada domain frekuensi, membolehkan pengasingan data kepada komponen yang boleh dikodkan dengan lebih cekap. Sebagai contoh, teknik pemampatan imej JPEG, menggunakan DCT pada blok piksel yang kecil kemudiannya mengubah data imej kepada pekali frekuensi. Proses ini membolehkan penghapusan atau pengkuantuman komponen berfrekuensi tinggi yang kurang ketara perbezaannya secara visual. Ia membawa kepada pengurangan besar dalam saiz fail, dan dalam masa yang sama, mengekalkan kemiripan visual yang boleh diterima oleh pancaindera manusia.

Kebarangkalian dan statistik juga menjadi asas strategi pemampatan, terutamanya dalam membina model pengagihan data. Teknik seperti Pengekodan Aritmetik menggunakan taburan kebarangkalian untuk mewakili keseluruhan mesej sebagai satu nilai berangka. Ia mempertingkatkan proses pengekodan berdasarkan kemungkinan pelbagai simbol. Pendekatan berasaskan kamus seperti LZ77 dan LZW pula memanfaatkan konsep menggantikan urutan berulang dengan rujukan yang lebih pendek kepada satu sifat data. Dengan itu, ia berupaya meminimumkan lebihan data yang tidak signifikan. Kaedah ini terbukti amat berkesan apabila corak berulang dengan kerap dalam data, membolehkan pemampatan yang banyak tanpa kehilangan maklumat.

Kesimpulannya, algoritma pemampatan adalah asas kepada penyimpanan, penghantaran dan pemprosesan data yang cekap dalam dunia digital yang semakin meluas penggunaanya. Ia mengurangkan saiz fail tanpa menghilangkan maklumat yang ketara, membolehkan kita menyimpan lebih banyak data dalam ruang terhad, mempercepatkan kadar pemindahan data dan mengurangkan kos jalur lebar dan storan. Daripada penstriman video berkualiti tinggi kepada pengaksesan dalam laman sesawang yang pantas serta penghantaran data yang selamat melalui rangkaian, algoritma pemampatan memainkan peranan penting dalam memastikan sejumlah besar data yang dijana setiap hari dapat dikendalikan dengan berkesan. Memandangkan data terus berkembang dengan pesat, kepentingan membangunkan dan mengoptimumkan algoritma pemampatan hanya akan meningkat, memacu inovasi dan menyokong infrastruktur masa depan digital.

 

Ditulis oleh:

 
Dr. Amir Hamzah Abd Ghafar
Jabatan Matematik dan Statistik
Fakulti Sains, Universiti Putra Malaysia
Kepakaran: Kriptografi Bermatematik, Teori Nombor Berkomputasi 
Email: amir_hamzah@upm.edu.my

Tarikh Input: 04/09/2024 | Kemaskini: 05/09/2024 | amir_hamzah

PERKONGSIAN MEDIA

FAKULTI SAINS
Universiti Putra Malaysia
43400 UPM Serdang
Selangor Darul Ehsan
0397696601/6602/6603
TIADA
X, (08:55:11pm-09:00:11pm, 12 Jun 2026)   [*LIVETIMESTAMP*]