Rabu, 20 Oktober 2010

mengenaL Format FiLe AUdio



Mendengarkan musik/audio di komputer adalah aktivitas yang sudah biasa dilakukan. Walaupun tampaknya sederhana, namun file-file audio di komputer terdiri dari berbagai macam variasi. Masing-masing file audio mempunyai ciri khas yang berbeda, dan seperti halnya software, format file audio pun mengenal free dan open format, serta propietary format.

Seperti yang kita tahu, suara yang manusia (atau suara yang dihasilkan alat musik) merupakan fenomena fisik yang dihasilkan oleh suatu getaran. Getaran ini menghasilkan tekanan yang berbeda-beda di udara sekitarnya. Pola osilasi yang terjadi di udara tersebut diistilahkan dengan gelombang. Bentuk gelombangnya adalah gelombang analog atau kontinu yang membawa informasi. Dua parameter/ karakteristik terpenting yang dimiliki oleh gelombang analog adalah amplitudo dan frekuensi. Amplitudo merupakan ukuran tinggi rendahnya tegangan dari gelombang analog, sedangkan frekuensi adalah jumlha gelombang analog dalam satu detik.


Gelombang suara ini memiliki lebha dan bukit, satu buah lembah dan bukit akan menghasilkan satu siklus. Siklus ini berlangsung berulang-ulang dan perulangan siklus tiap detiknya disebut frekensi. Satu unit frekuensi dinamakan sebagai Hartz atau Hz. Telinga manusia dapat mendengar bunyi antara 20 Hz hingga 20 kHz (20000). Artinya, bila sebuah benda dapat bergetar dan menghasilkan siklus tiap detiknya sebesar 20 kali, maka telinga dapat menangkap suara dari getaran benda tersebut.

Banyaknya cycle dalam 1 detik inilah yang menentukan “pitch” atau nada dari suatu suara. Contohnya, nada A adalah 440 cycle per detik. Sedangkan keras/pelannya suatu suara diwakili oleh amplitudo.

Dari Analog Menuju Digital

Gelombang suara analog ini tidak dapat langsung direpresentasikan atau direkam pada komputer. Komputer perlu untuk mengukur amplitudo pada satuan waktu tertentu untuk menghasilkan sejumlah angka. Komputer melakukan penyimpanan angka tersebut ke dalam sebuah file sebagai sebagai data yang nantinya digunakan saat file tersebut diakses (di-decode menjadi suara). Tiap satuan pengukuran ini dinamakan “sample”.

Sebagai contoh, suatu CD Audio memiliki sampling rate sebesar 44,1 kHz atau 44100 Hz. Artinya dalam satu detik, sample yang diambil sebanyak 44.100. CD Audio ini merupakan format digital pertama yang dikembangkan oleh Sony pada tahun 1979. Pada tahun-tahun berikutnya, muncul berbagai format dengan media fisik penyimpanan yang berbeda-beda.

Dari format tersebut, bagaimana ukuran file ditentukan? Pada setiap sample diperlukan 2 byte (atau 16-bit data). Pada kualitas musik yang stereo untuk membedakan jalur kanan dan jalur kiri, maka diperlukan tambahan 2 x 2 byte = 4 byte, sehingga untuk dalam 1 detik yang terdiri dari 44.100 sample, besar file hasil penyimpanan adalah 4x44.100 atau 176.400 byte (172 KB). Jika durasi music adalah 4 menit, maka ukuran file sebesar 172 KB*4*60 detik = 41.280 KB (40 MB lebih). Karena begitu besarnya ukuran dari sebuah file audio, maka mulailah dikembangkan teknik kompresi agar ukurannya dapat menjadi lebih kecil. Salah satu teknik komresi adalah dengan mengurangi jumlah sample tiap detiknya. Kompresi ini akan berakibat menurunnya kualitas suara. Sekali kualitas suara diturunkan, maka tidak mungkin untuk dikembalikan ke kualitas suara aslinya, dikarenakan adanya beberapa informasi (sampling rate) yang dihilangkan. Jenis kompresi semacam ini diiistilahkan sebagai lossy compression. Cara kompresi lain yang dikenal adalah lossless compression.

  Jenis-Jenis Format File Audio:

Secara umum, ada 3 kelompok utama format file audio, yaitu :

Format file audio tanpa kompresi, seperti file WAV, AIFF, AU dan raw header-less PCM.
Format file audio dengan kompresi lossy, seperti MP3, Vorbis, Mousepack, AAC, TRIAC, dan lossy Windows Media Audio (WMA)
Format audio dengan kompresi lossless, seperti FLAC, Monkey’s Audio (filename extension APE), WavPack (filename extension WV), Shorten, Tom’s lossless audio compressor (TAK), TTA, ATRAC Advanced Lossless, Apple Lossless, MPEG-4 SLS, MPEG-4 ALS, MPEG-4 DST, Windows Media Audio Lossless (WMA Lossless).
Dari format-format tersebut, terbagi menjadi 3 bagian, yaitu format yang free dan open (seperti wav, ogg, mpc, flac, aiff, raw, au, dan midi), free (gsm, dct, vox, aac, mp4, dan mmf), serta propeietary (mp3, wma, atrac, ra, ram, dss, msv, dvf, m4p, 3gp, amr, dan awb).




A. Format CD

Ekstensi : cda

File dengan ekstensi .cda merupakan representasi dari track CD-audio. File dengan format .cda dapat langsung dijalankan melalui CD-ROM, sementara filenya sendiri tidak mempunyai informasi kode modulasi apapun sehingga jika dikopi ke dalam harddisk, file tersebut menjadi tidak dapat di-play. Pada November 1984, dua tahun setelah CD diproduksi secara missal, Sony mengeluarkan Discman sebagai media pemutar portable. Agar dapat mengambil/mengkopi file audio dari CD-Audio, dibutuhkan software khusus atau ripping untuk mengubah dari format .cda menjadi format lain yang dapat disimpan di computer.

B. Format Advanced Audio Coding (AAC)

Ekstensi : .m4a, .m4b, .m4p, .m4v, .m4r, .3gp, .mp4, .aac

AAC merupaka format audio menggunakan lossy compression (data hasil kompresi tidak bisa dikembalikan lagi ke data sebelum dikompres secara sempurna, karena ada data yang hilang).

Cara kerja AAC :
  • Bagian-bagian sinyal yang tidak relevan dibuang
  • Menghilangkan bagian-bagian sinyal yang redundan
  • Dilakukan proses MDCT (Modified Discret Cosine Transform) berdasarkan tingkat kompleksitas sinyal
  • Adanya penambahan Internal Error Connection
  • Kemudian sinyal disimpan atau dipancarkan
Saat ini, AAC merupakan standar format untuk telepon selular seperti Apple’s iPhone, Sony Ericsson, N-series, dan model S40 dari Nokia, serta telepon sel berbasis Android. Juga perangkat portable seperti iPod, iTunes, Sony Playstation Portable, generasi terbaru dari Walkman Sony, semua jenis telepon Nintendo’s Wii, Nintendo DSi, mendukung format AAC. Kepopuleran format ini dikarenakan audio codec-nya yang menyempurnakan MP3, seperti pada jangkauan sample rate yang lebih banyak (8 Hz-96 kHz), memiliki 48 channerl, dan suara yang lebih bagus untuk bit yang lebih rendah (di bawah 16 Hz).

Portable player untuk format file AAC adalah Archos, Creative Zen Portable, Microsoft Zune, SanDisk Sansa, Sony Playstation Portable (PSP), Sony Walkman, Nintendo DSi, dan Cowon.

C. Format Waveform Audio (WAV)

Ekstensi : .wav atau .wv

WAV merupakan format file audio yang dikembangkan oleh Microsoft dan IBM sebagai standar untuk menyimpan file audio pada PC, dengan menggunakan coding PCM (Pulse Code Modulation). Tidak seperti AAV, file WAV adalah file audio yang tidak terkompres sehingga seluruh sampel audio disimpan semuanya di media penyimpanan dalam bentuk digital. Karena ukurannya yang besar, file WAV jarang digunakan sebagai file audio di Internet.

D. Format Audio Interchange File Format (AIFF)

Ekstensi : .aiff, .aif, .aifc


File AIFF merupakan format file audio standar yang digunakan untuk menyimpan data suara untuk PC dan perangkat audio elektronik lainnya, yang dikembangkan oleh Apple pada tahun 1988. Standar dari file AIFF adalah uncomressed code pulse-modulation (PCM), namun juga ada varian terkompresi yang dikenal sebagai AIFF AIFF-C atau aifc, dengan berbagai kompresi codec.

E. Format MPEG Audio Layer 3 (MP3)


Ekstensi : .mp3

Pada awalnya, format MP3 ini dikembangkan oleh seorang Jerman bernama Karlheinz Brandenburg, memakai pengodean Pulse Code Modulation (PCM). Prinsip yang dipergunakan oleh MP3 adalah mengurangi jumlah bit yang diperlukan dengan menggunakan model psychoacoustic untuk menghilangkan komponen-komponen suara yang tidak terdengar oleh manusia – sehingga adapat digolongkan file audio dengan kompresi lossy.

Pada tahun 1991, file MP3 distandarisasi dan tahun 1994 hingga akhir tahun 2000, popularitas dari MP3 semakin meningkat dengan semakin mudahnya akses Internet. Munculnya software untuk menjalankan file MP3 seperti Winamp di tahun 1997 yang dikembangkan oleh Nullsoft, dan player console untuk Linux, mp123, juga membuat file MP3 semakin digemari.

Beberapa batasan dari file MP3 ini adalah :
  • Bit rate terbatas, maksimum 320 kbit/s (beberapa encoder dapat menghasilkan bit rate yang lebih tinggi, tetapi sangat sedikit dukungan untuk mp3-mp3 tersebut yang memiliki bit rate tinggi).
  • Resolusi waktu yang digunakan mp3 dapat menjadi terlalu rendah untuk sinyal-sinyal suara yang sangat transient, sehingga dapat menyebabkan noise.
  • Resolusi frekuensi terbatasi oleh ukuran window yang panjang kecil, mengurangi efisiensi coding.
  • Tidak ada scale factor band untuk frekuensi di atas 15,5 atau 15,8 kHz.
  • Mode jointstereo dilakukan pada basis per frame.
  • Delay bagi encoder/decoder tidak didefinisikan, sehingga tidak ada dorongan untuk gapless playback (pemutaran audio tanpa gap). Tetapi, beberapa encoder seperti LAME, dapat menambahkan metadata tambahan yang memberikan informasi kepada MP3 player untuk mengatasi hal ini.
F. Format MIDI

Ekstensi : .mid


Merupakan standar yang dibuat oleh perusahaan alat-alat music elektronik berupa serangkaian spesifikasi agar berbagai instrument dapat berkomunikasi.
Dengan menggunakan format MIDI, perangkat elektronik seperti keyboard dan computer dapat melakukan sinkronisasi satu sama lain.
Interface MIDI terdiri dari 2 komponen yaitu :
  • Perangkat keras, merupakan hardware yang terhubung dengan peralatan (keyboar/computer)
  • Data format yang mengandung pengkodean informasi (spesifikasi instrument, awal/akhir nada, frekuensi dan volume suara).
G. Format Monkey’s Audio

Ekstensi : .ape, .api

Merupakan format file audio dengan kompresi lossless sehingga tidak mengurangi kualitas suara. Umumnya, sebuah file audio dengan format Monkey’s Audio mempunyai ukuran lebih besar 3-5 kali dibandingkan dengan format MP3 (pada bitrate 192 Kb/s). Secara resmi, Monkey Audio hanya mendukung platform Windows, seperti yang ditulis di website resminya. Pada masa-masa mendatang, Monkey Audio akan mendukung untuk platform Linux dan Mac OS. Player yang dapat digunakan untuk menjalankan file format ini adalah Monkey’s Audio.