Merekam Audio dari Pengguna

Paul Kinlan

Banyak browser kini memiliki kemampuan untuk mengakses input video dan audio dari pengguna. Namun, bergantung pada browser, pengalaman ini mungkin berupa pengalaman inline dan dinamis penuh, atau dapat didelegasikan ke aplikasi lain di perangkat pengguna.

Mulai dengan sederhana dan bertahap

Cara termudah untuk melakukannya adalah dengan meminta file yang telah direkam sebelumnya kepada pengguna. Lakukan ini dengan membuat elemen input file sederhana dan menambahkan filter accept yang menunjukkan bahwa kita hanya dapat menerima file audio, dan atribut capture yang menunjukkan bahwa kita ingin mendapatkannya langsung dari mikrofon.

<input type="file" accept="audio/*" capture />

Metode ini berfungsi di semua platform. Di desktop, pengguna akan diminta untuk mengupload file dari sistem file (mengabaikan atribut capture). Di Safari di iOS, tindakan ini akan membuka aplikasi mikrofon, yang memungkinkan Anda merekam audio, lalu mengirimnya kembali ke halaman web. Di Android, tindakan ini akan memberi pengguna pilihan aplikasi yang akan digunakan untuk merekam audio sebelum mengirimnya kembali ke halaman web.

Setelah pengguna selesai merekam dan kembali ke situs, Anda harus mendapatkan data file. Anda bisa mendapatkan akses cepat dengan melampirkan peristiwa onchange ke elemen input, lalu membaca properti files objek peristiwa.

<input type="file" accept="audio/*" capture id="recorder" />
<audio id="player" controls></audio>
  <script>
    const recorder = document.getElementById('recorder');
    const player = document.getElementById('player');

    recorder.addEventListener('change', function (e) {
      const file = e.target.files[0];
      const url = URL.createObjectURL(file);
      // Do something with the audio file.
      player.src = url;
    });
  </script>
</audio>

Setelah memiliki akses ke file, Anda dapat melakukan apa pun yang Anda inginkan dengan file tersebut. Misalnya, Anda dapat:

Lampirkan langsung ke elemen <audio> agar Anda dapat memutarnya
Mendownloadnya ke perangkat pengguna
Upload ke server dengan melampirkan ke XMLHttpRequest
Teruskan melalui Web Audio API dan terapkan filter ke dalamnya

Meskipun metode elemen input untuk mendapatkan akses ke data audio sangat umum, ini adalah opsi yang paling tidak menarik. Kami sangat ingin mendapatkan akses ke mikrofon dan memberikan pengalaman yang baik langsung di halaman.

Mengakses mikrofon secara interaktif

Browser modern dapat memiliki saluran langsung ke mikrofon yang memungkinkan kita membuat pengalaman yang terintegrasi sepenuhnya dengan halaman web dan pengguna tidak akan pernah keluar dari browser.

Mendapatkan akses ke mikrofon

Kita dapat langsung mengakses Mikrofon menggunakan API dalam spesifikasi WebRTC yang disebut getUserMedia(). getUserMedia() akan meminta akses ke mikrofon dan kamera yang terhubung.

Jika berhasil, API akan menampilkan Stream yang akan berisi data dari kamera atau mikrofon, lalu kita dapat melampirkan Stream ke elemen <audio>, melampirkan Stream ke streaming WebRTC, melampirkan Stream ke AudioContext Audio Web, atau menyimpannya menggunakan MediaRecorder API.

Untuk mendapatkan data dari mikrofon, kita cukup menetapkan audio: true dalam objek batasan yang diteruskan ke getUserMedia() API.

<audio id="player" controls></audio>
<script>
  const player = document.getElementById('player');

  const handleSuccess = function (stream) {
    if (window.URL) {
      player.srcObject = stream;
    } else {
      player.src = stream;
    }
  };

  navigator.mediaDevices
    .getUserMedia({audio: true, video: false})
    .then(handleSuccess);
</script>

Jika ingin memilih mikrofon tertentu, Anda dapat menghitung mikrofon yang tersedia terlebih dahulu.

navigator.mediaDevices.enumerateDevices().then((devices) => {
  devices = devices.filter((d) => d.kind === 'audioinput');
});

Kemudian, Anda dapat meneruskan deviceId yang ingin digunakan saat memanggil getUserMedia.

navigator.mediaDevices.getUserMedia({
  audio: {
    deviceId: devices[0].deviceId,
  },
});

Hal ini tidak terlalu berguna. Yang dapat kita lakukan hanyalah mengambil data audio dan memutarnya.

Mengakses data mentah dari mikrofon

Untuk mengakses data mentah dari mikrofon, kita harus mengambil streaming yang dibuat oleh getUserMedia(), lalu menggunakan Web Audio API untuk memproses data. Web Audio API adalah API sederhana yang mengambil sumber input dan menghubungkan sumber tersebut ke node yang dapat memproses data audio (menyesuaikan Gain, dll.) dan pada akhirnya ke speaker sehingga pengguna dapat mendengarnya.

Salah satu node yang dapat Anda hubungkan adalah AudioWorkletNode. Node ini memberi Anda kemampuan tingkat rendah untuk pemrosesan audio kustom. Pemrosesan audio yang sebenarnya terjadi di metode callback process() di AudioWorkletProcessor. Panggil fungsi ini untuk memasukkan input dan parameter serta mengambil output.

Lihat Enter Audio Worklet untuk mempelajari lebih lanjut.

<script>
  const handleSuccess = async function(stream) {
    const context = new AudioContext();
    const source = context.createMediaStreamSource(stream);

    await context.audioWorklet.addModule("processor.js");
    const worklet = new AudioWorkletNode(context, "worklet-processor");

    source.connect(worklet);
    worklet.connect(context.destination);
  };

  navigator.mediaDevices.getUserMedia({ audio: true, video: false })
      .then(handleSuccess);
</script>

// processor.js
class WorkletProcessor extends AudioWorkletProcessor {
  process(inputs, outputs, parameters) {
    // Do something with the data, e.g. convert it to WAV
    console.log(inputs);
    return true;
  }
}

registerProcessor("worklet-processor", WorkletProcessor);

Data yang disimpan dalam buffering adalah data mentah dari mikrofon dan Anda memiliki sejumlah opsi terkait tindakan yang dapat Anda lakukan dengan data tersebut:

Menguploadnya langsung ke server
Menyimpan secara lokal
Konversikan ke format file khusus, seperti WAV, lalu simpan ke server atau secara lokal

Menyimpan data dari mikrofon

Cara termudah untuk menyimpan data dari mikrofon adalah dengan menggunakan MediaRecorder API.

MediaRecorder API akan mengambil streaming yang dibuat oleh getUserMedia, lalu secara bertahap menyimpan data yang ada di streaming ke tujuan yang Anda inginkan.

<a id="download">Download</a>
<button id="stop">Stop</button>
<script>
  const downloadLink = document.getElementById('download');
  const stopButton = document.getElementById('stop');


  const handleSuccess = function(stream) {
    const options = {mimeType: 'audio/webm'};
    const recordedChunks = [];
    const mediaRecorder = new MediaRecorder(stream, options);

    mediaRecorder.addEventListener('dataavailable', function(e) {
      if (e.data.size > 0) recordedChunks.push(e.data);
    });

    mediaRecorder.addEventListener('stop', function() {
      downloadLink.href = URL.createObjectURL(new Blob(recordedChunks));
      downloadLink.download = 'acetest.wav';
    });

    stopButton.addEventListener('click', function() {
      mediaRecorder.stop();
    });

    mediaRecorder.start();
  };

  navigator.mediaDevices.getUserMedia({ audio: true, video: false })
      .then(handleSuccess);
</script>

Dalam kasus ini, kita menyimpan data langsung ke array yang nantinya dapat kita ubah menjadi Blob, yang kemudian dapat digunakan untuk menyimpan data ke Server Web atau langsung ke penyimpanan di perangkat pengguna.

Meminta izin untuk menggunakan mikrofon secara bertanggung jawab

Jika pengguna belum pernah memberikan akses ke mikrofon ke situs Anda, maka saat Anda memanggil getUserMedia, browser akan meminta pengguna untuk memberikan izin ke mikrofon ke situs Anda.

Pengguna tidak suka dimintai akses ke perangkat canggih di komputer mereka dan mereka akan sering memblokir permintaan tersebut, atau mereka akan mengabaikannya jika tidak memahami konteks pembuatan perintah. Praktik terbaiknya adalah hanya meminta akses ke mikrofon saat pertama kali diperlukan. Setelah pengguna memberikan akses, mereka tidak akan diminta lagi. Namun, jika mereka menolak akses, Anda tidak dapat meminta izin lagi kepada pengguna.

Menggunakan API izin untuk memeriksa apakah Anda sudah memiliki akses

getUserMedia API tidak memberi Anda informasi apakah Anda sudah memiliki akses ke mikrofon. Hal ini menimbulkan masalah, untuk memberikan UI yang bagus agar pengguna memberikan akses ke mikrofon, Anda harus meminta akses ke mikrofon.

Hal ini dapat diatasi di beberapa browser menggunakan Permission API. navigator.permission API memungkinkan Anda membuat kueri status kemampuan untuk mengakses API tertentu tanpa harus meminta lagi.

Untuk membuat kueri apakah Anda memiliki akses ke mikrofon pengguna, Anda dapat meneruskan {name: 'microphone'} ke metode kueri dan metode tersebut akan menampilkan:

granted — pengguna sebelumnya telah memberi Anda akses ke mikrofon;
prompt — pengguna belum memberi Anda akses dan akan diminta saat Anda memanggil getUserMedia;
denied — sistem atau pengguna telah memblokir akses ke mikrofon secara eksplisit dan Anda tidak akan dapat mengaksesnya.

Dan sekarang Anda dapat dengan cepat memeriksa apakah perlu mengubah antarmuka pengguna untuk mengakomodasi tindakan yang perlu dilakukan pengguna.

navigator.permissions.query({name: 'microphone'}).then(function (result) {
  if (result.state == 'granted') {
  } else if (result.state == 'prompt') {
  } else if (result.state == 'denied') {
  }
  result.onchange = function () {};
});