現在、多くのブラウザには、ユーザーによる動画および音声ファイルの入力を処理する機能が備わっています。ただしブラウザによっては、この機能が動的に組み込まれている場合や、ユーザーの端末上にある別のアプリに処理が委ねられる場合があります。
簡単なケースから始める
最も簡単な方法は、事前に録音済みのファイルをユーザーに要求することです。そのためには、簡単なファイル入力要素を作成して、音声ファイルのみを受け入れる accept
フィルタと、マイクから直接取得することを示す capture
属性を追加します。
<input type="file" accept="audio/*" capture />
この方法はすべてのプラットフォームで使用できます。PC の場合、ユーザーは、ファイル システムからファイルをアップロードするように求められます(capture
属性は無視されます)。iOS 上の Safari にこの方法を使用すると、マイクアプリが起動し、音声を録音してウェブページに送信できるようになります。Android の場合、ユーザーは音声をウェブページに送信する前に、音声の録音に使用するアプリを選択できます。
ユーザーが録音を完了してウェブサイトに戻ったら、何らかの方法でそのファイルデータを取得する必要があります。onchange
イベントを入力要素にアタッチして、イベント オブジェクトの files
プロパティを読み取ることで、すばやくアクセスできます。
<input type="file" accept="audio/*" capture id="recorder" />
<audio id="player" controls></audio>
<script>
const recorder = document.getElementById('recorder');
const player = document.getElementById('player');
recorder.addEventListener('change', function (e) {
const file = e.target.files[0];
const url = URL.createObjectURL(file);
// Do something with the audio file.
player.src = url;
});
</script>
</audio>
ファイルにアクセスできるようになると、ファイルに対してあらゆる操作を行えます。たとえば、下記の設定が可能です。
- ファイルを
<audio>
要素に直接アタッチして、ファイルを再生できるようにする - ファイルをユーザーの端末にダウンロードする
XMLHttpRequest
にアタッチして、サーバーにアップロードする- Web Audio API を介してファイルを渡し、ファイルにフィルタを適用する
入力要素を使用して音声データにアクセスする方法は汎用的ですが、好ましい方法ではありません。理想的には、マイクにアクセスして、ページ内で適切なエクスペリエンスを直接提供する必要があります。
マイクにインタラクティブにアクセスする
最新のブラウザはマイクに直接アクセスできるため、ウェブページと完全に統合されたエクスペリエンスを実現できます。よって、ユーザーはブラウザから離れる必要がありません。
マイクへのアクセス権を取得する
WebRTC 仕様の API(getUserMedia()
)を使用して、マイクに直接アクセスできます。getUserMedia()
は、接続済みのマイクとカメラへのアクセス権の付与を求めるメッセージがユーザーに表示されます。
アクセスが許可されると、API によって、カメラまたはマイクからのデータが含まれる Stream
が返されます。このストリームは <audio>
要素や WebRTC ストリームにアタッチしたり、Web Audio の AudioContext
にアタッチしたり、MediaRecorder
API を使用して保存したりできます。
マイクからデータを取得するために、getUserMedia()
API に渡す constraints オブジェクトで audio: true
を設定しています。
<audio id="player" controls></audio>
<script>
const player = document.getElementById('player');
const handleSuccess = function (stream) {
if (window.URL) {
player.srcObject = stream;
} else {
player.src = stream;
}
};
navigator.mediaDevices
.getUserMedia({audio: true, video: false})
.then(handleSuccess);
</script>
特定のマイクを選択する場合は、まず使用可能なマイクを列挙します。
navigator.mediaDevices.enumerateDevices().then((devices) => {
devices = devices.filter((d) => d.kind === 'audioinput');
});
その後、getUserMedia
を呼び出すときに使用する deviceId
を渡すことができます。
navigator.mediaDevices.getUserMedia({
audio: {
deviceId: devices[0].deviceId,
},
});
この機能だけでは、音声データを取得して再生することしかできません。
マイクの未加工データにアクセスする
マイクの未加工データにアクセスするには、getUserMedia()
で作成されたストリームを取得し、Web Audio API を使用してそのデータを処理する必要があります。Web Audio API はシンプルな API であり、入力ソースを取得すると、それを音声データを処理(ゲインの調整など)できるノードに接続し、最終的にはユーザーが音声を聞くことができるようにスピーカーに接続します。
接続できるノードの 1 つは AudioWorkletNode
です。このノードを使用すると、カスタム オーディオ処理の低レベル機能を利用できます。実際の音声処理は、AudioWorkletProcessor
の process()
コールバック メソッドで行われます。この関数を呼び出して、入力とパラメータをフィードし、出力を取得します。
詳しくは、Enter Audio Worklet をご覧ください。
<script>
const handleSuccess = async function(stream) {
const context = new AudioContext();
const source = context.createMediaStreamSource(stream);
await context.audioWorklet.addModule("processor.js");
const worklet = new AudioWorkletNode(context, "worklet-processor");
source.connect(worklet);
worklet.connect(context.destination);
};
navigator.mediaDevices.getUserMedia({ audio: true, video: false })
.then(handleSuccess);
</script>
// processor.js
class WorkletProcessor extends AudioWorkletProcessor {
process(inputs, outputs, parameters) {
// Do something with the data, e.g. convert it to WAV
console.log(inputs);
return true;
}
}
registerProcessor("worklet-processor", WorkletProcessor);
バッファに保持されたデータはマイクの未加工データであり、そのデータに対して多くの操作を行うことができます。次に例を示します。
- データをサーバーに直接アップロードする
- データをローカルで保存する
- WAV などの専用のファイル形式に変換してから、サーバーまたはローカルに保存する
マイクのデータを保存する
マイクのデータを保存する最も簡単な方法は、MediaRecorder
API を使用することです。
MediaRecorder
API は、getUserMedia
によって作成されたストリームを取得してから、ストリーム上のデータを任意の保存先に段階的に保存します。
<a id="download">Download</a>
<button id="stop">Stop</button>
<script>
const downloadLink = document.getElementById('download');
const stopButton = document.getElementById('stop');
const handleSuccess = function(stream) {
const options = {mimeType: 'audio/webm'};
const recordedChunks = [];
const mediaRecorder = new MediaRecorder(stream, options);
mediaRecorder.addEventListener('dataavailable', function(e) {
if (e.data.size > 0) recordedChunks.push(e.data);
});
mediaRecorder.addEventListener('stop', function() {
downloadLink.href = URL.createObjectURL(new Blob(recordedChunks));
downloadLink.download = 'acetest.wav';
});
stopButton.addEventListener('click', function() {
mediaRecorder.stop();
});
mediaRecorder.start();
};
navigator.mediaDevices.getUserMedia({ audio: true, video: false })
.then(handleSuccess);
</script>
ここでは、あとで Blob
に変換できる配列にデータを直接保存しています。その後、これを使用して、ウェブサーバーまたは直接ユーザーの端末のストレージにデータを保存します。
マイクを適切に使用するためにパーミッションを要求する
ユーザーが、サイトによるマイクへのアクセスを許可したことがない場合は、getUserMedia
を呼び出すと、マイクにアクセスするためのパーミッションを付与するよう求める画面が表示されます。
ユーザーは、マシン上の高機能なデバイスへのアクセス権を要求されることを好まず、リクエストを拒否する傾向があります。また、プロンプトが表示された理由がわからない場合は、リクエストを無視することもあります。初めてマイクが必要になったときに、一度だけアクセス権を要求することをおすすめします。アクセス権が付与されると、ユーザーに再度プロンプトが表示されることはありません。ただし、ユーザーがアクセスを拒否した場合は、再度アクセスしてユーザーにパーミッションを要求できなくなります。
Permission API を使用してアクセス権の有無を確認する
getUserMedia
API からの情報では、既にマイクへのアクセス権があるかどうかを確認できません。これは問題になります。適切な UI を表示してマイクへのアクセスをユーザーに許可してもらうには、マイクへのアクセス権を求める必要があります。
この問題は、一部のブラウザでは Permission API を使用すると解決できます。navigator.permission
API を使用すると、プロンプトを再度表示する必要なく、特定の API にアクセスできるかどうかを照会できます。
ユーザーのマイクへのアクセス権があるかどうかを照会するには、{name: 'microphone'}
をクエリメソッドに渡すと、以下のいずれかが返されます。
granted
- ユーザーは以前にマイクへのアクセス権を付与しています。prompt
- ユーザーはアクセス権を付与したことがなく、getUserMedia
を呼び出すと、ユーザーにプロンプトが表示されます。denied
- システムまたはユーザーがマイクへのアクセスを明示的にブロックしているため、マイクにアクセスできません。
これで、ユーザーが必要な操作を実行できるようにするためにユーザー インターフェースを変更する必要があるかどうかをすばやく確認できます。
navigator.permissions.query({name: 'microphone'}).then(function (result) {
if (result.state == 'granted') {
} else if (result.state == 'prompt') {
} else if (result.state == 'denied') {
}
result.onchange = function () {};
});