Web Audio API'sını kullanmaya başlama

Boris Smus
Boris Smus

HTML5 <audio> öğesinden önce, web'in sessizliğini bozmak için Flash veya başka bir eklenti gerekiyordu. Web'de ses için artık eklenti gerekmese de ses etiketi, karmaşık oyunlar ve etkileşimli uygulamalar uygulama konusunda önemli sınırlamalar getirir.

Web Audio API, web uygulamalarında sesleri işlemek ve sentezlemek için kullanılan üst düzey bir JavaScript API'sidir. Bu API'nin amacı, modern oyun ses motorlarında bulunan özellikleri ve modern masaüstü ses prodüksiyon uygulamalarında bulunan bazı karıştırma, işleme ve filtreleme görevlerini içermektir. Aşağıda, bu güçlü API'nin kullanımına dair basit bir giriş verilmiştir.

AudioContext'i kullanmaya başlama

AudioContext, tüm sesleri yönetmek ve çalmak için kullanılır. Web Audio API'yi kullanarak ses oluşturmak için bir veya daha fazla ses kaynağı oluşturun ve bunları AudioContext örneği tarafından sağlanan ses hedefine bağlayın. Bu bağlantının doğrudan olması gerekmez ve ses sinyali için işleme modülü görevi gören herhangi bir sayıda ara AudioNodes üzerinden geçilebilir. Bu yönlendirme, Web Audio spesifikasyonunda daha ayrıntılı olarak açıklanmaktadır.

Tek bir AudioContext örneği, birden fazla ses girişini ve karmaşık ses grafiklerini destekleyebilir. Bu nedenle, oluşturduğumuz her ses uygulaması için bunlardan yalnızca birine ihtiyacımız olacaktır.

Aşağıdaki snippet, bir AudioContext oluşturur:

var context;
window.addEventListener('load', init, false);
function init() {
    try {
    context = new AudioContext();
    }
    catch(e) {
    alert('Web Audio API is not supported in this browser');
    }
}

WebKit tabanlı eski tarayıcılarda webkitAudioContext ile olduğu gibi webkit ön ekini kullanın.

AudioNode oluşturma ve ses dosyası verilerinin kodunu çözme gibi ilgi çekici Web Audio API işlevlerinin çoğu AudioContext yöntemlerindendir.

Sesler yükleniyor

Web Audio API, kısa ve orta uzunluktaki sesler için AudioBuffer kullanır. Temel yaklaşım, ses dosyalarını getirmek için XMLHttpRequest kullanmaktır.

API, ses dosyası verilerinin WAV, MP3, AAC, OGG ve diğer gibi birden çok biçimde yüklenmesini destekler. Farklı ses biçimleri için tarayıcı desteği değişiklik gösterir.

Aşağıdaki snippet'te ses örneği yükleme gösterilmektedir:

var dogBarkingBuffer = null;
var context = new AudioContext();

function loadDogSound(url) {
    var request = new XMLHttpRequest();
    request.open('GET', url, true);
    request.responseType = 'arraybuffer';

    // Decode asynchronously
    request.onload = function() {
    context.decodeAudioData(request.response, function(buffer) {
        dogBarkingBuffer = buffer;
    }, onError);
    }
    request.send();
}

Ses dosyası verileri ikili veridir (metin değil). Bu nedenle, isteğin responseType değerini 'arraybuffer' olarak ayarlarız. ArrayBuffers hakkında daha fazla bilgi için bu XHR2 makalesine göz atın.

(Kodlanmamış) ses dosyası verileri alındıktan sonra, daha sonra kod çözme işlemi için saklanabilir veya AudioContext decodeAudioData() yöntemi kullanılarak hemen kod çözme işlemi yapılabilir. Bu yöntem, request.response içinde depolanan ses dosyası verilerinin ArrayBuffer'ünü alır ve verileri eşzamansız olarak kod çözer (ana JavaScript yürütme iş parçacısını engellemez).

decodeAudioData() tamamlandığında, kodu çözülmüş PCM ses verilerini AudioBuffer olarak sağlayan bir geri çağırma işlevini çağırır.

Ses çal

Basit bir ses grafiği
Basit bir ses grafiği

Bir veya daha fazla AudioBuffers yüklendikten sonra ses çalmaya hazır oluruz. Bir köpeğin havlama sesini içeren bir AudioBuffer yüklediğimizi ve yüklemenin tamamlandığını varsayalım. Sonra bu arabelleği şu kodla oynatabiliriz.

var context = new AudioContext();

function playSound(buffer) {
    var source = context.createBufferSource(); // creates a sound source
    source.buffer = buffer;                    // tell the source which sound to play
    source.connect(context.destination);       // connect the source to the context's destination (the speakers)
    source.noteOn(0);                          // play the source now
}

Bu playSound() işlevi, kullanıcı bir tuşa her bastığı veya fareyle bir öğeyi her tıkladığı zaman çağrılabilir.

noteOn(time) işlevi, oyunlar ve zaman açısından kritik diğer uygulamalar için ses oynatmayı hassas bir şekilde planlamayı kolaylaştırır. Ancak bu planlamanın düzgün çalışması için ses arabelleklerinizin önceden yüklenmiş olduğundan emin olun.

Web Audio API'yi soyutlama

Elbette, bu belirli sesi yüklemek için sabit kodlanmamış daha genel bir yükleme sistemi oluşturmak daha iyi olur. Ses uygulamalarının veya oyunların kullanabileceği çok sayıda kısa ya da orta uzunlukta sesle ilgili pek çok yaklaşım vardır. Aşağıda BufferLoader kullanmanın bir yolu (web standardının bir parçası olmayan) gösterilmiştir.

Aşağıda, BufferLoader sınıfını nasıl kullanabileceğinize dair bir örnek verilmiştir. İki AudioBuffers oluşturalım ve yüklendikten sonra aynı anda oynatalım.

window.onload = init;
var context;
var bufferLoader;

function init() {
    context = new AudioContext();

    bufferLoader = new BufferLoader(
    context,
    [
        '../sounds/hyper-reality/br-jam-loop.wav',
        '../sounds/hyper-reality/laughter.wav',
    ],
    finishedLoading
    );

    bufferLoader.load();
}

function finishedLoading(bufferList) {
    // Create two sources and play them both together.
    var source1 = context.createBufferSource();
    var source2 = context.createBufferSource();
    source1.buffer = bufferList[0];
    source2.buffer = bufferList[1];

    source1.connect(context.destination);
    source2.connect(context.destination);
    source1.noteOn(0);
    source2.noteOn(0);
}

Zamanla ilgili işlemler: Ritim eşliğinde ses çalma

Web Audio API, geliştiricilerin oynatmayı hassas bir şekilde planlamasına olanak tanır. Bunu göstermek için basit bir ritim parçası oluşturalım. Muhtemelen en çok bilinen drumkit deseni de şudur:

Basit bir rock davul ritmi
Basit bir rock davul ritmi

Bu örnekte her sekiz notada bir hihat ve 4/4'te bir "vuruş ve trampet", her üç ayda bir sırayla oynanıyor.

kick, snare ve hihat arabelleklerini yüklediğimizi varsayalım. Bu işlemi gerçekleştirmek için gereken kod basittir:

for (var bar = 0; bar < 2; bar++) {
    var time = startTime + bar * 8 * eighthNoteTime;
    // Play the bass (kick) drum on beats 1, 5
    playSound(kick, time);
    playSound(kick, time + 4 * eighthNoteTime);

    // Play the snare drum on beats 3, 7
    playSound(snare, time + 2 * eighthNoteTime);
    playSound(snare, time + 6 * eighthNoteTime);

    // Play the hi-hat every eighth note.
    for (var i = 0; i < 8; ++i) {
    playSound(hihat, time + i * eighthNoteTime);
    }
}

Bu örnekte, nota kağıtlarında gördüğümüz sınırsız döngü yerine yalnızca bir tekrarlama gerçekleştiriyoruz. playSound işlevi, aşağıdaki şekilde belirli bir zamanda bir arabellek oynatan bir yöntemdir:

function playSound(buffer, time) {
    var source = context.createBufferSource();
    source.buffer = buffer;
    source.connect(context.destination);
    source.noteOn(time);
}

Bir sesin ses düzeyini değiştirme

Bir sesle yapmak isteyebileceğiniz en temel işlemlerden biri sesin seviyesini değiştirmektir. Web Audio API'sini kullanarak, ses düzeyini değiştirmek için kaynağımızı bir AudioGainNode üzerinden hedefine yönlendirebiliriz:

Kazanç düğümü içeren ses grafiği
Güçlendirme düğümü içeren ses grafiği

Bu bağlantı kurulumu aşağıdaki gibi yapılabilir:

// Create a gain node.
var gainNode = context.createGainNode();
// Connect the source to the gain node.
source.connect(gainNode);
// Connect the gain node to the destination.
gainNode.connect(context.destination);

Grafik oluşturulduktan sonra, gainNode.gain.value öğesini aşağıdaki şekilde değiştirerek ses seviyesini programatik olarak değiştirebilirsiniz:

// Reduce the volume.
gainNode.gain.value = 0.5;

İki ses arasında geçiş

Şimdi, birden fazla ses çaldığımız ancak bunlar arasında geçiş yapmak istediğimiz biraz daha karmaşık bir senaryoya sahip olduğumuzu varsayalım. Bu, iki pikapımız olduğu ve bir ses kaynağından diğerine geçiş yapmak istediğimiz DJ benzeri bir uygulamada sık karşılaşılan bir durumdur.

Bu işlem aşağıdaki ses grafiğiyle yapılabilir:

Kazanç düğümleri aracılığıyla bağlı iki kaynağın yer aldığı ses grafiği
Güç düğümleri aracılığıyla bağlı iki kaynağın yer aldığı ses grafiği

Bunu ayarlamak için iki AudioGainNodes oluşturup her kaynağı düğümler aracılığıyla bağlarız. Bunun için aşağıdaki işleve benzer bir işlev kullanırız:

function createSource(buffer) {
    var source = context.createBufferSource();
    // Create a gain node.
    var gainNode = context.createGainNode();
    source.buffer = buffer;
    // Turn on looping.
    source.loop = true;
    // Connect source to gain.
    source.connect(gainNode);
    // Connect gain to destination.
    gainNode.connect(context.destination);

    return {
    source: source,
    gainNode: gainNode
    };
}

Eşit güç geçişi

Basit bir doğrusal geçiş yaklaşımı, parçalar arasında pan yaptığınızda ses seviyesinde bir düşüş gösterir.

Doğrusal bir geçiş efekti
Doğrusal geçiş

Bu sorunu gidermek için, karşılık gelen kazanç eğrilerinin doğrusal olmayan ve daha yüksek bir genlikte kesiştiği eşit güç eğrisi kullanırız. Bu sayede ses bölgeleri arasındaki ses düşüşleri en aza indirilir. Böylece, seviyeleri biraz farklı olabilecek bölgeler arasında daha eşit bir geçiş elde edilir.

Eşit güç geçişi.
Eşit güçte bir geçiş

Oynatma listelerinde geçiş efekti

Geçiş efektleri, müzik çalar uygulamalarında da yaygın olarak kullanılır. Bir şarkı değiştiğinde, rahatsız edici bir geçiş olmaması için mevcut parçanın sesini yavaşça azaltıp yeni parçanın sesini yavaşça artırırız. Bunu yapmak için, ileriye dönük bir geçiş planlayın. Bu planlamayı yapmak için setTimeout kullanabiliriz ancak bu kesin değildir. Web Audio API'sinde, AudioGainNode kazanç değeri gibi parametrelerin gelecekteki değerlerini planlamak için AudioParam arayüzünü kullanabiliriz.

Bu nedenle, bir oynatma listesi verildiğinde, oynatılan parçanın bitmesinden kısa bir süre önce mevcut parçada kazanç azaltma ve sonraki parçada kazanç artırma planlayarak parçalar arasında geçiş yapabiliriz:

function playHelper(bufferNow, bufferLater) {
    var playNow = createSource(bufferNow);
    var source = playNow.source;
    var gainNode = playNow.gainNode;
    var duration = bufferNow.duration;
    var currTime = context.currentTime;
    // Fade the playNow track in.
    gainNode.gain.linearRampToValueAtTime(0, currTime);
    gainNode.gain.linearRampToValueAtTime(1, currTime + ctx.FADE_TIME);
    // Play the playNow track.
    source.noteOn(0);
    // At the end of the track, fade it out.
    gainNode.gain.linearRampToValueAtTime(1, currTime + duration-ctx.FADE_TIME);
    gainNode.gain.linearRampToValueAtTime(0, currTime + duration);
    // Schedule a recursive track change with the tracks swapped.
    var recurse = arguments.callee;
    ctx.timer = setTimeout(function() {
    recurse(bufferLater, bufferNow);
    }, (duration - ctx.FADE_TIME) - 1000);
}

Web Audio API, linearRampToValueAtTime ve exponentialRampToValueAtTime gibi bir parametrenin değerini kademeli olarak değiştirmek için kullanışlı bir RampToValue yöntemleri grubu sağlar.

Geçiş zamanlaması işlevi, yerleşik doğrusal ve üstel olanlardan (yukarıda olduğu gibi) seçilebilir. Bununla birlikte, setValueCurveAtTime işlevini kullanarak bir değer dizisi aracılığıyla kendi değer eğrinizi de belirtebilirsiniz.

Bir sese basit bir filtre efekti uygulama

BiquadFilterNode içeren bir ses grafiği
BiquadFilterNode içeren bir ses grafiği

Web Audio API, sesi bir ses düğümünden diğerine aktarmanıza olanak tanır. Böylece, ses formlarınıza karmaşık efektler eklemek için karmaşık olabilecek bir işlemci zinciri oluşturabilirsiniz.

Bunu yapmanın bir yolu, ses kaynağınız ile hedefinizin arasına BiquadFilterNode'ları yerleştirmektir. Bu tür ses düğümleri, grafik eşitleyiciler ve hatta daha karmaşık efektler oluşturmak için kullanılabilecek çeşitli düşük dereceli filtreler yapabilir. Bu filtreler genellikle bir sesin frekans spektrumunun hangi kısımlarının vurgulanacağını ve hangilerinin azaltılacağını seçmekle ilgilidir.

Desteklenen filtre türleri şunlardır:

  • Düşük geçiren filtre
  • Yüksek geçiren filtre
  • Bant geçiren filtre
  • Düşük raf filtresi
  • Yüksek raf filtresi
  • Odak boyama filtresi
  • Çentik filtresi
  • Tüm kart filtresi

Tüm filtreler, belirli bir miktarda kazanç, filtrenin uygulanacağı sıklık ve kalite faktörü belirtmek için parametreler içerir. Düşük geçiren filtre, düşük frekans aralığını korur ancak yüksek frekansları atar. Ayrılma noktası, sıklık değeriyle belirlenir. Q faktörü ise birimsizdir ve grafiğin şeklini belirler. Kazanç, bu düşük geçiren filtreyi değil, yalnızca düşük raf ve tepe filtresi gibi belirli filtreleri etkiler.

Bir ses örneğinden yalnızca basları ayıklamak için basit bir düşük geçiren filtre oluşturalım:

// Create the filter
var filter = context.createBiquadFilter();
// Create the audio graph.
source.connect(filter);
filter.connect(context.destination);
// Create and specify parameters for the low-pass filter.
filter.type = 0; // Low-pass filter. See BiquadFilterNode docs
filter.frequency.value = 440; // Set cutoff to 440 HZ
// Playback the sound.
source.noteOn(0);

Genel olarak, insan kulağı da aynı prensiple çalıştığından (yani A4 440 Hz, A5 ise 880 Hz) frekans kontrollerinin logaritmik ölçekte çalışacak şekilde ayarlanması gerekir. Daha fazla bilgi için yukarıdaki kaynak kod bağlantısındaki FilterSample.changeFrequency işlevine bakın.

Son olarak, örnek kodun filtreyi bağlamanıza ve filtrenin bağlantısını kesmenize olanak tanıdığını, böylece AudioContext grafiğini dinamik olarak değiştirdiğini unutmayın. node.disconnect(outputNumber) işlevini çağırarak AudioNodes'ın grafikle olan bağlantısını kesebiliriz. Örneğin, grafiği bir filtreden doğrudan bağlantıya doğru yeniden yönlendirmek için aşağıdakileri yapabiliriz:

// Disconnect the source and filter.
source.disconnect(0);
filter.disconnect(0);
// Connect the source directly.
source.connect(context.destination);

Daha fazla dinleme

Ses kesitlerini yükleme ve çalma da dahil olmak üzere API'nin temel özelliklerini ele aldık. Bazı yaygın ses efektlerini etkinleştirmek için kazanç düğümleri ve filtreler içeren ses grafikleri, planlanmış sesler ve ses parametresi düzenlemeleri oluşturduk. Bu noktada, harika web ses uygulamaları oluşturmaya hazırsınız.

İlham almak istiyorsanız Web Audio API'yi kullanan birçok geliştirici harika çalışmalar oluşturmuştur. En sevdiğim içeriklerden bazıları şunlardır:

  • SoundCloud kalıcı bağlantılarını kullanan tarayıcı içi ses birleştirme aracı AudioJedit.
  • 3D blokları üst üste yığarak seslerin oluşturulduğu bir ses sıralayıcı olan ToneCraft.
  • Plink, Web Audio ve WebSockets'ı kullanan ortak çalışmaya dayalı bir müzik yapma oyunudur.