Virtual reality hadir di web, bagian II

Semua tentang loop frame

Joe Medley
Joe Medley

Baru-baru ini, saya memublikasikan Virtual reality comes to the web, sebuah artikel yang memperkenalkan konsep dasar di balik WebXR Device API. Saya juga memberikan petunjuk untuk meminta, memasuki, dan mengakhiri sesi XR.

Artikel ini menjelaskan loop frame, yang merupakan loop tanpa batas yang dikontrol oleh agen pengguna tempat konten digambar berulang kali ke layar. Konten digambar dalam blok terpisah yang disebut frame. Urutan frame menciptakan ilusi gerakan.

WebGL dan WebGL2 adalah satu-satunya cara untuk merender konten selama loop frame di Aplikasi WebXR. Untungnya, banyak framework yang menyediakan lapisan abstraksi di atas WebGL dan WebGL2. Framework tersebut mencakup three.js, babylonjs, dan PlayCanvas, sedangkan A-Frame dan React 360 dirancang untuk berinteraksi dengan WebXR.

Artikel ini bukan tutorial WebGL atau framework. Artikel ini menjelaskan dasar-dasar loop frame menggunakan contoh Sesi VR Imersif dari Immersive Web Working Group (demo, sumber). Jika Anda ingin mempelajari WebGL atau salah satu framework, internet menyediakan daftar artikel yang terus bertambah.

Pemain dan pertandingan

Saat mencoba memahami loop frame, saya terus tersesat dalam detail. Ada banyak objek yang digunakan, dan beberapa di antaranya hanya diberi nama oleh properti referensi pada objek lain. Untuk membantu Anda memahaminya, saya akan menjelaskan objek, yang saya sebut 'pemain'. Kemudian, saya akan menjelaskan cara mereka berinteraksi, yang saya sebut 'game'.

Pemain

XRViewerPose

Pose adalah posisi dan orientasi sesuatu dalam ruang 3D. Penonton dan perangkat input memiliki pose, tetapi pose penontonlah yang kita bahas di sini. Pose penampil dan perangkat input memiliki atribut transform yang menjelaskan posisinya sebagai vektor dan orientasinya sebagai kuadrona relatif terhadap asal. Asal ditentukan berdasarkan jenis ruang referensi yang diminta saat memanggil XRSession.requestReferenceSpace().

Ruang referensi memerlukan sedikit penjelasan. Saya membahasnya secara mendalam di Augmented reality. Contoh yang saya gunakan sebagai dasar untuk artikel ini menggunakan ruang referensi 'local' yang berarti asal berada di posisi penampil pada saat pembuatan sesi tanpa lantai yang ditentukan dengan baik, dan posisi tepatnya dapat bervariasi menurut platform.

XRView

Tampilan sesuai dengan kamera yang melihat tampilan virtual. Tampilan juga memiliki atribut transform yang menjelaskan posisinya sebagai vektor dan orientasinya. Ini disediakan sebagai pasangan vektor/kuaternion dan sebagai matriks yang setara, Anda dapat menggunakan representasi mana pun, bergantung pada mana yang paling sesuai dengan kode Anda. Setiap tampilan sesuai dengan tampilan atau bagian tampilan yang digunakan oleh perangkat untuk menampilkan gambar kepada penampil. Objek XRView ditampilkan dalam array dari objek XRViewerPose. Jumlah tampilan dalam array bervariasi. Di perangkat seluler, tampilan AR memiliki satu tampilan, yang mungkin atau mungkin tidak mencakup layar perangkat. Headset biasanya memiliki dua tampilan, satu untuk setiap mata.

XRWebGLLayer

Lapisan menyediakan sumber gambar bitmap dan deskripsi cara gambar tersebut dirender di perangkat. Deskripsi ini tidak cukup menggambarkan fungsi pemutar ini. Saya menganggapnya sebagai perantara antara perangkat dan WebGLRenderingContext. MDN memiliki pandangan yang sama, yang menyatakan bahwa 'menyediakan penautan' antara keduanya. Dengan demikian, server ini memberikan akses ke pemain lain.

Secara umum, objek WebGL menyimpan informasi status untuk merender grafik 2D dan 3D.

WebGLFramebuffer

Framebuffer menyediakan data gambar ke WebGLRenderingContext. Setelah mengambilnya dari XRWebGLLayer, Anda cukup meneruskannya ke WebGLRenderingContext saat ini. Selain memanggil bindFramebuffer() (selengkapnya tentang hal itu nanti), Anda tidak akan pernah mengakses objek ini secara langsung. Anda hanya akan meneruskannya dari XRWebGLLayer ke WebGLRenderingContext.

XRViewport

Area pandang memberikan koordinat dan dimensi wilayah persegi panjang di WebGLFramebuffer.

WebGLRenderingContext

Konteks rendering adalah titik akses terprogram untuk kanvas (ruang tempat kita menggambar). Untuk melakukannya, aplikasi memerlukan WebGLFramebuffer dan XRViewport.

Perhatikan hubungan antara XRWebGLLayer dan WebGLRenderingContext. Satu sesuai dengan perangkat penampil dan yang lainnya sesuai dengan halaman web. WebGLFramebuffer dan XRViewport diteruskan dari yang pertama ke yang kedua.

Hubungan antara XRWebGLLayer dan WebGLRenderingContext
Hubungan antara XRWebGLLayer dan WebGLRenderingContext

Game

Setelah mengetahui siapa pemainnya, mari kita lihat game yang mereka mainkan. Ini adalah game yang dimulai ulang dengan setiap frame. Ingat bahwa frame adalah bagian dari loop frame yang terjadi dengan kecepatan yang bergantung pada hardware yang mendasarinya. Untuk aplikasi VR, frame per detik dapat berkisar antara 60 hingga 144. AR untuk Android berjalan pada kecepatan 30 frame per detik. Kode Anda tidak boleh mengasumsikan kecepatan frame tertentu.

Proses dasar untuk loop frame terlihat seperti ini:

  1. Hubungi XRSession.requestAnimationFrame(). Sebagai respons, agen pengguna memanggil XRFrameRequestCallback, yang ditentukan oleh Anda.
  2. Di dalam fungsi callback Anda:
    1. Hubungi XRSession.requestAnimationFrame() lagi.
    2. Dapatkan pose penampil.
    3. Teruskan ('bind') WebGLFramebuffer dari XRWebGLLayer ke WebGLRenderingContext.
    4. Lakukan iterasi pada setiap objek XRView, ambil XRViewport-nya dari XRWebGLLayer, lalu teruskan ke WebGLRenderingContext.
    5. Menggambar sesuatu ke framebuffer.

Karena langkah 1 dan 2a telah dibahas dalam artikel sebelumnya, saya akan memulai dari langkah 2b.

Mendapatkan pose penonton

Hal ini mungkin sudah jelas. Untuk menggambar apa pun dalam AR atau VR, saya perlu mengetahui lokasi penonton dan tempat mereka melihat. Posisi dan orientasi penampil disediakan oleh objek XRViewerPose. Saya mendapatkan pose penampil dengan memanggil XRFrame.getViewerPose() pada frame animasi saat ini. Saya meneruskan ruang referensi yang saya peroleh saat menyiapkan sesi. Nilai yang ditampilkan oleh objek ini selalu relatif terhadap ruang referensi yang saya minta saat memasukkan sesi saat ini. Seperti yang mungkin Anda ingat, saya harus meneruskan ruang referensi saat ini saat meminta pose.

function onXRFrame(hrTime, xrFrame) {
  let xrSession
= xrFrame.session;
  xrSession
.requestAnimationFrame(onXRFrame);
  let xrViewerPose
= xrFrame.getViewerPose(xrRefSpace);
 
if (xrViewerPose) {
   
// Render based on the pose.
 
}
}

Ada satu pose penonton yang mewakili posisi keseluruhan pengguna, yang berarti kepala penonton atau kamera ponsel jika menggunakan smartphone. Pose memberi tahu aplikasi Anda lokasi penampil. Rendering gambar yang sebenarnya menggunakan objek XRView, yang akan saya bahas sebentar lagi.

Sebelum melanjutkan, saya menguji apakah pose pelihat ditampilkan jika sistem kehilangan pelacakan atau memblokir pose karena alasan privasi. Pelacakan adalah kemampuan perangkat VR untuk mengetahui lokasinya dan/atau perangkat inputnya relatif terhadap lingkungan. Pelacakan dapat hilang dengan beberapa cara, dan bervariasi bergantung pada metode yang digunakan untuk pelacakan. Misalnya, jika kamera di headset atau ponsel digunakan untuk melacak, perangkat mungkin kehilangan kemampuannya untuk menentukan lokasinya dalam situasi dengan cahaya redup atau tidak ada cahaya, atau jika kamera tertutup.

Contoh pemblokiran pose karena alasan privasi adalah jika headset menampilkan dialog keamanan seperti permintaan izin, browser dapat berhenti memberikan pose ke aplikasi saat hal ini terjadi. Namun, saya telah memanggil XRSession.requestAnimationFrame() sehingga jika sistem dapat pulih, loop frame akan berlanjut. Jika tidak, agen pengguna akan mengakhiri sesi dan memanggil pengendali peristiwa end.

Pengalihan singkat

Langkah berikutnya memerlukan objek yang dibuat selama penyiapan sesi. Ingat bahwa saya membuat kanvas dan menginstruksikannya untuk membuat konteks rendering Web GL yang kompatibel dengan XR, yang saya dapatkan dengan memanggil canvas.getContext(). Semua gambar dilakukan menggunakan WebGL API, WebGL2 API, atau framework berbasis WebGL seperti Three.js. Konteks ini diteruskan ke objek sesi melalui updateRenderState(), beserta instance XRWebGLLayer baru.

let canvas = document.createElement('canvas');
// The rendering context must be based on WebGL or WebGL2
let webGLRenContext
= canvas.getContext('webgl', { xrCompatible: true });
xrSession
.updateRenderState({
    baseLayer
: new XRWebGLLayer(xrSession, webGLRenContext)
 
});

Teruskan ('bind') WebGLFramebuffer

XRWebGLLayer menyediakan framebuffer untuk WebGLRenderingContext yang disediakan khusus untuk digunakan dengan WebXR dan menggantikan framebuffer default konteks rendering. Hal ini disebut 'binding' dalam bahasa WebGL.

function onXRFrame(hrTime, xrFrame) {
  let xrSession
= xrFrame.session;
  xrSession
.requestAnimationFrame(onXRFrame);
  let xrViewerPose
= xrFrame.getViewerPose(xrRefSpace);
 
if (xrViewerPose) {
    let glLayer
= xrSession.renderState.baseLayer;
    webGLRenContext
.bindFramebuffer(webGLRenContext.FRAMEBUFFER, glLayer.framebuffer);
   
// Iterate over the views
 
}
}

Melakukan iterasi pada setiap objek XRView

Setelah mendapatkan pose dan mengikat framebuffer, saatnya mendapatkan viewport. XRViewerPose berisi array antarmuka XRView yang masing-masing mewakili layar atau bagian layar. Informasi ini berisi informasi yang diperlukan untuk merender konten yang diposisikan dengan benar untuk perangkat dan pelihat seperti bidang pandang, offset mata, dan properti optik lainnya. Karena saya menggambar untuk dua mata, saya memiliki dua tampilan, yang saya loop dan menggambar gambar terpisah untuk masing-masing.

Saat menerapkan untuk augmented reality berbasis ponsel, saya hanya akan memiliki satu tampilan, tetapi saya tetap akan menggunakan loop. Meskipun tampaknya tidak ada gunanya melakukan iterasi melalui satu tampilan, tindakan ini memungkinkan Anda memiliki satu jalur rendering untuk spektrum pengalaman imersif. Ini adalah perbedaan penting antara WebXR dan sistem imersif lainnya.

function onXRFrame(hrTime, xrFrame) {
  let xrSession
= xrFrame.session;
  xrSession
.requestAnimationFrame(onXRFrame);
  let xrViewerPose
= xrFrame.getViewerPose(xrRefSpace);
 
if (xrViewerPose) {
    let glLayer
= xrSession.renderState.baseLayer;
    webGLRenContext
.bindFramebuffer(webGLRenContext.FRAMEBUFFER, glLayer.framebuffer);
   
for (let xrView of xrViewerPose.views) {
     
// Pass viewports to the context
   
}
 
}
}

Meneruskan objek XRViewport ke WebGLRenderingContext

Objek XRView mengacu pada apa yang dapat diamati di layar. Namun, untuk menggambar ke tampilan tersebut, saya memerlukan koordinat dan dimensi yang spesifik untuk perangkat saya. Seperti framebuffer, saya memintanya dari XRWebGLLayer dan meneruskannya ke WebGLRenderingContext.

function onXRFrame(hrTime, xrFrame) {
  let xrSession
= xrFrame.session;
  xrSession
.requestAnimationFrame(onXRFrame);
  let xrViewerPose
= xrFrame.getViewerPose(xrRefSpace);
 
if (xrViewerPose) {
    let glLayer
= xrSession.renderState.baseLayer;
    webGLRenContext
.bindFramebuffer(webGLRenContext.FRAMEBUFFER, glLayer.framebuffer);
   
for (let xrView of xrViewerPose.views) {
      let viewport
= glLayer.getViewport(xrView);
      webGLRenContext
.viewport(viewport.x, viewport.y, viewport.width, viewport.height);
     
// Draw something to the framebuffer
   
}
 
}
}

webGLRenContext

Dalam menulis artikel ini, saya berdebat dengan beberapa rekan kerja tentang penamaan objek webGLRenContext. Skrip contoh dan sebagian besar kode WebXR hanya memanggil variabel ini gl. Saat mencoba memahami sampel, saya terus lupa apa yang dimaksud dengan gl. Saya menamainya webGLRenContext untuk mengingatkan Anda saat Anda mempelajari bahwa ini adalah instance WebGLRenderingContext.

Alasannya adalah karena menggunakan gl memungkinkan nama metode terlihat seperti nama metode di OpenGL ES 2.0 API, yang digunakan untuk membuat VR dalam bahasa yang dikompilasi. Fakta ini jelas jika Anda telah menulis aplikasi VR menggunakan OpenGL, tetapi membingungkan jika Anda benar-benar baru mengenal teknologi ini.

Menggambar sesuatu ke framebuffer

Jika Anda merasa sangat ambisius, Anda dapat menggunakan WebGL secara langsung, tetapi saya tidak menyarankan hal itu. Akan jauh lebih mudah untuk menggunakan salah satu framework yang tercantum di bagian atas.

Kesimpulan

Ini bukan akhir dari artikel atau update WebXR. Anda dapat menemukan referensi untuk semua antarmuka dan anggota WebXR di MDN. Untuk peningkatan antarmuka mendatang, ikuti setiap fitur di Chrome Status.

Foto oleh JESHOOTS.COM di Unsplash