WebAssembly क्या है और यह कहां से आया?

जब से वेब, सिर्फ़ दस्तावेज़ों के लिए नहीं, बल्कि ऐप्लिकेशन के लिए भी एक प्लैटफ़ॉर्म बन गया है, तब से कुछ सबसे बेहतरीन ऐप्लिकेशन ने वेब ब्राउज़र को उनकी सीमाओं तक पहुंचा दिया है. परफ़ॉर्मेंस को बेहतर बनाने के लिए, लोअर-लेवल की भाषाओं के साथ इंटरफ़ेस करके "क्लोज़र टू द मेटल" अप्रोच का इस्तेमाल, कई हायर-लेवल की भाषाओं में किया जाता है. उदाहरण के लिए, Java में Java Native Interface होता है. JavaScript के लिए, यह लोअर-लेवल की भाषा WebAssembly है. इस लेख में, आपको असेंबली लैंग्वेज के बारे में जानकारी मिलेगी. साथ ही, यह भी पता चलेगा कि यह वेब पर क्यों फ़ायदेमंद हो सकती है. इसके बाद, आपको यह पता चलेगा कि asm.js के इंटरिम समाधान के ज़रिए WebAssembly कैसे बनाया गया था.

असेंबली लैंग्वेज

क्या आपने कभी असेंबली लैंग्वेज में प्रोग्रामिंग की है? कंप्यूटर प्रोग्रामिंग में, असेंबली लैंग्वेज को अक्सर सिर्फ़ असेंबली कहा जाता है. इसे आम तौर पर ASM या asm के तौर पर संक्षिप्त किया जाता है. यह कोई भी लो-लेवल प्रोग्रामिंग लैंग्वेज होती है. इसमें भाषा के निर्देशों और आर्किटेक्चर के मशीन कोड निर्देशों के बीच काफ़ी समानता होती है.

उदाहरण के लिए, Intel® 64 and IA-32 Architectures (PDF) को देखने पर पता चलता है कि MUL निर्देश (गुणा करने के लिए) पहले ऑपरेंड (डेस्टिनेशन ऑपरेंड) और दूसरे ऑपरेंड (सोर्स ऑपरेंड) का बिना साइन वाला गुणा करता है. साथ ही, नतीजे को डेस्टिनेशन ऑपरेंड में सेव करता है. आसान शब्दों में कहें, तो डेस्टिनेशन ऑपरेंड, रजिस्टर AX में मौजूद एक इंप्लाइड ऑपरेंड होता है. वहीं, सोर्स ऑपरेंड, CX जैसे सामान्य रजिस्टर में मौजूद होता है. नतीजे को रजिस्टर AX में फिर से सेव किया जाता है. x86 कोड का यह उदाहरण देखें:

mov ax, 5  ; Set the value of register AX to 5.
mov cx, 10 ; Set the value of register CX to 10.
mul cx     ; Multiply the value of register AX (5)
           ; and the value of register CX (10), and
           ; store the result in register AX.

तुलना के लिए, अगर आपको 5 और 10 को गुणा करने का टास्क दिया जाता है, तो शायद आप JavaScript में इस तरह का कोड लिखेंगे:

const factor1 = 5;
const factor2 = 10;
const result = factor1 * factor2;

असेंबली का इस्तेमाल करने का फ़ायदा यह है कि मशीन के लिए ऑप्टिमाइज़ किया गया यह कोड, लोगों के लिए ऑप्टिमाइज़ किए गए कोड की तुलना में ज़्यादा असरदार होता है. ऊपर दिए गए उदाहरण में, इससे कोई फ़र्क़ नहीं पड़ता. हालांकि, ज़्यादा जटिल कार्रवाइयों के लिए, यह अंतर काफ़ी ज़्यादा हो सकता है.

जैसा कि नाम से पता चलता है, x86 कोड, x86 आर्किटेक्चर पर निर्भर करता है. अगर असेंबली कोड लिखने का कोई ऐसा तरीका हो जो किसी खास आर्किटेक्चर पर निर्भर न हो, लेकिन असेंबली के परफ़ॉर्मेंस फ़ायदे उसे मिलें, तो क्या होगा?

asm.js

आर्किटेक्चर पर निर्भर न रहने वाले असेंबली कोड को लिखने का पहला चरण asm.js था. यह JavaScript का एक सबसेट है. इसका इस्तेमाल कंपाइलर के लिए, लो-लेवल और असरदार टारगेट लैंग्वेज के तौर पर किया जा सकता है. इस सब-लैंग्वेज में, C या C++ जैसी मेमोरी के लिए असुरक्षित भाषाओं के लिए, सैंडबॉक्स की गई वर्चुअल मशीन के बारे में बताया गया है. स्टैटिक और डाइनैमिक पुष्टि के कॉम्बिनेशन की वजह से, JavaScript इंजन, मान्य asm.js कोड के लिए, पहले से ही ऑप्टिमाइज़ किए गए कंपाइलेशन की रणनीति का इस्तेमाल कर सकते हैं. मैन्युअल मेमोरी मैनेजमेंट (जैसे कि C) वाली स्टैटिक टाइप की भाषाओं में लिखे गए कोड को, सोर्स-टू-सोर्स कंपाइलर से ट्रांसलेट किया जाता था. जैसे, early Emscripten (LLVM पर आधारित).

परफ़ॉर्मेंस को बेहतर बनाने के लिए, भाषा से जुड़ी सुविधाओं को एओटी के हिसाब से सीमित किया गया. Firefox 22 पहला ब्राउज़र था, जिसने asm.js के साथ काम करने की सुविधा दी थी. इसे OdinMonkey के नाम से रिलीज़ किया गया था. Chrome ने वर्शन 61 में asm.js के साथ काम करने की सुविधा जोड़ी थी. asm.js अब भी ब्राउज़र में काम करता है. हालांकि, अब इसकी जगह WebAssembly ने ले ली है. इस समय asm.js का इस्तेमाल उन ब्राउज़र के लिए किया जा सकता है जिन पर WebAssembly काम नहीं करता.

WebAssembly

WebAssembly, असेंबली जैसी लो-लेवल लैंग्वेज है. इसका बाइनरी फ़ॉर्मैट छोटा होता है. यह नेटिव परफ़ॉर्मेंस के साथ काम करती है. यह C/C++ और Rust जैसी भाषाओं के साथ-साथ, कई अन्य भाषाओं को कंपाइल करने का टारगेट देती है, ताकि वे वेब पर चल सकें. मेमोरी मैनेज करने वाली भाषाओं, जैसे कि Java और Dart के लिए, यह सुविधा जल्द ही उपलब्ध होगी. Kotlin/Wasm के लिए, यह सुविधा पहले ही उपलब्ध हो चुकी है. WebAssembly को JavaScript के साथ काम करने के लिए डिज़ाइन किया गया है, ताकि दोनों साथ मिलकर काम कर सकें.

ब्राउज़र के अलावा, WebAssembly प्रोग्राम अन्य रनटाइम में भी चलते हैं. ऐसा WASI की वजह से होता है. WASI, WebAssembly के लिए एक मॉड्यूलर सिस्टम इंटरफ़ेस है. WASI को अलग-अलग ऑपरेटिंग सिस्टम पर पोर्टेबल बनाने के लिए बनाया गया है. इसका मकसद सुरक्षित रहना और सैंडबॉक्स किए गए एनवायरमेंट में काम करना है.

WebAssembly कोड (बाइनरी कोड, यानी कि बाइटकोड) को पोर्टेबल वर्चुअल स्टैक मशीन (वीएम) पर चलाने के लिए बनाया गया है. बाइटकोड को JavaScript की तुलना में तेज़ी से पार्स और एक्ज़ीक्यूट करने के लिए डिज़ाइन किया गया है. साथ ही, इसमें कोड को छोटा करके दिखाया जाता है.

निर्देशों को कॉन्सेप्ट के हिसाब से लागू करने के लिए, पारंपरिक प्रोग्राम काउंटर का इस्तेमाल किया जाता है. यह काउंटर, निर्देशों के हिसाब से आगे बढ़ता है. आम तौर पर, ज़्यादातर Wasm इंजन, Wasm बाइटकोड को मशीन कोड में कंपाइल करते हैं. इसके बाद, उसे एक्ज़ीक्यूट करते हैं. निर्देशों को दो कैटगरी में बांटा गया है:

  • कंट्रोल इंस्ट्रक्शन, फ़ॉर्म कंट्रोल कंस्ट्रक्ट करते हैं और स्टैक से आर्ग्युमेंट वैल्यू को हटाते हैं. ये प्रोग्राम काउंटर को बदल सकते हैं और स्टैक पर नतीजे की वैल्यू को पुश कर सकते हैं.
  • आसान निर्देश, जो स्टैक से आर्ग्युमेंट की वैल्यू निकालते हैं, वैल्यू पर ऑपरेटर लागू करते हैं, और फिर नतीजे की वैल्यू को स्टैक पर पुश करते हैं. इसके बाद, प्रोग्राम काउंटर अपने-आप आगे बढ़ता है.

ऊपर दिए गए उदाहरण पर वापस जाएं. यहां दिया गया WebAssembly कोड, लेख की शुरुआत में दिए गए x86 कोड के बराबर होगा:

i32.const 5  ; Push the integer value 5 onto the stack.
i32.const 10 ; Push the integer value 10 onto the stack.
i32.mul      ; Pop the two most recent items on the stack,
             ; multiply them, and push the result onto the stack.

asm.js को पूरी तरह से सॉफ़्टवेयर में लागू किया जाता है. इसका मतलब है कि इसका कोड किसी भी JavaScript इंजन में चल सकता है. भले ही, उसे ऑप्टिमाइज़ न किया गया हो. वहीं, WebAssembly के लिए नई सुविधा की ज़रूरत होती है, जिस पर सभी ब्राउज़र वेंडर सहमत हुए. WebAssembly को साल 2015 में लॉन्च करने का एलान किया गया था. इसे पहली बार मार्च 2017 में रिलीज़ किया गया था. WebAssembly को 5 दिसंबर, 2019 को W3C का सुझाव मिला. W3C, इस स्टैंडर्ड को बनाए रखता है. इसमें सभी मुख्य ब्राउज़र वेंडर और अन्य पक्ष योगदान देते हैं. साल 2017 से, यह सुविधा सभी ब्राउज़र के लिए उपलब्ध है.

WebAssembly के दो वर्शन होते हैं: टेक्स्ट और बाइनरी. ऊपर दिया गया टेक्स्ट, इमेज का ब्यौरा है.

टेक्स्ट के तौर पर जानकारी देना

टेक्स्ट फ़ॉर्मैट में जानकारी दिखाने के लिए, S-एक्सप्रेशन का इस्तेमाल किया जाता है. साथ ही, आम तौर पर फ़ाइल एक्सटेंशन .wat का इस्तेमाल किया जाता है. यह WebAssembly text फ़ॉर्मैट के लिए होता है. अगर आपको लिखना ही है, तो इसे हाथ से लिखा जा सकता है. ऊपर दिए गए गुणा के उदाहरण को लेते हुए, इसे ज़्यादा काम का बनाया गया है. इसके लिए, फ़ैक्टर को अब हार्डकोड नहीं किया गया है. इस कोड को समझने के लिए, यहां दिया गया कोड देखें:

(module
  (func $mul (param $factor1 i32) (param $factor2 i32) (result i32)
    local.get $factor1
    local.get $factor2
    i32.mul)
  (export "mul" (func $mul))
)

बाइनरी फ़ॉर्मैट

.wasm फ़ाइल एक्सटेंशन का इस्तेमाल करने वाला बाइनरी फ़ॉर्मैट, इंसानों के इस्तेमाल के लिए नहीं बनाया गया है. इसलिए, इसे इंसानों के लिए बनाना भी मुश्किल है. wat2wasm जैसे टूल का इस्तेमाल करके, ऊपर दिए गए कोड को इस बाइनरी फ़ॉर्मैट में बदला जा सकता है. (टिप्पणियां आम तौर पर बाइनरी फ़ॉर्मैट में नहीं होती हैं. हालांकि, wat2wasm टूल इन्हें बेहतर तरीके से समझने के लिए जोड़ता है.)

0000000: 0061 736d                             ; WASM_BINARY_MAGIC
0000004: 0100 0000                             ; WASM_BINARY_VERSION
; section "Type" (1)
0000008: 01                                    ; section code
0000009: 00                                    ; section size (guess)
000000a: 01                                    ; num types
; func type 0
000000b: 60                                    ; func
000000c: 02                                    ; num params
000000d: 7f                                    ; i32
000000e: 7f                                    ; i32
000000f: 01                                    ; num results
0000010: 7f                                    ; i32
0000009: 07                                    ; FIXUP section size
; section "Function" (3)
0000011: 03                                    ; section code
0000012: 00                                    ; section size (guess)
0000013: 01                                    ; num functions
0000014: 00                                    ; function 0 signature index
0000012: 02                                    ; FIXUP section size
; section "Export" (7)
0000015: 07                                    ; section code
0000016: 00                                    ; section size (guess)
0000017: 01                                    ; num exports
0000018: 03                                    ; string length
0000019: 6d75 6c                          mul  ; export name
000001c: 00                                    ; export kind
000001d: 00                                    ; export func index
0000016: 07                                    ; FIXUP section size
; section "Code" (10)
000001e: 0a                                    ; section code
000001f: 00                                    ; section size (guess)
0000020: 01                                    ; num functions
; function body 0
0000021: 00                                    ; func body size (guess)
0000022: 00                                    ; local decl count
0000023: 20                                    ; local.get
0000024: 00                                    ; local index
0000025: 20                                    ; local.get
0000026: 01                                    ; local index
0000027: 6c                                    ; i32.mul
0000028: 0b                                    ; end
0000021: 07                                    ; FIXUP func body size
000001f: 09                                    ; FIXUP section size
; section "name"
0000029: 00                                    ; section code
000002a: 00                                    ; section size (guess)
000002b: 04                                    ; string length
000002c: 6e61 6d65                       name  ; custom section name
0000030: 01                                    ; name subsection type
0000031: 00                                    ; subsection size (guess)
0000032: 01                                    ; num names
0000033: 00                                    ; elem index
0000034: 03                                    ; string length
0000035: 6d75 6c                          mul  ; elem name 0
0000031: 06                                    ; FIXUP subsection size
0000038: 02                                    ; local name type
0000039: 00                                    ; subsection size (guess)
000003a: 01                                    ; num functions
000003b: 00                                    ; function index
000003c: 02                                    ; num locals
000003d: 00                                    ; local index
000003e: 07                                    ; string length
000003f: 6661 6374 6f72 31            factor1  ; local name 0
0000046: 01                                    ; local index
0000047: 07                                    ; string length
0000048: 6661 6374 6f72 32            factor2  ; local name 1
0000039: 15                                    ; FIXUP subsection size
000002a: 24                                    ; FIXUP section size

WebAssembly में कंपाइल करना

जैसा कि आपने देखा, न तो .wat और न ही .wasm, दोनों ही इंसानों के लिए बहुत ज़्यादा मददगार नहीं हैं. ऐसे में, Emscripten जैसे कंपाइलर का इस्तेमाल किया जाता है. इसकी मदद से, C और C++ जैसी हाई-लेवल लैंग्वेज से कंपाइल किया जा सकता है. Rust और अन्य भाषाओं के लिए, कई अन्य कंपाइलर उपलब्ध हैं. यहां दिया गया C कोड देखें:

#include <stdio.h>

int main() {
  printf("Hello World\n");
  return 0;
}

आम तौर पर, इस C प्रोग्राम को कंपाइलर gcc की मदद से कंपाइल किया जाता है.

$ gcc hello.c -o hello

Emscripten इंस्टॉल होने के बाद, इसे WebAssembly में कंपाइल करने के लिए, emcc कमांड और लगभग एक जैसे आर्ग्युमेंट का इस्तेमाल करें:

$ emcc hello.c -o hello.html

इससे hello.wasm फ़ाइल और एचटीएमएल रैपर फ़ाइल hello.html बन जाएगी. जब वेब सर्वर से hello.html फ़ाइल को दिखाया जाता है, तब आपको DevTools कंसोल में "Hello World" प्रिंट किया हुआ दिखेगा.

एचटीएमएल रैपर के बिना भी WebAssembly में कंपाइल करने का एक तरीका है:

$ emcc hello.c -o hello.js

पहले की तरह, इससे hello.wasm फ़ाइल बनेगी. हालांकि, इस बार एचटीएमएल रैपर के बजाय hello.js फ़ाइल बनेगी. जांच करने के लिए, नतीजे के तौर पर मिली JavaScript फ़ाइल hello.js को चलाएं. उदाहरण के लिए, Node.js:

$ node hello.js
Hello World

ज़्यादा जानें

WebAssembly के बारे में दी गई यह छोटी सी जानकारी, सिर्फ़ एक झलक है. MDN पर WebAssembly के दस्तावेज़ में, WebAssembly के बारे में ज़्यादा जानें. साथ ही, Emscripten के दस्तावेज़ देखें. सच कहें, तो WebAssembly के साथ काम करना थोड़ा उल्लू बनाने का तरीका मीम जैसा लग सकता है. ऐसा इसलिए, क्योंकि एचटीएमएल, सीएसएस, और JavaScript के बारे में जानने वाले वेब डेवलपर को ज़रूरी नहीं कि C जैसी भाषाओं के बारे में भी पता हो. अच्छी बात यह है कि StackOverflow के webassembly टैग जैसे चैनल मौजूद हैं. यहां विशेषज्ञ, आपकी मदद करने के लिए हमेशा तैयार रहते हैं. हालांकि, आपको उनसे विनम्रता से मदद मांगनी होगी.

Acknowledgements

इस लेख की समीक्षा याकोब कुमेरो, डेरेक शफ़, और राशेल ऐंड्रयू ने की है.