مقدمه
ضبط صوتی/تصویری برای مدت طولانی " جام مقدس" توسعه وب بوده است. سالهاست که مجبور بودهایم برای انجام کار به افزونههای مرورگر ( فلش یا سیلورلایت ) اعتماد کنیم. بیا!
HTML5 برای نجات. ممکن است واضح نباشد، اما ظهور HTML5 باعث افزایش دسترسی به سخت افزار دستگاه شده است. موقعیت جغرافیایی (GPS)، API جهتگیری (شتابسنج)، WebGL (GPU)، و Web Audio API (سختافزار صوتی) نمونههای کاملی هستند. این ویژگیها به طرز مضحکی قدرتمند هستند و APIهای جاوا اسکریپت سطح بالایی را نشان میدهند که در بالای قابلیتهای سختافزاری اساسی سیستم قرار دارند.
این آموزش یک API جدید به نام GetUserMedia را معرفی می کند که به برنامه های وب اجازه می دهد به دوربین و میکروفون کاربر دسترسی داشته باشند.
جاده getUserMedia()
اگر از تاریخچه آن آگاه نیستید، راهی که به API getUserMedia()
رسیدیم داستان جالبی است.
چندین نوع از "API های ضبط رسانه" در چند سال گذشته تکامل یافته اند. بسیاری از افراد نیاز به دسترسی به دستگاه های بومی را در وب تشخیص دادند، اما این امر باعث شد همه و مادرشان مشخصات جدیدی را جمع آوری کنند. اوضاع آنقدر به هم ریخت که سرانجام W3C تصمیم گرفت یک گروه کاری تشکیل دهد. تنها هدف آنها؟ دیوانگی را معنا کن! گروه کاری Device APIs Policy (DAP) وظیفه ادغام + استاندارد کردن تعداد زیادی از پیشنهادات را بر عهده دارد.
من سعی خواهم کرد آنچه را که در سال 2011 اتفاق افتاد خلاصه کنم…
دور 1: ضبط رسانه HTML
HTML Media Capture اولین اقدام DAP در استانداردسازی ضبط رسانه در وب بود. با بارگذاری بیش از حد <input type="file">
و افزودن مقادیر جدید برای پارامتر accept
کار می کند.
اگر میخواهید به کاربران اجازه دهید با وبکم از خود عکس بگیرند، این کار با capture=camera
امکانپذیر است:
<input type="file" accept="image/*;capture=camera">
ضبط ویدیو یا صدا مشابه است:
<input type="file" accept="video/*;capture=camcorder">
<input type="file" accept="audio/*;capture=microphone">
یه جورایی خوبه درسته؟ من به خصوص دوست دارم که از ورودی فایل استفاده مجدد کند. از نظر معنایی، بسیار منطقی است. جایی که این «API» خاص کوتاهی میکند، توانایی انجام جلوههای بیدرنگ (مثلاً ارائه دادههای وبکم زنده به یک <canvas>
و اعمال فیلترهای WebGL) است. HTML Media Capture فقط به شما امکان می دهد یک فایل رسانه ای را ضبط کنید یا یک عکس فوری به موقع بگیرید.
پشتیبانی:
- مرورگر Android 3.0 - یکی از اولین اجراها. این ویدیو را ببینید تا آن را در عمل ببینید.
- Chrome for Android (0.16)
- فایرفاکس موبایل 10.0
- iOS6 Safari و Chrome (پشتیبانی جزئی)
دور 2: عنصر دستگاه
بسیاری فکر می کردند HTML Media Capture بسیار محدود کننده است، بنابراین یک مشخصات جدید ظاهر شد که از هر نوع دستگاه (آینده) پشتیبانی می کرد. جای تعجب نیست که طراحی یک عنصر جدید، عنصر <device>
را فراخوانی کرد که به getUserMedia()
تبدیل شد.
Opera یکی از اولین مرورگرهایی بود که پیاده سازی های اولیه فیلم برداری را بر اساس عنصر <device>
ایجاد کرد. بلافاصله پس از آن (به طور دقیق در همان روز )، WhatWG تصمیم گرفت تگ <device>
را به نفع یک آپدیت دیگر حذف کند، این بار یک API جاوا اسکریپت به نام navigator.getUserMedia()
. یک هفته بعد، اپرا بیلدهای جدیدی را منتشر کرد که شامل پشتیبانی از مشخصات getUserMedia()
به روز شده بود. در اواخر همان سال، مایکروسافت با انتشار آزمایشگاهی برای IE9 که از مشخصات جدید پشتیبانی می کرد، به حزب پیوست.
در اینجا چیزی است که <device>
به نظر می رسد:
<device type="media" onchange="update(this.data)"></device>
<video autoplay></video>
<script>
function update(stream) {
document.querySelector('video').src = stream.url;
}
</script>
پشتیبانی:
متأسفانه، هیچ مرورگری منتشر نشده تا به حال <device>
را شامل نشده است. حدس میزنم یک API کمتر برای نگرانی :) <device>
دو چیز عالی داشت: 1.) معنایی بود و 2.) برای پشتیبانی از دستگاههای صوتی/تصویری به راحتی قابل گسترش بود.
نفس بکش این چیزها سریع حرکت می کنند!
دور 3: WebRTC
عنصر <device>
در نهایت راه Dodo را طی کرد.
سرعت یافتن یک API عکسبرداری مناسب به لطف تلاش بزرگتر WebRTC (ارتباطات زمان واقعی وب) تسریع شد. این مشخصات توسط گروه کاری W3C WebRTC نظارت می شود. گوگل، اپرا، موزیلا و چند مورد دیگر پیاده سازی هایی دارند.
getUserMedia()
مربوط به WebRTC است زیرا دروازه ورود به مجموعه APIها است. ابزاری برای دسترسی به جریان دوربین/میکروفون محلی کاربر فراهم می کند.
پشتیبانی:
getUserMedia()
از Chrome 21، Opera 18 و Firefox 17 پشتیبانی میشود.
شروع کردن
با navigator.mediaDevices.getUserMedia()
، در نهایت میتوانیم بدون افزونه از ورودی وبکم و میکروفون استفاده کنیم. دسترسی به دوربین اکنون یک تماس است، نه نصب دور. مستقیماً در مرورگر پخته می شود. هنوز هیجان زده اید؟
تشخیص ویژگی
تشخیص ویژگی یک بررسی ساده برای وجود navigator.mediaDevices.getUserMedia
است:
if (navigator.mediaDevices?.getUserMedia) {
// Good to go!
} else {
alert("navigator.mediaDevices.getUserMedia() is not supported");
}
دسترسی به دستگاه ورودی
برای استفاده از وب کم یا میکروفون، باید اجازه درخواست کنیم. اولین پارامتر برای navigator.mediaDevices.getUserMedia()
یک شی است که جزئیات و الزامات هر نوع رسانه ای را که می خواهید به آن دسترسی داشته باشید مشخص می کند. به عنوان مثال، اگر می خواهید به وب کم دسترسی داشته باشید، اولین پارامتر باید {video: true}
باشد. برای استفاده از میکروفون و دوربین، {video: true, audio: true}
را ارسال کنید:
<video autoplay></video>
<script>
navigator.mediaDevices
.getUserMedia({ video: true, audio: true })
.then((localMediaStream) => {
const video = document.querySelector("video");
video.srcObject = localMediaStream;
})
.catch((error) => {
console.log("Rejected!", error);
});
</script>
باشه پس اینجا چه خبر است؟ ضبط رسانه نمونه کاملی از همکاری APIهای جدید HTML5 است. این در ارتباط با دیگر دوستان HTML5 ما، <audio>
و <video>
کار می کند. توجه داشته باشید که ما یک ویژگی src
تنظیم نمی کنیم یا عناصر <source>
را در عنصر <video>
درج نمی کنیم. به جای اینکه ویدیو را با URL به یک فایل رسانه ای وارد کنیم، srcObject
روی شی LocalMediaStream
تنظیم می کنیم که نشان دهنده وب کم است.
به <video>
هم می گویم که به autoplay
وگرنه در فریم اول فریز می شود. افزودن controls
نیز همانطور که انتظار داشتید کار می کند.
تنظیم محدودیت های رسانه (رزولیشن، ارتفاع، عرض)
پارامتر اول getUserMedia()
همچنین میتواند برای تعیین الزامات (یا محدودیتهای) بیشتر در جریان رسانه بازگشتی استفاده شود. بهعنوان مثال، بهجای اینکه فقط نشان دهید که میخواهید به ویدیو دسترسی اولیه داشته باشید (به عنوان مثال {video: true}
)، میتوانید علاوه بر این میتوانید جریان را HD باشد:
const hdConstraints = {
video: { width: { exact: 1280} , height: { exact: 720 } },
};
const stream = await navigator.mediaDevices.getUserMedia(hdConstraints);
const vgaConstraints = {
video: { width: { exact: 640} , height: { exact: 360 } },
};
const stream = await navigator.mediaDevices.getUserMedia(hdConstraints);
برای پیکربندیهای بیشتر، API محدودیتها را ببینید.
انتخاب منبع رسانه
متد enumerateDevices()
در رابط MediaDevices
فهرستی از دستگاه های ورودی و خروجی رسانه موجود مانند میکروفون، دوربین، هدست و غیره را درخواست می کند. Promise برگشتی با آرایه ای از اشیاء MediaDeviceInfo
که دستگاه ها را توصیف می کنند حل می شود.
در این مثال، آخرین میکروفون و دوربینی که پیدا شده است به عنوان منبع جریان رسانه انتخاب شده است:
if (!navigator.mediaDevices?.enumerateDevices) {
console.log("enumerateDevices() not supported.");
} else {
// List cameras and microphones.
navigator.mediaDevices
.enumerateDevices()
.then((devices) => {
let audioSource = null;
let videoSource = null;
devices.forEach((device) => {
if (device.kind === "audioinput") {
audioSource = device.deviceId;
} else if (device.kind === "videoinput") {
videoSource = device.deviceId;
}
});
sourceSelected(audioSource, videoSource);
})
.catch((err) => {
console.error(`${err.name}: ${err.message}`);
});
}
async function sourceSelected(audioSource, videoSource) {
const constraints = {
audio: { deviceId: audioSource },
video: { deviceId: videoSource },
};
const stream = await navigator.mediaDevices.getUserMedia(constraints);
}
نسخه ی نمایشی عالی Sam Dutton را ببینید که چگونه به کاربران اجازه دهید منبع رسانه را انتخاب کنند.
امنیت
مرورگرها با فراخوانی navigator.mediaDevices.getUserMedia()
یک کادر گفتگوی مجوز را نشان میدهند که به کاربران این امکان را میدهد که به دوربین/میکرون خود اجازه یا رد کنند. به عنوان مثال، در اینجا گفتگوی مجوز Chrome آمده است:
ارائه بازگشت
برای کاربرانی که از navigator.mediaDevices.getUserMedia()
پشتیبانی نمیکنند، یکی از گزینهها این است که اگر API پشتیبانی نمیشود و/یا تماس به دلایلی انجام نشد، به فایل ویدیویی موجود برگردند:
if (!navigator.mediaDevices?.getUserMedia) {
video.src = "fallbackvideo.webm";
} else {
const stream = await navigator.mediaDevices.getUserMedia({ video: true });
video.srcObject = stream;
}