媒體應用程式基本概念

Derek Herman
Derek Herman
Joe Medley
Joe Medley

處理媒體時,通常需要變更媒體檔案的特性,例如位元率或解析度。尋找簡單易行的入門方式可能會讓人卻步。本頁面將說明所用工具,以及如何快速安裝這些工具。

首先,我們會說明兩種常見指令列媒體公用程式的基本用法:Shaka PackagerFFmpeg,然後協助您快速安裝這些工具。為什麼要涵蓋兩個應用程式?雖然這兩種方法本身都相當實用,但都無法提供所有必要的網路媒體準備作業。我們也建立了媒體轉換媒體加密頁面,其中介紹了這兩個應用程式較常執行的作業。

這些應用程式並非處理檔案的唯一選項,但它們是兩個最常見且功能強大的應用程式。其他選項包括 GUI 應用程式 MiroHandBrakeVLC。另外還有 ZencoderAmazon Elastic EncoderGoogle Transcoder API 等編碼/轉碼服務。

Shaka Packager

Shaka Packager 是免費的媒體封裝 SDK。如果您在網站上使用媒體播放器,請使用 Shaka Packager 準備檔案。這種類型支援兩種最常用的影片串流通訊協定轉換:透過 HTTP (DASH) 或 HTTP 即時串流 (HLS) 動態自動調整串流。Shaka Packager 支援主要的安全防護功能:通用加密和 Widevine 數位權利管理 (DRM)。也能處理直播和隨選影片。

不論套件上說明為何,這項公用程式不僅適用於 C++ 開發人員。您可以將其用作建構媒體軟體的程式庫,也可以將其用作指令列公用程式,為網路播放作業準備媒體檔案。後者對我們來說比較有用。事實上,對網頁媒體創作者而言,Shaka Packager 是執行某些工作的唯一方法,而不需要支付昂貴的商業應用程式費用。

以下是 Shaka Packager 指令的基本模式:

packager stream_descriptor [stream_descriptor-2 [stream_descriptor-n]] [flags]

這與輸入 packager -help 的結果不太一樣。這個範例較容易理解,這反映了 Shaka Packager 說明文件中的範例。請注意,模式中有多個 stream_descriptor 項目。雖然我們沒有顯示,但您可以透過單一指令分別操作檔案的影片和音訊串流。

請比較這個基本模式與顯示檔案特性的簡易用法。在本例中,我們已將等同的部分排成一列。

packager stream_descriptor [stream_descriptor-n] [flags]

packager input=glocken.mp4                       --dump_stream_info

指令會輸出以下內容:

File "glocken.mp4":
Found 2 stream(s).
Stream [0] type: Video
 codec_string: avc1.640028
 time_scale: 30000
 duration: 300300 (10.0 seconds)
 is_encrypted: false
 codec: H264
 width: 1920
 height: 1080
 pixel_aspect_ratio: 1:1
 trick_play_factor: 0
 nalu_length_size: 4

Stream [1] type: Audio
 codec_string: mp4a.40.2
 time_scale: 48000
 duration: 481280 (10.0 seconds)
 is_encrypted: false
 codec: AAC
 sample_bits: 16
 num_channels: 2
 sampling_frequency: 48000
 language: eng
 seek_preroll_ns: 20833

請參閱「媒體檔案的基本概念」一文,並注意以下幾點。Full HD 高畫質的高度與寬度都正確,而音訊和影片轉碼器則是最適合其容器類型 (音訊和視訊的 AAC) 和 H264 視訊轉碼器的理想選擇。另請注意,串流會使用數字來識別。這對於分別操控音訊和視訊的作業而言非常有用。

請注意,上述輸出內容並未顯示位元率。雖然缺少的資訊,但輸出內容更容易閱讀,因此我們盡可能使用該結果。當我們需要 Shaka Packager 無法取得的資訊 (例如比特率) 時,就會使用 FFmpeg。

FFmpeg

FFmpeg 也是一款免費應用程式,可用於錄製、轉換及串流媒體檔案。但功能比 Shaka Packager 還低或更差。 兩者只是不同。

FFmpeg 指令的基本模式如下所示:

ffmpeg [GeneralOptions] [InputFileOptions] -i input [OutputFileOptions] output

這個應用程式可處理多個串流,就像 Shaka Packager 一樣。其中部分選項會用於多個位置,並根據指令中的不同位置,以不同方式操控檔案輸出內容。請留意這一點,並查看 Stack Overflow 上的 FFmpeg 問題和類似網站。

我們將再次比較基本模式與顯示檔案特性的範例。

    ffmpeg [GeneralOptions] [InputFileOptions] -i input        [OutputFileOptions] output

    ffmpeg                                     -i glocken.mp4

除了所要求的資訊外,這也會列印錯誤訊息,如以下範例所示。這是因為這在技術上是 FFmpeg 的錯誤用法。我們使用這項功能,是因為它會顯示我們關心的資訊。

Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'glocken.mp4':
  Metadata:
    major_brand     : isom
    minor_version   : 512
    compatible_brands: isomiso2avc1mp41
    encoder         : Lavf58.17.100
  Duration: 00:01:47.53, start: 0.000000, bitrate: 10715 kb/s
    Stream #0:0(eng): Video: h264 (High) (avc1 / 0x31637661), yuvj420p(pc), 1920x1080, 10579 kb/s, 29.97 fps, 29.97 tbr, 30k tbn, 59.94 tbc (default)
    Metadata:
      handler_name    : VideoHandler
    Stream #0:1(eng): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 128 kb/s (default)
    Metadata:
      handler_name    : SoundHandler
At least one output file must be specified

使用 Docker 安裝應用程式

如果您打算按照指示操作並嘗試我們的指令,可以手動安裝必要工具,或是採用簡單的途徑,使用 Docker。建議您使用 Docker,因為這樣可以為您省下大量時間。此外,我們也提供操作說明,協助您快速完成設定。

  1. 首先,請在電腦上建立名為 media-tools 的新目錄。您可以使用任何名稱,但請注意,以下說明假設您使用 media-tools 做為目錄名稱。

  2. media-tools 中建立 dockermedia 目錄。這會將 media 目錄排除在建構環境之外。這一點很重要,因為 media 是我們要執行作業的檔案儲存位置,其中有些檔案可能相當大。如果將 Dockerfile 直接放入 media-tools,日後如果要重新建構映像檔 (例如變更已安裝的版本),可能會導致建構速度變慢。

  3. 建立 /media-tools/docker/Dockerfile,並新增下列建構指示:

    FROM google/shaka-packager:release-v2.4.3 as packager
    FROM jrottenberg/ffmpeg:4.3.2-alpine38
    COPY --from=packager /usr/bin /usr/bin
    ENTRYPOINT  ["sh"]
    
  4. 建構映像檔:

    docker build -t media-tools ./docker
    
  5. 將映像檔做為互動式殼層執行。在 Linux 上執行下列操作:

    docker run -w /media -v ${PWD}/media:/media -it --rm media-tools
    /media #
    

    Windows:

    docker run -w /media -v %cd%/media:/media -it --rm media-tools
    /media #
    

執行映像檔時,您可以檢查 FFmpeg 和 Shaka Packager 的版本,藉由執行 ffmpeg -versionpackager --version 驗證一切是否順利。輸出內容應如下所示:

/media # ffmpeg -version
ffmpeg version 4.3.2 Copyright (c) 2000-2021 the FFmpeg developers
built with gcc 6.4.0 (Alpine 6.4.0)
configuration: --disable-debug --disable-doc --disable-ffplay --enable-shared --enable-avresample --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-gpl --enable-libass --enable-fontconfig --enable-libfreetype --enable-libvidstab --enable-libmp3lame --enable-libopus --enable-libtheora --enable-libvorbis --enable-libvpx --enable-libwebp --enable-libxcb --enable-libx265 --enable-libxvid --enable-libx264 --enable-nonfree --enable-openssl --enable-libfdk_aac --enable-postproc --enable-small --enable-version3 --enable-libbluray --enable-libzmq --extra-libs=-ldl --prefix=/opt/ffmpeg --enable-libopenjpeg --enable-libkvazaar --enable-libaom --extra-libs=-lpthread --enable-libsrt --enable-libaribb24 --extra-cflags=-I/opt/ffmpeg/include --extra-ldflags=-L/opt/ffmpeg/lib
libavutil      56. 51.100 / 56. 51.100
libavcodec     58. 91.100 / 58. 91.100
libavformat    58. 45.100 / 58. 45.100
libavdevice    58. 10.100 / 58. 10.100
libavfilter     7. 85.100 /  7. 85.100
libavresample   4.  0.  0 /  4.  0.  0
libswscale      5.  7.100 /  5.  7.100
libswresample   3.  7.100 /  3.  7.100
libpostproc    55.  7.100 / 55.  7.100
/media # packager --version
packager version v2.4.3-dd9870075f-release

您已嘗試使用 Shaka Packager 和 FFmpeg,現在可以繼續學習基本概念,接下來是媒體串流基本概念