媒體應用程式基本概念

Derek Herman
Derek Herman
Joe Medley
Joe Medley

處理媒體時,通常需要變更媒體檔案的特性,例如位元率或解析度。尋找簡單易行的入門方式,可能會讓您感到相當困難。本頁面將說明所用工具,以及如何快速安裝這些工具。

首先,我們會說明兩種常見指令列媒體公用程式的基本用法:Shaka PackagerFFmpeg,然後協助您快速安裝這些工具。為什麼要涵蓋兩個應用程式?雖然這兩種方法本身都很強大且實用,但都無法提供製作網路媒體所需的一切。我們也建立了媒體轉換媒體加密頁面,其中列舉了這兩個應用程式更多常見的作業。

這些應用程式並非處理檔案的唯一選項,但它們是兩個最常見且功能強大的應用程式。其他選項包括 GUI 應用程式 MiroHandBrakeVLC。另外還有 ZencoderAmazon Elastic EncoderGoogle Transcoder API 等編碼/轉碼服務。

Shaka Packager

Shaka Packager 是免費的媒體封裝 SDK。如果您在網站上使用媒體播放器,請使用 Shaka Packager 準備檔案。這項工具支援兩種最常見的影片串流通訊協定轉換:基於 HTTP 的動態自動調整串流 (DASH) 或 HTTP 即時串流 (HLS)。Shaka Packager 支援主要安全性功能:通用加密和 Widevine 數位版權管理 (DRM)。也能處理直播和隨選影片。

不論套件上說明為何,這項公用程式不僅適用於 C++ 開發人員。您可以將其用作建構媒體軟體的程式庫,也可以將其用作指令列公用程式,為網路播放作業準備媒體檔案。後者對我們來說比較有用。事實上,對於網路媒體創作者而言,Shaka Packager 是唯一可用於執行某些工作,且不必花錢購買昂貴商業應用程式的工具。

以下是 Shaka Packager 指令的基本模式:

packager stream_descriptor [stream_descriptor-2 [stream_descriptor-n]] [flags]

這與輸入 packager -help 的結果不太一樣。這個範例更容易推理,並反映 Shaka Packager 說明文件中的範例。請注意,模式中有多個 stream_descriptor 項目。雖然我們沒有顯示,但您可以使用單一指令分別操作檔案的影片和音訊串流。

請比較這個基本模式與顯示檔案特性的簡易用法。在本例中,我們已將等同的部分排列在一起。

packager stream_descriptor [stream_descriptor-n] [flags]

packager input=glocken.mp4                       --dump_stream_info

指令會輸出以下內容:

File "glocken.mp4":
Found 2 stream(s).
Stream [0] type: Video
 codec_string: avc1.640028
 time_scale: 30000
 duration: 300300 (10.0 seconds)
 is_encrypted: false
 codec: H264
 width: 1920
 height: 1080
 pixel_aspect_ratio: 1:1
 trick_play_factor: 0
 nalu_length_size: 4

Stream [1] type: Audio
 codec_string: mp4a.40.2
 time_scale: 48000
 duration: 481280 (10.0 seconds)
 is_encrypted: false
 codec: AAC
 sample_bits: 16
 num_channels: 2
 sampling_frequency: 48000
 language: eng
 seek_preroll_ns: 20833

請參閱「媒體檔案的基本概念」一文,並注意以下幾點。高度和寬度正確對應至全高畫質,音訊和視訊轉碼器則是其容器類型的首選轉碼器,音訊為 AAC,視訊為 H.264。請注意,串流會以數字標示。這些方法對於分別操控音訊和影像的作業很有幫助。

請注意,上述輸出內容並未顯示位元率。儘管缺少了一些內容,但這項輸出內容較易閱讀,因此我們會盡可能使用這項輸出內容。當我們需要 Shaka Packager 無法取得的資訊 (例如比特率) 時,就會使用 FFmpeg。

FFmpeg

FFmpeg 也是一款免費應用程式,可用於錄製、轉換及串流媒體檔案。其功能不比 Shaka Packager 好,也不比它差。兩者只是不同。

FFmpeg 指令的基本模式如下所示:

ffmpeg [GeneralOptions] [InputFileOptions] -i input [OutputFileOptions] output

和 Shaka Packager 一樣,這個應用程式可以處理多個串流。其中部分選項會用於多個位置,並根據指令中的不同位置,以不同方式操控檔案輸出內容。請留意這一點,並查看 Stack Overflow 上的 FFmpeg 問題和類似網站。

我們將再次比較基本模式與顯示檔案屬性的範例。

    ffmpeg [GeneralOptions] [InputFileOptions] -i input        [OutputFileOptions] output

    ffmpeg                                     -i glocken.mp4

除了我們要求的資訊之外,這項操作也會顯示錯誤訊息,如以下範例所示。這是因為這在技術上是 FFmpeg 的錯誤用法。我們使用這項功能,是因為它會顯示我們關心的資訊。

Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'glocken.mp4':
  Metadata:
    major_brand     : isom
    minor_version   : 512
    compatible_brands: isomiso2avc1mp41
    encoder         : Lavf58.17.100
  Duration: 00:01:47.53, start: 0.000000, bitrate: 10715 kb/s
    Stream #0:0(eng): Video: h264 (High) (avc1 / 0x31637661), yuvj420p(pc), 1920x1080, 10579 kb/s, 29.97 fps, 29.97 tbr, 30k tbn, 59.94 tbc (default)
    Metadata:
      handler_name    : VideoHandler
    Stream #0:1(eng): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 128 kb/s (default)
    Metadata:
      handler_name    : SoundHandler
At least one output file must be specified

使用 Docker 安裝應用程式

如果您打算按照指示操作並嘗試我們的指令,可以手動安裝必要工具,或是採用簡單的途徑,使用 Docker。建議您使用 Docker,這樣可以節省大量時間。此外,我們也提供操作說明,協助您快速完成設定。

  1. 首先,請在電腦上建立名為 media-tools 的新目錄。您可以使用任何名稱,但請注意,以下說明假設您使用 media-tools 做為目錄名稱。

  2. media-tools 中建立 dockermedia 目錄。這麼做可將 media 目錄從建構內容中移除。這點很重要,因為 media 是我們要執行作業的檔案儲存位置,其中有些檔案可能相當大。如果將 Dockerfile 直接放入 media-tools,日後如果要重新建構映像檔 (例如變更已安裝的版本),可能會導致建構速度變慢。

  3. 建立 /media-tools/docker/Dockerfile,並新增下列建構指示:

    FROM google/shaka-packager:release-v2.4.3 as packager
    FROM jrottenberg/ffmpeg:4.3.2-alpine38
    COPY --from=packager /usr/bin /usr/bin
    ENTRYPOINT  ["sh"]
    
  4. 建構映像檔:

    docker build -t media-tools ./docker
    
  5. 以互動式殼層的形式執行映像檔。在 Linux 上執行下列操作:

    docker run -w /media -v ${PWD}/media:/media -it --rm media-tools
    /media #
    

    Windows:

    docker run -w /media -v %cd%/media:/media -it --rm media-tools
    /media #
    

執行映像檔時,您可以檢查 FFmpeg 和 Shaka Packager 的版本,藉由執行 ffmpeg -versionpackager --version 驗證一切是否順利。輸出內容應如下所示:

/media # ffmpeg -version
ffmpeg version 4.3.2 Copyright (c) 2000-2021 the FFmpeg developers
built with gcc 6.4.0 (Alpine 6.4.0)
configuration: --disable-debug --disable-doc --disable-ffplay --enable-shared --enable-avresample --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-gpl --enable-libass --enable-fontconfig --enable-libfreetype --enable-libvidstab --enable-libmp3lame --enable-libopus --enable-libtheora --enable-libvorbis --enable-libvpx --enable-libwebp --enable-libxcb --enable-libx265 --enable-libxvid --enable-libx264 --enable-nonfree --enable-openssl --enable-libfdk_aac --enable-postproc --enable-small --enable-version3 --enable-libbluray --enable-libzmq --extra-libs=-ldl --prefix=/opt/ffmpeg --enable-libopenjpeg --enable-libkvazaar --enable-libaom --extra-libs=-lpthread --enable-libsrt --enable-libaribb24 --extra-cflags=-I/opt/ffmpeg/include --extra-ldflags=-L/opt/ffmpeg/lib
libavutil      56. 51.100 / 56. 51.100
libavcodec     58. 91.100 / 58. 91.100
libavformat    58. 45.100 / 58. 45.100
libavdevice    58. 10.100 / 58. 10.100
libavfilter     7. 85.100 /  7. 85.100
libavresample   4.  0.  0 /  4.  0.  0
libswscale      5.  7.100 /  5.  7.100
libswresample   3.  7.100 /  3.  7.100
libpostproc    55.  7.100 / 55.  7.100
/media # packager --version
packager version v2.4.3-dd9870075f-release

您已嘗試使用 Shaka Packager 和 FFmpeg,現在可以繼續學習基本概念,接下來是媒體串流基本概念