Google I/O にご参加いただきありがとうございました。オンデマンドでコンテンツを視聴できます。

このページは Cloud Translation API によって翻訳されました。

AirSHIFT が React アプリのランタイムパフォーマンスを改善した 5 つの方法

React SPA のパフォーマンス最適化の実際のケーススタディ。

Kento Tsuji

Satoshi Arai

Yusuke Utsunomiya

Yosuke Furukawa

ウェブサイトのパフォーマンスは読み込み時間だけではありません。特に、ユーザーが日常的に使用する生産性の高いデスクトップアプリでは、高速でレスポンシブなエクスペリエンスをユーザーに提供することが重要です。Recruit Technologies のエンジニアリングチームは、リファクタリングプロジェクトを実施してウェブアプリの AirSHIFT を改善し、ユーザー入力のパフォーマンスを向上させました。以下にその取り組みをご紹介いたします。

応答が遅い、生産性が低い

AirSHIFT は、レストランやカフェなどの店舗オーナーがスタッフのシフトを管理するのに役立つデスクトップウェブアプリケーションです。React で構築されたこのシングルページアプリケーションは、日、週、月などで整理されたシフトスケジュールのグリッドテーブルなど、豊富なクライアント機能を備えています。

AirSHIFT ウェブアプリのスクリーンショット。

Recruit Technologies のエンジニアリングチームが AirSHIFT アプリに新機能を追加したところ、パフォーマンスの低下に関するフィードバックが増え始めました。AirSHIFT のエンジニアリングマネージャーである古川洋介氏は次のように述べています。

ユーザー調査で、ある店舗オーナーが、シフト表の読み込みを待つ間、ボタンをクリックした後に席を離れてコーヒーを淹れると言っていたことに驚きました。

エンジニアリングチームは調査を通じて、ユーザーの多くが 10 年前の 1 GHz の Celeron M ノートパソコンなど、低スペックのコンピュータで大規模なシフトテーブルを読み込んでいることに気づきました。

ローエンドデバイス上のエンドレススピナー。

AirSHIFT アプリは、高負荷なスクリプトでメインスレッドをブロックしていましたが、エンジニアリングチームは高速な Wi-Fi 接続を備えた高スペックのコンピュータで開発とテストを行っていたため、スクリプトの負荷の高さに気づいていませんでした。

アプリの実行時のアクティビティを示すグラフ。 — シフトテーブルを読み込む際、読み込み時間の約 80% がスクリプトの実行に費やされました。

CPU とネットワークスロットリングを有効にして Chrome DevTools でパフォーマンスをプロファイリングした結果、パフォーマンスの最適化が必要であることが明らかになりました。AirSHIFT は、この問題に対処するためにタスクフォースを結成しました。アプリをユーザー入力に迅速に応答させるために、以下の 5 つのことに重点を置きました。

1. 大規模なテーブルを仮想化する

シフト表を表示するには、仮想 DOM の作成と、スタッフ数と時間帯に比例した画面へのレンダリングという、複数の負荷の高いステップが必要でした。たとえば、あるレストランに 50 人の作業メンバーがいて、毎月のシフトのスケジュールを確認したい場合、50（メンバー）数に 30（日）を掛けたテーブルであれば、1,500 個のセルコンポーネントをレンダリングすることになります。これは、特に低スペックのデバイスで非常にコストの高いオペレーションです。実際は、状況はさらに悪化していました。調査の結果、200 名のスタッフを管理する店舗があり、月に 1 つのテーブルで約 6,000 個のセルコンポーネントを必要とすることがわかりました。

このオペレーションのコストを削減するために、AirSHIFT はシフトテーブルを仮想化しました。アプリは、ビューポート内のコンポーネントのみをマウントし、画面外のコンポーネントのマウントを解除します。

AirSHIFT を使用してビューポートの外のコンテンツをレンダリングしたことを示す注釈付きのスクリーンショット。 — 前: シフト表のすべてのセルをレンダリング。

AirSHIFT がビューポートに表示されるコンテンツのみをレンダリングするようになったことを示す、アノテーション付きのスクリーンショット。 — 後: ビューポート内のセルのみをレンダリングします。

このケースでは、複雑な 2 次元グリッドテーブルの有効化に関する要件があったため、AirSHIFT は React-virtualized を使用しました。また、今後は軽量の react-window を使用するように実装を変換する方法も検討しています。

結果

テーブルを仮想化しただけで、スクリプト実行時間が 6 秒短縮されました（CPU が 4 倍に減速し、高速 3G でスロットリングされた Macbook Pro 環境）。これは、リファクタリングプロジェクトで最も効果的なパフォーマンス改善でした。

Chrome DevTools の [Performance] パネルの記録に注釈を付けたスクリーンショット。 — 以前: ユーザー入力後に約 10 秒のスクリプト処理。

Chrome DevTools の [Performance] パネルの記録の別のアノテーション付きスクリーンショット。 — 後: ユーザー入力後 4 秒のスクリプト。

2. User Timing API による監査

次に、AirSHIFT チームは、ユーザー入力で実行されるスクリプトをリファクタリングしました。Chrome DevTools の炎グラフを使用すると、メインスレッドで実際に何が起こっているかを分析できます。しかし、AirSHIFT チームは、React のライフサイクルに基づいてアプリケーションアクティビティを分析するほうが簡単だと判断しました。

React 16 では、User Timing API を介してパフォーマンストレースが提供されます。これは、Chrome DevTools の [Timings] セクションで可視化できます。AirSHIFT は、[タイミング] セクションを使用して、React ライフサイクルイベントで実行されている不要なロジックを見つけました。

Chrome DevTools の [Performance] パネルの [Timings] セクション。 — React のユーザータイミングイベント。

結果

AirSHIFT チームは、すべてのルートナビゲーションの直前に不要な React Tree Reconciliation が発生していることを発見しました。つまり、React はナビゲーションの前にシフトテーブルを不必要に更新していました。この問題の原因は、不要な Redux の状態の更新が原因です。この問題を修正することで、スクリプト実行時間が約 750 ミリ秒短縮されました。AirSHIFT では、他のマイクロ最適化も行い、最終的にスクリプト作成時間を合計 1 秒短縮しました。

3. コンポーネントの遅延読み込みと高コストのロジックをウェブワーカーに移動する

AirSHIFT にはチャットアプリケーションが組み込まれています。多くのショップオーナーは、シフト表を見ながらチャットでスタッフとやり取りしています。つまり、表の読み込み中にユーザーがメッセージを入力している可能性があります。テーブルをレンダリングするスクリプトがメインスレッドで占有されている場合、ユーザー入力にジャンクが生じる可能性があります。

このエクスペリエンスを改善するため、AirSHIFT では React.lazy と Suspense を使用して、実際のコンポーネントを遅延読み込みしながら、表コンテンツのプレースホルダを表示するようになりました。

AirSHIFT チームは、遅延読み込みコンポーネント内の費用のかかるビジネスロジックの一部をウェブワーカーに移行しました。これにより、メインスレッドを解放してユーザー入力への対応に集中できるようにすることで、ユーザー入力ジャンクの問題を解決しました。

通常、デベロッパーはワーカーの使用に複雑さを感じますが、今回は Comlink が面倒な作業を代行しました。以下は、AirSHIFT が最も費用のかかるオペレーションの 1 つである総労働費用の計算をワーカー化した方法の疑似コードです。

App.js で React.lazy と Suspense を使用して、読み込み中にフォールバックコンテンツを表示する

/** App.js */
import React, { lazy, Suspense } from 'react'

// Lazily loading the Cost component with React.lazy
const Hello = lazy(() => import('./Cost'))

const Loading = () => (
  <div>Some fallback content to show while loading</div>
)

// Showing the fallback content while loading the Cost component by Suspense
export default function App({ userInfo }) {
   return (
    <div>
      <Suspense fallback={<Loading />}>
        <Cost />
      </Suspense>
    </div>
  )
}

[費用] コンポーネントで、comlink を使用して計算ロジックを実行する

/** Cost.js */
import React from 'react';
import { proxy } from 'comlink';

// import the workerlized calc function with comlink
const WorkerlizedCostCalc = proxy(new Worker('./WorkerlizedCostCalc.js'));
export default async function Cost({ userInfo }) {
  // execute the calculation in the worker
  const instance = await new WorkerlizedCostCalc();
  const cost = await instance.calc(userInfo);
  return <p>{cost}</p>;
}

ワーカーで実行される計算ロジックを実装し、comlink で公開する

// WorkerlizedCostCalc.js
import { expose } from 'comlink'
import { someExpensiveCalculation } from './CostCalc.js'

// Expose the new workerlized calc function with comlink
expose({
  calc(userInfo) {
    // run existing (expensive) function in the worker
    return someExpensiveCalculation(userInfo);
  }
}, self);

結果

トライアルとしてワーカー化したロジックは限られているものの、AirSHIFT は JavaScript をメインスレッドからワーカースレッドに約 100 ミリ秒シフトしました（4 倍の CPU スロットリングでシミュレート）。

Chrome DevTools の [Performance] パネルの記録のスクリーンショット。メインスレッドではなく、Web Worker でスクリプティングが行われていることを示しています。

AirSHIFT は現在、ジャンクをさらに削減するために、他のコンポーネントを遅延読み込みし、より多くのロジックをウェブワーカーにオフロードできるかどうかを検討しています。

4. パフォーマンスバジェットの設定

こうした最適化をすべて実装した後、アプリのパフォーマンスが時間の経過とともに低下しないようにすることが重要でした。AirSHIFT で bundlesize が使用されるようになり、現在の JavaScript ファイルと CSS ファイルのサイズを超えないようになりました。これらの基本的な予算を設定するだけでなく、シフトテーブルの読み込み時間のさまざまなパーセンタイルが表示されるダッシュボードを作成して、理想的でない状況でもアプリケーションのパフォーマンスが良好かどうかを確認しました。

すべての Redux イベントのスクリプト完了時間が測定されるようになりました
パフォーマンスデータは Elasticsearch で収集されます。
各イベントの 10 パーセンタイル、25 パーセンタイル、50 パーセンタイル、75 パーセンタイルのパフォーマンスが Kibana で可視化されます。

AirSHIFT は、シフト表の読み込みイベントをモニタリングし、75 パーセンタイル以上のユーザーに対して 3 秒以内に完了するようにしました。これは現時点では適用されていない予算ですが、予算を超過した場合は、Elasticsearch を介した自動通知を検討しています。

75 パーセンタイルが 2,500 ms 前後、50 パーセンタイルが 1,250 ms 前後、25 パーセンタイルが 750 ms 前後、10 パーセンタイルが 500 ms 前後で完了することを示すグラフ。 — パーセンタイル別の日次パフォーマンスデータを示す Kibana ダッシュボード。

結果

上のグラフから、AirSHIFT は現在、75 パーセンタイルのユーザーのほとんどが 3 秒のバジェットに達しており、25 パーセンタイルのユーザーはシフトテーブルを 1 秒以内に読み込んでいることがわかります。さまざまな状態やデバイスから RUM パフォーマンスデータをキャプチャすることで、AirSHIFT は新機能リリースがアプリケーションのパフォーマンスに実際に影響を与えているかどうかを確認できるようになりました。

5. パフォーマンスハッカソン

こうしたパフォーマンス最適化の取り組みはすべて重要で効果がありましたが、エンジニアリングチームとビジネスチームに機能以外の開発を優先させるのは必ずしも簡単ではありません。課題の一部は、これらのパフォーマンスの最適化の一部を計画できないことです。試行錯誤と試行錯誤の考え方が必要です。

AirSHIFT では、エンジニアがパフォーマンス関連の作業にのみ集中できるように、社内で 1 日間のパフォーマンスハッカソンを実施しています。これらのハッカソンでは、すべての制約を取り除き、エンジニアの創造性を尊重します。つまり、スピードに貢献する実装はすべて検討に値します。ハッカソンを加速させるため、AirSHIFT ではグループを小規模なチームに分割し、各チームがLighthouse のパフォーマンススコアを最も大きく改善できるチームを競い合います。チームは非常に競争的になります。🔥

ハッカソンの写真。

結果

ハッカソンアプローチはうまく機能しています。

パフォーマンスのボトルネックを見つけるには、ハッカソン中に複数のアプローチを実際に試し、Lighthouse でそれぞれを測定します。
ハッカソンの後、本番環境リリースに向けて優先すべき最適化をチームに納得させることは比較的簡単です。
また、スピードの重要性を訴求する効果的な方法でもあります。参加者は、コードの書き方とパフォーマンスの関係を理解できます。

良い副作用として、リクルート内の他の多くのエンジニアリングチームがこの実践的なアプローチに興味を持ち、AirSHIFT チームは現在、社内で複数のスピードハッカソンを開催しています。

概要

AirSHIFT がこれらの最適化に取り組むのは、決して簡単なことではありませんが、確実に成果が得られました。AirSHIFT は中央値で 1.5 秒以内にシフトテーブルを読み込むことができ、プロジェクト開始前のパフォーマンスから 6 倍向上しています。

パフォーマンスの最適化がリリースされた後、あるユーザーは次のように述べています。

シフト表の読み込みを高速化してくださり、ありがとうございます。シフト勤務の調整が非常に効率的になりました。