機械学習にもとづくビデオエフェクトでアプリを強化

機械学習にもとづくビデオエフェクトでアプリを強化

フレームレート変換、超高解像度、ノイズフィルタなどのエフェクトを追加して、ビデオ編集やライブストリーミングの体験を向上させる方法を学びましょう。Video Toolboxフレームワークに搭載され、Appleシリコン向けに最適化された機械学習にもとづくビデオ処理アルゴリズムについて詳しく説明します。これらのエフェクトを統合し、実際のユースケースで利用できるようにアプリの機能を向上させる方法について解説します。

関連する章
- 0:00 - イントロダクション
- 1:04 - ビデオエフェクトの概要
- 4:55 - アプリへのエフェクトの追加
- 6:46 - 使用例：フレームレート変換
- 11:16 - 使用例：被写体ぶれエフェクト
- 13:46 - 使用例：低遅延／超高解像度エフェクト
- 14:55 - 使用例：低遅延フレーム補間
リソース
こんにちは Video ProcessingチームエンジニアのMakhloufです Video Toolboxはビデオアプリで最も使用されているフレームワークの1つです様々なビデオのニーズに対応できるように豊富な機能を備えています macOS 15.4以降 Appleシリコンに最適化した MLベースのビデオ処理アルゴリズムの VTFrameProcessor APIによって強化されましたがうれしいことにこのAPIを iOS 26でも利用できるようになりましたこのビデオでは最初にVTFrameProcessor APIにより利用可能になったエフェクトについて説明した後エフェクトをアプリに統合する基本的な手順について見ていきます最後によくあるいくつかのユースケースを例として実際に実装してみます VTFrameProcessor APIには多用途に対応する様々なエフェクトがありますフレームレート変換や超高解像度被写体ぶれなどのエフェクトは高品質のビデオ編集用に設計されています低遅延のフレーム補間や超高解像度エフェクトはリアルタイムに処理する必要があるアプリに向いていますテンポラルノイズフィルタはそのどちらの場合も使用できますこれらのエフェクトを使用してどのようなことができるか見てみましょうフレームレート変換ではクリップの1秒あたりのフレーム数をターゲットのFPSに合わせて調整できますこれはスローモーションエフェクトの作成にも使用されます左側はサッカー選手がゴールを喜んでいるビデオです右側はスローモーションエフェクトを適用した同じビデオですアクションを遅くすることでどれくらい喜んでいるかがよくわかる映像にすることができプレーヤーの気持ちを強調することができます超高解像度スケーラはビデオの解像度を向上させ古いビデオの細部を復元できるため写真補正やメディア復元などのアプリに最適ですこの例では超高解像度エフェクトを適用することでビデオの鮮明さと明瞭さが向上されています右側のボートの方がより詳細で明瞭に表現されています超高解像度では 2つのMLモデルが利用可能で 1つは画像用でもう1つはビデオ用です被写体ぶれは映画制作で人気のある機能の1つで観客が期待する自然な動きを生み出すために不可欠ですこのエフェクトは様々なエフェクトを作るのにも使用されますこの例では右側のビデオに被写体ぶれエフェクトが適用されていますエフェクトによりバイカーが疾走しているように見せることができますまたこのエフェクトは左側のビデオのようなガタガタした動きを滑らかにしより見やすいビデオにすることができますもう1つの非常に役立つエフェクトはテンポラルノイズフィルタですこれは前後の参照フレームを使用して推測されたモーションに基づいていますビデオの一時的なノイズやアーティファクトを除去するのに役立ちますビデオを圧縮しやすくなりビデオの画質も向上させることができます左側の木のビデオにはたくさんのカラーノイズがありますエフェクトを適用した右側のビデオではだいぶきれいになっています特に交通標識のノイズが減っています低遅延フレーム補間エフェクトではフレームレートをリアルタイムでアップサンプリングすることができますオプションで解像度をアップサンプリングすることもできます左側の女性が歩きながらカメラに話している低フレームレートのビデオでは映像が途切れ途切れになっています右側の改善したビデオではよりスムーズになって見やすくなっています低遅延ビデオ超高解像度エフェクトは軽量の超高解像度スケーラですこのエフェクトは特にネットワーク状況がよくない場合でもビデオ会議を快適に行えるように最適化されていますコーディングアーティファクトを減らしエッジを鮮明にすることで画質を改善しますこのエフェクトを実際に見てみましょう左側の男性が話しているビデオは解像度が低く画質もよくありません右側の処理したビデオでは解像度が高く圧縮アーティファクトも減りエッジが鮮明になって顔の細かな特徴がわかるようになっています次にこれらのエフェクトをどのようにアプリに統合できるかについて説明しますアプリとフレームワークの間でどのようにデータがやり取りされるのか説明しますクリップを処理する主な手順についても説明します VTFrameProcessor APIを利用するにはアプリにVideo Toolboxフレームワークをインポートする必要がありますその後 2つの主な手順でクリップを処理できます最初の手順はエフェクトを選択することですこの段階でアプリは処理セッションを開始し一連の設定を提供してセッション全体にエフェクトをどのように使用するかを説明しますセッションが作成されたらアプリはフレームを処理する VTFrameProcessorオブジェクトを取得します VTFrameProcessorはフレームベースのAPIであるため入力ビデオフレームをパラメータと一緒に 1つずつ送信する必要があります処理が完了するとフレームワークから出力フレームが返されます VTFrameProcessor APIを活用できる多数のユースケースがありますその例をいくつか見ていきそれらの実装方法を紹介しますその前に話しておきたい点としてこのプレゼンテーションには参考資料として完全に機能するサンプルコードが添付されていますデモアプリにはこれらのエフェクトを試せるテストクリップが用意されていますここではビデオ編集とライブビデオの改善の 2つのユースケースを見ていきましょうフレームレート変換や超高解像度また被写体ぶれやテンポラルノイズフィルタはいずれもビデオの画質が最も重要視されるビデオ編集アプリにとても適していますフレームレート変換から見ていきましょうフレームレート変換ではビデオクリップのフレーム数を増やす処理が行われますこの処理は新しいフレームを合成しそれらを既存のフレームの間に挿入することによって行われます通常は再生の滑らかさを向上させるために行われます特にソースとターゲットでディスプレイのフレームレートが異なるため画像がカクつく場合に行われますこのエフェクトはフレームの欠落によるギャップを埋めるのに役立ちますまたスローモーションエフェクトを作る場合にも使用されますこれは映画制作でよく使われるエフェクトでアクションシーンをゆっくり再生することで視覚的な印象を強める効果がありますスポーツではゲームの決定的な瞬間を強調したり分析したりするためにスローモーションが使用されます左側にはダンスの基本ステップを練習する男性のビデオが示されています右側はスローモーションエフェクトを適用した同じビデオですエフェクトを適用することで視聴者がダンスの複雑な動きをゆっくり見ることができるようになるだけでなくより魅力的な映像にすることができますではVTFrameProcessor APIを使用して実際にフレームレート変換を実装してみましょう最初にエフェクト用のセッションを作成しますこれを行うには VTFrameProcessor オブジェクトを作成します次に設定オブジェクトを作成します VTFrameRateConversion Configuration型をフレームレート変換には使用します設定を初期化するには入力フレームの幅や高さオプティカルフローを事前に計算するかどうか画質レベルやアルゴリズムのリビジョンなどいくつかの設定を指定する必要がありますこれでセッション開始メソッドを呼び出しフレーム処理エンジンを初期化することができます次にパラメータオブジェクトを使用してフレームを処理しますがそれには VTFrameRateConversion Parameters型のオブジェクトを使用する必要がありますパラメータクラスを使用する前に必要なバッファをすべて割り当てる必要があります一般的に入出力フレームのバッファはすべて呼び出し元によって割り当てられます設定クラスのソースと宛先のピクセルバッファ属性を使用して CVPixelBufferプールを設定できます最初に現在のソースフレームオブジェクトと次のフレームオブジェクトを作成します次に interpolationPhase配列を作成し補間されたフレームを挿入する場所を指定します配列サイズはフレームを何個補間するかを示しています最後にバッファを使用して出力を受信する宛先配列を作成しますこれはinterpolationPhase配列と同じサイズになりますバッファの準備ができたので残りのパラメータを設定しますここではオプティカルフローをnilに設定しプロセッサがフローを計算できるようにしましたまたフレームを順番に送信するかランダムに送信するかを示す送信モードも設定しました VTFrameRateConversion Parametersが作成されたら process関数を呼び出して実際の処理を行うことができます要約すると各エフェクトは 2種類のクラスによって定義されます 1つはエフェクトの処理セッションの設定方法を定義するVTFrame ProcessorConfigurationクラスともう1つは入力フレームと出力フレームまた関連するすべてのパラメータを定義するVTFrame ProcessorParametersクラスですアプリを開発するときに行うべき重要な決定事項はオプティカルフローを事前に計算するかどうかですフロー計算は負荷が大きいためアプリによっては事前にフロー計算を行いレンダリング時のパフォーマンスを向上させている場合がありますオプティカルフローを事前に計算するには VTOpticalFlowConfigurationクラスと VTOpticalFlowParametersクラスを使います事前に計算されたフローパラメータの使用を無効に設定した場合フレームワークはフローをその場で計算します
次にもう1つの重要なビデオ編集機能について説明しますそれは被写体ぶれです被写体ぶれは遅いシャッター速度をシミュレートし移動するオブジェクトにぼかしたエフェクトを作成しますぼかしの強さは APIを介して調整できどれくらいぼかすかをコントロールできますこのエフェクトは動きを自然に見せたり高速で移動する物体にスピード感を加えて芸術性を高めたりするためなど様々な状況で使用されます左側は高速道路のタイムラプスビデオです被写体ぶれエフェクトを適用した右側の映像はより流動的になっていますタイムラプスビデオに被写体ぶれを適用すると自然な動きが再現されよりリアルに見せることができ静止画が連続している感じを軽減できます被写体ぶれ処理セッションを作成するには VTMotionBlurConfigurationを使います参考として設定方法がよく似ているフレームレート変換の例を参照できます次に VTMotionBlurParameters オブジェクトを初期化してフレームを処理する方法を紹介します被写体ぶれにはその次とその前の 2つの参照フレームが必要になりますクリップの最初のフレームで前のフレームをnilに設定しクリップの最後で次のフレームを nilに設定する必要がありますフレームバッファの準備ができたので VTMotionBlurParametersを作成しますフローパラメータをnilに設定してプロセッサにオプティカルフローを計算させます次にぼかしの強さを 1〜100の範囲で選択します被写体ぶれパラメータを作成したら process関数を呼び出して実際の処理を開始できます次にビデオ会議やライブストリーミングなどリアルタイムで使用できるように設計されたいくつかの機能について説明しますテンポラルノイズフィルタや低遅延フレーム補間超高解像エフェクトはいずれもリアルタイムで使用できるように設計されていますこれらではパフォーマンスを意識しながら画質を向上させることができます低遅延エフェクトの場合通常画質の向上は受信側のデバイス上で行われます次にこれらのエフェクトのいくつかを見てみましょう最初に低遅延超高解像度エフェクトから見てみましょうこのエフェクトを実装するにはLowLatency SuperResolutionScalerConfigurationと Parametersクラスを使用しますどちらのクラスも使い方は簡単です設定クラスに必要なのはフレームの幅と高さとスケーリング比のみでパラメータクラスに必要なのはソースと宛先のフレームバッファのみですこの例は低遅延超高解像度によりビデオ会議セッションの画質がどのように向上するかを示しています左側のビデオではビデオ通話をしているひげを生やした男性が話したり笑ったり身を振ったりしています解像度が低いためぼやけて見えます超高解像度を適用すると右側のビデオのように男性の顔特にひげの質感が大幅に鮮明になっています低遅延フレーム補間もリアルタイムのビデオ会議の画質を向上させることができるように設計されていますこれはビデオ通話アプリに非常に有効なエフェクトで特に接続速度が遅い場合に効果的ですこのエフェクトを適用するには適切なバージョンの LowLatencyFrame InterpolationConfigurationと Parametersクラスを使用します低遅延フレーム補間によりどのようにカクつきが滑らかになりストリーミング体験が快適なものになるかについては先ほど示しましたこのAPIにはフレームレート倍増機能と解像度アップスケーリング機能を 1つのフィルタにまとめた追加のユーティリティが用意されています
処理後は女性の顔の特徴や背景がより鮮明になりストリーミングがよりスムーズです Video Toolboxフレームワークにはハードウェアビデオエンコーディング機能やデコーディング機能への直接アクセスなど多くの機能が事前に用意されていますこれによりビデオの圧縮や解凍またピクセル形式の変換などのサービスが可能になります VTFrameProcessor APIが追加されたことによりデベロッパはさらに魅力的なアプリを作成できるようになりました VTFrameProcessor APIについて学ぶことができました今すぐこれらのエフェクトをアプリに統合しましょうスローモーションや被写体ぶれなどの新しいエフェクトでビデオ編集機能を強化しましょう低遅延超高解像度やフレーム補間エフェクトを使ってライブストリーミング体験を向上させましょうこれらは VTFrameProcessor APIでできるようになることのほんの一例にすぎませんビデオのご視聴ありがとうございました皆さんの動画を見るのを楽しみにしています

8:06 - Frame rate conversion configuration

// Frame rate conversion configuration


let processor = VTFrameProcessor()

guard let configuration = VTFrameRateConversionConfiguration(frameWidth: width,
                                                            frameHeight: height,
                                                     usePrecomputedFlow: false,
                                                  qualityPrioritization: .normal,
                                                               revision: .revision1)
else {
     throw Fault.failedToCreateFRCConfiguration
}

try processor.startSession(configuration: configuration)

8:56 - Frame rate conversion buffer allocation

// Frame rate conversion buffer allocation

//use sourcePixelBufferAttributes and destinationPixelBufferAttributes property of VTFrameRateConversionConfiguration to create source and destination CVPixelBuffer pools

sourceFrame = VTFrameProcessorFrame(buffer: curPixelBuffer, presentationTimeStamp: sourcePTS)
nextFrame = VTFrameProcessorFrame(buffer: nextPixelBuffer, presentationTimeStamp: nextPTS)

// Interpolate 3 frames between reference frames for 4x slow-mo
var interpolationPhase: [Float] = [0.25, 0.5, 0.75]

//create destinationFrames
let destinationFrames = try framesBetween(firstPTS: sourcePTS,
                                           lastPTS: nextPTS,
                            interpolationIntervals: intervals)

9:48 - Frame rate conversion parameters

// Frame rate conversion parameters

guard let parameters = VTFrameRateConversionParameters(sourceFrame: sourceFrame,
                                                         nextFrame: nextFrame,
                                                       opticalFlow: nil,
                                                interpolationPhase: interpolationPhase,
                                                    submissionMode: .sequential,
                                                 destinationFrames: destinationFrames)
else {
     throw Fault.failedToCreateFRCParameters
}

try await processor.process(parameters: parameters)

12:35 - Motion blur process parameters

// Motion blur process parameters

sourceFrame = VTFrameProcessorFrame(buffer: curPixelBuffer, presentationTimeStamp: sourcePTS)
nextFrame = VTFrameProcessorFrame(buffer: nextPixelBuffer, presentationTimeStamp: nextPTS)
previousFrame = VTFrameProcessorFrame(buffer: prevPixelBuffer, presentationTimeStamp: prevPTS)
destinationFrame = VTFrameProcessorFrame(buffer: destPixelBuffer, presentationTimeStamp: sourcePTS)

guard let parameters = VTMotionBlurParameters(sourceFrame: currentFrame,
                                                nextFrame: nextFrame,
                                            previousFrame: previousFrame,
                                          nextOpticalFlow: nil,
                                      previousOpticalFlow: nil,
                                       motionBlurStrength: strength,
                                           submissionMode: .sequential,
                                         destinationFrame: destinationFrame) 
else {
    throw Fault.failedToCreateMotionBlurParameters
}

try await processor.process(parameters: parameters)

関連する章

リソース