シズベルの専門家が AI 主導のコーデックの改善を実証
AI の活用により EVC 圧縮効率が 26% 向上 ― CTO の Giovanni Ballocca とエンジニアの Alessandra Mosca を含むシズベル研究チームが成果を発表
Sisvel Tech の代表者を含む研究チームは、AI ベースのツールを MPEG-5 EVC 規格に統合し、コーデックの性能を 26% 向上させました。この研究内容を詳述した査読済みの論文は、当該分野の主要学術誌である Multimedia Tools and Applications に先月公表されました。
本研究は、AI 対応のデータコーディング仕様を策定するために 2020 年に創設された標準化団体 MPAI の後援の下で行われました。Sisvel Technology の会長兼 CEO の Massimo Marcarini は、MPAI の理事を務めています。
論文の著者は 8 名で、シズベルの CTO である Giovanni Ballocca と Sisvel Tech の特許エンジニアである Alessandra Mosca も名を連ねています。両氏は、データの準備と分析、実験の実施、論文の執筆に貢献しました。その他の共著者は、キプロスの CYENS Center of Excellence、トリノ大学、Polytechnic Institute of Paris、RAI、MPAI に所属する専門家たちです。
著者らによれば、「私たちの知る限り、本研究はディープラーニングツールを使用して EVC 規格の性能向上を図った初の試みである」とのことです。EVC コーデックは、2020 年に標準化団体の MPEG によって策 定され、従来の非 AI フレームワークで最先端の圧縮効率をすでに達成していることから、本研究の対象として選ばれました。
本論文の主な貢献は以下の 2 点です。
1. EVC 内の 2 つのコーディングブロックを AI ベースのツールに置き換える方法を提案
2. この AI ベースのエンコーディングフレームワークを統合することで、パフォーマンスが大幅に向上することを実証
研究チームは、EVC 仕様の中でニューラルネットワークが効果を発揮できる領域として、2 つの分野を特定しました。1 つ目は「超解像度」で、ビデオを元の解像度に復元する後処理工程です。ディープニューラルネットワークは、低解像度画像と高解像度画像間の複雑な対応関係を学習する能力があることを実証したため、この処理に適していると考えられました。
もう 1 つは、「イントラ予測」と呼ばれるデータ削減処理で、すでにデコード済みの近傍画素を参照することで、対象となるピクセルブロックの内容をコーデックが予測する技術です。ここでも AI ツールが活用されました。
データセット、実験、結果に関する詳細な情報が、本論文に記載されています。主な成果として、ビデオ品質を一定に保ちながら、BD レート(2 つのコーデック(または構成)間の平均ビットレート削減率を測定する圧縮効率の指標)において、26% の改善が達成されました。
研究者らはまた、AI ツールの使用による性能向上は、個別的な改善にとどまらず、相乗的に効果を発揮すること、さらに実際のアプリケーションへの一般化が可能であることを示しました。
今後の研究課題として、チームは以下の方 向性を挙げています。
インループフィルタリングなどの高度な技術を適用した、パフォーマンスのさらなる向上
提案した AI アーキテクチャをさらに最適化し、効率性の向上を維持しながら、計算負荷を軽減
他のビデオコーデックへのこれらのツールの適用を模索
論文の全文は、こちらから取得できます。

