このページの全ては誤っているかもしれません。[[x264関連の記事に関して]]を読んでください。 *(2010/10/07:追記)この記事は古く、'''誤っています'''。新記事の[[HEVC(H.265/HVC)]]を参照してください。 *(2010/04/23:追記)タイムラインに関して記述しました。 *(2010/04/07:追記)英語版Wikipediaの記述が変わっていたので対応しました。 *(2009/10/28:変更)日立の提案している方式に関して断片的な情報を得たので記述のニュアンスを変えました。 !!!H.265 猫科研究所ではMPEG-4 Part10 AVC / H.264関連の記事が増えてきているが、この記事で紹介するのは''H.265''、またはH.264'''+'''(''NGVC''という呼び方もある)だ。 なお、テクニカルな記事というより''興味本位の読み物''と思ってほしい。 H.265はその名前から察することができるように、''H.264の次世代''に予定される動画圧縮規格である。 ただし、現在のところまだ正式に規格としてリリースされておらず、検討中の段階だ。 [Vcodex|http://www.vcodex.com/h265.html]によれば、2010年中にリファレンスコーデックが開発され、2011-2012年にドラフト作成、2012-2013年に勧告されるのではないかということだ。 ひとまず、[英語版WikipediaのH.265のページ|http://en.wikipedia.org/wiki/H.265]から概要を抜き出してみよう。 Wikipediaかよ、という意見はあるかと思うが所詮読み物なのでご勘弁を。 !!英語版Wikipediaの抜粋&和訳 H.265はITU-T Video Coding Experts Group(VCEG)で改善余地を研究中である。 初期段階ではH.264の改良ではなく''新規の符号化方式''と考えられていた。 しかし、目標に関しての合意はいくらかなされたものの、現在のところ完全新規のH.265スタンダード(H.265規格)ではなく、JVT(Joint Video Team)によるH.264のリファレンス実装であるKTA(Key Technical Area) ''JM11の修正に止まっている''。 このような状況のため、全く新規のH.265はひとまず置いておき、プロジェクトは2009年4月にその方向性を''NGVC''(Next Generation Video Coding)に変更した。 これは''H.264+''とも呼ぶべきもので、H.264 High profileに比較して同じ画質、50%〜300%の計算複雑性で、最大で50%のビットレート削減が要件となっている。 実際のところ、H.264 High profileと同等の視覚的画質において、''計算複雑性の50%、ビットレートの25%が削減可能''になっているらしい。 また、2009年7月にはMPEGとVCEGのミーティングが開かれ、JVTの様なNGVCとHVCのコラボレーションに付いて議論された。 !機能 *2次元・分割不能・適応的補完フィルタ(AIF: adaptive interpolation filter)(2-D non-separable AIF)。 *分割可能AIF。 *指向性AIF。 *==1/8画素動きベクタの動き補償。==(いつの間にか取り下げられたみたい) *空間・周波数領域での適応的予測エラー符号化(APEC: Adaptive prediction error coding)。 *最大64x64の構造で追加の変換(transform)を伴なう"Supermacroblock"。 *''適応的量子化マトリックス選択''(AQMS: Adaptive quantization matrix selection)。 *''動きベクタ選択と符号化に対する競争ベースのスキーム''(計画法)。 *''イントラ符号化に対するモード依存型KLT''。 これらはマルチパスエンコードで最も効果が高いと考えられている。 !!英語版Wikipediaからわかること まず、そもそもH.265は計画自体が足下から揺らいでおり、''名称も実態もH.264+、H.NGVCと呼ぶほうが正確''になってきている。 H.264のリファレンスコーデックであるJMへの改造によって進んでおり、''H.264に比べて25%のビットレート削減と50%の計算量削減''が実現できているらしい。 機能的に猫科研究所で分かるのは、==動き補償が1/8画素になり、==量子化マトリックスが適応的に変更可能で、イントラ符号化がより効率よくなりそうだ、といったところ。恐らく計算量の削減は主に動き補償関連でなされており、ビットレートの削減は主にAIFと適応的量子化マトリックス、イントラ符号化の改善でなされているのではないかと思う。AIFについては中身が分からないので何とも言えない部分もあるが。 (2010/04/07追記)空間・周波数領域での適応的予測エラー符号化(APEC)に関しては、どうやら[hiki blog: KTAソフトウェアに関して|http://mhiki.blogspot.com/2008/11/kta.html]で語られている、動き補償などによって差分を得た後に''DCTをかけない''方式を指すようだ。 つまり、これまで周波数領域でのみ行っていた処理に対し、空間領域のままの方が良さそうならそっちで符号化しようということらしい。 確かに、高精度な動き補償によってある程度PCMが単純化しているのであれば、そこに量子化なり差分予測(ADPCM)的な変換をかけてもよいのかもしれない。 (2010/04/07追記)KLTは画像の特徴点の移動を追う、つまりMV検索に使用できるアルゴリズムのことで、既にその理論は[MPEGにも使用されている|http://journal.mycom.co.jp/series/interview/178/index.html]らしい。実装も[KLT: Kanade-Lucas-Tomasi Feature Tracker|http://www.ces.clemson.edu/~stb/klt/]でソースコードがパブリックドメインに付されている。これをintra符号化にどう使用するのかは追ってない。 そしてH.264におけるJVTと同様に''MPEG(HVC)との連携''が模索されており、ISO/IECとITUで同じような規格ができることは避けられるかもしれない。ちなみにHVCとはHigh-performance Video Codingで、MPEG側で検討中の次世代符号化方式と思って良いだろう。 !!次世代符号化方式の様相 実は、このHVCもH.264のHigh profileをベースに開発が進められており、同様に[英語版WikipediaのHVCのページ|http://en.wikipedia.org/wiki/High-performance_Video_Coding]を見ると上記の機能と被る内容がいくつか出てくる。 HVC自体はどちらかというと、現在の''HDとそれ以上の解像度に向けてより効率的な符号化''方式を模索する点に目的がある。 が、それに向けて使用する技術はH.265/NGVCと共通点が多い。 また、どちらも計算量をH.264より増やした場合にはH.264の2倍程度の圧縮率を達成することを目標としている点も同じだ。 次世代の符号化方式についてリサーチしている[h265.net|http://www.h265.net/]でも、両者は平行して扱われている感が強い。 尤も、H.265側がH264+的方向性にシフトしたからこそ、コラボレーションが検討されるようになったのだろう。 なお、先日、CEATEC2009で日立がH.264の3倍の圧縮効率を持つ映像符号化方式を開発したと発表し、これを[H.265に提案しているらしい|http://www.nikkeibp.co.jp/it/article/NEWS/20091007/338536/]が、こちらはH264+を目指すHVCやNGVCとはかなり方向性が異なるようだ。 HVCとNGVCはDCTを使用するフーリエ変換ベースの技術だが、日立の方式は上記記事中で''「画像サイズの縮小」''と書かれていることから、DWTを使用する''ウェーブレット''ベースか、それに近い理論が使用されていることが伺える。このため基本的な技術体系、パラダイムが違うと思った方がよい。技術的に詳細な記事が少ないため断片的な情報からの憶測に過ぎないが、ウェーブレット的な処理とDCT系の処理を組み合わせたものになりそうだ。 !ウェーブレット(DWT) ウェーブレット(DWT)は''一時期非常に期待された技術''で、JPEGの後継とされた''JPEG2000''で既に2000年頃には実用になっている。 高圧縮(動画で言えば低ビットレート)ではDCT系の圧縮技術よりも優れているとされているが、中程度の圧縮ではDCT系より''質感を損なう''(のっぺりする)ことが指摘されている。 また、原理的に''ブロックノイズやモスキートノイズが発生しない''。 このため動画の場合にはデブロックが不要になるが、コアであるDWT自体が重い処理であるため、速度的アドバンテージはないだろう。 JPEG2000がJPEGをリプレースできていないことからわかるように、DCTに対しDWTは圧倒的なアドバンテージを確保するには至っていない。 DWTを使用した動画の符号化方式としてはオープンソースのSnowが有名だが、現状ではやはりH.264(x264)に劣るという評価のようだ。 筆者の個人的見解では、将来的にはDWTが採用されていくと見ているが、現状、''DWT系の符号化方式は時期尚早という意見が主流''だろう。 DWTの将来性に関しては別記事の[[DCT vs DWT]]を参照のこと。 日立の方式はDWT処理そのものではないかもしれないが、ウェーブレットに近い考え方、原理を利用していそうだ。DCTと組み合わせ、大まかにはウェーブレット、詳細部分をDCTとしているなら、質感を保持したまま圧縮率を大きく上げられるかもしれない。しかし、DWTは高解像度でこそ生きる技術だと思うのだが、日立がMPEGではなくH.265に提案している点は解せない。 !!まとめ H.265は、基本的な計画が揺れているために、どのようなものになるかまだ不透明な部分が大きい。ただ、最低限H.264+的なものになるとしても、MPEGのHVC と同等のものが実現されると考えられる。恐らくはMPEG-4 Part2 Video(xvidやDivX)に対するH.264/AVCくらいの進化は期待できそうだ。