超高速のパケット処理性能を実現、仮想ルータ高速化技術を開発【富士通研究所】
DX/IoT/AI 無料従来比18倍のパケット処理性能を実現し、アプリケーションのサーバ集約率を向上
富士通研究所は11月27日、仮想環境におけるネットワーク処理の主要機能である仮想ルータを高速化する技術を開発したと発表した。
汎用サーバ上の仮想環境でネットワーク処理のインフラ機能と複数のアプリケーションを集約するサーバ仮想化は、データセンタだけでなく MEC(Mobile Edge Computing)や基地局といったエッジ領域にまで拡がりつつあり、交通管制などの社会インフラやスポーツ観戦などのエンターテインメントで活用されている。しかし、使用するデータ量の増加とシステムの複雑化に伴って、仮想ネットワークのパケット処理に要するCPUリソースが増加する。そのため、1台のサーバ上で稼働できるアプリケーション数が減り、サーバ集約率の低下につながっている。
今回、これらの課題を解決するため、仮想ネットワークのルータ機能をFPGAにオフロードして処理するとともに、性能ボトルネックであったパケット宛先制御を高速化する技術を開発した。これにより、従来の仮想ルータと比較して、パケット処理性能を約18倍高速化し、CPUリソースを約13分の1に削減したという。
富士通研究所は「本技術により、低負荷・高性能な仮想ネットワークを提供し、5G時代の大量データを活用したビジネスにおいて、サーバの利用効率を向上させ、企業のDXを支える」としている。
開発の背景と課題
企業のデジタル革新が進む中、汎用サーバ上の仮想環境を用いて、複数のアプリケーションとネットワーク処理機能を集約するサーバ仮想化が広く一般化してきている。また様々な企業におけるDXの加速により、アプリケーション同士が連携して動作する新たなサービスも生まれている。このような背景から、アプリケーションが取り扱うデータ量は増加傾向にあり、ネットワークの複雑化と負荷増加が問題となっている。
その中で、効率的なサーバ仮想化を実現するためには、柔軟なネットワーク構成に必要な仮想ルータのパケット処理性能の向上と、ネットワーク処理に用いられるCPUリソースの削減が課題となっている。これらの課題を解決することにより、サーバ上で動作するアプリケーション数の増加、または必要なサーバ台数の削減を実現することができ、ユーザの投資コストを低減する。
開発された技術
今回、仮想ルータ機能をFPGAにオフロードし処理することでCPUの処理を肩代わりするとともに、パケットの宛先制御を高速化する技術を開発しました。これにより、ネットワーク性能を高速化するとともに、ネットワーク処理で使用するCPUリソースを大幅に削減します。
高速パケット宛先検索技術
従来は、パケット順を変更することなく全パケットで同じ処理を実施することで高速処理を行っていました。仮想ルータ処理の入出力でパケット順が変わると、アプリケーションでは再送が発生し、品質低下やシステムの負荷増加に繋がる。
同技術では、パケットのパイプライン上でパケットと別に順序情報を保持し、多段にわたる宛先検索処理において前段検索の結果から不要となった次段検索をバイパスさせて合流させる際に、パケットのパイプラインの順序情報をもとに高速にパケットを元の順序に戻す。高速なパイプライン処理を維持しつつメモリアクセスを低減させるとともに、パイプライン処理を二重化することで、パケット処理性能を向上させる。
検索テーブルのハイブリッドメモリ管理技術
宛先検索処理ではメモリ内にある複数のテーブルを検索して宛先を決定するが、高速で小容量なFPGAの内部メモリと大容量の外部メモリとを、宛先検索処理を止めずに自動的に切り替える機能を開発した。接続数の増加に伴って検索テーブル群のメモリ使用量が増加して内部メモリの空き容量が少なくなった場合に、容量あたりのアクセス頻度が低い検索テーブルをバックグラウンドで外部メモリに同期しておき、検索処理を止めることなく外部メモリの検索テーブルに自動で切り替える。これにより、大規模システムにおいて通信先が多く、大きな検索テーブルが必要な場合でも、外部メモリへのアクセスを抑えて、安定したパケット処理性能を実現する。
効果
富士通研究所は同技術を用いて、オープンソースの代表的な仮想ルータである「Tungsten Fabric」を、高速メモリHBM2を搭載した「インテル Stratix 10 MX FPGA」上に実装させ、汎用サーバ上でのオフロード効果の検証を行った。100Gbpsのイーサネットで接続したサーバ2台に仮想マシンを4台ずつ動かし、各仮想マシン間で通信を行って仮想ルータの性能を測定したところ、従来手法では13.8Mppsだったパケット処理性能に対して、250Mppsと約18倍の高速化を実現した。また、使用CPUコア数も従来の13コアから1コアに削減した。
同技術を用いることでアプリケーションのサーバ集約率を向上させることが可能となる。例えばスタジアムにおける映像配信サービスがより少ないサーバ台数での運用が可能となるなど、キャリア事業者向けの基地局やMECをはじめとした5G時代の大量データを活用したインフラビジネス領域におけるサーバの利用効率を向上させ、ユーザのDXを基盤から支える。
今後
富士通研究所は「本技術のさらなる性能向上と機能拡充を行うとともに、お客様のDXユースケースを想定した検証を進め、2021年度中の実用化を目指す」としている。