3. 次世代サービスネットワークアーキテクチャに関する研究

3.1. サービスオーバレイネットワークアーキテクチャに関する研究

3.1.1. オーバレイネットワークにおけるネットワーク性能計測手法

オーバレイネットワークはIP ネットワーク上に論理的に構築されたネットワークであるため、性能の維持、向上のためには定期的にオーバレイパスの資源情報を計測によって得る必要がある。オーバレイネットワークの構築に必要な情報を得る手法は数多く提案されているが、その多くは小規模なオーバレイネットワークを対象としており、全てのオーバレイノード間の経路を計測する手法である。このような手法ではオーバレイノード数の2乗の計測コストが必要であり、オーバレイノード数が増加した場合には計測に必要なコストの増加が問題となる。

この問題に対して本研究では、オーバレイパスの重複した部分の計測を行わず、重複部分の計測結果を合成することにより、オーバレイネットワーク全体の性能を推定する、計測結果の空間的合成手法を提案した。この手法は、オーバレイネットワーク全体のパスの情報を得る完全性を維持しつつ、パスの計測数を削減することができるが、計測結果の空間的合成によって得られた推定結果と実際の計測結果との間の誤差、つまり推定精度が問題となる。そのため、本研究では、PlanetLab上における計測結果を用いた、パケット廃棄率の計測結果の空間的合成手法の精度評価を行った。また、推定精度を向上させるための計測結果のデータ処理手法を提案した。

精度評価の結果、PlanetLab環境における、実際のパケット廃棄率の計測結果と、空間的合成手法によって得られた推定値との平均対数誤差は約0.4であることがわかった。また、パケット廃棄率の計測においては、オーバレイノード処理負荷が原因となり、計測開始後の数秒間にパケットが全く届かないことがあり、そのような計測結果を削除した上で統合手法を適用することによって、推定精度が向上することがわかった。さらに、パケット廃棄率の計測結果に対し、統計的検定を適用し、外れ値を除去することにより、平均対数誤差を最大で36%改善できることを示した。

[関連発表論文]

3.2. Webトラヒック制御に関する研究

3.2.1. Webトラヒック特性の分析に関する研究(NTT ネットワーク基盤技術研究所との共同研究)

クライアントPC からのリクエスト受信時に、サーブレットやJava Server Pages (JSP)のプログラムをサーバ側で実行するか、JavaScript で書かれたAjax やDOM によるプログラムをHTML に埋め込みクライアントPC 側で実行することで生成される動的オブジェクトの割合が増加している。その結果、Webサイト閲覧時に発生する通信パターンが複雑化している。一方で、67%のユーザは毎週のようにWeb 閲覧時の待ち時間の長さを感じており、17%のユーザはWeb 閲覧時に最大でも5 秒しか待てないという報告がなされており、複雑性を増すWeb トラヒックをいかにして効率的に配信するかが重要な課題となっている。

そこで、過去の研究において、測定用PC から多数のサイトにアクセスした際に発生するトラヒックの通信特性値をHAR (HTTPArchive) ファイルとして取得し、HAR ファイルから各種特性値を抽出することで、URL カテゴリやオブジェクト種別ごとの各種通信特性の傾向について分析したが、単一地点(東京) からの測定分析に限定されており、通信構造の地理的な傾向の差異は分析されていない。

そこで本研究では、PlanetLab を用いて世界の12 の拠点から、アクセス頻度の高い約1、000 のWeb サイトにアクセスしたときに発生する通信パターンを測定し、サーバ距離、遅延時間、オブジェクト数といった各種特性値の地域的な傾向について分析した。その結果、Business、Regional、Shopping、Sportsなどの地域性の高いオブジェクトは各々のアクセス地点の近隣に存在するサーバから取得される傾向があり、一方、Reference、Health、Adult、Gamesなどの地域性の低いサイトのオブジェクトは北米に存在するサーバから取得される傾向があることが明らかとなった。また各Web サイトを各測定地点における各特性値の傾向に基づきクラスター分析し、オブジェクト種別やURLカテゴリによる通信特性の違いを明らかにし、効率的なキャッシュ制御法として、地域性の低いサイトのオブジェクトを様々な地域で優先的にキャッシュすることで、限られたキャッシュ資源を有効に活用した効果的なWebレスポンス時間の改善が期待できることを示した。

[関連発表論文]

3.2.2. Webパフォーマンス計測と性能向上に関する研究

近年、Webパフォーマンスの重要性が注目を集めている。Webパフォーマンスとは、Webページ上のリンクがクリックされてから、次のWebページを構成するオブジェクトがダウンロードされ、表示が完了するまでの時間である。ユーザはWebパフォーマンスが低いWebページから離れる傾向にあり、Webパフォーマンスの低下はサービス提供者の収入の低下に直結する。このため、サービス提供者は自身が提供するWebページのパフォーマンスを測定し、パフォーマンス低下の原因を究明、改善する必要がある。しかし、このようなWebパフォーマンスの低下原因は、ネットワーク環境やクライアントの性能等、Webブラウザの動作環境によって変わると考えられる。

本研究では、Webブラウザの動作環境を変化させ、且つ、Webパフォーマンスに加えてサーバ・ネットワーク・クライアントそれぞれのパフォーマンスについて測定可能とする、Webパフォーマンス測定プラットフォームを提案する。提案手法を評価した結果、提案手法は959個のWebページの88のホストでの測定において、測定にかかる稼働は30分程度でWebブラウザの動作環境の多様性によらず一定であり、PlanetLabを用いることで多様なWebブラウザの動作環境での測定ができることを確認した。これにより、測定結果から、Webページのパフォーマンス改善の方針を検討できるデータを収集することができた。

さらに、Webブラウザ内での待ち時間を削減するためのレンダリング結果のキャッシュによるWebパフォーマンスの向上手法を提案した。提案手法は、これまで端末内のブラウザで行われてきたレンダリングの処理を肩代わりする機能をネットワーク内に配置し、本機能によって生成されるレンダリング結果をキャッシュしておくことで、キャッシュヒット時に、レンダリングにかかる時間を削減する。提案手法の有効性の評価の結果、RTTが長い地域やWebページにおいて、提案手法は有効であることがわかった。また、この様な地域やWebページにおいては、動的なオブジェクトの割合が8割程度までのWebページで効果が期待できることがわかった。

[関連発表論文]

3.3. サイバーセキュリティの高度化に関する研究

3.3.1. 生物の環境適応性に基づくWebサイトへのぜい弱性スキャン検知(NTTセキュアプラットフォーム研究所との共同研究)

Web サービスの浸透に伴いWeb サーバに対する攻撃が急増する一方で、Web サービスの形態が多様化し、Web 攻撃を防止するために全てのサービスの脆弱性を特定することは困難となっている。そのため、Web 攻撃の情報を収集・解析して未知の攻撃の検知を行うことが重要である。Web 攻撃を収集する方法としては、Web サーバ型ハニーポットと呼ばれるおとりのシステムを用いる方法が知られている。しかし、ハニーポットは検索エンジンのクローラなどの正常なパケットを含む多量なパケットを収集するため、その中から悪質なパケットを自動的に識別する機構が求められている。特に攻撃の前準備動作としてWeb サイトのぜい弱性を確認するぜい弱性スキャンはクローラの特徴と類似しており、後者を高精度に識別する必要がある。クローラ識別に関する既存研究として、公開情報などから識別が容易な有名クローラの特徴を用いて他のクローラの識別を行う手法が提案されている。しかし、クローラ自体の多様化により、通信の多様化にも適応可能な判別手法が必要となっている。そこで、本研究では、多量かつ多様なデータの扱いに長けた生物の仕組みに着想を得たクラスタリング手法AntTreeをクローラ識別へと適用し、その有用性を示す。実データを用いた実験結果より、従来手法と比較して、AntTreeがより高い精度でクローラの識別が可能であることを示した。

[関連発表論文]