17 3-3 旅行時間の分析手法 本研究では、道路区間を対象とした旅行時間を把握するにあたり、混合正規分布(Gaussian Mixture Model)を用いた。混合正規分布はクラスタリングの手法であり、データセットをクラスターごとに分けられるのみならず、データセットの確率密度分布を得ることは可能となる。 本研究で用いた混合正規分布は正規分布と比較したメリットを図 3-6に示す。この結果から、混合正規分布は正規分布より、旅行時間の分布にあてはまる程度が良いことが見られて、分析モデルの対数尤度についても、混合正規分布の方は高いことが確認できた。 ここで、図 3-6が示した混合正規分布の結果に対する解釈は次の通りである。混雑状態の旅行時間では、平均値が465.14秒、標準偏差が98.99秒である。これに対して、非混雑状態の旅行時間では、平均値が275.47秒、標準偏差が62.29秒である。また、混雑状態の混合係数が0.43である。この結果から、本研究で用いた混合正規分布は妥当であると考える。 また、混合正規分布の未知パラメータを推定するため、本研究はRプログラムを用いたEMアルゴリズム(Expectation-Maximization Algorithm)を作成した。ここで、混合正規分布に適用するEMアルゴリズムに対する詳細な説明12)を割愛する。 図 3-6 旅行時間に対応する分析手法の比較 12) EMアルゴリズム徹底解説,https://qiita.com/kenmatsu4/items/59ea3e5dfa3d4c161efb 本研究の分析手法のイメージ路円滑化○本研究では、バス旅行時間を把握するにあたり、混合正規分布を用いて旅行時間をモデリング。そのメリットは交通状況の混雑状態(〇)・非混雑状態(〇)に応じた旅行時間を把握することは可能であるため、正規分布の結果(〇)と比較して優位性を持つ0.000.040.080.120.160.200.240501001502002503003504004505005506006507007508008509009501000Probability DensityTravel time (Unit: second)ヒストグラム正規分布混合正規分布図旅行時間に適用した混合正規分布VS正規分布の例
元のページ ../index.html#23