28 になれば、想定される事故より少ないより交通安全力が高い地域であると判定し、残差がプラスになれば、想定される事故より多いより交通安全力が低い地域であると判定する。この考え方は、推定モデルで表現できない部分が地域の交通安全力を応答変数となる事故データは市区町村別のデータが公表される「事故件数」、「死亡者数」とする。説明変数となる社会指標は先に整理したデータから、その入手しやすさ、妥当性等を踏まえ以下のものから選定することとした。 〇社会指標全般:経済・財政と暮らしの指標「見える化」 データ集(内閣府) 〇利用交通手段:国勢調査(2010年) 〇自動車保有台数:自動車保有車両数統計(2015年)(自動車検査登録情報協会) 社会指標全般においては、特に交通事故との関連性が想定されるものを中心に説明変数とする指標を選定した。選定した指標は入手できる最新のものを使用した。具体的には表 4-8に示す通りである。 推定モデルに使用するモデルについて、上記の考え方に則り、まずは残差の二乗和を最小とする重回帰モデルを採用する。加えて、事故データがカウントデータであるという特性を踏まえ、カウントデータの推定によく用いられるポワソン回帰および負の二項回帰モデルも採用し、本検討においていずれのモデルが妥当であるかを考察する。 なお、交通事故は収集した説明変数以外にも地域の特性など多様な要因によって影響を受けていることが想定される。ここでは、このような地域の特性の差を極力少なくさせるため、地域ごとにモデルを構築することとした。具体的には、政令指定市、中核市、特例市、特別区といった規模の大きな都市及び市、町、村の4分類でモデル構築を行った。 多変量モデルにおいては、モデル精度の観点から、使用する説明変数の数は少ない方が望ましい。よって、本研究では以下のような手順で説明変数として使用する指標の選択を実施した。まず、いずれの都市規模でも普遍的に応答変数(事故件数、死亡者数)との相関が高い1指標をキー指標として選定した。次に、モデルの符号整合性を整えるための処理として、応答変数との単相関が0.2以上の指標を抽出した。次に、モデルの信頼性を低下させる多重共線性回避のための処理として、多重共線性を判定するVIF値が既定値(ここでは5を採用)以下となるよう、説明変数間で相関が高い指標を峻別した。 最後に、ステップワイズ(変数増減法)による変数選択を実施し、影響力の低い説明変数を除外した。以上の手順を通じて、モデルの構築を行った。
元のページ ../index.html#34