概要
我が国では、人口減少による人手不足への対応として、様々な分野で機械化が進んでいる。例えば、公共交通機関の 1 つであるバスに関しては、作業の効率化や人員削減を目的として、最適なダイアグラムを組むためにされている人物の計数を機械的にする技術が注目されており、多数の技術が開発されている。これらの技術は、バス車内に機械を設置し、人物を計数する手法が多く提案されている。しかし、バス車内での計数手法は、バス会社以外の施設や団体が計数する際、バス会社に対して継続的に膨大な金銭的コストを要する課題がある。そこで、本研究では、深層学習を用いてバス停を撮影した動画像からバスの乗降車人数を計数する手法を開発した。そして、実証実験を通じて提案手法の有用性と課題を明らかにした。
提案手法
本研究で提案する手法の流れを図1に示す。提案手法は、降車人数計数機能と乗車人数計数機能で構成される。入力データは、ビデオカメラでバス停を撮影した動画像、出力データは、バスごとの乗降車人数を計数したデータとする。

降車人数計数機能
本機能では、物体検出AIを用いてバスの車両、人物が降車するバスのドアの領域や降車人物を検出して追跡し、それらを基にバスの降車人数を計数する。これらは、バス検出・判別処理、降車位置検出処理と降車人数計数処理により構成される。
バス検出・判別処理では、物体検出AIを用いて動画像内から計数対象となるバスを検出する。このとき、図2に示すように、検出したバスの領域の短径面積が最大のものが計数対象となる。また、図3に示すように、事前にビデオカメラを設置したバス停に停車するバスの種類に応じて設定した色の閾値を基に、バスの車体の色からバス会社を推定する。


降車位置検出処理では、図4に示すように、バスの車体から人物が降車するドアの領域を検出する。バスから降車する際には、ドアから一人ずつしか出入りできないため、ドア付近では、バスから降車する人物同士のオクルージョンの発生が少ない。そのため、本処理で検出したドア領域付近を通過する降車人物を計数することで、バス車内の混雑状況によって計数精度が左右されない。

降車人数計数処理では、バス検出・判別処理で検出したバスの領域から人物を検出して追跡し、検出した人物の位置とバスのドアの領域を基にバスから降車した人物を計数する。人物の追跡には、図5に示すように、検出した人物の骨格情報から肩の位置を利用し、フレーム間で一定の閾値内であれば同一人物として追跡した。肩の骨格位置を用いたのは、フレーム間で人物の検出領域の重心座標値を用いる場合に比べ、座標値が大きく変化しにくく、追跡が途切れにくいためである。検出した人物がバスから降車したかどうかの判定には、図6に示すような条件をいくつか設定することで判定した。


乗車人数計数処理
本機能では、物体検出AIを用いて動画像内に設定した領域内から人物を検出し、バスの乗車待ち行列の人数を計数することで、バスの乗車人数を計数する。これらは、行列エリア設定処理と行列人数計数処理により構成される。まず、行列エリア設定処理では、図7に示すように、動画像内からバスの乗車待ちとなる行列の位置を設定し、設定した行列エリアを画像として切り出す。バスの乗車待ちをしている行列は、並んでいる人物同士の間隔が一定間隔開くため、バスに乗車する人物同士のオクルージョンの発生が少ない。そのため、本行列からバスに乗車する人物を計数することで、バス車内の混雑状況によって計数精度が左右されない。次に、行列人数計数処理では、図7に示すように、切り出した行列エリアから人物を検出して計数する。

実証実験
実験内容
本実験では、動画像に対して、提案手法を用いてバスの降車人数とバスの乗車待ち行列人数をそれぞれ計数し、目視で計数した正解データと比較する。バスの降車人数の計数に用いる動画像は、図8・図9に示すように、異なる角度で撮影した。これは、ビデオカメラに対するバスの向きによって、計数に影響があるかどうか確認するためである。また、撮影時間は、バスが到着してから乗客が全員降りきるまでとした。バスの乗車待ち行列人数の計数に用いる動画像は、図8に示すように、人物の間隔が空いていることがわかるように行列の全体を撮影した。これは、オクルージョンの影響による誤計数を低減するためである。また、撮影時間はバスの乗車待ちをしている時の1分間とし、10秒ごとに計数する。
本実験で利用する物体検出AIとして、画像処理分野でよく利用されており、新たなモデルの提案が多いYOLO[1]を採用することとした。特に、YOLOの中でも本研究時点で最新のモデルであるYOLOv8[2]を利用した。バスと人物の検出にはYOLOv8の既存の物体検出モデルを利用する。また、バスのドアの領域を検出する既存の物体検出モデルは無いため、自身で構築した。


結果と考察
バス降車人数の計数結果とバスの種類の推定結果を表1に示す。まず、バスの種別の推定結果は全て正しいものとなった。次に、降車人数の正解率を確認すると、7本の動画像で100%の正解率となり、誤計数がある3本の動画像でも90%以上の正解率となった。以上のことから、提案手法の有用性を確認できたと考えられる。しかし、設定した条件に一致しなかったために降車した人物と判定されない場合や、同一人物を複数回計数したことによって誤計数が発生した。そのため、今後は降車の判定方法などを改善していくことで、誤計数を防止できるか検証が必要である。
バス乗車待ち行列人数の計数結果を表2に示す。まず、動画像AとB以外では、95%以上の正解率となった。このことから、提案手法の有用性を確認できたと考えられる。しかし、動画像AとBでは他に比べて過剰計数が特に多くなったことで正解率が低下した。これは、実際に行列に並んでいる人物以外に、通路を通り過ぎている人物なども計数していることが原因と考えられる。また、同一人物を複数回計数したことによる過剰計数などが見られた。そのため、今後は人物を追跡して移動しているかどうかの判定や、検出した人物が同一人物かどうかの判定をすることで、誤計数を防止できるか検証が必要である。
おわりに
本研究では、バス停などのバス車外に設置したビデオカメラで撮影した動画像から、バスの混雑状況によらず、バス会社ごとの降車人数を計数する手法と、バスの乗車待ちをしている行列人数を計数する手法を提案した。そして、実証実験により、提案手法の有用性を確認できた。今後は、検証実験によって明らかになった課題に対応することで、提案手法の実用可能性を高めることを目指す。
参考文献
[1] J.Redmon,S.Divvala,R.Girshick,A.Farhadi:You Only Look Once:
Unified,RealTime Object Detection, IEEE,Confrence on Computer
Vision and Pattern Recognition(CVPR),pp.779-788,2016.
[2] Ultralytics:Ultralytics YOLOv8,https://github.com/ultralytics/ultralytics,
2023.12.28.
コメント