概要
近年、スマートフォン等のデジタルデバイスの普及により、YouTube等の動画投稿プラットフォームの市場規模は拡大してきている。その中でも、YouTubeの市場規模は拡大傾向にあり、今後もさらに拡大されると推測される。そのため、現在では、企業等もYouTubeに参入してきている。企業等がYouTubeのチャンネル運用を始める目的としては商品・サービスの売上の増加や採用活動の促進等があげられる。しかし、ただ動画を投稿しているだけでは、集客等に繋がらないため、ターゲティングやコンテンツ内容等を分析し、視聴者層や流行に合わせた動画づくりがされている。そのため、現在では、様々な分析ツールがあるが、投稿本数の少ない場合でも使える分析ツールといった初心者向けのものが存在しない。また、視聴者の生の声でもあるコメントを使用している分析ツールを見つけることができなかった。そこで、本研究では、投稿動画のコメントに深層学習を用いて複数の感情推定し、推定された感情をもとに動画の評価をする手法を提案する。
提案手法
本研究で、提案する手法の流れを図1に示す。提案手法はコメント分類機能、感情推定機能と動画評価機能で構成される。入力データは、収集したコメント郡、出力データは、動画の評価とする。

コメント分類機能
本機能では、入力データである収集したコメント郡を動画ジャンル別や動画の投稿者別に分類する。また、本機能で日本語以外(英語、中国語や韓国語等)を除去する。本研究では、手動で除去する。本機能のイメージ図を図2に示す。

感情推定機能
本機能では、コメント分類機能で分類したコメントの感情推定する。感情推定機能の処理の流れを図3に示す。感情の種類は「喜び」、「悲しみ」、「期待」、「驚き」、「怒り」、「恐れ」、「嫌悪」と「信頼」の8つに推定する。本研究では、深層学習の手法としてBERT[1]を用いる。BERTはMLM事前タスクと双方向Transformer encoderによる言語表現モデル手法である。

動画評価機能
本機能では、感情推定機能で推定したコメントをもとに、動画の評価をする。動画評価機能の処理イメージ図を図4に示す。まず、感情推定機能で算出したスコアをそれぞれの感情ごとに平均する。次に、平均したスコアで、「喜び」、「期待」、「信頼」と「驚き」のどれかが一番高いスコアの場合、高評価とし、「悲しみ」、「怒り」、「恐れ」と「嫌悪」のうちどれかが一番高いスコアの場合、低評価とする。

実証実験
実験内容
本実験では、提案手法の感情推定機能の正確性の確認をする。
本実験の対象データは、YouTubeに投稿されたコメントとする。また、本実験では、事前に日本語以外のコメントは省いたうえで実験をする。対象コメントの動画は、以下の4つである。動画ジャンルは動画1がゲーム実況、ゲーム2がファッション、動画3が教育、動画4が時事となっている。
- 動画1:【4人実況】11年ぶりに発売された話題の完全新作『 スーパーマリオブラザーズ ワンダー 』#1[2]
- 動画2:バッグの中身のついでにお気に入りバッグも紹介します![3]
- 動画3:日本物理学会でしか伝わらないフリップネタ[4]
- 動画4:「所沢のタイソン」を脅迫容疑で逮捕 知人の男性を「殺すからな」と脅したか “けんか3000戦無敗”と自称し「BreakingDown」出場|TBS NEWS DIG[5]
実験手順は、まず、対象とする動画のコメントを手動で感情推定する。次に、BERTを用いた深層学習で感情推定する。そして、手動でしたものとBERTでしたものとを比較し、正確性の確認をする。BERTには、日本語の感情分析用のデータセットであるWRIMEを用いてファインチューニングをした。
結果と考察
各動画の適合率、再現率とF値を表1に示す。表1に示すとおりBERTを用いた深層学習での感情推定は正確にできていることが分かる。しかし、動画3の教育カテゴリの動画だけ適合率が低くなってしまう結果となった。原因としては、動画1や動画2と違い動画3には、教育系動画ならではの専門用語がデータセットではファインチューニングできていなかったためと思われる。そのため、今後は、ファインチューニングをするデータを増やす必要がある。
表1 適合率・再現率・F値

次に、それぞれの感情スコアの平均と動画の評価を表 2に示す。動画評価をした動画全てにおいて「喜び」、「期待」、「信頼」と「驚き」の感情スコアの方が高くなったため、全て高評価だったことが分かる。しかし、動画4では、高評価と低評価のスコアにあまり差は見られなかった。そのため、「悲しみ」、「怒り」、「恐れ」と「嫌悪」の低評価の方も推定できているといえる。今後は、コメントに付与されている投稿日等を用いることで、動画の評価の変化も分かるようにしていきたい。また、別の分析方法を用いることで一文の中に複数の感情が入っているコメントなどの分析をしていきたい。
表2 感情スコアの平均と動画評価

おわりに
本研究では、投稿動画のコメントを感情推定し、それをもとに動画の評価をする手法を提案した。検証実験により、本提案手法である、BERTを用いた深層学習での感情推定の正確性の確認できた。しかし、1部の動画においては正答率が低くなってしまった。そのため、今後は、ファインチューニングをする際のデータを増やす必要がある。また、コメントに付与されている投稿日を用いることで動画評価の変化も分かるようにしていきたい。そして、別の分析方法を用いることで一文の中に複数の感情が入っているコメントなどの分析をしていきたい。
参考文献
- google-research:bert,https://github.com/google-research/bert,2024.1.26
- キヨ。:【4人実況】11年ぶりに発売された話題の完全新作『 スーパーマリオブラザーズ ワンダー 』#1,https://www.youtube.com/watch?v=7VrLBlRn1IM&t=3487s,2023.10.25.
- さしはらちゃんねる:バッグの中身のついでにお気に入りバッグも紹介します!,https://www.youtube.com/watch?v=5X_teaucBg8&t=9s,2023.10.25
- 予備校のノリで学ぶ「大学の数学・物理」:日本物理学会でしか伝わらないフリップネタ,https://www.youtube.com/watch?v=B3V_xmTJmz0,2023.10.25.
- TBS NEWS DIG Powered by JNN:「所沢のタイソン」を脅迫容疑で逮捕 知人の男性を「殺すからな」と脅したか “けんか3000戦無敗”と自称し「BreakingDown」出場|TBS NEWS DIG,https://www.youtube.com/watch?v=50535Mytjpg,2024.1.10.
コメント