複数言語モデルによる文章表現の堅さ推定手法の検討

世の中には様々な表現の文章がある.一般の人が文章を書く場合,文章を書く相手や場面によって文章表現を変える必要がある.例えば,友人に送るメールと上司に送るメールや,手紙と論文では文章表現が異なる.しかし,文章作成に熟練していないユーザは,文章にどれくらい堅い表現,または柔らかい表現を使えば良いか,判断するのが難しいと考える.さらに,現在の多くの対話型エージェントは,人間ほどには文章表現を考慮していないせいで,ユーザが堅い表現の質問をしても,柔らかい表現で返答してしまい,場面にふさわしくない会話が行われることが少なくない.そこで我々は,この問題を解決するために,文章表現の堅さを推定する手法を提案する.この手法では,まず,表現が堅い文章群と柔らかい文章群のそれぞれをWord2Vecで分析して,堅い言語モデルと柔らかい言語モデルを構築する.そして,これらの各言語モデルを用いて測定した推定対象文章中の各単語間の概念距離分布を特徴量とした回帰分析により,推定対象文章の表現の堅さレベルを推定する.本稿では文章表現の堅さレベルを推定するプロトタイプシステムの作成,および検証実験を行う.提案システムが推定した文章表現の堅さレベルと,人手で判定した文章表現の堅さレベルの相関係数を測定する実験を行なったところ,0.446程度という結果が得られ,提案手法に一定の有効性が確認できた.本稿の貢献は次の通りである.

  • 複数言語モデルで測定した各単語間の概念距離の頻度分布を利用し,文章表現の堅さを推定する手法を提案した点
  • 上記提案方式の推定精度の検証実験を実施した点

担当者:中村仁汰

一覧へ戻る