学生の活動
SDS研究科博士後期課程1年の木山 朔さん(小町研究室所属)が、言語処理学会で論文賞を受賞しました
ソーシャル・データサイエンス研究科博士後期課程1年の木山 朔さん(小町研究室所属)が、言語処理学会で論文賞を受賞しました。
論文のタイトルは「通時的な類似度行列に基づく単語の意味変化の分析」で、2025年1月〜12月に掲載された33件の論文の中から3件が論文賞として表彰されました。
言語処理学会論文賞:https://www.anlp.jp/award/ronbun.html
【概要】
言葉の意味や、言葉どうしの関係は、時間がたつと少しずつ変わっていきます。このような変化を「単語の意味の時間による変化」といいます。どのように意味が変わっていくのかを長い時間の流れで調べることは、言葉の変化を詳しく理解するためにとても大切です。
しかし、これまでの研究では、ある時期から次の時期へと変わったかどうかだけを見る方法が多く、意味がどのように変わってきたのかを細かく調べるには十分ではありません。また、BERTというAIの方法を使って意味の割合を調べる方法もありますが、計算に時間やコンピュータの力が多く必要になるという問題があります。
そこで本研究では、軽くて速く計算できる単語の表現方法(単語埋め込み)を使い、時間ごとの単語の似ている度合いをまとめた表(類似度行列)を作ることで、長い期間にわたる意味の変化のパターンを見つける方法を提案します。ある単語について、異なる時代どうしでどれくらい意味が似ているかを計算すると、その変化のしかたを調べることができます。
さらに、いくつかの単語について作ったこの表をグループ分けすると、似た変化のしかたをする単語どうしを自動で見つけることができます。実際に調べてみると、意味が変わった単語と同じ変化パターンを持つ単語や、社会の変化によって意味が変わったと考えられる単語どうしをグループにまとめられることがわかりました。
また、英語と日本語のデータを使って、さまざまな時間の区切り方で実験を行い、この方法がどのくらいうまく働くか、そしてどのような限界があるかについても考察しました。

授賞式の木山さん

言語処理学会論文賞