題目: テキストマイニングを用いた中国の反日BBSの内容の分析

氏名: 王沛璋

担当教員: 山岸俊男


 日本と中国の関係は、過去二千年にわたる歴史を持つ。近年、靖国神社参拝問題、歴史教科書問題などにより、中国国内における反日感情が高まりつつある。本研究の目的は、中国国内に存在するインターネット上の掲示板の書き込みをテキストマイニングという手法を用い、現代中国人が持つ日本に対する印象、日本に対する差別構造を探索的に探ることにある。テキストマイニングとは、日記やアンケートの答えといったテキストを単語に分割し、その出現頻度などを測定することで単語間の関係を調べる技法のことである。

 本研究では、日中関係に関する書き込みがあるウェブサイトにあるコメントを分析対象とし、単語間の分析を行った。まず初めに、全コメント内の頻出200語を算出し、各コメントで使用されていたかどうかを調べた。使われている場合は1を、使われていない場合は0とし、7880行×200列のデータセットを作成した。次に、200単語のうち2つの単語が同一コメント内に登場している数を数えた。この作業をすべての組み合わせ(200単語×200単語)において行い、200行×200列のデータセットAを作成した。最後に、2つの単語が登場する期待値を2×2のクロス表の周辺度数から算出し、データセットAで算出した値をこの期待値で割った。この値は2つの単語間のつながりの強さを意味している。この200行×200列のデータセットを2つの単語間の関係値データとし、単語間の関係を調べるために用いた。

 研究の結果、常任、軍国主義、捕鯨という3つの単語が「日本」と特に強く関係していることが明らかになった。また、3つの単語は、それぞれ「反対」という単語と強く結びついていた。それらの結果は、中国国民は、戦時中における日本の軍国主義、そして、近年、問題となっている日本の捕鯨問題、日本の常任理事国への参加問題に対してネガティブな印象を持っていることを示している。また、日中間のみならず「台湾」という単語を入れて、3つの国家間での分析も行った。その結果、日中に関係のある単語の多くは戦争と関係のある単語であり、中台に関係のある単語の多くは民族問題、独立と関係のある単語であった。また、日台湾の間に関係のある単語はほとんどなかった。これらの結果は、中国人は、台湾を中国の領土の一部とし、台湾人を自国の国民として考え、国家として他国と比較、分析しないことを示唆している。


卒業論文題目一覧