プロ野球ゲームでのTwitterのつぶやき分析

ネットワークシステム研究室
指導教員:坂本 直志
10EC096 曵地 航

目次

1. はじめに
2. Twitter
2.1. Twitterについて
2.2. ツイートとは
2.3. ハッシュタグとは
3. 準備
3.1. プロ野球について
3.2. Twitterから見た特性
4. 解析結果
4.1. プロ野球シーズン中のつぶやき推移
4.2. 日本シリーズ中のつぶやき推移
4.2.1. 第01戦
4.2.2. 第02戦
4.2.3. 第03戦
4.2.4. 第04戦
4.2.5. 第05戦
4.2.6. 第06戦
4.2.7. 第07戦
4.3. 考察
5. まとめ
6. 参考文献

1.はじめに

Twitter では ツイートと呼ばれる 140 字以内の短いテキスト情報をベースに,様々な情報がやり取りされている。テレビで中継されるイベントの実況や感想もその内の一つであり、その際ハッシュタグという#記号を付けてつぶやくことが多くある。

Twitter日本版公式ブログであるTwitter Japan Blog[1]において2013年に日本で盛り上がったハッシュタグが発表された。以下がTOP10である。

表1-1 Twitterハッシュタグトレンド
1 #艦これ DMMオンラインゲーム「艦隊これくしょん〜艦これ〜」
2 #あまちゃん NHK連続テレビ小説「あまちゃん」
3 #lovelive サンライズ×ランティス×G'sマガジンが送り出す、新世代アイドルプロジェクト「ラブライブ!」
4 #wbc ワールド・ベースボール・クラシック World Baseball Classic
5 #shingeki 進撃の巨人
6 #ff14 FinalFantasyXIV
7 #tv_free テレビアニメ「Free!」
8 #railgun とある科学の超電磁砲
9 #vividred アニメ「 ビビッドレッド・オペレーション」」
10 #c84 コミックマーケット84

あまちゃん、World Baseball Classic、進撃の巨人などがTOP10にランクインされ、 2013年に流行やイベントがあり、非常に注目されたコンテンツ、大会でもある。

このように、流行があったもの、大きなイベントがあったものはTwitterでツイートされることが多く、 その際にハッシュタグを用いたツイートが多い。実際Twitter Japan Blogにおいても “ハッシュタグ「#なでしこ」を使って、なでしこジャパンを応援しよう” “#抱負2013 で、2013年の抱負をツイートしよう” などハッシュタグを用いたてつぶやこうという内容をブログ内で紹介している。

今回はハッシュタグを利用したTwitterの傾向を読み取ろうと考えているが、研究の目的としては

を知ることを目的とした。まずTwitterが情報抽出ツールとして適切かについては、 現在はテレビ番組内容やスポーツの試合など現在行われていることに対してつぶやかれることが多いTwitterだが、 実際のところはどうなのか。特にスポーツにおけるつぶやき推移というものはデータを重ねるごとに傾向などが現れるので、 その点について考察していきたいと思う。Twitterの今後の利用目的については、その重ねていったデータは、 果たしてどのように役に立つかなど今後の発展についても考察していきたいと思う。

2.Twitter

2.1 Twitterについて

Twitterは2006年7月に元オブビアウス社(現ツイッター社)が開始した140文字以内の「ツイート」と称される短文を投稿できる情報サービスである。 文章以外にも、他ページへのリンクを付加することにより、写真や動画などのメディアコンテンツを共有することが出来る。 その他、ユーザーからの返信やリツイートと呼ばれる再投稿、お気に入り登録などのコミュニケーションを取ることが出来る。 現在Twitterの利用者数は5億人を超え、日本は世界で3番目に多い。[2]

図1

図2.1-1 Twitter国別利用者数

図2.1-3はTwitterの基本画面である。左側の空白部分に140文字のツイートを行う。 右側のユーザーのつぶやきが表示されているのはタイムラインと言い、フォローしているユーザーのつぶやきが表示される。 この画面上で様々なユーザーのつぶやきを見たり、コミュニケーションを図ったりしている。

図2

図2.1-2 Twitter基本画面

現在では個人だけでなく、有名人の方や企業がTwitterを情報発信ツールとして利用していることが多い。 ユーザーの本音に対して手軽、かつ直に触れることができるということで、芸能人や企業などが導入されているケ ースなどもある。アカウントによるが、一般人の返信に反応する芸能人や企業も存在する。

図3

図2.1-3 芸能人Twitterランキング

このようにTwitterはシンプルなつくりながらも、有名、無名問わず様々な人たちに様々な用途で利用されていることがわかる。 ここで、その他のTwitterの基本的な専門用語あげておく。

表2.1-1 Twitter用語集
ツイート ユーザーから投稿する140文字以内のツイート(2.2節参照)
リツイート 他のユーザーの投稿を再投稿すること。RTとも略す。
リプライ 他のユーザーに宛てた投稿のこと。「@ユーザー名 (投稿したい内容)」の書式で投稿すると、 そのユーザー宛の返信扱いとなる。人とのコミュニケーションを図るために利用される。
フォロー 他のユーザーの投稿を自分のタイムラインで表示できるように、 ユーザーを登録すること。相手が投稿を非公開にしていなければ無許可で自由にできるが、 相手の設定によってはフォローされたことが通知される。投稿を非公開にしているユーザー をフォローするには相手の承認が必要になる。
フォロワー 自分のことをフォローしている他のユーザー。有名人は立場上フォロワーの数が増えていく傾向にある。
サーチ 検索することで、キーワードを含んだ投稿がリアルタイムで、タイムラインに表示される。検索ワードは保存でき、いつでも更新できる。
トレンド 今、数多く投稿されている単語が地域別に表示される。
ハッシュタグ 特定のトピックに関する投稿を、公式のツイッター検索から一覧して見ることができるように、キーワードの前に#を置いて投稿する。(2.3節参照)
リスト ユーザーを名前付けたリストで分類する。公開または非公開が設定できて、自分だけしか見られないリストとしても設定できる。
お気に入り 気に入った投稿をブックマークしたい場合などに星マーク(☆)を付けてお気に入りに登録する。

今回はグルーピング関連のハッシュタグというものを利用するので次節で説明する。

2.2 ツイートとは

ツイートとは、Twitterで、書き込みを投稿すること、および、投稿されたメッセージのことである。Twitterにおけるツイートは、一般的なブログやミニブログにおける「投稿する」(post)や「アップデート」(update)に相当すると言われる。1回のツイートで投稿出来る文字数は140文字以内の制限がある。文字以外にも、動画、写真もツイートすることが可能であり、アップロード先には様々なアップローダーが存在する。

2.3 ハッシュタグとは

#OOOという形式で特定のトピックに関する投稿ができ、ハッシュタグ検索をすることにより、同じイベントの参加者や、同じ経験、同じ興味を持つ人のさまざまな意見が閲覧しやすくなる。以前は日本語には非対応だったが2011年7月から日本語のハッシュタグ利用も可能となった。そのことで現在では番組企画で放送中につぶやきをハッシュタグ付きでつぶやくような企画なども行われていることが多い。

図4

3.準備

3.1 プロ野球とは

1934年に大日本東京野球倶楽部(現読売ジャイアンツ)がプロ球団として初めて創立され、プロ野球が生まれた。

現在はパシフィックリーグ(パ・リーグ)に6球団、とセントラルリーグ(セ・リーグ)に6球団が属している。

レギュラーシーズンは144試合を約5か月で消化する。週6日試合が基本でレギュラーシーズンが進められる。

3月末頃から10月頃までペナントと呼ばれる両リーグでのリーグ戦が行われ、両リーグそれぞれの1位球団を決定します。そのリーグ戦での1位球団同士が日本一をかけて戦うのが日本シリーズである。

3.2 Twitterから見た特性

野球に関するつぶやきに関してはファン別にハッシュタグをつけてつぶやかれるツイートが多い。12球団別にハッシュタグがあり、球団が公式に利用しているのもある。以下に球団別のハッシュタグを表記する。

表3.2-1 ハッシュタグ表
セ・リーグ ハッシュタグ パ・リーグ ハッシュタグ
読売ジャイアンツ #giants 東北楽天ゴールデンイーグルス #rakuteneagles
阪神タイガース #hanshin 埼玉西武ライオンズ #SeibuLions
広島東洋カープ #carp 千葉ロッテマリーンズ #chibalotte
中日ドラゴンズ #dragons 福岡ソフトバンクホークス #SBHawks
横浜DeNAベイスターズ #baystars オリックス・バファローズ #Orix_Buffaloes
東京ヤクルトスワローズ #swallows 北海道日本ハムファイターズ #lovefighters

今回の研究は上記のハッシュタグを利用する。

4.解析結果

4.1 プロ野球シーズン中のつぶやき推移

ここでは、実際につぶやかれたプロ野球関連ツイートに関するつぶやきを解析していく。

今回研究対象にするのはハッシュタグがつけられたつぶやきを使用する。そのつぶやきを取得する方法として、今回はハッシュタグクラウドを使用した。

図5

図4.1-1 ハッシュタグクラウド

ハッシュタグクラウド[3]では1週間分のハッシュタグであれば、どのハッシュタグでも取得可能である。そのため今回の研究のために各球団のつぶやきを取得しておく。ファイル形式はcsvファイルでまとめられているので、そのつぶやき数をプログラムを用いて数え、球団別につぶやき数をまとめグラフにする。

簡単に2013年シーズンを振り返ると、楽天の創設初の優勝&日本一が話題になったが、広島の16年ぶりのAクラス進出、バレンティン選手(ヤクルト)の王貞治(元巨人)が持っていたシーズン本塁打記録55本を上回る60本を放つなど記録面などで印象深いシーズンとなった。 その他にも宮本慎也(ヤクルト)選手、桧山 進次郎(阪神)選手、前田智徳(広島)選手などチームを長年支えてきた選手の引退も目立った。その部分を中心にツイート推移を見ていこうと思う。

ここでは9月の各リーグ別のつぶやき推移を比較していく。

図6

図4.1-2 セ・リーグ球団つぶやき数

図7

図4.1-3 セ・リーグ球団つぶやき数一覧

図8

図4.1-4 パ・リーグ球団つぶやき数

図9

図4.1-5 パ・リーグ球団つぶやき数一覧

図4.1-2おいてのピークは10月5日の阪神である。これは阪神で長年活躍した選手の引退試合が開催されていたため、つぶやき数突出している。2番目に多かったのは、9月16日の広島で今季初の6連勝を達成し、クライマックスシリーズ争いを一歩抜け出した形であるためにつぶやき数が伸びた。

一方のパ・リーグは楽天の日本一がつぶやきにおいて群を抜いて伸びる結果になった。  更に球団の違いでもつぶやき数の差が表れている。12球団で一番つぶやき平均数が多いのは阪神で、常に多いつぶやき数が見てとれる。一方一番少ないのはオリックスで、常にグラフの下位を推移していることがわかる。

4.2 日本シリーズ中のつぶやき推移

日本シリーズとは、日本のプロ野球のセントラル・リーグとパシフィック・リーグのそれぞれのクライマックスシリーズの勝者が対戦して日本一(その年の日本の年間王者)を決めるシリーズ試合である。ゲームは7試合行われ、先に4勝したチームがその年の日本一チームとなる。

球団創設9年目で初の日本シリーズ出場、そして初の日本一を目指す楽天とV9以来40年ぶりの日本一連覇を狙った巨人での日本シリーズとなった。無敗の記録を持つ田中将大投手(楽天)、巨人の人気度もあり、注目度が非常に高かったと言える。試合は第7戦までもつれこみ、最終戦で4勝をした楽天が日本一へと輝いた。

以下から各試合についてのつぶやき推移を見ていく。ワンプレーに対し1つのつぶやき例を示す。

4.2.1 第01戦

図10

図4.2.1-1 第1戦スコア

東北地方で初めて行われた日本シリーズは継投で巨人が楽天を完封勝利で先勝した。巨人は5回表に長野の右前適時打と、8回表に村田のソロ本塁打で2点を挙げ、投げては2回以降毎回塁へ走者を出しながらも、先発の内海が6回まで、それ以降をマシソン、山口、西村の盤石の継投で完封し勝利した。楽天は先発で好投した則本を援護できず、巨人を上回る9安打を放ちながら、5回裏一塁の場面で嶋のエンドランで一塁走者の松井が、ロペスの好送球で三塁憤死、8回にも2死一、二塁で松井が左翼へ放った飛球を亀井に好捕されるなど、得点する事が出来なかった。

図11

図4.2.1-2 第1戦両チームつぶやき推移図

図12

図4.2.1-3 第1戦両チーム合計つぶやき推移図

19:28  巨人133 楽天124 計257

楽天藤田選手の打球が巨人内海投手に打球が直撃する内野安打を放つ。

図13

図4.2.1-4 19:28の巨人側つぶやき

図14

図4.2.1-5 19:28の楽天側つぶやき

19:52 巨人215 楽天83 計298

巨人長野選手の先制タイムリー。今シリーズ初得点となる。Twitterの特徴として嬉しさが出たときは‘あ’を連呼する傾向になる。人間も叫んだ時にそうなることもあるので、気持ちがそのままツイートにのった形となっている。

図15

図4.2.1-6 19:52の巨人側つぶやき

図16

図4.2.1-7 19:52の楽天側つぶやき

21:09 巨人275 楽天131 計406

ホームランを放つとキタ━━━(゜∀゜)━━━!!!! という2ちゃんねるでよく使用される顔文字(アヒャ)が連発する傾向にある。逆に打たれた側はショックを受けた意味で ‘うわああああ’や‘ぎゃああああ’を連発する傾向にある。

図17

図4.2.1-8 21:09の巨人側つぶやき

図18

図4.2.1-9 21:09の楽天側つぶやき

21:27 巨人201 楽天107 計308
21:28 巨人372 楽天165 計537

楽天は8回1,2塁のチャンスで外野に大飛球を放つも、巨人亀井選手のファインプレーにより無失点に終わる。

図19

図4.2.1-10 21:28の巨人側つぶやき

図20

図4.2.1-11 21:28の楽天側つぶやき

4.2.2 第02戦

図21

図4.2.2-1 第2戦スコア

楽天が田中の毎回の12奪三振、3安打1失点の完投勝利で、日本シリーズ球団初勝利で1勝1敗のタイとした。楽天は6回裏の1死二塁の場面で、前日の試合で巨人の先制点のきっかけとなる失策と、打っては5打数無安打に抑えられた銀次が甘く入ったスライダーを中前適時打として、1点を先制。7回裏の2死一、三塁の場面で藤田の二ゴロが微妙な判定で内野安打となり、巨人監督の原が猛抗議するものの覆らず、2点目が入った。巨人打線は8回の寺内のソロ本塁打による1点に終わり、4回表の2死一、三塁と、6回表の2死満塁の場面でいずれもロペスが凡退で、先発の菅野を援護できなかった。

図22

図4.2.2-2 第2戦両チームつぶやき推移図

図23

図4.2.2-3 第2戦両チーム合計つぶやき推移図

21:14 巨人45 楽天218 計263

楽天藤田選手ボテボテの当たりも執念のヘッドスライディングがセーフとなる。しかし、ツイート上ではアウトなのでは?という声が目立つ。

図24

図4.2.2-4 21:14の巨人側つぶやき

図25

図4.2.2-5 21:14の楽天側つぶやき

4.2.3 第03戦

図26

図4.2.3-1 第3戦スコア

楽天が先発野手全員による13安打で、巨人の先発の杉内を2回途中で降板させるなど打線で圧倒、投げては美馬の好投もあり、5対1で勝利し対戦成績を2勝1敗とした。楽天は2回表に二死満塁から、藤田、銀次の連続二塁打で4点を先制し、8回表にも追加点を挙げて試合を決めた。巨人は美馬に対し6回途中まで無四球、4安打に抑えられ、6回の美馬のアクシデントによる降板を受けて登板したレイにも2回1/3を8回裏の矢野のソロ本塁打による1失点に抑えられる。巨人は高橋、ロペスがここまで3試合で無安打、同じく阿部が1安打など打線が低調となっている。

図27

図4.2.3-2 第3戦両チームつぶやき推移図

図28

図4.2.3-3 第3戦両チーム合計つぶやき推移図

19:00 巨人117 楽天168 計285

楽天藤田選手のタイムリーで先制。巨人ファンは杉内投手の悪さを指摘する。

図29

図4.2.3-4 19:00の巨人側つぶやき

図30

図4.2.4-5 19:00の楽天側つぶやき

21:28 巨人153 楽天129 計282

審判がセーフからアウトのジェスチャーに変えたため、ツイート上で巨人ファンから批判的な内容が多くみられる。

図31

図4.2.3-6 21:28の巨人側つぶやき

4.2.4 第04戦

図32

図4.2.4-1 第4戦スコア

巨人が逆転で2勝2敗のタイとした。巨人は前日までシリーズ無安打のロペスや、高橋を外すなど打線を組み替えた。序盤に楽天に4点を取られるが、初回から5回裏までに点を重ねて5対4と逆転、その後楽天が追いつくが、巨人は7回裏に1死一、二塁で寺内が決勝点となる適時打を放ち再び逆転。この後はマシソンと山口と継投し、勝利した。楽天投手陣は先発ハウザーが3回4四球1死球など、この試合だけで12与四死球で、監督の星野は試合後に四球が多かった事を敗因としてあげている。

図33

図4.2.4-2 第4戦両チームつぶやき推移図

図34

図4.2.4-3 第4戦両チーム合計つぶやき推移図

20:23 巨人197 楽天114 計311

楽天宮川投手が巨人寺内選手の頭部でボールを当ててしまい、危険球退場となる。

図35

図4.2.4-4 20:23の巨人側つぶやき

図36

図4.2.4-5 20:23の楽天側つぶやき

4.2.5 第05戦

図37

図4.2.5-1 第5戦スコア

このシリーズ初の延長戦となった試合は、延長10回に勝ち越した楽天が3勝2敗として日本一に王手をかけた。楽天は3回に2本の適時打で4試合連続で先制点を挙げ、先発の辛島は5回を1安打無失点に抑え、6回からは第1戦先発の則本がリリーフ登板。巨人は7回裏に村田のソロ本塁打で1点を返し、土壇場の9回裏にも村田が1死一、三塁から同点となる適時打で、延長戦に入る。10回表、楽天は先頭打者の則本が、西村から四球で出塁すると、その後1死一、二塁から銀次が中前安打で則本がホームに生還し勝ち越し、この後ジョーンズの適時打で、さらに1点を加えると、その裏は続投の則本が3者凡退に抑えて試合終了。巨人打線はこの日も4安打2点で、3番坂本、4番阿部が無安打に終わっている。

図38

図4.2.5-2 第5戦両チームつぶやき推移図

図39

図4.2.5-3 第5戦両チーム合計つぶやき推移図

21:53 巨人215 楽天318 計533

楽天藤田選手が痛い足を引きずりながら交代し、両チームから賞賛される。その後楽天ジョーンズ選手のタイムリーにより2点差に広がる。

図40

図4.2.5-4 21:53の巨人側ツイート

図41

図4.2.5-5 21:53の楽天側ツイート

4.2.6 第06戦

図42

図4.2.6-1 第6戦スコア

巨人がこの年シーズン公式戦から日本シリーズにかけて連勝を続けた田中を攻略して、3勝3敗でタイとして逆王手をかけた。 先制したのはこの試合も楽天で、2回裏に1死二、三塁から嶋の内野ゴロで先制、ロペスの失策もあり、この回2点を挙げた。巨人は5回表にこのシリーズで2安打で不調だった坂本の二塁打をきっかけに、この試合開始時までポストシーズン無安打と不調だったロペスの2ラン本塁打で同点に追いつくと、この後高橋由のタイムリーも出て、この回3点を挙げて逆転。6回表にロペスの内野ゴロで1点を追加すると、7回からは山口、マシソンとつないで勝利した。先発の菅野は楽天打線を6番まで無安打に抑えるなど、7回3安打2失点の内容で勝利投手。

楽天はここまで3勝2敗で王手をかけ地元仙台に戻り、今季公式戦で不敗のエースを立てたものの、12安打4失点で田中は完投ながら敗れた。田中はポストシーズンを含めた公式戦では、前年8月19日の敗戦以来の440日ぶり、今年になって初めての敗戦投手。ポストシーズンを含めた公式戦での連勝は30でストップ。また4失点は今季登板ではワースト

図43

図4.2.6-2 第6戦両チームつぶやき推移図

図44

図4.2.6-3 第6戦両チーム合計つぶやき推移図

4.2.7 第07戦

図45

図4.2.7-1 第7戦スコア

共に3勝3敗で迎えた第7戦は、楽天が継投による完封で3対0で勝利し、初の日本一を達成した。 先発は第3戦と同じとなる美馬と杉内。楽天は1回裏に巨人の失策から第2試合から6試合連続で先制点を挙げ、2回裏には岡島の二塁適時打で2対0とし、巨人は先発の杉内から澤村に繋ぐが、4回裏に牧田にソロ本塁打が出て3対0。5回からは巨人は内海が登板、楽天は6回まで美馬が無失点の好投で7回からは則本を登板、互いに追加点が入らないまま、9回表には楽天は前日160球完投をしたばかりの田中が志願して登板。2安打され、2死一、三塁としたものの、最後は矢野を空振り三振として試合終了、楽天が日本一となり田中がセーブを挙げ、胴上げ投手となった。勝利投手は楽天の先発の美馬で、このシリーズのMVPを獲得。

図46

図4.2.7-2 第7戦両チームつぶやき推移図

図47

図4.2.7-3 第7戦両チーム合計つぶやき推移図

19:03 巨人44 楽天192 計236

楽天マギー選手のショート強襲の当たりを巨人坂本選手のエラーで楽天先制

図40

図4.2.7-4 19:03の巨人側ツイート

図41

図4.2.7-5 19:03の楽天側ツイート

19:20 巨人30  楽天208 計238

楽天岡島選手のタイムリーにより追加点。巨人杉内投手はマウンドを降りる。

図50

図4.2.7-6 19:20の巨人側ツイート

図51

図4.2.7-7 19:20の楽天側ツイート

21:50 巨人194 楽天117 計311

楽天が球団初の日本一になる。

図56

図4.2.7-8 21:50の巨人側ツイート

図57

図4.2.7-9 21:50の楽天側ツイート

4.3 考察

各試合のつぶやき推移からピーク時のつぶやきを抽出すると、どのようなことが起き、どちらのチームのファンが盛り上がったかがわかるため、試合の流れを掴むことができる。これは得点シーンやピンチ時に多く見られる傾向である。

つぶやきが伸びる要因として、得点というのがポイントになる。第2戦では楽天がエースの田中投手が投げたにもかかわらず、つぶやきの数は全7試合において1番低かった。これは得点が入ったのが試合終盤のみであったため前半にピーク時が来なかったためである。一方第4戦、第5戦は多くのつぶやき数が見受けられる。この2試合のみ試合時間が4時間前後(その他は3時間20分程度)であるのも原因だが、得点シーンや延長戦などで山場が多くなり、つぶやき数が伸びたと考えられる。

5.まとめ

本研究では、プロ野球の試合に対してTwitterの利用について述べてきたが、両チームからのつぶやきを取得することによりそれぞれの場面でもファンの反応は様々あることがわかる。グラフに表わすことにより盛り上がることは理解できるが、どのようなことが起こっているのかはつぶやきをみないとわからなかった。しかし、どのようなことが起こったかはつぶやきからも理解出来るため、プロ野球に対する情報抽出は有効であると考える。

Twitterの今後として、このデータを生かすのであればスポーツニュースなどの短編にまとめる際に有効であると考える。長時間の映像をグラフの山で理解できるため、どの時間でどのようなことが起きたかなどが理解できるため、今後Twitterを用いたこのような手法が出てくるかもしれないと思う。

今後の課題として、今回の研究では一定期間のリーグ別つぶやき、試合別つぶやきの数を中心にどのようなことが読み取れるかなどを行ったが、つぶやきの詳細な分析はあまり出来なかった。つぶやきで選手名、感情などより詳細なデータにまとめることにより、山からでもどのような場面なのかが理解でるかが課題であると思う。

6.参考文献

  1. Twitter Japan Blog  Twitterの2013年(日本のトレンド編)https://blog.twitter.com/ja/2013/twitterno2013nian-ri-ben-notorendobian
  2. アナリスト・グループ、Semiocast  http://semiocast.com/publications/2012_07_30_Twitter_reaches_half_a_billion_accounts_140m_in_the_US
  3. ハッシュタグクラウド http://hashtagcloud.net/
  4. 久保光証他(2013) 良い実況者に着目したTwitterからのスポーツ速報生成 言語処理学会 第19 回年次大会 発表論文集