DataTennis.NET

データテニスドットネット

錦織選手のサーブデータ(コース・速度など)をダウンロードできるようにしました

公開日:
最終更新日:2019/04/09

      2019/04/09

こんにちは。

個人でテニスのデータ分析ツールをつくってる@otakoです。

サーブのコース・速度などのデータを錦織実況掲示板から収集して公開しましたので紹介します。

錦織選手と対戦相手のサーブデータ(コース・速度など)をダウンロードできるようにしました

データには、各ポイントのサーブコース・速度・どちらの選手がポイントをとったかなどのデータが記録されています。

↓のような感じで整理しているスプレッドシート(CSVファイル)で、1トーナメント1ファイルに分けてます。

項目の説明を簡単にします。

・FirstSecond 1⇒1stサーブ 2⇒2ndサーブ
・Cource サーブボールの着地したエリア(コース) w⇒wide b⇒body(middle) c⇒center
・OpponentPlayer 錦織選手の対戦相手
・Server どちらのサーブか
・Speed サーブ速度 大会によってkmhとマイル/h表示の2つがあるため2つの単位のデータが存在します。ご注意ください。
・WinLose 錦織選手がポイントとったかどうか 〇⇒錦織選手のポイント ×⇒相手選手のポイント
・Side Deuce⇒Deuceサイド Ad⇒Adサイド
など。

エクセルなどスプレッドシートを扱えるソフトを使って、各項目をソートしてグラフ化してみたりすると、新しい発見があるかもしれません。

例えばSideの項目で、DueceとAdで分けてソートしてサーブコースやサーブ速度などを確認してみるとその選手の特徴がみえてきます。

こんな感じで、サーブの配給率やポイント率をまとめることもできます。

データ収集方法は、こちらの記事【Webスクレイピング】錦織圭実況掲示板のデータ記録(サーブコースや速度など)を抽出してまとめてみましたに書いてます。

お願いしたいこと

こちらのデータは公式のものではありません。
錦織実況掲示板のコメント欄で試合データを詳細に記載されてる方(赤黄色さん)のデータを収集してまとめたものです。

サーブコース・速度やポイントWonLostなど詳細にデータを記録してくれています。

非常に大変な作業かと思われます。
ご活用いただく場合は、記録者に感謝とリスペクトをもってご使用いただきたいです。

データに関してですが、欠けてるデータもありますし、間違いも存在しうることをご承知ください。
データの間違いには責任はもてませんので、あくまで参考データとしてご活用いただくようお願いします。

サーブ速度の単位違いに注意

サーブ速度ですが、大会によってkmhとマイル/h表示の2つがあるため、こちらのデータは2つのデータが存在しますのでご注意ください。
単位は書いてません。速度の大きさでkmhかマイルなのか判断願います。

データ一覧

まずはここ最近の大会をアップしてみました。過去の試合も増やしていく予定です。

githubにもデータ置いてます。

2018年

・11月 ATPファイナルズ
・10月 ウィーン(ATP500)
・10月 上海マスターズ(ATP1000)
・10月 楽天オープン(ATP500)
・9月 メス(ATP250)
・9月 全米オープン(GrandSlam)
・8月 トロント(ATP1000)
・8月 シンシナティ(ATP1000)
・7月 ウィンブルドン(GrandSlam)
・6月 ハレ(ATP250)
・5月 全仏オープン(GrandSlam)
・5月 ローマ(ATP1000)
・5月 マドリッド(ATP1000)
・4月 モンテカルロ(ATP500)
・3月 マイアミ(ATP1000)
・2月 ニューヨーク(ATP1000)
・1月 ダラス(Challenger)ダラス

2017年

・8月 モントリオール
・7月 ワシントン
・7月 ウィンブルドン
・5月 全仏オープン2
・5月 ローマ
・5月 ジュネーブ
・3月 インディアンウエルズ
・2月 リオデジャネイロ
・1月 ブリスベン

2016年

・10月 ツアーファイナルズ
・10月 パリ
・10月 バーゼル
・9月 全米オープン2
・9月 全米オープン1
・8月 リオオリンピック2
・8月 リオオリンピック1
・8月 シンシナティ
・5月 全仏オープン1
・5月 ローマ1
・5月 ローマ2
・5月 マドリッド

 - blog, データ分析, 錦織圭