DataTennis. NET

データテニス ドットネット

テニスのデータ入手方法について

公開日:

   

データ分析するためにはデータが必要

巷ではデータ分析、データサイエンスが流行しています。このサイトも「テニスにデータを活用しよう」をコンセプトに、テニス×データに関連する記事を書いたり、分析ツールをつくったりとやってます。
データテニスドットネット(DataTennis.Net)について

さて、データを活用しようと思っても、手元にデータがなければ何もできないんですよね。まずはデータを集めるところから始める必要があります。

ということで、今回はデータを活用する第一歩となるテニスのデータを入手する方法について紹介したいと思います。

TennisAbstractからデータ入手

TennisAbstractという海外のテニスのデータサイトがあり、そこからデータを入手するのがお勧めです。

ATP、WTA、グランドスラム問わず、詳細かつ大量の試合データがこのサイトに掲載されています。

サーブポイント率、リターンポイント率など、基本的なStatsデータにとどまらず、ショットコース(プレースメント)の傾向やフォアハンド、バックハンド、スライス、ロブなど、どの種類のショットで打ったか、サーブコース、リターン深さ、など非常に多くのデータを確認することができます。

そして、面白いのがデータの集計方法です。
誰もが参加できるクラウドソーシング型のデータ集計プロジェクト(MatchChartingProject)で、各自映像をみながらスプレッドシートに試合内容を記録します。記録後にメールでシートを提出すると、データが集計され、TennisAbstractに掲載されます。(データに間違いがないか、ある程度のチェックは行われてると思います)

試合データはcsvファイルとして、github.com/JeffSackmann/tennis_atpに置いてあります。

自分もデータを記録して提出したことがありまして、そのときに書いた記事がこちらになります。
テニストッププロの試合データ記録プロジェクト【MatchChartingProject】に参加してみました

錦織圭の試合データ

錦織圭実況掲示板という、錦織の試合の様子や感想を自由に書き込める2ちゃんねる形式の掲示板があります。多くの錦織の試合の全ポイント情報を細かく集計してくれてる方がいらっしゃって、その情報全てをスクレイピングで収集して、スプレッドシート形式(csvファイル)に整形してます。

データには、各ポイントのサーブコース・速度・どちらの選手がポイントをとったかなどのデータが記録されています。
↓のような感じで整理しているスプレッドシート(CSVファイル)で、1トーナメント1ファイルに分けてます。

データ項目は↓になります。
・FirstSecond 1⇒1stサーブ 2⇒2ndサーブ
・Cource サーブボールの着地したエリア(コース) w⇒wide b⇒body(middle) c⇒center
・OpponentPlayer 錦織選手の対戦相手
・Server どちらのサーブか
・Speed サーブ速度 大会によってkmhとマイル/h表示の2つがあるため2つの単位のデータが存在します。ご注意ください。
・WinLose 錦織選手がポイントとったかどうか 〇⇒錦織選手のポイント ×⇒相手選手のポイント
・Side Deuce⇒Deuceサイド Ad⇒Adサイド
など。

ファイルのありかはこちら。2016年~2019年までの試合データがあります。
github.com/taikoma/NishikoriBoardData/tree/master/data

2019年の錦織のサーブ不調が気になって、2018年のサーブ速度と比較したことがあります。
錦織圭のサーブ速度データを去年の全米オープンのデータと比較してみた

データ収集や分析に関して書いた記事はこちら。
【Webスクレイピング】錦織圭実況掲示板のデータ記録(サーブコースや速度など)を抽出してまとめてみました

錦織と錦織の対戦相手に限定したデータになりますが、サーブ速度を含めたデータセットは他にないと思います。ダウンロードしてあれこれデータ分析してもらえると嬉しいです。

自分でデータを記録する① スマホアプリ

時間はかかりますが、自分でデータを記録していく、というやり方もあります。
弊アプリで恐縮ですが、「データテニス」というスコアを記録するAndroidアプリを公開してます。
よければご利用ください。

テニスのスコアアプリ「データテニス【Datatennis】」(for Android)

app

↓のGooglePlayリンクからデータテニスをダウンロードできます。
Get it on Google Play

自分でデータを記録する② 動画分析

動画を取り込んでボールの着地点だったり、ポイントwonlostやサービスエース、リターンエラーなどポイント種別を記録するツールです。
サーブなどの着地点を記録したく、テニス専用の動画分析ツールをつくってます。

↓はツールを使って記録したサーブ着地点データをプロットした図です。
錦織とデルポトロが対戦したときのデータ、デルポトロはライン際に打っているのに対して、錦織はばらつきが大きいことがわかります。
Image

↓は操作画面です。

一応、ソースコードはgithubでも公開していて、pythonの実行環境があれば使用することができます。
開発中なんでバグも多く、動作保証はできません。すいません。多くの皆さんに使ってもらえるよう、完成に向けて開発を進めております。

github.com/taikoma/TennisVideoAnalysis

以上、テニスのデータ入手方法について紹介しました。
テニスのデータ分析が盛り上がるよう、今後もこうした情報があればブログで提供していきたいと思います。

 - blog, データ分析