DataTennis. NET

データテニス ドットネット

テニストッププロの試合データ記録プロジェクト【MatchChartingProject】に参加してみました

公開日:
最終更新日:2019/04/09

      2019/04/09

こんにちは。

個人でテニスのデータ分析ツールをつくってる@otakoです。

トッププロのデータを集めることを目的にした、試合データ記録プロジェクトMatchChartingProjectに参加したので、参加方法、データ記録方法などについて紹介します。

MatchChartingProjectはクラウドソーシング型のデータ記録プロジェクト

MatchChartingProjectでは、5070試合もの大量のデータが公開されており、われらが錦織圭の試合も66試合分のデータがあります。(2019/2/14時点)
ボランティア参加型のクラウドソーシングプロジェクトで、誰でも参加可能です。

映像をみながらスプレッドシートに試合内容を記録し、提出すると、データが集計された後にTennisAbstractに掲載されます。

試合のデータはサーブポイント率、リターンポイント率など、よくみるStatsデータにとどまらず、ショットコース(プレースメント)の傾向やフォアハンド、バックハンド、スライス、ロブなど、どの種類のショットで打ったか、サーブコース、リターン深さ、など非常に多くのデータを確認することができます。

データの充実度はこのサイトが世界一!、だと自分は思っていて、こちらのデータをソースにした分析事例をみかけることも多々ありますね。
データ分析しようにもデータがないとはじまりません。データ集計サイトは貴重な存在です。

自分は今テニスデータの分析ツールを開発中で、こちらのデータの記録方法やまとめ方などを勉強したく、参加してみた次第です。
せっかく参加したので、備忘録としてプロジェクトへの参加方法とデータの記録・提出方法について書きました。

参加方法について

詳しくはQuick Start Guideに書いてあります。

まず最初にやること。Charted ATP and WTA Matchesに、記録したい試合が既に公開されてないかを確認します。
そして、予定リストとなるシートというものがあり、記録予定の試合が登録されていないことを確認。
これは公開されてないけど、これから記録する予定の試合を記入するものとなってます。
試合を記録したけど、他の人も記録をしていて重複してしまう、というのを避けるためにこうしたシートで運用されているようです。

自分は、先日行われたブリスベン準決勝、錦織圭vsジェレミーシャルディ戦を選びました。錦織が6-2、6-2で勝った試合ですね。

そして、試合記録用のスプレッドシートがあるので、そのシートをダウンロードし、データ記録作業に入ります。

データ記録について

映像をみながらスプレッドシートにデータを記録します。

サーブ、リターン、全ショットのコースや種類についてコードを記録していきます。
1stと2ndと入力する箇所が異なり、1stでポイント終了の場合は1stのみにポイント記録、2ndでポイント終了の場合は、1stのサーブ内容と2ndのポイント内容を記録。

コードというのは、サーブコース、ショットの種類、コースなどを、対応する英数字の文字として記録していきます。
対応表をつくったので貼り付けておきます。

全てを記述する必要はなく、Serve direction、Shot codes、How the point endedまで記入できればよいみたく。
自分は、Shot Direction、Return depthは記述し、Courtpositionについては記述しませんでした。

1つ、例を挙げて説明しましょう。
・1st n
・2nd 6s73f1fn#
と記録しているポイントがあります。

これは、
・1stサーブはネット。
・2ndサーブのプレースメントはdown the T(6)
・リターンはバックハンドスライス(s)
・リターン深さはネット前(7)
・錦織のバックハンド側にボール着地(3)
・錦織のフォアハンドショット(f)
・シャルディのフォアハンド側にボール着地(1)
・シャルディのフォアハンド(f)はネット(n)のフォースドエラー(#)
を記録していることになります。

こんな感じで、全てのショットをコードで記述していき、これを最初から最後までポイントを記録していきます。
全てのポイントを記録すれば、試合のデータ記録は終了です。

データ送付はメールで

記録が終了したら、スプレッドシートをMatchChartingProjectの管理者Jeff Sackmannさんにメールで送ります。
Jeff Sackmannさん側でデータを集計してくれ、数日後にデータがサイトに公開されます。

自分が記録した試合は2019 Brisbane SF: Jeremy Chardy vs Kei Nishikoriにて公開されてます。

参加してみて

全てのショットを記録する必要があるため、記録は結構大変。自分は毎ショット、映像を停止して記録しましたので、時間もかかりましたし。
慣れれば停止せずリアルタイムに記録できるとありますが、けっこう道のりは長いような。

大変な作業なので、何10~100試合とこれをやるのは正直きつい。
それを、誰でも参加できるクラウドソーシングという形で、試合を記録してもらい集計してデータベースをつくっていく、というやり方は素晴らしいアイディアだなと。

コード(英数字)で記録していくというやり方も面白いですね。
錦織圭を鼻血が出るまで応援し続けるブログの団長さんも鼻血記法という記述方法で各ポイントを記録されたりしてます。
スポーツ分析業界では「コーディング」と呼ばれており、割り当てたコード(記号)でデータを記録するのは一般的にやられる手法のようです。
慣れが必要ですが、データ記録手段としては効率的なやり方かもしれません。

自分がつくっている分析ツールにも、コーディング対応させようかなあとか、記録したデータをコードに変換してMatchChartingProjectに提出できるようにしたら面白いかなあ、と考え始めています。

データ分析内容については、また別のブログ記事に書こうと思います。
ではでは。

 - blog, データ分析, 錦織圭