錦織圭のサーブデータ追加(復帰以降3大会)とデータの日本語文字化け対応
公開日:
最終更新日:2020/11/03
2020/11/03
2020年9月のATP250キッツビュール大会から錦織圭選手が復帰しました。肘の怪我と新型コロナ流行などの影響による約1年間の長い休みを経ての復帰となります。復帰してからまだ数週間ですが、キッツビュール(ATP250)、ハンブルグ(ATP500)、ローマ(ATP1000)と既に3大会をこなしました。始まると、忙しいですね。
復帰以降3大会のデータを追加
さて、こちらのページで錦織圭選手と対戦相手のサーブデータ(コース・速度など)をダウンロードできるようにしており、復帰以降3大会のデータも追加しました。
https://github.com/taikoma/NishikoriBoardData/tree/master/data
2020のフォルダの中にデータが格納されています。
日本語文字化け対応
そしてエクセルでcsvファイルを開くと日本語文字が化ける現象にも対応しました。
エクセルは文字コードUTF-8のファイルを開くと文字化けする現象があるようです。
こんな感じです。
文字コードはUTF-8で保存していましたが、エクセルでデータ分析する人が困らないようSHIFT-JISでも保存するようにしました。
ファイル名の末尾に「sjis」とつけています。
文字化けがなくなっていますね。
サーブ改造の効果
復帰までの1年間で、サーブ改造に取り組んでいた、という話もあります。
錦織圭が1年かけサーブ改造に着手した理由/連載上
「ひじや手首のけがは、サーブが主な原因だった」ことで改造を決断した、と。
フォーム改造は怪我の予防が主目的てすが、サーブ速度などにどう影響してくるかも気になります。そういった影響を定量的に評価するのにサーブ速度データは良い材料になると思います。自分でも時間ができたらデータで確認したいなあと思っています。
関連記事
以前書いた錦織圭サーブデータに関する記事です。
【Webスクレイピング】錦織圭実況掲示板のデータ記録(サーブコースや速度など)を抽出してまとめてみました