JV-Linkで取得できるデータの種類と活用法
JV-Linkで取得できるデータの種類と活用法
JRA-VAN Data Lab. が提供する JV-Link では、JRAの公式競馬データを40種以上取得できます。この記事では、取得できるデータをカテゴリごとに紹介し、それぞれの競馬予想・分析での活用法を解説します。
レース情報
競馬予想の基盤となるデータ群です。
特別登録馬
重賞やオープン競走の特別登録段階での出走予定馬リストです。レース週の火曜に更新されます。
活用法: 出馬表が確定する前の段階で予想の下準備ができます。想定オッズの算出や、除外の可能性を加味した買い目検討に使えます。
レース詳細
レースの基本情報(開催場・距離・馬場・天候・グレード・頭数など)がまとまったデータです。
活用法: 過去レースの条件をSQLでフィルタリングする際の軸になります。「東京芝2400m・良馬場・G1」のような条件検索はこのデータがベースです。
馬毎レース情報(出馬表)
各馬の枠番・馬番・斤量・騎手・オッズなど、レースごとの出走情報です。過去走の着順・タイム・上がり3F・通過順位もここに含まれます。
活用法: 競馬予想の最重要データです。スピード指数の算出、前走成績の比較、脚質判定(逃げ・先行・差し・追込)など、ほぼすべての分析がこのデータを起点に行われます。Pythonでの機械学習でも、ここから特徴量を大量に生成します。
払戻情報
各レースの単勝・複勝・馬連・馬単・三連複・三連単の払戻金額です。
活用法: 回収率の算出に必須です。過去の予想モデルのバックテストで「この買い方をしていたらいくら回収できたか」を計算できます。期待値ベースの投票戦略を構築する際の基盤です。
調教データ
坂路やウッドチップコースでの調教タイム・併せ馬の結果などです。
活用法: 馬のコンディション判定に使います。「調教タイムが自己ベストを更新した馬の好走率」のような分析ができます。近年は調教データを特徴量に入れた予測モデルの精度向上が注目されています。
馬体重
レース当日に計測された馬体重と前走比の増減です。
活用法: 大幅な増減は体調の変化を示すシグナルになります。「前走比+10kg以上の馬の成績」のような統計分析や、当日の馬体重を特徴量としてモデルに組み込む使い方があります。
オッズデータ
投票戦略・期待値分析に欠かせないデータ群です。
単勝・複勝オッズ
もっとも基本的なオッズデータです。確定オッズだけでなく、時系列オッズモードを使えばレース前のオッズ推移も取得できます。
活用法: 予測モデルが算出した各馬の勝率とオッズを比較し、期待値がプラスの馬券を特定する「期待値投票」の根幹です。時系列データを使えば、締切直前のオッズ急落(大口投票の兆候)を検知することもできます。
馬連・馬単・三連複・三連単オッズ
連勝式のオッズデータです。組み合わせ数が膨大なため、データ量は大きくなります。
活用法: 馬券種ごとの期待値計算に使います。「三連単の期待値が高い買い目を自動抽出する」といった高度な投票戦略を組めます。ただしデータ量が大きいため、必要な場合のみ取込むのがおすすめです。
票数データ
各馬券種の投票票数です。
活用法: オッズだけでは分からない投票の偏りを分析できます。「票数が特定の買い目に集中しているかどうか」で、インサイダー的な動きを推測する使い方もあります。
マスタデータ
馬・騎手・調教師などの基本情報です。分析の際にレースデータとJOINして使います。
競走馬マスタ
馬名・性別・毛色・生年月日・馬主・調教師など、競走馬の基本属性です。
活用法: レース情報と結合して「牝馬限定の分析」「4歳馬の成績傾向」などの切り口で分析する際に使います。
血統情報
父・母・母父の血統データです。産駒マスタ・繁殖馬マスタと合わせると、数世代にわたる血統表を構築できます。
活用法: 血統分析は競馬予想の王道です。「ディープインパクト産駒の芝2000m以上での成績」「母父がStorm Catの馬のダート適性」のように、種牡馬×条件の成績を統計的に評価できます。新馬戦や未知の条件では特に血統の重要度が高くなります。
騎手マスタ・調教師マスタ
騎手・調教師の基本情報と成績データです。
活用法: 「ルメール騎手の東京芝での勝率」「特定の調教師が得意なレース条件」の分析に使います。騎手変更時のプラス/マイナス評価にも活用できます。
速報データ
レース開催中にリアルタイムで配信されるデータです。
速報専用データの種類
- 馬体重(当日速報) — パドック後の最新馬体重
- 天候・馬場状態 — 当日の変更情報
- 出走取消・競走除外 — 当日の取消情報
- 騎手変更(当日) — 当日の乗り替わり
- 発走時刻変更・コース変更 — レース条件の変更
活用法: リアルタイムで予想を更新する自動投票システムを構築する際に不可欠です。出走取消があれば買い目を自動で組み替える、馬体重の大幅増減で投票額を調整する、といった運用が可能になります。
データの取得期間
JV-Linkでは 1986年以降 のデータを取得できます。約40年分のレースデータを使えるため、統計的に有意な分析が行えます。
取得範囲は自由に設定でき、「2020年以降のデータだけで十分」という場合は数時間で初回取込が完了します。
まとめ
| カテゴリ | 主な用途 |
|---|---|
| レース情報 | スピード指数・脚質分析・機械学習の特徴量 |
| オッズ | 期待値投票・大口検知・回収率分析 |
| マスタデータ | 血統分析・騎手/調教師評価 |
| 速報データ | リアルタイム予想更新・自動投票 |
JV-Linkのデータをデータベースに蓄積すれば、上記のすべての分析をSQLやPythonで自在に行えます。
JvLink To Importer を使えば、これらのデータをGUI操作だけでPostgreSQLやMySQLに自動取込できます。プログラミングなしで競馬データベースを構築したい方はぜひお試しください。
この記事をシェア