データ分析する際に過去何年のデータの抽出すべきなのか

スポンサーリンク

1: 名無しさん@実況で競馬板アウト 2017/01/02(月) 13:55:31.96 ID:ZMNsQ1MK0

過去10年は多すぎるよな?
過去5年だと少し古いか?
過去1年だとデータが少ない?

議論しましょう

2: 名無しさん@実況で競馬板アウト 2017/01/02(月) 13:56:14.37 ID:cdsWO/nx0
条件変わりからだろ

 

3: 名無しさん@実況で競馬板アウト 2017/01/02(月) 13:56:18.48 ID:/Ge1S+XI0
5年だな

 

5: 名無しさん@実況で競馬板アウト 2017/01/02(月) 13:58:23.90 ID:ZMNsQ1MK0
>>3
5年だと傾向として古くない?
重賞とかじゃなくてコースデータを分析する際には

 

4: 名無しさん@実況で競馬板アウト 2017/01/02(月) 13:58:07.47 ID:dUlH5aj/0

5年がいいとこじゃないか?

改修工事とか芝の変更とかないのが前提だけどね。

10年を浅く分析するより5年を濃く分析した方が近年の傾向に沿う。

 

6: 名無しさん@実況で競馬板アウト 2017/01/02(月) 13:59:05.52 ID:dmVi1CZm0
長くとも三年だろうな

 

8: 名無しさん@実況で競馬板アウト 2017/01/02(月) 14:02:53.79 ID:tGNroG/3O
一年では短いし、百レースでも足らん

スポンサーリンク

9: 名無しさん@実況で競馬板アウト 2017/01/02(月) 14:03:07.77 ID:++36Aq/K0
短いデータでも良いんだよ
逆に短いデータで傾向が偏らないようなデータならあてにならないし使えない

 

11: 名無しさん@実況で競馬板アウト 2017/01/02(月) 14:10:30.24 ID:ZMNsQ1MK0
>>9
一理ある

 

15: 名無しさん@実況で競馬板アウト 2017/01/02(月) 14:15:53.21 ID:dmVi1CZm0
どういうデータかはわからんが、JRA発表のデータ自体にバラつきがあるからあんまり意味はない。

 

16: 名無しさん@実況で競馬板アウト 2017/01/02(月) 14:18:06.46 ID:ZMNsQ1MK0
例えば中山ダート1200の騎手別傾向や種牡馬別傾向を調べたい

 

36: 名無しさん@実況で競馬板アウト 2017/01/02(月) 15:58:51.47 ID:W9jcwZp30
>>16
騎手なんて技術が変わるんだから新しいほうがいいに決まってる

 

21: 名無しさん@実況で競馬板アウト 2017/01/02(月) 14:35:49.66 ID:NqXA3VHO0
データてのはあればあるだけいい
ただ過去の傾向から抽出するのではなく、今後のトレンドがどう動いていくのか先読みすることに用いるべきだ
そこらへんを解っていない自称データ派にはならないように

 

23: 名無しさん@実況で競馬板アウト 2017/01/02(月) 14:45:52.77 ID:snzqRd7l0
>>21
若い頃、コース成績のいい種牡馬買いまくって旬が過ぎてたってのよくやったわw

 

27: 名無しさん@実況で競馬板アウト 2017/01/02(月) 14:53:44.41 ID:9a8l+dwB0
枠順と騎手は長いデータで見るけど脚質は開催単位、週単位で見ないとわからんだろ

 

39: 名無しさん@実況で競馬板アウト 2017/01/02(月) 16:04:45.70 ID:x5XRqEef0
データ→使える
ジンクス→使えない
これらを混同してはいけない

 

40: 名無しさん@実況で競馬板アウト 2017/01/02(月) 16:16:16.79 ID:iUEfTQae0
データってのは例数の多さこそ絶対
余程の条件変更がない限りすべて揃えるのが正解

 

42: 名無しさん@実況で競馬板アウト 2017/01/02(月) 16:37:34.39 ID:PFNe0pef0
統計学的見地から有意なデータ数を集めようとすると古すぎて使えない物も含まれるというジレンマ

 

43: 名無しさん@実況で競馬板アウト 2017/01/02(月) 16:50:37.66 ID:pMSkPVDL0
ここ2,3年の間で、シャタリング,パーチドレン,エアレーションなどなど、馬場改良技術が劇的に変わったようで、
そのせいで過去の傾向が使えなくなった。
数年前まで、中山芝の短距離戦なんか逃げ・先行馬買っておけば安泰だったのに、
ある文献によると日本一逃げが決まりにくい馬場になったらしい。
去年の12月なんて、阪神の芝コース、ダートよりも時計かかっていたぞ。
そのくせディープ産駒が来てしまうから、わけわからん。
このまま行くと、内枠至上主義は京都以外なくなるかもね。

 

45: 名無しさん@実況で競馬板アウト 2017/01/02(月) 17:24:38.38 ID:ZMNsQ1MK0
馬場改良が本格的に始まったのっていつよ?

 

49: 名無しさん@実況で競馬板アウト 2017/01/02(月) 17:32:18.03 ID:+z5UN9VV0

>>45
>馬場改良が本格的に始まったのっていつよ?

はっきりとした年代の記憶がちょっとあれなんだけど、確か1990年前後の阪神競馬場が最初だよ
それまでのJRAの競馬場は芝の下の路盤が土をカチカチに固めた路盤だったんだけど
これを境に土じゃなくて山砂の路盤に変えたんだよ
その結果、「水はけ」に関して言えば劇的に良くなった

 

46: 名無しさん@実況で競馬板アウト 2017/01/02(月) 17:26:13.95 ID:4LPs3z2y0
原則として競馬にデータ、すなわち傾向論は相性悪いと思うけどね
特に同一レースにおける過去何年のデータは全く無視していいと思ってる
それを採用する人間の考えが理解できない
逆にレース週の結果は条件が異なろうとデータとして重視する
例えばダービーを予想するときには、過去10年のダービーの結果を調べはしないがその週の東京の芝のレース結果は未勝利の1400戦だろうが分析する
馬場傾向と展開の傾向、騎手トレンドが予想の根幹だからかもしれんが

 

54: 名無しさん@実況で競馬板アウト 2017/01/02(月) 17:42:11.21 ID:7hchKn0E0
馬の実力を見極めて初めてデータを使う
データはプラスマイナスの材料であってデータだけでたけで買ったり切ったりするものではない

 

57: 名無しさん@実況で競馬板アウト 2017/01/02(月) 17:48:28.71 ID:+z5UN9VV0

もっとも阪神競馬場でそのような大規模改修をした直後、ありえないくらいに時計が遅くなった
下記はその一例である

※サンケイ大阪杯勝ちタイム(良馬場)
87年 ニシノライデン  2.01.0
88年 フレッシュボイス 2.01.7

92年 トウカイテイオー 2.06.3

当時、騎手やファンなどのあらゆる方面から「改修後の阪神の馬場は重すぎる」というクレームが発生した
当初、JRAは阪神の馬場が一気に重くなった的確な原因をつかめていなかった
芝の下の路盤を土から山砂に変えただけでここまで時計が遅くなるのはおかしいと思っていたようだ
むしろその原因は路盤の変更ではなく、同時に行ったオーバーシードのほうにあると読んでいた
でも理論的にはオーバーシードだけでこれほど時計が遅くなるというのはナンセンスである

そうこうしているうちにだんだん実情がつかめてくると実は原因はやはり路盤にあったのだ
芝の下の山砂の層の土砂の粒度が大きすぎて流動性がありすぎてダート馬場の上に芝を乗っけたような状態になっていたのだ
それで馬が走ると次々に路盤の中が壊れて崩れていたのである

この原因が判明してから、もう一度路盤を改良するのに更に数年の年月を要したわけである

 

58: しんたろう ◆3UjjOZHwX2 2017/01/02(月) 17:55:59.04 ID:c0b7ROQt0
>>57
この時トウカイテイオーが大阪杯ではなく、阪神大賞典のほうに出ていたら
マックイーン>>5馬身>>カミノクレッセ>>5馬身>>トウカイテイオー
みたいな本番に近いような結果に終わって、世紀の対決も起こらなかったし
マックとカミノの馬連も20倍もつかずに3倍程度だったろうなw

スポンサーリンク

61: 名無しさん@実況で競馬板アウト 2017/01/02(月) 18:26:54.72 ID:ZMNsQ1MK0
とりあえずコースデータ分析する際には過去何年がいいの?

 

62: 名無しさん@実況で競馬板アウト 2017/01/02(月) 18:32:14.80 ID:vk+Wt6kb0
>>61
俺は過去2.3年かな
未勝利、500万、1000万から上はわけてる

 

87: 名無しさん@実況で競馬板アウト 2017/01/02(月) 20:05:19.45 ID:ZMNsQ1MK0
>>62
具体的にどう分けるの?

 

90: 名無しさん@実況で競馬板アウト 2017/01/02(月) 20:09:34.73 ID:eTpmsyct0

>>87
書き方が悪かったw
未勝利は未勝利だけ
500万も同様
1000万から上は1600万OP重賞すべてマークしてる

レースの流れとか違って来るだろうから、GⅠ検討する時に未勝利のデータ入って来るのはなんか違うと思う

逆に事実は事実だから全部含めるって考え方も当然あり

 

93: 名無しさん@実況で競馬板アウト 2017/01/02(月) 20:18:20.31 ID:ZMNsQ1MK0
>>90
なるほどー
実際の分析はどう?
結果に繋がってる?

 

95: 名無しさん@実況で競馬板アウト 2017/01/02(月) 20:23:36.18 ID:QkyJPYIy0

>>93
さっぱりだあw

でも懲りずに少しずつ買う
京都D1200未勝利のヨハネスブルグとか狙ってみる

 

63: 名無しさん@実況で競馬板アウト 2017/01/02(月) 18:33:55.58 ID:zeyH+L7h0
芝の種類やコースA、B、C、Dとかでみなきゃ意味ないぞ
ざっくりすぎだろ

 

64: 名無しさん@実況で競馬板アウト 2017/01/02(月) 18:34:22.20 ID:yZXkX70Q0
コースデータのように日々どころかレースごとに変動するようなもんはどうしようもないだろ
騎手だって当日の状況を見てそのレースをどう乗るか判断してるんだし

 

65: 名無しさん@実況で競馬板アウト 2017/01/02(月) 18:48:00.28 ID:GODjQreEO
結局サンプル数だよ
理想は中央地方全レース全頭に当てはまるやつ
つまり最高のデータは指数系になる
最悪のデータは一年に一回しかない重賞のデータかな

 

97: 名無しさん@実況で競馬板アウト 2017/01/02(月) 20:37:55.86 ID:+UCTgl+q0
パイロだけ買っときゃプラスと言われ始めてから久しいが、未だに儲かるのは、
データなんて関係無い!ってやつが相当数いるからだと思うから、
むしろデータ否定派を増やす努力をしたほうが良いぞ。

 

98: 名無しさん@実況で競馬板アウト 2017/01/02(月) 21:05:33.15 ID:m8Jrri7c0
データ否定派って天気予報も信用しなそう

 

引用元:データ分析する際に過去何年のデータの抽出すべきなのか【http://awabi.2ch.sc/test/read.cgi/keiba/1483332931/】

スポンサーリンク

コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA