機械学習ランダムフォレスト BoatRaceデータを用意

機械学習の手法の1つランダムフォレストを勉強したいと思います。
その前にそれらしいデータを入手しないといけないので、ボートレースデータを入手してテキストファイルの独自すぎるフォーマットをCSV形式にします。

以下サイトにある「競走成績ダウンロード」よりダウンロードしました。
https://www.boatrace.jp/owpc/pc/extra/data/download.html

ソースは以下の通りです。

ちなみに以下サイトを参考に改変させて頂きました。ありがとうございます。
https://github.com/cstenmt/boatrace

2019年1年分のデータを取得した結果は以下です。データをお使いになりたい方は以下からダウンロード下さい。

BoatRaceResultData2019.7z 3 MB cloud_download

4 件のコメント

  • はじめまして
    プログラミング初心者です
    グーグルコラボでこのコードを動かそうとして貼り付けたのですが、別途処理が必要でしょうか。
    よろしければ教えていただけませんか。

    • パイソンから頑張る さま
      コメントありがとうございます。
      こちらのソースはグーグルコラボで動かしていないのですが、データ読み込んでパースしているだけですので、基本的に動くはず。。と思います。

      競艇データフォーマットが変わったりしていたら、読み込む位置(line2[3:7]←この数字)等変える必要があるかもしれませんが、まだ1年経っていないので大丈夫だと思うんですけど。。動かなかったらごめんなさい~。

      • さっそくお返事ありがとうございます
        オフィシャルから取得したTXTファイル(解凍しました)をアップロードしたところ
        FileNotFoundError: [Errno 2] No such file or directory: ‘./data/results/txt’
        というエラーが出ました。
        アップロードする場所の問題なのでしょうか。。。レベルの低い質問で恐縮です。。

        • パイソンから頑張る さま
          コメントありがとうございます。
          そうですね。アップロードしたファイルが読めていないようですね。
          GoogleColabでファイル読み込みをしたものを先ほど記事(https://wp.me/pbxYws-vT)しましたので、宜しければ見てください。

          上手くいきますように。

  • コメントを残す

    メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

    日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)