機械学習の手法の1つランダムフォレストを勉強したいと思います。
その前にそれらしいデータを入手しないといけないので、ボートレースデータを入手してテキストファイルの独自すぎるフォーマットをCSV形式にします。
以下サイトにある「競走成績ダウンロード」よりダウンロードしました。
https://www.boatrace.jp/owpc/pc/extra/data/download.html
ソースは以下の通りです。
ちなみに以下サイトを参考に改変させて頂きました。ありがとうございます。
https://github.com/cstenmt/boatrace
2019年1年分のデータを取得した結果は以下です。データをお使いになりたい方は以下からダウンロード下さい。
BoatRaceResultData2019 (1725 ダウンロード)
コメント
コメント一覧 (4件)
はじめまして
プログラミング初心者です
グーグルコラボでこのコードを動かそうとして貼り付けたのですが、別途処理が必要でしょうか。
よろしければ教えていただけませんか。
パイソンから頑張る さま
コメントありがとうございます。
こちらのソースはグーグルコラボで動かしていないのですが、データ読み込んでパースしているだけですので、基本的に動くはず。。と思います。
競艇データフォーマットが変わったりしていたら、読み込む位置(line2[3:7]←この数字)等変える必要があるかもしれませんが、まだ1年経っていないので大丈夫だと思うんですけど。。動かなかったらごめんなさい~。
さっそくお返事ありがとうございます
オフィシャルから取得したTXTファイル(解凍しました)をアップロードしたところ
FileNotFoundError: [Errno 2] No such file or directory: ‘./data/results/txt’
というエラーが出ました。
アップロードする場所の問題なのでしょうか。。。レベルの低い質問で恐縮です。。
パイソンから頑張る さま
コメントありがとうございます。
そうですね。アップロードしたファイルが読めていないようですね。
GoogleColabでファイル読み込みをしたものを先ほど記事(https://wp.me/pbxYws-vT)しましたので、宜しければ見てください。
上手くいきますように。