Google colabからKaagle APIを利用して、データをダウンロードする手順について記載します。
Kaggle API Tokenの作成
Kaggle>Account>APIの「Create New API Token」をクリックして、kaggle.jsonをダウンロードします。
kaggle.jsonをGoogle Driveにアップロードします。今回は、Driveの直下に置きます。
Google ColaboratoryでのKaggle API利用できるようにする
Kaggle APIをインストールします。
!pip install kaggle
Google Driveにアップロードしたkaggle.jsonを読み込むために、Driveのマウントを行います。
from google.colab import drive
drive.mount('/content/drive')
Kaggle APIを利用できるようにするため、kaggle.jsonからusernameとkeyを設定します。
import os
import json
f = open("/content/drive/MyDrive/kaggle.json", 'r')
json_data = json.load(f)
os.environ['KAGGLE_USERNAME'] = json_data['username']
os.environ['KAGGLE_KEY'] = json_data['key']
Kaggleのデータをダウンロード
Spaceship Titanicのデータをダウンロードしていきます。Competitionのサイトから「Join Competition」をクリックして、データのダウンロードできるようにします。
Dataタブをクリックして、中央くらいにあるapiコマンドをコピーします。
!kaggle competitions download -c spaceship-titanic
実行すると、/contentにデータがzipでダウンロードされます。
zipファイルを解凍すればデータを利用することができます。
!unzip '/content/spaceship-titanic.zip'
train.csv、test.csv、sample_submission.csvが確認できました。
コメント