スポンサーリンク

Google colabでKaggleのデータを利用する【Kaagle API】

Google Colab

Google colabからKaagle APIを利用して、データをダウンロードする手順について記載します。

Kaggle API Tokenの作成

Kaggle>Account>APIの「Create New API Token」をクリックして、kaggle.jsonをダウンロードします。

kaggle.jsonをGoogle Driveにアップロードします。今回は、Driveの直下に置きます。

Google ColaboratoryでのKaggle API利用できるようにする

Kaggle APIをインストールします。

!pip install kaggle

Google Driveにアップロードしたkaggle.jsonを読み込むために、Driveのマウントを行います。

from google.colab import drive
drive.mount('/content/drive')

Kaggle APIを利用できるようにするため、kaggle.jsonからusernameとkeyを設定します。

import os
import json
f = open("/content/drive/MyDrive/kaggle.json", 'r')
json_data = json.load(f) 
os.environ['KAGGLE_USERNAME'] = json_data['username']
os.environ['KAGGLE_KEY'] = json_data['key']

Kaggleのデータをダウンロード

Spaceship Titanicのデータをダウンロードしていきます。Competitionのサイトから「Join Competition」をクリックして、データのダウンロードできるようにします。

Dataタブをクリックして、中央くらいにあるapiコマンドをコピーします。

!kaggle competitions download -c spaceship-titanic

実行すると、/contentにデータがzipでダウンロードされます。

zipファイルを解凍すればデータを利用することができます。

!unzip '/content/spaceship-titanic.zip'

train.csv、test.csv、sample_submission.csvが確認できました。

関連記事、参考記事

コメント