【python】googleapiclientを使ってGoogle CustomSearchで画像収集

Facebook にシェア
Pocket
LINEで送る
このエントリーを Google ブックマーク に追加

前提

Google API

Google API Console関連の情報は各自で行ってほしい。

注意としては、Googleカスタム検索の設定で

google customsearchで画像が取得できない場合

を行うこと。

Python

Macにpyenvをインストール

以下の環境を構築

・Python 3.5.1
・pyvenvで、「~/.venv/cse」に仮想環境を構築

gitインストール

brew install git

画像収集

pipをアップデート

source ~/.venv/cse/bin/activate
pip install --upgrade pip

ソースをダウンロード

git clone https://github.com/umentu/collect_image

pipで必要なライブラリを修得

cd ~/collect_image
pip install -r ./requirements.txt

custom_search.pyを編集する

collect_images/custom_search.py の18行目〜20行目のGoogle APIキーとエンジンIDの情報を入力する。

# 取得したgoogle関連情報
GOOGLE_API_KEY = "**************"
GOOGLE_ENGINE_ID = "**************"

また、collect_images/custom_search.py の130行目に、取得したい画像の検索ワードを入力する。(”cat”の部分。)

if __name__ == '__main__':
    
    custom_search = CustomSearch(GOOGLE_API_KEY, GOOGLE_ENGINE_ID)
    custom_search.save_images("cat", max_count=1, resize=True)

実行する

実行すると画像が10個ダウンロードされる。

cd ~/collect_image
python ./custom_search.py

https://www.royalcanin.com/~/media/Royal-Canin/Product-Categories/cat-adult-landing-hero.ashx
https://upload.wikimedia.org/wikipedia/commons/1/1e/Large_Siamese_cat_tosses_a_mouse.jpg
https://i.ytimg.com/vi/tntOCGkgt98/maxresdefault.jpg
https://upload.wikimedia.org/wikipedia/commons/4/4d/Cat_March_2010-1.jpg
https://www.petfinder.com/wp-content/uploads/2012/11/140272627-grooming-needs-senior-cat-632x475.jpg
https://upload.wikimedia.org/wikipedia/commons/0/0b/Cat_poster_1.jpg
https://www.royalcanin.com/~/media/Royal-Canin/Product-Categories/cat-breed-landing-hero.ashx
https://www.friskies.com/Content/images/catconcoctions/home-cat.png
https://www.petfinder.com/wp-content/uploads/2013/09/cat-black-superstitious-fcs-cat-myths-162286659.jpg
http://cdn3-www.cattime.com/assets/uploads/2012/07/abyssinian-cat.jpg

~/collect_image/imagesの中に、検索したワードのフォルダが作成され、画像がダウンロードされている。

cat

備考

1回あたり10個の画像が取得できる仕様で、

    custom_search.save_images("cat", max_count=1, resize=False)

のところで max_countの数値を変えると10 * max_count 文の画像が取得できたり、
resizeのところを True にすると機械学習用に画像を圧縮できたりする。

Follow me!

【python】googleapiclientを使ってGoogle CustomSearchで画像収集” に対して1件のコメントがあります。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です