テキスト検出はEASTが有名かと思うので今回はEAST: An Efficient and Accurate Scene Text Detector を動かしてみようかと思います。
■環境手順
https://github.com/argman/EAST からコードを git clone
git clone https://github.com/argman/EAST.git
cd EAST
conda環境を作成
conda create -n east python=3.6
依存ライブラリのインストール
pip install -r requirements.txt
pip install opencv-python
pip install Shapely
conda install tensorflow=1.1
下記のエラーが出た場合は `sudo apt-get install libgeos-dev` を実行
Downloading Shapely-1.5.13.tar.gz (176kB)
100% |████████████████████████████████| 184kB 936kB/s
Complete output from command python setup.py egg_info:
Failed `CDLL(libgeos_c.so.1)`
Failed `CDLL(libgeos_c.so)`
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "/tmp/pip-build-lx_i2wdn/Shapely/setup.py", line 38, in <module>
from shapely._buildcfg import geos_version_string, geos_version, \
File "/tmp/pip-build-lx_i2wdn/Shapely/shapely/_buildcfg.py", line 167, in <module>
fallbacks=['libgeos_c.so.1', 'libgeos_c.so'])
File "/tmp/pip-build-lx_i2wdn/Shapely/shapely/_buildcfg.py", line 161, in load_dll
libname, fallbacks or []))
OSError: Could not find library geos_c or load any of its variants ['libgeos_c.so.1', 'libgeos_c.so']
学習済みモデルをダウンロード
https://drive.google.com/open?id=0B3APw5BZJ67ETHNPaU9xUkVoV0U
ダウンロード後解凍する
unzip east_icdar2015_resnet_v1_50_rbox.zip
推論を実行する
python eval.py --test_data_path={テキスト検出したい画像のあるディレクトリ} --checkpoint_path={モデルを解凍したディレクトリ} --output_dir={結果を出力したいディレクトリ}
例
python eval.py --test_data_path=images/ --checkpoint_path=east_icdar2015_resnet_v1_50_rbox --output_dir=outputs
結果が出力されました!