pixiv類似画像検索エンジンの構想

pya!類似画像検索エンジンを移植しようと考えているのだが、そのまま移植すると速度が問題となると思われる。pya!類似画像検索エンジンでは検索部分にSQL文を使用して保守性を高めているのだが、それほど速くはない。5万画像の検索が数秒という感じだ。この枚数ならサービスとして提供できるのだが、pixivの画像枚数は400万弱。到底追いつかない。
そこでエンジンをC++で書き直し、ついでにSIMD命令を使って検索を高速化することを考えている。幸い今回のエンジンに使えそうなSIMD命令を見つけたので、後は書くだけの状態になっている。
今書いている論文が書き終わったら早速実装に取り掛かろうと思う。