ホーム研究概要ロボティクス>CNNを用いる画像の感性情報推定に関する研究

 

 

 

CNNを用いる画像の感性情報推定に関する研究

 

図像の感性情報抽出における困難な部分は図像から感性特徴量、あるいは人の感情を影響しやすい視覚特徴の抽出することである。今までの感性視覚特徴の抽出方法は具体的な応用分野により専門な知識を組み合わせ、感性特徴を人工的に定義し、それで取り出す。全般的に考慮すると、このような特徴量抽出方法は非モデル化で、効率性は低下である。 本研究では、深層学習により、畳み込みニューラルネットワークでコンピューターに図像が含める感性特徴を認識させ、感性情報特徴量を取り出す。その後、二度と同じ感情特徴のある画像が輸入すれば、画像が反映された感性インフォメーションが示すことができ、コンピューターに人間のように感情が分かることは目的である。 初めに、ウェブクローラ(Web Crawler)によって、ウェブで感性特徴の鮮明な画像を取得し、大量の原始画像データを集まりデータバンクを作る。そのあと、畳み込みニューラルネットワークによって原始画像の初処理を行う。 畳み込みニューラルネットワークは強いローブスト性をもっているから、畳み込み計算とプーリング計算によって、ズーム、平行移動、回転した画像の特徴量が偏差する問題を有効に解決し。初処理した図像の抽出特徴エリアをMASKエリアと表記、その表記したMASKエリアの内容によって感性特徴量を分類する。図像の特徴量を表す媒介変数が図形の「色」「形」「柄」などいくつが違うから、異なる分類の特徴量を違う表記方法で表す。 畳み込みニューラルネットワークの特性により、輸入は未処理な原始図形でも良いため、受容野から収集したデータがフェルタによって共有できる。そのため、画像の中の感性情報特徴量が効率的に取り出せ、ディープネットの学習性能が一層に上がる。しかしながら、現在の畳み込みニューラルネットワークはまだ収束速度が低下し、認識精密度が低く、普遍化が足りないなどの問題があるため、本研究は画像から感性情報を抽出における、GPUによりCUDAプログラミング特徴認識方法を提唱する。 コンピュータービジョンの発展により、図像が情報を載せる能力が驚くほど高くなる一方、図像に元々含む情報と複数の感性特徴量を持つことにより、シングルスレッドのCPUによるプログラミングの進行速度が緩慢になっていた。そのため、処理過程の速度を上げるように、GPUにおけるCUDA構造のプログラムを行うと、内部構造は下図のように構成する。構造の中にKernelブロックは感性特徴を抽出過程である、GPUを並行方式の運作を行い、中央処理装置をスレッド処理機としてデータインテンシブする。ブロック内部のスレッド処理機の間にデータの交換、シンクロナス、シェアすることができ、NVIDIAのC語言コンパイラによって実行する。