ディープラーニングとは何なのか? そのイメージをつかんでみる人工知能(2/5 ページ)

» 2015年07月27日 11時36分 公開
[深澤祐援Credo]
Credo

自己符号化機を何層も重ねていく

 この問題を解決したのがディープラーニングのアルゴリズムの根幹を成す自己符号化機と多層学習です。

 自己符号化機では、出力層と入力層のどちらにも学習させたいデータの正解例を読み込ませます。この行為が目的としているのは学習させたいデータを表す特徴量として、よりたくさんの情報を持っている特徴量を作り出すことです。

 入力層と出力層のデータは同じですが、真ん中の隠れ層を2つと比べてデータの数を敢えて小さくします。例えば1000個の特徴量で表現されるデータに対して隠れ層を100個で構成するようにすれば、データを100個の特徴量で表現できるようにニューラルネットワークは重みを調整します。こうすることで特徴量を徐々に圧縮していくことができます。

 また自己符号化機ではこの特徴量圧縮を行う際に、少しだけデータにノイズを加えます。本来のデータとは少しだけ違う形にあえて変換してしまいますが、そうることでより一層圧縮された特徴量を、本来のデータを非常に正確に表すものにすることができるのです。

 そして圧縮された特徴量を持つ隠れ層は、次の層においてまた出力層及び入力層として用いられます。そしてまた間にある隠れ層において特徴量は圧縮され、さらに数は少なくなりますが学習させたいデータを正確に表現する特徴量が得られます。

 これを何回も何回も重ねて行うことで、最終的に特徴量としてベストなものだけが残ることになるのです。

Copyright © Credo All rights reserved.