10年後になくなる可能性が高い職業とは(前編)コンビニ店員がなくなる確率は88%(2/4 ページ)

» 2015年07月20日 06時00分 公開
[深澤祐援Credo]
Credo

正解例を基に機械に学習させる“教師あり学習”

 この論文で用いられた手法は、ガウス過程分類――“教師あり学習”という機械学習手法の1つです。機械学習には“教師あり学習”と“教師なし学習”の2つあり、ここでは教師あり学習について説明します。

 教師あり学習とは、一言で言えば、正解例をあらかじめ用意し、それを基に機械に判断基準を作らせる手法です。下の図を見てください。

 教師あり学習では、あらかじめ人間が正解例として“教師データ”をプログラムに与えます。プログラムはこれを基にして判別の基準となるモデルを作成し当てはめることで、未知のデータについても分類ができるようになるのです。先のガウス過程分類は、この教師あり学習に分類されます。

 実際の論文では70個の教師データを作成し、そこから構成される判断基準が高性能であることを確認した上で700近くの職業全体にそのモデルを適用し、コンピュータに取って代わられる可能性が高い職業か、これからも人間がこなしていく職業なのかを判別していたようです。

 本稿で筆者が用いたのも教師あり学習に分類される“ランダムフォレスト”と呼ばれる手法です。教師データとして用いたのは先の論文で示されていたものの中から、なくなる可能性が高い職業と低い職業をそれぞれ50個ずつ抜き出し教師データとしました。

 一方、教師なし学習では正解例は与えられません。プログラムは与えられたデータの特徴を学習し、個々のデータについて見つかりやすいかそうでないかを判別する基準となるモデルを作成します。未知のデータにモデルを適用し、どちらの特徴に近いかを判断するのです。

 教師あり学習は、読み込ませる教師データが正しければ高い精度を誇りますが、そうでない場合、精度や分類方法がブレてしまう欠点がありました。

 しかし教師なし学習は分類の仕方もプログラムによって判断させるので、より許容範囲の広い分類を行わせることができます。それゆえ、より多くの仮説をしっかり用意しておくことが重要です。現実社会では主に“クラスタリング”という、グループ分けの手法として用いられます。

Copyright © Credo All rights reserved.