SONY

ディープラーニングにおける中間層の役割とは?基本的な仕組みや考え方を解説

ニューラルネットワークは、人間の脳をモデルとして作られた人工ニューロンをつなげたものです。ニューラルネットワークの構造には、入力層、中間層、出力層があります。この記事ではニューラルネットワークの構造のうち、中間層をピックアップして解説します。エンジニアとしてディープラーニングによるAI開発に取り組んでいる人は、ぜひ参考にしてください。

アイキャッチ画像

人工ニューロン、ニューラルネットワーク、ディープラーニングの関係性

ここでは、人工ニューロンやニューラルネットワークがどのようにディープラーニングに関連しているのかを解説します。

人工ニューロンとは

生き物の神経細胞の機能をモデル化し、コンピューター上で関数を設定したものです。神経細胞の形状に則り、樹状突起や軸索などに相当する部分が設けられています。この仕組みにより、コンピューターに情報を与えると自動的に学習が始まります。人工ニューロンの考え方が生まれたのは 1950年代といわれており、現在のディープラーニングの基礎となりました。

ニューラルネットワークとは

生き物の脳の神経のつながりを模して作られています。ニューラルネットワークは複数の人工ニューロンによって構成されており、樹状突起で信号を受け取った後、次へ情報を伝えるためにシナプスを作ります。伝達された情報は、入力層、中間層、出力層の順に処理されます。シナプスの結合が強化されると、伝達速度をさらに速めることが可能です。

ディープラーニングとは

コンピューターが自動的にデータを分析し、学習する技術です。多層のニューラルネットワークを組み合わせることで、精度の高いディープラーニングが生み出されています。限定的で、すでに構造化されたデータを扱う機械学習とは異なり、ディープラーニングは構造化されていない複雑なデータを扱えます。

AI(人工知能)とは

学習や推論といった知能に近い機能をもつコンピューターを意味します。Artificial Intelligenceを略して AIと呼びます。AIの定義は明確に定められているわけではなく、研究者によって見解はまちまちです。AIの種類は、一定の領域を対象とする「特化型 AI」と、幅広い領域について対応可能な「汎用型AI」の 2つに大別されます。

入力層、中間層、出力層とは

ここでは、入力層、中間層、出力層の特徴や役割について解説します。

入力層

人工ニューロンが最初に情報を受け取るのが入力層です。生き物のニューロンは電気信号によって情報を受け取るのに対し、人工ニューロンは数値で受け取ります。

​たとえば、手書きで「0」と書かれた画像を人工ニューロンに認識させる場合、入力層では画像の 1ピクセルを入力値として受け取ります。入力層で受け取った情報は、ニューロン同士の結合の強度に応じて、優先順位が決定される仕組みです。

中間層

入力層から情報を受け継ぎ、さまざまな計算を行うのが中間層です。中間層が多いほど複雑な分析ができ、中間層が3層以上あるニューラルネットワークをディープラーニングと呼びます。中間層の数に決まりはなく、扱う情報にあわせた任意での設定が可能です。なお、中間層は、隠れ層と呼ばれる場合もあります。

出力層

入力層と中間層で重みをかけ、活性化関数で処理された値が示されるのが出力層です。たとえば、手書きで書かれた「0」の画像について、何が書かれているのか判断した結果が出力されます。

なお、出力層で得られた結果を教師データと照合し、出力層から入力層に向けて誤差の修正や調整を行う方法を「誤差逆伝播法」とよびます。これにより、多くの中間層をもつ複雑なニューラルネットワークでも、より適切な学習を行うことが可能です。

ディープラーニングにおける中間層の考え方

ここでは、ディープラーニングにおける中間層の考え方を説明します。

中間層の役割

中間層は、入力層が取り込んだ複雑なデータを選別し、学習によって扱いやすい状態に変換します。その後、単純なデータしか扱えない出力層へ結果を渡します。ニューロンの数や中間層が増えるほど分析の柔軟性や結果の表現力は向上する反面、データやメモリ、演算の量は増加します。

中間層のニューロン数、ユニット数の考え方

ニューラルネットワークが学習を進めるには、そもそも人がニューロンやユニットの数を決める必要があります。これらの要素は、ハイパーパラメータと呼ばれます。たとえば、画像認識技術の場合、最初の中間層には多くのニューロンを設定し、少しずつ減らしていくのが基本です。

一方、画像を生成する場合は、最初はニューロンを少なく設定し、徐々に増やしていくほうがよいでしょう。また、ユニット数は多めにもたせておき、後から減らしていく学習方法が適切です。いずれにせよ、ニューラルネットワークによる学習には、多くのデータや時間がかかります。

パラメータWの更新方法

ディープラーニングにおいてパラメータを更新する場合、ミニバッチ勾配降下法を採用するのが一般的です。パラメータの更新ごとにすべてのデータを計算に含めるバッチ勾配降下法に対し、ミニバッチ勾配降下法では利用するデータ量は少なめです。

取り出したいくつかのデータをもとに勾配を計算するため、必要なメモリが少なく、外れ値の影響も受けにくいなどのメリットがあります。​

中間層の適切な層数は処理するデータの量や種類で決める

中間層の数に決まりはないため、実際に試行錯誤しながら最適化しなければなりません。その場合、さまざまなことを考慮する必要があります。中間層を増やせばニューラルネットワークのパフォーマンスは向上しますが、メモリや演算量も増えてしまいます。データの量や種類にあわせ、最も効率的な設計を組み立てるようにしてください。

ディープラーニングやAI開発における課題

ここでは、ディープラーニングや AI開発における課題について説明します。

Pythonや機械学習のスキルがあるエンジニアが必要

ディープラーニングや AIを開発するには、基本的なプログラミングスキルに加えて、数学や統計、Pythonや機械学習に関する知識をもつエンジニアが必要です。ディープラーニングや AI開発ができるエンジニアは国内外を問わずニーズがあるため、人材不足の傾向があります。そのような人材を確保するには、収入面でも好条件を示す必要があるでしょう。

開発コストの問題

ディープラーニングや AI開発にはコストがかかります。自社で解決したいと考える課題によっては、かかるコストが膨大になる可能性もあるでしょう。たとえば、1日に数千件の問い合わせを処理できるチャットボットを開発する場合、数百万円以上かかることもあります。そのため、まずは欲しい機能を予算内で構築できるか確認する必要があります。

まとめ

ディープラーニングでは、ニューラルネットワークの中間層によって複雑な分析が行われています。中間層を最適な状態に設定するには、さまざまなパターンを模索、試行錯誤することが大切です。

ソニーが開発した「Neural Network Console」は、コーディングをせずにディープラーニングによる高度な AIを開発でき、ボタン 1つで高速な学習を始められます。無料体験もできるので、ぜひ自社の AI開発に役立ててください。

Cloud版ではInternet Explorerには対応していません。
Google Chromeをお使いいただくか、
こちらよりWindows版をダウンロードください

処理中に問題が発生しました。しばらく経ってからもう一度実行してください。

サインインアカウントの選択

Neural Network Consoleで利用するアカウントを選択してください。
Google、Sonyどちらのアカウントでも同様の機能が利用できます。