NEC、少量の収集データで活用可能な機械学習技術を開発

2018年7月10日

〜学習効率の高いデータを収集し、推定精度を向上〜

NECは、機械学習技術で必要とされる大量のデータが得られない状況でも活用可能な、複数の機械学習技術を開発しました。今回開発した技術は、学習用のデータ量が十分に得られていない段階からでも機械学習技術の活用を可能とします。

(1)人のノウハウを取り入れて、学習効率の高いデータを能動的に収集して学習する技術

(2)収集したデータをもとに、実世界の事象の複数のシミュレーション結果の類似度に基づいてパラメータの修正を自動で繰り返し、正しいパラメータを推定する技術

(3)AIの分析結果に基づく意思決定時に、収集データを学習用と効果評価用に分割した複数パターンで効果を見積もり、少数データの偏りに影響されにくい意思決定を可能にする技術

NECは「社会ソリューション事業」に注力しており、本技術をはじめとするAIやIoTなどのデジタル技術により、お客様との共創を通じた企業・社会のデジタルトランスフォーメーションに貢献していきます。

 

背景

近年、インターネット上に公開された豊富な画像等のデータに対して、ディープラーニングを代表とする機械学習技術が大きな効果を発揮し、様々な用途で活用されています。しかし、データ収集の初期段階や、データ収集コストが高い環境のように学習データが大量に得られない状況では、これまでの機械学習技術はその効果を十分に発揮できませんでした。

今回開発した技術により、機械学習技術が活用できる場面を拡大することが可能となります。

各技術の特長

1. 専門知識を持つ人のノウハウを取り入れて、学習効率の高いデータを能動的に収集
実世界で起こる状況を把握するためのフィールド調査を行うには、データ収集に大きなコストがかかるため、より少ない実験回数で学習することが求められます。本技術は、業務や領域での専門知識を持つ人の物事の因果関係に関するノウハウ(肥料の成分と植物の育成の関係、等)を数値化して活用します。

これにより、学習効率の高いデータを能動的に収集し学習を行えるので、より少ない収集データで学習することが可能となり、データ収集コストを下げることができます。

2. 複数シミュレーション結果の類似度に基づいてパラメータ修正を繰り返すことにより正確なシミュレーションパラメータを推定
複雑なシミュレーションを行うには多数のシミュレーションパラメータが必要で、実データに合わせて正しくパラメータを調整する必要があります。しかし、実データが少なく、初期パラメータの見当がつかないと、従来の技術では実データに合うようなパラメータを推定できず、正確なシミュレーションが行えませんでした。

本技術では、パラメータ値の異なる複数のシミュレーション結果の類似度に基づいたパラメータ値の修正を繰り返して、正しいパラメータ値を推定します。

3. AIの分析結果に基づく意思決定時に、少数データの偏りに影響されにくい意思決定が可能な学習
効率的な資産配分の決定など、データから学習した結果に基づいて人の意思決定を支援することが期待されます。しかし、学習データが少ないと、意思決定による効果を大きめに見積もってしまうという課題がありました。

本技術は、収集したデータを学習用と効果評価用に複数の分割パターンを準備し、それぞれの効果評価結果を平均して、より正確な効果を見積もります。これにより、少数データの偏りに影響されにくく、より正しい意思決定ができるようになります。

 

これらの成果の一部は、NEC-産総研人工知能連携研究室、国立情報学研究所、科学技術振興機構、統計数理研究所、Max Planck Institute for Intelligent Systemsとのオープンイノベーションによって得られた成果です。

なお、今回の成果について、機械学習技術に関する国際会議であるICML2018(International Conference on Machine Learning、期間: 2018年7月10日~15日、場所:スウェーデンのストックホルム)にて、発表します。
URL:https://icml.cc/

NECグループは、安全・安心・効率・公平という社会価値を創造する「社会ソリューション事業」をグローバルに推進しています。当社は、先進のICTや知見を融合し、人々がより明るく豊かに生きる、効率的で洗練された社会を実現していきます。

 

参考:「NEC、少量の収集データで活用可能な機械学習技術を開発」