工場への機械学習・AI 導入の9ステップ-インテルIoT ワークショップ報告(2)

Submitted by Shin Kai on


前回に引続き、インテルが3月に開催した製造業向けのIoT 導入に関するワークショップの発表概要をご紹介する。IoT に対するインテルの視点の概説(前回掲載)に続いて、同社製造・産業部門ディレクターでソリューションアーキテクトのテッド・コンネル(Ted Connel)氏が、インテルの工場で実装する機械学習・AI 導入をテーマとする事例発表を行った。コンネル氏によれば、インテルは1980年代にIoT への取り組みを開始せざるを得なかった。それは、インテルが賢明で将来が予測できていたからではなく、製造する製品そのものからの差し迫った要請だった。以下、その概要をご紹介する。

インテル創業者の一人ムーアが唱えたムーアの法則(Moore’s law)に従って、製造する同一面積の集積回路上のトランジスタ数は18カ月ごとに倍になる。すなわち半分の面積上に同数のトランジスタを作りこむことになる。今日のPC に搭載されるチップサイズでは、配線幅が原子100個分の幅にまで微細化されている。その微細加工の作り込みを実現するために、インテルは製造工程において1980年代から製造装置をつなぐ試みを開始した。続く1990年代には、いかにプロセスが作用しこれを数理的に制御することが可能かを理解するためにビッグデータ解析を開始した。

工場の完全無人化の要請

今日、インテルの半導体工場の生産フロアに、オペレータの姿はない。完全無人化を実現している。唯一製造現場に入ることが許されるのは、装置の保全担当者だけであるが、その保全作業もロボットの導入によって、これを皆無にする試みを開始している。無人化の要求は、チップ製品の最大の汚染源すなわち不具合の原因が、製造工程におけるヒトの存在によるところからきている。例えば、呼吸する息によって体外に排出された分子が体のどこかに付着し、その分子が微視加工配線の製品上に落下しただけで、製品の不具合を引き起こすことになる。従って、工場の完全自動化は、製品の要求からくる当然の帰結ということになる。

生産工程の無人化を実現するプロセス

半導体製造は、チップ製造のフロントエンドとこれをパッケージ化するバックエンドの2つの製造工程にわけれらる。フロントエンドの1つの工場だけで50億個のデータポイントを備える。すなわち、50億個のセンサがシステムにつながり、そのデータを分析している。1つの工場から生成されるデータ量は1日あたり1ペタバイトに達する。ちなみにIBM のパブリッククラウドのデータ量は1日あたり約0.5ペタバイト規模といわれる。

このデータ量を聞いた半導体事業以外の事業者は、そこまでしなくても構わない、と思われるかもしれないが、インテルの考えでは、どの業種の事業者も今後、インテル規模のデータ量に近づいていくだろう、と想定している。センサはアナログ回路であり、Hz 単位の信号を送ってくる。わずか数個のセンサでもすでにビッグデータの領域に入る。従って、設置するセンサ数の増加にともなってデータの処理量は急増する。

無人化工場のアーキテクチャ

インテルの工場では、生産工程のすべての製造装置のそれぞれにPC をつないでいる。そのPC には解析エンジンを搭載してデータ源に近いところで解析を実行し、さらに装置の遠隔からの制御機能も行える。工場のデータセンタ側には1拠点当たり600台のサーバを装備し、1つのデータセンタが機能を停止した場合に備えてデータセンタ2カ所による冗長構成の体制を整えている。

生産フロアでは、ニコン製ステッパやキヤノン製ステッパ、日立製プラズマエッチャーなどのそれぞれの装置ツールにデスクトップPC をつないでいる。インテルはこれらの装置ツール類と工場のアプリケーションをつなぐためのミドルウエアを開発した。また生産フロアの各PC と工場のデータセンタの両方を仮想化することにより、いわばプライベートクラウド環境を実現している。例えば、ある製造装置が稼働停止している場合も、それにつながるPC で工場の作業工程のアプリケーションを走らせて確認することが可能で、これによりPC の有効活用もできる。

エッジ部のコンピュータ処理量は小さいと思われがちだがそうはならない。エッジ部の処理能力を小型化して、全てをクラウドに上げる別の方法では大掛かりなネットワークを構築せざるを得ず、コスト高になる。また1工場あたり1日のデータ量がペタバイトクラスになるデータのほとんどは蓄積していない。インテルはデータ分析をエッジ部で実行し、そのPC が製造装置を監視し、装置の正常稼働状態が維持できていることを確保している。すべてが正常と判断されれば、データ蓄積は行わない。ただ統計的工程管理(SPC)の目的用途としてのみこれに要するデータを残している。

エッジ処理の3要因

インテルが演算処理能力をエッジに置く決定をした理由として3つの要因がある。第1に回答を得るまでスピードをどれだけ早く求めるか。すなわち遅延回避の問題。第2にセキュリティの要件。データがデータ源から離れれば離れるほどセキュリティの確保は難しくなる。第3にネットワークのコスト問題。デジタル世界には、データとコンピューティング処理能力がある。データを演算処理能力に近づけるか、演算処理能力をデータに近づけるか、のどちらを選択しても構わない。インテルは、データセンタと生産現場間に太いデータネットワークを構築するためのコスト増を回避した。

工場のアーキテクチャには、リアルタイムデータベースと従来型のデータベースの両方を活用している。ただしひとつ、このアーキテクチャから学ぶところがあるとすれば、データのプラットフォームとしてコンピューティング処理を仮想化することにより、分散処理を実現しているところにある。これにより、処理能力に関しては、サーバをデータセンタに追加するだけでスケール拡張は容易である。しかしエンジ部で1対1のデータとコンピュート処理との関係性が確立されているため、大規模なネットワークを必要としない。工場内は全体がクリーンな防塵環境にあるため、その環境内に通常のデスクトップPC を持ち込んでも心配がない。ただしクリーンルーム環境とは異なる現場環境では、産業用PC を選択せざるを得ないだろう。

ソフトウエアスタックの構成

ソフトウエアスタックの構成は、製造実行システム(MES)を中心に、その周辺に製造工程の装置とつないだPC を介して装置の遠隔制御を可能にするミドルウエアを開発した。そのミドルウエアが装置ツールからデータを取得して、pub/sub モデルによってそのデータを必要とするアプリケーションに送信する。その周囲層に位置づけられるのが遠隔オペレーションセンタで、ネットワークを介して必要に応じてオペレータが遠隔から制御できる。このセンタは工場に隣接している。ネットワーク制御は、分析機能を介して、現在1人のオペレータが80種の装置ツールを制御可能としている。開発のロードマップでは、今年末までに、1人のオペレータ当たりの制御可能な装置ツール数を120種まで拡大する計画である。ただし、オペレータは装置が正常に稼働していない場合にのみ介入する。通常の工場で、オペレータの作業範囲に含まれるレシピのダウンロードや在庫管理などはすべて自動化されていて、オペレータの手を煩わせない。

さらにそのスタックの外周部に高度な分析機能が位置する。インテル製造の最大重点課題である歩留まりの改善の取組みがここに集約される。歩留まりこそ第一の指標である。このすべてのシステムが歩留まりを支援するために構築されているといえる。ソフトウエアスタックの最も外周部にあたるのが、いわゆる外部世界とつながる部分で、モビリティ、警報アラート、データウエアハウス、事業報告のアプリケーション領域となる。インテルはこの構築に早期から独自に取り組んできたため、これらのソフトウエアのほとんどを自作した。今日ならば、優れた市販アプリケーションを取得し活用することが、もっと容易にできるだろう、という。

既存設備の接続問題

さて、一般的に、既存の工場内の設備でこれまで接続していない旧式の装置・機器類をどのようにつなぐかという問題は容易でない。中国のODM で有力なフォックスコン(鴻海、Foxconn)が先頃、インテルに対して自社工場内でのこの問題で協力を要請してきた。そこでインテルは、ホストPC あるいはPLC を接続したい機器・装置につなぎ、その機器・装置からのデータ取得や遠隔制御を可能にする方法を開発した。現在ではこのソリューションは、産業用電子機器のエイディーリンク(ADLink)を通じて商用ベースで市場に提供されている。ファーウェイ(華為、Huawei)も現在、これを実装しようとしている段階にある。

故障の特定-センサか装置か

インテルの場合は、サプライやから購入する装置にもともと埋め込まれているセンサを利用する場合がほとんどである。しかしそれ以外にも追加のセンサを加えて、機械学習のアルゴリズムの精度向上に役立てている。センサから入るデータが異常を示す場合、センサを組み込んだ装置の異常か、センサの異常かという問題になる。センサの故障の特定は、数学的にセンサのエンドポイントからのデータを全て見て、センサとの相関関係をもとに数字的に把握する。装置の異常と判断された場合には、直ちに装置を停止し、エンジニアが現場に入り装置の不具合を検査する。

データ収集ネットワークとオートメーションネットワークの切り分け

ミドルウエアがプッシュするエンタープライズサービスバスがあり、データ収集のネットワークはオートメーションネットワークには全く干渉しない構成となっている。ニコンやキヤノンや日立製の製造装置が製造ラインにあるが、それらのオートメーションは個別のネットワークを構成する。ニコンはニコンの装置、キヤノンはキヤノンの装置としか通信しないネットワーク構成になっていてそれぞれのネットワークスタックを構成する。

プロジェクトのインテル内での展開

インテル内では、ある工場でのプロジェクトの成功事例を他の工場に移植する仕方で展開が図られた。遠隔オペレーティングセンタのコンセプトがスタートしたのはアイルランドのFAB24 だった。リアルタイムでプロセスを制御するための機械学習も同じFAB24 ではじめて開発された。当初は日立プラズマエッチャーを対象に立ち上がったプロジェクトで、アイルランドの工場での開発成果を、世界の他の地域にあるインテルのFAB 内の日立のエッチャーに適用し展開した。インテルの世界各地にある工場は、相互に競争しているが、工場の構成概念は統一して設計されているため、その展開が容易になっている。

機械学習・AI 導入の9ステップ

インテルは、こういったインフラとソフトウエアスタック構成の上に、分析機能を走らせ工場を運用している。そこに至る工程を9ステップで紹介すると、まず最初に確立すべきは、エンタープライズネットワークと製造ネットワークを別物として扱い、しっかりと分離するという認識である。そこでインテルが実施した最初のことは、ネットワークアクセスサーバをエンタープライズネットワークと製造ネットワーク間に設けた。こうるすことで、例えばオフィスで働いているエンジニアが、その権限を得ていることを条件としてネットワークアクセスサーバを介して製造ネットワークにアクセスできるようにした。また、SAP のERP のようなエンタープライズアプリケーションに、製造ネットワークとのやり取りを可能にし、必要な部品の発注時期やその点数などサプライチェーン管理ができるようにした。これらのアクセスポイントは厳しくセキュリティ管理されており、例えばSAP の場合は特定のポート指定があり、そのポートにおいてどのようなデータが流れているかを常時監視していて、正当なデータ以外を流さない構成にしている。インテルのエンジニアも製造ネットワークにアクセスするためには、インテル社内のネットワークからアクセスするしか手段がない。

第3ステップでは、MES のシステムにおいて使用している装置や部品をトラッキングすることである。続いてのステップでは、装置ツールを制御しデータを取得するためにPC を装置の脇に設備した。このPC は装置とのインターフェースの役割を果たし、遠隔から装置の制御を可能にする。その制御用のHMI はインテル独自の開発品を使用している。製造装置の供給元である各社製インターフェースではなく、インテル独自のHMI を開発し、これを普遍的に工場内で使用することにより、現場のエンジニア力を強化できると考えている。これにより、どのオペレータでもどの端末を見てもこれにつながる装置で何が起こっているかを直ちに認識できる。PC を仮想化しているため、オペレータは装置に紐づくHMI の外にも、MES や他の工場オートメーションのアプリケーションシステムを走らせて見ることができる。

第5ステップでは、アプリケーションあるいはMES と、製造装置自体をミドルウエアによって切り分けることを実施した。当初はアプリケーションと製造装置を直接つないでいたが、アプリケーションを変更するたびに、装置側にも変更が必要になることが判明した。その逆も同様だ。装置をアプリケーションから隔離することは、インテルにとって初期の重要な学びとなった。続いて、つないだ装置からのデータを活用する第6ステップで、まず統計的工程管理(SPC)システムをデジタル化した。これにより、コンピュータがこれをリアルタイムで判読し、運転のプロセス進行がSPC に即しているかをモニタリングできるようにした。従って、SPC との関連で制御に問題を見出した段階でコンピュータがMES システムに装置ツールを停止するよう指示し、その在庫分は別のところに移動し再スケジューリングして工程処理する体制をとっている。

その次にスケジュールのステップ。装置ツールが実際どのように作動しているかを知ることによって、工場内での生産財のスケジューリングに対する大きなメリットを享受できる。インテルは工場の再スケジューリングには4ソケットのxeon サーバを活用している。第8ステップはマテハンの自動化。200mm から300mm ウエハに転換した時期にそのハンドリングは人手では重量的に無理が生じた。ウエハは24枚を真空密封したボックスで搬送するが、その重量は約30kg ある。さらに、生産プロセス工程の無人化の進行もあり、マテハンを完全自動化した。

第9ステップは、IoT を活用した工場計装の拡張である。ビッグデータの分析では、日立のプラズマエッチング装置からのプロセスデータにマシンビジョン計測のデータを追加することで、機械学習のアルゴリズムの精度を向上させた経験から、マシンビジョンデータを追加して収集するようにした。これらのエンドポイントも水平方向のプラットフォームしか活用しないことによって、セキュリティの監視体制を確保している。

コンネル氏は最後に、これらのステップを通じて重要なのは、標準の問題である、という。半導体業界ではこの標準化問題を25年前に解決している。インテルは半導体装置レベルのSEMI 通信プロトコル標準に準拠した装置を採用することで、プラグアンドプレイの接続性を確保している。業界が異なっても、どの標準であれ、1つの標準に即した戦略が求められる、という。