
- データサイエンティストが語るVol.5
製造業の装置データの活用はなぜ難しい?現場で使える解決策と実戦ノウハウを公開
製造業のデータ活用において、装置データこそが価値の源泉であることは疑いようがない。しかし、その活用度合いは企業や工場によって決定的な差となって現れている。
活用が進む現場では、同一のデータであっても活用を絶えず進化させ、加速度的な成果を上げている。一方で、停滞する現場では、ただ漠然とデータを蓄積するのみだ。
そこにあるデータは「何かあった時」の保険、すなわち過去を釈明するための道具に過ぎない。なぜ、多くのプロジェクトが本格導入を前に立ち往生するのか。
その原因は以下に集約される。
原因①戦略の欠如:投資に見合う劇的なメリットを構想できていない。
原因②技術的挫折:PoC(概念実証)の段階で予期せぬ技術的課題に直面し、頓挫した。
原因③現場の運用:技術的には成立したが現場の実運用に耐えうる設計がされていない。
「やってみなければ分からない」課題は確かに存在する。だが、着手する前から排除できるリスクもまた、数多く存在する。
本稿では、装置データ活用がもたらす真のメリットから、頓挫を回避するための技術的なポイント、そして持続可能な運用のポイントまでを包括的に解説する。
▼前回のブログはこちら
装置データ活用の全体像
下の図は製造業における品質関係の装置データ活用の全体像だ。
この中で、検査データや装置データを加工してトレンド監視を行う4つの活用方法(SPC、品質予測、異常検知、予兆検知)を本稿の範囲とする。
↓クリックで図版を拡大
- SPC:検査データや装置データの集計値を活用して、異常や傾向を検知すること
- 異常検知:装置データを加工した特徴量を開発して、装置の異常を検知すること
- 予兆検知:装置データを加工した特徴量を開発して、装置のメンテナンス時期を予測すること
- 品質予測:検査データの予測モデルを開発して、要因分析や予測に役立てること
- 要因分析:検査データに異常が発生した場合に原因を追究すること
- 最適化、プロセス制御:検査データが最適になるように、処理条件を(手動、自動)変更すること
SPCとはどのような手法か?
SPCとは、検査データや装置データの集計値を活用して、異常や傾向を検知することであるが具体的なイメージを下の図に示す。ここではSPCの代表的な手法であるXbar-R管理図を例に説明する。
↓クリックで図版を拡大
対象とするデータは、検査装置から取得された検査データと、製造装置から取得された装置データとする。Xbar-R管理図の場合、正規分布を持つ連続値であることが前提となっている。取得されたデータは、サンプリングされたデータごとに平均とレンジ、さらに管理幅(UCL, LCL)が計算される。その計算をここでは集計と表現している。集計にて算出された平均、レンジをトレンド監視するまでがSPCとなる。
外れた場合に製品が廃棄となる「規格幅(USL, USL)」に対して、その内側に「管理幅(UCL, LCL)」を設定することで、厳しい管理をしていること、さらに平均値の7点連続上昇のような偶然では発生しにくい傾向が見られた場合に異常と定義するなどで、不良を早期に発見する、または不良を未然に防ぐという建付けになっている。
SPCのメリットは何か?
SPCのメリットは何と言っても簡単にスタートできることだ。
PCが無かった1920年代には手法が確立されていたので、測定値、紙、電卓があれば手動でもスタートできる。データが電子化されていれば、表計算ソフトで自動化も可能だ。
もう一つのメリットは、製造業のQC7つ道具や、自動車業界の品質基準であるIATF16949認証などで必須のコアツールとなっていたりと、製造業では確立された手法となっているために、社内の教育プログラムに組み込まれている場合が多く、活用できる人材が豊富である点だ。現代においてSPCの導入に抵抗する現場は無いはずだ。
SPCの前提から課題と解決策を考える
課題を説明するために、SPCの前提条件を明確にする必要がある。
前提条件1:正規分布が前提
前提条件2:単体データが前提
前提条件3:変動の原因は直前の工程
これらの前提条件は1920年代には当たり前であったが、現代の製造業では当たり前ではない。以下に前提条件から外れる場合と解決策について考えてみる。
SPCの課題①:正規分布が前提
SPCは、歴史的な背景(1920年代の製造業)から対象のデータは、直径、厚み、幅などの正規分布をもつ検査データだったはずだ。
そこから1980年代に装置データが取得可能となり、対象が装置データまで拡張された。しかし、1980年代の装置データ取得は、まだまだ黎明期であり、1日に1度の目視による日常点検データであったり、装置内部で計算された一定期間の平均値であったりと、正規分布として扱っても大きな問題とはならかなった。別の言い方では、そのような粒度の荒いデータでは、装置の異常は検知することはできなかった。
2000年代以降では、IoTデバイスの発展もあり、装置データの取得が容易になり、秒単位やミリ秒単位の時系列データの生データが取得できるようになると、下の図のような正規分布とならないデータの扱いが必要となってきた。
↓クリックで図版を拡大
左側のグラフは、近年では予兆検知に使用される装置の振動や音響データだ。
データはノイズのように見え、平均や標準偏差のような単純は計算では、正常と異常を判別することができない。
中心のグラフは、バッチプロセスにおける波形データを示している。
バッチプロセスでは、温度などのデータが上昇、安定、下降のようなサイクルとなっており、この波形の異常が製品の不良を引き起こす場合が多い。
右側のグラフは、装置内で同じ値を繰り返す矩形データを示している。
矩形データは最大値と最小値を繰り返すが、この乱れ(ノイズ)が機械的な動作異常を示している場合が多い。データだけを見ると、最小値と最大値の2つの値となっており、正規分布にはならない。
いずれのデータも正規分布にならず、平均や標準偏差のような単純な計算では、正常と異常を判別できない。さらに、緑色で示すような上限、下限のような単純な管理幅で異常を検知することはできない。
異常検知、予兆検知による解決
正規分布とならない時系列の生データに対する解決策は、データに対して加工を行い特徴量に変換することだ。
冒頭で、異常検知とは、装置データを加工した特徴量を開発して、装置の異常を検知すること、予兆検知とは、装置データを加工した特徴量を開発して、装置のメンテナンス時期を予測すること、としたが、両者はデータの流れだけを見ると類似しており、具体的には下の図のようになる。
↓クリックで図版を拡大
製造装置から取得された時系列の生データは、「特徴量開発」に繋がっている。
SPCでは、ここが「集計」として、平均、レンジ、管理幅(UCL, LCL)などの簡単な計算であったが、特徴量という言葉を使うことで、特別な計算をすることを示している。
それは結果的に平均値となる場合もあるが、異常検知であれば、装置の正常と異常を判別できる値であり、予兆検知であれば装置の汚れや摩耗などによる劣化を示す値になる。つまり、異常検知、予兆検知とは、この特徴量が開発できるかどうか?にかかっている。
上の例にある振動や音響データであれば、フーリエ変換を行った後の周波数特性、バッチプロセスの波形データであれば、温度などの上昇時の傾きや安定時の平均値、矩形データであれば、ノイズの頻度などを数値化したものになる。
これらは部品の種類や不良モードによって異なり、特徴量への変換も多変量解析や機械学習が必要となり、さらにドメイン知識による解釈も必要なことから難易度が高く、PoCにおける技術的課題となる場合が多い。
SPCの課題②:単体データが前提
検査データを扱うSPCであれば問題とならなかったが、装置データを扱うことになると、データ間に関係性がある場合について検知できる手法が必要となる場合がある。下の図がその具体的な例だ。
↓クリックで図版を拡大
左側の上下2つの単体のトレンドチャート(温度と圧力)は、緑色の管理幅内を推移しており、管理幅を超えるような異常な点はない。ここで温度と圧力には相関関係がある場合を考えてみる。実際に散布図を描くと右側の散布図となる。ここで、赤で示した点、つまり単体データの判断ではなく、2つのデータの相関関係から外れた点を異常と判断したい場合、どうしたら良いだろうか?
このように相関関係がある2つのデータの相関関係からの外れを異常と判断したい場合は頻繁にある。入力値が大きくなれば、出力値も大きくなるケースだ。このように複数のデータの関係性(相関関係)の異常は、単体データが前提のSPCでは検知できない。
MSPC (Multivariate SPC)による解決
上述の相関関係からの外れによる異常は、その外れ度合いを特徴量として算出することが解決策となる。この仕組みは、通常のSPCを単変量SPC(Univariate SPC)と呼ぶのに対して、多変量SPC(Multivariate SPC)と呼ぶ。特徴量は「T2統計量」と「Q統計量」と呼ばれる値となるが、本稿ではT2統計量について説明する。T2統計量の計算ステップを下の図に示す。
↓クリックで図版を拡大
左の散布図は、オリジナルデータでここではX軸を温度、Y軸を圧力としていた。両者は緑色の管理幅の内側に入っているために、異常な点を異常と判別できない。
ここで最初に行うのは主成分分析となる。
中央の散布図は主成分分析を行った後になるが、右上がりの楕円状で示されていた灰色のデータがX軸と平行になるように回転している。主成分分析を行うことで、X軸は主成分スコア1(PC1)、Y軸は主成分スコア2(PC2)に変換されている。
さらに右側の散布図では、横長だった楕円が円に近くなっている。
これは、横長のX軸(PC1)に対して、PC1のバラツキを示す標準偏差で割り算を行い、同様にY軸(PC2)に対しても、PC2のバラツキを示す標準偏差で割り算をして標準化したからである。数式としては、X軸=PC1/(PC1の標準偏差)、Y軸=PC2/(PC2の標準偏差)となっている。
ここまでくると、異常な点は、正常なデータ(灰色と青)から分離できることになり、データの中心から距離、つまりPC1/(PC1の標準偏差)の2乗とPC2/(PC2の標準偏差)の2乗の和を計算することで、正常と異常を判別できるようになる。この特徴量をT2統計量と定義している。これが単体データだけでなく、データに関係性がある場合に異常を検知する解決策の1つとなる。
SPCの課題③:変動の原因は直前の工程
歴史的な背景(1920年代の製造業)から、SPCの対象のデータは、直径、厚み、幅などの検査データ(結果系データ)だったはずだ。
そしてSPCで何らかの変動が検知された場合、その原因は、使用された材料の異常、直前の製造装置又は検査装置の異常、作業員や方法、手順のミス、つまりは直前の工程の4M情報に限定できた。
しかし、現代の製造業は製造方法が複雑になり、検査にコストがかかることから、複数の工程を経た後で検査を行う場合が多い。つまりは、検査データのSPCは、1920年代とは異なり、直前の工程だけでなく、複数の工程の影響を受けており、変動が検知された場合の原因の範囲が広くなっている。下の図が現代のSPCのイメージだ。
↓クリックで図版を拡大
検査データはSPCを行ってトレンド監視を行っている。
原料装置、製造装置1、製造装置2からもデータは取得されているが、積極的には活用されておらず、検査データに異常が発生した場合に要因分析として、都度、活用されるにすぎない。このデータ収集と解析には多くの工数がかかることが課題となっている。
品質予測による解決
品質予測は、検査データの予測モデルを開発して、要因分析や予測に役立てること、としたが、下の図のように、原料データや装置データを検査データに異常が発生した場合のみ活用するのではなく、もっと積極的に活用する。
具体的には、検査データを目的変数Y、原料データ、装置データなどを説明変数Xとした予測モデルを開発する。そして、検査データの予測値をトレンド監視する。
↓クリックで図版を拡大
この予測モデルの作成によって、検査データの「予測値」は、直前の工程だけでなく、関連した工程のデータを考慮できるようになる。
それぞれのメリットは何か?
異常検知、予兆検知、MSPC、品質予測がどのような手法であるか理解できたことから、それぞれに対してメリットを考えてみる。ここで投資に見合う劇的なメリットを構想できないと、プロジェクトをスタートすることも難しくなる。
異常検知、予兆検知のメリットは何か?
異常検知の一般的なメリットは、
1)データを見て判断することで、属人化を防ぐことが可能となり、技術伝承ができるようになる。特徴量の開発を行うことで、装置がどのような時に故障となるのか?をデータで学ぶことで、プロセスや装置に対する理解を深めることができる。
2)データを見て判断することで、装置の異常を判断する頻度が増え、早期発見に繋がる。導入前は1日に1度の日常点検などで、装置の状態を確認する頻度が少なかったが、導入後はリアルタイムでトレンド監視ができる。また、装置が居室から離れているような場合、装置確認の工数削減も期待できる。
3)装置異常の初期で見つけることができれば、原因追及が効率的になり、故障からの立ち上がりも早くなる。完全に故障してしまい、動かなくなってしまった装置はデータの取得もできなくなり、原因追及はできない。
しかし、上記のようなメリットは、金額に換算することが難しく、劇的なメリットとして説明するのは難しい場合がある。
下の図は、異常検知で金額に換算しやすい例である。製造装置1は重要な工程で、ここで装置に異常が発生したとすると、品質に大きな問題が発生する。
↓クリックで図版を拡大
そのために次の検査工程で製品の検査(途中検査)を行うが、この時点の検査では、全ての項目の品質異常を検知できない。全ての項目の品質異常が発見できるのは、最終検査だけ、つまり赤の矢印の工程については、不良と気が付かないまま流動してしまう。
例えば、製造装置1は成膜の工程とする。成膜された膜には、求められる特性が複数あり、途中検査では装置の正常度合いの確認を兼ねて、簡易的に膜厚だけをトレンド監視しているが、抵抗などの電気的な特性の測定はできないような場合だ。(電気的な特性は最終検査でしか測定できない)
このように異常検知については、重要装置を対象として、その直後の検査では見つからない異常を見つけることが、大きなメリットを産む。
予兆検知の一般的なメリットは、
1) 予兆検知の代表的なメリットは、TBM(Time Based Maintenance)からCBM(Condition Based Maintenance)に移行できることだ。一定期間かつ安全性を重視してメンテナンスを行うTBMは過剰なメンテナンスを行っている可能性が高く、データを判断材料にメンテナンス時期を予測し、メンテナンス周期も延ばすことで、稼働率を向上する。
2) 装置の汚れや摩耗などによる劣化を確認するために行ってきた作業を削減できる。本稿で説明した予兆検知は、装置から取得したデータを特徴量に加工して、それを見て判断する仕組みだが、そのような仕組みが無くても、製造現場では色々な方法を用いて装置の状態を確認してきた。
例えば、装置の内部が汚れている場合には、解放点検を行って目視で確認したり、付着している物質を化学分析したり、実際に製品を流して、それを測定することで判断してきた。
このような作業は長時間の装置停止を伴うことが多く、その工数を削減できることが大きなメリットとなる。
MSPC (Multivariate SPC)のメリットは何か?
MSPCは異常検知、予兆検知のどちらにも使われる手法であることから、ここではMSPCならではのメリットを説明する。
1) MSPCは、相関関係からの外れを検知できるだけでなく、主成分分析を活用することで、多くの種類のデータを2つの特徴量の変化で表現することができる。例えば、500種の装置データを個別にSPCするためには、500個のトレンド監視を行う必要があるが、MSPCでは、500種をT2統計量とQ統計量に集約してしまうので、その2つのトレンド監視をすることで、500種のデータを監視したことになる。これは大きな工数削減となる。
2) 異常が検知された時は、その内訳を算出することができる。T2統計量とQ統計量の2つだけを使って500種のデータを監視できるとしたが、異常が発生した場合には、どのデータが異常に寄与しているかを知ることができる。
下の図はMSPCの運用イメージだ。左側の装置オリジナルデータは、中心のT2統計量に変換されてトレンド監視が行われる。
↓クリックで図版を拡大
ここでT2統計量が増加していることが、装置の異常や予兆を示しているが、その時点で、要因分析を行ったのが右側の2段のグラフだ。
上段のトレンドチャートは、T2統計量、下段の積み上げ棒グラフは、T2統計量の寄与を示している。つまりは、T2統計量の増加は、グラフの緑色のデータと、赤色のデータの変動の合計であることを示している。
このようにMSPCは、多くのデータを一旦、T2統計量とQ統計量に集約し、これにより監視の工数を削減し、異常が発生した場合、元のデータに分解できる。この仕組みによって、装置に異常や劣化が発生した場合の要因分析を効率的に行うことができる。
品質予測のメリットは何か?
品質予測は、原料データ、装置データなどを使って、検査データの予測モデルを作ることだが、実現できれば大きなメリットがある。
1) 工場における検査は、コストの削減やスループットの向上のために、サンプリングで行われる場合が殆どだ。サンプリング頻度を高くすれば検査コストが上がり、頻度を低くすれば不良品が流出するというトレードオフと常に戦っている。これを品質予測にて回避できる。品質予測では、全ての製品に対して測定値の予測値が計算されるので、不良品の見逃しが起こらない。これにより不良率の低減や品質の向上が期待できる。
2) 予測モデルが完成し、予測値による検査値のトレンド監視ができるようになった姿を下の図に示す。左側は予測値計算の元となる検査データ、原料データ、装置データのトレンドチャートだ。
↓クリックで図版を拡大
そこから検査データの予測モデルを開発し、中央のトレンド監視を行う。ここで変化が起きたとする。実際の検査データであれば、ここから関連するデータを収集して要因分析がスタートするが、検査データの予測モデルが出来ていれば、その寄与が自動的に計算される。右側の上段のトレンドチャートが予測値となるが、下段の積み上げ棒グラフは、予測値の寄与、つまり内訳が示されている。赤、青、緑は例えば、装置の温度、圧力、流量のようなデータで、それぞれの変化と予測値の変化を対応させることが可能となる。この寄与が求まることで、検査データ変動の要因分析を非常に効率的に行うことができるようになる。
3) 品質を予測することが早い工程で可能となると、予測をすることのメリットが大きくなる。下の図が典型的な例だ。上段の「品質予測なし」は工程1から順番に製品を流し、最終的な検査で品質を確認する。
↓クリックで図版を拡大
途中で検査を行うことがあっても、最終的な品質は最後にならないと分からない。さらに言えば、最終検査で問題が発覚しても何もできない。もしかしたら初期の工程で異常が発生していても作り続けなければならない。このような製造方法は時に膨大な損失が発生する可能性がある。これに対して下段の「品質予測あり」では、品質は工程3までで確定しており、その直後に予測値が計算できることを想定している。
このような状況は、最終的な検査を行うために電極を形成したり、組立てを行う必要がある製品で頻繁に見られる。もし、工程3のような初期の工程で品質が予測できるのであれば、その時点で製品の流動を停止させ、対策を行ったり、変動に対してプロセス制御を行うなどの対策が行うことができる。このような製品の運用方法の変革が大きなメリットを産む。
装置データ活用の課題は何か?
本稿の冒頭で装置データ活用の失敗原因を「原因②技術的挫折:PoC(概念実証)の段階で予期せぬ技術的課題に直面し、頓挫した。」と「原因③現場の運用:技術的には成立したが現場の実運用に耐えうる設計がされていない。」としたが、具体的な内容をデータ、データ解析スキル、データ活用基盤、運用面の4つの視点で解説する。
装置データ活用の課題①:データ
装置データ活用の課題はデータ取得であることは間違いない。
製品が常に同じ条件で処理され、必要とするデータが、必要なデータ粒度で、統計的な判断ができる程十分に取得できていることが理想であるが、以下のような場合で課題が発生する。
装置が古いなどの理由で、取得したいデータが、必要なデータ粒度で取得できない。
溶けた金属の内部温度など、測定はしたいが、物理的に測定できない。
装置の構造上、センサーの設置ができず、データが取得できない。
作業員の五感(視覚、聴覚、嗅覚、味覚、触覚)を示すセンサーが無い。
プロセスや製品に知識が不足しており、取得すべきデータに気が付いていない。
少量多品種生産なので、同じ状態のデータが取得できない。
開発中の製品なので、安定したデータが取得されていない。
装置の状態を示す「アイドリング中」や「処理中」などの情報が無い。
異常時のデータや、汚れや摩耗などの劣化時のデータが取得できない。
常にプロセスが調整されており、同じ条件で処理されたデータがない。
メンテナンスの前後などでも変動するので、異常を定義するのが難しい。
原料や材料、投入量によっても変動するので、異常を定義するのが難しい。
外乱(気温、気圧、湿度など)によって変化するので、異常を定義するのが難しい。
これらは、プロジェクト開始前に十分に検討が必要だ。
装置データ活用の課題②:データ解析スキル
本稿の範囲で出てきたデータ解析スキルのキーワードは、特徴量開発、多変量解析、フーリエ変換、主成分分析、モデル作成(機械学習)であったが、それらを使いこなして、下のデータ解析フローように、ゴール設定から結果の解釈とフィードバックのサイクルを回すスキルが必要だ。特に、装置データ活用の場合、装置データの理解だけでなく、検査データの理解、製品と工程内の運用の理解も必要なので、難易度は高い。特にデータ不足への対応や前処理、機械学習などは、Pythonなどのプログラムの知識が必要な場合も多いので、外部データサイエンティストの協力が必要となる。
↓クリックで図版を拡大
装置データ活用の課題③:データ活用基盤
装置データを本格的に活用することになると、装置データの取得だけでなく、その他のデータも同時に活用できる「データ活用基盤」が必要となってくる。下の図は、データ活用基盤の必要とされる機能である。
データ間連携・アプリ間連携
システム間連携
ノウハウの共有
可視化・統計解析・機械学習
データ前処理
パフォーマンス
PoC(概念実証)の段階では全てを必要としないが、将来的に何が必要であるか?は早い段階で検討しておく必要がある。
装置データ活用の課題④:運用面
運用面は十分に検討する必要がある。装置データを活用することでメリットがあるケースというのは、運用を変えるケースであることだ。工場内の運用が変わらなければ劇的なメリットを産みだすことはできない。ポイントとなるのは、工場やベテランの知見、ノウハウを数値に置き換えることができるか?と数値に置き換えるということは、データ解析やソフトウェアの使い方をマスターする必要がある。特に、異常検知、予兆検知、品質予測の特徴量や予測モデルは、1度作成して終わりではなく、継続的にメンテナンスが必要だ。また、管理値を設定し、アラームを発報する本格導入においては、正常な時にアラームを発報してしまう誤検知、異常なのにアラームが発報しない見逃しのトレードオフを最適化することが必要となり、アラームが発報したら、どのようなアクションを取るのか?を決める必要がある。
この運用に対するスキルや工数を考慮せずに装置データの活用を語ることはできない。
✅データサイエンティストが語るVol.5のPDFはこちら>>
次回のブログ(公開準備中)
本稿にて、SPC、MSPC、予兆検知、異常検知、品質予測の概要、メリット、課題を包括的に説明した。
次回はそれらの実現に必要な、データ活用人材の育成について、深掘りする。
コラム「データサイエンティストが語るシリーズ」
























