catch-img
  • データサイエンティストが語るVol.4

製造業の可視化はなぜ難しい?現場で使える解決策と実践ノウハウを公開

製造業におけるデータ活用の「一丁目一番地」。それは可視化だ。
データをグラフ化し、人間が理解できる形にする。言葉にすれば簡単だが、取得されたデータを単純に並べただけで止まってしまっては、せっかくの資産を有効活用したとは言えない。
製造業のデータは、データ量、データ項目ともに巨大なデータ空間になっており、そのデータ空間をどう切り取るかは、工場のノウハウそのものである。
優れた可視化とは、「なぜ今までこの見方をしなかったのか?」と思わせるほどの衝撃を与え、二度と元のやり方には戻れないような不可逆的な変化をもたらす。
本稿では、製造業の現場において、どのようなグラフが優れているのか、どのような価値を生みだすのか、を具体的に4つの視点で解説する。

▼前回のブログはこちら

間宮秀雄
間宮秀雄
半導体工場、電子デバイス工場のプロセスインテグレーションとして、現場に根ざした品質改善や生産性向上に幅広く携わってきたデータサイエンティスト。単なるデータ解析にとどまらず、製造現場のドメイン知識を活かした実践的な課題解決を得意としています。2018年よりフューチャーアーティザンに参画し、YDC SONARのプリセールスや、顧客に寄り添ったデータ活用支援を通じて、ものづくり現場の変革をサポートしています。 本ブログでは、現場経験に裏打ちされた実践的な知見や、データ活用の最新トレンドを発信していきます。

1. アクションに直結するリアルタイムなグラフ

優れた可視化の第一条件は、リアルタイム性だ。
製造現場において、現状把握からアクションまでの時間は短ければ短いほど良い。問題が起きたその瞬間に気づき、手を打つために可視化は存在する。同じフォーマットのグラフを描くことに人間が工数をかけるべきではない。データ取得から描画までは、完全に自動化された仕組みが必要だ。過去についての報告書を作るのではなく、今この瞬間の状況を把握できる環境こそが求められている。

2. 全体を俯瞰しボトルネックを見つける広範囲なグラフ

次に必要なのは、広範囲な視点を持つグラフだ。
工場内を流動する製品全体、あるいはラインや装置全体を俯瞰(ふかん)する視座のことだ。個々の製品や装置だけを見ることは、まさに「木を見て森を見ず」の状態である。全体を見渡して初めて、どこがボトルネックなのか、どこに改善の余地があるのかが見えてくる。
個別のデータに閉じることなく、サイロ化を防ぎ、データ間を連携させ、全体を俯瞰できる環境が必要だ。

3. 集計値ではなく生データを活用したグラフ

多くのKPIは集計値で管理されているが、現代の製造業は高度に安定しているため、平均化されたデータでは微細な差異が見えてこない。集計値はデータの分布を想定しているので、想定した変動には気づけても、想定外の変化は見逃してしまう。
本当に見るべきは、集計される前の生データだ。
生データを活用することで、数値化が難しい微細な差異、多くのデータを重ねないと現れてこないような微細な差異などが見えてくる。
生データを直接描画すると、データが重なりあってしまう課題が生じる。そこで必要となるのは情報を失わずにデータを俯瞰する方法だ。生データと俯瞰したデータを往復する中でこそ、新たな知見は生まれる。

4. データの文脈を表現する情報量の多いグラフ

最後に、最も重要なのがデータの文脈(コンテキスト)だ。
製造業のデータは、その瞬間のデータだけを切り抜いても判断ができない場合がある。
たとえば、最終検査において品質値(結果系データ)が低い製品が発生した場合、単体の要因系データとの相関を見るだけで十分だろうか?その製品が流れた前後の情報が必要なのではないか?
また、複数の品質値(結果系データ)がトレードオフの関係になっている場合、1つの品質値を見ただけで、その製品が良い製品と言えるだろうか?
その品質値が良いのは、もう一方の品質値を犠牲にしているだけなのではないか?
これらを可視化するためには、従来のX軸とY軸で表す2次元のグラフでは情報量が足りない。前後の関係やトレードオフを表す情報、つまり文脈(コンテキスト)を表す情報を同じグラフに示す必要がある。
2次元のデータを超える表現には、多変量解析が強力ではあるが、現場での解釈性においては、優れた可視化の方が勝る場合が多い。
自由度の高い前処理と可視化ツールを駆使し、データの背景にある文脈を表現することが、現場の改善を加速させる。

ケーススタディ

上記の4つのポイント(リアルタイム、全体俯瞰、生データ、文脈)は、言葉だけではイメージしにくい。幾つかのポイントが同時に含まれている場合も多い。具体的なケーススタディから咀嚼し、抽象化することが活用のヒントになるはずだ。

ケーススタディ(1):装置のチョコ停と累積時間の関係

下のグラフはX軸に時刻、Y軸が装置となっているガントチャートと呼ばれるグラフだ。
各装置の状態(製品処理、チョコ停、メンテナンス)に対して、開始時刻と終了時刻があれば描画することができる。
このグラフは特別に、メンテナンス終了からの累積時間を目安に次回のメンテナンスを行っていることを想定して、累積時間を青のグラデーションで示している。(濃い青は累積時間が長い)
チョコ停やメンテナンスの回数をKPIとしている工場は多い。それはそのまま稼働率というメジャーなKPIに繋がるからだ。しかし、チョコ停やメンテナンスがどのような状況で起きているのか、は集計された数値だけを見ていても分からない。
この例では、EQ01はメンテナンス周期が長い、EQ02はメンテナンス周期が短い、EQ03はランダムにチョコ停が発生している、EQ04はメンテナンス前(累積時間が長い時)にチョコ停が多発する、EQ05はメンテナンス直後(累積時間が短い時)にチョコ停が多発する特徴を示している。
このように長期間にわたり、複数装置の稼働状況を同時に俯瞰し、チョコ停やメンテナンスが累積時間という文脈のなかでどのような状況で起きているかを理解することが、装置の特徴、運用の特徴を理解し、改善に繋がる方法となる。

↓クリックで図版を拡大

ケーススタディ(2):製品の処理時間、待ち時間と品質の関係

下のグラフはX軸に時刻、Y軸に工程の流れ(各工程の開始と終了)を示し、製品ごとに線で結んでいるグラフだ。名前をつけるならトラベルグラフと言ったところだ。
全ての製品が投入時から先入れ先出しのルールを守り、処理時間、待ち時間が同じで、まったく滞りがなければ、左下から右上に直線的なグラフになる。そして全ての線は平行になる。
このグラフは最終検査のOK、NGが製品の処理時間、待ち時間と関係があるか?を確認するために、製品ごとOKは緑、NGは赤と分類している。
このグラフでは、NG品(赤)は工程5の待ち時間で共通して線の傾きが緩やかに見える。それはつまり、待ち時間が長かったことを示している。
この微細な差異を事前に定義した数値(プロセス時間、待ち時間)で比較するのは難しい。
工場は常に状況が変化しており、固定された管理幅では判断できない場合もある。
「同じ時間帯で、NG品だけがなぜか待ち時間が長かった」のような前後関係(文脈)の理解が改善のヒントとなるはずだ。
このように製品履歴データを活用した、長期間における全行程の俯瞰、さらに文脈の理解は、製造業の可視化の基本となる。


↓クリックで図版を拡大

ケーススタディ(3):装置による品質の違い(機差解析)

製品が複数の工程(例えば工程1から工程5)を流れ、それぞれの工程に複数の装置が使用される工場において、製品に不良が発生した場合、最初に行う要因分析は、どの工程のどの装置が問題であったか、を調べることだ。これを機差解析と呼ぶ。
機差解析の一番簡単な方法は下のグラフの上段のように、X軸に装置、Y軸を品質値としたBOXプロットを工程ごとに描く方法だ。ここでは下の上段に5つの工程について5個のBOXプロットを描いている。Y軸の品質値は一定でバラツキが少ないことが望ましい。
BOXプロットを使用する理由は、平均値や中央値だけでなく、四分位数(下から25%, 50%, 75%の数値)によって、データの分布の違いを表現できるからだ。
しかしながら、この四分位数による比較は、単純な平均値や中央値による比較よりも感度は良いものの、結局のところ集計値を使っていることから、検出感度に限界がある。
そこでさらに検出感度を上げる手法が下段のQQプロットだ。
QQプロットは、集計値を使わず生データにて、データ分布の差異を完全に表現することができる。この例では、工程3の装置3に異常が発生し、品質値の不良を引き起こしている。工程3以外では、全てのQQプロットが重なっているが、工程3の装置3だけQQプロットが重なっておらず、品質データの分布に変化(異常)があることが検出できている。
これは、広範囲なデータ(全ての工程 x 全ての装置)、生データ(QQプロット)の活用が有効であった例だ。

↓クリックで図版を拡大

ケーススタディ(4):広がりを持つ検査結果の重ね合わせ

下のグラフの左側(4つの緑色の四角)は、ロール・ツー・ロール、鉄鋼、半導体のように板状に広がりをもった製品における品質値の分布を示している。緑色のグラデーションによって、品質値の大きさを示している。
このような可視化方法はヒートマップと呼ばれているが、製造業では色々な活用方法がある。1つの活用方法は、この例のように広がりをもった製品における品質値の分布を可視化する方法だ。
X軸、Y軸はそれぞれ製品内の測定位置を示し、その場所の品質値を色の濃淡で表している。この可視化で期待していることは、品質値バラツキに傾向があるか?ということだ。バラツキがランダムであれば、改善することは難しい。しかし、何か傾向、つまり特徴的な色のムラ(分布傾向)、が見えれば、改善の糸口が見つかるはずだ。
現代の製造技術は安定しており、1つの製品でハッキリと特徴のある分布傾向を見つけるのは難しい。そこで複数の製品のデータを同じX軸、Y軸の値で重ねて描画することでハッキリとした分布傾向が見えてくる。(右側のヒートマップ)
この例は連続した品質値のバラツキの例であるが、広がりを持った板状の製品については、ゴミ、欠陥などの分布を表現することも多い。
個々の製品を見ると傾向は見えないが、重なることで傾向が見えてくる例は多い。生データを活用することで微細な変化に気が付く例だ。

↓クリックで図版を拡大

ケーススタディ(5):組立て装置と部品の組み合わせによる品質低下

ケーススタディ(4)では、X軸、Y軸が座標という連続的な数値であったのに対し、このケーススタディ(5)はX軸、Y軸をカテゴリー値にした例だ。
X軸は部品、Y軸は組立て装置として、そのマトリックス上の最終製品の品質値を緑、黄色、赤と変化するグラデーションで表現している。
組立て工場では、部品 x 組立て装置の膨大な組み合わせが存在する。さらに品質値の変動も微細である可能性もある。このような状況でヒートマップによる可視化は、力を発揮する。
左上のグラフの赤いラインが横に入っているのは、特定の組立て装置に異常があった場合を示している。ある特定の組立て装置に異常があった場合、どの部品を使ったとしても製品は不良となる。よって左上のグラフの赤いラインは装置起因で横に赤くなる。
同様に右上は特定の部品に異常があった場合、どの組立て装置を使ったとしても製品は不良となるので、グラフの赤いラインは部品起因として縦に赤くなる。
そして、特定の組立て装置、特定の部品の組み合わせが不良の原因であった場合、組立て装置と部品のマトリックスの交点が赤くなる。
このように、ヒートマップを活用することで、異常の原因が組立て装置なのか、部品なのか、それらの組み合わせなのかを微細なら差異であっても見つけることができる。
生データを重ねることで、膨大な組み合わせから微細な差異が検知できる例だ。

↓クリックで図版を拡大

ケーススタディ(6):バラツキの大きなトレンドチャートとデータ密度

下のトレンドチャート(左上)は、X軸に時刻、Y軸に品質値を示している。
データ数は4万行で現代の製造業で扱うデータとしては、決して膨大な量ではない。
ここまでのケーススタディでは、生データを直接描画したり、重ね合わせをしたりすることで、微細な差異を検知できるケースを紹介してきたが、このようなノイズが多いトレンドチャートでは、データが重なってしまい、有益の情報を得ることができない。品質値のトレンドチャートを描いた場合、平均値の変動、バラツキの変動、外れ値の有無、変化点の有無、そしてデータ分布の変動が検知したい。
しかし、データが重なってしまうことでせっかくの生データも無駄になってしまう。
1つの解決策は、右上のように散布図表示に変更して、さらに点の大きさを小さくすることで、データの重なりを避けることだ。しかし、この方法が有効なデータ数は限られている。数万レベルのデータには対応できても、数100万のデータでは無力だ。
最終手段はやはり生データを何らかの特徴量(集計値)に置き換えることだ。
下段のグラフは、散布図のグラフに対し、データの密度という特徴量を加えている。データ密度が低い方から緑、黄色、赤とグラデーションで表示している。
この例では、平均値を中心とした正規分布を持つことが正常であり、赤矢印で示した2山の分布を持つデータ分布の異常を簡単に見つけることができる。
このように生データと集計値を行き来することで、ノイズに隠れたデータ分布の変化を検知することができる。

↓クリックで図版を拡大

ケーススタディ(7):トレードオフからのブレークスルー

下の散布図(左側)はX軸、Y軸ともに品質値(結果系データ)を示している。
製造業における散布図の活用方法としては、X軸に要因系データ、Y軸に結果系データとして、相関関係の有無を調べる相関分析や、回帰分析が一般的であるが、このように結果系データどうしの関係性を見ることは、お互いがトレードオフの関係になっていないかを調べる場合が多い。
製造業では至るところにトレードオフが存在する。製品の品質を向上させるために、コストを犠牲にする、のような工場全体の話や、もっと詳細な個別のプロセスにおいても、処理スピードを向上させるために、バラツキの増加を容認する、のような話など、どちらかを優先するだけでは不十分で、バランスを取る必要があるケースだ。
それをグラフに表したのが下の左側の散布図だ。
品質値1,品質値2ともに値が小さいグラフの左下が理想的な状態ではあるが、そこには実績を示す青い点が存在しない。グラフの右下は、品質値2は良いが、品質値1は悪いというトレードオフ、グラフの左上は逆のトレードオフだ。
製品の品質とコストの関係、処理スピードとバラツキの関係もトレードオフであれば、このグラフの赤い破線の上のどこかに存在し、それを「バランスを取っている」と表現しているだけだ。つまりは、理想の状態には近づいてはいない。
バランスを取っている状態、トレードオフの状態から抜け出し、ブレークスルーをするためには、この赤い破線を左下に動かす条件を見つけることに他ならない。
それを見つける方法の1つは、散布図の点を第3のパラメータで色分けすることだ。右側のグラフはプロセス値(例えば装置内の温度など)でグラデーションしているが、このグラデーションの方向が理想の方向に向かうパラメータであれば、ブレークスルーのヒントになる。
これは散布図という通常は2次元のデータを扱う可視化に、第三の情報を加えることにより、ブレークスルーを見つけるという価値が発見できる例だ。

↓クリックで図版を拡大

ケーススタディ(8):途中検査の推移と最終検査の関係

下のトレンドチャート(左側)は特にパラレルプロットと呼ばれているグラフだ。
X軸に工程内の検査を順番に示し、Y軸にそれぞれの検査値を示している。それぞれの検査のバラツキが赤の矢印で示されている。細かい青のラインの1本は1つの製品を示している。つまりは、各製品が工程1検査、工程2検査、工程3検査と進んだ時に、検査の結果がどのように推移したかを示している。
ある製品は、工程1の検査では低い値を示しているが、工程2では高い値を示し、工程3では平均的な値となる、のような振舞いを1枚のグラフに表現することを目的としている。
左側のグラフに最終検査の品質値でグラデーションをしたものが右側のグラフになる。
品質値が小さい方から緑、黄色、赤でグラデーションしている。
一般的には、工程内の検査(工程1検査、工程2検査、工程3検査)と最終検査の品質値は、相関分析や多変量解析によって関係性が調べられる。しかしながら、前後の関係を知らずに結論を出すのは危険だ。このグラフでは、最終検査の品質値が高い製品(赤のライン)は、工程1検査では値が低く、工程2検査では値が高い製品になっており、品質値が低い製品(緑のライン)は、工程1検査では値が高く、工程2検査では値が低い製品だ。
多変量解析で適切な手法を選べばこの結論に至ることもできるかもしれないが、このような可視化でも十分で説得力がある。生データを使い、全体俯瞰を行い、文脈(コンテキスト)が重要な例だ。

↓クリックで図版を拡大

ケーススタディ(9):原料と装置の組み合わせによる品質の変化

下のグラフはサンキー・ダイアグラムの派生形で、沖積図と呼ばれるグラフだ。
グラフの左側から右側に向かって、どのような分割や統合を得て製品が流れていくかを「流れ」で示している。
下のグラフでは、原料が3グループあり、そこからスタートした製品が、工程1では、装置1、装置2、装置3のいずれかで分割されて処理され、工程2でも分割や統合が行われ、最終的に工程4でどの装置で処理されているか、を示している。各工程間を結ぶ流れの色は、赤、緑、青となっているが、これは品質を”High”, “Mid”, “Low”とグループ分けした結果である。
グラフから得られる知見は、①品質”High”(赤)は、原料2からスタートして、工程2の装置3で処理したものしかない、②品質”Low”(青)は、工程1の装置3で処理され、工程3の装置2で処理したものしかない。
このグラフからは、なぜこのような組み合わせが製品の品質に影響を与えたのかは分からない。しかし、製品やプロセスのドメイン知識があれば、仮説を立てるキッカケにはなるはずだ。前後の関係、つまり文脈(コンテキスト)や全体俯瞰が必須な例だ。

↓クリックで図版を拡大

データサイエンティストが語るVol.4のPDFはこちら>>

次回のブログ(公開準備中)
製造業のデータ活用の中で最も活用範囲が広く、難易度が高い装置データの活用について、多変量解析や、機械学習の応用も含め、包括的に解説する。


YDC SONARのご紹介
フューチャーアーティザン株式会社が提供するYDC SONARは、製造業のデータ活用基盤として多くの実績を持つソフトウェアです。今回のような複雑なステップが必要な解析をスムーズに行うことができます。詳細は以下のサイトから資料をダウンロードできます。

コラム「データサイエンティストが語るシリーズ」

おすすめ記事

お問い合わせ・資料請求はこちら

見積依頼や無料相談はこちら

かんたん1分

人気記事ランキング