はじめよう実験計画

実験を早く終わらせるための技術

決定的スクリーニング計画とは

決定的スクリーニング計画(DSD)とは

決定的スクリーニング計画(Definitive Screening Design)とは2011年に提案された新しい実験計画の手法です。*1頭文字をとって「DSD」と呼ばれています。

実験計画では「要因配置計画」が最もメジャーですが、DSDは要因配置計画のような古典的な実験計画よりも多くの点で優れています。本記事ではDSDの特徴をまとめてみました。

効果の交絡が少ない

調べたい要因の効果に相関がある状態は「交絡」と言われますが、DSDではこの「交絡」が少ないという特徴があります。交絡関係のあると効果同士を独立に評価することは出来なくなってしまうので、この特徴はとても重要です。

3水準実験

また、DSDは3水準実験です。つまり一つの要因について低・中・高のようにパラメータを3段階変更します。3水準実験は最適化に使用できるというメリットがあります。というのも、一般的な2水準実験(低 or 高)だと1次の効果しか推定できないため、2つの水準値の間に最適点がある場合、その最適点を見落としてしまいます(図1)。DSDでは、3つの水準値を実験できるため、実験範囲内の最適点は検知可能ということですね。

f:id:Sturgeon:20200313115004p:plain

図1.2水準の間に存在する最適点

少ない実験回数で最適化が可能

古典的な実験計画では、はじめに「スクリーニング計画」と呼ばれる実験により、多くの要因から有意な数個の要因を抽出します。その後、追加の実験で「最適化」する、という2段階のアプローチが取られることが多いです。しかし、DSDでは一度の実験で最適化が完了する場合があります

しかも、DSDは3水準実験にもかかわらず、非常に少ない試行回数で効率的に効果の推定が可能です。これは次に説明するDSDの特殊な構造のおかげになります。

DSDの構造

実際のDSDの構造は表1のようになっています。表1は要因数が4のDSDの実験計画です。A,B,C,Dが要因を、-1, 0, 1が水準(低・中・高)を表しています。この表の一行が一つの試行を意味していて、例えば、一番上の行は要因Aを水準0、その他の要因をすべて水準1に設定して試行を行うということになります。

表1と照らし合わせて見てほしいのですが、DSDは

  1. 「ある一つの要因が0でその他の要因が±1という列のペア(フォールドオーバーペア)」が要因の数mだけある。
  2. 一番下に全要因の水準が0の行(センターラン)がある。

という構造になっています。

したがって、DSDの基本の試行回数は(フォールドオーバーペア)×(要因数)+(センターラン)=2m+1になります。

f:id:Sturgeon:20200503134047p:plain

表1.4要因の決定的スクリーニング計画

以上のようなDSDの構造は「カンファレンス行列」と呼ばれる特殊な行列を使って作成されるのですが*2、DSDの作成はソフトウェアで行えばよいので、数学の原理まで理解しなくて大丈夫です。

DSDの特徴

これまでDSDの特徴を簡単に紹介しましたが、以下に、より具体的な特徴を列挙します。

  1. 試行回数は最小2m+1(mは要因の数)。ただ、偽要因やセンターランによる追加の実験が推奨される。*3偽要因については後述。
  2. 主効果と交互作用は直交する。
  3. 交互作用同士は完全には交絡しない。
  4. 2次効果は主効果は直交する。
  5. 2次効果は交互作用と完全には交絡しない。
  6. 要因の数が12以下であれば、3個以下の効果を含むすべての2次モデルが推定できる。

以上の特徴2~6は、効果の相関のカラーマップを見ると意味が分かります。図2が相関のカラーマップで、主効果・相互作用・2次効果どうしの相関係数の絶対値|r|を示したものです(赤=1、青=0)。

f:id:Sturgeon:20200226130651p:plain

図2 主効果・相互作用・2次効果の相関係数(赤=1、青=0)

対角線上の赤は同一効果同士の相関なので完全に1です。上4行および左4列は青色で埋められていて、これは主効果と交互作用、および主効果と2次効果の相関が0、つまり、これらの効果を独立に推定できることを示しています(DSDの特徴2および4)。また、交互作用同士、および交互作用と2次効果のエリアは薄い青色なので、完全には交絡していないことも分かります。(特徴3と5)。

古典的な実験計画法では、重要な効果どうしが交絡することがあります。これは、仮に効果AとBCに交絡があるとすると、Aが重要なのかBCが重要なのか、分析の結果に曖昧さが残る、ということ。しかし、DSDでは特徴2~5により、ほとんどの場合、分析結果に曖昧さが残りません。このような特徴があるためDSDは"Definitive (決定的)"と名付けられています。

DSDの解析方法

冒頭の表1のようなDSDの計画に沿って実験を行った後、適切なモデル選択手法によりモデルを作成します。

AICやBICといった基準を用いてモデルを選ぶことになります。AICやBICは一般的に用いられるモデル選択手法です。

AICやBIC以外では、DSDのために提案された効果的モデル選択手法*4も使われます。この手法は、DSDの1次効果と2次効果(交互作用・2乗効果)を独立に評価する手法です。この手法は今のところJMPという有償のソフトウェアしか提供していない模様…

経験的には、有限補正AIC(AICc)で選んだモデルが、予測が最も合うという意味で良いモデルを与えてくれます。

一方、真の構造の推定が目的である場合には、BICでモデル選択するのが良いのだそうです。DSD用の効果的モデル選択は、一度JMPのトライアルバージョンを使用して試したことがありますが、BICと同じようなモデルが選択される傾向にありました。

こちらの記事で、DSDの解析手法を説明しました。

sturgeon.hatenablog.com

その他の情報

ブロック

DSDにおいて、2つのブロックを導入するときはフォールドオーバーペアのそれぞれに割り当てます。つまり、フォールドオーバーペアの一方にブロック1を、他方にブロック2を、という具合。2つ以上のブロックも導入することが出来ます。*5

カテゴリカル変数

DSDは基本的には連続変数(温度・質量など)のみを要因として想定しています。しかし、カテゴリカル変数(材料の種類など)を追加したデザインも作成することができます。

カテゴリカル変数に対応したDSDについてこちらの記事に書きました。

sturgeon.hatenablog.com

カテゴリカル変数を含むDSDは、連続変数だけのDSDを基本のデザインとし、カテゴリカル変数には水準値±1を割り振るのですが、その際、全体の計画がD最適になるように、アルゴリズムによって±1を当てはめることで作成されます。

sturgeon.hatenablog.com

ただ、DSDはカテゴリカル変数にはあまり向いておらず、カテゴリカル変数の数が増加すると、2次効果の検出力が低下するようです。*6

偽要因 (Fake Factor)

DSDの最小デザインの試行回数は2m+1ですが、2つの偽要因を追加することで、2(m+2)+1 = 2m+5回の試行回数になります。偽要因を追加することで、誤差をモデル選択に依存しない形で推定することが出来ます。一方、偽要因を使用しない場合には、有意な要因だけを含むモデルの残差から誤差の推定を行うため、その推定は選んだモデルに依存したものになります。

偽要因を用いた解析手法はこちら

参考書籍

残念ながら、現在のところ決定的スクリーニング計画についてまともにかかれた日本語の教科書はありません。下の洋書か、英論文を読むしかないです...

 

日本語で決定的スクリーニング計画に関して詳しく書いてある参考書がなかったので、kindle本を出版しました。ペーパーヘリコプターの落下時間の最大化という問題に対して、決定的スクリーニング計画を適用しました。また、決定的スクリーニング計画を簡単に、かつ、すぐに試せるよう、無料のWebアプリを使用して、ボタンクリックのみで実行できるようになっております。ぜひ手に取ってみてください!

実験を早く終わらせるための実験計画法入門
決定的スクリーニング計画による
ペーパーヘリコプター設計

 

Web上で試せる無料アプリDSDApp

こちら→

https://my-first-dsd.shinyapps.io/DSDApp_ver2/

 

DSDを使うには有償ソフトかプログラミングが必須ですが、こちらのサイトではクリックのみでDSDを試すことが出来ます。使い方は下の記事で紹介しています。

www.doe-get-started.com

最後に

決定的スクリーニング計画(DSD)は新しい実験計画法であり、多くの要因の中から重要な効果の抽出と、最適化を同時に行うことができます。スクリーニング計画でありながら最適化にも使えるというのは、要因配置計画などにはない素晴らしい特徴です。

実験計画法自体は古くからありますが、DSDが提案されたのは比較的最近で、実験計画の分野における革命的な手法と言っても良いかもしれません。

皆さんもDSDの使用を検討してみてはいかがでしょうか?

 

*1:Jones and Nachtsheim, Journal of Quality Technology, (43)1, 2011, https://www.tandfonline.com/doi/abs/10.1080/00224065.2011.11917841

*2:Xiao, Lin, and Bai, Journal of Quality Technology, 44(1), 2012, https://www.tandfonline.com/doi/abs/10.1080/00224065.2012.11917877

*3:Jones and Nachtsheim, Technometorics, 59(3), 2017, https://www.tandfonline.com/doi/full/10.1080/00401706.2016.1234979

*4:effective model selection

*5:Jones and Nachtsheim, Technometrics, 58(1), 2016, https://www.tandfonline.com/doi/abs/10.1080/00401706.2015.1013777

*6:Jones and Nachtsheim, Journal of Quality Technology, 45(3), 2013, https://www.tandfonline.com/doi/abs/10.1080/00224065.2013.11917921