決定的スクリーニング計画の拡張｜コーヒーの淹れ方（続編）

はじめに
決定的スクリーニング計画のD最適性による拡張
具体的な拡張の方法
計画の評価
プログラム

はじめに

決定的スクリーニング計画の拡張を、「コーヒーの淹れ方」実験に対して行いました。

「コーヒーの淹れ方」実験についてはこちらをご覧ください。

sturgeon.hatenablog.com

この実験では「湯温」「豆の粗さ」「水位」「蒸らし時間」という4つの要因が「香り」「酸味」といった味にどのように影響を与えるか、そして自分好みのコーヒーを淹れるにはそれらの要因の値をどのように調整すればよいか、ということを調べました。

実験の結果としては、「湯温が低いほど香りが豊か」「蒸らし時間が短いほど苦みが少ない」といった知見が得られました。今回は、決定的スクリーニング計画はうまくいったのですが、懸念事項として、一回の決定的スクリーニング計画では特に2乗の要因効果に曖昧さが残ることや、誤差が大きすぎるといったことが考えられます。

その場合、試行回数を増やす（実験を拡張する）必要があります。そこで今回、はじめに実施した決定的スクリーニング計画をどのように拡張すればよいか書きました。

決定的スクリーニング計画のD最適性による拡張

決定的スクリーニング計画に限った話ではありませんが、計画を拡張する際、偏った実験点を選ぶ危険があるため、でたらめに実験点を増やすのは良くありません。

そこで、D最適性やI最適性のような、なんらかの最適性を基準として拡張を行います。

sturgeon.hatenablog.com

D最適性は1次のモデル式をもっとも効率的に推定する実験計画表（デザインマトリックス）の性質のことです。

具体的な拡張方法は後で説明することにして、まず図1で拡張前と拡張後の実験を見てみましょう。図1の左の表で示されているのが以前の実験で使用した計画表で、図1の右の表には左の表に新たに9回の試行が加えられています。

f:id:Sturgeon:20200412112458p:plain — 図1. 拡張前と拡張後の決定的スクリーニング計画

決定的スクリーニング計画は左上から右上にかけて要因の水準が0となるセルが並ぶので、拡張のときもこのゼロをまず指定しました（図1の緑のセル）。

追加の試行のゼロ以外のセルには-1または1が入ります。何らかのアルゴリズムにより-1と1を入れ替えながら、全体のデザインマトリックスXのD=|(X'X^-1)|を計算し、Dが最小になるときの-1と1のパターンを拡張後の計画とするのです。

ここで、プログラムによる-1/1の当てはめは、「座標変換アルゴリズム」というアルゴリズムで行うことが推奨されています*1。しかし、このアルゴリズムを自作するのが難しかったので、簡易的ではありますが、以下のような方針でD最適性による拡張を行うことにしました。

具体的な拡張の方法

決定的スクリーニング計画のゼロのセルは固定する。
追加する8回（2×要因数）の試行のうち半分の4回（要因数）の試行の列に-1と1をランダムに設定する。
もう半分の列はフォールドオーバーペアなので、ステップ2で設定した-1と1の逆符号の値を設定する。
全体のデザインマトリックスのD=|(X'X^-1)|を計算する。

2~4のサイクルをできるだけ多く繰返し、Dが最小になるときの-1と1の組合せを拡張計画として使用する、という方針です。このような方針は、アルゴリズムとは呼べない代物で、デザインマトリックスは必ずしもD「最適」ではないです。しかし、何万回とサイクルを回せば、D最適計画に近い計画は得られるだろうという発想です。

計画の評価

拡張した計画は相関のカラーマップを用いて、調べたい要因効果間に交絡が無いかどうか確かめます。図2が事前の計画の相関のカラーマップ、図3が拡張した計画（図1の右に示した計画）の相関のカラーマップです。

f:id:Sturgeon:20200412121254p:plain — 図2．拡張前の計画の相関のカラーマップ

f:id:Sturgeon:20200412121329p:plain — 図3．拡張後の計画の相関のカラーマップ

図2についての説明はこちらに説明した通りです↓

sturgeon.hatenablog.com

青が相関0、赤が相関1なので、青の領域が多いほど効果の推定が確実になります。図2と図3の比較により、図3（拡張後）は特に2次効果（相互作用と2乗効果）の青の領域が全体としては増えていることが分かります。

しかし、図2と比べて図3の一部の領域（AB*CC, AB*DD, AC*BB, BD*AA）では相関が増加してしまっています。これは、もしかしたら”ちゃんとした”アルゴリズムを使用すれば解決できるかもしれません。ただ、「AB*CC, AB*DD, AC*BB, BD*AA」の交絡が無視できるのであれば、一部の相関の増加を特に問題視する必要はないでしょう。

カラーマップを描いてみて、重要だと思われる効果同士に交絡が存在する場合には、何度かプログラムを実行して別の拡張を検討すれば良いと思います。

プログラム

参考のために、今回作成したコードを示します。このプログラムは、理論的に「D最適性」を保証するものではありません。したがって、「座標変換アルゴリズム」のコードがあればそれを使用するのに越したことはありません。

ただ、実験計画法は”実務的な”手法ですから、理論は抜きにして問題のない（交絡関係・予測分散などをチェックして）計画を発見できればそれでいいと思います。

f:id:Sturgeon:20200412121733p:plain — 図4．決定的スクリーニング計画の拡張に使用したコード。D”最適”らしい計画を選ぶのに-1と1のランダム設定を10000回行っています。

*1:R. K. Meyer and C. J. Nachtheim, Technometrics, Vol. 37, No. 1 (Feb., 1995), pp. 60-69, "The Coordinate-Exchange Algorithm for Constructing Exact Optimal Experimental Designs"