このQ&Aは役に立ちましたか?
正規分布への変換について
2023/10/19 00:28
- 正規分布への変換方法について理解できていない
- データの分布が正規分布していないように見られる
- ネットで説明がありそうな文献やサイトを探している
正規分布への変換について
2012/05/22 16:47
お世話になります。
現在計測しているデータの工程能力を計算しているのですが、
データの分布が正規分布していないように見られます。(N=30個)
そこで、自然対数を取ると正規分布に近づくのですが、
なんの根拠もなしに自然対数を取っても良いものか
理解できていません。
ネットで検索しても正直よく理解できず、
噛み砕いた説明がある文献やサイトをご存じないでしょうか。
ちなみに、データはそれぞれ独立したワークから測定したものです。
自分なりに勉強し、正規分布の検証として
?測定データと期待値のグラフを作成
→直線状ではなさそうだが、どの程度のばらつきが許されるのか
わからず、判断がつかない。
?ネットからD'Agostino-Pearson正規分布検定なるものを実施
→K^2 4.0、 p 0.13 正規分布の可能性がある。
値の意味は理解できていないのですが、
正規分布の可能性としては低めということだけは推測できました。
以上、どうぞよろしくお願いいたします。
回答 (4件中 1~4件目)
逆の考えで、N数30個で正規分布に近いグラフを作成できますか?
小生は、N数100個でも少なく1000個位は最低必要と考えます。
そして、検証は“標準偏差と分散”にて、N数30個を分析すれば良いと推測ですが
考えております。
このQ&Aは役に立ちましたか?
この質問は投稿から一年以上経過しています。
解決しない場合、新しい質問の投稿をおすすめします。
失礼があったら御容赦くださいですが、
アドバイスしにくいですね。
先の回答者さんのとおりで、
工程能力の算出であれば、
実データが正規分布しているかどうかはほぼ関係ない
(正規分布を仮定しているだけ)
工程能力の算出であれば、
どんなバラツキも許されると考えて差し支えない。
「正規分布の検証」は工程能力の算出では必要ないと思うが、、、
何らかのデータ操作の後に正規分布となったにしても、
すでに、工程能力の算出とは違う話になっている。
なぜ、正規分布に近づけるようなデータ操作が必要か?
説明が必要と思う。
計算してみればいいというものではない。
普通は、データをいじらない。
分布が気に入らないときは、
QC手法で言う層別で、サンプリングを一定のルールで分割することを考える。
万が一、
貴殿の測定しているデータが正規分布になる必然性があるのなら、
測定方法を考え直したほうが良いと思う。
お礼
2012/05/23 09:27
ご回答ありがとうございます。
耳が痛いご指摘です。
確かに正規分布を仮定した計算の方が不利側の算出になるので、
より確実ですね。
>なぜ、正規分布に近づけるようなデータ操作が必要か?
私自身、この点について知りたいと思っています。
操作が必要かというより、どういう場合なら適用しても良いのか?
皆さんのご回答を拝見させて頂いて頭の中が整理できて来ました。
自分でも正規分布を前提とすべきという結論には達しているのですが、
正規分布しない事柄も世の中には存在すると思われますし、
変換する手法も存在するなら、どういう場合に使うのかという、
知識欲が強くなってきました。
工程能力を計算し把握することは工程改善が目的ではないでしょうか。
工程能力計算は手段と思いますよ。
ですから、現場で役立つことを優先しては如何か。
サンプリングは同一ロットで、通常安定した工程が前提ではないでしょうか。
試作工法等は対象外と考えたほうが良いです。
宜しく。
お礼
2012/05/23 09:14
ご回答ありがとうございます。
今回は工程改善のためのトライデータになります。
ただし、サンプリングはご指摘のように安定した状態でのもので、
試作工法ではございません。
ただ、トライですのでN増しにも限りがあります。
ヒストグラムに偏りが見えるため、正規分布が全てではないのでは
と思い立った次第です。
変換式にしても、理解が深まるまではそれで判断するつもりはございませんが、
手法として存在するのであれば、勉強したいと考えております。
そもそもきれいに正規分布しているとは限らない
あくまでも正規分布してるだろうとして管理するのがISOに基本理念
最終的には抜き取りで現場で管理しないといけません
お礼
2012/05/23 08:18
ご回答ありがとうございます。
私の無知による発想なのですが、今回の私のケースは別としても、
正規分布しない事柄というのも存在するのではないかと思いました。
(ちなみに今回は偏った分布になっています。)
仮に正規分布していないものを、正規分布の計算方法で工程能力を
算出しても妥当性にかけるのではないかと思っております。
ネットで調べたところ、変換式で正規分布化させる手法があると知りました。
もちろん、なんの理解もなく都合に合わせて変換式をもちいるつもりはありません。
以上を踏まえても正規分布を前提として算出すべきというご回答の主旨でしょうか?
お礼
2012/05/23 09:28
ご回答ありがとうございます。
こちらも耳が痛いご指摘ですが、トライのためなかなかN数を
増やせない状況です。
標準偏差と分散による検証の件、勉強してみます。