過去の桐井戸端BBS (桐ver.9)
25548 他の項目の近似値を求めたい heri 2004/03/22-11:56
こんにちは。

[A] [B] [C]
9  10  1
8  10  1
11 10  1

17 20  2
22 20  2
21 20  2

29 30  3
26 30  3
32 30  3

上記のような場合、[C]の項目ごとに、[A]の値が[B]に一番近いレコードを選びたいのですが、
どうすればいいでしょうか?
たとえば、[C]1の場合は9もしくは11、[C]2の場合は21、[C]3の場合は29です。
実際の数値は小数も含みもっと細かいですが。
ご存じの方、教えて下さい。

25549 Re:他の項目の近似値を求めたいのですが。 原山 正洋 2004/03/22-12:30
記事番号25548へのコメント
heri さん今日は

項目[D]を増設
項目計算式には #絶対値( [B]-[A] )
並べ替え [C]昇順,[D]昇順
絞り込み 単一化

これでどうでしょう。

25550 Re:他の項目の近似値を求めたいのですが。 heri 2004/03/22-13:26
記事番号25549へのコメント
なるほど。
差の絶対値が一番小さいものを絞り込むわけですね。
大変助かりました。
ありがとうございました!
25552 Re:他の項目の近似値を求めたいのですが。 悲しげ 2004/03/22-14:02
記事番号25549へのコメント
どもっ、原山さん

単一化してしまうと

>たとえば、[C]1の場合は9もしくは11、

のように「または」即ち複数のケースを拾えないのでは?

25554 Re:他の項目の近似値を求めたいのですが。 悲しげ 2004/03/22-14:21
記事番号25552へのコメント
私が考えた方法。

▼項目[差][順](いずれも数値系項目)を増設。
[差]は項目計算式で #abs([A]-[B])
なお、[B]と[C]は対応関係にあると思われ、且つ[C]は
   #グループ([B])
の置換で取得できると思うのですが、一応入力済みの[C]を使うことにします。
▼並べ替え条件「C差順」 1:[C],2:[差] を設定して並べ替える。
▼項目[順]について、置換(または置換条件を設定)する。
置換計算式は #順位([C],[差])

この結果、[順]の値が「1」となるものがお求めのレコードになろうかと思います。
「9もしくは11」の場合も含めて。

25556 Re:他の項目の近似値を求めたいのですが。 原山 正洋 2004/03/22-14:44
記事番号25554へのコメント
悲しげさんどうもです。
>この結果、[順]の値が「1」となるものがお求めのレコードになろう
>かと思います。「9もしくは11」の場合も含めて。

>実際の数値は小数も含みもっと細かいですが。
これに幻惑されていました。
おっしゃるとおり、全くの同値もありうるので
こちらのほうがいいですね。

25596 偏差平方和で評価するのが本来でしょうね 佐田 守弘 2004/03/24-22:29
記事番号25548へのコメント
heriさん
既に解決されていると思いますが、参考までに書いておきます。
書かれている例では、変数(?)が1つの場合ですが、実際問題としては複数あるのが普通です。
例では、[C]が1〜3で、[B]が10,20,30をそれぞれ別のレコードどして書いておられますが、
実際には次の様な形ではないのでしょうか。

[No] [A10] [A20] [A30] [A40] 
 1  9.6  21.0  29.7  40.5
 2  10.2  20.8  34.6  42.2
 3  9.9  20.1  29.6  39.8

項目名に[A10]、[A20]などを使っていますが、これはそれぞれ基準値が10、20であるべき時の実際値の意味です。
書かれている例に対応すれば[B]が基準値ですが、いちいち基準値を表に書く必要がないので、
この様な形にしてみました。

質問では、[A]が[B]に一番近いレコードは、[C]の値によって変わって構わない様に書かれているので、
私の論点は少し違っているかも知れません。
しかし一般に、この様なケースの多くは、上記に書いた様に、基準値10,20,30,40に対して、
実測値はそれぞれ振れている(変動している)けれど、どの番号のデータが、
最もその変動が少ないか?を求める事が多いものです。

こういった場合偏差の絶対値の総和、つまり、Σ|([An]-N)| (N=10,20,30,40)
で評価するのも1つの方法ではありますが、
一般には偏差平方和、つまり、Σ([An]-N)^2 で評価するのが普通です。

偏差を平方する意味は、次の様に解釈できます。
1)平方する事によって偏差平方値は全て性の値になる。
2)平方する事によって、基準値からの解離が大きく評価される。

一例として上記の値を整数の場合について挙げてみます。
[No] [A10] [A20] [A30] [A40] 偏差の和 偏差平方和 
 1  11   21   29   39   4     4
 2  10   20   33   40   3     9
1は、いずれも基準値に対して1ずつずれていますから、偏差の絶対値和は4です。
これに対して2では、30に対する値が3と大きくずれていますが、他はずれていません。
しかし、細かくずれるのは誤差が少ないけど、大きくずれるのは誤差が大きいと判断するには、
偏差の絶対値の和で評価するよりも、偏差平方和で評価する方が敵しています。

●近似式と最小二乗法
桐のグラフにも近似式の機能があります。自動で表示されるのでどの様な仕組みになっているかを考えずに
使う事が多いと思います。
この様な近似式は、一般的には最小二乗法で決めるのが普通です。
つまり近似式で近似した値と、実際の値との偏差の平方和が最小になる様に、
近似式を決めるわけです。

佐田守弘(KS-00119)

戻る