従来法の問題点

１．はやいパソコンとは

みなさん「体感とベンチマークは必ずしも一致しない」とか言う話を聞いたことがありませんか?
これにはいろいろ言い訳が考え出されています。
理由ではありません｡
子供が自分の立場を取繕うためにするのと同じ言い訳です。

曰く　ベンチマークは実際のアプリでは無いので条件が違うからだ。
曰く　実際のパソコンの使い方は人それぞれ違うからだ
曰く　体感の加減は人それぞれ違うからだ。

それでも多少は参考ぐらいにはなるかと思うのですが､実際にはほとんどというか､あまりに一致しないと思いませんか?

実はもっと根の深～～～い根本的な問題があったのです。

ベンチマークの数値さえ､上がれば良いという人は以下を読む必要は有りません。

すこしでも体感速度に近いベンチマークデータを欲しい人は読んでみてください。

まずは今までの評価方法がどうおかしいのか検証して見ましょう。

Ａ社、Ｂ社、Ｃ社製の3つのパソコンがあります。

Ａ社製は表示が速いがＨＤの転送が遅いパソコンです。

Ｃ社製は表示は遅いがＨＤの転送が速いパソコンです。

Ｂ社製はその中間的なパソコンです。

ベンチマーク１（四角の描画の速度）とベンチマーク２（ＨＤのread）の2つのベンチマークのスコアがそれぞれ以下とします。

ベンチマーク２は3種類のデータが並んでいますが､単位が違うだけで同じ速度を表しています。

	Ａ	Ｂ	Ｃ	単位
ベンチマーク１（四角）	10000	1000	100	個/秒
ベンチマーク２（ＨＤＤ）	100	1000	10000	ＫＢ/秒
	0.1	1	10	ＭＢ/秒
	100000	1000000	10000000	Ｂ/秒

このパソコンを10000個の矩形を表示し、10000KBのデータを読み込む業務に使う場合ではどのパソコンがもっともはやいでしょうか。

従来の数値の合計が大きい物がよいという評価方法では

Ａ：10000+100＝10100　ポイント
Ｂ：1000+1000＝2000　ポイント
Ｃ：100+10000＝10100　ポイント

結果はＡ＝Ｃ＞＞Ｂとなりこの場合はＡとＣは同等の能力で、Ｂだけは他の1/5の能力しかないことになります。

(･_･)：誰がどない見てもＢがボロクソに遅いがな！

いまたまたまベンチマーク２の評価をKB/秒で行っていますが､もしMB/秒で計測していたらどうなるでしょうか

Ａ：10000+0.1＝10000.1　ポイント
Ｂ：1000+1＝1001　ポイント
Ｃ：100+10＝110　ポイント
結果はＡ＞＞Ｂ＞＞Ｃとなり
ＢはＣより10倍も早く、
ＡはＢよりもさらに10倍もはやい。ということになります。

(･_･)：Ａがダントツで､Ｃはカスやんけ！

またもし、ベンチマーク２の評価をB/秒で計測していたらどうなるでしょうか

Ａ：10000+100000＝110000　ポイント
Ｂ：1000+1000000＝1001000　ポイント
Ｃ：100+10000000＝10000100　ポイント
結果はＣ＞＞Ｂ＞＞Ａとなり
今度はさっきと全く逆で、
ＢはＡより10倍も早く、
ＣはＢよりもさらに10倍もはやい。
ということになります。

(･_･)：なんでやねん！

もともと同じデータなのに集計する時に単位を変えるだけで評価が激変するような評価方法が正しいはずは有りませんね。
とりあえず、単位の違う数値の合計を求めるというのは間違いであるということくらいは分かります｡

合計をデータ数で割った平均値というのもよく使われますが､値が小さくなるだけで傾向としては同じで、不適当です。

単位を合わせれば良いんだということに気がつけば、これもよく用いられている方法ですが、1機種（または旧機種)のデータを基準(100％）とした場合で評価するという方法があります。
この場合は測定データの単位がなんであろうと、基準と比較した後の計算結果は「％」になるため、単位が同じになります。
では計算して見ましょう。

単位は（％）

	Ａを基準にした場合		Ｂを基準にした場合		Ｃを基準にした場合
	四角	ＨＤＤ	四角	ＨＤＤ	四角	ＨＤＤ
Ａ	100	100	1000	10	10000	1
Ｂ	1000	10	100	100	1000	10
Ｃ	10000	1	10	1000	100	100

Ａを基準にした場合
Ａ：100+100＝200　ポイント
Ｂ：1000+10＝1010　ポイント
Ｃ：10000+1＝10001　ポイント
結果はＣ＞＞Ｂ＞＞Ａとなり、
ＢはＡより５倍はやく、
ＣはＢよりさらに10倍速いことになります。

続いてＢを基準にした場合
Ａ：10+1000＝1010　ポイント
Ｂ：100+100＝200　ポイント
Ｃ：1000+10＝1010　ポイント
結果はＡ＝Ｃ＞＞Ｂとなり、
ＡとＣは同じでＢより5倍はやい
ことになります。

ついでにＣを基準にした場合
Ａ：10000+1＝10001　ポイント
Ｂ：1000+10＝1010　ポイント
Ｃ：100+100＝200　ポイント
結果はＡ＞＞Ｂ＞＞Ｃとなり、
ＢはＣよりも10倍はやく、
ＡはＢよりもさらに10倍はやい
ことになります。
Ａを基準にした場合とまるっきり逆ですね。

基準を変えただけで､こんなに評価が変わるというのが、正しい評価方法であるはずは有りませんね。
この1つの機種を基準にという考え方は一見正しそうですが､能力の足し算をしたこと自体がが間違いであるということです。
またこの計算方法は基準になる機種がもっとも不利になるという問題が有ることが分かります。

では、処理に必要な時間で評価すると

	四角	ＨＤＤ	合計(秒）
Ａ	10000/10000＝1	10000/100＝100	101
Ｂ	10000/1000＝10	10000/1000＝10	20
Ｃ	10000/100＝100	10000/100＝100	101

Ａは1+100＝101秒
Ｂは10+10＝20秒
Ｃは100+1＝101秒
結果は短時間で終わるほどはやいのですから、
Ｂの能力＞＞Ａ＝Ｃとなり、 実はＢが他の5倍も速い事が分かります。

２．体感速度というのは一体どういうものでしょうか？

ＨＤの転送速度などという物は目に見えません。
せいぜい、ＨＤのアクセスランプの点滅を見つめるくらいなものです。
また、いくら表示されているからといっても､毎秒1000個も矩形を表示していくのを目で追って数えることは不可能です。
実際にはスタートしてから､一定の処理が終わるまでの時間の長さを感じているわけです。
つまり処理時間の短いパソコンがはやいと体感できるパソコンなのです。
あまりに概念的話ですので､もう少し具体的な例題をみてみましょう。

Ａ君は毎日時速4kmで徒歩10分の後、時速100kmの電車に1時間乗って、会社（or学校）に通っています。

片道1時間強はちょっときついので、Ｂさんに相談しました。
Ａ君：「もっとはやく通う方法は無いでしょうか?」

ベンチマーク好きのＢさん
電車の100kmは十分速いけど徒歩の4kmが遅すぎるね。駅まで平均時速40kmでバイクをとばせば、
徒歩の時の平均
（100+4)/2=52km/h
に比べてバイクの時は
平均（100+40)/2=70km/h
になるから
70/52＝1.35となって、35％速くなるよ。」

それを聞いていた
ベンチマーク狂のCさん

馬鹿だなあ、
電車の速度は変化なしなので100％、
徒歩をバイクにすると40/4＝10＝1000％
も速くなっているんだから､
平均すれば(100+1000)/2=550％
と5.5倍も高速化されるじゃん。

Ａ君、「そんなに速くなるんだったら､バイク買うっきゃないっすねぇ。」

数日後のＡ君「Ｂさん、Ｃさん、バイク買ったけど5倍どころか3割さえも早くなった気がしないんですけど～～。」
Ｂさん、Ｃさん「体感とベンチマークは必ずしも一致しないもんさ」

ではＡ君の体感、Ｂさんの計算、Ｃさんの計算のうち正しいのはどれでしょう。(笑）

（回答
もちろんＡ君ですよね。

（解説
本当にはやくなった量は
徒歩の時は60分＋10分＝70分
バイクの時は
60分＋10分*4/40＝60分＋1分＝61分
差は9分で、
割合では70/61＝1.15となり、
それでも15％速くなっています。

がＢさんのベンチマーク方法の予想値の35％に比べれば半分以下ですね。
特にＣさんのベンチマーク方法の様に元の何％アップとかいう数値の合計や平均を求める評価方法がいかにでたらめであるかが良く分かりますね。

こういう速度と時間の問題は小学校で習った覚えがあると思いますが、この時一番良く間違うパターンが速度を足して平均してしまうという間違いです。

その小学生でやってはいけないと習った間違いを業界ぐるみでやっているのです。(笑)
(^_^)：コンピュータ業界っちゅうのは技術の最先端の産業やなかったんかいな！
(･_･)：せやから這いテク行怪ゆうんやんか！

パソコンのベンチマークデータは単位時間あたりの計算回数だったり、データ転送量であったりして、通常単位系が違います。
従って､それらの単位の違うデータを合計したり、それをデータ数で割って平均値化したりするということは、無意味以外の何ものでも有りません。

また基準に対して何％速くなったかという数値を平均化しても、全く意味が有りません。

単位系が同じだからといって、速度どうしの平均を取っても意味が有りません。

一番正しい評価方法は一定の仕事量をこなすのに何秒かかるかという、時間の単位で評価することです。

そして短時間で処理が終わる方が良いということを理解してください。

　100m走で10秒切る人と10秒以上かかる人ではどちらが速いかといえば10秒切る人ですよね。

ところがベンチマークで計ったパソコンの性能をグラフ化する時に、棒グラフが長いほど、高性能に思う人がいらっしゃる様です。

雑誌の編集者にもそういう人が多いのかもしれません。
より賢いユーザーになる為には、短時間で終わるパソコンほどはやいパソコンだということを理解してください。

３．なぜパソコンをパワーアップしても思ったよりもはやくならないのか？

パソコンの動作は、プログラムの各部分部分の処理時間の合計になります。
この処理時間は処理内容によって､ボトルネックになる要素が異なります。

例１）
メインメモリを読む必要がある場合はＣＰＵはデータが読みこみ終わるまでひたすら、待機しつづけます。
右の図で色のついているところが実行時間です。
この場合はＣＰＵをこれ以上はやくしても、待機している時間が長くなるだけで、パソコンとしてははやくなりません。

CPU

メモリ

クロック

ところが、メモリをはやくすれば、その分だけパソコンとしても早くなります。
この図の場合はメモリを2倍のはやさにすれば2倍はやくなります｡

CPU

メモリ

クロック

例２）
逆にＣＰＵ内部のキャッシュが100％ヒットしている間は、メモリはなにもする仕事が有りません。
この場合はメモリをはやくしても、パソコンとしてははやくなりません

CPU

メモリ

クロック

が、ＣＰＵをはやくすれば、その分だけパソコンとしてもはやくなります。
この図の場合はCPUを2倍のはやさにすれば2倍はやくなります｡

CPU

メモリ

クロック

この処理時間が遅くなっている原因の部分はボトルネックと呼ばれています。

これを他の要素にも応用すると

パソコンの処理時間＝ＣＰＵがボトルネックの処理時間＋メモリがボトルネックの処理時間＋ＶＧＡがボトルネックの処理時間＋ＨＤがボトルネックの処理時間＋・・・
というように表されます。

本当に２倍はやいパソコンにしようと思った場合は､ＣＰＵも２倍はやく、メモリも２倍はやく、ＨＤＤも２倍はやく、ＶＧＡも２倍はやく・・・
というように何もかも２倍はやくしなければなりません。

ところが実際のパワーアップはＣＰＵだけはやくするとか、ＶＧＡだけはやくするとかしかできません。

例として､「ＣＰＵ」と「ＣＰＵ以外のその他」という分類で考えてみましょう。

ＣＰＵが本当にボトルネックになっている場合、例えば

ＣＰＵがボトルネックの処理時間が90秒、
ＣＰＵ以外がボトルネックの処理時間が10秒とします。

ＣＰＵを２倍はやい物に替えた場合は
ＣＰＵがボトルネックの処理時間が90/2＝45秒に減少します。

パソコンとして評価すると
もとの処理時間は90+10＝100秒
パワーアップ後は90/2+10＝45+10＝55秒
高速化の度合いは100/55＝182％
とＣＰＵを２倍高速化したらパソコンとしては82％高速化されます。

	CPU	その他	合計(秒）
改良前	90	10	100
改良後	90/2＝45	10	55

これぐらいはやくなってくれれば交換した甲斐があるというものです。

しかし、残念ながら実際のアプリケーションではこれほど､ＣＰＵに依存するような処理は無いようです。

今度はＣＰＵがボトルネックの処理時間が50秒、ＣＰＵ以外がボトルネックの処理時間が50秒とします。

ＣＰＵを２倍はやい物に替えた場合はＣＰＵがボトルネックの処理時間が50/2＝25秒に減少します。パソコンとして評価すると

もとの処理時間は50+50＝100秒
パワーアップ後は50/2+50＝25+50＝75秒
高速化の度合いは100/75＝133％

	CPU	その他	合計(秒）
改良前	50	50	100
改良後	50/2＝25	50	75

とＣＰＵを２倍も高速化したのにパソコンとしては33％しか高速化されていません。
これはＣＰＵがボトルネックの処理時間が元々全体の50秒/100秒＝50％しかないため、全体としては大したボトルネックでは無いからです。

（･_･）：50％でもたいしたボトルネックやないんかよ！

もっともっとＣＰＵを早くして100倍はやいＣＰＵに交換したとしても
パワーアップ後は50/100＝0.5+50＝50.5秒
高速化の度合いは100/50.5＝198％
とＣＰＵを100倍も高速化したのにパソコンとしては２倍も高速化できません。

	CPU	その他	合計(秒）
改良前	50	50	100
改良後	50/100＝0.5	50	50.5

つまり、よほどボトルネックになっている処理が分かっていて､よほどうまく高速化しないことにはパソコンははやくなりません。

現実的にはすでにボトルネックは処理内容によって変化する為､ある処理だけは早くなってもその他の処理時間はほとんど変わらないというようなことが起こります｡

1つのパーツを換えただけではわずかしかはやくならないと思ったほうが良いと思われます。

３．ではなぜこのようないい加減な評価方法が蔓延してしまったのでしょうか?

○メーカにとって、自分のところの新製品がはやくなったイメージを持たせた方が、たくさん売れて良い。

○販売店も同様のイメージを持ってもらった方が、たくさん売れてよい。

○ユーザーはせっかく高価な物を買うのだから、少しでもはやくなって欲しい。
これは恋人に「嘘でもいいから好きだといってくれ～～～！」と頼んでいるような気持ちというところでしょうか?
（^_^）：わいだって､高価なパーツ買ったらそうおもてまっせ～～～！

○パソコン雑誌(＆ライター)は、広告料がたくさんはいって、本がたくさん売れさえすれば良い。
よって、広告主や購入者が喜ぶような記事を書く。

以上４者が４者とも嘘でもいいからはやくなったようにみえる方が良いと思っているからです。(笑)

とうぜん訳も分からず書いているライターさんも多いことでしょうが、わざと書いているライターさんがいないとはいえないでしょう。Ａ^_^;)

パワーアップが体感できないのはよく行われているベンチマークの評価方法ほど
実際には早くなっていないから
というのが主因でしょう｡(T_T)

ＴｏＢｅ Continued