2012 年度「計算数学」 2012-11-30

§7.1 Shell ソート【課題２】

(7.1.1) ここから、素朴でないソートについて学び始める。自明でないアルゴリズムなので、まず、「どんな手順でやるか」がわかりにくいことが多い。手順を理解したうえで、「なぜこれでソートできるのか？」「ちょっと見たところ手間がかかるのに、なぜこのほうが速いのか？」を、数学を用いて考察する（のだが、授業中には時間がない。興味のある者だけ、プリントを見て自分で考えよ）。

(7.1.2) 初めに、Shell ソートを扱う。 Shell は人名なので大文字で始まる。

(7.1.3) （正の）自然数 m を一つ選んで固定する。配列 a[1], ..., a[N] を、その中から m おきに取り出した、次の m 本の部分配列に分割する。

a[1], a[m+1], a[2*m+1], ...
a[2], a[m+2], a[2*m+2], ...
...
a[m-1], a[2*m-1], a[3*m-1], ...
a[m], a[2*m], a[3*m], ...

普通の日本語ではこれを「m-1 おきに取り出した」と呼ぶかもしれない。このそれぞれの部分配列の中でソートを行ない、それぞれの部分配列の中では小さい順にならんでいるようにすることを、ここでは「m おきにソートする」と呼ぼう。

(7.1.4) 具体例で説明する。次を「3 おきにソートする」としよう。

    18 08 13 93 78 32 81 65 02 40

まずは a[1] から始まる部分配列を考える。 “いまは見ない”部分は「..」とする。

    18 .. .. 93 .. .. 81 .. .. 40

これをこの中で小さい順に並べ替えるとこうなる。（どうやって並べ替えるかは後述。）

    18 .. .. 40 .. .. 81 .. .. 93

こんどは a[2] から始まる部分配列を考え、それを小さい順に並べ替える。

    .. 08 .. .. 78 .. .. 65 .. ..
                  ↓
    .. 08 .. .. 65 .. .. 78 .. ..

最後に a[3] から始まる部分配列を考え、それを小さい順に並べ替える。

    .. .. 13 .. .. 32 .. .. 02 ..
                  ↓
    .. .. 02 .. .. 13 .. .. 32 ..

よって、最終的にはこうなる。

    18 08 02 40 65 13 81 78 32 93

(7.1.5) たとえば配列の大きさ N が 1000 のとき、

364 おきにソートし、次に
121 おきにソートし、次に
40 おきにソートし、次に
13 おきにソートし、次に
4 おきにソートし、次に
1 おきにソートする

のが Shell ソートである。各ステップは挿入ソートで行なう。この数列 364, 121, 40, 13, 4, 1 は漸化式 m₁ = 1, m_n+1 = 3 * m_n + 1 で定義される数列を逆順に見たものである。この数列に特別な意味があるわけではない。 1 で終わる別の単調減少数列を選んでもよい。ただし、あとでわかるように、隣り合った項が互いに素であるほうが望ましいようである。

(7.1.6) 最後に行なう 1 おきのソートとは普通のソートのことだから、上のアルゴリズムで正しくソートされることは間違いない。よって、これから考えるべき問題は、「なぜこれが速いのか？」である。

(7.1.7) 自然数 m, M が 0 < m < M を満たすとき、次の事実が成り立つ。

M おきにソートしてから m おきにソートした結果は、 M おきにソートされている。

(7.1.8) （証明の概略：「m おきの転倒数」を # {(i, j) | i < j かつ j-i は m の倍数、かつ a[i] > a[j]} で定義する。いま、配列は M おきにソートされているとする。 m おきのソートが完了していなければ、 m おきの転倒数は 0 でなく、転倒している組 (a[i], a[i+m]) が存在する。このような i を一つ選んで固定し、組 (a[i+k*M], a[i+m+k*M]) （k は整数）のうち、転倒している組すべてに互換をほどこす。この操作のあと、m おきの転倒数が減少していること、および M おきにソートされたままであることを観察せよ。この操作を m おきの転倒数が 0 になるまでくり返してゆけば m おきのソートが完了するのだから、主張は正しい。）

(7.1.9) 仮に M が 5, m が 3 だったとしよう。 5 おきにソートし、それから 3 おきにソートしたあと、

... ≦ a[i-15] ≦ a[i-12] ≦ a[i-9] ≦ a[i-6] ≦ a[i-3] ≦ a[i]

であることはもちろんだが、a[i-5] ≦ a[i] にも注意すると

... ≦ a[i-17] ≦ a[i-14] ≦ a[i-11] ≦ a[i-8] ≦ a[i-5] ≦ a[i]

が言える。 a[i-10] ≦ a[i] であることからは

... ≦ a[i-22] ≦ a[i-19] ≦ a[i-16] ≦ a[i-13] ≦ a[i-10] ≦ a[i]

が出てくる。ここに出てくる項をよく見ると、「c が 8 以上ならば a[i-c] ≦ a[i]」が成り立つことがわかる。

(7.1.10) このあとに 1 おきのソートを挿入ソートで行なえばソートが完了するが、上の考察から、任意の i に対し #{j | j < i かつ a[j] > a[i]} < 8 であることがわかるから、どの要素を挿入する際も高々 8 回の比較、高々 7 回の交換で十分である。計算量をおおざっぱに調べてみよう。

5 おきのソートの計算量は、長さ N/5 の部分配列を 5 本、挿入ソートでソートするから 5*(N/5)²/4 = N²/20,
3 おきのソートの計算量は同様に 3(N/3)²/4 = N²/12,
これに最後の 1 おきのソートの計算量 8N を加えると 2N²/15 + 8N となる。

Ο(N²) であることに変わりはないが、挿入ソートの計算量の N²/4 と比べると、 N² の係数が小さくなった分だけ、速いはずである。

(7.1.11) ※ 実験してみると、 3 おきにソートする際の計算量はこれよりはるかに小さい。それは、その前に 5 おきにソートしたことで、小さいものが左に、大きいものが右に寄っているためであろう。

(7.1.12) 上の例では「5 おき」「3 おき」にソートしたのがよい“下準備”となった。そこから 8 という数が出てきて、最後の「1 おき」のソートの計算量が 8N となったのだった。一般の場合を考えよう。自然数 m, M が 0 < m < M を満たすとき、 M おきにソートしてから m おきにソートしたあとでは 0 以上の整数 x, y に対し a[i-(m*x+M*y)] ≦ a[i] が成り立つ。

(7.1.13) 次の定理はすでに習ったであろう。

a と b を互いに素な自然数とし、 d を整数とするとき、方程式 ax+by = d は整数解 (x, y) をもつ。

(7.1.14) ことばを変えて言えば、 a と b とが互いに素なら直線 ax+by = d の上には格子点（＝ x 座標も y 座標も整数である点）が存在する、ということである。 (x, y) が解であるとき、任意の整数 k に対し (x+kb, y-ka) も解である。これ以外の解がないことはすぐわかる。よって、格子点は直線 ax+by = d の上に x 座標でみて b おき、y 座標でみて a おきに並んでいる。

(7.1.15) この定理から次が得られる。

a と b を互いに素な自然数とするとき、整数 d が (a-1)(b-1) 以上ならば方程式 ax+by = d は 0 以上の整数の解 (x, y) をもつ。

(7.1.16) （証明の概略：上の定理から、直線 ax+by = d の上に格子点があることはわかる。この直線が二直線 x = -1, y = -1 と交わる点の、x 座標の差を考えよう。 d = (a-1)(b-1) のとき、直線 y = -1 とは x = b-1+1/a で交わる。これと x = -1 との差は b+1/a となり、b よりも大きい。直線 ax+by = d は、d が大きくなるほど上方へ移動するので、 d がより大きければ、この差はさらに大きくなる。よって、d が (a-1)(b-1) 以上であるならば、直線 ax+by = d のうち x > -1 かつ y > -1 である部分に格子点があることがわかる。）

(7.1.17) ※ 方程式 ax+by = (a-1)(b-1)-1 は 0 以上の整数の解 (x, y) を持たない。これは (b-1, -1) と (-1, a-1) とが隣り合った解であることからわかる。

(7.1.18) ※ さっきの例で出てきた「8」は (M-1)(m-1) にあたる。

(7.1.19) 上の例では「5 おき」「3 おき」「1 おき」にソートしたが、この授業の実習では (7.1.5) で述べた単調増加数列を逆にたどりつつ、もっと何度も「m おきのソート」を行なう。 m が N 以上なら「m おきのソート」とは何もしないことだから、 m が大きすぎても別に困らない。よって、m の値は、(7.1.5) で述べた単調増加数列の項のうち、いま使っているコンパイラの int 型で表せる最大の数から始めればよい。その値は、簡単なプログラムを書いて動かすことで求められるように、 1743392200 である。このようにした場合の Shell ソートの理論的な計算量は私には全くわからない。

(7.1.20) 【重要】上では m 本の部分配列をそれぞれ m おきにソートすると説明したが、実際には

a[m+1] を（m おきの部分配列の中で）しかるべき位置に挿入し、
a[m+2] を（m おきの部分配列の中で）しかるべき位置に挿入し、
……
a[N-1] を（m おきの部分配列の中で）しかるべき位置に挿入する、
a[N] を（m おきの部分配列の中で）しかるべき位置に挿入する、

とするほうが楽だろう。これなら三重ループで済むからである。

§7.2 課題２

(7.2.1) 課題１と同様のことを、Shell ソートについて行なえ。課題１で書いた、挿入ソートのソースファイルのコピーを元にする。ソースファイル名は shell.c がよいだろう。ファイル名には小文字が便利なので，頭文字を小文字にした。

(7.2.2) ※ Shell ソートのプログラムを書く際には、最初から配列を画面いっぱいにとること。 N が 10 ぐらいでは意味がない。また、初めのうちは、途中で m が変わるごとに「40 おきにソートします」などと出力させるとよいかもしれない。（これらの間にソートされてゆく過程が出力される。）

(7.2.3) 挿入ソートのプログラムは for が二重になっていたが、それをさらに for ループで囲み、そのループで m を減らしてゆく。その際、(7.1.5) で述べた単調増加数列を逆にたどる際の漸化式は m = (m-1)/3 でもよいが、Ｃ言語では int 型の正の数どうしの割り算では余りは切り捨てられるから、 m = m/3 と書けばよい。ソートを行なう部分の全体は次のようになる。

    for (m = 前述の大きな数; m ???; m = m/3) {
        挿入ソートの二重ループをここに入れ、一部手直しをする
    }

(7.2.4) N を大きくしての実験は、 N を 10000, 100000, 1000000 の三通りに変えて行なえ。

(7.2.5) 件名は「kadai2」（←全て半角文字、アルファベットは小文字、途中にスペースをいれない）とせよ。これ以外の注意点は課題１と同じである。

§7.3 発展問題

(7.3.1) ここは、時間などに余裕がある人のためのオプション項目である。

(7.3.2) 5 おき、3 おき、1 おきにソートする Shell ソートのプログラムを書き、(7.1.7), (7.1.9) の主張が正しいことを確認せよ。さらに、それぞれの段階における、そこまでの比較回数・交換回数を出力するようにせよ。

(7.3.3) Shell ソートの m の取り方を別のものに変えたらどうなるか。効率を調べてみよ。（K&R2 の教科書に出ているものは N/2 から始めて 2 で割ってゆくものである。これは、N が 2 のベキ乗のとき効率がよくないと言われている。それを確かめてみるのもよい。）

(7.3.4) 前に (7.1.19) に書いた定数 1743392200 を求めるプログラムを書け。

(7.3.5) 上で書いたプログラム（＝ m が 1743392200 から始まるもの）は、 int 型が 32 ビットの場合のものである。それ以外の場合でも適切に動作する Shell ソートのプログラムを書け。

(7.3.6) 前に書いた挿入ソートを、N を 100000 にして動かし、時計でかかった時間を測定せよ。それを元に、 1000000 のときの所要時間を推測せよ。それと今回の Shell ソートの場合とを比べてみよ。

(7.3.7) （ビット数と、int 型で扱える数の範囲について簡単に説明する。 1 ビットには 0 か 1 かのどちらかが格納できる。よって、センターのパソコンのように int 型が 32 ビットであれば、 2³² = 4294967296 通りの数が格納できる。普通、このうち半分を非負の数に、残りの半分を負の数にあてるので、センターの Linux では、 int 型であらわせる最小の数は -2147483648, 最大の数は 2147483647 となっている。）

§7.4 ソートプログラムの効率の限界

(7.4.1) 互いに異なる三つの数 a, b, c を比較して小さい順に並べるとしよう。下の図は、最初に a < b かどうかを調べ、「はい」なら上へ、「いいえ」なら下へ進む、と読む。一番右に書かれているのが、得られた結論である。

                          +-               「a < b < c」
                          |
            +- (b < c ?) -+
            |             |             +- 「a < c < b」
            |             +- (a < c ?) -+
            |                           +- 「c < a < b」
-(a < b ?) -+
            |                           +- 「b < a < c」
            |             +- (a < c ?) -+
            |             |             +- 「b < c < a」
            +- (b < c ?) -+
                          |
                          +-               「c < b < a」

高々３回の比較で結論に至るが、これを２回に減らすことは不可能である。それは、２回の分岐では４通りの結論しかありえないのに対し、結論は 3! = 6 通りあるからである。

(7.4.2) 同様の議論により、高々 k 回の比較で N 個の元をソートするプログラムがあったとすると、 2^k ≧ N! が成り立つ。自然対数をとると k log(2) ≧ log(N!) = log(1) + log(2) + log(3) + ... + log(N-1) + log(N) となる。この右辺は、関数 y = log(x) の積分と比較することにより、 N log(N) - N + 1 よりも大きく、 (N+1) log(N+1) - N よりも小さいことがわかる。 N が十分大きければほぼ N log(N) とみなせる。よって、 N が十分大きいとき、 “ほぼ k ≧ N log(N) / log(2)”である。公式 log_ac = log_ab ・log_bc, あるいは log_ac / log_ab = log_bc を思い出すと、これは“ほぼ k ≧ N log₂(N)”となる。情報科学では対数の底として 2 を選ぶことが多いらしい。その約束を採用するなら、“ほぼ k ≧ N log(N)”と書ける。オーダーで言えば、Ο(N log(N)) が限界となる。これより真に小さいオーダーの計算量で済むアルゴリズムは存在しない。

(7.4.3) （ただし、これは、二つの要素の比較と互換を基礎としてアルゴリズムを構成する限り、の話である。それ以外の、ソートに都合のよい機能を持ったコンピュータがでてきて、基礎になる演算が比較・互換以外のものになれば、その回数は上の限界よりも少ないことがあり得る。）

(7.4.4) 次から、Ο(N log(N)) のソートアルゴリズムを学ぶ。オーダーの点から見れば、これよりも効率のよいアルゴリズムは存在しない。あとは、係数をどれだけ小さくできるか、である。

§7.5 画面出力関数の改良

(7.5.1) 関数 print(void) を改良し，いま注目すべき数だけを「[ ]」で囲んで出力する関数， void print2(int i, int j)は書けるか？　引数の i, jは，「[ ]」で囲まれるものの添え字である。 print2(2, 6) として呼び出すと画面には「16[53]27 38 49[32]89」のように出力されるものとする。

(7.5.2) この関数は，これから学ぶソートではあまり役に立たないかもしれないが，挿入ソート，Shell ソートの過程をよく見たい場合には便利であろう。諸君のあとから学ぶ人への助けになるかもしれない。