2007 年度「計算数学１」 2007-05-24

§49 Shell ソート

(49.1) ここから、素朴でないソートについて学び始める。自明なアルゴリズムではないので、しっかり取り組むこと。初めに学ぶ Shell ソートでは、「どんな手順でやるか」がまずわかりにくい。それを理解したうえで、「ちょっと見たところ手間がかかるのに、なぜこのほうが速いのか？」を考えることになる。なお、Shell は人名である。

(49.2) （正の）自然数 m を一つ選んで固定する。配列 a[1], ..., a[N] を、その中から m おきに取り出した、次の m 本の部分配列に分割する。

a[1], a[m+1], a[2*m+1], ...
a[2], a[m+2], a[2*m+2], ...
...
a[m-1], a[2*m-1], a[3*m-1], ...
a[m], a[2*m], a[3*m], ...

普通の日本語ではこれを「m-1 おきに取り出した」と呼ぶかもしれない。このそれぞれの部分配列の中でソートを行ない、それぞれの部分配列の中では小さい順にならんでいるようにすることを、ここでは「m おきにソートする」と呼ぼう。

(49.3) 具体例で説明する。次を「3 おきにソートする」としよう。

    18 08 13 93 78 32 81 65 02 40

まずは a[1] から始まる部分配列を考える。 “いまは見ない”部分は「..」とする。

    18 .. .. 93 .. .. 81 .. .. 40

これをこの中で小さい順に並べ替えるとこうなる。

    18 .. .. 40 .. .. 81 .. .. 93

こんどは a[2] から始まる部分配列を考え、それを小さい順に並べ替える。

    .. 08 .. .. 78 .. .. 65 .. ..
                  ↓
    .. 08 .. .. 65 .. .. 78 .. ..

最後に a[3] から始まる部分配列を考え、それを小さい順に並べ替える。

    .. .. 13 .. .. 32 .. .. 02 ..
                  ↓
    .. .. 02 .. .. 13 .. .. 32 ..

よって、最終的にはこうなる。

    18 08 02 40 65 13 81 78 32 93

(49.4) たとえば配列の大きさ N が 1000 のとき、

364 おきにソートし、次に
121 おきにソートし、次に
40 おきにソートし、次に
13 おきにソートし、次に
4 おきにソートし、次に
1 おきにソートする、

とするのが Shell ソートである。各ステップは挿入ソートで行なう。この数列 364, 121, 40, 13, 4, 1 は漸化式 m₁ = 1, m_n+1 = 3 * m_n + 1 で定義される数列を逆順に見たものである。この数列に特別な意味があるわけではない。 1 で終わる別の単調減少数列を選んでもよい。ただし、あとでわかるように、隣り合った項が互いに素であるほうが望ましいようである。

(49.5) 1 おきのソートとは普通のソートのことである。それを最後に行なうから、上のアルゴリズムで正しくソートが行なわれることは間違いない。よって、これから考えるべき問題は、「なぜこれが速いのか？」である。

(49.6) 整数 m, M が 0 < m < M を満たすとき、次の事実が成り立つ。

M おきにソートしてから m おきにソートした結果は、 M おきにソートされている。

(49.7) （証明の概略：「m おきの転倒数」を # {(i, j) | i < j かつ j-i は m の倍数、かつ a[i] > a[j]} で定義する。いま、配列は M おきにソートされているとしよう。 m おきのソートが完了していなければ、 m おきの転倒数は 0 でないので、転倒している組 a[i], a[i+m] が存在する。この i に対し、組 a[i+k*M], a[i+m+k*M] （k は整数）のうち、転倒している組をすべて交換する。この操作のあと、m おき転倒数が減少していること、および M おきにソートされたままであることを観察せよ。この操作をくり返してゆけば m おきのソートが完了するのだから、主張は正しい。）

(49.8) 仮に M が 5, m が 3 だったとしよう。 5 おきにソートし、それから 3 おきにソートしたあと、

... <= a[i-15] <= a[i-12] <= a[i-9] <= a[i-6] <= a[i-3] <= a[i]

であることはもちろんだが、a[i-5] <= a[i] にも注意すると

... <= a[i-17] <= a[i-14] <= a[i-11] <= a[i-8] <= a[i-5] <= a[i]

が言える。 a[i-10] <= a[i] であることからは

... <= a[i-22] <= a[i-19] <= a[i-16] <= a[i-13] <= a[i-10] <= a[i]

が出てくる。ここに出てくる項をよく見ると、「c が 8 以上ならば a[i-c] <= a[i]」が成り立つことがわかる。

(49.9) このあとに 1 おきのソートを挿入ソートで行なえばソートが完了するが、上の考察から、任意の i に対し #{j | j < i かつ a[j] > a[i]} < 8 であることがわかるから、どの要素を挿入する際も高々 7 回の交換で十分である。計算量をおおざっぱに調べてみよう。

5 おきのソートの計算量は、長さ N/5 の部分配列を 5 本ソートするから 5*(N/5)²/4 = N²/20 であり、
3 おきのソートの計算量は同様に 3(N/3)²/4 = N²/12 である。
これに最後の 1 おきのソートの計算量 7N を加えると 2N²/15 + 7N となる。

Ο(N²) であることに変わりはないが、挿入ソートでは N²/4 だったから、 N² の係数が小さくなった分だけ、速いはずである。

(49.10) ※ 3 おきにソートするときの計算量が本当に上の通りかという疑問があろう。その前に 5 おきにソートしているからである。これは私にはわからない。

(49.11) 上の例では「5 おき」「3 おき」にソートしたのがよい“下準備”となった。そこから 8 という数が出てきて、最後の「1 おき」のソートの計算量が 7N となったのだった。一般の場合を考えよう。整数 m, M が 0 < m < M を満たすとき、 M おきにソートしてから m おきにソートしたあとでは 0 以上の整数 x, y に対し a[i-(m*x+M*y)] <= a[i] が成り立つ。

(49.12) 次の定理 (Chinese Remainder Theorem) はすでに代数学の時間に習ったであろう。

a と b を互いに素な自然数とし、 d を整数とするとき、方程式 ax+by = d は整数解 (x, y) をもつ。

(49.13) ことばを変えて言えば、 a と b とが互いに素なら直線 ax+by = d の上には格子点（＝ x 座標も y 座標も整数である点）が存在する、ということである。 (x, y) が解であるとき、任意の整数 k に対し (x+kb, y-ka) も解である。これ以外の解がないことはすぐわかる。よって、格子点は直線 ax+by = d の上に x 座標でみて b おき、y 座標でみて a おきに並んでいる。

(49.14) この定理から次が得られる。

a と b を互いに素な自然数とするとき、整数 d が (a-1)(b-1) 以上ならば方程式 ax+by = d は 0 以上の整数の解 (x, y) をもつ。

(49.15) （証明の概略：上の定理から、直線 ax+by = d の上に格子点があることはわかる。この直線が二直線 x = -1, y = -1 と交わる点の、x 座標の差を考えよう。 d = (a-1)(b-1) のとき、直線 y = -1 とは x = b-1+1/a で交わる。これと x = -1 との差は b+1/a となり、b よりも大きい。直線 ax+by = d は、d が大きくなるほど上方へ移動するので、 d がより大きければ、この差はさらに大きくなる。よって、d が (a-1)(b-1) 以上であるならば、直線 ax+by = d のうち x > -1 かつ y > -1 である部分に格子点があることがわかる。）

(49.16) ※ 方程式 ax+by = (a-1)(b-1)-1 は 0 以上の整数の解 (x, y) を持たない。これは (b-1, -1) と (-1, a-1) とが隣り合った解であることからわかる。

(49.17) ※ さっきの例で出てきた「8」は (M-1)(m-1) にあたる。

(49.18) 上の例では「5 おき」「3 おき」「1 おき」にソートしたが、この授業の実習では (49.4) で述べた単調増加数列を逆にたどりつつ、もっと何度も「m おきのソート」を行なう。 m が N 以上なら「m おきのソート」とは何もしないことだから、 m が大きすぎても別に困らない。よって、m の値は、(49.4) で述べた単調増加数列の項のうち、いま使っているコンパイラの int 型で表せる最大の数から始めればよい。その値は、次のプログラムを動かすことで求められるように 1743392200 である。（このプログラム中の「25」という定数の値は試行錯誤を行なって決めた。）

#include <stdio.h>

main() {
    int i, m;

    m = 1;
    for (i = 1; i < 25; i++) {
        printf("%d\n", m);
        m = 3*m+1;
    }
}

このようにした場合の Shell ソートの理論的な計算量は私には全くわからない。

(49.19) 上では m 本の部分配列をそれぞれ m おきにソートすると説明したが、実際には

a[m+1] を（m おきの部分配列の中で）しかるべき位置に挿入し、
a[m+2] を（m おきの部分配列の中で）しかるべき位置に挿入し、
……
a[N-1] を（m おきの部分配列の中で）しかるべき位置に挿入する、
a[N] を（m おきの部分配列の中で）しかるべき位置に挿入する、

とするほうが楽だろう。これなら三重ループで済むからである。

§50 課題４

(50.1) 課題３と同様のことを、Shell ソートについて行なえ。

(50.2) ※ Shell ソートのプログラムを書く際には、最初から配列を画面いっぱいにとること。 N が 10 ぐらいでは意味がない。また、初めのうちは、途中で m が変わるごとに「40 おきにソートします」などと出力させるとよいかもしれない。（これらの間にソートされてゆく過程が出力されることになる。）

(50.3) (49.4) で述べた単調増加数列を逆にたどる際の漸化式は m = (m-1)/3 でもよいが、Ｃ言語では int 型の正の数どうしの割り算では余りは切り捨てられるから、 m = m/3 と書けばよい。

(50.4) 件名は「kadai4」（←全て半角文字、アルファベットは小文字、途中にスペースをいれない）としてください。これ以外の注意点は課題３と同じです。（理論上の比較・交換回数は述べていないので、それと実験結果を比べることは（当然ながら）できません。）

§51 発展問題

(51.1) ここは、時間などに余裕がある人のためのオプション項目である。

(51.2) その１．挿入ソートの二段目は次のようにも書ける。

a[i] を別の変数 x にコピーしておく。
要素をずらす。すなわち、
- a[i-1] > x なら a[i-1] を a[i] にコピー。
- a[i-2] > x なら a[i-2] を a[i-1] にコピー。
- ...
- a[1] > x なら a[1] を a[2] にコピー。
上の過程は不等号が成立しなくなったら打ち切って、そこ --- どこかは各自で考えること --- へ x をコピー。

関数 swap() は中で三回のコピーを行なう。それをくり返して呼び出す前のやり方に比べ、このほうがコピーの回数が少ないので、速いはずである。この場合のコピーの回数はおよそ何回か。また、このようにプログラムを変更して、実行時間などを比べてみよ。

(51.3) その２． Shell ソートの m の取り方を別のものに変えたらどうなるか。効率を調べてみよ。（K&R2 の教科書に出ているのは効率がよくないと言われている。それを確かめてみるのもよい。）

(51.4) その３．上で書いたプログラムは、 int 型が 32 ビットの場合のものである。それ以外の場合でも適切に動作する Shell ソートのプログラムを書いてみよ。

岩瀬順一