2020 年度「データサイエンス基礎」 2020-06-16

クォーター末試験の週ということもあり,きょうは短めにしました。 課題の期限は六月いっぱいです。 できなかった人は登学できるようになってから補習を受けてもらいます。 補習でとおっても(たぶん)あとで違いはありません。

§4.1 最小二乗法

データ (x1, y1), (x2, y2), (x3, y3), ..., (xN, yN) に対し, それらの間に y = ax + b なる一次式の関係がありそうで, それからのずれは誤差だとしたら, 誤差が最も小さくなる a と b の値は? という問題を解くのが最小二乗法である。 (一次関数以外の関係を想定する場合もある。)

ここでは,誤差を | yi - (axi + b) |2 の和と定義し,それを最小にするよう a, b を定めるものとする。

sxy を §3.1 で出てきた共分散,sx を x の標準偏差, mx, my を x, y の平均とするとき, a = sxy / sx2, b = my - amx となることが知られている。 sxy/(sxsy) が相関係数だったから, a は「相関係数 * (sy/sx)」とも書ける。 こう書くと,そうかなと思えるであろう。 b は,直線 y = ax + b が (mx, my) を通るように決めている。

A1 から A1000 を,平均 0, 標準偏差 1 なる標準正規分布に従う乱数で埋める。 B1 から B1000 も同様とせよ。 A 列と B 列との散布図を出せ。 適当なセルに「=slope(b1:b1000,a1:a1000)」と打ち込むと a の値が, 「=intercept(b1:b1000,a1:a1000)」と打ち込むと b の値がはいる。 いまの場合,a も b も 0 に近い値になる。

B1 に「=norm.inv(rand(),0,1) + a1 * 2 + 0.7」と打ち, それを B1000 まで広げよ。 すると,こんどは a が 2, b が 0.7 に近い値になるであろう。

上の「=norm.inv(rand(),0,1) + a1 * 2 + 0.7」の 「* 2」「+ 0.7」を別の数値に変えたものをファイル 200616.xlsx として提出せよ。

§4.2 タイピング練習

(これは課題ではありません。)

順番が逆だったかもしれません。最後になりましたが, キーボードを,キーを見ないで打てるよう,タイピング練習をしましょう。 正しい練習法をとれば,一日 30 分,十日でマスターできるとされていますが, 上達の速さには個人差,というか,“個人比”があります。 この数倍かかる人もいますし,数分の一で終わってしまう人もいます。

普通の人の目標は「1 打 0.2 秒」,すなわち「1 秒に 5 打」です。 ここまではほとんどの人が練習で達することができます。 これから使う練習プログラムの目標はこれよりずっとやさしくなっていますが, このプログラムで練習して最後の課まで合格した人がその後もパソコンを使い続ければ, たいていこの目標を達成できると思われます。

私が作った練習用サイトは,ブラウザ Edge では動かないため, それよりも前のブラウザ,Internet Explorer を使います。

このサイトは,上で述べた,“正しい練習法”にのっとっています。 それは,打ったものがすぐには見えない・わからないことです。 そのため,やっていて特におもしろいことは起こりません。 が,十日で終わりますので,辛抱して試してみてください。

適当な場所で .html ファイルを新規作成する。 すなわち,右クリック,「新規作成」,「テキスト ドキュメント」。 この新規ファイルの名を,a.html に変更する。 拡張子も変えることになるので警告が出るが,変更する。 このファイルのアイコンをクリックして選択してから右クリック, 「プログラムから開く」,「Internet Explorer」。 これでブラウザ Internet Explorer が起動した。 (このファイル a.html は Internet Explorer の起動のためだけに使うものなので,いらなくなったら消す。)

iwase tx4js」と打ち込むと,Google か Bing が 『岩瀬順一の「タイピング練習プログラム tx4js」』を出してくる。 これをクリック。

ウィンドウを最大化しておくとやりやすい。

「お気に入り」に登録するには Ctrl+D を押す。 「お気に入り」を呼び出すには Alt+C を押す。

最上段の数字キーの指使いは二通りあります。

数字キーは遠い位置にありますが,そのうち慣れます。 左手の小指・薬指・中指で打つ数字キーを打つときは, 左手の人差し指を F のキーにつけておきます。 左手の人差し指で打つ数字キーを打つときは, 左手の小指を A のキーにつけておきます。 右手についても同様です。 実際にはキーから指が少し離れることもありますが, こういったつもりで練習すると上達が速いでしょう。


岩瀬順一