2022 年度「データサイエンス基礎」 2022-05-10

§1.1 はじめに

(1.1.1) 数物科学類1年生を対象とする。

(1.1.2) パソコンの基本的な使い方は既知とする。

(1.1.3) ほかの授業担当者が作られた掲示板等は私は読みません。ご了承ください。

§1.2 ファイルの置き場

(1.2.1) どこかに適当な名前の新規フォルダーを作り、 この授業のファイルはそこに作るとよい。 特に好みがなければ、 Windows では「ドキュメント」の中に、Mac では「書類」の中に、 名前は 22dsk でどうだろうか? 2022 年度の Data Science kiso, である。

(1.2.2) 以下はこの名前のフォルダーを作ったとして説明する。 そうでない人は適宜読み替えること。

§1.3 Excel のファイルの作り方,Excel の最小限の使い方

(1.3.1) Windows の場合。 フォルダー 22dsk の中の、何もないところを右クリック, 「新規作成」をクリック, 「Microsoft Excel ワークシート」をクリック。 「新規 Microsoft Excel ワークシート.xlsx」という名前の, Excel のファイルのアイコンができたはずだ。 好きな名前に変えることができる。 ただし,「.xlsx」の部分は変えてはいけない。 このアイコンの色・形を,だいたいでよいから,頭に入れよう。 「.xlsx」という「拡張子」で終わる名前のファイルは, Excel 用のファイルである。 このアイコンをダブルクリックすれば Excel が起動する。

Mac の場合。 Launchpad をクリック。Microsoft Excel のアイコンをクリック。 「空白のブック」をダブルクリック。

(1.3.2) Excel の最小限の使い方。 Excel の画面は,縦横の表である。 行を 1, 2, 3, ..., 列を A, B, C, ... と呼ぶ。 行と列の定義は線形代数学で学んだとおり。 第 A 列の第 1 行のセル(=ます)を A1 と呼ぶ。 これは線形代数学の約束とは異なる。 適当なセルをクリックしてから,適当に文字を打ってみよ。 セルに打ち込んだ文字列の部分訂正は,セルの中ではできない。 そのやりかたは (1.4.5) で述べる。

(1.3.3) 終了法。 Windows の場合。 保存して終了するには,左上の「ファイル」,左の「上書き保存」。 右上のすみの「×」。 保存しないで終了するには,右上のすみの「×」。 「……変更内容を保存しますか?」と尋ねられるので,「保存しない」。

Mac の場合。 保存しないで終了するには,左上のすみの「×」。 「……変更を保存しますか?」と尋ねられるので,「保存しない」。 保存して終了するには「ファイル」「名前を付けて保存...」 「自分の Mac」、「場所」は 22dsk を選ぶ。 なお、次回からは 22dsk の中の .xlsx ファイルのアイコンをダブルクリックすればそのファイルが開く。 また、保存するには「ファイル」「保存」でよい。

§1.4 Excel の使い方

(1.4.1) Excel の画面について,説明する。 上部に,Windows では「ファイル」「ホーム」「挿入」……とあるのが「タブ」である。 Mac では「ホーム」「挿入」「描画」……。 ふだんは「ホーム」にしておくとよい。

(1.4.2) これらのタブのうち,「ファイル」以外をクリックすると, その下の,高さ 3 センチメートルほどの部分が変わる。この部分を「リボン」という。

(1.4.3) Windows の場合、「ファイル」タブをクリックすると別画面になる。 戻るには,左上の「←」をクリックする。

(1.4.4) データの入力。目的のセルをクリックしてから打ち込む。 Tab キーを打つと確定され,その右のセルに入力箇所が移る。 Enter キーを打っても確定され,その次の行に入力箇所が移る。 途中で打ち間違いに気づいた場合, 「←」「→」キーを使うとうまくない。どうなるかは各自で試せ。

(1.4.5) データの修正。セルにカーソルがある状態で Delete キー, BackSpace キーを打つと,そのセルに打ち込まれたものは全部消えてしまう。 一部を訂正するには,リボンの下の「数式バー」で編集する。 「× レ fx」と書かれている箇所の右の,細長い部分である。

§1.5 Excel の練習(等差数列,グラフ,関数)

(1.5.1) これは練習なので,適当なファイル名で実験し,終わったら削除してしまって構わない。

(1.5.2) セル A1 に 1, A2 に 2 と入力せよ。 それからこの二つのセルを範囲指定する。 (それには,マウスカーソルを A1 に合わせてマウスの左ボタンを押し, そのままマウスカーソルが A2 に合うまでマウスを動かし, 左ボタンを押すのをやめる,のだった。)

(1.5.3) A2 の右下に小さな正方形が出るので, それを真下に,A5 の右下までドラッグする。 (それには,マウスカーソルをあて, マウスの左ボタンを押したまま下に移動するのだった。) これで A3 に 3 が,A4 に 4 が,A5 に 5 がはいったであろう。 このように,等差数列を簡単に入力することができる。 確認したらこれらを削除せよ。 (A1 から A5 までを範囲指定してから Delete キーを押すと楽である。)

(1.5.4) A1 に 0 を,A2 に 0.125 を入力せよ。 上で練習した要領で,A1 から下へ向かって, 初項 0, 公差 0.125 の等差数列が,7 まで表示されるようにせよ。 (途中,たとえば A18 までで止まってしまった場合, A17 と A18 を範囲指定して, A18 の右下の小さな正方形を下へドラッグすれば続きができる。 行きすぎてしまった場合は,余分は消す。)

(1.5.5) B1 に「=a1*a1」と入力せよ。すると表示は 0 となるであろう。 A1 かける A1 が計算されたのである。 B1 を範囲指定し,右下の小さな正方形を下にドラッグすると, B2 には A2 かける A2 が, B3 には A3 かける A3 が,……,はいる。 Excel はこういうふうにできているのである。 これを,さっき入力したうちの最後の 7 のところまで,おこなえ。 (これも,途中で止まってしまったら,そこから続ければよい。)

(1.5.6) 列記号の「B」という文字をクリックして,B 列を範囲指定せよ。 「挿入」タブの中の「グラフ」のうち, 折れ線グラフのうちの「2-D 折れ線」の,どれか一つをクリック。 すると y = x2 のグラフ,すなわち放物線の半分が表示されるはずだ。 グラフは,その中の適当な部分をクリックしてから Delete キーを押せば消える。

(1.5.7) こんどは,C1 に「=sin(a1)」と入力せよ。これは正弦関数である。 いまやったことを思い出し,C2 を sin(A2) で,C3 を sin(A3) で,……,埋めよ。 そして,C 列の数値を折れ線グラフにせよ。正弦曲線が表示される。

(1.5.8) 基本的な,使える表現をまとめておこう。

=数値+数値」「=セル名-セル名」「=数値*セル名」。 例:「=b3-c3」「=b3*100/c3」。

大文字・小文字は区別されない。

(1.5.9) 演算子をまとめておこう。 「+ 足し算」「- 引き算」 「* 掛け算」「/ 割り算」 「^ ベキ乗」。

(1.5.10) セルの選択。

(1.5.11) Excel で使える「関数」の一部。なお,「引数」は「ひきすう」と読む。 sum(引数1, 引数2, ...) は,sum(a1:a100) のように使う。 これでセル A1 から A100 まで,の意味になる。 (a1a100 との間にある記号はコロンである。)

sum(引数1, 引数2, ...)合計を求める
max(引数1, 引数2, ...)最大値を求める
min(引数1, 引数2, ...)最小値を求める
mode(引数1, 引数2, ...)最頻値を求める
average(引数1, 引数2, ...)平均値を求める
var.p(引数1, 引数2, ...)分散を求める
stdev.p(引数1, 引数2, ...)標準偏差を求める
count(引数1, 引数2, ...)引数に含まれる数値の個数を求める
fact(引数)階乗を求める
abs(引数)絶対値を求める
sin(引数)cos(引数)tan(引数)正弦,余弦,正接を求める(引数の単位は radian)
ln(引数)log10(引数)自然対数,常用対数を求める
sqrt(引数)正の平方根を求める
pi()円周率を返す定数関数(小かっこは省略不可)
rand()0 以上 1 未満の乱数を返す関数(小かっこは省略不可)

§1.6 課題(第5回)

(1.6.1) 微分積分学でマクローリン展開 f(x) = f(0) + f(1)(0)x/1! + f(2)(0)x2/2! + ... + f(n)(0)xn/n! + ... を学ぶはずである。 ここで f(i)(x) は f(x) の i 次導関数(または i 階導関数)である。 正弦関数 y = sin(x) のマクローリン展開の,収束の様子をグラフにしてみよう。 sin(x) = x - x3/3! + x5/5! - x7/7! + x9/9! - x11/11! + x13/13! - ... である。 この級数を途中で打ち切ると,sin(x) の近似値が得られる。 それをグラフにしてみるのである。

(1.6.2) わざと間違えながら進むことで Excel の重要な機能をも学ぶ。

(1.6.3) 新規ファイル 220510.xlsx を作り, A 列に,-7.5 で始まり 7.5 で終わる,公差 0.25 の等差数列を入力せよ。 これが x になる。

(1.6.4) B 列に,x の正弦の値を記入せよ。 B 列を折れ線グラフで表示せよ。 正弦曲線になるはずだ。確認したらそのグラフは消す。

(1.6.5) C 列に,x の値を記入せよ。これが,sin(x) の一次関数による近似である。 B 列,C 列を折れ線グラフで表示せよ。 C 列の絶対値は 7.5 まで大きくなるので,グラフが縦に圧縮される。 確認したらそのグラフは消す。

(1.6.6) D 列に,x - x3/3! を記入したい。 3 の階乗は fact(3) とするのであった。 よって D1 に「=a1-a1^3/fact(3)」と記入する。 これを利用して D 列を埋めよ。 これが,sin(x) の三次関数による近似である。 B 列,C 列, D 列を折れ線グラフで表示せよ。 D 列の絶対値は 60 よりも大きくなるので,グラフが縦に圧縮され,よくわからないものになる。

(1.6.7) そこで,C 列,D 列のうち,絶対値が 3 より大きいものを,手作業で消せ。 グラフは縦に伸びて見やすくなったであろう。 どれがどの関数のグラフかを確認すること。

(1.6.8) 同様にして,E 列に x - x3/3! + x5/5! を打ち込みたいが, E1 に「=d1+a1^5/fact(5)」と打ってはうまくゆかない。 D 列のうち,絶対値が大きいものを消してしまったからである。

(1.6.9) でも,E1 に「=a1-a1^3/fact(3)+a1^5/fact(5)」と打ちこむのは面倒である。 D18 には値が見えているはずである。これを E1 にコピーし,それに追加できないか,やってみよう。 すると数式バーには B1-B1^3/FACT(3) と表示される。 ほしいものは A1-A1^3/FACT(3) である。 少し考えると,これは Excel の仕様から,当然の結果である。 D 列のものを E 列にコピーした。 そのため,列記号の A は B に変わってコピーされた,というわけである。

(1.6.10) そこで,次のようにする。 D 列と E1 の値を削除しよう。 D1 に「=$a1-$a1^3/fact(3)」と記入し, それを利用して D 列を埋める。 このようにやり直してから,D18 を E1 にコピーすると, 数式バーには「=$A1-$A1^3/FACT(3)」と出て,うまくゆく。 列記号 A の前につけた $ は, 「コピーする際に,この列記号(ここでは A)は変化させない」の意味である。

(1.6.11) (ここでは使わないが,行番号の前につけて A$1 のようにすれば, コピーしてもその行番号は変わらない。 $A$1 のように行番号・列記号の両方に適用することも可能である。)

(1.6.12) 数式バーの「=$A1-$A1^3/FACT(3)」を利用して, E1 に「=$A1-$A1^3/FACT(3)+$a1^5/fact(5)」 と記入し,それを利用して E 列を埋める。 そして,絶対値が 3 を超えるものは削除してから, B 列から E 列までを折れ線グラフにしよう。 これで,正弦関数と,それの 1 次,3 次,5 次の近似をグラフにできた。

(1.6.13) 同様にして, F 列に 7 次近似,G 列に 9 次近似,H 列に 11 次近似,I 列に 13 次近似を入れ, 大きすぎるデータは消して,すべてをまとめた折れ線グラフにせよ。 一列埋めるごとにグラフにすると,だんだん近づいてゆくことが実感できよう。

(1.6.14) グラフは,ドラッグで位置が,四辺や四隅をドラッグすることで大きさ・形が調整できる。 (グラフタイトルなどはそのままにしておいてよい。)

(1.6.15) 以上を保存したファイル 220510.xlsx を,LMS から提出せよ。

§1.7 タイピング練習

(1.7.1) これは,どこまで進んだかをブラウザが記憶する。

(1.7.2) 「岩瀬順一 タイピング練習」で検索し, 「岩瀬順一の「タイピング練習プログラム tx4js」」へ行く。 あとはブラウザの中で練習ができる。 ただし,Edge の Internet Explorer モードでしか動作しない。

(1.7.3) おもしろみのあるプログラムではないが, 一日 30 分,十日で一通り終わるので, すこしがまんして練習されたい。

(1.7.4) ただし,かかる日数には「個人差」ならぬ「個人比」がある。 三分の一で終わる人もあれば,三倍かかる人もいる。

(1.7.5) このプログラムでは最上段(数字が並んだ段)の練習はおこなわない。 最上段の指使いは, 左手小指が 1, 薬指が 2, 中指が 3, 人差し指が 4 と 5, 右手人差し指が 6 と 7, 中指が 8, 薬指が 9, 小指が 0, というのが一つの流儀である。


岩瀬順一