# モジュール・ライブラリのインポート(必ず最初に実行)
import sys, os
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

# 日本語フォントの設定(Mac:'Hiragino Sans', Windows:'MS Gothic')
plt.rcParams['font.family'] = 'MS Gothic'

# 表記の設定
pd.set_option('display.precision', 3)   # 小数点以下の表示桁
pd.set_option('display.max_rows', 20)  # 表示する行数
pd.set_option('display.max_columns', 10)  # 表示する行数
%precision 3
'%.3f'

2. プログラミング環境の構築#

2.1. Anacondaのインストール#

  • Anacondaのアンインストール(環境再構築の場合)

    • コントロールパネル > プログラムのアンインストール

    • Anacondaを選択してアンインストール

    • anaconda3というフォルダが残っている場合は手動で削除する

      • ユーザフォルダまたはCドライブ直下を確認

    • PC再起動

  • インストーラのダウンロード

  • Anacondaのインストール

    • Select Installation TypeでJust Meを選ぶ

    • Choose Install LocationはデフォルトのままでOKだが,anacondaのインストール先のパスに日本語が含まれるとうまくいかないので注意

    • Advanced Installation Optionsで以下の2つに必ずチェックを入れる

      • Add Anaconda3 to my PATH environment variable

      • Register Anaconda3 as my default Python 3.9

  • Anaconda Navigatorを起動して,インストールが成功しているか確認する(適宜アップデートする)

2.2. 作業フォルダの作成#

データ分析では,様々なファイルを扱わなければならない. これらのファイルが自分のPC内のどこに保存されているかを把握しておかないと,ファイルを探すだけで時間を取られてしまう. データ分析を始める際にまず行うべきことは,PC内のフォルダやファイルを整理することである.

まず本講義専用の作業フォルダを作成する. フォルダ名は自分で分かれば何でも良いが(英数字の方が望ましい),スペースは絶対に入れないこと. 作業フォルダの作成場所はクラウドストレージのフォルダ(例えば,OneDrive)の中に作ることを推奨する(こうすれば,自動的にクラウド上にバックアップされる).

ここでは,ローカルディスク(C:)>ユーザー>username>OneDriveの中に情報処理の応用という作業フォルダを作ったとする:

[OneDrive]
    - [デスクトップ]
    - [ドキュメント]
    ...
    - [情報処理の応用]

本講義で扱うファイルは全てこの情報処理の応用フォルダの中に保存する. 情報処理の応用フォルダの中身は次のように章ごとのサブフォルダやレポート用のフォルダに分けておくと良い:

[情報処理の応用]
    - [chap_1]
    - [chap_2]
    ...
    - [report]
    - [others]

2.3. Jupyter Labの運用#

Anacondaをインストールすると,自動的にJupyter Labが使えるようになる. 本講義では演習の時間を設けるので,その際には以下のようにJupyter Labを運用する.

2.3.1. Jupyter Labの起動#

  • Anaconda Navigatorを起動

    • [スタートメニュー]→[Anaconda Navigator (anaconda3)]

  • [Jupyter Lab]をLaunch

2.3.2. ノートブック(.ipynbファイル)の起動#

  • .ipynbファイルをダウンロードし,作業フォルダ内に保存する.

    • 講義ノート上部のアイコンから.ipynbをクリック

    • 自動保存された場合はダウンロードフォルダ内に保存されているはず

  • Jupyter Lab左上のフォルダアイコンをクリックする.

  • .ipynbファイルを保存したフォルダに移動し,.ipynbファイルをダブルクリックする.

2.4. パス(Path)について#

2.4.1. パスとは何か?#

自分のPCに保存されたファイルをJupyter Labに読み込んだり,逆にJupyter Labで作成した図などを自分のPCに保存するには,対象となるファイルの在り処,つまりアドレスが分からないといけない. このアドレスを指定する文字列のことをパス(Path)と呼ぶ.

Windowsの場合,パスはフォルダの階層構造を区切り文字¥(またはバックスラッシュ\)によって区切った形式で以下のように表される:

C:¥ユーザー¥ドキュメント

フォルダの階層の区切りは¥(またはバックスラッシュ\\)によって表されており,¥の隣にはフォルダの名前が記載されている. 上の例は,Cドライブ(C:)の中にあるユーザーフォルダの中のドキュメントフォルダのパスを表す.

2.4.2. 相対パスと絶対パス#

パスには相対パスと絶対パスの2種類が存在する.

相対パス

現在自分がいるフォルダのことをカレントディレクトリと呼ぶ. 通常は,Jupyter Labで開いている.ipynbファイルが保存されているフォルダがカレントディレクトリとなる. 相対パスとはカレントディレクトリからの相対的な位置を示す方法で,例えば以下のように指定する:

./test.pdf

ここで,先頭の.はカレントディレクトリ(sec_1-3.ipynbが保存されているフォルダ)を意味する文字である. よって,この場合はカレントディレクトリの中にあるtest.pdfというファイルを示すパスとなる.

練習として,以下のコードを実行してみよう. カレントディレクトリの中にtest.pdfというファイルができるはずである.

fig, ax = plt.subplots(figsize=(3.5, 3))
x = np.arange(-np.pi, np.pi, 0.01)
ax.plot(x, np.sin(x))
ax.set_xlabel('横軸') # 横軸のラベル
ax.set_ylabel('縦軸') # 縦軸のラベル
ax.set_title('三角関数のグラフ', fontsize=12) # タイトル

fig.savefig('./test.pdf', bbox_inches="tight", pad_inches=0.2, transparent=True, dpi=300)
../_images/7530b4904334cde157267015c3285dd0a637a49f4fec1f20fba4d80d361d027e.png

絶対パス

最も上の階層であるドライブ名(通常はC:)から始まるパスを絶対パスと呼ぶ. Windowsにおいて絶対パスを取得(コピー)するには以下のようにする:

  • エクスプローラー上で対象のファイルやフォルダに対しshiftキーを押しながら右クリック

  • 「パスのコピー」を選択

なお,Windows環境においてパスをコピーして貼り付けると C:\ユーザー\ユーザー名\OneDrive\情報処理の応用 のように区切り文字がバックスラッシュ\または¥になるはずである. ところが,pythonではバックスラッシュ\と文字を組み合わせたエスケープシーケンスいう特別な文字列が存在し,例えば,\nは改行,\tはタブを表すエスケープシーケンスとなる. これにより,上の例の中にある\tの部分はパスの区切りではなくエスケープシーケンスとして認識され,エラーが出ることがある(特に,pythonでファイルの入出力を行うとき). これを回避するには以下のように先頭にrを付ける

r"C:\ユーザー\ユーザー名\OneDrive\情報処理の応用"

これは,raw文字列と呼ばれ,""の中に指定した文字列をそのままの形で認識させることができる.

実際に,自分の好きなフォルダのパスをコピーし,test2.pdfという名前で図を保存してみよう.

import numpy as np
import matplotlib.pyplot as plt

fig, ax = plt.subplots(figsize=(3.5, 3))
x = np.arange(-np.pi, np.pi, 0.01)
ax.plot(x, np.sin(x))

fig.savefig(, bbox_inches="tight", pad_inches=0.2, transparent=True, dpi=300)

2.5. Maplotlibの日本語対応#

Matplotlibはグラフ作成のためのライブラリである. Matplotlibは標準で日本語に対応していないが,以下の2つの方法で日本語を出力することができる

1. matplotlibで使用する日本語フォントを設定する

pipでのインストールを行いたくない場合は,matplotlib用の日本語フォントその都度指定する方法もある. 以下のように,好きな日本語フォントを使用できるが,WindowsやMacによって使用可能なフォントが異なるので注意する. フォントにこだわりがなければ,Windowsの場合は'MS Gothic',Macの場合は'Hiragino Sans'としておけば良い.

# 日本語フォントの設定(Mac:'Hiragino Sans',Windows: 'MS Gothic')
import matplotlib.pyplot as plt
plt.rcParams['font.family'] = 'MS Gothic'

方法2: japanize_matplotlib を利用する

  • 2024年9月現在,Python 3.12以上ではjapanize_matplotlibが使えない.

  • 代わりにmatplotlob-fontjaが公開されている(詳しくはこちら).