【Seaborn】relplotによる2変数間の関係の可視化#

※記事内に商品プロモーションを含むことがあります。

公開日

Seabornのrelplot関数は、散布図または折れ線グラフによって、2変数間の関係を可視化する機能を持っています。この記事では、relplot関数の使用方法とオプションについて解説します。

relplot関数の基本#

まず、relplot関数でプロットするデータとして、tipsデータセットを取得します。

import seaborn as sns

df = sns.load_dataset("tips")
df
total_bill tip sex smoker day time size
0 16.99 1.01 Female No Sun Dinner 2
1 10.34 1.66 Male No Sun Dinner 3
2 21.01 3.50 Male No Sun Dinner 3
3 23.68 3.31 Male No Sun Dinner 2
4 24.59 3.61 Female No Sun Dinner 4
... ... ... ... ... ... ... ...
239 29.03 5.92 Male No Sat Dinner 3
240 27.18 2.00 Female Yes Sat Dinner 2
241 22.67 2.00 Male Yes Sat Dinner 2
242 17.82 1.75 Male No Sat Dinner 2
243 18.78 3.00 Female No Thur Dinner 2

244 rows × 7 columns

tipsデータセットは以下の7変数を持ち、データ数は244個です。

  • total_bill: 食事の代金(USドル)

  • tip: チップの額(USドル)

  • sex: 性別

  • smoker: 喫煙者か否か

  • day: 曜日(木曜~日曜のいずれか)

  • time: 食事の時間(昼食または夕食)

  • size: 人数

これをrelplot関数でプロットします。引数dataにDataFrameを与え、x, yにそれぞれx, y軸に表示したい変数を与えます。

sns.relplot(data=df, x="total_bill", y="tip")
<seaborn.axisgrid.FacetGrid at 0x251e256de80>
../_images/b52caf7ccb0ff2cc4b8a8f0667e9b4195a83f699fc54a8823e14ae73f1d47003.png

このように2変数の関係が散布図としてプロットされます。

relplot関数の主なオプションを以下に示します。

オプション

説明

x/y

str

x, y軸の変数

kind

str

グラフの種類。scatrer: 散布図(デフォルト)、line: 折れ線グラフ

hue

str

色分けをするカテゴリ変数名

hue_order

list of str

hueの順番

palette

dict/str

hueの色を指定。カラーマップも指定可能

size

str

散布図のマーカーサイズに対応させる変数名

style

str

散布図のマーカー種類や、折れ線グラフの線の種類を変更する変数名

row

str

複数グラフに分割するときに、縦方向のキーとなる変数名

col

str

複数グラフに分割するときに、横方向のキーとなる変数名

row_order

list of str

rowオプションの順序を指定

col_order

list of str

colオプションの順序を指定

col_wrap

int

rowを指定したときの1行あたりのグラフの数

height

float

各グラフの高さ

aspect

float

aspect*heightがグラフの横幅になる

変数による色分け#

hueオプションに変数を指定することにより、変数の値ごとに色分けされたグラフが出力されます。

sns.relplot(data=df, x="total_bill", y="tip", hue="day")
<seaborn.axisgrid.FacetGrid at 0x251e2961950>
../_images/fefe5465261dab6cd5db1d1b986ac4a69b1f0bd6ab9506f5bfc50fa041cc46aa.png

paletteオプションでは、カテゴリ変数ごとの色を指定できます。指定方法は2つあります。1つは辞書形式で、変数ごとに色の名前を指定します。

sns.relplot(data=df, x="total_bill", y="tip", hue="day",
            palette={"Thur": "red",
                     "Fri": "blue",
                     "Sat": "green",
                     "Sun": "orange"})
<seaborn.axisgrid.FacetGrid at 0x251e24f9590>
../_images/455559446513013d2ef1db80ee831b065a2a9c6daf8afa4144f644b8e6ebf772.png

もう1つの方法は、カラーマップの名前を与える方法です。指定可能なカラーマップについては以下のページを参照下さい。

Matplotlibのカラーマップ

sns.relplot(data=df, x="total_bill", y="tip", hue="day",
            palette="Blues")
<seaborn.axisgrid.FacetGrid at 0x251e29611d0>
../_images/6ab56750594de03f4495103e17eaaa0c83d857a8f6579ea225a39ea33f2d6c5d.png

また、hueオプションには、カテゴリ変数だけでなく数値変数を与えることも可能です。size(人数)で色分けした例を示します。

sns.relplot(data=df, x="total_bill", y="tip", hue="size")
<seaborn.axisgrid.FacetGrid at 0x251e2961450>
../_images/e62226d7f980256a20274b9776dc955e779a8889374950f85e9a005d090c2e93.png

マーカーのサイズ#

sizeオプションに数値データ名を与えると、数値の大きさに応じてマーカーのサイズが変化します(※以下の例では、sizeオプションに与えた"size"はDataFrameの列名の"size"(人数 )のことです)。

sns.relplot(data=df, x="total_bill", y="tip", size="size")
<seaborn.axisgrid.FacetGrid at 0x251e2c1d6d0>
../_images/0e2221c58ae4c2b4634575dc32379104e0ff03159cbf2e37e517265c1781a7ba.png

マーカーの種類#

styleオプションに変数を指定することにより、変数の値ごとにマーカーの種類が異なるグラフが出力されます。styleオプションとhueオプションを併用することも可能です。

sns.relplot(data=df, x="total_bill", y="tip", style="day")
<seaborn.axisgrid.FacetGrid at 0x251e3f19090>
../_images/9b9649101c6064d6272b87971d56dfb24a4fec28c4f271858e8a01a36cdce92d.png
sns.relplot(data=df, x="total_bill", y="tip",
            style="time", hue="day")
<seaborn.axisgrid.FacetGrid at 0x251e411ca50>
../_images/9d386ee1b5f1e85668408834b71a8d7ad6b12a24aa8450ab0c8a319c730142e5.png

複数グラフへ分割#

row, colオプションに変数名を渡すことにより、その変数の値でデータを分割し、縦・横方向にグラフを並べてプロットします。rowオプションに"time"(食事の時間)を渡して、グラフを縦方向に分割した例を以下に示します。

sns.relplot(data=df, x="total_bill", y="tip", row="time")
<seaborn.axisgrid.FacetGrid at 0x251e41839d0>
../_images/f8924747e3a78b610e73941530d52ffa8331cb3faa4970902925eb630ef44e96.png

colオプションに"smoker"(喫煙者か否か)を渡して、グラフを横方向に分割した例を以下に示します。

sns.relplot(data=df, x="total_bill", y="tip", col="smoker")
<seaborn.axisgrid.FacetGrid at 0x251e467d950>
../_images/3b98e1d615c6f58eceef7e442481c4811a09da962475360d6c507aea3aa42154.png

row, colオプションを同時に使用することも可能です。その場合、グラフは縦・横の両方向に分割されます。

sns.relplot(data=df, x="total_bill", y="tip",
            row="time", col="smoker")
<seaborn.axisgrid.FacetGrid at 0x251e4737d90>
../_images/6c601207e39b4634bcc764cba4b7c0568e0d45c56b124d0b084ff55f8a720e1d.png

折れ線グラフ#

relplot関数のkindオプションを"line"とすることにより、折れ線グラフとしてプロットできます。ここでは、fmriというデータセットを用います。

fmri = sns.load_dataset("fmri")
fmri
subject timepoint event region signal
0 s13 18 stim parietal -0.017552
1 s5 14 stim parietal -0.080883
2 s12 18 stim parietal -0.081033
3 s11 18 stim parietal -0.046134
4 s10 18 stim parietal -0.037970
... ... ... ... ... ...
1059 s0 8 cue frontal 0.018165
1060 s13 7 cue frontal -0.029130
1061 s12 7 cue frontal -0.004939
1062 s11 7 cue frontal -0.025367
1063 s0 0 cue parietal -0.006899

1064 rows × 5 columns

timepointというラベルには、同じ値のデータが複数個含まれています。fmriを折れ線グラフとしてプロットします。

sns.relplot(data=fmri, x="timepoint", y="signal", kind="line")
<seaborn.axisgrid.FacetGrid at 0x251e5581310>
../_images/bb44e78e3107750d3c5436ffdb407ae1d9880a500e28d80aed2824d91f744a35.png

薄い水色の区間は、95%信頼区間 (Confidence interval, CI) を示します。

散布図の場合と同様に、折れ線グラフでもhue, style, col, rowオプションなどにより、データを分割してプロットすることが可能です。

sns.relplot(data=fmri, x="timepoint", y="signal",
            kind="line", hue="event")
<seaborn.axisgrid.FacetGrid at 0x251e55eb110>
../_images/543ebe71a60cfada89baf3e99ebc9fd11a4aa00dc66e462b0d29384a96adec9e.png
sns.relplot(data=fmri, x="timepoint", y="signal",
            kind="line", style="event")
<seaborn.axisgrid.FacetGrid at 0x251e5643c50>
../_images/156cae98fb7a1892591f8cdb3422f18729b65ea945e432ff9dabdb5eae0f6d84.png

グラフの保存#

relplot関数で出力したグラフをファイルとして保存するには、relplot関数の戻り値 (rg) のsavefig()メソッドを使用します。引数に保存するファイル名を与えます。

rg = sns.relplot(data=fmri, x="timepoint", y="signal", kind="line")
rg.savefig("relplot.png")
../_images/d26b6991e94079d74b1369e8e5699c22aa59f3942c700853a51b2be45254f2b4.png