データの分析 変数変換の公式 例題付き

データの分析

センター試験や共通テストでたびたび出題される変数変換の問題
そんな問題は、計算をして求めていくことを前提に問題設定されているはずなのだが、
とても時間内に終わるような計算量ではない。
つまり、公式を暗記してしまった方が戦略的に良いと思う。
今回の記事は暗記すべき公式を掲載しつつも、成り立つ理由・証明も載せていきたいと思う。
ぜひ、最後までご覧ください。

変換の公式

$x$,$y$,$u$,$v$は変数であり,$a$,$b$ は定数である。

変数$x$$y$$u=ax+b$$v=cy+d$
平均$\overline{x}$$\overline{y}$$\overline{u}=a\overline{x}+b$$\overline{v}=a\overline{y}+b$
分散$S_{x}^{2}$$S_{y}^{2}$$S_{u}^{2}=a^{2}S_{x}^{2}$$S_{v}^{2}=b^{2}S_{y}^{2}$
標準偏差$S_{x}$$S_{y}$$S_{u}=\vert a \vert S_{x}$$S_{v}=\vert a \vert S_{y}$
共分散$S_{xy}$$S_{uv}= ac S_{xy}$
相関係数$r_{xy}$$r_{uv} =
\begin{eqnarray}
\begin{cases}
r_{xy} &(ac>0) \\
-r_{xy} &(ac<0) \end{cases}
\end{eqnarray}$
変数変換の公式 (暗記事項)

右の2列が今回のメインの部分である。
ここの部分を暗記すれば変数変換の問題は一瞬で解くことができる。

覚えるのが大変だという人は以下の3つだけでも押さえておこう!

①変数変換した際は定数項の影響を受けるのは平均のみで,
 平均以外は定数項の部分は影響を受けない。

②分散は$s^2$と書くくらいだから係数を2乗する。

③相関係数は元の相関係数の$1$倍か$-1$倍のどちらかである。
 何も解けなかったときは感でも$\frac{1}{2}$で正解する。

変数変換の公式の証明

右2列部分の証明となる。なので、ここでは平均、分散、標準偏差、共分散、相関係数の定義は知っているものとして解説する。
上記の定義を知らない場合やまだ身についていない場合はその事項を覚えてから見てほしい。

平均の証明 $\overline{u}=a\overline{x}+b$ 難易度 ★

$$\begin{eqnarray}
\overline {u} &=& \frac{u_{1}+u_{2}+u_{3}+\cdots +u_{n}}{n} \\
\\
&& \hspace{20pt} u=ax+bと変数変換をしているから\\
\\
&=& \frac{(ax_{1}+b)+(ax_{2}+b)+(ax_{3}+b)+ \cdots +(ax_{n}+b)}{n} \\
\\
&& \hspace{20pt} ( \hspace{20pt} )の中の第1項と第2項をまとめる\\
\\
&=& \frac{a(x_{1}+x_{2}+x_{3}+ \cdots +x_{n})+nb}{n}
\\
&& \hspace{20pt} 分子の第1項と第2項を分ける\\
\\
&=& a \cdot \frac{x_{1}+x_{2}+x_{3}+ \cdots +x_{n}}{n} + \frac{nb}{n} \\
\\
&& \hspace{20pt} 第1項はxの平均の定義を用いて,第2項は約分する\\
\\
&=&a \overline{x}+b
\end{eqnarray}$$

分散の証明 $S_{u}^{2}=a^{2}S_{x}^{2}$ 難易度 ★★★

$$\begin{eqnarray}
S_{u}^{2} &=& \frac{(u_{1} \ – \ \overline {u})^2 + (u_{2} \ – \ \overline {u})^2 + \cdots + (u_{n} \ – \ \overline {u})^2 }{n} \\[10pt]
&& \hspace{20pt} u=ax+bと変数変換し,平均の証明の\overline{u}=a\overline{x}+b より\\[10pt]
&=& \frac{(ax_{1}+b \ – \ (a\overline{x} + b))^{2} + (ax_{2}+b \ – \ (a\overline{x} + b))^{2} + \cdots +(ax_{n}+b \ – \ (a\overline{x} + b))^{2}}{n} \\[10pt]
&& \hspace{20pt} 各 ( \hspace{20pt} )^{2}の中を整理する\\[10pt]
&=& \frac{(ax_{1} \ – \ a\overline{x})^{2} + (ax_{2} \ – \ a\overline{x})^{2} + \cdots +(ax_{n} \ – \ a\overline{x} )^{2}}{n}\\[10pt]
&& \hspace{20pt} 各 ( \hspace{20pt} )^{2}をaでくくる.2乗に注意して\\[10pt]
&=& a^{2} \cdot \frac{(x_{1} \ – \ \overline{x})^{2} + (x_{2} \ – \ \overline{x})^{2} + \cdots +(x_{n} \ – \ \overline{x} )^{2}}{n} \\[10pt]
&& \hspace{20pt} 分散の定義より\\[10pt]
&=&a^{2}S_{x}^{2}
\end{eqnarray}$$

標準偏差の証明 $S_{u}=\vert a \vert S_{x}$ 難易度 ★

$$\begin{eqnarray}
S_{u} &=& \sqrt{S_{u}^2} \\[10pt]
&& \hspace{20pt}分散の証明より\\[10pt]
&=& \sqrt{a^{2}S_{x}^2} \\[10pt]
&& \hspace{20pt} \sqrt{a^2}=\vert a \vert,S_{x}>0より\\[10pt]
&=& \vert a \vert S_{x}\\
\end{eqnarray}$$

共分散の証明 $S_{uv}=\vert ac \vert S_{xy}$ 難易度 ★★★★★

$$\begin{eqnarray}
S_{uv} &=& \frac{(u_{1} \ – \ \overline {u})(v_{1} \ – \ \overline {v}) +(u_{2} \ – \ \overline {u})(v_{2} \ – \ \overline {v}) + \cdots + (u_{n} \ – \ \overline {u})(v_{n} \ – \ \overline {v})}{n} \\[10pt]
&& \hspace{10pt} u=ax+b,v=cy+dと変数変換し,平均の証明の\overline{u}=a\overline{x}+b,\overline{v}=a\overline{y}+b より\\[10pt]
&=& \frac{1}{n}(ax_{1}+b \ – \ (a\overline{x} + b))(cy_{1}+d \ – \ (c\overline{y} + d)) + (ax_{2}+b \ – \ (a\overline{x} + b))(cy_{2}+d \ – \ (c\overline{y} + d))\\
&&+ \cdots +(ax_{n}+b \ – \ (a\overline{x} + b))(cy_{n}+d \ – \ (c\overline{y} + d)) \\[10pt]
&& \hspace{10pt} 各 ( \hspace{20pt} )の中を整理する\\[10pt]
&=& \frac{(ax_{1} \ – \ a\overline{x})(cy_{1} \ – \ c\overline{y}) + \cdots +(ax_{n} \ – \ a\overline{x})(cy_{n} \ – \ c\overline{y})}{n}\\[10pt]
&& \hspace{10pt} 各 ( \hspace{20pt} )をaとcでくくる.\\[10pt]
&=& ac \frac{(x_{1} \ – \ \overline{x})(y_{1} \ – \ \overline{y}) + \cdots +(x_{n} \ – \ \overline{x} )(y_{n} \ – \ \overline{y})}{n} \\[10pt]
&& \hspace{10pt} 共分散の定義より\\[10pt]
&=&acS_{xy}
\end{eqnarray}$$

相関係数の証明 難易度 ★★

$$\begin{eqnarray}
r_{uv} &=& \frac{S_{uv}}{S_{u}S_{v}} \\[10pt]
&& \hspace{10pt} 標準偏差と共分散の証明より\\[10pt]
&=& \frac{acS_{xy}}{\vert a \vert S_{x} \vert c \vert S_{y}} \\[10pt]
&=& \frac{acS_{xy}}{\vert ac \vert S_{x}S_{y}} \\[10pt]
&=& \frac{ac}{\vert ac \vert}\frac{S_{xy}}{S_{x}S_{y}} \\[10pt]
&& \hspace{10pt} 相関係数の定義とac>0,ac<0 で場合分けをすればよいので\\[10pt]
&=&\begin{cases}
r_{xy} &(ac>0) \\
-r_{xy} &(ac<0) \end{cases}
\end{eqnarray}$$

例題 (2017年センター試験過去問より)

これはスキージャンプの得点についての問題である。
問題文に$Y$についての説明がないが$Y$は空中姿勢における得点を表している。

$X$と$D$の関係が問題文にあるので,

$$D=1.80X \ – \ 1.80\cdot 125.0 + 60.0$$

よって,分散に関しては

$$S_{D}^2 = 1.80^2 S_{X}^2$$

より[ ソ ]は$3.24$である。

共分散に関しては

$$S_{DY}=1.80\cdot 1S_{XY}$$

より[ タ ]は$1.80$である。

相関係数については

[ タ ]が$1.80>0$なので[ チ ]は1である。

まとめ

変数変換の公式は暗記しておけば、すんなり解けてしまう問題がいくつもある。
時間制限の厳しい共通テストではぜひ活用してもらいたい。

コメント

タイトルとURLをコピーしました