题目描述
在机器学习中,对数据进行归一化处理是一种常用的技术。
将数据从各种各样分布调整为平均值为 $0$、方差为 $1$ 的标准分布,在很多情况下都可以有效地加速模型的训练。
这里假定需要处理的数据为 $n$ 个整数 $a _ 1, a _ 2, \ldots, a _ n$。
这组数据的平均值:
$$
\overline a = a _ 1 + a _ 2 + \cdots + a _ n \over n
$$
方差:
$$
D (a) = \frac 1 n \sum \limits_ {i = 1} ^ n (a _ i − \overline a) ^ 2
$$
使用如下函数处理所有数据,得到的 $n$ 个浮点数 $f (a _ 1), f (a _ 2), \ldots, f (a _ n)$ 即满足平均值为 $0$ 且方差为 $1$:
$$
f (a _ i) = {a _ i − \overline a \over \sqrt {D (a)}}
$$
输入格式
第一行包含一个整数 $n$,表示待处理的整数个数。
第二行包含空格分隔的 $n$ 个整数,依次表示 $a _ 1, a _ 2, \ldots, a _ n$。
输出格式
输出共 $n$ 行,每行一个浮点数,依次表示按上述方法归一化处理后的数据 $f (a _ 1), f (a _ 2), \ldots, f (a _ n)$。
如果你输出的每个浮点数与参考结果相比,均满足绝对误差不大于 $10 ^ {−4}$,则该测试点满分,否则不得分。
数据范围
全部的测试数据保证 $n, |a _ i| \le 1000$,其中 $|a _ i|$ 表示 $a _ i$ 的绝对值。
且输入的 $n$ 个整数 $a _ 1, a _ 2, \ldots, a _ n$ 满足:方差 $D (a) \ge 1$。
输入样例:
7
-4 293 0 -22 12 654 1000
输出样例:
-0.7485510379073613
0.04504284674812264
-0.7378629047806881
-0.7966476369773906
-0.7057985054006686
1.0096468614303775
1.9341703768876082
样例解释
平均值:$\overline a \approx 276.14285714285717$
方差:$D (a) \approx 140060.69387755104$
标准差:$\sqrt {D (a)} \approx 374.24683549437134$
解题思路
暴力求出平均值 $\overline a$ 与方差 $D (a)$,再依次求出每个数的 $f (a _ i)$ 即可。具体实现见代码。
AC Code
#include <iostream>
#include <cstdio>
#include <cmath>
#define N 1005
using namespace std;
int n;
long double ave, sq, a[N];
int main ()
{
cin >> n;
for (int i = 1; i <= n; i ++)
{
cin >> a[i], ave += a[i]; // 顺便处理平均值的分子部分
}
ave /= n; // 平均值分子除以分母
for (int i = 1; i <= n; i ++)
{
sq += (a[i] - ave) * (a[i] - ave); // 按照方差的定义处理方差的分子部分
}
sq /= n; // 方差分子除以分母
for (int i = 1; i <= n; i ++)
{
printf ("%LF\n", (a[i] - ave) / sqrt (sq)); // 按照 f[a[i]] 的定义直接求
}
return 0;
}
感谢观看!
$$\href {/blog/content/29204/} {\color {LimeGreen} {【寒假每日一题】题解}}$$
刚才忙着打 $\small \textsf {CF}$ 比赛没时间写题解 $\texttt {qwq}$
orz