该算法生成一个值列表,平均从 300k 到 1M 点(取决于是否实现收敛以及在什么点)。为所有这些点绘制图表需要花费大量时间,并且将带有图表的笔记本电脑保存到磁盘时,笔记本电脑会占用大量空间。
因此,我们希望将点数减少到 100。即 将得到的点列表分成 100 个样本,并在每个样本中取平均值,然后形成一个包含 100 个接收值的列表。问题是如何做得更好更高效,有没有有效的算法呢?
该算法生成一个值列表,平均从 300k 到 1M 点(取决于是否实现收敛以及在什么点)。为所有这些点绘制图表需要花费大量时间,并且将带有图表的笔记本电脑保存到磁盘时,笔记本电脑会占用大量空间。
因此,我们希望将点数减少到 100。即 将得到的点列表分成 100 个样本,并在每个样本中取平均值,然后形成一个包含 100 个接收值的列表。问题是如何做得更好更高效,有没有有效的算法呢?
好吧,像这样,例如,用于
Pandas聚合。立即工作:不幸的是,我现在无法附上图片。
一般来说,如果你的数据随时间变化不大,那么也许不需要聚合,抽样就足够了。尝试比较:
通常,采样是一种非常强大的技术。当您有大量硬件无法物理处理的数据时,获取一些数据样本并对其进行试验会很有用 - 这样您可以更快地检查所有内容。