我正在制作一个 ML 模型 - 基于时间序列的链接质量预测。我上传了数据集,准备好了。我想构建一个值对日期的依赖性的线性图,但我得到了一个“粥”(副主编,请参阅更改历史中的屏幕):
import pandas as pd
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
from glob import glob
from datetime import datetime, time
from pandas.plotting import autocorrelation_plot
from statsmodels.graphics.tsaplots import plot_acf
files = glob("/content/newDataset/*.tsv")
dataset = pd.concat([pd.read_csv(f, sep="\t", skiprows=1) for f in files],
ignore_index=True)
n_samples = 6992974
dt_from = pd.to_datetime("2016-01-15 00:00:00.000000")
dt_to = pd.to_datetime("2016-01-28 23:59:59.999999")
dataset["DateTime"] = pd.date_range(dt_from, dt_to, periods=n_samples)
dataset['LQ'] = dataset.LQ.astype('float64')
dataset.head()
def plot_series(time, series, format="-", start=0, end=None, label=None):
plt.plot(time[start:end], series[start:end], format, label=label)
plt.xlabel("DateTime")
plt.ylabel("LQ")
if label:
plt.legend(fontsize=14)
plt.grid(True)
def trend(time, slope=0):
return slope * time
time = dataset['DateTime']
series = dataset['LQ']
plt.figure(figsize=(10, 6))
plot_series(time, series)
plt.show()
它可以与什么连接?
您正试图在一张小图上排列近 700 万个点。果然是“粥”。
在这种情况下,他们通常会绘制移动平均线(移动窗口中的平均值):
PS 尝试调整窗口大小 (
window) 以便获得满意的图表。