时间序列(Time Series)是一系列数据点,其中每个数据点都与时间戳关联,一个简单的示例是在给定的一天中,股票在不同时间点的价格,另一个示例是该地区一年中不同月份的降雨量。
在下面的示例中,无涯教程以特定股票代码每天四分之一的股价价格为示例,将这些值捕获为一个csv文件,然后使用pandas库将它们组织到一个数据框中。然后,通过将其他Valuedate列重新创建为索引并删除旧的valuedate列,将date字段设置为数据框的索引。
样本数据
以下是给定季度不同日期的股票价格示例数据。数据保存在名为stock.csv的文件中
ValueDate Price 01-01-2018, 1042.05 02-01-2018, 1033.55 03-01-2018, 1029.7 04-01-2018, 1021.3 05-01-2018, 1015.4 ... ... ... ... 23-03-2018, 1161.3 26-03-2018, 1167.6 27-03-2018, 1155.25 28-03-2018, 1154
创建时间序列
from datetime import datetime import pandas as pd import matplotlib.pyplot as pltdata = pd.read_csv(path_to_file/stock.csv) df = pd.DataFrame(data, columns = [ValueDate, Price])
#将日期设置为索引 df[ValueDate] = pd.to_datetime(df[ValueDate]) df.index = df[ValueDate] del df[ValueDate]
df.plot(figsize=(15, 6)) plt.show()
其输出如下-