python 函数式 panda_带有动态参数的Python Pandas groupby函数,每月...
几年来,我有一个小时格式的数据,格式如下:
Date/Time Value
01.03.2010 00:00:00 60
01.03.2010 01:00:00 50
01.03.2010 02:00:00 52
01.03.2010 03:00:00 49
.
.
.
31.12.2013 23:00:00 77
我正在使用以下代码来获取数据中每年每一小时的平均值:
In [11]: year_hour_means = df1.groupby(lambda x: (x.year, x.hour)).mean()
In [12]: year_hour_means
Out[12]:
Value
(2010, 0) 60
(2010, 1) 50
(2010, 2) 52
(2010, 3) 49
现在,我想将该代码放入函数中,这样我就可以动态地选择按小时,季度或年份对小时进行分组,并且也可以针对数据帧的某个日期范围进行分组.
我写了以下函数:
def datameans(df, avggrouper1, avggrouper2, startdate, enddate):
import pandas as pd
df_hour_means = df[startdate:enddate]
df_hour_means = df_hour_means.groupby(lambda x: (avggrouper1, avggrouper2)).mean()
print df_hour_means.to_string()
df_hour_means.plot()
pass
我正在这样调用函数
datameans(dataframe, 'x.quarter', 'x.hour' , '2010-01-01 00:00:00', '2012-12-31 23:00:00')
不幸的是,这不起作用.有人可以帮我如何将年,季,月和日作为不同的参数来计算均值吗?