如何正确分组数据?
有一个数据框,其中包含每个分析师和任务类型的已完成任务状态:
df1
ID Board Analyst Status Crea_d Fin_d
46258 RUCRA Ivanov open 2019-07-10 NaT
2345 RUCRA Ivanov close 2019-07-11 2019-07-11
46218 RUCRA Ivanov close 2019-07-11 2019-07-11
3087 RUCRA Sidorov open 2019-07-22 NaT
2367 BV Petrov open 2019-07-25 NaT
2985 GRADE Petrov close 2019-07-05 2019-07-05
20987 GRADE Ivanov close 2019-07-11 2019-07-12
2396 BV Sidorov open 2019-07-29 NaT
有必要以这样一种方式对数据进行分组,以便您可以查看在特定时期(每天、每周、每月)按类型(董事会)完成了多少分析师以及还有多少未完成的任务。
grouped_df:
Board Analyst Status Count
RUCRA Ivanov open 1
RUCRA Ivanov close 2
RUCRA Sidorov open 1
BV Petrov open 1
GRADE Petrov close 1
GRADE Ivanov close 1
BV Sidorov open 1
我做了类似的事情,但是逻辑在某个地方被破坏了,我无法弄清楚:
grouped_df: = (df1.groupby(['Board','Analyst','Status', pd.Grouper(key='Fin_d', freq='M')], as_index=False)['ID'].count())
我只想为每个分析师构建图表,他每天使用趋势线执行多少任务(条形图),但是由于代码中的错误或违反逻辑,没有任何结果。
如果我理解正确:
或像这样: