有一个文件包含类似“%Y-%m-%d”的数据
datetime_click
2017-03-01
2017-03-02
2017-03-03
2017-03-04
2017-03-05
将列加载到数据框中时是否可以立即指定列的数据时间格式?或者换句话说,这里用什么代替?
df = pd.read_csv('result.csv', dtype={'datetime_click':'????????????'})
或者每次如果我想按时间过滤数据,我需要这样转换数据列
def convert_to_datetime(row):
prom_data = datetime.strptime(row['datetime_click'], '%Y-%m-%d')
return prom_data
df['datetime_click'] = df.apply(convert_to_datetime, axis=1)
然后才使用以下算法进行过滤
startDate = '2017-03-03'
endDate = '2017-03-04'
startDate_datetime = datetime.strptime( startDate, '%Y-%m-%d' )
endDate_datetime = datetime.strptime( endDate, '%Y-%m-%d' )
df = df[(df['datetime_click'] >= startDate_datetime) &
(df['datetime_click'] <= endDate_datetime)]
是否可以立即以某种方式使用此算法?
使用pd.read_csv(parse_dates=[...])选项: