最近在做数据分析的练习时,对一段python代码中的for循环不是很理解,代码如下:
print('修正数据类型(数据清理)') import unicodecsv from datetime import datetime as dt def read_csv(filename): with open(filename, 'rb') as f: reader = unicodecsv.DictReader(f) return list(reader) def parse_date(date): #将字符串的date转换成python的日期时间对象 if date == '': #检查日期是否为空字符串 return None else: return dt.strptime(date, '%Y-%m-%d') #将字符串解析成日期 daily_engagement = read_csv('daily-engagement.csv') print(daily_engagement[0]) # 清理 engagement 的数据类型 for engagement_record in daily_engagement: engagement_record['utc_date'] = parse_date(engagement_record['utc_date']) print('\n每日参与学生数据:') print(daily_engagement[0])
结果输出如下:
修正数据类型(数据清理)
OrderedDict([('acct', '0'), ('utc_date', '2015-01-09'), ('num_courses_visited', '1.0'), ('total_minutes_visited', '11.6793745'), ('lessons_completed', '0.0'), ('projects_completed', '0.0')])
每日参与学生数据:
OrderedDict([('acct', '0'), ('utc_date', datetime.datetime(2015, 1, 9, 0, 0)), ('num_courses_visited', '1.0'), ('total_minutes_visited', '11.6793745'), ('lessons_completed', '0.0'), ('projects_completed', '0.0')])
在读取了daily-engagement.csv文件后,打印变量daily_engagement[0]时,('utc_date', '2015-01-09')中的日期还只是字符串
我的问题是,在对变量daily_engagement进行遍历后,为什么在打印同样的daily_engagement时,里面的utc_date就变成了datetime.datetime(2015, 1, 9, 0, 0)?
我在看这个for循环的时候只看出了对变量engagement_record作了修改,看不出有对daily_engagement作赋值之类的操作,但却能够打印修改后的结果
请大神指教个中原理,谢谢!
慕函数9285021