有一个数据集DataFrame。它有一个 key_skills 列。在 key_skills 中,每一行要么是一个空列表,要么是一个字典列表,格式如下:
[{'name': 'PHP'}, {'name': '1С-Битрикс'}, {'name': 'Git'}, {'name': 'MySQL'}, {'name': 'CSS3'}, {'name': 'ООП'}, {'name': 'API'}, {'name': 'HTML5'}]
如何计算名称的每个元素?也就是说,获取值:PHP、1C-Bitrix、Git、MySQL 等。
这是我在列中获取字典值的方式,但这不适用于字典列表:
df['skills'] = df['key_skills'].map(lambda x: x.get("name", np.nan) if isinstance(x, dict) else np.nan)
那么,相应地,迭代这个列表并将你的这个函数应用到它的元素上:
好吧,你仍然可以调整一些东西,但你最终需要得到什么并不完全清楚。