RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 784584
Accepted
Дмитрий Владимирович
Дмитрий Владимирович
Asked:2020-02-13 21:10:02 +0000 UTC2020-02-13 21:10:02 +0000 UTC 2020-02-13 21:10:02 +0000 UTC

如何使用 python 从两个 csv 文件中收集信息?

  • 772

任务是这样的:在文件 1.csv 中有一个具有“OR-SDR-28HD-OLEC”类型的唯一值的列。此列中的每个单元格对应于相邻列中单元格的值。有一个 2.csv 文件,它的值来自 1.csv 文件的第一列。2.csv文件中第一列的值需要从第二列中拉出对应的值。

1.csv 看起来像这样:

Overwrite=No,,"* Changing the setting to ?Overwrite=Yes? will have the added effect of deactivating all of your items from the website except for those listed on this datafeed. If this is not intended, keep ?Overwrite=No?.",,,,,,,,
Part #,Item #,Currency,MSRP,MAP,Checkout MAP,Selling Price,Inventory,Fulfillment Option,Shipping,Activation Mark
PS2-BEC-5780,9SIAFDG6V86915,USD,,0.00,False,26.98,37,Seller,free,True

2.csv 应在第二列中包含来自 1.csv 的项目编号

Overwrite = Yes,,* Changing the setting to ?Overwrite=Yes? will have the added effect of deactivating all of your items from the website except for those listed on this datafeed. If this is not intended, keep ?Overwrite=No?.
Part #,Item #,Currency,MSRP,MAP,Checkout MAP,Selling Price,Inventory,Fulfillment Option,Shipping,Activation Mark
PS2-BEC-5780,,USD,,0.00,False,26.98,37,Seller,free,True
python
  • 2 2 个回答
  • 10 Views

2 个回答

  • Voted
  1. jfs
    2020-02-13T21:35:41Z2020-02-13T21:35:41Z

    唯一值可以用作索引pandas.DataFrame,然后您可以简单地使用以下方法获得所需的值df.loc[]:

    #!/usr/bin/env python3
    import pandas as pd
    
    # use unique keys as index
    df = pd.read_csv('1.csv', index_col=0, names=['key', 'value'], header=None)
    print(df)
    
    # read as series
    keys = pd.read_csv('2.csv', squeeze=True, names=['key'])
    print('\nKeys:', *keys)
    print('\n', df.loc[keys])
    

    输出示例:

         value
    key       
    a        1
    b        2
    c        3
    d        4
    
    Keys: b d b
    
          value
    key       
    b        2
    d        4
    b        2
    
    • 1
  2. Best Answer
    MaxU - stop genocide of UA
    2020-02-13T22:29:30Z2020-02-13T22:29:30Z

    如果我正确理解了任务:

    import pandas as pd
    
    d1 = pd.read_csv(filename1, skiprows=1, usecols=['Part #','Item #'])
    d2 = pd.read_csv(filename2, skiprows=1).drop('Item #',axis=1)
    
    res = d2.merge(d1, on='Part #', how='left')
    

    如果您只想从另一个 CSV 文件(DataFrame)添加一列,那么使用该方法会更有效.map():

    d1 = pd.read_csv(filename1, skiprows=1, usecols=['Part #','Item #'])
    d2 = pd.read_csv(filename2, skiprows=1)
    
    d2['Item #'] = d2['Part #'].map(d1.set_index('Part #')['Item #'])
    

    例子:

    In [106]: d2['Item #'] = d2['Part #'].map(d1.set_index('Part #')['Item #'])
    
    In [107]: d2
    Out[107]:
             Part #          Item # Currency  MSRP  MAP  Checkout MAP  Selling Price  Inventory Fulfillment Option Shipping  \
    0  PS2-BEC-5780  9SIAFDG6V86915      USD   NaN  0.0         False          26.98         37             Seller     free
    
       Activation Mark
    0             True
    

    更新: pandas.DataFrame 是内存中的“表”结构。要将 DataFrame 保存为 CSV,可以使用DataFrame.to_csv()方法

    d2.to_csv(r'/path/to/file.csv', index=False)
    
    • 1

相关问题

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    是否可以在 C++ 中继承类 <---> 结构?

    • 2 个回答
  • Marko Smith

    这种神经网络架构适合文本分类吗?

    • 1 个回答
  • Marko Smith

    为什么分配的工作方式不同?

    • 3 个回答
  • Marko Smith

    控制台中的光标坐标

    • 1 个回答
  • Marko Smith

    如何在 C++ 中删除类的实例?

    • 4 个回答
  • Marko Smith

    点是否属于线段的问题

    • 2 个回答
  • Marko Smith

    json结构错误

    • 1 个回答
  • Marko Smith

    ServiceWorker 中的“获取”事件

    • 1 个回答
  • Marko Smith

    c ++控制台应用程序exe文件[重复]

    • 1 个回答
  • Marko Smith

    按多列从sql表中选择

    • 1 个回答
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Suvitruf - Andrei Apanasik 什么是空? 2020-08-21 01:48:09 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5