RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 935194
Accepted
Pavel
Pavel
Asked:2020-01-22 19:02:56 +0000 UTC2020-01-22 19:02:56 +0000 UTC 2020-01-22 19:02:56 +0000 UTC

通过给定的熊猫参数选择列

  • 772

我有以下数据框:

在此处输入图像描述

它需要转换为以下形式:

Регистрационный номер   Год    Наименование           Значение
   1140280002235        2013  Нематериальные активы     0
   1140280002235        2013  Основные средства         0
   1140280002235        2014  Нематериальные активы     0
   1140280002235        2014  Основные средства         0
   1140280002235        2015  Нематериальные активы     0
   1140280002235        2015  Основные средства         825 000
   ..........................................................
   1147746032752        2015  Основные средства        2 314 000

原则上,您可以将注册号和年份设置为索引(set_index)。我不明白如何转换原始数据帧的逻辑,以便可以轻松地按年份和注册号过滤。

    import pandas as pd
    import numpy as np
    import re
    df_findata = pd.read_csv(open('spark_fin_data.csv', 'r', encoding='KOI8-R'), sep = ',', decimal=',')
    df_findata.head()

在此处输入图像描述

PS数据临时链接

python
  • 1 1 个回答
  • 10 Views

1 个回答

  • Voted
  1. Best Answer
    MaxU - stop genocide of UA
    2020-01-22T20:17:39Z2020-01-22T20:17:39Z

    试试这样:

    df = pd.read_csv(r'C:\download\data.csv', dtype={'Регистрационный номер':'str'})
    
    cols2drop = [
      '?',
     'Наименование',
     'Адрес (место нахождения)',
     'Дата регистрации',
     'Возраст компании',
     'Дата ликвидации',
     'Статус',
     'Вид деятельности/отрасль',
     'Организационно-правовая форма',
     'Форма собственности']
    
    df = (df.drop(cols2drop, axis=1)
            .set_index('Регистрационный номер')
            .stack()
            .reset_index(level=1)
            .rename(columns={'level_1':'name',0:'val'}))
    
    df[['Год','Наименование']] = \
        (df.pop('name')
           .str.extract(r'(\d{4}),\s*([^,]*?)\s*,'))
    
    
    df['Значение'] = pd.to_numeric(df.pop('val').str.replace('\s*',''), 
                                   errors='coerce')
    df = df.reset_index()
    

    结果:

    In [49]: df
    Out[49]:
            Регистрационный номер   Год                         Наименование  Значение
    0               1140280002235  2015                    Основные средства    825000
    1               1140280002235  2015                  Внеоборотные активы    825000
    2               1140280002235  2016                  Внеоборотные активы     37000
    3               1140280002235  2017                  Внеоборотные активы      6000
    4               1140280002235  2015                               Запасы     58000
    5               1140280002235  2016                               Запасы    162000
    6               1140280002235  2017                               Запасы      2000
    ...                       ...   ...                                  ...       ...
    1137143         1088602002004  2016  Прибыль (убыток) до налогообложения   6980000
    1137144         1088602002004  2017  Прибыль (убыток) до налогообложения  -2941000
    1137145         1088602002004  2013              Чистая прибыль (убыток)  33468000
    1137146         1088602002004  2014              Чистая прибыль (убыток)  28719000
    1137147         1088602002004  2015              Чистая прибыль (убыток)   1887000
    1137148         1088602002004  2016              Чистая прибыль (убыток)   4821000
    1137149         1088602002004  2017              Чистая прибыль (убыток)  -3229000
    
    [1137150 rows x 4 columns]
    
    • 1

相关问题

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    根据浏览器窗口的大小调整背景图案的大小

    • 2 个回答
  • Marko Smith

    理解for循环的执行逻辑

    • 1 个回答
  • Marko Smith

    复制动态数组时出错(C++)

    • 1 个回答
  • Marko Smith

    Or and If,elif,else 构造[重复]

    • 1 个回答
  • Marko Smith

    如何构建支持 x64 的 APK

    • 1 个回答
  • Marko Smith

    如何使按钮的输入宽度?

    • 2 个回答
  • Marko Smith

    如何显示对象变量的名称?

    • 3 个回答
  • Marko Smith

    如何循环一个函数?

    • 1 个回答
  • Marko Smith

    LOWORD 宏有什么作用?

    • 2 个回答
  • Marko Smith

    从字符串的开头删除直到并包括一个字符

    • 2 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5