RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题

问题[pandas]

Martin Hope
Светлана
Asked: 2024-10-08 16:13:31 +0000 UTC

使用 merge 按键合并两个 Pandas 数据帧

  • 6

合并两个数据框时,会出现额外的行。我将用一个例子来解释:数据帧1(50行),我通过4个键将数据帧2(1600万行)的列附加到它,最终的数据帧是51行。此外,这是额外的一行 - 它重复其中一行,即,事实上,行数由于行 - 重复而增加。可能是什么原因?当然,您可以稍后删除重复项,但我希望它们一开始就不会形成。 (至于数据类型 - 一切都很好,我检查过)

Вот примеры кода (2 варианта):

df_merged1 = pd.merge(
    res_test1, df3_,
    left_on=['uuid',  'id_route', 'vehicle_type', 'time' ],
    right_on=['uuid',  'id_route', 'vehicle_type', 'time' ]
)

df_merged2 = res_test1.merge(df3_, on=['uuid',  'id_route', 'vehicle_type', 'time' ])
pandas
  • 1 个回答
  • 29 Views
Martin Hope
vagiinalover
Asked: 2024-08-10 05:46:14 +0000 UTC

熊猫。包含文本和数字字段值的数据透视表

  • 5

大家好!请帮忙。我有这个数据框:

df = pd.DataFrame({
    'sku_sellout': ['a', 'a', 'b', 'c', 'a'],
    'labels': ['менее 100%', '100-200%', 'более 200%', 'более 200%', 'менее 100%'],
    'price': [100, 200, 300, 1000, 100],
    'ranges': ['0-100', '100-200', '200-300', '900-1000', '0-100'],
    'rur_extr': [1, 2, 3, 4, 1],
    'qnt_extr': [10, 20, 30, 40, 15]
})
sku_售完 标签 价格 范围 鲁尔外部 qnt_extr
一个 低于100% 100 0-100 1 10
一个 100-200% 200 100-200 2 20
乙 超过200% 300 200-300 3 30
c 超过200% 1000 900-1000 4 40
一个 低于100% 100 0-100 1 15

我需要从中得到这个:

df2 = pd.DataFrame({
    'sku_sellout': ['a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'c'],
    'metrics':['ranges', 'rur_extr','qnt_extr','ranges', 'rur_extr','qnt_extr','ranges', 'rur_extr','qnt_extr'],
    'менее 100%': ['0-100',2,25,None,None,None,None,None,None],
    '100-200%': ['100-200%',2,20,None,None,None,None,None,None],
    'более 200%': [None,None,None,'200-300',3,30,'900-1000',4,40]
})
sku_售完 指标 低于100% 100-200% 超过200%
一个 范围 0-100 100-200% 没有任何
一个 鲁尔外部 2 2 没有任何
一个 qnt_extr 25 20 没有任何
乙 范围 没有任何 没有任何 200-300
乙 鲁尔外部 没有任何 没有任何 3
乙 qnt_extr 没有任何 没有任何 30
c 范围 没有任何 没有任何 900-1000
c 鲁尔外部 没有任何 没有任何 4
c qnt_extr 没有任何 没有任何 40

那些。本质如下 - 行中有测量 sku_sellout 和指标(ranges、rur_extr、qnt_extr),列中有标签的值。十字路口处有:

  1. 如果是rur_extr或qnt_extr,则对应字段的和。
  2. 如果这是范围,则为此 sku_sellout 和标签找到的第一个值 (aggfunc='first') - 它将始终相同。

我通过melt 和pivot_table 完成了此操作,但无法将条件逻辑应用于该列:应用“first”或“sum”。

pandas
  • 1 个回答
  • 38 Views
Martin Hope
Stan
Asked: 2024-04-14 08:10:23 +0000 UTC

使用 interpolate() 和 Mean() 函数消除 NaN 变量的问题

  • 5

通常,在执行任何数据分析任务之前,您需要验证数据。有必要防止数据集中缺少数值。为此,我使用求平均值和插值的函数。但在每种情况下我都会遇到一个问题。
当data1.mean(axis=1)我收到 TypeError: unsupported operand type(s) for +: 'int' and 'str' 时。
当data1.interpolate(method ='linear', axis = 1)我收到 TypeError: Cannot interpolate with all object-dtype columns in the DataFrame 时。尝试将至少一列设置为数字数据类型。

我尝试了不同的选项来纠正这种情况,例如,我使用 to_numeric 函数将 str 值转换为 int,但这种方式出现了越来越多的问题(神奇地出现了更多 NaN 值)。与 相同astype(int)。

数据集。这里NaN值为“-”。
在此输入图像描述

你如何解决这个问题?

pandas
  • 1 个回答
  • 32 Views
Martin Hope
ProstoAndrey
Asked: 2024-04-04 22:18:48 +0000 UTC

使用另一列中的子字符串值填充数据帧列中的缺失值

  • 5

这是我第三天一直在尝试解决一个非常基本的问题 - 用另一列中的子字符串的值填充数据帧列中的缺失值。字符串字段。我阅读了很多文档和示例。最后我想出了这个:

def podstroka(y):
    return 'J' + y[14:]
df_FileOne['US'] = df_FileOne['US'].apply(lambda x: podstroka(df_FileOne['Debet'].astype(str)) if df_FileOne[df_FileOne['US'].isnull()] else df_FileOne['US'])

但这不起作用。ValueError:DataFrame 的真值不明确。求助,这里的专家只有时间敲一行代码来解决问题。 数据框

pandas
  • 1 个回答
  • 18 Views
Martin Hope
ANTON CHE
Asked: 2024-04-04 21:19:01 +0000 UTC

如何在.png和.xlsx文件的名称中写入变量名称?

  • 5

有一个包含 2 个变量的函数。这些变量是大表中的列。

def regr(x, y):
   x = acc[x] 
   y = acc[y]
   sns.regplot(x, y, line_kws=dict(color="r"))    
   plt.savefig('plot_' + ... + '.png')

   accc = pd.merge(x, y, left_index= True, right_index = True)
   accc.to_excel('table' + ... + '.xlsx') 

x 和 y 是从 1 到 2023 的数字。

  1. 如何调用 regr(x,y) 显示名为“plot_x_y.png”的图片?
  2. 通过 pd.to_excel 显示表格时,是否可以以类似的方式将变量名称写入文件名的一部分?
pandas
  • 3 个回答
  • 24 Views

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5