RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1608105
Accepted
KLYSTRON
KLYSTRON
Asked:2025-03-04 21:37:03 +0000 UTC2025-03-04 21:37:03 +0000 UTC 2025-03-04 21:37:03 +0000 UTC

二维数组中的搜索算法

  • 772

需要编写某种分析仪来计算患者的生存率。简单来说,它的运行算法如下: 在此处输入图片描述

将医生计算出的某个值 VAL [ 1 ] 与二维数组中的值 [ 2 ] 进行比较。比较只应与第一列的数据进行比较。

VAL 的值可能与数组中的某个值完全匹配,也可能与数组中的任何值都不匹配,但非常接近其中一个;超出数组中的值的范围。

如果 VAL 值与数组中的某个值完全匹配,那么算法应该向医生打印第 [ 3 ] 行中的下一个值(例如如图所示,VAL = 11 ,算法将打印第 - 280 行中的下一个值)。

至此我已经写出了[ 2 ]阶段的简化模型。下面的代码:

import numpy as np

a = np.array([
    [1, 244], [2, 211], [3, 466], [4, 698], [5, 899], [6, 109], [7, 129], [8, 140], 
[9, 168], [10, 188], [11, 280], [12, 282], [13, 245], [14, 256], [15, 258], 
[16, 305], [17, 352], [18, 345], [19, 365], [20, 348], [21, 440],[22, 424], 
[23, 444], [24, 446], [25, 477], [26, 479], [27, 571], [28, 573], [29, 557], 
[30, 577]
    ], int)

val = 11

if val in a:
    print('СОВПАТЕНИЕ ЕСТЬ!')
    idx = np.where(a == val)
    row = idx[0][0]
    print(f'Связанное значение: {a[row][1]}')
else:
    print('СОВПАДЕНИЙ НЕТ!')
    nearest_val = a.flat[np.abs(a - val).argmin()]
    print(f'Ближайшее значение: {nearest_val}')
    idx = np.where(a == nearest_val)
    row = idx[0][0]
    print(f'Связанное значение: {a[row][1]}')

该模型适用于两种情况:当 VAL 值与数组中的某个值完全匹配时,以及当没有精确的值,但有一个接近它的值时。第三个还没写。模型中使用的数组很小,只有 30 个值,而在成熟计算器中将使用的数组每列包含超过 5000 个值,并且在我看来,在这种情况下使用 Numpy 工具包是合乎逻辑的。

我想听听在这些问题上更有经验的同事的意见:

  1. 其逻辑实现得有多合理?从经验丰富的程序员的角度来看,是否存在更胜任的选择?

  2. 该算法一次搜索数组中的所有值,但如何将搜索限制在仅一列呢?

  3. 在模型中数组很小,但在计算器完整版本中将使用的数组每列包含超过 5000 个值。组织这种数组的最佳方法是什么?使其成为外部文件?或者将所有值移入代码本身?

  4. 我怎样才能以某种方式提取位于数组中的变量的索引值并将它们用作常规 int 值?在模型中我使用以下方法实现了这一点:

idx = np.where(a == val)
row = idx[0][0]

这是精确匹配。但我对这种方法的正确性表示严重怀疑。

补充:在研究strawdog 的评论 的过程中,我设法整理出了以下版本的算法:

import numpy as np

a = np.array([
    [1, 244], [2, 211], [3, 466], [4, 698], [5, 899], [6, 109], [7, 129], [8, 140], 
[9, 168], [10, 188], [11, 280], [12, 282], [13, 245], [14, 256], [15, 258], 
[16, 305], [17, 352], [18, 345], [19, 365], [20, 348], [21, 440],[22, 424], 
[23, 444], [24, 446], [25, 477], [26, 479], [27, 571], [28, 573], [29, 557], 
[30, 577]
    ], int)

val = 2

row = a[np.abs(a[:,0] - val).argmin()]

if val in a[:,0]:
    print(f'СОВПАТЕНИЕ ЕСТЬ!\n'
          f'Связанное значение: {a[np.where(a == row)][1]}')
else:
    print(f'СОВПАДЕНИЙ НЕТ!\n'
          f'Ближайшее значение: {a[np.where(a == row)][0]}\n'
          f'Связанное значение: {a[np.where(a == row)][1]}')

反过来,它与Serge3leo提出的选项非常相似。因此,我暂时就到此为止,稍后我将通过添加处理VAL值超出数组范围的情况的场景来补充答案。非常感谢strawdog和Serge3leo帮助我解决问题!

python
  • 1 1 个回答
  • 61 Views

1 个回答

  • Voted
  1. Best Answer
    Serge3leo
    2025-03-05T00:47:44Z2025-03-05T00:47:44Z

    代码本身应该缩短一点:

    import numpy as np
    
    a = np.array([
            [1, 244], [2, 211], [3, 466], [4, 698], [5, 899], [6, 109], [7, 129], [8, 140], 
            [9, 168], [10, 188], [11, 280], [12, 282], [13, 245], [14, 256], [15, 258], 
            [16, 305], [17, 352], [18, 345], [19, 365], [20, 348], [21, 440],[22, 424], 
            [23, 444], [24, 446], [25, 477], [26, 479], [27, 571], [28, 573], [29, 557], 
            [30, 577]
            ], int,
            order='F')  # Т.к. массовые операции происходят по первому индексу, 
                        # лучше его упорядочить так. Как вариант, транспонировать массив.
    
    val = 11.1
    
    # В диапазоне нормализованых или целых чисел 0 == abs(a-b) <=> a == b
    nearest_idx = np.argmin(np.abs(a[:, 0] - val))  
    if val == a[nearest_idx, 0]: 
        print('СОВПАТЕНИЕ ЕСТЬ!')
    else:
        # assert(abs(val) < np.max(np.abs(a[:, 0]))/np.finfo(val).eps)
        # assert(abs(val) < np.max(np.abs(a[:, 0])) * 10**15)
        # TODO: При произвольном val, необходимо сравнивать с min/max.
        print('СОВПАДЕНИЙ НЕТ!')
        print(f'Ближайшее значение: {a[nearest_idx, 0]}')
    print(f'Связанное значение: {a[nearest_idx, 1]}')
    

    使其成为外部文件?或者将所有值移入代码本身?

    这取决于更改的顺序。例如,如果这些是校准,那么在代码中肯定不值得,在文件中肯定更好,但如果这些是全局常量,那么在代码中是可能的。

    在其他所有条件相同的情况下,归档是更好的选择,但这取决于复制程序/模块的预期过程。

    附言

    关于“文件/代码”问题的补充。严格来说,“代码”也分为两种:“代码”可以在自己的模块中,“代码”可以在单独的模块中并连接import。恕我直言,这个问题主要有两个方面:“如何分配?”以及“阵列如何变化?” (总会有错误修复和改进出现)。

    “如何分配?”:

    • 如果应用程序由单个文件“myapp.py”组成,那么直接在其中指定数组不会对应用程序的分发施加任何限制。你可以按照你喜欢的简单方式去做,甚至只是复制一个文件;
    • 将数组放在单独的模块中假定应用程序将由多个文件组成。使用的时候,pip/Hatch/Setuptools/PyInstaller/...这并不是不便,但如果没有它们,就不那么方便了;
    • 将阵列放在单独的数据文件中可以提供更大的灵活性,但需要一些思考和决策。

    “数组如何变化?”:

    • 如果数组是应用算法的组成部分(例如,原子量表、χ²分位数、GOST 或 ISO 的一些方法),即改变算法会导致改变数组,反之亦然,那么选项:“代码”在其自身或单独的模块中看起来更可取;
    • 如果数组是针对特定设备的校正,或者是针对患者群体的标准,即由于有可能(很可能)在不改变算法的情况下改变数组,因此单独数据文件中的选项似乎更可取(如果算法本身保持不变,为什么要编辑和创建文件的版本?)。

    可能存在中间选择。

    附言。

    每列包含超过 5000 个值

    这个较大的值并不会导致严重的功耗或速度减慢,但请注意:

    • 该表达式val in a[:,0]平均会引发2500次以上的比较;
    • 表达式np.where(a == row)为2500..5000(取决于实现)。
    • 1

相关问题

  • 是否可以以某种方式自定义 QTabWidget?

  • telebot.anihelper.ApiException 错误

  • Python。检查一个数字是否是 3 的幂。输出 无

  • 解析多个响应

  • 交换两个数组的元素,以便它们的新内容也反转

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5