RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1473155
Accepted
Miha
Miha
Asked:2022-12-02 02:47:24 +0000 UTC2022-12-02 02:47:24 +0000 UTC 2022-12-02 02:47:24 +0000 UTC

迭代时间不断增长

  • 772

晚上好,亲爱的用户,
我需要你的帮助,我粗略地说,一个工作人员使用以下命令从文件中获取给定数据tail -n + x path/to/file | head -n50,但随着每次重复迭代,脚本的执行时间都会增加

代码示例:

$p = 'UploadFiles/million_test.txt';
$l = 0;
$i = 0;
$开始=微时间(真);
做 {
    $command = "tail -n+$l $p | head -n50";
    执行($命令,$数据);

    $计数 = 计数($数据);
    如果($count == 0){
        死;
    }
    $i++;
    $l += 500;

    如果 ($i % 100 == 0) {
        file_put_contents(
            '测试.txt',
            "$l [$count] =>" . 圆((微时间(真) - $开始),2)。
            PHP_EOL,
            文件附加
        );
        $开始=微时间(真);
    }
    取消设置($数据);
} while ($count > 0);

脚本执行数据

50000 [50] =>0.71 100000 [50] =>0.9 150000 [50] =>1.09 200000 [50] =>1.19 250000 [50] =>1.35 300000 [50] =>1.44 350000 [50] =>1.58 400000 [50] =>1.66 450000 [50] =>1.65

如您所见,经过几次迭代后,脚本执行时间增加了 2 倍。
也许有人知道我做错了什么?
或者至少提示要阅读的内容,我将不胜感激。

million_test.txt文件有大约 1200 万个条目。

php
  • 2 2 个回答
  • 34 Views

2 个回答

  • Voted
  1. newman
    2022-12-02T20:30:27Z2022-12-02T20:30:27Z

    一般来说,这都是可以理解的。最有可能的是,由于 tail 命令需要更长的时间,因此迭代时间会增加。那些。这里的问题不是您的代码,而是tail的工作方式。

    那些。当您“要求”提供文件的最后 500 行时,该命令会读取这 500 行并输出。当你请求接下来的 500 行时,命令读取 1000 行并输出它们,然后通过head你只需要其中的 500 行。

    在下一次迭代中, tail已经读取了 1500 行。等等。等等 越接近文件开头,需要读取和输出的行越多,命令耗时越长。

    在这个实现中没有什么可做的。目前还不完全清楚您要解决什么问题。但也许更理想和更快速的方法是使用 PHP 打开此文件并一次一行地读取它。并在必要时分成块。或者做点别的。

    • 1
  2. Best Answer
    Максим
    2022-12-02T21:32:17Z2022-12-02T21:32:17Z
    $command = "tail -n+$l $p | head -n50";
    exec($command, $data);
    

    该命令从文件中读取所有 (-n+$l) 行,然后获取其中的上半部分 (-n50) 这种方法本身非常慢。 file($p)对此好多了,下面是每1m行读取生成文件速度的对比测试

    весь файл прочитан функцией file($p) за 0.01сек 
    
    далее произведено чтение файла по частям при помощи exec("trail ....")
    Array
    (
        [50_5000] => 0.03
        [50_10000] => 0.03
        [50_15000] => 0.03
        [50_20000] => 0.03
        [50_25000] => 0.03
        [50_30000] => 0.03
        [50_35000] => 0.04
        [50_40000] => 0.04
        [50_45000] => 0.04
        [50_50000] => 0.04
        [50_55000] => 0.04
        [50_60000] => 0.04
        [50_65000] => 0.04
        [50_70000] => 0.04
        [50_75000] => 0.05
        [50_80000] => 0.05
        [50_85000] => 0.05
        [50_90000] => 0.05
        [50_95000] => 0.05
        [50_100000] => 0.05
    )
    
    • 1

相关问题

  • mysqli 类的对象无法转换为字符串

  • 您的系统中缺少 ext-http *,您的系统中缺少 ext-mysql_xdevapi *

  • 如何从csv中删除bom?

  • 当我按下 Enter 键时,如何让 PhpStorm 的 Emmet 插件触发,就像 VS Code 一样?

  • 注释在 Symfony5 中不起作用

  • 搜索最近的地理位置点

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5