究竟是什么标识了网站访问者？

Question

Artur Panteleev

Asked:2020-08-16 04:46:18 +0000 UTC2020-08-16 04:46:18 +0000 UTC 2020-08-16 04:46:18 +0000 UTC

在弱机上解析巨大日志文件的最有效方法是什么？

772

有一个 1gb 内存的服务器。在 70gb 上有一个日志文件 nginx（任何其他 Web 服务器）。考虑到所描述的资源限制，如何尽快收集站点用户的用户代理的统计信息。

2 个回答

Voted

Mikhail Vaysman · Answer 1 · 2020-08-16T05:10:52Z

Mikhail Vaysman

2020-08-16T05:10:52Z2020-08-16T05:10:52Z

您逐行读取文件并分析读取的术语。在几乎所有语言中，您都可以在处理文件系统时指定缓冲区大小，因此，尽管您逐行处理文件，系统仍会以固定块的形式读取文件。

5

Senior Pomidor · Answer 2 · 2020-08-16T05:47:07Z

Best Answer

Senior Pomidor

2020-08-16T05:47:07Z2020-08-16T05:47:07Z

您可以使用 Java 中的 StringTokenizer，它允许您逐行读取文件，而不会浪费内存存储文件的所有行。

StringTokenizer tok = new StringTokenizer("/path/to/file");
while (tok.hasMoreTokens()) {
    String line = tok.nextToken();
    // работаешь со строкой.
}

也可以在构造函数中指定分隔符，默认为\t\n\r\f

3

在弱机上解析巨大日志文件的最有效方法是什么？

Python 3.6 - 安装 MySQL (Windows)

C++ 编写程序“计算单个岛屿”。填充一个二维数组 12x12 0 和 1

返回指针的函数

我使用 django 管理面板添加图像，但它没有显示

这些条目是什么意思，它们的完整等效项是什么样的

浏览器仍然缓存文件数据

在 Excel VBA 中激活工作表的问题

为什么内置类型中包含复数而小数不包含？

获得唯一途径

告诉我一个像幻灯片一样创建滚动的库

在弱机上解析巨大日志文件的最有效方法是什么？

2 个回答

相关问题