RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 639452
Accepted
Monk
Monk
Asked:2020-03-14 23:40:55 +0000 UTC2020-03-14 23:40:55 +0000 UTC 2020-03-14 23:40:55 +0000 UTC

考虑到网络和磁盘,如何正确编写文件上传?

  • 772

有一段代码只是用来Parallel.ForEach以某种方式并行化下载,它看起来像这样:

Parallel.ForEach(books)
-Parallel.ForEach(chapters)
--Download(page)
--Save(page)

那些。可以在每个顶级元素上并行启动任意数量的下载,所有内容都在狭窄的通道上下垂,并且您经常会超时。当下载同时开始也几乎同时结束并尝试并行写入磁盘时,情况会更糟。

现在我有一个主要问题 - 如果你这样做更好:

var tasks = books
.SelectMany(b => b.Chapters)
.SelectMany(c => c.Pages)
.Select(p => Task.Run(() => p.Download(); p.Save())
tasks.WaitAll();

在哪种情况下网络和磁盘上的负载将是最佳的?网络还是比较关键的,因为超时不得不重复下载操作。

更新:我通过任务做了一个变体——最多 200 页可以轻松地同时下载 30 次。同时,一半以上处于Blocking状态,下载完成。活动任务的数量仍然没有自动限制,或者什么?最好的方法是什么?

UPDATE2:下载代码:

internal static ImageFile DownloadFile(Uri uri)
{
  byte[] result;
  WebResponse response;
  var file = new ImageFile();
  var request = WebRequest.Create(uri);

  try
  {
    response = request.GetResponse();
    using (var ms = new MemoryStream())
    {
      response.GetResponseStream().CopyTo(ms);
      result = ms.ToArray();
    }
  }
  catch (System.Exception ex)
  {
    Log.Exception(ex, string.Format("Загрузка {0} не завершена.", uri));
    return file;
  }
  if (response.ContentLength == result.LongLength)
    file.Body = result;
  return file;
}

有被阻止的任务挂起,还有一些从下面工作的任务: 在此处输入图像描述

被阻止的有这个堆栈: 在此处输入图像描述

c#
  • 1 1 个回答
  • 10 Views

1 个回答

  • Voted
  1. Best Answer
    Monk
    2020-03-16T18:31:37Z2020-03-16T18:31:37Z

    据我了解,本质如下。

    下载文件并写入磁盘,异步启动,“释放”CPU 线程,这意味着可以从任务池中启动另一个任务。

    鉴于我在那里有相同类型的任务,几乎同时开始下载任意数量的链接,然后它们等待空闲线程写入接收到的字节。只有真正的网络不是为这种情况设计的(比如硬盘),这意味着在最坏的情况下,请求会将用户的通道划分为非常微薄的吞吐速度,并且不会让你下载大部分。

    显然,我将不得不手动管理它,限制网络任务的最大数量(我仍然需要想出或找到一种方法来正确计算限制)和与硬盘一起工作的任务(在这里我只是不了解多次异步写入磁盘是否有任何意义)。

    UPD:用信号量解决,代码最少,收益最大:

     protected static SemaphoreSlim Throttler = new SemaphoreSlim(25); 
    

    嗯,抽象地说,下载是这样的:

     await Throttler.WaitAsync(); 
     var file = await ImageFile.DownloadFile(this.ImageLink); 
     Throttler.Release(); 
    

    UPD2:事实上,很难找到适用于任何通道宽度的通用图形。200稳定工作,结果在25-30也稳定工作。所以,最后我把它减到了25,万一有什么事更容易打断进程。

    • 1

相关问题

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    Python 3.6 - 安装 MySQL (Windows)

    • 1 个回答
  • Marko Smith

    C++ 编写程序“计算单个岛屿”。填充一个二维数组 12x12 0 和 1

    • 2 个回答
  • Marko Smith

    返回指针的函数

    • 1 个回答
  • Marko Smith

    我使用 django 管理面板添加图像,但它没有显示

    • 1 个回答
  • Marko Smith

    这些条目是什么意思,它们的完整等效项是什么样的

    • 2 个回答
  • Marko Smith

    浏览器仍然缓存文件数据

    • 1 个回答
  • Marko Smith

    在 Excel VBA 中激活工作表的问题

    • 3 个回答
  • Marko Smith

    为什么内置类型中包含复数而小数不包含?

    • 2 个回答
  • Marko Smith

    获得唯一途径

    • 3 个回答
  • Marko Smith

    告诉我一个像幻灯片一样创建滚动的库

    • 1 个回答
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Алексей Шиманский 如何以及通过什么方式来查找 Javascript 代码中的错误? 2020-08-03 00:21:37 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    user207618 Codegolf——组合选择算法的实现 2020-10-23 18:46:29 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5