RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1404343
Accepted
denisnumb
denisnumb
Asked:2022-06-27 21:20:09 +0000 UTC2022-06-27 21:20:09 +0000 UTC 2022-06-27 21:20:09 +0000 UTC

C#:如何从谷歌翻译响应中提取长文本的翻译?

  • 772

有一种方法是通过谷歌翻译不使用 翻译文本API v2,即通过通常的WebClient。

该方法接受参数text- 源文本和to- 文本需要翻译成的语言。源文本的语言设置为"auto",即应自动确定。

public static string Translate(string text, string to)
{
   var url = $"https://translate.googleapis.com/translate_a/single?client=gtx&sl=auto&tl={to}&dt=t&q={HttpUtility.UrlEncode(text)}";
   var webClient = new WebClient { Encoding = Encoding.UTF8 };
   var result = webClient.DownloadString(url);
   try
   {
       result = result.Substring(4, result.IndexOf("\"", 4, StringComparison.Ordinal) - 4);
       return result;
   }
   catch (Exception e)
   {
       Console.WriteLine($"Transalte Error: {e.Message}");
       return null;
   }
}

问题:

使用几个单词的简单文本,一切正常,但如果您指定多行(带有 content \n)或句子的文本,该方法仅返回第一句的翻译。

原因:

这是因为谷歌翻译\n不是在一行中返回单个句子(或字符串 ( ))的翻译,而是在几行中返回。

例如,当使用此类输入数据调用方法时

string text = @"Нижняя сторона крыльев менее яркая, но более пёстрая. Она коричневато-бурая, с разнообразными красноватыми и белыми пятнами и серыми разводами. Снизу на передних крыльях повторяется рисунок верхней стороны, который дополняется голубыми кольцами в центральной ячейке. Нижняя сторона задних крыльев коричневатая, с замысловатым мраморовидным рисунком, образованным за счет тёмных штрихов и извилистых линий. Также у переднего края заднего крыла находится светлое пятно";
Translate(text, "en");

该方法只会返回第一句

"The underside of the wings is less bright, but more variegated. "

结果将是这样的:

[[["The underside of the wings is less bright, but more variegated. ","Нижняя сторона крыльев менее яркая, но более пёстрая.",null,null,3,null,null,[[]],[[["d79f3353813f458ef00a8442f9b7b2b6","ru_en_2022q1.md"]]]],["It is brownish-brown, with a variety of reddish and white spots and gray stains. ","Она коричневато-бурая, с разнообразными красноватыми и белыми пятнами и серыми разводами.",null,null,3,null,null,[[]],[[["d79f3353813f458ef00a8442f9b7b2b6","ru_en_2022q1.md"]]]],["From below on the forewings, the pattern of the upper side is repeated, which is complemented by blue rings in the central cell. ","Снизу на передних крыльях повторяется рисунок верхней стороны, который дополняется голубыми кольцами в центральной ячейке.",null,null,3,null,null,[[]],[[["d79f3353813f458ef00a8442f9b7b2b6","ru_en_2022q1.md"]]]],["The underside of the hindwings is brownish, with an intricate marble-like pattern formed by dark strokes and sinuous lines. ","Нижняя сторона задних крыльев коричневатая, с замысловатым мраморовидным рисунком, образованным за счет тёмных штрихов и извилистых линий.",null,null,3,null,null,[[]],[[["d79f3353813f458ef00a8442f9b7b2b6","ru_en_2022q1.md"]]]],["There is also a light spot at the anterior edge of the hind wing.","Также у переднего края заднего крыла находится светлое пятно",null,null,3,null,null,[[]],[[["d79f3353813f458ef00a8442f9b7b2b6","ru_en_2022q1.md"]]]]],null,"ru",null,null,null,1,[],[["ru"],null,[1],["ru"]]]

而文本来自一个句子,该方法将正确返回,因为只有一个句子。

解决方案尝试:

\n我尝试用->\\n和\r->替换换行符和回车符\\r,然后在结果文本中返回它们并且它有效,但在我看来这不是正确的解决方案。而且,带点的文本(来自几个句子)仍然作为一个句子返回,这样替换点是不正确的。

在这个对象中,可以像列表一样Python简单地遍历它并获取必要的数据,但是由于强类型,我什至不知道如何反序列化这个对象。forC#

也许还有另一种方式?

c#
  • 1 1 个回答
  • 75 Views

1 个回答

  • Voted
  1. Best Answer
    denisnumb
    2022-06-28T01:37:22Z2022-06-28T01:37:22Z

    感谢@EvgeniyZ这个解决方案:

    由于使用来自 的标准方法反序列化来自 Google 翻译的 JSON 响应是有问题的System.Json.Text,因此解决方案是通过以下方式的转换器Newtonsoft.Json:

    // здесь result - это полный ответ от Google Translate
    var json = Newtonsoft.Json.JsonConvert.DeserializeObject<object[][][]>(result, new Newtonsoft.Json.JsonSerializerSettings
    {
      Error = (_, e) => { e.ErrorContext.Handled = true; }
    });
    
    // здесь берем элемент с индексом 1, то есть строку с переведенным текстом
    // а затем выполняем вход отдельных предложений в строку через пробел
    // с заменой `\n ` на `\n`, чтобы текст в новой строке не начинался с пробела
    result = string.Join(" ", json[0].SelectMany(x => x.Skip(0)?.Take(1)).Cast<string>()).Replace("\\n", "\n").Replace("\n ", "\n");
    
    • 0

相关问题

  • 使用嵌套类导出 xml 文件

  • 分层数据模板 [WPF]

  • 如何在 WPF 中为 ListView 手动创建列?

  • 在 2D 空间中,Collider 2D 挂在玩家身上,它对敌人的重量相同,我需要它这样当它们碰撞时,它们不会飞向不同的方向。统一

  • 如何在 c# 中使用 python 神经网络来创建语音合成?

  • 如何知道类中的方法是否属于接口?

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5