是否可以以某种方式自定义 QTabWidget？

Question

Евграф Котовский

Asked:2025-02-10 08:41:18 +0000 UTC2025-02-10 08:41:18 +0000 UTC 2025-02-10 08:41:18 +0000 UTC

为什么解析 XML（FB2）时字符串值为空

772

晚安。我编写了这个类来解析 XML：

from xml.dom.minidom import parse
from xml.dom import minidom

class Book(object):

    def __init__(self, filename):
        self.filename = filename

    def parse(self):
        with open(self.filename, "r", encoding="UTF-8") as document:
            document = parse(document)
            print(document.version, document.encoding, document.standalone)
            paragraphs = document.getElementsByTagName("section")
            for paragraph in paragraphs:
                text_nodes = [
                    node.nodeValue for node in paragraph.childNodes
                    if node.nodeType == minidom.Node.TEXT_NODE
                ]
                text = "".join(text_nodes)
            return text

当我输出结果时，有一个空行。 fb2文件本身是正确的，可以用程序打开。但它对我不起作用。这是为什么？

2 个回答

Voted

Alex Titov · Answer 1 · 2025-02-10T17:49:08Z

Best Answer

Alex Titov

2025-02-10T17:49:08Z2025-02-10T17:49:08Z

这就是内部循环的工作原理。首先，你只能得到解析最后一个section元素的结果（即文本没有被“累积”）；其次，你需要再“更深”一层去提取文本。

        text = ""
        for paragraph in paragraphs:
            text_nodes = [
                node.childNodes[0].nodeValue for node in paragraph.childNodes
                if node.nodeName == 'p' and node.childNodes[0].nodeValue
            ]
            text += "".join(text_nodes)
        return text

附注：您不应将部分元素的搜索结果称为段落:)

2

CrazyElf · Answer 2 · 2025-02-10T17:47:18Z

CrazyElf

2025-02-10T17:47:18Z2025-02-10T17:47:18Z

在您的代码中，事实证明在text_nodes然后在只有最后一段的text内容最终出现，因为这些变量在循环的每次迭代中都被重新分配。如果要查看所有段落的内容，则需要将所有段落收集到列表中，而不仅仅是最后一个段落，并在循环结束后将其转换为：text_nodestext

            text_nodes = [] 
            for paragraph in paragraphs:
                text_nodes.extend([
                    node.nodeValue for node in paragraph.childNodes
                    if node.nodeType == minidom.Node.TEXT_NODE
                ])
            text = "".join(text_nodes)
            return text

1

为什么解析 XML（FB2）时字符串值为空

我看不懂措辞

请求的模块“del”不提供名为“default”的导出

"!+tab" 在 HTML 的 vs 代码中不起作用

我正在尝试解决“猜词”的问题。Python

可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件？

Python解析野莓

问题：“警告：检查最新版本的 pip 时出错。”

帮助编写一个用值填充变量的循环。解决这个问题

尽管依赖数组为空，但在渲染上调用了 2 次 useEffect

数据不通过 Telegram.WebApp.sendData 发送

为什么解析 XML（FB2）时字符串值为空

2 个回答

相关问题