RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1557252
Accepted
Михаил Ширшов
Михаил Ширшов
Asked:2023-12-14 21:40:41 +0000 UTC2023-12-14 21:40:41 +0000 UTC 2023-12-14 21:40:41 +0000 UTC

不输出 xml 中的所有元素

  • 772

我需要从 Rosreestr KPT 的 xml 中在一列中显示所有具有坐标的地籍编号,第二列和第三列是坐标本身(x 和 y)。接下来是代码:

from bs4 import BeautifulSoup
from pathlib import Path
import pandas as pd

def ordinates(ordinates):
    ordinate_list = []
    for x in ordinates:
        cad_number = [s.find('cad_number').text for s in x.find_all('common_data')
        # for ordinate in x.find_all('ordinate'):
        xx = [cad.text for cad in x.find_all('x')]
        yy = [cad.text for cad in x.find_all('y')]
        ordinate_list.extend([(d,f,a) for d,f,a in zip(cad_number,xx,yy)])
    
    return ordinate_list

for path in Path(file_path).rglob('*.XML'):
    with open(path, 'r', encoding='utf-8') as parse:
        xml = parse.read()
        soup = BeautifulSoup(xml, features="lxml")
        ordinate = ordinates(soup.find_all('base_data'))
        for k in ordinate:
            data = {'Кадастровый номер':k[0],
                    'Координаты по X': k[2],
                    'Координаты по Y': k[2]}

显示以下信息(1个地籍编号和1个x和y坐标,尽管这些坐标的地籍编号可能有,例如9个)。然后是以下版本的代码:

def ordinates(ordinates):
    ordinate_list = []
    value_list_1 = []
    for x in ordinates:
        cad_number = ([s.find('cad_number').text for s in x.find_all('common_data')])
        value_list = ([s.find('value').text for s in x.find_all('common_data')])
        value_list_1.extend([(v,b) for v,b in zip(cad_number,value_list)])
        for ordinate in x.find_all('ordinate'):
            xx = [cad.text for cad in ordinate.find_all('x')]
            yy = [cad.text for cad in ordinate.find_all('y')]
            ordinate_list.extend([(d,f) for d,f in zip(xx,yy)])
     
    return ordinate_list

for path in Path(file_path).rglob('*.XML'):
    with open(path, 'r', encoding='utf-8') as parse:
        xml = parse.read()
        soup = BeautifulSoup(xml, features="lxml")
        ordinate = ordinates(soup.find_all('base_data'))
        for k in ordinate:
            data = {'Кадастровый номер':k[0],
                    'Вид объекта':k[1]}

这里 def ordords 函数显示所有坐标(如果你输入 return itude_list)或所有地籍数字(如果你输入 return value_list_1),但是如何同时输出所有内容并将其写入:

data = {'Кадастровый номер':k[0],
        'Координаты по X': k[2],
        'Координаты по Y': k[2]}

链接到 xml 格式的 CBT

python
  • 2 2 个回答
  • 44 Views

2 个回答

  • Voted
  1. Armen Legran
    2023-12-15T00:02:18Z2023-12-15T00:02:18Z
    
    from bs4 import BeautifulSoup
    from pathlib import Path
    import pandas as pd
    
    def ordinates(ordinates):
        ordinate_list = []
        for x in ordinates:
            cad_number = [s.find('cad_number').text for s in x.find_all('common_data')]
            for ordinate in x.find_all('ordinate'):
                xx = [cad.text for cad in ordinate.find_all('x')]
                yy = [cad.text for cad in ordinate.find_all('y')]
                ordinate_list.extend([(d,f,a) for d,f,a in zip(cad_number,xx,yy)])
        return ordinate_list
    
    data_list = []
    for path in Path(file_path).rglob('*.XML'):
        with open(path, 'r', encoding='utf-8') as parse:
            xml = parse.read()
            soup = BeautifulSoup(xml, features="lxml")
            ordinate = ordinates(soup.find_all('base_data'))
            for k in ordinate:
                data = {'Кадастровый номер':k[0],
                        'Координаты по X': k[1],
                        'Координаты по Y': k[2]}
                data_list.append(data)
    
    df = pd.DataFrame(data_list)
    
    • 0
  2. Best Answer
    Михаил Ширшов
    2023-12-18T13:29:52Z2023-12-18T13:29:52Z

    我不得不仔细地再次重写它......结果是我想要的))这里是代码:

    for path in Path(file_path).rglob('*.XML'):
        with open(path, 'r',encoding='utf-8-sig') as parse: 
            xml = parse.read()
            soup = BeautifulSoup(xml, features="xml")
            child_ZY = soup.find_all('land_record')
            data_excel = []
            for value in child_ZY:
                if value.select_one('contours_location x') is not None:
                    cad_n = (value.select_one('common_data cad_number').text)
                    x = [cad.text for cad in value.find_all('x')]
                    y = [cad.text for cad in value.find_all('y')]
                    pairs = list(zip(x, y))
                    coords = [{"Кадастровый номер": cad_n, "Координаты x": pair[0], "Координаты y": pair[1]} for pair in pairs]
                    data_excel.extend(coords)
            df = pd.DataFrame(data_excel)
            columns = ["Кадастровый номер", "Координаты x", "Координаты y"]
            df = pd.DataFrame(data_excel, columns=columns)
            df.to_excel(excel_file, index=False)
    
    • 0

相关问题

  • 是否可以以某种方式自定义 QTabWidget?

  • telebot.anihelper.ApiException 错误

  • Python。检查一个数字是否是 3 的幂。输出 无

  • 解析多个响应

  • 交换两个数组的元素,以便它们的新内容也反转

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5