RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1448543
Accepted
Михаил Ширшов
Михаил Ширшов
Asked:2022-09-14 21:11:03 +0000 UTC2022-09-14 21:11:03 +0000 UTC 2022-09-14 21:11:03 +0000 UTC

请帮我弄清楚为什么信息被覆盖?

  • 772

有这个 XML:

<common_data>
    <type>
      <code>002001001000</code>
      <value>Земельный участок</value>
    </type>
    <cad_number>52:40:0902001:102</cad_number>
    <type>
      <code>002001001000</code>
      <value>ЗУ</value>
    </type>
    <cad_number>52:45:0502000:1001</cad_number>
</common_data>

需要按顺序上传到表 cad_number(列“KN”)和值(列“Type”):

          КН                Тип
0 52:40:0902001:102  Земельный участок
1 52:45:0502000:1001 ЗУ

这是我的代码:

from bs4 import BeautifulSoup
from pathlib import Path
import pandas as pd

file_path = r'C:\Users\shirshov\Desktop\11\1' # путь к xml файлам, откуда берутся данные
excel_file = r'C:\Users\shirshov\Desktop\11\1.xlsx' # Путь до excel файла, куда попадает информация из выписок


name_3 = []
name_2 = []
page_1 = pd.DataFrame(columns = [])

for path in Path(r'C:\Users\shirshov\Desktop\11\1').rglob('*.XML'):
    with open(path, 'r',encoding='utf-8') as parse: 
        xml = parse.read()
        soup = BeautifulSoup(xml, 'lxml')
        for right in soup.find_all('common_data'):
            for child_3 in right.findChildren(['type'], recursive = False):
                for child_inn in child_3.findChildren(['value'], recursive = False): 
                    for df in child_inn:
                        name_3.append(df.text)
                        

        for right_1 in soup.find_all('common_data'):
            for child_2 in right_1.findChildren(['cad_number'], recursive = False):
                    for dfgkj in child_2:
                        name_2.append(dfgkj.text)
                        

        
        for i, x in enumerate(name_2):
            fggg = '{b:6s}'.format(a=i+1,b=x)
        for i, x in enumerate(name_3):
            fggg_1 = '{b:6s}'.format(a=i+1,b=x)
            Cad_num_flat = {'КН':f'{fggg}',
                    'Тип':f'{fggg_1}',}
        
            page_1 = pd.concat([page_1, pd.DataFrame.from_records([Cad_num_flat])], ignore_index=True)
            print(page_1)


with pd.ExcelWriter(excel_file, engine='openpyxl', mode = 'w') as writer:
    page_1.to_excel(writer, sheet_name='Помещения',index=True)

出了什么问题,在哪里?请帮帮我。

python
  • 0 0 个回答
  • 0 Views

0 个回答

  • Voted
  1. Best Answer
    Михаил Ширшов
    2022-09-19T20:45:53Z2022-09-19T20:45:53Z

    结果是这样的

    from bs4 import BeautifulSoup
    from pathlib import Path
    import pandas as pd
    
    file_path = r'C:\Users\shirshov\Desktop\11\1' # путь к xml файлам, откуда берутся данные
    excel_file = r'C:\Users\shirshov\Desktop\11\1.xlsx' # Путь до excel файла, куда попадает информация из выписок
    
    
    name_3 = []
    name_2 = []
    page_1 = pd.DataFrame(columns = [])
    
    for path in Path(r'C:\Users\shirshov\Desktop\11\1').rglob('*.XML'):
        with open(path, 'r',encoding='utf-8') as parse: 
            xml = parse.read()
            soup = BeautifulSoup(xml, 'lxml')
            for right in soup.find_all('common_data'):
                for child_3 in right.findChildren(['type'], recursive = False):
                    for child_inn in child_3.findChildren(['value'], recursive = False): 
                        for df in child_inn:
                            name_3.append(df.text)
                            
    
            for right_1 in soup.find_all('common_data'):
                for child_2 in right_1.findChildren(['cad_number'], recursive = False):
                        for dfgkj in child_2:
                            name_2.append(dfgkj.text)
                            
            
            
            for f, n in zip(name_2,name_3):
                Cad_num_flat = {'КН':f'{f}',
                                'Тип':f'{n}',}
                page_1 = pd.concat([page_1, pd.DataFrame.from_records([Cad_num_flat])], ignore_index=True)
                print(f'КН:{f}')
                print(f'Тип:{n}')
    
    
    with pd.ExcelWriter(excel_file, engine='openpyxl', mode = 'w') as writer:
        page_1.to_excel(writer, sheet_name='Помещения',index=True)

    • 0

相关问题

  • 是否可以以某种方式自定义 QTabWidget?

  • telebot.anihelper.ApiException 错误

  • Python。检查一个数字是否是 3 的幂。输出 无

  • 解析多个响应

  • 交换两个数组的元素,以便它们的新内容也反转

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5