RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 1407361
Accepted
ардуино IDE
ардуино IDE
Asked:2022-07-07 13:15:51 +0000 UTC2022-07-07 13:15:51 +0000 UTC 2022-07-07 13:15:51 +0000 UTC

用python判断一个句子中的大小写

  • 772

你好亲爱的程序员,我知道这听起来很奇怪,但我需要在一个句子(俄语)中确定大小写。

例如:他有问题 - 主格。问题的相关性 - 属格。他对这个问题不满意 - 与格

我尝试了带有变格和单词描述的网站https://ru.wiktionary.org/

更新:denisnumb,您可以通过某种方式将句子中的名词替换为其同义词,从而保留大小写。在我的示例中,我们找到一个同义词并根据您的示例替换它。

我只写了一个解析器,它确定单词的同义词并逐个变化单词:

import requests
from bs4 import BeautifulSoup

s = "проблемы".lower()

word_s = requests.get("https://ru.wiktionary.org/w/index.php", {"search": s})


word = BeautifulSoup(word_s.text, 'lxml')
quote = word.find('span', class_="mw-headline", id="Синонимы")
print(quote.next.next.next.text)
print(quote.next.next.next.a.get("href"))
quote1 = word.find('table', class_="morfotable ru")
cases = quote1.tbody.find_all("tr")
case_l = []
for case in cases:
    _ = []
    for i in case.find_all("td"):
        a = i.text.replace("́", "").replace("\n", "")  # Здесь убирается ударение, символ ударения сюда не скопировался.
        _.append(a)
        if a == s:
            print(_[0], a)
    case_l.append(_)
print(case_l)
python requests
  • 1 1 个回答
  • 90 Views

1 个回答

  • Voted
  1. Best Answer
    denisnumb
    2022-07-07T13:45:54Z2022-07-07T13:45:54Z

    尝试pymorphy2:

    pip install pymorphy2
    

    文档在这里


    假设有一段文本需要确定名词的格:

    text = 'Актуальность проблем, связанных с изучением значения конфликтов в жизни общества и управлением конфликтами, является на сегодняшний день очевидной и относимой к числу приоритетных.'
    

    让我们创建一个列表,以字典 ( dict) 的形式存储句子的各个单词,以及有关它们的大小写和词性的信息

    import pymorphy2
    
    morph = pymorphy2.MorphAnalyzer()
    
    text = 'Актуальность проблем, связанных с изучением значения конфликтов в жизни общества и управлением конфликтами, является на сегодняшний день очевидной и относимой к числу приоритетных.'
    
    text_words = []
                # здесь мы создаем список отдельных слов предложения и убираем лишние символы (знаки препинания), оставляя только буквы
    for word in [''.join([letter for letter in word if letter.isalpha()]) for word in text.split()]:
        word_info = morph.parse(word)[0]
        text_words.append(
            {
                'word': word,
                'case': word_info.tag.case,
                'POS': word_info.tag.POS
            })
    

    现在让我们得到结果

    for word in text_words:
        print(word)
    

    结论:

    {'word': 'Актуальность', 'case': 'accs', 'POS': 'NOUN'}
    {'word': 'проблем', 'case': 'gent', 'POS': 'NOUN'}
    {'word': 'связанных', 'case': 'gent', 'POS': 'ADJF'}
    {'word': 'с', 'case': None, 'POS': 'PREP'}
    {'word': 'изучением', 'case': 'ablt', 'POS': 'NOUN'}
    {'word': 'значения', 'case': 'gent', 'POS': 'NOUN'}
    {'word': 'конфликтов', 'case': 'gent', 'POS': 'NOUN'}
    {'word': 'в', 'case': None, 'POS': 'PREP'}
    {'word': 'жизни', 'case': 'gent', 'POS': 'NOUN'}
    {'word': 'общества', 'case': 'gent', 'POS': 'NOUN'}
    {'word': 'и', 'case': None, 'POS': 'CONJ'}
    {'word': 'управлением', 'case': 'ablt', 'POS': 'NOUN'}
    {'word': 'конфликтами', 'case': 'ablt', 'POS': 'NOUN'}
    {'word': 'является', 'case': None, 'POS': 'VERB'}
    {'word': 'на', 'case': None, 'POS': 'PREP'}
    {'word': 'сегодняшний', 'case': 'accs', 'POS': 'ADJF'}
    {'word': 'день', 'case': 'accs', 'POS': 'NOUN'}
    {'word': 'очевидной', 'case': 'ablt', 'POS': 'ADJF'}
    {'word': 'и', 'case': None, 'POS': 'CONJ'}
    {'word': 'относимой', 'case': 'gent', 'POS': 'PRTF'}
    {'word': 'к', 'case': None, 'POS': 'PREP'}
    {'word': 'числу', 'case': 'datv', 'POS': 'NOUN'}
    {'word': 'приоритетных', 'case': 'gent', 'POS': 'ADJF'}
    

    从文档中提供的表格中,我们查看案例 (case)和词性 (POS - Part of speech) 的名称。例如,NOUN-名词,gent-属格


    此外,使用您的方法,我们获取必要单词的同义词(您已经知道每个单词的词性和大小写),并将文本中的指定单词替换为新单词

    text = text.replace(old_word, new_word)
    

    如果同义词不在原始单词的情况下,则可以通过同一个库将其放入所需的情况下:

    # ставим слово "изучение" в родительный падеж (gent)
    morph.parse('изучение')[0].inflect({'gent'}).word
    

    结论:

    изучения
    
    • 4

相关问题

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5