是否可以以某种方式自定义 QTabWidget？

Question

Will Ronson

Asked:2024-11-07 17:32:44 +0000 UTC2024-11-07 17:32:44 +0000 UTC 2024-11-07 17:32:44 +0000 UTC

识别文字中的日期

772

我需要使用 ner 系统（当前使用 natasha）提供单词中的日期识别。

也就是说，有一个日期文本“2001 年 2 月 28 日”，您需要提取该日期。这怎么能做到呢？

未给出所需结果的示例（代码块未找到数据）：

matches = dates_extractor(doc.text)
v_dt_cnt = 0
for val in matches:
    obj_t = val.fact
    print(' Date', v_dt_cnt)

更新：您可以运行的示例代码

from natasha import (
    MorphVocab,
    DatesExtractor
)

morph_vocab = MorphVocab()
dates_extractor = DatesExtractor(morph_vocab)
for text in ("28 февраля 2001 года",
             "двадцать восьмое февраля 2001", 
             "28 февраля две тысячи первого года", 
             "двадцать восьмое февраля две тысячи первого года"):
    print(text)
    for date in dates_extractor(text):
        print(date)
    print('---')

结论：

28 февраля 2001 года
Match(start=0, stop=20, fact=Date(year=2001, month=2, day=28))
---
двадцать восьмое февраля 2001
Match(start=17, stop=29, fact=Date(year=2001, month=2, day=None))
---
28 февраля две тысячи первого года
Match(start=0, stop=10, fact=Date(year=None, month=2, day=28))
---
двадцать восьмое февраля две тысячи первого года
---

1 个回答

Voted

Алексей Сундеев · Answer 1 · 2024-11-07T19:25:59Z

from natasha import MorphVocab, DatesExtractor
from word2number import w2n
import re

# Функция для замены чисел прописью на числовые значения
def replace_words_with_numbers(text):
    words = text.split()
    for i, word in enumerate(words):
        try:
            # Преобразуем число прописью в числовое значение
            words[i] = str(w2n.word_to_num(word))
        except ValueError:
            # Если слово не число, просто оставляем его как есть
            pass
    return " ".join(words)

morph_vocab = MorphVocab()
dates_extractor = DatesExtractor(morph_vocab)

for text in ("28 февраля 2001 года",
             "двадцать восьмое февраля 2001", 
             "28 февраля две тысячи первого года", 
             "двадцать восьмое февраля две тысячи первого года"):
    
    # Преобразуем текст с числами прописью в числовые значения
    text_with_numbers = replace_words_with_numbers(text)
    
    print(f"Исходный текст: {text}")
    print(f"Текст с числовыми значениями: {text_with_numbers}")
    
    for date in dates_extractor(text_with_numbers):
        print(date)
    print('---')

该函数replace_words_with_numbers()将用文字书写的数字替换为其等价的数字：

Исходный текст: 28 февраля 2001 года
Текст с числовыми значениями: 28 февраля 2001 года
Match(start=0, stop=20, fact=Date(year=2001, month=2, day=28))
---
Исходный текст: двадцать восьмое февраля 2001
Текст с числовыми значениями: 28 февраля 2001
Match(start=0, stop=20, fact=Date(year=2001, month=2, day=28))
---
Исходный текст: 28 февраля две тысячи первого года
Текст с числовыми значениями: 28 февраля 2001 года
Match(start=0, stop=20, fact=Date(year=2001, month=2, day=28))
---
Исходный текст: двадцать восьмое февраля две тысячи первого года
Текст с числовыми значениями: 28 февраля 2001 года
Match(start=0, stop=20, fact=Date(year=2001, month=2, day=28))
---

识别文字中的日期

我看不懂措辞

请求的模块“del”不提供名为“default”的导出

"!+tab" 在 HTML 的 vs 代码中不起作用

我正在尝试解决“猜词”的问题。Python

可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件？

Python解析野莓

问题：“警告：检查最新版本的 pip 时出错。”

帮助编写一个用值填充变量的循环。解决这个问题

尽管依赖数组为空，但在渲染上调用了 2 次 useEffect

数据不通过 Telegram.WebApp.sendData 发送

识别文字中的日期

1 个回答

相关问题