2020年新年大赛！

Question

Optimus1

Asked:2022-07-02 01:26:59 +0800 CST2022-07-02 01:26:59 +0800 CST 2022-07-02 01:26:59 +0800 CST

SIMD指令加载到寄存器中[关闭]

772

我试图至少在最原始的层面上理解如何使用 SIMD。我发现这篇文章：https ://woboq.com/blog/utf-8-processing-using-simd.html

有一个简单的代码和解释，但我想不通：

int fromUtf8(const char *src, int len, unsigned short *dst) 
{

//Мы будем обрабатывать ввод по 16 байт за раз, поэтому длина должна быть не менее 16.

    while(len >= 16) 
    {
 
    //Загрузить 128 бит в векторный регистр. Мы используем встроенный 'loadu', где «u» означает не выровненный. Загрузка выровненных данных намного быстрее, но здесь мы не знаем, выровнен ли источник.

        __m128i chunk = _mm_loadu_si128(reinterpret_cast<const __m128i*>(src));
 

//Определить, является ли это ASCII, проверив, установлен ли старший бит одного байта:

        if (!_mm_movemask_epi8(chunk)) 
        {
              //....
        }

}

在这段代码中，我无法理解 - auto 文章写道，fromUtf8 函数需要一个指向 char * 的指针，其中有 16 位或 2 个字节。

但是现在文章 auto 使用了 _mm_loadu_si128 SIMD 函数，它将 128 位或 16 字节加载到寄存器中 - 根据指定的 src 源，但 src 只有 2 个字节长。

有可能这样做吗？_mm_loadu_si128 不会将垃圾加载到寄存器中，这将在 src 源中的 2 个字节之后？

1 个回答

Voted

AR Hovsepyan · Answer 1 · 2022-07-02T02:29:25+08:00

Best Answer

AR Hovsepyan

2022-07-02T02:29:25+08:002022-07-02T02:29:25+08:00

这篇文章我没看过，但是这里很清楚：

有一个指向字符数组（源）的指针，它根本不是 16 位。
此外，这个名字 __m128i chunk直接暗示了内置的意图 loadu：它处理一个 128 位的字符串片段（每个 16 个 UTF-8 字符），因此reinterpret_cast<const __m128i*>(src).
为了让它在源中，它在循环中执行 while(len >= 16)，因此 _mm_loadu_si128 不会将垃圾加载到寄存器中。
但是，你从哪里得到src整个字节的长度，我不知道......

1

SIMD指令加载到寄存器中[关闭]

我看不懂措辞

请求的模块“del”不提供名为“default”的导出

"!+tab" 在 HTML 的 vs 代码中不起作用

我正在尝试解决“猜词”的问题。Python

可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件？

Python解析野莓

问题：“警告：检查最新版本的 pip 时出错。”

帮助编写一个用值填充变量的循环。解决这个问题

尽管依赖数组为空，但在渲染上调用了 2 次 useEffect

数据不通过 Telegram.WebApp.sendData 发送

SIMD指令加载到寄存器中[关闭]

1 个回答

相关问题