Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

feat(route): add aijishu route 极术社区 #11967

Merged
merged 7 commits into from
Feb 27, 2023
Merged

Conversation

bigfei
Copy link
Contributor

@bigfei bigfei commented Feb 27, 2023

该 PR 相关 Issue / Involved issue

Close #11948

完整路由地址 / Example for the proposed route(s)

/aijishu/blog/armsoft
/aijishu/blog/readings
/aijishu/channel
/aijishu/channel/ai
/aijishu/u/bandaotitouzilia
/aijishu/u/chaoshenjingHype

新 RSS 检查列表 / New RSS Script Checklist

  • 新的路由 New Route
  • 文档说明 Documentation
    • 中文文档 CN
    • 英文文档 EN
  • 全文获取 fulltext
    • 使用缓存 Use Cache
  • 反爬/频率限制 anti-bot or rate limit?
    • 如果有, 是否有对应的措施? If yes, do your code reflect this sign?
  • 日期和时间 date and time
    • 可以解析 Parsed
    • 时区调整 Correct TimeZone
  • 添加了新的包 New package added
  • Puppeteer

说明 / Note

@github-actions github-actions bot added Route: v2 v2 route related Auto: Route Test Complete Auto route test has finished on given PR labels Feb 27, 2023
@github-actions
Copy link
Contributor

Successfully generated as following:

http://localhost:1200/aijishu/blog/armsoft - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[Arm服务器 - 极术社区]]></title>
        <link>https://aijishu.com//api/blog/1070000000002249/contents?page=1</link>
        <atom:link href="http://localhost:1200/aijishu/blog/armsoft" rel="self" type="application/rss+xml" />
        <description><![CDATA[Arm服务器 - 极术社区 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 15:15:27 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[StratoVirt 的 vCPU 拓扑(SMP)]]></title>
            <description><![CDATA[<p>CPU 拓扑用来表示 CPU 在硬件层面的组合方式,本文主要讲解 CPU 拓扑中的 SMP(Symmetric Multi-Processor,对称多处理器系统)架构,CPU 拓扑还包括其他信息,比如:cache 等,这些部分会在后面进行补充。CPU 拓扑除了描述 CPU 的组成关系外,还为内核的调度器提供服务,从而提供更好的性能。在 StratoVirt 中,支持 CPU 拓扑为后续的 CPU 热插拔开发打下一个基础。</p><p>常见的 CPU SMP 结构是:</p><pre><code>Socket --&gt; die --&gt; cluster --&gt; core --&gt; thread
</code></pre><ul><li>socket:对应主板上的 CPU 插槽</li><li>die:处理器在生产过程中,从晶圆上切割下来的一个个小方块,Die 之间的组件是通过片内总线互联的。</li><li>cluster:簇,大核或者小核的一种组合</li><li>core:表示独立的物理 CPU</li><li>thread:逻辑 CPU,英特尔超线程技术引入的新概念</li></ul><h2>CPU 拓扑的获取原理</h2><p>因为 x86 和 ARM 的拓扑获取方式不同,下面将会分开进行介绍。</p><h3>x86</h3><p>在 x86 架构下面,操作系统会通过读取 CPUID 来获取 CPU 拓扑结构。在 x86 体系结构中,CPUID 指令(由 CPUID 操作码标识)是处理器补充指令(其名称源自 CPU 标识),允许软件发现处理器的细节。程序可以使用 CPUID 来确定处理器类型。</p><p>CPUID 隐式使用 EAX 寄存器来确定返回的信息的主要类别,这被称为 CPUID 叶。跟 CPU 拓扑相关的 CPUID 叶分别是:0BH 和 1FH。1FH 是 0BH 的扩展,可以用来表示更多的层级。Intel 建议先检查 1FH 是否存在,如果 1FH 存在会优先使用它。当 EAX 的值被初始化为 0BH 的时候,CPUID 会在 EAX,EBX,ECX 和 EDX 寄存器中返回 core/logical 处理器拓扑信息。这个函数(EAX=0BH)要求 ECX 同时被初始化为一个 index,这个 index 表示的是在 core 层级还是 logical processor 层级。OS 调用这个函数是按 ECX=0,1,2..n 这个顺序调用的。返回处理器拓扑级别的顺序是特定的,因为每个级别报告一些累积数据,因此一些信息依赖于从先前级别检索到的信息。在 0BH 下,ECX 可以表示的层级有:SMT 和 Core,在 1FH 下,可以表示的层级有:SMT,Core,Module,Tile 和 Die。</p><p>下表是一个更详细的一个解释:</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMdP" alt="image.png" title="image.png"></p><p>来源: Intel 64 and IA-32 Architectures Software Developer's Manual</p><h3>ARM</h3><p>在 ARM 架构下,如果操作系统是依靠 Device Tree 启动的,则会通过 Device Tree 去获取 CPU 拓扑。如果是以 ACPI 的方式启动的话,操作系统会通过解析 ACPI 的 PPTT 表去获取 CPU 拓扑结构。</p><h3>ACPI——PPTT</h3><p>ACPI 是 Advanced Configuration and Power Interface (高级配置和电源接口)的缩写,ACPI 是一种与体系结构无关的电源管理和配置框架。这个框架建立了一个硬件寄存器集合来定义电源状态。ACPI 是操作系统和固件之间的一个中间层,是他们两者之间的一个接口。ACPI 定义了两种数据结构:data tables 和 definition blocks。data tables 用于存储给设备驱动使用的 raw data。definition blocks 由一些字节码组成,这些码可以被解释器执行。</p><p>为了使硬件供应商在选择其实施时具有灵活性,ACPI 使用表格来描述系统信息、功能和控制这些功能的方法。这些表列出了系统主板上的设备或无法使用其他硬件标准检测或电源管理的设备,以及 ACPI 概念中所述的功能。它们还列出了系统功能,如支持的睡眠电源状态、系统中可用的电源平面和时钟源的说明、电池、系统指示灯等。这使 OSPM 能够控制系统设备,而不需要知道系统控制是如何实现的。</p><p>PPTT 表就是其中的一个表格,PPTT 表全称是 Processor Properties Topology Table,处理器属性拓扑表用于描述处理器的拓扑结构,该表还可以描述附加信息,例如处理器拓扑中的哪些节点构成物理包。</p><p>下表是 PPTT 表的结构,包含一个表头和主体,表头和其他的 ACPI 表差别不大。其中<code>Signature</code>用于表示这是 PPTT 表,<code>Length</code>是整张表的大小,其他的信息可以查看下面的这张表。表的主体是一系列处理器拓扑结构。<img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/01-pptt-header.bea002f9.png" alt="01-pptt-header" title="01-pptt-header">下面的表表示处理器层级节点结构,表示处理器结构的话<code>Type</code>要设置为 0,<code>Length</code>表示这个节点的字节数。<code>Flags</code>用来描述跟处理器相关的信息,详细的看后面关于<code>Flags</code>的详细信息。<code>Parent</code>用于指向这个节点的上一级节点,存放的是一个偏移量地址<img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/02-pptt-node-structure.88b66c70.png" alt="02-pptt-node-structure" title="02-pptt-node-structure">下表是<code>Flags</code>的结构,<code>Flags</code>占据 4 个字节的长度。<code>Physical package</code>:如果处理器拓扑的此节点表示物理封装的边界,则设置<code>Physical package</code>为 1。如果处理器拓扑的此实例不表示物理软件包的边界,则设置为 0。<code>Processor is a Thread</code>:对于叶条目:如果代表此处理器的处理元素与兄弟节点共享功能单元,则必须将其设置为 1。对于非叶条目:必须设置为 0。<code>Node is a Leaf</code>:如果节点是处理器层次结构中的叶,则必须设置为 1。否则必须设置为 0。<img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/03-pptt-flags.8ccf1dd9.png" alt="03-pptt-flags" title="03-pptt-flags">参考:<a href="https://aijishu.com/link?target=https%3A%2F%2Fuefi.org%2Fspecs%2FACPI%2F6.4%2F05_ACPI_Software_Programming_Model%2FACPI_Software_Programming_Model.html%23processor-properties-topology-table-pptt" target="blank">https://uefi.org/specs/ACPI/6.4/05_ACPI_Software_Programming_Model/ACPI_Software_Programming_Model.html#processor-properties-topology-table-pptt</a></p><h3>Device Tree</h3><p>Device Tree 是一种描述硬件的数据结构。内核的启动程序会将设备树加载入内存中,然后通过解析 Device Tree 来获取硬件细节。Device Tree 是树形结构,由一系列被命名的节点和属性组成,节点可以包含子节点,它们之间的关系构成一棵树。属性就是 name 和 value 的键值对。</p><p>一个典型的设备树如下图:<img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/04-device-tree.1348daa5.png" alt="04-device-tree" title="04-device-tree"></p><p>ARM 的 CPU 拓扑是定义在 cpu-map 节点内,cpu-map 是 cpu 节点的子节点。在 cpu-map 节点里可以包含三种子节点:cluster 节点,core 节点,thread 节点。整个 dts 的例子如下:</p><pre><code>cpus {
    #size-cells = &lt;0&gt;;
    #address-cells = &lt;2&gt;;
    cpu-map {
        cluster0 {
            cluster0 {
                core0 {
                    thread0 {
                        cpu = &lt;&amp;CPU0&gt;;
                    };
                    thread1 {
                        cpu = &lt;&amp;CPU1&gt;;
                    };
                };
                core1 {
                    thread0 {
                        cpu = &lt;&amp;CPU2&gt;;
                    };
                    thread1 {
                        cpu = &lt;&amp;CPU3&gt;;
                    };
                };
            };
            cluster1 {
                core0 {
                    thread0 {
                        cpu = &lt;&amp;CPU4&gt;;
                    };
                    thread1 {
                        cpu = &lt;&amp;CPU5&gt;;
                    };
                };
                core1 {
                    thread0 {
                        cpu = &lt;&amp;CPU6&gt;;
                    };
                    thread1 {
                        cpu = &lt;&amp;CPU7&gt;;
                    };
                };
            };
        };
    };
    //...
};
</code></pre><p>参考:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.kernel.org%2Fdoc%2FDocumentation%2Fdevicetree%2Fbindings%2Farm%2Ftopology.txt" target="blank">https://www.kernel.org/doc/Documentation/devicetree/bindings/arm/topology.txt</a></p><p>图来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.devicetree.org%2Fspecifications%2F" target="blank">https://www.devicetree.org/specifications/</a></p><h2>StratoVirt 具体实现</h2><h3>CPUID</h3><p>首先我们需要计算每个拓扑结构唯一的 topology ID,然后获取或者自己建立相对应的 CPUID entry,当 entry 的 function 的值等于 0xB 和 0X1F 的时候,我们需要根据 CPUID 的规范去设置相对应的 EAX, EBX, ECX 的值。EAX 设置为拓扑 ID,EBX 用来表示那个层级的有几个逻辑处理器,ECX 表示层级号。0xB 需要配置 index 等于 0,1 对应的值,0x1F 需要配置 index 等于 0,1,2 对应的值。下面是相对应的代码:</p><pre><code>// cpu/src/x86_64/mod.rs
const ECX_INVALID: u32 = 0u32 &lt;&lt; 8;
const ECX_THREAD: u32 = 1u32 &lt;&lt; 8;
const ECX_CORE: u32 = 2u32 &lt;&lt; 8;
const ECX_DIE: u32 = 5u32 &lt;&lt; 8;
impl X86CPUState {
    fn setup_cpuid(&amp;self, vcpu_fd: &amp;Arc&lt;VcpuFd&gt;) -&gt; Result&lt;()&gt; {
        // 计算 topology ID
        let core_offset = 32u32 - (self.nr_threads - 1).leading_zeros();
        let die_offset = (32u32 - (self.nr_cores - 1).leading_zeros()) + core_offset;
        let pkg_offset = (32u32 - (self.nr_dies - 1).leading_zeros()) + die_offset;
        // 获取 KVM 的 fd 和 获取它支持的 CPUID entries
        for entry in entries.iter_mut() {
            match entry.function {
                // ...
                0xb =&gt; {
                    // Extended Topology Enumeration Leaf
                    entry.edx = self.apic_id as u32;
                    entry.ecx = entry.index &amp; 0xff;
                    match entry.index {
                        0 =&gt; {
                            entry.eax = core_offset;
                            entry.ebx = self.nr_threads;
                            entry.ecx |= ECX_THREAD;
                        }
                        1 =&gt; {
                            entry.eax = pkg_offset;
                            entry.ebx = self.nr_threads * self.nr_cores;
                            entry.ecx |= ECX_CORE;
                        }
                        _ =&gt; {
                            entry.eax = 0;
                            entry.ebx = 0;
                            entry.ecx |= ECX_INVALID;
                        }
                    }
                }
                // 0x1f 扩展,支持 die 层级
                0x1f =&gt; {
                    if self.nr_dies &lt; 2 {
                        entry.eax = 0;
                        entry.ebx = 0;
                        entry.ecx = 0;
                        entry.edx = 0;
                        continue;
                    }
                    entry.edx = self.apic_id as u32;
                    entry.ecx = entry.index &amp; 0xff;
                    match entry.index {
                        0 =&gt; {
                            entry.eax = core_offset;
                            entry.ebx = self.nr_threads;
                            entry.ecx |= ECX_THREAD;
                        }
                        1 =&gt; {
                            entry.eax = die_offset;
                            entry.ebx = self.nr_cores * self.nr_threads;
                            entry.ecx |= ECX_CORE;
                        }
                        2 =&gt; {
                            entry.eax = pkg_offset;
                            entry.ebx = self.nr_dies * self.nr_cores * self.nr_threads;
                            entry.ecx |= ECX_DIE;
                        }
                        _ =&gt; {
                            entry.eax = 0;
                            entry.ebx = 0;
                            entry.ecx |= ECX_INVALID;
                        }
                    }
                }
                // ...
            }
        }
}
</code></pre><h3>PPTT</h3><p>根据 ACPI PPTT 表的标准来构建,我们需要计算每个节点的偏移值用于其子节点指向它。我们还需要计算每个节点的 uid,uid 初始化为 0,每增加一个节点 uid 的值加一。还需要根据 PPTT 表的标准计算 Flags 的值。最后需要计算整张表的大小然后修改原来的长度的值。</p><pre><code>// machine/src/standard_vm/aarch64/mod.rs
impl AcpiBuilder for StdMachine {
    fn build_pptt_table(
        &amp;self,
        acpi_data: &amp;Arc&lt;Mutex&lt;Vec&lt;u8&gt;&gt;&gt;,
        loader: &amp;mut TableLoader,
    ) -&gt; super::errors::Result&lt;u64&gt; {
        // ...
        // 配置 PPTT 表头
        // 添加 socket 节点
        for socket in 0..self.cpu_topo.sockets {
            // 计算到起始地址的偏移量
            let socket_offset = pptt.table_len() - pptt_start;
            let socket_hierarchy_node = ProcessorHierarchyNode::new(0, 0x2, 0, socket as u32);
            // ...
            for cluster in 0..self.cpu_topo.clusters {
                let cluster_offset = pptt.table_len() - pptt_start;
                let cluster_hierarchy_node =
                    ProcessorHierarchyNode::new(0, 0x0, socket_offset as u32, cluster as u32);
                // ...
                for core in 0..self.cpu_topo.cores {
                    let core_offset = pptt.table_len() - pptt_start;
                    // 判断是否需要添加 thread 节点
                    if self.cpu_topo.threads &gt; 1 {
                        let core_hierarchy_node =
                            ProcessorHierarchyNode::new(0, 0x0, cluster_offset as u32, core as u32);
                        // ...
                        for _thread in 0..self.cpu_topo.threads {
                            let thread_hierarchy_node =
                                ProcessorHierarchyNode::new(0, 0xE, core_offset as u32, uid as u32);
                            // ...
                            uid += 1;
                        }
                    } else {
                        let thread_hierarchy_node =
                            ProcessorHierarchyNode::new(0, 0xA, cluster_offset as u32, uid as u32);
                        // ...
                        uid += 1;
                    }
                }
            }
        }
        // 将 PPTT 表添加到 loader 中
    }
}
</code></pre><h3>Device Tree</h3><p>StratoVirt 的 microvm 使用 device tree 启动,所以我们需要配置 device tree 中的 cpus 节点下的 cpu-map 来使 microvm 支持解析 CPU 拓扑。在 StratoVirt 中,我们支持两层 cluster。我们使用了多层循环来创建这个 tree,第一层是创建第一层 cluster,第二层对应创建第二层的 cluster,第三层创建 core,第四层创建 thread。</p><pre><code>impl CompileFDTHelper for LightMachine {
    fn generate_cpu_nodes(&amp;self, fdt: &amp;mut FdtBuilder) -&gt; util::errors::Result&lt;()&gt; {
        // 创建 cpus 节点
        // ...
        // Generate CPU topology
        // 创建 cpu-map 节点
        let cpu_map_node_dep = fdt.begin_node("cpu-map")?;
        // 创建第一层 cluster 节点
        for socket in 0..self.cpu_topo.sockets {
            let sock_name = format!("cluster{}", socket);
            let sock_node_dep = fdt.begin_node(&amp;sock_name)?;
            // 创建第二层 cluster 节点
            for cluster in 0..self.cpu_topo.clusters {
                let clster = format!("cluster{}", cluster);
                let cluster_node_dep = fdt.begin_node(&amp;clster)?;
                // 创建 core 节点
                for core in 0..self.cpu_topo.cores {
                    let core_name = format!("core{}", core);
                    let core_node_dep = fdt.begin_node(&amp;core_name)?;
                    // 创建 thread 节点
                    for thread in 0..self.cpu_topo.threads {
                        let thread_name = format!("thread{}", thread);
                        let thread_node_dep = fdt.begin_node(&amp;thread_name)?;
                        // 计算 cpu 的 id
                        // let vcpuid = ...
                        // 然后添加到节点中
                    }
                    fdt.end_node(core_node_dep)?;
                }
                fdt.end_node(cluster_node_dep)?;
            }
            fdt.end_node(sock_node_dep)?;
        }
        fdt.end_node(cpu_map_node_dep)?;
        Ok(())
    }
}
</code></pre><p>这个代码构建出来设备树的结构和前面原理中展示的结构基本一致</p><h2>验证方法</h2><p>我们可以通过下面的命令启动一个虚拟机,<code>smp</code>参数用来配置 vCPU 拓扑</p><pre><code>sudo ./target/release/stratovirt \
    -machine virt \
    -kernel /home/hwy/std-vmlinux.bin.1 \
    -append console=ttyAMA0 root=/dev/vda rw reboot=k panic=1 \
    -drive file=/usr/share/edk2/aarch64/QEMU_EFI-pflash.raw,if=pflash,unit=0,readonly=true \
    -drive file=/home/hwy/openEuler-22.03-LTS-stratovirt-aarch64.img,id=rootfs,readonly=false \
    -device virtio-blk-pci,drive=rootfs,bus=pcie.0,addr=0x1c.0x0,id=rootfs \
    -qmp unix:/var/tmp/hwy.socket,server,nowait \
    -serial stdio \
    -m 2048 \
    -smp 4,sockets=2,clusters=1,cores=2,threads=1
</code></pre><p>接着,我们可以通过观察<code>/sys/devices/system/cpu/cpu0/topology</code>下面的文件来查看配置的 topology。</p><pre><code>[root@StratoVirt topology] ll
total 0
-r--r--r-- 1 root root 64K Jul 18 09:04 cluster_cpus
-r--r--r-- 1 root root 64K Jul 18 09:04 cluster_cpus_list
-r--r--r-- 1 root root 64K Jul 18 09:04 cluster_id
-r--r--r-- 1 root root 64K Jul 18 09:04 core_cpus
-r--r--r-- 1 root root 64K Jul 18 09:04 core_cpus_list
-r--r--r-- 1 root root 64K Jul 18 09:01 core_id
-r--r--r-- 1 root root 64K Jul 18 09:01 core_siblings
-r--r--r-- 1 root root 64K Jul 18 09:04 core_siblings_list
-r--r--r-- 1 root root 64K Jul 18 09:04 die_cpus
-r--r--r-- 1 root root 64K Jul 18 09:04 die_cpus_list
-r--r--r-- 1 root root 64K Jul 18 09:04 die_id
-r--r--r-- 1 root root 64K Jul 18 09:04 package_cpus
-r--r--r-- 1 root root 64K Jul 18 09:04 package_cpus_list
-r--r--r-- 1 root root 64K Jul 18 09:01 physical_package_id
-r--r--r-- 1 root root 64K Jul 18 09:01 thread_siblings
-r--r--r-- 1 root root 64K Jul 18 09:04 thread_siblings_list
</code></pre><p>比如:</p><pre><code>cat core_cpus_list
</code></pre><p>结果是</p><pre><code>0
</code></pre><p>表示和 cpu0 同一个 core 的 cpu 只有 cpu0。</p><pre><code>cat package_cpus_list
</code></pre><p>会显示</p><pre><code>0-1
</code></pre><p>表示和 cpu0 同一个 socket 的 cpu 有从 cpu0 到 cpu1。</p><p>下面这些工具也可以辅助进行验证。</p><p>比如:lscpu</p><pre><code>lscpu
</code></pre><p>通过执行<code>lscpu</code>命令会出现下面结果</p><pre><code>Architecture:            aarch64
  CPU op-mode(s):        32-bit, 64-bit
  Byte Order:            Little Endian
CPU(s):                  64
  On-line CPU(s) list:   0-63
Vendor ID:               ARM
  Model name:            Cortex-A72
    Model:               2
    Thread(s) per core:  1
    Core(s) per cluster: 16
    Socket(s):           -
    Cluster(s):          4
    Stepping:            r0p2
    BogoMIPS:            100.00
    Flags:               fp asimd evtstrm aes pmull sha1 sha2 crc32 cpuid
NUMA:
  NUMA node(s):          4
  NUMA node0 CPU(s):     0-15
  NUMA node1 CPU(s):     16-31
  NUMA node2 CPU(s):     32-47
  NUMA node3 CPU(s):     48-63
Vulnerabilities:
  Itlb multihit:         Not affected
  L1tf:                  Not affected
  Mds:                   Not affected
  Meltdown:              Not affected
  Spec store bypass:     Vulnerable
  Spectre v1:            Mitigation; __user pointer sanitization
  Spectre v2:            Vulnerable
  Srbds:                 Not affected
  Tsx async abort:       Not affected
</code></pre><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2F2022-08-27%2FStratoVirt-vCPU.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000384438">Virtio-Net 技术分析</a></li><li><a href="https://aijishu.com/a/1060000000380775">VFIO设备直通原理(二)</a></li><li><a href="https://aijishu.com/a/1060000000380640">VFIO设备直通原理(一)</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000380076">DAOS ARM64调测之旅</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Tue, 14 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000384628</guid>
            <link>https://aijishu.com//a/1060000000384628</link>
        </item>
        <item>
            <title><![CDATA[Virtio-Net 技术分析]]></title>
            <description><![CDATA[<p>简介</p><p>传统的设备模拟中,虚拟机内部设备驱动完全不知道自己处于虚拟化环境中。对于网络,存储,IO 等操作完全由虚拟机内核到 qemu,最后到宿主机内核处理,这样会产生很多的 VM exit 和 VM entry,因此性能很差。virtio 技术提高了虚拟机的性能,在该方案中,虚拟机能够感知到子集处于虚拟机环境中,并且会加载 virtio 总线驱动和 virtio 设备驱动。</p><p>virtio-net 方案,包括前端驱动和后端设备,以及自身定义的 virtio 传输协议。虚拟机作为前端驱动,安装了 virtio-net 的driver,在 qemu 中加载 virtio-net 后端设备,用来接收前端发送的 I/O 请求,然后从接收的数据中按照传输协议进行解析。最后 qemu 通过操作虚拟tap设备,对物理设备进行操作,从而完成请求,并且会通过中断机制通知前端驱动。</p><p>virtio-net网络包的发送过程:</p><p><img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/2020-11-23-virtionet.4b41c976.png" alt="2020-11-23-virtionet" title="2020-11-23-virtionet"></p><h2>Virtio-Net 后端</h2><h3>收包流程</h3><p>当网卡有数据包时,tap 设备首先会收到报文,对应 virtio-net 的 tap 设备 fd 变为可读。qemu 通过 epoll 方式监测到有网络数据包,调用回调函数发起收报流程。virtio_net_receive 函数把数据拷贝到虚拟机的 virtio 网卡接收队列。然后向虚拟机注入一个中断,虚拟机便感知到有网络数据报文。</p><pre><code>qemu/hw/net/virtio-net.c
virtio_net_receive
    virtio_net_do_receive
        virtio_net_receive_rcu
</code></pre><p>上述是 virtio-net 的函数调用关系,virtio-net 最终调用 virtio_net_receive_rcu 函数,对网络数据包添加到 virtio queue。</p><pre><code>virtio_net_receive_rcu {
    virtio_net_can_receive     // 根据vm running状态,queue和设备状态判断virtio-net是否可以收包
    virtio_net_has_buffers     // 检查缓冲区,避免出现竞争状况
    receive_filter             // 对网络包进行过滤
    while (offset &lt; size) {
        elem = virtqueue_pop     // 从vring中取出一个请求,将信息传递给elem域中
        len = iov_from_buf         // 负责将报文拷贝到buffer中,实现向guest物理地址写入数据
        virtqueue_fill             // 当数据写完后,撤销映射,更新VRingAvail.ring[]的相关字段
    }
    virtqueue_flush         // 更新VRingUsed.ring的idx,表明可以回收
    virtio_notify             // 负责注入中断,通知前端虚拟机
}
</code></pre><h3>发包流程</h3><p>虚拟机的 virtio 网卡驱动向网卡缓冲区填好报文,然后写 queue notify 寄存器。这样,触发 VM exit ,虚拟机就会退出到root 模式,在 qemu 的 vcpu 线程 virtio_mmio_write 对其处理。</p><pre><code>qemu/hw/net/virtio-net.c
virtio_net_add_queue
    virtio_net_handle_tx_bh
        qemu_bh_schedule
            virtio_net_tx_bh
                virtio_net_flush_tx
            virtio_queue_set_notification
</code></pre><p>这里将 virtio_net_handle_tx_bh 函数绑定到 tx_vq。内部调用 qemu_bh_schedule 运行指定的函数,这里绑定的是virtio_net_tx_bh。最终调用 virtio_net_flush_tx 函数发送报文。</p><pre><code>virtio_net_flush_tx
    for (;;) {
        elem = virtqueue_pop     // 从vring中取出一个请求
        qemu_sendv_packet_async // qemu发包函数
    }
</code></pre><p>在 virtio_net_flush_tx 函数中,获取报文 elem,写 tap 设备的 fd,最终发给 tap 设备,投递出去。qemu_sendv_packet_async 发送网络包的调用链为: qemu_sendv_packet_async-&gt;qemu_net_queue_send_iov-&gt;qemu_net_queue_flush- &gt;qemu_net_queue_deliver。qemu 后端最终调用 tap_write_packet- &gt;writev 写入 tap 字符设备。</p><p>接着在内核的字符设备驱动中,tun_chr_write_iter 会被调用,在 TCP/IP 协议栈进一步处理网络包。</p><h3>创建设备</h3><pre><code>virtio_net_class_init
    virtio_net_device_realize
    virtio_net_get_config
    virtio_net_get_features
    ...
</code></pre><p>virtio_net_device_realize 完成对 virtio-net 设备的初始化过程。</p><pre><code>virtio_net_device_realize
    virtio_net_set_config_size
    virtio_init
    virtio_net_set_default_queue_size
    virtio_net_add_queue
    n-&gt;ctrl_vq = virtio_add_queue(virtio_net_handle_ctrl)
    qemu_new_nic
</code></pre><p>这个函数创建了一个 VirtIODevice,virtio_init 用来初始化这个设备。接着调用 virtio_net_add_queue 初始化队列。当设置多队列特性,还要额外增加一个 ctrl_vq 队列,用作控制队列。最后,qemu_new_nic 会创建一个虚拟机里面的网卡。这里的网卡对应的是后端 tap 设备。</p><h3>模拟网卡</h3><p>tap 设备的使用:qemu 使用 tap 作为网络后端。首先需要在宿主机上创建 tap 设备,并添加到网桥 br0 上。</p><pre><code># brctl addbr br0
# ip tuntap add dev tap0 mode tap
# brctl addif br0 tap0
# ip link set dev tap0 up
</code></pre><p>在使用 qemu 命令启动虚拟机的过程中,传递参数:net,nic,model,netdev,ifname...</p><p>其中 nic 表示前端虚拟机网卡,model 表示创建网卡类型,netdev 定义后端 tap 设备,ifname 表示 tap 设备的名字。</p><p>qemu 的 main 函数会调用 net\_init\_clients 进行网络设备的初始化 ,在该函数内对 netdev 参数进行解析。</p><pre><code>net_init_clients
    qemu_opts_foreach(qemu_find_opts("netdev"),net_init_netdev, NULL, errp))
        net_init_netdev
            net_client_init-&gt;net_client_init1 // 根据不同的driver类型,调用不同的初始化函数
                net_init_tap
                    net_tap_init
                        tap_open
</code></pre><p>tap_open 函数打开一个文件 "/dev/net/tun" ,然后通过 ioctl 操作这个文件。</p><pre><code>tap_open{
    fd = open(PATH_NET_TUN, O_RDWR)
    ioctl(fd, TUNGETFEATURES, &amp;features)
    ioctl(fd, TUNSETVNETHDRSZ, &amp;len)
    ioctl(fd, TUNSETIFF, (void *) &amp;ifr)
}
</code></pre><p>最终,通过宿主机内核复杂的网络协议栈,形成一个网络包,发送到外部网络中。这样做的原因是:虚拟机将网络包发送给 qemu,qemu 没有自己的网络协议栈,因此,qemu 将网络包转换成文件流,写入 "/dev/net/tun" 字符设备。内核TUN/TAP 字符设备驱动收到这个写入的文件流,然后交给 TUN/TAP 虚拟网卡驱动。驱动将文件流再次转成网络包,交给TCP/IP 协议栈,从 tap 设备发出标准的网络包。</p><h2>Virtio-Net 前端</h2><p>虚拟机里面的进程发送一个网络包,通过文件系统和 Socket 调用网络协议栈,到达网络设备层。 这里将调用 virtio-net 驱动做进一步处理。</p><p>前端 driver 将报文发送出去,注册的 ops 函数定义如下,其中指定的发送函数为 start_xmit。</p><pre><code>kernel/drivers/net/virtio_net.c
static const struct net_device_ops virtnet_netdev = {
    .ndo_open            = virtnet_open,
    .ndo_stop            = virtnet_close,
    .ndo_start_xmit      = start_xmit,
    ...
};
</code></pre><p>调用 start\_xmit 函数,将 skb 发送到 virtqueue 中, 然后调用 virtqueue\_kick 通知 qemu 后端将数据包发送出去。</p><pre><code>start_xmit{
    free_old_xmit_skbs // 释放backend处理过的desc
    xmit_skb           // 发包
        sg_init_table
        sg_set_buf(sq-&gt;sg, hdr, hdr_len);                      // 数据包头部填入scatterlist
        num_sg = skb_to_sgvec(skb, sq-&gt;sg + 1, 0, skb-&gt;len);  // 数据包填入scatterlist
        virtqueue_add_outbuf // sg table 写入desc描述符表,head desc信息写vring.avail
    virtqueue_kick_prepare(sq-&gt;vq) &amp;&amp; virtqueue_notify(sq-&gt;vq) // kick通知qemu后端
}
</code></pre><p>当虚拟机写入一个 I/O 会使得 qemu 触发 VM exit 。接下来进入 qemu 做 virtio-net 相关处理。</p><h2>流程总结</h2><ol><li>在虚拟机里面的用户态,应用程序通过 write 系统调用写入 socket。</li><li>写入的内容经过 VFS 层,内核协议栈,到达虚拟机里面的内核的网络设备驱动,即 virtio_net。</li><li>virtio_net 网络设备有一个操作结构 struct net_device_ops,里面定义了发送一个网络包调用的函数为 start_xmit。</li><li>在 virtio_net 的前端驱动和 qemu 中的后端驱动之间,有两个队列 virtqueue,一个用于发送,一个用于接收。然后,我们需要在 start_xmit 中调用 virtqueue_add,将网络包放入发送队列,然后调用 virtqueue_notify 通知 qemu。</li><li>qemu 本来处于 KVM_RUN 的状态,收到通知后,通过 VM exit 指令退出客户机模式,进入宿主机模式。发送网络包的时候,virtio_net_handle_tx_bh 函数会被调用。</li><li>接下来是一个 for 循环,我们需要在循环中调用 virtqueue_pop,从传输队列中获取要发送的数据,然后调用 qemu_sendv_packet_async 进行发送。</li><li>qemu 会调用 writev 向字符设备文件写入,进入宿主机的内核。</li><li>在宿主机内核中字符设备文件的 file_operations 里面的 write_iter 会被调用,也即会调用 tun_chr_write_iter。</li><li>在 tun_chr_write_iter 函数中,tun_get_user 将要发送的网络包从 qemu 拷贝到宿主机内核里面来,然后调用 netif_rx_ni 开始调用宿主机内核协议栈进行处理。</li><li>宿主机内核协议栈处理完毕之后,会发送给 tap 虚拟网卡,完成从虚拟机里面到宿主机的整个发送过程。</li></ol><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2Fxinleguo%2F2020-11-23-Virtio_Net_Technology.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000380775">VFIO设备直通原理(二)</a></li><li><a href="https://aijishu.com/a/1060000000380640">VFIO设备直通原理(一)</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000380076">DAOS ARM64调测之旅</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000376121">回顾2022年计算机视觉领域最激动人心的进展</a></li><li><a href="https://aijishu.com/a/1060000000375922">量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 13 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000384438</guid>
            <link>https://aijishu.com//a/1060000000384438</link>
        </item>
        <item>
            <title><![CDATA[VFIO设备直通原理(二)]]></title>
            <description><![CDATA[<p>设备直通给虚拟机能够极大提升虚拟机对物理设备访问的性能,本文通过vfio内核模块和qemu用户态实现介绍vfio设备直通时的关键部分,包括:用户态访问设备IO地址空间,DMA重映射,中断重映射等.</p><h2>VFIO访问直通设备IO地址空间</h2><p>1.PIO和MMIO</p><p>设备的IO地址空间的访问有PIO和MMIO两种方式,前者通过独立的IO端口访问设备,而MMIO是在物理内存中映射一段区间,直接访问该内存就可以访问设备的配置空间.在虚拟化的场景下,虚拟机通过PIO访问直通设备时,首先会VM-exit到qemu,由qemu通过转换表完成对该PIO操作的转发.对于PCI设备而言,其bar空间地址是通过PIO的方式设置的,如果将设备的PIO访问完全暴露给虚拟机,虚拟机修改了真实的物理设备的PCI Bar空间基地址配置,与host上不一致,可能会出现严重的问题,所以对于设备的PIO访问需要建立转换表,在VM-exit之后由qemu来完成设置的转发.</p><p>对于设备的MMIO空间访问,则可以通过建立EPT页表将设备的MMIO物理内存映射到虚拟的MMIO地址空间,让虚拟机能够直接通过MMIO访问PCI设备的bar空间,提高IO性能.</p><p>2.获取直通设备信息</p><p>通过VFIO提供的接口可以获取到设备的基本信息,包括设备的描述符、region的数量等。</p><pre><code>vfio_get_device:
    fd = ioctl(group-&gt;fd, VFIO_GROUP_GET_DEVICE_FD, name);
    ret = ioctl(fd, VFIO_DEVICE_GET_INFO, &amp;dev_info);
    vbasedev-&gt;fd = fd;
    vbasedev-&gt;group = group;
    QLIST_INSERT_HEAD(&amp;group-&gt;device_list, vbasedev, next);
    vbasedev-&gt;num_irqs = dev_info.num_irqs;
    vbasedev-&gt;num_regions = dev_info.num_regions;
    vbasedev-&gt;flags = dev_info.flags;
</code></pre><p>2.直通设备PCI配置空间模拟</p><p>Qemu为每个PCI直通设备都建立一个虚拟数据结构 VFIOPCIDevice,保存物理PCI设备的相关信息,由vfio\_get\_device来获取,保存到vbasedev中。</p><pre><code>typedef struct VFIOPCIDevice {
    PCIDevice pdev;
    VFIODevice vbasedev;
</code></pre><p>VFIO设备作为qemu的设备模型的一部分,qemu对直通设备的模拟初始化入口在 vfio\_realize,通过vfio\_get_device获取到直通设备的基本信息之后,会调用pread设备的fd获取到设备的配置空间信息的一份拷贝,qemu会写入一些自定义的config配置。</p><pre><code>vfio_realize:
    /* Get a copy of config space */
    ret = pread(vdev-&gt;vbasedev.fd, vdev-&gt;pdev.config,
                MIN(pci_config_size(&amp;vdev-&gt;pdev), vdev-&gt;config_size),
                vdev-&gt;config_offset);
    if (ret &lt; (int)MIN(pci_config_size(&amp;vdev-&gt;pdev), vdev-&gt;config_size)) {
        ret = ret &lt; 0 ? -errno : -EFAULT;
        error_setg_errno(errp, -ret, "failed to read device config space");
        goto error;
    }
    /* vfio emulates a lot for us, but some bits need extra love */
    vdev-&gt;emulated_config_bits = g_malloc0(vdev-&gt;config_size);
    /* QEMU can choose to expose the ROM or not */
    memset(vdev-&gt;emulated_config_bits + PCI_ROM_ADDRESS, 0xff, 4);
    /* QEMU can change multi-function devices to single function, or reverse */
    vdev-&gt;emulated_config_bits[PCI_HEADER_TYPE] =
                                              PCI_HEADER_TYPE_MULTI_FUNCTION;
    /* Restore or clear multifunction, this is always controlled by QEMU */
    if (vdev-&gt;pdev.cap_present &amp; QEMU_PCI_CAP_MULTIFUNCTION) {
        vdev-&gt;pdev.config[PCI_HEADER_TYPE] |= PCI_HEADER_TYPE_MULTI_FUNCTION;
    } else {
        vdev-&gt;pdev.config[PCI_HEADER_TYPE] &amp;= ~PCI_HEADER_TYPE_MULTI_FUNCTION;
    }
    /*
     * Clear host resource mapping info.  If we choose not to register a
     * BAR, such as might be the case with the option ROM, we can get
     * confusing, unwritable, residual addresses from the host here.
     */
    memset(&amp;vdev-&gt;pdev.config[PCI_BASE_ADDRESS_0], 0, 24);
    memset(&amp;vdev-&gt;pdev.config[PCI_ROM_ADDRESS], 0, 4);
</code></pre><p>3.直通设备MMIO映射</p><p>直通PCI设备的MMIO内存主要是指其Bar空间,qemu使用vfio\_populate\_device函数调用VFIO接口获取到PCI设备的Bar空间信息,然后通过vfio\_region\_setup获取到对应region的信息,并将qemu内存虚拟化的MemoryRegion设置为IO类型的region。重要的是,qemu会为该IO类型的MemoryRegion设置ops为vfio\_region\_ops,这样后续对于该块内存的读写会经过qemu VFIO模块注册的接口来进行。</p><pre><code>vfio_populate_device:
    for (i = VFIO_PCI_BAR0_REGION_INDEX; i &lt; VFIO_PCI_ROM_REGION_INDEX; i++) {
        char *name = g_strdup_printf("%s BAR %d", vbasedev-&gt;name, i);
        ret = vfio_region_setup(OBJECT(vdev), vbasedev, &amp;vdev-&gt;bars[i].region, i, name);
            -&gt; vfio_get_region_info
            -&gt; memory_region_init_io(region-&gt;mem, obj, &amp;vfio_region_ops,
                              region, name, region-&gt;size);
        QLIST_INIT(&amp;vdev-&gt;bars[i].quirks);
    }
    ret = vfio_get_region_info(vbasedev, VFIO_PCI_CONFIG_REGION_INDEX, &amp;reg_info);
            -&gt;    ioctl(vbasedev-&gt;fd, VFIO_DEVICE_GET_REGION_INFO, *info))
    ret = ioctl(vdev-&gt;vbasedev.fd, VFIO_DEVICE_GET_IRQ_INFO, &amp;irq_info);
</code></pre><p>到这里已经获取到了PCI设备的MMIO内存信息,但是还没有真正的将物理内存中的Bar空间映射到qemu,这一动作在vfio\_bars\_setup中完成,vfio\_region\_mmap会对region中每个需要map的内存地址完成映射,然后将映射的物理内存通过qemu注册到虚拟机作为一段虚拟机的物理地址空间。</p><pre><code>vfio_bars_setup:
    for (i = 0; i &lt; PCI_ROM_SLOT; i++)
        vfio_bar_setup(vdev, i);
            vfio_region_mmap(&amp;bar-&gt;region)
                    for (i = 0; i &lt; region-&gt;nr_mmaps; i++) {
                    region-&gt;mmaps[i].mmap = mmap(NULL, region-&gt;mmaps[i].size, prot,
                                                MAP_SHARED, region-&gt;vbasedev-&gt;fd,
                                                region-&gt;fd_offset +
                                                region-&gt;mmaps[i].offset);
                    memory_region_init_ram_device_ptr
                    memory_region_add_subregion
            pci_register_bar(&amp;vdev-&gt;pdev, nr, type, bar-&gt;region.mem);
</code></pre><p>这里的映射mmap接口对应的是VFIO设备在内核中注册的vfio\_pci\_mmap 函数,在内核中,该函数会为vma注册一个mmap的ops,对应着注册了一个缺页处理函数,当用户态程序访问该段虚拟内存缺页时,调用注册的缺页处理函数,完成虚拟地址到实际物理地址的映射。</p><pre><code>vfio_pci_mmap:
    vma-&gt;vm_flags |= VM_IO | VM_PFNMAP | VM_DONTEXPAND | VM_DONTDUMP;
    vma-&gt;vm_ops = &amp;vfio_pci_mmap_ops;
        -&gt; .fault = vfio_pci_mmap_fault,
                -&gt; if (remap_pfn_range(vma, vma-&gt;vm_start, vma-&gt;vm_pgoff,
                    vma-&gt;vm_end - vma-&gt;vm_start, vma-&gt;vm_page_prot))
</code></pre><p>简单来说,对于MMIO内存的的映射,主要是将物理内存中的MMIO空间映射到了qemu的虚拟地址空间,然后再由qemu将该段内存注册进虚拟机作为虚拟机的一段物理内存,在这个过程中会建立从gpa到hpa的EPT页表映射,提升MMIO的性能。</p><h2>DMA重映射</h2><p>首先关于DMA,设备通过DMA可以直接使用iova地址访问物理内存,从iova到实际物理地址的映射是在IOMMU中完成的,一般在dma_allooc分配设备能够访问的内存的时候,会分配iova地址和实际的物理地址空间,并在iommu中建立映射关系。 所以说要让设备进行DMA最关键的几个部分:</p><ul><li>设备能够识别的地址:IOVA</li><li>一段物理内存</li><li>IOVA到物理内存在IOMMU中的映射关系</li></ul><p>基于这几点来看VFIO的DMA重映射就比较清晰,首先从VFIO设备的初始化开始,在获取设备信息之前会先获取到设备所属的group和Container,并调用VFIO\_SET\_IOMMU完成container和IOMMU的绑定,并attach由VFIO管理的所有设备。此外注意到这里的 pci\_device\_iommu\_address\_space 函数,意思是qemu为设备dma注册了一段专门的地址空间,这段内存作为虚拟机的一段物理内存存在,在VFIO\_SET\_IOMMU之后,注册该地址空间,其region\_add函数为 vfio\_listener\_region\_add,意思是当内存空间布局发生变化这里是增加内存的时候都会调用该接口。</p><pre><code>vfio_realize:
    group = vfio_get_group(groupid, pci_device_iommu_address_space(pdev), errp);
        vfio_connect_container(group, as, errp)
            ret = ioctl(fd, VFIO_SET_IOMMU, container-&gt;iommu_type);
            container-&gt;listener = vfio_memory_listener;
            memory_listener_register(&amp;container-&gt;listener, container-&gt;space-&gt;as);
                    -&gt; .region_add = vfio_listener_region_add,
</code></pre><p>那么跟DMA有什么关系呢,当为设备进行DMA分配一块内存时,实际是以MemoryRegion的形式存在的,也就是说虚拟机进行dma alloc 会调用region\_add函数,进而调用注册的memory\_listener\_region\_add函数,MemoryRegion有了意味着分配了一块物理内存,还需要IOVA和映射关系才行。这里,IOVA地址使用的是section-&gt;offset\_within\_address_space,为什么可以这样,因为IOVA地址只是作为设备识别的地址,只要建立了映射关系就有意义。</p><pre><code>vfio_listener_region_add:
    iova = TARGET_PAGE_ALIGN(section-&gt;offset_within_address_space);
    /* Here we assume that memory_region_is_ram(section-&gt;mr)==true */
    vaddr = memory_region_get_ram_ptr(section-&gt;mr) +
            section-&gt;offset_within_region +
            (iova - section-&gt;offset_within_address_space);
    ret = vfio_dma_map(container, iova, int128_get64(llsize),
                       vaddr, section-&gt;readonly);
vfio_dma_map:
    struct vfio_iommu_type1_dma_map map = {
        .argsz = sizeof(map),
        .flags = VFIO_DMA_MAP_FLAG_READ,
        .vaddr = (__u64)(uintptr_t)vaddr,
        .iova = iova,
        .size = size,
    };
    ioctl(container-&gt;fd, VFIO_IOMMU_MAP_DMA, &amp;map)
</code></pre><p>建立映射的关键在于vfio\_dma\_map,通过ioctl调用container-&gt;fd接口VFIO\_IOMMU\_MAP_DMA完成DMA重映射。为什么是container-&gt;fd,因为VFIO Container管理内存资源,与IOMMU直接绑定,而IOMMU是完成IOVA到实际物理内存映射的关键。值得注意的是qemu只知道这一段内存的虚拟地址vaddr,所以将vaddr,iova和size传给内核,由内核获取物理内存信息完成映射。</p><pre><code>vfio_dma_do_map:
    vfio_pin_map_dma
        while (size) {
            /* Pin a contiguous chunk of memory */
            npage = vfio_pin_pages_remote(dma, vaddr + dma-&gt;size,
                                size &gt;&gt; PAGE_SHIFT, &amp;pfn, limit);
            /* Map it! */
            vfio_iommu_map(iommu, iova + dma-&gt;size, pfn, npage,
                            dma-&gt;prot);
                list_for_each_entry(d, &amp;iommu-&gt;domain_list, next)
                    iommu_map(d-&gt;domain, iova, (phys_addr_t)pfn &lt;&lt; PAGE_SHIFT,
                            npage &lt;&lt; PAGE_SHIFT, prot | d-&gt;prot);
                        arm_smmu_map
                            __arm_lpae_map
            size -= npage &lt;&lt; PAGE_SHIFT;
            dma-&gt;size += npage &lt;&lt; PAGE_SHIFT;
        }
</code></pre><p>内核完成建立iova到物理内存的映射之前会将分配的DMA内存给pin住,使用vfio\_pin\_pages\_remote接口可以获取到虚拟地址对应的物理地址和pin住的页数量,然后vfio\_iommu_map进而调用iommu以及smmu的map函数,最终用iova,物理地址信息pfn以及要映射的页数量在设备IO页表中建立映射关系。</p><pre><code>+--------+  iova  +--------+  gpa  +----+
| device |   -&gt;   | memory |   &lt;-  | vm |
+--------+        +--------+       +----+
</code></pre><p>最终完成了DMA重映射,设备使用qemu分配的iova地址通过IOMMU映射访问内存,虚拟机使用gpa通过Stage 2页表映射访问内存</p><h2>中断重映射</h2><p>对于PCI直通设备中断的虚拟化,主要包括三种类型INTx,Msi和Msi-X。</p><p>1.INTx中断初始化及enable</p><p>对于INTx类型的中断,在初始化的时候就进行使能了,qemu通过VFIO device的接口将中断irq set设置到内核中,并且会注册一个eventfd,设置了eventfd的handler,当发生intx类型的中断时,内核会通过eventfd通知qemu进行处理,qemu会通知虚拟机进行处理。</p><pre><code>vfio_realize:
    if (vfio_pci_read_config(&amp;vdev-&gt;pdev, PCI_INTERRUPT_PIN, 1)) {
        pci_device_set_intx_routing_notifier(&amp;vdev-&gt;pdev, vfio_intx_update);
        ret = vfio_intx_enable(vdev, errp);
            *pfd = event_notifier_get_fd(&amp;vdev-&gt;intx.interrupt);
            qemu_set_fd_handler(*pfd, vfio_intx_interrupt, NULL, vdev);
            ret = ioctl(vdev-&gt;vbasedev.fd, VFIO_DEVICE_SET_IRQS, irq_set);
</code></pre><p>2.MSI-X初始化</p><p>MSIX在vfio_realzie初始化时,首先获取到物理设备的中断相关的配置信息,将其设置到注册给对应的MMIO内存中</p><pre><code>vfio_msix_early_setup:
    pos = pci_find_capability(&amp;vdev-&gt;pdev, PCI_CAP_ID_MSIX);
    if (pread(fd, &amp;ctrl, sizeof(ctrl),
            vdev-&gt;config_offset + pos + PCI_MSIX_FLAGS) != sizeof(ctrl)) {
    if (pread(fd, &amp;table, sizeof(table),
            vdev-&gt;config_offset + pos + PCI_MSIX_TABLE) != sizeof(table)) {
    if (pread(fd, &amp;pba, sizeof(pba),
            vdev-&gt;config_offset + pos + PCI_MSIX_PBA) != sizeof(pba)) {
    ctrl = le16_to_cpu(ctrl);
    table = le32_to_cpu(table);
    pba = le32_to_cpu(pba);
    msix = g_malloc0(sizeof(*msix));
    msix-&gt;table_bar = table &amp; PCI_MSIX_FLAGS_BIRMASK;
    msix-&gt;table_offset = table &amp; ~PCI_MSIX_FLAGS_BIRMASK;
    msix-&gt;pba_bar = pba &amp; PCI_MSIX_FLAGS_BIRMASK;
    msix-&gt;pba_offset = pba &amp; ~PCI_MSIX_FLAGS_BIRMASK;
    msix-&gt;entries = (ctrl &amp; PCI_MSIX_FLAGS_QSIZE) + 1;
vfio_msix_setup:
    msix_init(&amp;vdev-&gt;pdev, vdev-&gt;msix-&gt;entries,
                    vdev-&gt;bars[vdev-&gt;msix-&gt;table_bar].region.mem,
                    vdev-&gt;msix-&gt;table_bar, vdev-&gt;msix-&gt;table_offset,
                    vdev-&gt;bars[vdev-&gt;msix-&gt;pba_bar].region.mem,
                    vdev-&gt;msix-&gt;pba_bar, vdev-&gt;msix-&gt;pba_offset, pos);
        memory_region_init_io(&amp;dev-&gt;msix_table_mmio, OBJECT(dev), &amp;msix_table_mmio_ops, dev,
                          "msix-table", table_size);
        memory_region_add_subregion(table_bar, table_offset, &amp;dev-&gt;msix_table_mmio);
        memory_region_init_io(&amp;dev-&gt;msix_pba_mmio, OBJECT(dev), &amp;msix_pba_mmio_ops, dev,
                            "msix-pba", pba_size);
        memory_region_add_subregion(pba_bar, pba_offset, &amp;dev-&gt;msix_pba_mmio);
vfio_realize:
    /* QEMU emulates all of MSI &amp; MSIX */
    if (pdev-&gt;cap_present &amp; QEMU_PCI_CAP_MSIX) {
        memset(vdev-&gt;emulated_config_bits + pdev-&gt;msix_cap, 0xff,
               MSIX_CAP_LENGTH);
    if (pdev-&gt;cap_present &amp; QEMU_PCI_CAP_MSI) {
        memset(vdev-&gt;emulated_config_bits + pdev-&gt;msi_cap, 0xff,
               vdev-&gt;msi_cap_size);
</code></pre><ol start="3"><li>MSI/MSI-X enable 与 irqfd的注册</li></ol><p>当虚拟机因为写PCI配置空间而发生VM-exit时,最终会完成msi和msix的使能,以MSIX的使能为例,在qemu侧会设置eventfd的处理函数,并通过kvm将irqfd注册到内核中,进而注册虚拟中断给虚拟机。</p><pre><code>kvm_cpu_exec:
    vfio_pci_write_config:
        vfio_msi_enable(vdev);
        vfio_msix_enable(vdev);
            for (i = 0; i &lt; vdev-&gt;nr_vectors; i++) {
                if (event_notifier_init(&amp;vector-&gt;interrupt, 0)) {
                qemu_set_fd_handler(event_notifier_get_fd(&amp;vector-&gt;interrupt),
                                    vfio_msi_interrupt, NULL, vector);
                vfio_add_kvm_msi_virq(vdev, vector, i, false);
                    kvm_irqchip_add_msi_route(kvm_state, vector_n, &amp;vdev-&gt;pdev);
                    vfio_add_kvm_msi_virq
                        kvm_irqchip_add_irqfd_notifier_gsi
                            kvm_vm_ioctl(s, KVM_IRQFD, &amp;irqfd);
            /* Set interrupt type prior to possible interrupts */
            vdev-&gt;interrupt = VFIO_INT_MSI;
            ret = vfio_enable_vectors(vdev, false);
                ret = ioctl(vdev-&gt;vbasedev.fd, VFIO_DEVICE_SET_IRQS, irq_set);
</code></pre><h2>小结</h2><p>要让设备直通给虚拟机,需要将设备的DMA能力、中断响应和IO地址空间访问安全地暴露给用户态,本文主要介绍了VFIO设备直通关键的几个环节,包括如何在用户态访问物理设备的IO地址空间、如何进行DMA重映射和中断重映射。</p><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2Fwxggg%2F2020-11-29-vfio-passthrough-2.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000380640">VFIO设备直通原理(一)</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000380076">DAOS ARM64调测之旅</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000376121">回顾2022年计算机视觉领域最激动人心的进展</a></li><li><a href="https://aijishu.com/a/1060000000375922">量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!</a></li><li><a href="https://aijishu.com/a/1060000000375779">自制深度学习推理框架-前言-第一课</a></li><li><a href="https://aijishu.com/a/1060000000375145">YOLOv6精度提升的又一根稻草,感知量化的重参再设计,QARep值得内卷</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Wed, 18 Jan 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000380775</guid>
            <link>https://aijishu.com//a/1060000000380775</link>
        </item>
        <item>
            <title><![CDATA[VFIO设备直通原理(一)]]></title>
            <description><![CDATA[<p>现代系统大多提供DMA和中断重映射功能来确保I/O设备在有限的范围内运行,比如x86平台的AMD-Vi和Intel VT-d。VFIO(Virtual Function I/O)是一个可以将设备I/O、中断和DMA等能力安全的暴露到用户态空间,从而使用用户态驱动实现设备驱动的框架。通过VFIO进行设备直通到虚拟机,可以获得更高的设备I/O性能。</p><p>实现用户态驱动最关键的问题在于如何安全可控的将设备的DMA能力暴露到用户空间,IOMMU的出现可以限制设备对内存的访问,恶意的设备不能直接读写物理内存,经过IOMMU映射之后才能使用IOVA或者虚拟地址进行访存,由IOMMU来保证访存的安全性。</p><h2>VFIO内核组件</h2><p>VFIO内核组件主要包括如下图所示,通过设备文件向用户态提供统一访问接口vfio interface层,包括:</p><ul><li>VFIO container</li><li>VFIO group</li><li>VFIO device</li></ul><pre><code>+-----------------------------------------+
|            vfio interface               |
+-----------------------------------------+
|  vfio_iommu_driver |       vfio_pci     |
+--------------------+--------------------+
|        iommu       |       pci_bus      |
+--------------------+--------------------+
</code></pre><p>vfio interface 封装了vfio\_iommu\_driver和vfio\_pci分别和底层的IOMMU、PCI驱动进行交互,vfio\_iommu\_driver为VFIO提供了IOMMU重映射驱动,向用户态暴露DMA操作,主要是vfio\_iommu\_type1驱动,利用IOMMU管理IO页表的能力来进行IO重映射。vfio\_pci模块封装pci设备驱动并和用户态程序进行配合完成用户态的设备配置模拟、Bar空间重定向及中断重映射等功能。</p><p>VFIO框架中比较重要的几个概念包括:Container、Group和Device,其相互之间的关系如图所示,一个container可以理解为实际的物理资源集合,每个container中可以有多个group,group描述了设备在物理上的划分,一个group可以有多个device,划分的逻辑取决于硬件上的IOMMU拓扑结构。</p><pre><code>container
+------------------------+
|    group0    group1    |
|  +-------+  +------+   |
|  | dev0  |  | dev2 |   |
|  | dev1  |  +------+   |
|  +-------+             |
+------------------------+
</code></pre><p>可以结合内核中vfio.txt文件来理解Container、Group、Device和IOMMU之间的关系。</p><h2>VFIO Container</h2><pre><code>// container: /dev/vfio/vfio
struct vfio_container {
    struct kref            kref;
    struct list_head        group_list;
    struct rw_semaphore        group_lock;
    struct vfio_iommu_driver    *iommu_driver;
    void                *iommu_data;
    bool                noiommu;
};
</code></pre><p>Container是管理内存资源,和IOMMU、DMA及地址空间相关,可以通过打开设备文件/dev/vfio/vfio来获取container对应的文件描述符,在内核vfio/vfio.c中有对应该vfio设备文件的具体操作实现,ioctl主要是可以获取IOMMU相关的信息,vfio会将用户态对IOMMU相关操作发给底层的vfio_iommu驱动进行操作,通过vfio ioctl提供的接口如下:</p><ul><li>获取API versio</li><li>设置IOMMU的类型,如设置为常用的VFIO\_TYPE1\_IOMMU</li><li>获取IOMMU的信息</li><li>分配空间并进行DMA映射</li></ul><pre><code>int container, group, device, i;
struct vfio_iommu_type1_info iommu_info = { .argsz = sizeof(iommu_info) };
struct vfio_iommu_type1_dma_map dma_map = { .argsz = sizeof(dma_map) };
/* Create a new container */
container = open("/dev/vfio/vfio", O_RDWR);
if (ioctl(container, VFIO_GET_API_VERSION) != VFIO_API_VERSION)
    /* Unknown API version */
if (!ioctl(container, VFIO_CHECK_EXTENSION, VFIO_TYPE1_IOMMU))
    /* Doesn't support the IOMMU driver we want. */
/* Enable the IOMMU model we want */
ioctl(container, VFIO_SET_IOMMU, VFIO_TYPE1_IOMMU);
/* Get addition IOMMU info */
ioctl(container, VFIO_IOMMU_GET_INFO, &amp;iommu_info);
/* Allocate some space and setup a DMA mapping */
dma_map.vaddr = mmap(0, 1024 * 1024, PROT_READ | PROT_WRITE,
                MAP_PRIVATE | MAP_ANONYMOUS, 0, 0);
dma_map.size = 1024 * 1024;
dma_map.iova = 0; /* 1MB starting at 0x0 from device view */
dma_map.flags = VFIO_DMA_MAP_FLAG_READ | VFIO_DMA_MAP_FLAG_WRITE;
ioctl(container, VFIO_IOMMU_MAP_DMA, &amp;dma_map);
</code></pre><h2>VFIO Group</h2><pre><code>// group: /dev/vfio/%group_id
struct vfio_group {
    struct kref            kref;
    int                minor;
    atomic_t            container_users;
    struct iommu_group        *iommu_group;
    struct vfio_container        *container;
    struct list_head        device_list;
    struct mutex            device_lock;
    struct device            *dev;
    struct notifier_block        nb;
    struct list_head        vfio_next;
    struct list_head        container_next;
    struct list_head        unbound_list;
    struct mutex            unbound_lock;
    atomic_t            opened;
    wait_queue_head_t        container_q;
    bool                noiommu;
    struct kvm            *kvm;
    struct blocking_notifier_head    notifier;
};
</code></pre><p>Group是IOMMU进行DMA隔离的最小硬件单元,设备属于哪个group取决于IOMMU和设备的物理结构,在设备直通时需要将一个group里的所有设备都分配给一个虚拟机,其实就是多个group可以从属于一个container,而group下的所有设备也随着该group从属于该container。这样能够做到DMA隔离,避免一个container里的device通过DMA来攻击获取另一个container里的数据。</p><p>对于一个PCI设备0000:06:0d.0::,通过readlink可以在sys文件目录下获取其iommu_group,比如该PCI设备在ID为26的IOMMU group中。</p><pre><code>$ readlink /sys/bus/pci/devices/0000:06:0d.0/iommu_group
../../../../kernel/iommu_groups/26
</code></pre><p>设备挂载在pci bus下,可以使用 vfio-pci 来管理这个group。使用vfio-pci来管理设备时,首先从原来的驱动里unbind该PCI设备,然后将id写入新的vfio-pci路径下,会为这个group创建一个字符设备。</p><pre><code>$ lspci -n -s 0000:06:0d.0
06:0d.0 0401: 1102:0002 (rev 08)
$ echo 0000:06:0d.0 &gt; /sys/bus/pci/devices/0000:06:0d.0/driver/unbind
$ echo 1102 0002 &gt; /sys/bus/pci/drivers/vfio-pci/new_id
</code></pre><p>当设备绑定到vfio之后,在/dev/vfio/路径下面会产生一个新的group id,通过该id可以获取到group,完成以下操作:</p><ul><li>查询group状态,是否所有设备都绑定到vfio驱动</li><li>设置group的container</li><li>根据设备的BDF号为设备分配一个文件描述符</li></ul><pre><code>struct vfio_group_status group_status =
                { .argsz = sizeof(group_status) };
/* Open the group */
group = open("/dev/vfio/26", O_RDWR);
/* Test the group is viable and available */
ioctl(group, VFIO_GROUP_GET_STATUS, &amp;group_status);
if (!(group_status.flags &amp; VFIO_GROUP_FLAGS_VIABLE))
    /* Group is not viable (ie, not all devices bound for vfio) */
/* Add the group to the container */
ioctl(group, VFIO_GROUP_SET_CONTAINER, &amp;container);
/* Get a file descriptor for the device */
device = ioctl(group, VFIO_GROUP_GET_DEVICE_FD, "0000:06:0d.0");
</code></pre><h2>VFIO Device</h2><pre><code>struct vfio_device {
    struct kref            kref;
    struct device            *dev;
    const struct vfio_device_ops    *ops;
    struct vfio_group        *group;
    struct list_head        group_next;
    void                *device_data;
};
</code></pre><p>为了兼顾platform和pci设备,vfio统一对外提供<code>struct vfio_device</code>来描述vfio设备,并用device_data来指向如<code>struct vfio_pci_device</code>。Device即设备,但与真正的物理设备有区别的是,对于一个在硬件上独立的设备,单独构成一个iommu group,而如果是multi-function的设备,多个function之间是互联的,相互可以访问对方的数据,所以必须放到一个group里面。</p><p>通过group的ioctl操作和设备的的BDF号获取到设备描述符之后,在vfio_pci中有对应描述符的内核操作vfio_pci_ops,这个ops是在vfio_pci设备驱动vfio_pci_probe调用的时候注册到PCI设备的,probe的时候还会将设备加入到对应的group中。vfio_pci设备的ops中比较重要的是 vfio_pci_ioctl函数,提供了如下功能:</p><ul><li>VFIO_DEVICE_GET_INFO:获取设备信息,region数量、irq数量等</li><li>VFIO_DEVICE_GET_REGION_INFO:获取vfio_region的信息,包括配置空间的region和bar空间的region等</li><li>VFIO_DEVICE_GET_IRQ_INFO:获取设备中断相关的信息</li><li>VFIO_DEVICE_SET_IRQS:完成中断相关的设置</li><li>VFIO_DEVICE_RESET:设备复位</li><li>VFIO_DEVICE_GET_PCI_HOT_RESET_INFO:获取PCI设备hot reset信息</li><li>VFIO_DEVICE_PCI_HOT_RESET:设置PCI设备 hot reset</li><li>VFIO_DEVICE_IOEVENTFD:设置ioeventfd</li></ul><p>要暴露设备的能力到用户态空间,要让用户态能够直接访问设备配置空间并处理设备中断,对于PCI设备而言,其配置其配置空间是一个VFIO region,对应着一块MMIO内存,通过建立dma重映射让用户态能够直接访问设备配置空间,另外还需要建立中断重映射以让用户态驱动处理设备中断事件。</p><pre><code>struct vfio_device_info device_info = { .argsz = sizeof(device_info) };
/* Get a file descriptor for the device */
device = ioctl(group, VFIO_GROUP_GET_DEVICE_FD, "0000:06:0d.0");
/* Test and setup the device */
ioctl(device, VFIO_DEVICE_GET_INFO, &amp;device_info);
for (i = 0; i &lt; device_info.num_regions; i++) {
    struct vfio_region_info reg = { .argsz = sizeof(reg) };
    reg.index = i;
    ioctl(device, VFIO_DEVICE_GET_REGION_INFO, &amp;reg);
    /* Setup mappings... read/write offsets, mmaps
        * For PCI devices, config space is a region */
}
for (i = 0; i &lt; device_info.num_irqs; i++) {
    struct vfio_irq_info irq = { .argsz = sizeof(irq) };
    irq.index = i;
    ioctl(device, VFIO_DEVICE_GET_IRQ_INFO, &amp;irq);
    /* Setup IRQs... eventfds, VFIO_DEVICE_SET_IRQS */
}
/* Gratuitous device reset and go... */
ioctl(device, VFIO_DEVICE_RESET);
</code></pre><h2>Container,group和device绑定</h2><p>1.VFIO_SET_IOMMU: Container 绑定 IOMMU:</p><p>首先,VFIO的Container和IOMMU之间的绑定,通过在用户态通过ioctl调用VFIO_SET_IOMMU完成,绑定意味着将container管理的所有group都attach到IOMMU中,最终会将每个group中的每个设备都attach到IOMMU中,这意味着为设备建立IO页表完成初始化</p><pre><code>ioctl(container, VFIO_SET_IOMMU, VFIO_TYPE1_IOMMU)
    vfio_ioctl_set_iommu
        list_for_each_entry(group, &amp;container-&gt;group_list, container_next) {
        ret = driver-&gt;ops-&gt;attach_group(data, group-&gt;iommu_group);
            __iommu_attach_group
                ret = __iommu_group_for_each_dev(group, domain,
                     iommu_group_do_attach_device);
                        __iommu_attach_device
                            arm_smmu_attach_dev
                                建立设备的IO页表
</code></pre><p>2.VFIO\_GROUP\_SET_CONTAINER: 将Group设置到对应的Container:</p><p>VFIO提供接口由用户态指定Group绑定到哪个Container中,这个绑定操作会将group记录到container的链表中进行管理,并且如果已经设置好了vfio\_iommu\_driver,会进行group的attach操作,并进而完成该group中的设备的IO页表初始化</p><pre><code>VFIO_GROUP_SET_CONTAINER:
    vfio_group_set_container
        driver = container-&gt;iommu_driver;
        if (driver) {
            ret = driver-&gt;ops-&gt;attach_group(container-&gt;iommu_data,
                            group-&gt;iommu_group);
            if (ret)
                goto unlock_out;
        }
        group-&gt;container = container;
        container-&gt;noiommu = group-&gt;noiommu;
        list_add(&amp;group-&gt;container_next, &amp;container-&gt;group_list);
</code></pre><p>3.Device和Group之间的绑定关系源自设备和IOMMU的物理拓扑结构</p><h2>小结</h2><p>VFIO内核组件的实现与Linux内核的IOMMU、设备模型等紧密相连,通过抽象出VFIO的概念来完成对Linux内核组件的封装。本文主要通过VFIO的用户态接口的使用来介绍了VFIO的几个基本概念,包括VFIO Container、Group和Device。要让物理设备通过VFIO驱动暴露给用户态,需要完成以下步骤:</p><ul><li>首先将设备与原有驱动进行解绑,并重新绑定到VFIO驱动,VFIO驱动会为设备指定对应的group,设备属于哪个IOMMU group与设备和IOMMU的物理拓扑结构有关。</li><li>完成上述绑定之后,用户态驱动就可以通过<code>/dev/vfio/vfio</code>获取到VFIO 的container,设置vfio_iommu_driver的类型,通过container可以间接访问IOMMU完成dma映射。</li><li>然后可以通过<code>/dev/vfio/%group_id</code>获取到设备所属的group,通过ioctl将该group上的所有设备加入到container中。</li><li>然后通过group和设备BDF号可以获取到VFIO device的fd,并通过vfio提供的接口访问设备的配置空间和irq信息等,完成在用户态访问物理设备。</li></ul><p>VFIO设备直通有几个关键问题需要关注,如何访问直通设备的IO地址空间,如何完成中断重映射和DMA重映射让用户态驱动访问物理设备能力.</p><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2Fwxggg%2F2020-11-29-vfio-passthrough-1.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000380076">DAOS ARM64调测之旅</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000376121">回顾2022年计算机视觉领域最激动人心的进展</a></li><li><a href="https://aijishu.com/a/1060000000375922">量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!</a></li><li><a href="https://aijishu.com/a/1060000000375779">自制深度学习推理框架-前言-第一课</a></li><li><a href="https://aijishu.com/a/1060000000375145">YOLOv6精度提升的又一根稻草,感知量化的重参再设计,QARep值得内卷</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Tue, 17 Jan 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000380640</guid>
            <link>https://aijishu.com//a/1060000000380640</link>
        </item>
        <item>
            <title><![CDATA[DAOS ARM64调测之旅]]></title>
            <description><![CDATA[<p>背景概述</p><p>从IO500榜单上了解到,前10名有一半是DAOS,这是什么样一款存储软件,能如此优秀?从HDD到SSD,仅仅是性能提升、延迟降低,从SSD到SCM,不仅仅是性能提升,还支持按字节事务性访问,异常后回滚。SCM不带DMA,访问过程消耗大量的CPU资源,从软件架构上优化,就是想办法减少拷贝过程,诞生了RDMA零拷贝;从硬件上优化,intel推出了DSA加速器。DAOS+SCM新架构值得在ARM64上尝试。</p><h2>编译问题</h2><p>DAOS官网上明确说仅支持x86+Optane内存+NVMe SSD商用化,同时提供了用内存模拟Optane内存的实验特性。ARM64跑DAOS就有了可能。我们首先进行了版本编译,碰到了静态检查结构体大小报错。通过分析发现根因是pthread\_mutex在不同平台上,长度是不一样的,x86 64是40字节,ARM64是48字节,多了8字节,触发了结构体大小断言报错。提问题单,社区帮忙调整数据结构解决了断言错误。接下来就是依赖的SPDK组件编译报错,DAOS设置spdk\_arch是x86,修改为读编译主机arch,是ARM64就使用native方式编译,解决了SPDK编译报错问题。再下来是缺少libipmctl.so,ipmctl是intel Optane的管理工具,只有x86版本,ARM64需要去掉libipmctl依赖,增加ipmctl空接口后,解决了依赖报错问题。telemetry的go代码限制只有amd64编译,修改为amd64、arm64都编译。最后一个问题是Dup2在ARM64上不支持,使用Dup3来支持Dup2。</p><h2>IO500调测</h2><p>版本编译出来后,在ARM64上部署测试,一跑就挂死,调用栈是问号,打开所有调试信息,每次挂死前都是在mercury网络模块,无法进一步定位。直觉判定可能是内核页大小问题导致的,x86只支持4K页,ARM64支持4K、16K、64K页,改成4K页后,就能正常跑起来不挂死了。又出现了新问题,找不到网络接口,异常退出了。看日志,不支持bond、vlan等虚拟网络设备,改成使用物理网卡后,网络正常识别,集群正常起来。不一会就出现网络超时故障,查看日志有的是4秒超时,有的是请求发出去立即就超时了,看起来是集群间时间没有同步,对端收到后时间差超过超时门限,触发超时流程,时间同步后,几秒超时问题消失。跑一段时间后还是出现超时,且系统明显卡顿,查看CPU并不忙,查看内存free情况,发现内存很少,perf抓火焰图,发现内存申请走了慢路径申请,减少模拟Optane的内存大小后,网络超时问题消失。IO500测试60~70秒左右,就出现集群空间满,测试终止。查看SCM空间已用完,NVMe空间剩余还很大。上社区论坛查到,元数据只保留在SCM上,SCM空间不足也不会转存到NVMe中,直接上报空间不足错误。只能加大物理内存,从256GB加到512GB后,保留了更多的内存,IO500能测试到200秒左右还是耗光了SCM,IO500需要测试300秒,成绩才是有效的,因此需要想办法减少SCM空间使用。从DAOS架构图上看到SCM内存用来存放元数据、非对齐的数据、小块数据,查看代码,小块数据默认是4K以下就存SCM。修改容器属性,io门限值降低到2K,这样IO500终于能测试完。增加target个数,增加并发度,又出现了SCM耗尽,仔细读DAOS文档,提到每个target会预留SCM、NVMe内存做聚合使用,查看代码找到了SCM会保留2GB、NVMe保留10GB,没有设置接口,直接修改代码SCM保留512MB,每个target节省了1.5GB,一个rank 16个target共节省了24GB内存,每个rank总共分配了90GB,节省了26%的内存。IO500跑完再没出现过SCM耗尽,性能也得到了大幅提升。逐步增加客户端个数,发现mdtest部分测试项随着并发度增加能一直增加,说明客户端有瓶颈,10台客户端里有4台性能较差,更换性能更好的客户端后,性能进一步提升。开启端到端校验后测试,发现sha512新建容器大概率失败,X86每次都是成功的。执行isal_crypto下的sha512测试用例,都是通过的。看github问题列表,发现2021年就有人上报了在ARM64上sha512值错误并提供了测试程序。分析sha512代码,发现缺少了多次更新不足一块数据的追加处理,修复后,测试程序通过,DAOS端到端sha512校验也通过了。</p><h2>功能验证</h2><p>由于IO500只跑性能,没有校验数据是否正确,我们通过复制大量不同大小的文件到DAOS文件系统,重启DAOS集群后,再复制回来,检查前后的md5值是否一致,来校验数据是否正确。前后md5值是一致的,确认数据一致性没有问题。压力测试大概率出现复制回来过程中,服务端coredump,看log是池版本号为NULL触发断言,待分析。扩展测试了2/3副本、EC 2+1 2+2 4+2,数据校验均正确。</p><p>在社区上看到DAOS计划用容器来支持块设备,目前容器不支持预先指定容量。DAOS提供dfs插件支持fio测试,实际还是文件系统,并不是块设备。fio测试了单IO时延,写4K随机写110us、读160us、混合读写150us,接近100us。单台服务器4K多并发随机写测试420K IOPS。fusionstorage、阿里云已经能做到50us,100万IOPS,看来还有优化空间。</p><p>ARM64运行DAOS还有哪些问题?我们执行了daos_test、run_test.sh,跟x86对比测试,发现ARM64上出现vos小io测试错误、epoch错误、对象检查错误,分析测试代码,发现是测试代码本身的问题,x86能通过是因为局部变量初始值是0,ARM64初始值是随机的,修改测试代码后,这三个用例能通过。还发现EC一个用例失败,正在分析中,其他测试都跟x86一致。</p><h2>总结展望</h2><p>DAOS ARM64调测过程总体来说,比较顺利,主要是断言比较多,能快速定位问题。大量使用spdk、isal、isal_ctypto,pmdk模块,ARM64已经很好的适配过这些模块,因此很少补丁改动,即可在arm64上编译通过,运行稳定。dashboard使用promethues+grafana,性能测试过程可视化,方便诊断性能。每个target单线程,没有多线程并发冲突问题,也就没有ARM64弱序问题。问题分析过程中,大量参考了DAOS社区问题单,分析步骤详细,提供了分析思路。</p><p>后续重点在社区添加ARM64 CI,覆盖多种OS编译、单元测试,定期取主线版本进行性能测试。使用内存备电验证pmdk刷cache、数据校验正确性验证。社区版本支持UCX、NVMe of RDMA模块后,进行ARM64UCX、NoF功能测试。</p><h2>ARM64补丁列表</h2><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F8998" target="blank">DAOS-10569 client: fix build on aarch64</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F8984" target="blank">DAOS-10148 tse: fix TSE task buffer to account for aarch64</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9398" target="blank">DAOS-10871 build: Fix aarch64 build SPDK error</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9401" target="blank">DAOS-10872 control: Fix aarch64 build control errors</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9505" target="blank">DAOS-10922 control: Implement ipmctl for aarch64</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9487" target="blank">DAOS-10899 test: use expected variable to do assert checking</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9486" target="blank">DAOS-10898 obj: fix the assert in small_io test</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9456" target="blank">DAOS-10891 tests: fix incorrect assert in check_oclass</a></p><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2Ffengchunsong%2FDAOS%2520ARM64%E8%B0%83%E6%B5%8B%E4%B9%8B%E6%97%85.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000376121">回顾2022年计算机视觉领域最激动人心的进展</a></li><li><a href="https://aijishu.com/a/1060000000375922">量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!</a></li><li><a href="https://aijishu.com/a/1060000000375779">自制深度学习推理框架-前言-第一课</a></li><li><a href="https://aijishu.com/a/1060000000375145">YOLOv6精度提升的又一根稻草,感知量化的重参再设计,QARep值得内卷</a></li><li><a href="https://aijishu.com/a/1060000000374982">xNN:支付宝端侧深度学习框架</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Thu, 12 Jan 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000380076</guid>
            <link>https://aijishu.com//a/1060000000380076</link>
        </item>
        <item>
            <title><![CDATA[Virtio协议概述]]></title>
            <description><![CDATA[<p>摘要</p><p>半虚拟化设备(Virtio Device)在当前云计算虚拟化场景下已经得到了非常广泛的应用, 并且现在也有越来越多的物理设备也开始支持Virtio协议,即所谓的<code>Virtio Offload</code>, 通过将virtio协议卸载到硬件上(例如virtio-net网卡卸载,virtio-scsi卸载)让物理机和虚拟机都能够获得加速体验。 本文中我们来重点了解一下virtio技术中的一些关键点,方便我们加深对半虚拟化的理解。 本文适合对IO虚拟化有一定了解的人群阅读,本文的目的是对想要了解virtio内部机制的读者提供帮助。</p><p>在开始了解virtio之前,我们先思考一下几个相关问题:</p><ul><li>virtio设备有哪几种呈现方式?</li><li>virtio-pci设备的配置空间都有哪些内容?</li><li>virtio前端和后端基于共享内存机制进行通信,它是凭什么可以做到无锁的?</li><li>virtio机制中有那几个关键的数据结构?virtio配置接口存放在哪里?virtio是如何工作的?</li><li>virtio前后端是如何进行通信的?irqfd和ioeventfd是什么回事儿?在virtio前后端通信中是怎么用到的?</li><li>virtio设备支持MSIx,在qemu/kvm中具体是怎么实现对MSIx的模拟呢?</li><li>virtio modern相对于virtio legay多了哪些新特性?</li></ul><h2>0. 简单了解一下Virtio Spec协议</h2><p>virtio协议标准最早由IBM提出,virtio作为一套标准协议现在有专门的技术委员会进行管理, 具体的标准可以访问<a href="https://aijishu.com/link?target=http%3A%2F%2Fdocs.oasis-open.org%2Fvirtio%2Fvirtio%2Fv1.0%2Fvirtio-v1.0.html" target="blank"><code>virtio</code>官网</a>, 开发者可以向技术委员会提供新的virtio设备提案(<code>RFC</code>),经过委员会通过后可以增加新的virtio设备类型。</p><p>组成一个virtio设备的四要素包括:<strong>设备状态域,<code>feature bits</code>,设备配置空间,一个或者多个<code>virtqueue</code></strong>。 其中设备状态域包含6种状态:</p><ul><li>ACKNOWLEDGE(1):GuestOS发现了这个设备,并且认为这是一个有效的virtio设备;</li><li>DRIVER (2) : GuestOS知道该如何驱动这个设备;</li><li>FAILED (128) : GuestOS无法正常驱动这个设备,Something is wriong;</li><li>FEATURES_OK (8) : GuestOS认识所有的feature,并且feature协商一完成;</li><li>DRIVER_OK (4) : 驱动加载完成,设备可以投入使用了;</li><li>DEVICE_NEEDS_RESET (64) :设备触发了错误,需要重置才能继续工作。</li></ul><p><code>feature bits</code>用来标志设备支持那个特性,其中bit0-bit23是特定设备可以使用的<code>feature bits</code>, bit24-bit37预给队列和feature协商机制,bit38以上保留给未来其他用途。 例如:对于virtio-net设备而言,feature bit0表示网卡设备支持checksum校验。<code>VIRTIO_F_VERSION_1</code>这个feature bit用来表示设备是否支持virtio 1.0 spec标准。</p><p>在virtio协议中,所有的设备都使用virtqueue来进行数据的传输。<strong>每个设备可以有0个或者多个virtqueue,每个virtqueue占用2个或者更多个4K的物理页</strong>。 virtqueue有<code>Split Virtqueues</code>和<code>Packed Virtqueues</code>两种模式, 在<code>Split virtqueues</code>模式下virtqueue被分成若干个部分, 每个部分都是前端驱动或者后端单向可写的(不能两端同时写)。 每个virtqueue都有一个16bit的queue size参数,表示队列的总长度。 每个virtqueue由3个部分组成:</p><pre><code>    +-------------------+--------------------------------+-----------------------+
    | Descriptor Table  |   Available Ring  (padding)    |       Used Ring       |
    +-------------------+--------------------------------+-----------------------+
</code></pre><ul><li>Descriptor Table:存放IO传输请求信息;</li><li>Available Ring:记录了Descriptor Table表中的哪些项被更新了,前端Driver可写但后端只读;</li><li>Used Ring:记录Descriptor Table表中哪些请求已经被提交到硬件,前端Driver只读但后端可写。</li></ul><p>整个virtio协议中设备IO请求的工作机制可以简单地概括为:</p><ol><li>前端驱动将IO请求放到<code>Descriptor Table</code>中,然后将索引更新到<code>Available Ring</code>中,然后kick后端去取数据;</li><li>后端取出IO请求进行处理,然后结果刷新到<code>Descriptor Table</code>中再更新<code>Using Ring</code>,然后发送中断notify前端。</li></ol><p>从virtio协议可以了解到<strong>virtio设备支持3种设备呈现模式</strong>:</p><ul><li>Virtio Over PCI BUS,依旧遵循PCI规范,挂在到PCI总线上,作为virtio-pci设备呈现;</li><li>Virtio Over MMIO,部分不支持PCI协议的虚拟化平台可以使用这种工作模式,直接挂载到系统总线上;</li><li>Virtio Over Channel I/O:主要用在s390平台上,virtio-ccw使用这种基于channel I/O的机制。</li></ul><p>其中,Virtio Over PCI BUS的使用比较广泛,作为PCI设备需按照规范要通过PCI配置空间来向操作系统报告设备支持的特性集合, 这样操作系统才知道这是一个什么类型的virtio设备,并调用对应的前端驱动和这个设备进行握手,进而将设备驱动起来。 QEMU会给virtio设备模拟PCI配置空间,对于virtio设备来说PCI Vendor ID固定为0x1AF4, PCI Device ID 为 0x1000到0x107F之间的是virtio设备。 同时,在不支持PCI协议的虚拟化平台上,virtio设备也可以直接通过MMIO进行呈现, virtio-spec 4.2<a href="https://aijishu.com/link?target=https%3A%2F%2Fdocs.oasis-open.org%2Fvirtio%2Fvirtio%2Fv1.1%2Fcsprd01%2Fvirtio-v1.1-csprd01.html%23x1-1440002" target="blank">Virtio Over MMIO</a>有针对virtio-mmio设备呈现方式的详细描述,mmio相关信息可以直接通过内核参数报告给Linux操作系统。 本文主要基于virtio-pci展开讨论。</p><p>前面提到virtio设备有<code>feature bits</code>,<code>virtqueue</code>等四要素,那么在virtio-pci模式下是如何呈现的呢? 从virtio spec来看,老的virtio协议和新的virtio协议在这一块有很大改动。 virtio legacy(virtio 0.95)协议规定,对应的配置数据结构(virtio common configuration structure) 应该存放在设备的BAR0里面,我们称之为<code>virtio legay interface</code>,其结构如下:</p><pre><code>                       virtio legacy ==&gt; Mapped into PCI BAR0
    +------------------------------------------------------------------+
    |                    Host Feature Bits[0:31]                       |
    +------------------------------------------------------------------+
    |                    Guest Feature Bits[0:31]                      |
    +------------------------------------------------------------------+
    |                    Virtqueue Address PFN                         |
    +---------------------------------+--------------------------------+
    |           Queue Select          |           Queue Size           |
    +----------------+----------------+--------------------------------+
    |   ISR Status   | Device Stat    |           Queue Notify         |
    +----------------+----------------+--------------------------------+
    |       MSI Config Vector         |         MSI Queue Vector       |
    +---------------------------------+--------------------------------+
</code></pre><p>对于新的<code>virtio modern</code>,协议将配置结构划分为5种类型:</p><pre><code>/* Common configuration */
#define VIRTIO_PCI_CAP_COMMON_CFG        1
/* Notifications */
#define VIRTIO_PCI_CAP_NOTIFY_CFG        2
/* ISR Status */
#define VIRTIO_PCI_CAP_ISR_CFG           3
/* Device specific configuration */
#define VIRTIO_PCI_CAP_DEVICE_CFG        4
/* PCI configuration access */
#define VIRTIO_PCI_CAP_PCI_CFG           5
</code></pre><p>以上的每种配置结构是直接映射到virtio设备的BAR空间内,那么如何指定每种配置结构的位置呢? 答案是通过<code>PCI Capability list</code>方式去指定,这和物理PCI设备是一样的,体现了virtio-pci的协议兼容性。</p><pre><code>struct virtio_pci_cap {
        u8 cap_vndr;    /* Generic PCI field: PCI_CAP_ID_VNDR */
        u8 cap_next;    /* Generic PCI field: next ptr. */
        u8 cap_len;     /* Generic PCI field: capability length */
        u8 cfg_type;    /* Identifies the structure. */
        u8 bar;         /* Where to find it. */
        u8 padding[3];  /* Pad to full dword. */
        le32 offset;    /* Offset within bar. */
        le32 length;    /* Length of the structure, in bytes. */
};
</code></pre><p>只是略微不同的是,virtio-pci的Capability有一个统一的结构, 其中<code>cfg_type</code>表示Cap的类型,bar表示这个配置结构被映射到的BAR空间号。 这样每个配置结构都可以通过BAR空间直接访问,或者通过PCI配置空间的<code>VIRTIO_PCI_CAP_PCI_CFG</code>域进行访问。 每个Cap的具体结构定义可以参考virtio spec 4.1.4.3小节。</p><h1>1. 前后端数据共享</h1><p>传统的纯模拟设备在工作的时候,会触发频繁的陷入陷出, 而且IO请求的内容要进行多次拷贝传递,严重影响了设备的IO性能。 virtio为了提升设备的IO性能,采用了共享内存机制,<strong>前端驱动会提前申请好一段物理地址空间用来存放IO请求,然后将这段地址的GPA告诉QEMU</strong>。 前端驱动在下发IO请求后,QEMU可以直接从共享内存中取出请求,然后将完成后的结果又直接写到虚拟机对应地址上去。<strong>整个过程中可以做到直投直取,省去了不必要的数据拷贝开销</strong>。</p><p><strong><code>Virtqueue</code>是整个virtio方案的灵魂所在</strong>。每个virtqueue都包含3张表,<code>Descriptor Table</code>存放了IO请求描述符,<code>Available Ring</code>记录了当前哪些描述符是可用的,<code>Used Ring</code>记录了哪些描述符已经被后端使用了。</p><pre><code>                          +------------------------------------+
                          |       virtio  guest driver         |
                          +-----------------+------------------+
                            /               |              ^
                           /                |               \
                          put            update             get
                         /                  |                 \
                        V                   V                  \
                   +----------+      +------------+        +----------+
                   |          |      |            |        |          |
                   +----------+      +------------+        +----------+
                   | available|      | descriptor |        |   used   |
                   |   ring   |

...

@github-actions
Copy link
Contributor

http://localhost:1200/aijishu/blog/readings - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[极术读书 - 极术社区]]></title>
        <link>https://aijishu.com//api/blog/1070000000080366/contents?page=1</link>
        <atom:link href="http://localhost:1200/aijishu/blog/readings" rel="self" type="application/rss+xml" />
        <description><![CDATA[极术读书 - 极术社区 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 15:15:30 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[免费国家精品课程:《嵌入式系统及应用》MOOC在线课程,第13次开课!]]></title>
            <description><![CDATA[<blockquote>极术读书是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>。</blockquote><p>和安谋科技技术人才生态有非常深入合作的苏州大学王宜怀教授,正在授课的基于Arm® Cortex®-M处理器的<strong>《嵌入式系统及应用》在线开放课程</strong>一直是我们极力推荐的。该课程连续几年被评为<strong>国家精品课程</strong>。</p><p>嵌入式系统是嵌入式人工智能与物联网的重要基础,该课程以Arm Cortex-M微处理器为蓝本,以软硬件构件为主线,基于嵌入式软件工程基本原理,按照"<strong>通用知识—驱动构件使用方法—测试实例—芯片编程结构—构件设计方法</strong>”的线条,逐步阐述嵌入式系统基本知识要素及较为规范的底层软硬件相结合的设计方法。</p><p><strong>目前是本课程的第13次开课,开课时间是2023年02月20日 ~ 2023年06月16日。</strong>如果你想掌握构成计算机的基本部件原理,掌握计算机高级程序设计方法,为从寄存器级理解软件干预硬件提供基础,那就赶快查看下方信息,报名学习吧!现在加入还来得及喔~</p><h2>《嵌入式系统及应用》在线开放课程</h2><p><a href="https://v.qq.com/x/page/j3325qf1xro.html">https://v.qq.com/x/page/j3325qf1xro.html</a></p><p>本视频由授课教师提供</p><h3><strong>01 基本介绍</strong></h3><ul><li><strong>课程名称:</strong>《嵌入式系统及应用》</li><li><strong>授课单位:</strong>苏州大学</li><li><strong>授课教师:</strong>王宜怀、张建、刘长勇</li><li><strong>在线学习网址:</strong>  <a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.icourse163.org%2Fcourse%2FSUDA-1001754273" target="blank">[<strong>爱课程-中国大学MOOC</strong>]</a></li><li><strong>本次开课时间:</strong>2023年02月20日 ~ 2023年06月16日</li></ul><h3>02 课程概述</h3><p>《嵌入式系统及应用》课程作为嵌入式人工智能与物联网相关专业的基础课程,以Arm Cortex-M微处理器为蓝本,采用构件化开发,针对每个知识点,提供样本程序(葫芦),学生通过模仿该程序稍加修改后可完成符合自我要求的程序(照葫芦画瓢)。课程按照<strong>“通用知识—驱动构件使用方法—测试实例—芯片编程结构—构件设计方法”</strong>的线条,逐步阐述嵌入式系统基本知识要素及较为规范的底层软硬件相结合的设计方法。</p><h3>03 课程用书</h3><p>本课程教学用书《嵌入式技术基础与实践(第6版)—基于STM32L431微控制器》,该教材历经十多年凝练,仔细梳理了嵌入式系统的通用基础知识要素,注重把握通用知识与芯片相关知识之间的平衡、把握硬件与软件的关系、对底层驱动进行构件化封装、设计合理的测试用例,教材内含简明实验套件,结合网上电子资源,方便读者进行实践与应用。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbqNk" alt="51546da303679fd168b5fe7d75d10e65.jpg" title="51546da303679fd168b5fe7d75d10e65.jpg"></p><p><strong>《嵌入式技术基础与实践(第6版)》(王宜怀主编)</strong></p><blockquote>【书内含通用嵌入式计算机GEC,型号:AHL-STM32L431,可完成书中基本实验】</blockquote><p><strong>电子资源下载地址及路径:</strong></p><p>“<a href="https://aijishu.com/link?target=https%3A%2F%2Fsumcu.suda.edu.cn%2F" target="blank">https://sumcu.suda.edu.cn/</a>”→“金葫芦专区”→“嵌入式书6版”,右边为下载索引</p><p><strong>点击<a href="https://aijishu.com/link?target=https%3A%2F%2Ftuicashier.youzan.com%2Fpay%2Fwscgoods_order%3Fbanner_id%3Dseach.16152946%7Esearch%7E7%7E7LEMSxlm%26words%3D%E5%B5%8C%E5%85%A5%E5%BC%8F%26alg%3D0%26slg%3Dconsumer-search%2CstandardModify%2C30be7fd3-df55-4535-c709-11c1b3a78e09%2C711.545_c9498a9569324a1ab4d18b403e0cc497%26reft%3D1630934839602%26spm%3Dseach.16152946%26is_share%3D1%26shopAutoEnter%3D1%26sl%3D3NTPzP%26from_params%3Dsl%7E3NTPzP%21online_kdt_id%7E16152946%26sub_kdt_id%3D16152946%26st%3D3%26alias%3D3f579wrkbwq9es4%26is_silence_auth%3D1" target="blank">链接</a>即可购买教材:</strong></p><h3><strong>04 课程大纲</strong></h3><p><strong>01 概述</strong></p><p>1.1 初识嵌入式系统<br>1.2 嵌入式系统的定义、发展简史、分类及特点<br>1.3 嵌入式系统的学习困惑、知识体系及学习建议<br>1.4 微控制器与应用处理器简介<br>1.5 嵌入式系统常用术语</p><p><strong>02 Arm Cortex-M4微处理器</strong></p><p>2.1 Arm Cortex-M4微处理器简介<br>2.2 寻址方式与机器码的获取方法<br>2.3 基本指令分类解析<br>2.4 汇编语言的基本语法</p><p><strong>03 存储器映像、中断源与硬件最小系统</strong></p><p>3.1 STM32L系列MCU概述<br>3.2 STM32L4的引脚图与硬件最小系统<br>3.3 由MCU构建通用嵌入式计算机</p><p><strong>04 GPIO及程序框架</strong></p><p>4.1 GPIO通用基础知识<br>4.2 软件干预硬件的方法<br>4.3 认识工程框架<br>4.4 GPIO构件的制作过程<br>4.5 第一个汇编语言工程:控制小灯闪烁<br>4.6 实验一 熟悉实验开发环境及GPIO编程</p><p><strong>05 嵌入式硬件构件与底层驱动构件基本规范</strong></p><p>5.1 嵌入式硬件构件<br>5.2 嵌入式底层驱动构件的概念与层次模型<br>5.3 底层驱动构件的封装规范<br>5.4 硬件构件及其驱动构件的复用与移植方法</p><p><strong>06 串行通信模块及第一个中断程序结构</strong></p><p>6.1 异步串行通信的通用基础知识<br>6.2 基于构件的串行通信编程方法<br>6.3 UART构件的制作过程<br>6.4 中断机制及中断编程步骤<br>6.5 实验二 串口通信及中断实验</p><p><strong>07 定时器相关模块</strong></p><p>7.1 定时器通用基础知识<br>7.2 STM32L431中的定时器<br>7.3 脉宽调制<br>7.4 输入捕捉与输出比较<br>7.5 实验三 定时器及PWM实验</p><p><strong>08 Flash在线编程、ADC与DAC  </strong></p><p>8.1 Flash在线编程  <br>8.2 ADC<br>8.3 DAC<br>8.4 实验四 ADC实验</p><p><strong>09&nbsp;SPI、I2C与TSC模块  </strong></p><p>9.1 串行外设接口SPI模块  <br>9.2 集成电路互联总线I2C模块<br>9.3 触摸感应控制器TSC模块<br>9.4 实验五 SPI通信实验</p><p><strong>10 CAN总线、DMA与位带操作</strong>  </p><p>10.1 CAN总线<br>10.2 DMA<br>10.3 位带操作</p><p><strong>11 系统时钟与其他功能模块</strong>  </p><p>11.1 时钟系统<br>11.2 复位模块与看门狗模块<br>11.3 电源控制模块与CRC校验模块<br>11.4 实验六 综合实验</p><p><strong>12 应用案例  </strong></p><p>12.1 嵌入式系统稳定性问题<br>12.2 外接传感器及执行部件的编程方法<br>12.3 实时操作系统的简明实例<br>12.4 嵌入式人工智能的简明实例<br>12.5 NB-IoT的应用简介<br>12.6 4G、Cat1、Wi-Fi及WSN的应用</p><h3><strong>05 预备知识</strong></h3><p>必须具备以下知识:</p><ul><li>计算机硬件基础(或模拟电路与数字电路、计算机组成、汇编语言、微机原理)</li><li>高级程序语言设计等(如C语言)</li></ul><p>学生通过学习上述课程,基本掌握构成计算机的基本部件原理,掌握计算机高级程序设计方法,为从寄存器级理解软件干预硬件提供基础。</p>
                                                    ]]></description>
            <pubDate>Wed, 22 Feb 2023 15:15:29 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000385950</guid>
            <link>https://aijishu.com//a/1060000000385950</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】2023年元宵50本《嵌入式系统设计》赠书名单公布]]></title>
            <description><![CDATA[<p>2023年元宵节,极术社区联合安谋科技组织了<a href="https://aijishu.com/e/1120000000381671">【元宵赠书】50本《嵌入式系统设计—基于Cortex-M处理器与RTOS构建》新书免费领</a>,获得了很多工程师的支持。下面将中奖名单公布如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLPU" alt="1675672651957.jpg" title="1675672651957.jpg"></p><p>恭喜上面的中奖者,极术读书工作人员稍后将会发送邮件给中奖人员,请注意查收邮件。没有中奖的用户也不用灰心,极术读书会定期组织精选好书的活动,欢迎关注。</p>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000383140</guid>
            <link>https://aijishu.com//a/1060000000383140</link>
        </item>
        <item>
            <title><![CDATA[9位院士12位专家联合撰文:智能计算的新进展、挑战与未来 | Science合作期刊]]></title>
            <description><![CDATA[<blockquote>文章作者:允中  <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2Fd7PpTEHjfH33fVRTsOaucg" target="blank">量子位</a></blockquote><p>2023年1月3日,海内外9位院士及12位专家在Science《科学》合作期刊Intelligent Computing发表长篇综述论文《智能计算的最新进展、挑战和未来》。文章全面阐述了智能计算的理论基础、智能与计算的技术融合、重要应用、重大挑战和未来前景,将为学术界和工业界的相关研究人员提供全方位的参考和对智能计算领域的指引性见解。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKa" alt="image.png" title="image.png"></p><p>论文地址:<a href="https://aijishu.com/link?target=https%3A%2F%2Fspj.science.org%2Fdoi%2F10.34133%2Ficomputing.0006" target="blank">https://spj.science.org/doi/10.34133/icomputing.0006</a></p><h2>简介</h2><p>人类社会正从信息社会进入智能社会,计算已成为推动社会发展的关键要素。在万物互联的数字文明新时代,传统的基于数据的计算已经远远不能满足人类对更高智能水平的追求。</p><p>近年来,计算和信息技术飞速发展,深度学习的空前普及和成功将人工智能(AI)确立为人类探索机器智能的前沿领域。自此产生了一系列突破性的研究成果,包括Yann LeCun提出的卷积神经网络和Yoshua Bengio在深度学习因果推理领域的成果。</p><p>2016年3月,DeepMind推出的AI围棋程序<strong>AlphaGo</strong>与世界顶尖围棋高手李世石对战,在世界范围内引起了前所未有的关注。这场划时代的人机大战以AI的压倒性胜利而告终,成为将AI浪潮推向全新高度的催化剂。</p><p>AI的另一个重要推动者是<strong>大型预训练模型的出现</strong>,这些模型已经开始广泛应用于自然语言和图像处理,以在迁移学习的帮助下处理各种各样的应用。其中最具代表性的是自然语言处理模型GPT-3,已经证明具有高度结构复杂性和大量参数的大模型可以提高深度学习的性能。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKb" alt="image.png" title="image.png"></p><p>计算能力是支撑智能计算的重要因素之一。面对信息社会中庞大的数据源、异构的硬件配置和不断变化的计算需求,智能计算主要通过<strong>垂直和水平</strong>架构来满足智能任务的计算能力要求。</p><p><strong>垂直架构</strong>的特点是同质化的计算基础设施,主要通过应用智能方法提高资源利用效率来提升计算能力。</p><p>相比之下,<strong>水平架构</strong>对异构和广域计算资源进行协调和调度,使协作计算的效果最大化。例如,2020年4月,针对全球COVID-19研究的计算需求,Folding@home在三周内联合40万名计算志愿者,实现了2.5Exaflops的计算量,超过了世界上任何一台超级计算机。</p><p>尽管在智能和计算方面取得了巨大成功,但我们在这两个领域仍然面临着一些重大挑战:</p><p><strong>智能方面的挑战。</strong></p><p>使用深度学习的AI目前在可解释性、通用性、可进化性和自主性方面面临着重大挑战。与人类智能相比,当前大多数AI技术的作用都很弱,而且只能在特定领域或任务中发挥良好作用。从基于数据的智能升级到更多样化的智能,包括感知智能、认知智能、自主智能和人机融合智能等,也面临着重大的理论和技术挑战。</p><p><strong>计算方面的挑战。</strong></p><p>数字化浪潮带来了应用、连接、终端、用户以及数据量前所未有的增长,所有这些都需要巨大的计算能力。满足如此快速增长的计算能力需求变得越来越具有挑战性。智能社会中的巨型任务依赖于各种特定计算资源的高效组合。此外,传统的硬件模式不能很好地适应智能算法,制约了软件的发展。</p><p>迄今为止,智能计算还没有一个被普遍接受的定义。考虑到世界的三个基本空间,即人类社会空间、物理空间和信息空间日益紧密融合,我们从解决复杂的科学和社会问题的角度提出了智能计算的新定义:</p><blockquote><strong>智能计算是支撑万物互联的数字文明时代新的计算理论方法、架构体系和技术能力的总称。智能计算根据具体的实际需求,以最小的代价完成计算任务,匹配足够的计算能力,调用最好的算法,获得最优的结果。</strong></blockquote><p>智能计算的新定义是为响应人类社会、物理世界和信息空间三元融合快速增长的计算需求而提出的。智能计算以人为本,追求高计算能力、高能效、智能和安全。其目标是提供通用、高效、安全、自主、可靠、透明的计算服务,以支持大规模、复杂的计算任务。图1为智能计算的整体理论框架,它体现了支持人类社会—物理世界—信息空间集成的多种计算范式。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKc" alt="image.png" title="image.png"></p><h2>智能计算基础</h2><p>智能计算是数字文明时代支撑万物互联的新型计算理论方法、架构体系和技术能力的总称。利用智能计算可以实现许多经典和前沿研究领域的创新,以解决复杂的科学和社会问题。智能计算的基本要素包括人的智能、机器的能力以及由万物组成的物理世界。</p><p>在理论框架中,人是智能计算的核心和智慧的源泉,代表着原始的、与生俱来的智能,称为<strong>元智能</strong>。</p><p>元智能包括理解、表达、抽象、推理、创造和反思等人类高级能力,其中包含人类积累的知识。元智能以碳基生命为载体,是由个体和生物群体经过百万年的进化产生的,它包括生物具身智能、脑智能(尤其是人脑)和群体智能。所有的智能系统都是由人类设计和建造的。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKd" alt="image.png" title="image.png"></p><p>因此,在智能计算的理论体系中,人类的智慧是智能的源泉,计算机是人类智能的赋能。我们称计算机的智能为<strong>通用智能</strong>。</p><p>通用智能代表计算机解决具有广泛外延的复杂问题的能力,以硅基设施为载体,由个体和群体计算设备产生。生物智能可以在以下四个层次上移植到计算机上:数据智能、感知智能、认知智能和自主智能。元智能和通用智能如图2所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKe" alt="image.png" title="image.png"></p><p>智能计算面临大场景、大数据、大问题、泛在需求的挑战。算法模型变得越来越复杂,需要超级计算能力来支持越来越大的模型训练。目前,计算资源已经成为提高计算机智能研究水平的障碍。随着智能算法的发展,拥有丰富计算资源的机构可能形成系统的技术垄断。经典的超级计算机已经难以满足AI对计算能力的需求。</p><p>虽然通过算法优化可以在一定程度上降低算力需求,但并不能从根本上解决这个问题。需要从架构、加速模块、集成模式、软件栈等多个维度进行全面优化,如图3所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKf" alt="image.png" title="image.png"></p><p>智能计算在理论技术上具有以下特点(图4):理论技术上的自学习和可进化性,架构上的高计算能力和高能效,系统方法上的安全性和可靠性,运行机制上的自动化和精确性,以及服务性上的协作和泛在性。智能计算包括两个本质方面:<strong>智能和计算,两者相辅相成</strong>。</p><p>智能促进了计算技术的发展,计算是智能的基础。提高计算系统性能和效率的高级智能技术范式是<strong>“智能驱动的计算”</strong>。支持计算机智能发展的高效、强大的计算技术范式是<strong>“面向智能的计算”</strong>。</p><p>两种基本范式从五个方面进行创新,提升计算能力、能源效率、数据使用、知识表达和算法能力,实现泛在、透明、可靠、实时、自动化的服务。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKg" alt="image.png" title="image.png"></p><h2>智能驱动的计算</h2><p>提高计算的普适性对智能计算至关重要。现实场景中的问题,例如模拟、图(gragh)(图5)等,需要进行各种计算。智能计算的另一个关键点是如何提高计算的智能化水平。从经验上来说,我们常常需要向自然界的智能生物学习,计算也不例外,例如三大经典智能方法:人工神经网络(图6)、模糊系统和进化计算,都是受生物智能启发提出的算法。智能计算理论包括但不限于以上几种计算,以实现高度的泛在化和智能化。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKh" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKi" alt="image.png" title="image.png"></p><p>智能系统在开始工作之前,首先要进行<strong>智能感知</strong>。因此,感知智能在所有智能系统中都起着至关重要的作用。感知智能的重点是多模态感知、数据融合、智能信号提取和处理。</p><p>典型的例子包括智慧城市管理、自动潜水系统、智能防御系统和自主机器人。感知智能研究中最热门的领域是模拟人类的五种感觉能力,视觉、听觉、嗅觉、味觉和触觉。</p><p>此外,智能传感还包括温度、压力、湿度、高度、速度、重力等,需要大量的计算或数据训练来提高其性能。</p><p>近年来,随着模式识别和深度学习技术的全面应用,机器的感知智能已经超过人类,在语音、视觉和触觉识别方面取得了重大进展。由于其日益增长的重要性和日益拓宽的应用领域,智能传感器受到了广泛关注。如图7所示,智能传感器具有各种形式以满足不同应用的需求,并且更新更好的型号正在被不断的开发出来。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKj" alt="image.png" title="image.png"></p><p><strong>认知智能</strong>是指机器具有像人一样的逻辑理解和认知能力,特别是思考、理解、总结和主动应用知识的能力。它描述了智能体在真实环境中处理复杂事实和情况的能力。</p><p>数据识别是感知智能的核心功能,需要对图像、视频、声音等各类数据进行大规模的数据采集和特征提取,完成结构化处理。相比之下,认知智能需要理解数据元素之间的关系,分析结构化数据中的逻辑,并根据提炼出的知识做出响应。</p><p>认知智能计算主要研究机器的自然语言处理、因果推理和知识推理(图8)等领域。通过对人脑的神经生物学过程和认知机制的启发式研究,可以提高机器的认知水平,以使其获得帮助、理解、决策、洞察和发现的能力。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKk" alt="image.png" title="image.png"></p><p>驱动机器从被动输出到主动创造有两个关键要素:强泛化模型和与外部环境的持续交互。<strong>自主智能</strong>的发展路径从学习单一任务开始,举一反三,逐步达到与环境动态交互的主动学习,最终实现自我进化的高级智能。当前可以通过迁移学习、元学习和自主学习等技术寻找生成自主智能的可行路径。</p><p>尽管在智能的四个层面上(数据智能,感知智能,认知智能,自主智能)取得了重大进展,但目前仅通过计算/统计模型还难以从极其复杂的场景中实现完全的智能。</p><p>在这些场景中,人类应该继续在解决问题和决策中发挥不可或缺的作用,来探索人类认知过程中涉及的要素,并将其与机器智能相结合。下一步,将聚焦于人机交互、人机融合和脑机接口等技术。</p><h2>面向智能的计算</h2><p>AI的发现不断涌现,这在很大程度上归功于不断增长的计算能力。AI的快速变化是由新思想或革命性理论推动的。通常,最新的先进模型仅依赖于更大的神经网络和更强大的处理系统。</p><p>Open AI研究人员在2018年进行了一项研究,追踪基于计算能力的最大模型的增长情况。利用AI研究史上训练的一些最著名的AI模型所需的计算量,他们发现了计算资源快速增长的两个趋势。</p><p><strong>开发突破性模型所需的计算能力的增长速度与摩尔定律大致相同</strong>,即在2012年之前,单个微芯片的计算能力往往每两年翻一番。但图像识别系统AlexNet在2012年发布时引起了人们的新兴趣。AlexNet的引入刺激了顶级模型的计算需求急剧增加,从2012年到2018年,这种需求每3到4个月翻一番,如图9所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKl" alt="image.png" title="image.png"></p><p>当摩尔定律失效时,超大算力主要依赖于海量计算、内存和存储资源的并行叠加。</p><p>例如,“高性能计算”是指将大量计算机快速联网成一个“集群”以进行密集计算的做法,使用户能够比传统计算机更快地处理大量数据,从而获得更深入的洞察力和竞争优势。</p><p>此外,得益于云计算(图10),用户现在可以选择增加其高性能计算程序的容量,从而继续提高算力。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKn" alt="image.png" title="image.png"></p><p>推进智能计算架构创新的目标包括更高效的能源管理、更低的功耗、更便宜的总芯片成本以及更快速的错误检测和纠正。当涉及某些无法在CPU上执行的AI操作时,AI加速器可能会大大减少训练和执行时间。</p><p>在短期内,所使用加速器的架构专业化将是保持计算能力增长的最佳方式,如图11所示为已公开发布的AI加速器和处理器的峰值性能与功耗。</p><p>另外,<strong>内存计算</strong>(图12)是一个非常有效的方案,它能够使内存单元执行原始逻辑操作,因此它们可以在不需要与处理器交互的情况下进行计算,这是内存和处理器之间不断扩大速度差距的主要原因。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKo" alt="image.png" title="image.png"></p><p><strong>复杂性</strong>是传统计算机进一步突破的瓶颈。当今高度复杂的AI模型(例如深度神经网络)在边缘设备中仍然难以实现普遍使用。这是由于运行这些模型的高级GPU和加速器存在功率和带宽紧缩的缺陷,导致处理时间长并且架构设计繁琐。</p><p>由于这些问题,研究人员开始创造新的计算模式,主要包括:</p><p><strong>量子计算</strong>(图13),因为其具有纠缠或其他非经典相关性带来的量子优势,可以在许多复杂的计算问题中实现指数速度;</p><p><strong>神经形态计算</strong>(图14)的构造和操作受到大脑中神经元和突触的启发,因其能源效率高而非常适合计算,神经形态计算是事件驱动和高度并行化的,这意味着只有小部分系统同时工作,所以消耗的功率非常小;</p><p><strong>光子计算</strong>(图15)与电神经网络相比具有许多优势,包括超高带宽、快速计算速度和高并行性,所有这些都是通过使用光子硬件加速来计算复杂的矩阵向量乘法来实现的;</p><p><strong>生物计算</strong>(图16)是利用生物系统固有的信息处理机制发展起来的一种新的计算模型,主要包括蛋白质计算机、RNA计算机和DNA计算机,具有并行和分布式计算能力强、功耗低的优势。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKp" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKr" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKs" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKt" alt="image.png" title="image.png"></p><h2>智能计算的应用</h2><p>如果要跟上当前科学的快速发展,就必须不断的进行革新。现在正在进行的计算机革命的融合将以前所未有的方式极大地推动科学发现的进步。</p><p>几十年来,<strong>计算材料</strong>(图17)已成为研究材料特性和设计新材料的有力手段。然而,由于材料和材料行为的复杂性,它们的应用面临许多挑战,包括缺乏许多原子、离子以及原子和离子相互作用的力场和电位,分子动力学模拟中的不同热力学相,以及优化材料成分和工艺参数的巨大搜索空间。作为一种新的研究范式,AI集成到计算材料中是对传统计算材料的革命,并且已经在多长度、多时间尺度、多物理场耦合计算方面取得了巨大成功。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKu" alt="image.png" title="image.png"></p><p>作为最古老的观测科学之一,<strong>天文学</strong>在历史上收集了大量数据。由于望远镜技术的突破,收集到的数据爆炸性增长。天文学和天体物理学领域的特点是拥有丰富的数据和各种大口径的地面望远镜,例如即将推出的大型巡天望远镜和天基望远镜。使用高分辨率相机和相关工具,数据收集现在更加高效,并且在很大程度上实现了自动化,必须进行更高效的数据分析。因此,需要智能计算技术来解释和评估数据集。</p><p><strong>药物设计</strong>同样受益于AI(图18),AI可以帮助科学家建立蛋白质的3D结构、模拟药物和蛋白质之间的化学反应以及预测药物的功效。在药理学中,AI可以用于创建靶向化合物和多靶点药物。利用AI还可以设计合成路线、预测反应产率并了解化学合成背后的机制。AI让重新利用现有药物来治疗新的治疗目标变得更加容易。此外,AI对于识别不良反应、测定生物活性和获得药物筛选结果至关重要。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKv" alt="image.png" title="image.png"></p><p>随着大数据和AI技术使用的增长,<strong>作物育种</strong>开始进行融合与突破(图19)。AI技术可以支持服务的创建、模型的识别以及农业食品应用和供应链阶段的决策过程。AI在农业中的主要目标是准确预测结果并提高产量,同时最大限度地减少资源使用。因此,AI工具提供的算法可以评估产量,预测难以预见的问题或事件以及发生趋势。从种植到收获再到销售,AI促进了整个农业价值链。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKw" alt="image.png" title="image.png"></p><p>智能计算加速转型变革,导致经济和社会秩序的转变。由于技术进步,商品和劳动力市场正在发生巨大变化,<strong>数字社会</strong>正在逐渐形成(图20)。AI应该成为数字经济中每一个数据驱动战略的核心,包括工业4.0。例如,人工智能可以应用于预测性维护。预测性维护包括涉及通用设备或生产机械的维护,并使用来自生产线或运营线的传感器数据帮助降低运营费用或停机时间。</p><p>另外。AI可以应用于城市治理,通过开发新的策略和方法,使城市更智能。智慧城市治理旨在利用最先进的信息技术同步数据、程序、权限等,造福城市居民,主要包含四个方面:</p><blockquote>智慧决策、智慧城市治理、智慧行政和智慧城市合作。</blockquote><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKx" alt="image.png" title="image.png"></p><h2>展望</h2><p>从新兴产业生态的角度来看,智能计算产业仍面临着一系列挑战,决定着其未来发展。</p><p><strong>第一,与传统计算理论相比,智能计算是语言和生物学驱动的计算范式的应用和发展。</strong></p><p>这意味着机器可以根据不同的场景模仿人脑解决问题和决策的能力。然而,硅基和碳基运算的底层逻辑存在根本差异,大脑智能的机制仍有待进一步探索。智能计算的下一步是通过深入探索类人智能的基本要素,其在宏观层面的相互作用机制以及在微观层面上支持不确定性生成的计算理论,进行彻底的改革。</p><p><strong>第二,探索人类如何学习并将其应用到AI的研究中具有重要意义。</strong></p><p>知识驱动的机器智能可以从人类活动中学习,模仿人脑的决策能力,使机器能够像人一样感知、识别、思考、学习和协作。需要探索多知识驱动的知识推理和持续学习的理论和关键技术,使智能系统具有类人的学习、感知、表示和决策能力,促进智能计算从数据驱动向知识驱动演进。</p><p><strong>第三,软硬件适配面临着巨大的挑战,如精度损失、调用困难、协作效率低下等。</strong></p><p>未来,计算机必须突破冯·诺依曼体系结构下固定的输入和处理范式,大力发展交叉学科的智能计算和仿生学。在算法层面进行设计,突破现有架构的局限,以更低的计算和硬件设计成本尝试更灵活、更人性化的数据处理方式。此外,开发高性能、低能耗的新型组件设计方案,提高软件和硬件的计算能力和效率,以满足快速增长的需求和智能计算应用也很重要。</p><p><strong>第四,智能计算的理论技术架构是一个复杂的系统,具有多个与其他学科相互作用的子系统。</strong></p><p>系统中的各种硬件需要更复杂的系统设计,更好的优化技术,以及系统调优的更大成本。高维计算理论复杂性的缺乏是大规模计算系统面临的主要挑战。</p><h2>结论</h2><p>当前,我们正迎来<strong>人类发展的第四次浪潮</strong>,正处于从信息社会向<strong>人类社会-物理世界-信息空间</strong>融合的智能社会的关键转型期。在这种转变中,计算技术正在经历变革,甚至是颠覆性的变化。</p><p>智能计算被认为是未来计算的发展方向,不仅是面向智能的计算,而且是智能赋能的计算。它将提供通用、高效、安全、自主、可靠和透明的计算服务,以支持当今智能社会中大规模和复杂的计算任务。</p><p>本文全面回顾了智能计算的理论基础、智能与计算的技术融合、重要应用、挑战和未来方向。</p><p>我们希望这篇综述能为研究人员和从业者提供一个很好的参考,并促进未来智能计算领域的理论和技术创新。</p><blockquote>文章作者:允中  <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2Fd7PpTEHjfH33fVRTsOaucg" target="blank">量子位</a></blockquote><blockquote>更多FPGA干货请关注<a href="https://aijishu.com/blog/readings">极术读书</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000382786</guid>
            <link>https://aijishu.com//a/1060000000382786</link>
        </item>
        <item>
            <title><![CDATA[招募 | 基于Arm MCU数字控制系统的低代码开发方面的技术专著翻译合作]]></title>
            <description><![CDATA[<p>兔年伊始,机械工业出版社又来邀请各位技术专家合作翻译Arm相关国外技术专著啦,欢迎大家关注联系~</p><h2>关于书籍《Embedded Digital Control with Microcontrollers: Implementation with C and Python (IEEE Press) 》</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLto" alt="image.png" title="image.png"></p><p>《Embedded Digital Control with Microcontrollers: Implementation with C and Python (IEEE Press)》是关于Arm MCU数控系统低代码开发的参考书,图书介绍了简洁实用的微控制器数字控制系统实现方法和理论。</p><p>图书作者通过三个阶段的介绍,让读者更好得来进行学习。</p><ul><li>首先,图书描述了如何通过 Python 编程语言实现原型数字控制系统,以帮助读者更好地理解理论数字控制概念。</li><li>其次,本书为读者提供了使用 C 编程语言在实际微控制器上实现数字控制系统的指导。这将使读者能够解决涉及数字控制、机器人和机电一体化的现实问题。</li><li>最后,读者将学习如何通过在实际应用中实施数字控制系统,将书中讨论的理论问题与实践问题结合起来。在整本书中,使用 Python 编程语言的数字控制系统的应用确保读者可以应用其中包含的理论。</li></ul><p>书籍链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.amazon.com%2FEmbedded-Digital-Control-Microcontrollers-Implementation%2Fdp%2F1119576520%2Fref%3Dsr_1_1%3Fkeywords%3D9781119576525%26qid%3D1675070337%26s%3Dbooks%26sr%3D1-1" target="blank">https://www.amazon.com/Embedded-Digital-Control-Microcontrollers-Implementation/dp/1119576520/ref=sr_1_1?keywords=9781119576525&amp;qid=1675070337&amp;s=books&amp;sr=1-1</a></p><h2>翻译合作招募</h2><p>如果有对Arm嵌入式技术感兴趣的,并且有嵌入式编程经验的,专业和英语都不错的工程师们,欢迎联系翻译合作,具体合作细节可和负责人详细沟通。</p><p>联系人:<strong>机工社朱经理</strong><br>微信号:<strong>jack1967_zhu</strong>,添加微信请备注“Arm”<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbupq" alt="image.png" title="image.png"><br>扫一扫添加微信沟通翻译合作</p>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000381770</guid>
            <link>https://aijishu.com//a/1060000000381770</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】2023年元旦50本《Arm64体系架构编程与实践》赠书名单公布]]></title>
            <description><![CDATA[<p>为了感谢大家对极术社区的支持,2023年元旦极术社区微信服务号联合安谋科技学堂微信号组织了<a href="https://aijishu.com/e/1120000000376650">50本《Arm64体系架构编程与实践》的赠书活动</a>,近一千人参与了抽奖活动,抽奖名单已有微信抽奖助手自动公布,截图如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbKzy" alt="image.png" title="image.png"></p><p>恭喜以上中奖者,请私信兑奖码,极术社区微信号截图以及安谋科技微信号截图给极术小姐姐,如活动中未关注或者已取关的中奖用户不予兑换。</p><p>感谢大家的支持,更多读书活动请关注极术读书栏目:<a href="https://aijishu.com/books">https://aijishu.com/books</a></p>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000378287</guid>
            <link>https://aijishu.com//a/1060000000378287</link>
        </item>
        <item>
            <title><![CDATA[学习STM32/GD32开发设计,推荐《嵌入式系统设计—基于Cortex-M处理器与RTOS构建》]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>。</blockquote><p>本期极术社区推荐的是由杭州电子科技大学曾毓和黄继业老师编写,清华大学出版社出版的新书《嵌入式系统设计——基于Cortex-M处理器与RTOS构建》。该书系统介绍了基于ARM Cortex-M体系的嵌入式系统设计,同时配套有STM32芯片和GD32芯片的开发板,让工程师可以同时掌握两种芯片的开发及设计。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbKyC" alt="image.png" title="image.png"></p><h2>内容简介</h2><p>全书系统介绍了基于ARM Cortex-M体系的嵌入式系统设计,将微控制器技术、RTOS概念、传感器应用、编程技巧和实用方法与实际工程开发技术在STM32F407/GD32F407硬件平台上很好地结合起来,使读者通过本书的学习能迅速了解并掌握基于STM32/GD32的嵌入式系统设计方法和工程开发实用技术,为后续的深入学习和发展打下坚实的理论与实践基础。</p><h2>书籍特色</h2><ul><li><strong>紧跟嵌入式技术发展</strong>,基于图形化配置工具的和多任务系统设计视角介绍嵌入式系统应用设计流程。</li><li><strong>主要内容基于业内流行的FreeRTOS嵌入式实时系统</strong>,多实例演示RTOS的任务管理、优先级、信号、消息和任务通知等基础概念应用方法。</li><li><strong>应用示例丰富实用</strong>,操作讲解详实易懂,所有示例都通过了配套嵌入式平台的硬件验证,有较高的工程实践参考性。</li><li><strong>详实的嵌入式鸿蒙系统移植教程</strong>,涵盖环境搭建和工程创建、移植、编译下载过程完整步骤,帮你从零开始鸿蒙嵌入式应用开发。</li><li><strong>全书使用工具软件皆为免费、开源或作者自制软件</strong>,配套实验板资料全部开放,板载MCU器件也都可用国产MCU替代,可极大降低教学和学习成本。</li></ul><h2>配套开发板介绍</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbKyE" alt="image.png" title="image.png"><br>配套HX32F4学习板主要特点:</p><ul><li>核心芯片选用基于Cortex-M4内核的主流高性能MCU,型号STM32F407VET6/VGT6。(HX32F4的国产版本选用引脚兼容的GD32F407VET6或GD32F470VET6)</li><li>板载DAP下载调试器,仅需一根TYPE-C接口就能完成供电,下载,调试,串口调试。</li><li>板载嵌入式学习基础资源包括:8个LED、6个独立按键、4位数码管、无源蜂鸣器、麦克风、电容触摸按键,外接16MB SPI FLASH。</li><li>板载外设接口包括:3.5mm音频输出、ADC、DAC、CAN接口、ESP8266模块接口、HC05蓝牙接口、IIC接口、单总线模块接口、SD卡接口、以太网接口、USB Host和USB Device接口。</li><li>板上还提供15x2扩展接口,可直插2.4寸LCD触摸液晶屏或作为外设扩展接口,涵盖USART、SPI、IIC、ADC、DAC、定时器等外设引脚,方便进行其他的扩展实验。</li><li>原理图和PCB资料全部开放,开源地址:<a href="https://aijishu.com/link?target=https%3A%2F%2Fgitee.com%2Fzalileo%2FHX32F4-Board" target="blank">https://gitee.com/zalileo/HX32F4-Board</a></li></ul><h2>书籍目录</h2><ul><li><p>第1章 基于Cortex-M的嵌入式系统概述</p><ul><li>1.1 嵌入式系统基本概念</li><li>1.2 ARM Cortex体系结构</li><li>1.3 ARM Cortex-M各系列特点</li><li>1.4 STM32F407结构简介</li><li>1.5 实时操作系统RTOS简介</li><li>1.6 嵌入式系统在物联网中的发展</li></ul></li><li><p>第2章 Cortex-M嵌入式硬件平台</p><ul><li>2.1 硬件平台简介</li><li>2.2 主要器件</li><li>2.3 主要功能模块</li></ul></li><li><p>第3章 嵌入式开发工具与设计流程</p><ul><li>3.1 STM32开发工具</li><li><p>3.2 ARM Keil MDK工具</p><ul><li>3.3 STM32CubeMX使用方法</li><li>3.3.1 STM32Cube简介</li><li>3.3.2 STM32CubeMX软件安装</li></ul></li><li><p>3.4    基于HAL库的程序设计流程</p><ul><li>3.4.1 STM32 HAL介绍</li><li>3.4.2 CubeMX工程创建流程</li></ul></li><li>3.5 第一个LED点灯程序</li><li>实验1 按键扫描与流水灯设计</li></ul></li><li><p>第4章 FreeRTOS操作系统</p><ul><li>4.1 FreeRTOS系统简介</li><li>4.2 FreeRTOS系统移植</li><li><p>4.3 多任务系统基本概念</p><ul><li>4.3.1 任务及任务管理</li><li>4.3.2 优先级</li><li>4.3.3 消息队列</li><li>4.3.4 信号量</li><li>4.3.5 互斥量</li><li>4.3.6 事件</li><li>4.3.7 任务通知</li><li>4.3.8 内存管理</li></ul></li><li><p>4.4 创建第一个RTOS工程</p><ul><li>4.4.1 CubeMX工程配置</li><li>4.4.2 导出MDK工程</li><li>4.4.3 编写功能代码</li></ul></li><li>实验2 多任务键盘与流水灯实验</li></ul></li><li><p>第5章 简单外设应用</p><ul><li>5.1 数码管应用</li><li>5.2 按键与外部中断</li><li><p>5.3 麦克风与ADC应用</p><ul><li>5.3.1 添加串口打印输出</li><li>5.3.2 ADC模块介绍</li><li>5.3.3 麦克风AD采样示例</li></ul></li><li>5.4 单总线温湿度传感器应用</li><li>5.5 IIC接口陀螺仪传感器应用</li><li>实验3 声控延时亮灯实验</li><li>实验4 温度报警与倾角检测实验</li></ul></li><li><p>第6章 串口通信应用</p><ul><li>6.1 学习板虚拟串口概述</li><li>6.2 轮询接收方式串口通信</li><li><p>6.3 中断接收方式串口通信</p><ul><li>6.3.1 串口接收中断示例</li><li>6.3.2 DMA空闲中断示例</li><li>6.3.3 流水灯串口通信应用</li></ul></li><li>6.4    使用SWO调试</li></ul></li><li>实验5 简单串口通信实验</li><li>实验6 数据采集与串口通信实验</li><li><p>第7章 无线通信应用</p><ul><li><p>7.1 蓝牙HC05通信模块介绍</p><ul><li>7.1.1 HC05蓝牙模块用法介绍</li><li>7.1.2 HC05蓝牙模块AT指令介绍</li></ul></li><li>7.2 蓝牙通信实践</li><li><p>7.3 ESP8266WiFi通信模块介绍</p><ul><li>7.3.1 ESP01模块用法介绍</li><li>7.3.2 ESP01模块AT指令介绍</li></ul></li><li>7.4 WIFI通信实践</li><li><p>7.5    物联网连接应用实践</p><ul><li>7.5.1 创建OneNET平台设备</li><li>7.5.2 连接OneNET平台</li></ul></li><li>实验7 蓝牙手机遥控实验</li><li>实验8 数据采集及Wifi通信实验</li></ul></li><li><p>第8章     GUI显示应用</p><ul><li><p>8.1 OLED应用介绍</p><ul><li>8.1.1 单色IIC接口OLED介绍</li><li>8.1.2 OLED显示屏驱动程序介绍</li><li>8.1.3 GUISlim图形库介绍</li><li>8.1.4 汉字点阵文件介绍</li></ul></li><li>8.2 OLED应用实践</li><li>8.3 MCU接口LCD介绍</li><li><p>8.4 LCD应用实践</p><ul><li>8.4.1 emWin图形库介绍</li><li>8.4.2 FSMC总线配置</li><li>8.4.3 LCD屏驱动移植接口</li><li><p>8.4.4 GUI应用设计</p><ul><li>实验9 OLED显示屏数据曲线绘制实验</li></ul></li></ul></li><li>实验10 LCD液晶屏GUI设计实验</li></ul></li><li><p>第9章 定时器应用</p><ul><li><p>9.1 STM32F4定时器介绍</p><ul><li>9.1.1 常规定时器</li><li>9.1.2 HAL库定时器模块设计方法</li><li>9.1.3 定时器基本概念介绍</li></ul></li><li>9.2 定时器基本功能应用</li><li>9.3 PWM输出应用</li><li>9.4 信号捕捉应用</li><li>9.5 外部脉冲计数应用</li><li>实验11 简易闹铃设计实验</li><li>实验12 呼吸灯设计实验</li><li>实验13 简易频率计设计实验</li><li>实验14 简单录音机设计实验</li></ul></li><li><p>第10章 RTC与低功耗应用</p><ul><li>10.1 RTC实时时钟应用</li><li>10.2 STM32低功耗模式介绍</li><li>10.3 STM32低功耗应用</li><li>实验15 基于RTC的电子钟设计</li><li>实验16 低功耗待机与唤醒实验</li></ul></li><li><p>第11章 FatFs文件系统应用</p><ul><li>11.1 FatFs介绍</li><li><p>11.2 SPI FLASH应用实践</p><ul><li>11.2.1 添加配置SPI外设</li><li>11.2.2 添加SPI FLASH驱动</li><li>11.2.3 SPI FLASH直接读写操作实践</li><li>11.2.4 SPI FLASH文件读写操作实践</li></ul></li><li><p>11.3 SD卡应用实践</p><ul><li>11.3.1 添加配置SDIO外设</li><li>11.3.2 SD卡文件读写操作实践</li></ul></li><li><p>11.4 U盘挂载应用实践</p><ul><li>11.4.1 添加配置USB HOST组件</li><li>11.4.2 U盘文件读写操作实践</li></ul></li><li>实验17 数据存储实验</li><li>实验18 文件传输实验</li></ul></li><li><p>第12章 STM32 IAP程序设计</p><ul><li>12.1 STM32 IAP概念介绍</li><li>12.2 STM32内部FLASH介绍</li><li>12.3 STM32内部FLASH读写实践</li><li>12.4 程序跳转应用实践</li><li>12.5 IAP程序设计实践</li><li>实验19 串口IAP设计实验</li><li>实验20 U盘IAP设计实验</li></ul></li><li><p>第13章 鸿蒙嵌入式系统移植</p><ul><li><p>13.1 OpenHarmony介绍</p><ul><li>13.1.1 LiteOS-M内核简介</li><li>13.1.2 开发环境配置</li></ul></li><li><p>13.2 OpenHarmony系统移植</p><ul><li>13.2.1 创建裸机工程</li><li>13.2.2 系统编译构建移植</li><li>13.2.3 系统启动过程适配</li><li>13.2.4 编译及烧录</li></ul></li><li><p>13.3 OpenHarmony应用开发示例</p><ul><li>13.3.1 hello world示例</li><li>13.3.2 流水灯示例</li></ul></li><li>实验21 OpenHarmony系统移植实验</li></ul></li></ul><h2>作者介绍</h2><p>本书适用对象:电子、计算机类相关专业的高等院校本专科学生。<br>本书适用课程:单片机、嵌入式实践和电子系统综合设计等相关实践课程。</p><h2>书籍购买</h2><p>书籍购买链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13603919.html" target="blank">https://item.jd.com/13603919.html</a></p><p>相关课件及教学资料下载:<a href="https://aijishu.com/link?target=https%3A%2F%2Fgitee.com%2Fzalileo%2FHX32F4-Board" target="blank">https://gitee.com/zalileo/HX32F4-Board</a>,书籍课件在其下的“07 相关资料”目录中,书籍实验示例工程在其下的“05 学习板配套教材示例代码”目录中,如有下载问题,可联系邮箱:<a href="https://aijishu.com/link?target=mailto%3Azyu20%40hdu.edu.cn" target="blank">zyu20@hdu.edu.cn</a></p><p>老师可以免费申请该书籍,申请链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fdocs.qq.com%2Fform%2Fpage%2FDYkNBY2hVWGVvdG1v%23%2Ffill" target="blank">https://docs.qq.com/form/page/DYkNBY2hVWGVvdG1v#/fill</a><br>配套开发板购买:<br><a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.taobao.com%2Fitem.htm%3Fspm%3Da1z10.5-c-s.w4002-23113581213.10.1f823de1YJY0ga%26id%3D696813161080" target="blank">https://item.taobao.com/item.htm?spm=a1z10.5-c-s.w4002-23113581213.10.1f823de1YJY0ga&amp;id=696813161080</a></p><blockquote>更多书籍推荐及赠书活动请关注<a href="https://aijishu.com/books">极术读书</a>页面。</blockquote>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000378231</guid>
            <link>https://aijishu.com//a/1060000000378231</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】50本《智能网联汽车计算平台测试装调》赠书名单公布]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>栏目。</blockquote><p>2022年11月30日至12月5日,极术社区联合安谋科技学堂,机械工业出版社赠送50本《<a href="https://aijishu.com/e/1120000000368246"><strong>智能网联汽车计算平台测试装调</strong></a>》,非常感谢大家的积极参与,赠书名单如下,恭喜下方的小伙伴,下面每人将收到极术读书赠送的一本《智能网联汽车计算平台测试装调》。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbI8e" alt="df93aa6972e82e1338bfd90b7f03c6a.png" title="df93aa6972e82e1338bfd90b7f03c6a.png"></p><blockquote><p>祝贺以上获奖的小伙伴!</p><p>极术读书工作人员将给中奖用户发送邮件通知确认后尽快安排寄出。</p><p>暂时没有获奖的的小伙伴也不要着急,接下来极术读书及安谋科技学堂会多多组织类似的活动,努力为大家谋福利!<br>本次赠书活动感谢机械工业出版社和书籍作者上海交大刘彦博老师的大力支持!</p></blockquote><p><strong>活动原文</strong>:<a href="https://aijishu.com/e/1120000000368246">【极术读书】冬季送50本《智能网联汽车计算平台测试装调》,带你全面掌握智能汽车计算平台软硬件!</a></p><blockquote>关注<a href="https://aijishu.com/books">极术读书栏目</a>,即时获取最新推荐好书以及读书活动。</blockquote><p><strong>学习公号推荐</strong>:关注<strong>安谋科技学堂</strong>公众号,学习更多技术知识!<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbiNv" alt="安谋科技学堂.png" title="安谋科技学堂.png"></p><p><strong>如何购买?</strong><br>京东旗舰店:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13457369.html" target="blank">https://item.jd.com/13457369.html</a></p><blockquote>本活动最终解释权归极术社区所有。</blockquote>
                                                    ]]></description>
            <pubDate>Sun, 04 Dec 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000372749</guid>
            <link>https://aijishu.com//a/1060000000372749</link>
        </item>
        <item>
            <title><![CDATA[新书推荐| 《智能网联汽车计算平台测试装调》带你全面学习智能汽车计算平台]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>。</blockquote><p>在政策、技术与市场等多重因素的影响下,汽车这一传统产业与能源、交通、信息通信等领域有关技术加速融合,正在形成电动化、智能化、网联化的发展格局。智能网联汽车的发展已经进入快车道。而随着无人驾驶技术的发展,智能网联汽车计算平台在智能驾驶中的作用也愈发重要。为了让大家更快掌握智能网联汽车计算平台,极术读书给大家推荐由北京电子科技职业学院汽车工程学院院长冯志新和上海交大刘彦博编写,机械工业出版社最新出版的《智能网联汽车计算平台测试装调》。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbHXm" alt="image.png" title="image.png"></p><h2>内容简介</h2><p>本书是智能网联计算平台测试应用与调试开发的初级教材,主要是为了满足行业对智能网联汽车技术专业人才的需求,促进高职院校汽车专业的建设。</p><p>全书共8章,以学习任务为出发点贯穿教学,通过任务导入、任务分析、任务资讯、任务准备、任务实施、任务检查与评价逐层深入实践。</p><p>本书内容包括智能网联车载计算平台的基础知识、框架结构和硬件认知,Python 语言和Linux 系统的相关操作和基础知识,华为MDC 平台和智行者计算平台的拆装与调试,以及相关软件的环境部署和操作技巧。</p><h2>书籍特色</h2><p>本书具有以下特点:</p><p>1)紧跟汽车新技术的发展步伐,结合智能网联汽车技术专业的职业取向、培养目标进行内容设置,及时反映产业升级和行业发展需求,体现新知识、新技术、新工艺、新方法、新材料。</p><p>2)采用学习任务式编写体例。每一个学习任务都对应有相关的任务驱动,且配备有对应的技能操作步骤,可操作性强。</p><p>3)注重实践应用能力的培养和技能的提升,实现“理实一体”,旨在为行业培养高素质的汽车智能技术技能人才。</p><p>本书在编写过程中大量参考了<strong>华为、百度、英伟达、安谋科技、亚马逊、迈斯沃克、恩智浦、盛心杰缘智能科技、九州华海科技、盛子智能科技</strong>等知名公司的工程技术专家提供的资料,具备一定的先进性和工程性。</p><h2>书籍目录</h2><ul><li>1 计算平台认知</li><li>2 计算平台架构认知</li><li>3 计算平台硬件认知</li><li>4 Python 基础知识</li><li>5 Linux 基础知识</li><li>6 华为MDC 300F 平台的拆装与调试</li><li>7 智行者计算平台的拆装与调试</li><li>8 软件部署</li></ul><h2>作者介绍</h2><ul><li><strong>冯志新</strong>,工学博士,教授,北京电子科技职业学院 汽车工程学院院长,北京市级专业带头人,教育部课程思政教学名师,教育部汽车职业教育教学指导委员会委员。全国“双高”汽车制造与装配技术专业群建设负责人,北京市市级教师教学创新团队和高校继续教育高水平教学团队负责人。曽获教育教学成果一等奖1项,获北京市级教育教学成果一等奖2项,主持和参与厅局级以上课题8项,主编教材4部。兼任中国机械工业教育协会第五届理事,国家职业技能鉴定高级考评员和质量督导员,机械工业人才评价工作专家委员会委员。</li><li><strong>刘彦博</strong> ,中国汽车产品高级工程师,上海交通大学教辅系列青年教师<br>,华为云MVP专家/华为鲲鹏计算先锋教师,百度自动驾驶培训讲师,英伟达自动驾驶培训讲师,IEEE上海会员。主要研究方向为汽车电子、智能网联感知融合技术、智能网联网络拓扑优化等。精通嵌入式系统、硬件电路设计,熟悉多种智能网联车载平台系统。主要参与的项目有信息产业部中国电子科技集团公司2U/3U车载计算平台设计、车载采集监控系统、北斗车载控制系统、车载电子控制系统,教育部产学研华为云智能驾驶开发设计、教育部产学研无人驾驶课程开发、教育部产学研5G车路协同开发等项目。发表EI核心论文30余篇、发明专利5篇、软件著作5篇,著有《 智能网联汽车计算平台测试装调》《新能源汽车技术研究进展微探》,《电子控制技术》等教材。</li></ul><h2>书籍购买</h2><p>京东链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13457369.html" target="blank">https://item.jd.com/13457369.html</a></p><blockquote>更多书籍推荐及赠书活动请关注<a href="https://aijishu.com/books">极术读书</a>页面。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 21 Nov 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000368242</guid>
            <link>https://aijishu.com//a/1060000000368242</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】赠卡活动第二期名单公布]]></title>
            <description><![CDATA[<p>11月第一周,极术读书栏目又组织了<a href="https://aijishu.com/e/1120000000361727">第二次极客时间月卡赠送活动</a>。活动获得了很多社区用户的支持,恭喜以下的用户获得极客时间超级会员月卡。<br>姓名    手机<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbG7u" alt="jikeshijian.png" title="jikeshijian.png"></p><blockquote>工作人员会在1~2个工作日发邮件到大家登记邮箱说明如何免费兑换卡券,敬请关注邮件。请在<strong>2022年12月2日</strong>前兑换,超过时间则不予兑换。如有任何问题欢迎微信联系极术小姐姐(微信:aijishu20)</blockquote><p><strong>推荐目前极术社区正在组织的活动</strong></p><ul><li><a href="https://aijishu.com/e/1120000000359788">「免费申请」基于Arm Cortex-M4的兆易创新GD32F427高性能开发板试用活动</a></li></ul><p>更多赠书赠卡活动敬请关注<a href="https://aijishu.com/books"><strong>极术读书</strong></a>。</p>
                                                    ]]></description>
            <pubDate>Sun, 06 Nov 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000365015</guid>
            <link>https://aijishu.com//a/1060000000365015</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】国庆《嵌入式实时操作系统 ―基于ARM Mbed OS的应用实践》赠书名单公布]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>栏目。</blockquote><p>2022年9月28日至10月8日,极术社区联合安谋科技学堂赠送50本《<a href="https://aijishu.com/e/1120000000355587"><strong>嵌入式实时操作系统 ―基于ARM Mbed OS的应用实践</strong></a>》,非常感谢大家的积极参与,赠书名单如下,恭喜下方的小伙伴,下面每人将收到极术读书赠送的一本《嵌入式实时操作系统 ―基于ARM Mbed OS的应用实践》。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbFwu" alt="2022年国庆赠书.png" title="2022年国庆赠书.png"></p><blockquote><p>祝贺以上获奖的小伙伴!</p><p>极术读书工作人员将给中奖用户发送邮件通知确认后尽快安排寄出。</p><p>暂时没有获奖的的小伙伴也不要着急,接下来极术读书及安谋科技学堂会多多组织类似的活动,努力为大家谋福利!<br>本次赠书活动感谢电子工业出版社和书籍作者王宜怀教授的大力支持!</p></blockquote><p><strong>活动原文</strong>:<a href="https://aijishu.com/e/1120000000355587">【极术读书】国庆赠书50本《嵌入式实时操作系统 ―基于ARM Mbed OS的应用实践》,掌握实时操作系统应用及原理!</a></p><blockquote>关注<a href="https://aijishu.com/books">极术读书栏目</a>,即时获取最新推荐好书以及读书活动。</blockquote><p><strong>学习公号推荐</strong>:关注<strong>安谋科技学堂</strong>公众号,学习更多技术知识!<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbiNv" alt="安谋科技学堂.png" title="安谋科技学堂.png"></p><p><strong>如何购买?</strong><br>京东旗舰店:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13237887.html" target="blank">https://item.jd.com/13237887.html</a></p><blockquote>本活动最终解释权归极术社区所有。</blockquote>
                                                    ]]></description>
            <pubDate>Fri, 07 Oct 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000358877</guid>
            <link>https://aijishu.com//a/1060000000358877</link>
        </item>
        <item>
            <title><![CDATA[极术读书 | 新书推荐《嵌入式实时操作系统 ――基于ARM Mbed OS的应用实践》]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>。</blockquote><p>嵌入式实时操作系统是嵌入式人工智能与物联网终端的重要工具和运行载体,也是嵌入式工程师必备知识。本篇极术读书将推荐安谋科技合作图书,苏州大学王宜怀教授所著《<strong>嵌入式实时操作系统 ――基于ARM Mbed OS的应用实践</strong>》。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbEw2" alt="image.png" title="image.png"></p><h2>内容介绍</h2><p>虽然实时操作系统种类繁多,有国外的,也有国产的;有收费的,也有免费的;有开发者持续维护升级的,也有依赖爱好者更新升级的。但是无论哪一种, 学习实时操作系统时都必须以一个具体的实时操作系统为蓝本。实际上,不同的实时操作系统,其应用方法及原理大同小异,掌握其共性是学习的关键,这样才能达到举一反三的效果。</p><p>本书推荐的Mbed OS是ARM公司于2014年开始推出并逐步完善的一款免费的 开源嵌入式实时操作系统,Mbed OS专为基于ARM Cortex-M内核的MCU设计, 主要面向物联网终端。该书以ARM Mbed OS实时操作系统为背景,阐述实时操作系统的线程、调度、延时函数、事件、消息队列、线程信号、信号量、互斥量等基本要素,给出实时操作系统下的程序设计方法。</p><p>本书分为基础应用篇(第1~7章)、原理剖析篇(第8~12章)及综合实践篇(第13、14章)三大部分,如果读者只做实时操作系统下的应用开发,可只阅读基础应用篇与综合实践篇;如果希望理解实时操作系统原理,那么建议通读全书。</p><p>本书适合软件开发工程师,可作为实时操作系统的技术培训书籍,书籍配套有实践的开发板。</p><h2>书籍目录</h2><p><strong>第1篇 基础应用篇</strong></p><ul><li><p>第1章 实时操作系统的基本概念与线程基础知识 3</p><ul><li><p>1.1 实时操作系统的基本含义 3</p><ul><li>1.1.1 嵌入式系统的基本分类 3</li><li>1.1.2 无操作系统与实时操作系统 4</li><li>1.1.3 实时操作系统与非实时操作系统 5</li></ul></li><li><p>1.2 实时操作系统中的基本概念 6</p><ul><li>1.2.1 线程与调度的基本含义 6</li><li>1.2.2 内核的基本概念 7</li><li>1.2.3 线程的基本概念 9</li></ul></li><li><p>1.3 线程的三要素、四种状态及三种基本形式 10</p><ul><li>1.3.1 线程的三要素 10</li><li>1.3.2 线程的四种状态 11</li><li>1.3.3 线程的三种基本形式 13</li></ul></li><li>1.4 本章小结 14</li></ul></li><li><p>第2章 相关基础知识 17</p><ul><li><p>2.1 CPU内部寄存器的分类及ARM Cortex-M处理器的主要寄存器 17</p><ul><li>2.1.1 CPU内部寄存器的分类 17</li><li>2.1.2 ARM Cortex-M处理器的主要寄存器 18</li></ul></li><li><p>2.2 C语言中的构造类型及编译相关问题 21</p><ul><li>2.2.1 C语言中的构造类型 21</li><li>2.2.2 编译相关问题 25</li></ul></li><li><p>2.3 实时操作系统内核使用的数据结构 26</p><ul><li>2.3.1 栈与堆 26</li><li>2.3.2 队列 28</li><li>2.3.3 链表 29</li></ul></li><li><p>2.4 汇编语言概述 36</p><ul><li>2.4.1 汇编语言格式 36</li><li>2.4.2 常用伪指令简介 38</li></ul></li><li>2.5 本章小结 40</li></ul></li><li><p>第3章 Mbed OS第一个样例工程 41</p><ul><li>3.1 Mbed OS简介 41</li><li><p>3.2 软件和硬件开发平台 42</p><ul><li>3.2.1 GEC架构简介 42</li><li>3.2.2 硬件平台 43</li><li>3.2.3 软件平台 44</li><li>3.2.4 网上电子资源 45</li></ul></li><li><p>3.3 第一个样例工程 46</p><ul><li>3.3.1 样例程序功能 46</li><li>3.3.2 工程框架设计原则 46</li><li>3.3.3 无操作系统的工程框架 47</li><li>3.3.4 Mbed OS的工程框架 51</li></ul></li><li>3.4 本章小结 56</li></ul></li><li><p>第4章 实时操作系统下应用程序的基本要素 57</p><ul><li><p>4.1 中断的基本概念及处理过程 57</p><ul><li>4.1.1 中断的基本概念 57</li><li>4.1.2 中断处理的基本过程 58</li></ul></li><li><p>4.2 时间嘀嗒与延时函数 60</p><ul><li>4.2.1 时间嘀嗒 60</li><li>4.2.2 延时函数 60</li></ul></li><li><p>4.3 调度策略 61</p><ul><li>4.3.1 调度基础知识 61</li><li>4.3.2 Mbed OS中使用的调度策略 62</li><li>4.3.3 Mbed OS中的固有线程 63</li></ul></li><li><p>4.4 实时操作系统中的功能列表 64</p><ul><li>4.4.1 就绪列表 64</li><li>4.4.2 延时列表 64</li><li>4.4.3 等待列表 64</li><li>4.4.4 条件阻塞列表 64</li></ul></li><li>4.5 本章小结 65</li></ul></li><li><p>第5章 同步与通信的应用方法 67</p><ul><li><p>5.1 实时操作系统中同步与通信的基本概念 67</p><ul><li>5.1.1 同步的含义与通信手段 67</li><li>5.1.2 同步类型 68</li></ul></li><li><p>5.2 事件 69</p><ul><li>5.2.1 事件的含义及应用场合 69</li><li>5.2.2 事件的常用函数 69</li><li>5.2.3 事件的编程举例:通过事件实现中断与线程的通信 71</li><li>5.2.4 事件的编程举例:通过事件实现线程之间的通信 74</li></ul></li><li><p>5.3 消息队列 76</p><ul><li>5.3.1 消息队列的含义及应用场合 76</li><li>5.3.2 消息队列的常用函数 76</li><li>5.3.3 消息队列的编程举例 78</li></ul></li><li><p>5.4 线程信号 82</p><ul><li>5.4.1 线程信号的含义及应用场合 82</li><li>5.4.2 线程信号的常用函数 83</li><li>5.4.3 线程信号的编程举例 84</li></ul></li><li><p>5.5 信号量 87</p><ul><li>5.5.1 信号量的含义及应用场合 87</li><li>5.5.2 信号量的常用函数 88</li><li>5.5.3 信号量的编程举例 89</li></ul></li><li><p>5.6 互斥量 92</p><ul><li>5.6.1 互斥量的含义及应用场合 92</li><li>5.6.2 互斥量的常用函数 94</li><li>5.6.3 互斥量的编程举例 95</li></ul></li><li>5.7 本章小结 98</li></ul></li><li><p>第6章 底层硬件驱动构件 99</p><ul><li><p>6.1 嵌入式构件概述 99</p><ul><li>6.1.1 制作构件的必要性 99</li><li>6.1.2 构件的基本概念 99</li><li>6.1.3 嵌入式开发中构件的分类 100</li><li>6.1.4 构件的基本特征与表达形式 101</li></ul></li><li><p>6.2 底层硬件驱动构件设计原则与方法 102</p><ul><li>6.2.1 底层硬件驱动构件设计的基本原则 102</li><li>6.2.2 底层硬件驱动构件设计要点分析 103</li><li>6.2.3 底层硬件驱动构件封装规范概要 104</li><li>6.2.4 封装的前期准备 105</li></ul></li><li><p>6.3 底层硬件驱动构件设计举例 106</p><ul><li>6.3.1 GPIO构件 106</li><li>6.3.2 UART构件 114</li><li>6.3.3 Flash构件 119</li><li>6.3.4 ADC构件 123</li><li>6.3.5 PWM构件 127</li></ul></li><li><p>6.4 应用构件及软件构件设计实例 131</p><ul><li>6.4.1 应用构件设计实例 131</li><li>6.4.2 软件构件设计实例 133</li></ul></li><li>6.5 本章小结 142</li></ul></li><li><p>第7章 实时操作系统下的程序设计方法 143</p><ul><li><p>7.1 程序稳定性问题 143</p><ul><li>7.1.1 稳定性的基本要求 143</li><li>7.1.2 看门狗复位与定期复位的应用 144</li><li>7.1.3 临界区的处理 147</li></ul></li><li><p>7.2 中断服务程序设计、线程划分及优先级安排问题 148</p><ul><li>7.2.1 中断服务程序设计的基本问题 148</li><li>7.2.2 线程划分的简明方法 149</li><li>7.2.3 线程优先级安排问题 149</li></ul></li><li><p>7.3 利用信号量解决并发与资源共享的问题 150</p><ul><li>7.3.1 并发与资源共享的问题 150</li><li>7.3.2 应用实例 151</li></ul></li><li><p>7.4 优先级反转问题 155</p><ul><li>7.4.1 优先级反转问题的出现 155</li><li>7.4.2 Mbed OS中避免优先级反转问题的方法 157</li></ul></li><li>7.5 本章小结 162<br> <strong>第2篇 原理剖析篇</strong></li></ul></li><li><p>第8章 理解Mbed OS的启动过程 165</p><ul><li><p>8.1 芯片启动到main函数之前的运行过程 165</p><ul><li>8.1.1 寻找第一条被执行指令的存放处 165</li><li>8.1.2 通过启动文件理解芯片启动过程 167</li></ul></li><li><p>8.2 Mbed OS启动流程概要 169</p><ul><li>8.2.1 相关宏定义及结构体 169</li><li>8.2.2 栈和堆的配置 176</li><li>8.2.3 启动过程概述 179</li><li>8.2.4 如何运行到主线程 181</li><li>8.2.5 启动过程总流程源代码 182</li></ul></li><li><p>8.3 深入理解启动过程(一):内核初始化解析 183</p><ul><li>8.3.1 内核初始化准备工作 183</li><li>8.3.2 进入SVC中断服务程序SVC_Handler 186</li><li>8.3.3 实际内核初始化函数 187</li><li>8.3.4 返回流程 199</li></ul></li><li><p>8.4 深入理解启动过程(二):创建主线程、启动内核 200</p><ul><li>8.4.1 创建主线程 201</li><li>8.4.2 启动内核 215</li><li>8.4.3 定时器线程函数 226</li><li>8.4.4 消息获取与处理函数 228</li><li>8.4.5 线程延时等待函数 238</li></ul></li><li><p>8.5 中断服务程序SVC_Handler详解 240</p><ul><li>8.5.1 SVC_Handler功能概要 241</li><li>8.5.2 SVC_Handler完整流程 241</li><li>8.5.3 SVC_Handler功能分段解析 243</li><li>8.5.4 SVC_Handler完整代码注释 246</li><li>8.6 函数调用关系总结及存储空间分析 249</li><li>8.6.1 启动过程中函数的调用关系总结 250</li><li>8.6.2 启动过程存储空间分析 253</li></ul></li><li>8.7 本章小结 257</li></ul></li><li><p>第9章 理解时间嘀嗒 259</p><ul><li><p>9.1 时间嘀嗒的建立与使用 259</p><ul><li>9.1.1 SysTick定时器的寄存器 259</li><li>9.1.2 SysTick定时器的初始化 260</li><li>9.1.3 SysTick中断服务程序 263</li></ul></li><li><p>9.2 延时函数 266</p><ul><li>9.2.1 线程延时等待函数 266</li><li>9.2.2 线程延时嘀嗒函数 267</li><li>9.2.3 其他时间嘀嗒函数 269</li></ul></li><li><p>9.3 延时等待列表工作机制 271</p><ul><li>9.3.1 线程插入延时等待列表函数 271</li><li>9.3.2 从延时等待列表中移除线程的函数 274</li><li>9.3.3 延时函数调度过程实例剖析 275</li></ul></li><li><p>9.4 与时间相关的函数 279</p><ul><li>9.4.1 获取系统运行时间函数 280</li><li>9.4.2 日期转时间戳函数 281</li><li>9.4.3 时间戳转日期函数 283</li></ul></li><li>9.5 本章小结 286</li></ul></li><li><p>第10章 理解调度机制 287</p><ul><li><p>10.1 ARM Cortex-M4的SVC和PendSV中断的调度作用 287</p><ul><li>10.1.1 SVC中断的调度作用 287</li><li>10.1.2 PendSV中断的调度作用 288</li><li>10.1.3 列表分析 288</li></ul></li><li><p>10.2 中断服务程序PendSV_Handler剖析 289</p><ul><li>10.2.1 osRtxPendSV _Handler的功能概要 289</li><li>10.2.2 osRtxPendSV_Handler函数源代码解析 290</li><li>10.2.3 跳转到SVC_Context进行上下文切换 291</li><li>10.2.4 PendSV_Handler函数完整代码注释 291</li></ul></li><li><p>10.3 PendSV应用举例 292</p><ul><li>10.3.1 PendSV在事件中的应用 292</li><li>10.3.2 PendSV在线程信号中的应用 296</li></ul></li><li>10.4 本章小结 300</li></ul></li><li><p>第11章 理解事件与消息队列 301</p><ul><li><p>11.1 事件 301</p><ul><li>11.1.1 事件的相关结构体 301</li><li>11.1.2 事件函数深入剖析 302</li><li>11.1.3 事件调度剖析 307</li></ul></li><li><p>11.2 消息队列 311</p><ul><li>11.2.1 消息或消息队列结构体 311</li><li>11.2.2 消息队列函数深入剖析 313</li><li>11.2.3 消息队列调度剖析 318</li></ul></li><li>11.3 本章小结 322</li></ul></li><li><p>第12章 理解线程信号、信号量与互斥量 323</p><ul><li><p>12.1 线程信号 323</p><ul><li>12.1.1 线程操作函数 323</li><li>12.1.2 线程信号函数深入剖析 329</li><li>12.1.3 线程信号调度剖析 333</li></ul></li><li><p>12.2 信号量 337</p><ul><li>12.2.1 信号量控制块结构体 337</li><li>12.2.2 信号量函数深入剖析 337</li><li>12.2.3 信号量调度剖析 341</li></ul></li><li><p>12.3 互斥量 345</p><ul><li>12.3.1 互斥量结构体 345</li><li>12.3.2 互斥量函数深入剖析 346</li><li>12.3.3 互斥量调度剖析 352</li><li>12.3.4 互斥量避免优先级反转问题调度剖析 356</li></ul></li><li>12.4 本章小结 359<br><strong>第3篇 综合实践篇</strong></li></ul></li><li><p>第13章 基于Mbed OS的AHL-EORS应用 363</p><ul><li><p>13.1 AHL-EORS简介 363</p><ul><li>13.1.1 硬件清单 363</li><li>13.1.2 硬件测试导引 364</li></ul></li><li><p>13.2 卷积神经网络概述 364</p><ul><li>13.2.1 卷积神经网络的技术特点 364</li><li>13.2.2 卷积神经网络原理 365</li></ul></li><li><p>13.3 AHL-EORS选用模型分析 368</p><ul><li>13.3.1 MobileNetV2模型 369</li><li>13.3.2 NCP模型 370</li></ul></li><li><p>13.4 AHL-EORS的数据采集与训练过程 373</p><ul><li>13.4.1 数据采集程序 373</li><li>13.4.2 模型训练与部署 376</li></ul></li><li>13.5 在通用嵌入式计算机GEC上进行的推理过程 377</li><li>13.6 本章小结 380</li></ul></li><li><p>第14章 基于Mbed OS的NB-IoT应用开发 381</p><ul><li><p>14.1 窄带物联网应用开发概述 381</p><ul><li>14.1.1 窄带物联网简介 381</li><li>14.1.2 NB-IoT应用开发所面临的难题及解决思路 382</li><li>14.1.3 直观体验NB-IoT数据传输 383</li><li>14.1.4 金葫芦NB-IoT开发套件简介 384</li></ul></li><li><p>14.2 NB-IoT应用架构及通信基本过程 386</p><ul><li>14.2.1 建立NB-IoT应用架构的基本原则 386</li><li>14.2.2 终端UE、信息邮局MPO与人机交互系统HCI的基本定义 386</li><li>14.2.3 基于信息邮局粗略了解基本通信过程 387</li></ul></li><li><p>14.3 终端UE与云侦听程序的通信过程 388</p><ul><li>14.3.1 基于mbed的终端UE模板工程设计 389</li><li>14.3.2 云侦听模板工程功能简介 391</li><li>14.3.3 建立云侦听程序的运行场景 392</li><li>14.3.4 运行云侦听与终端UE模板工程 394</li><li>14.3.5 通信过程中的常见错误说明 396</li></ul></li><li><p>14.4 通过Web网页的数据访问 397</p><ul><li>14.4.1 运行Web模板观察自己终端UE的数据 397</li><li>14.4.2 NB-IoT的Web网页模板工程结构 398</li></ul></li><li><p>14.5 通过微信小程序的数据访问 399</p><ul><li>14.5.1 运行小程序模板观察自己终端UE的数据 399</li><li>14.5.2 NB-IoT的微信小程序模板工程结构 401</li></ul></li></ul></li><li>参考文献 403</li></ul><h2>作者简介</h2><p>王宜怀,博士,教授、博士生导师、网络工程系主任;苏州大学嵌入式系统与物联网研究所所长;苏州市政协常委、中国农工民主党苏州市委常委;江苏省计算机学会嵌入式系统与物联网专业委员会主任、中国软件行业协会嵌入式系统分会理事。主要研究方向:嵌入式系统、物联网与智能控制技术。</p><h2>书籍购买</h2><p>书籍购买:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13237887.html" target="blank">https://item.jd.com/13237887.html</a><br>试读链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fcread.jd.com%2Fread%2FstartRead.action%3FbookId%3D30817514%26readType%3D1" target="blank">https://cread.jd.com/read/startRead.action?bookId=30817514&amp;readType=1</a></p><p>配套电子资源获取(包含文档和源代码):点击<a href="https://aijishu.com/link?target=http%3A%2F%2Fsumcu.suda.edu.cn%2FmbedOS%2Flist.htm" target="blank">苏州大学嵌入式学习社区官网</a>,在【<strong>著作</strong>】-【<strong>mebdOS</strong>】下栏目下获得电子资源。</p><blockquote>更多书籍推荐请关注<a href="https://aijishu.com/blog/armjiaoyushengta"><strong>极术读书专栏</strong></a>,用知识武装头脑,增强个人竞争力。</blockquote>
                                                    ]]></description>
            <pubDate>Tue, 20 Sep 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000355068</guid>
            <link>https://aijishu.com//a/1060000000355068</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】极客时间月卡赠卡第一期获奖名单]]></title>
            <description><![CDATA[<p>上周<a href="https://aijishu.com/books">极术读书栏目</a>组织了极客时间月卡赠卡第一期活动,收到了很多社区用户的支持。下方为社区中奖用户名单,非常感谢大家的支持。欢迎大家继续关注<a href="https://aijishu.com/books">极术读书栏目</a>,我们会推荐更多嵌入式,AI,芯片设计,安全等领域的好书以及组织webinar和赠书活动。</p><p>中奖名单如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbDzn" alt="a5d1f6022a5601cc6cc20a95a6630b2.png" title="a5d1f6022a5601cc6cc20a95a6630b2.png"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbDzo" alt="bfb41fd344bc64dd5fd8c4922c2cd6e.jpg" title="bfb41fd344bc64dd5fd8c4922c2cd6e.jpg"></p><blockquote><p>恭喜以上用户,我们将尽快将月卡兑换码发到您的申请邮箱。没有获奖的小伙伴也不要灰心,请关注我们更多活动。</p><p>暂时没有获奖的的小伙伴也不要着急,接下来极术读书及安谋科技学堂会多多组织类似的活动,努力为大家谋福利!</p></blockquote><p><strong>活动原文</strong>:<a href="https://aijishu.com/e/1120000000346486">【极术读书】赠卡活动第一期,200张极客时间月卡免费领,从零开始学芯片</a></p><p><strong>学习推荐</strong>:关注<strong>安谋科技学堂</strong>公众号<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbiNv" alt="安谋科技学堂.png" title="安谋科技学堂.png"></p><blockquote>本活动最终解释权归极术社区所有。</blockquote>
                                                    ]]></description>
            <pubDate>Sun, 04 Sep 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000351369</guid>
            <link>https://aijishu.com//a/1060000000351369</link>
        </item>
        <item>
            <title><![CDATA[免费学习国家精品课程:《嵌入式系统及应用》在线课程,第12次开课!]]></title>
            <description><![CDATA[<p>和安谋科技教育计划有非常深入合作的苏州大学王宜怀教授,正在授课的基于Arm® Cortex®-M处理器的<strong>《嵌入式系统及应用》在线开放课程</strong>一直是我们极力推荐的。目前该课程已经被评为<strong>国家精品课程</strong>。</p><p>嵌入式系统是嵌入式人工智能与物联网的重要基础,该课程以Arm Cortex-M微处理器为蓝本,以软硬件构件为主线,基于嵌入式软件工程基本原理,按照"通用知识—驱动构件使用方法—测试实例—芯片编程结构—构件设计方法”的线条,逐步阐述嵌入式系统基本知识要素及较为规范的底层软硬件相结合的设计方法。</p><p><strong>目前是本课程的第12次开课,开课时间是2022年09月05日 ~ 2023年01月06日。</strong>如果你想掌握构成计算机的基本部件原理,掌握计算机高级程序设计方法,为从寄存器级理解软件干预硬件提供基础,那就赶快查看下方信息,报名学习吧!现在加入还来得及喔~</p><h2>《嵌入式系统及应用》在线开放课程</h2><p><a href="https://v.qq.com/x/page/j3325qf1xro.html">https://v.qq.com/x/page/j3325qf1xro.html</a></p><p>本视频由授课教师提供</p><h4><strong>01 基本介绍</strong></h4><ul><li><strong>课程名称:</strong>《嵌入式系统及应用》</li><li><strong>授课单位:</strong>苏州大学</li><li><strong>授课教师:</strong>王宜怀、张建、刘长勇</li><li><strong>在线学习网址:</strong>  <a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.icourse163.org%2Fcourse%2FSUDA-1001754273" target="blank">[爱课程-中国大学MOOC]</a></li></ul><h4><strong>02 课程概述</strong></h4><p>《嵌入式系统及应用》课程作为嵌入式人工智能与物联网相关专业的基础课程,以Arm Cortex-M微处理器为蓝本,采用构件化开发,针对每个知识点,提供样本程序(葫芦),学生通过模仿该程序稍加修改后可完成符合自我要求的程序(照葫芦画瓢)。课程按照<strong>“通用知识—驱动构件使用方法—测试实例—芯片编程结构—构件设计方法”</strong>的线条,逐步阐述嵌入式系统基本知识要素及较为规范的底层软硬件相结合的设计方法。</p><h4><strong>03 课程用书</strong></h4><p>本课程教学用书《嵌入式技术基础与实践(第6版)—基于STM32L431微控制器》,该教材历经十多年凝练,仔细梳理了嵌入式系统的通用基础知识要素,注重把握通用知识与芯片相关知识之间的平衡、把握硬件与软件的关系、对底层驱动进行构件化封装、设计合理的测试用例,教材内含简明实验套件,结合网上电子资源,方便读者进行实践与应用。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbqNk" alt="51546da303679fd168b5fe7d75d10e65.jpg" title="51546da303679fd168b5fe7d75d10e65.jpg"></p><p><strong>《嵌入式技术基础与实践(第6版)》(王宜怀主编)</strong></p><blockquote>【书内含通用嵌入式计算机GEC,型号:AHL-STM32L431,可完成书中基本实验】</blockquote><p><strong>电子资源下载地址及路径:</strong></p><p>“<a href="https://aijishu.com/link?target=https%3A%2F%2Fsumcu.suda.edu.cn%2F" target="blank">https://sumcu.suda.edu.cn/</a>”→“金葫芦专区”→“嵌入式书6版”,右边为下载索引</p><p><strong>点击<a href="https://aijishu.com/link?target=https%3A%2F%2Ftuicashier.youzan.com%2Fpay%2Fwscgoods_order%3Fbanner_id%3Dseach.16152946%7Esearch%7E7%7E7LEMSxlm%26words%3D%E5%B5%8C%E5%85%A5%E5%BC%8F%26alg%3D0%26slg%3Dconsumer-search%2CstandardModify%2C30be7fd3-df55-4535-c709-11c1b3a78e09%2C711.545_c9498a9569324a1ab4d18b403e0cc497%26reft%3D1630934839602%26spm%3Dseach.16152946%26is_share%3D1%26shopAutoEnter%3D1%26sl%3D3NTPzP%26from_params%3Dsl%7E3NTPzP%21online_kdt_id%7E16152946%26sub_kdt_id%3D16152946%26st%3D3%26alias%3D3f579wrkbwq9es4%26is_silence_auth%3D1" target="blank">链接</a>即可购买教材:</strong></p><h4><strong>04 课程大纲</strong></h4><p><strong>01 概述</strong></p><p>1.1 初识嵌入式系统<br>1.2 嵌入式系统的定义、发展简史、分类及特点<br>1.3 嵌入式系统的学习困惑、知识体系及学习建议<br>1.4 微控制器与应用处理器简介<br>1.5 嵌入式系统常用术语</p><p><strong>02 Arm Cortex-M4微处理器</strong></p><p>2.1 Arm Cortex-M4微处理器简介<br>2.2 寻址方式与机器码的获取方法<br>2.3 基本指令分类解析<br>2.4 汇编语言的基本语法</p><p><strong>03 存储器映像、中断源与硬件最小系统</strong></p><p>3.1 STM32L系列MCU概述<br>3.2 STM32L4的引脚图与硬件最小系统<br>3.3 由MCU构建通用嵌入式计算机</p><p><strong>04 GPIO及程序框架</strong></p><p>4.1 GPIO通用基础知识<br>4.2 软件干预硬件的方法<br>4.3 认识工程框架<br>4.4 GPIO构件的制作过程<br>4.5 第一个汇编语言工程:控制小灯闪烁<br>4.6 实验一 熟悉实验开发环境及GPIO编程</p><p><strong>05 嵌入式硬件构件与底层驱动构件基本规范</strong></p><p>5.1 嵌入式硬件构件<br>5.2 嵌入式底层驱动构件的概念与层次模型<br>5.3 底层驱动构件的封装规范<br>5.4 硬件构件及其驱动构件的复用与移植方法</p><p><strong>06 串行通信模块及第一个中断程序结构</strong></p><p>6.1 异步串行通信的通用基础知识<br>6.2 基于构件的串行通信编程方法<br>6.3 UART构件的制作过程<br>6.4 中断机制及中断编程步骤<br>6.5 实验二 串口通信及中断实验</p><p><strong>07 定时器相关模块</strong></p><p>7.1 定时器通用基础知识<br>7.2 STM32L431中的定时器<br>7.3 脉宽调制<br>7.4 输入捕捉与输出比较<br>7.5 实验三 定时器及PWM实验</p><p><strong>08 Flash在线编程、ADC与DAC  </strong></p><p>8.1 Flash在线编程  <br>8.2 ADC<br>8.3 DAC<br>8.4 实验四 ADC实验</p><p><strong>09&nbsp;SPI、I2C与TSC模块  </strong></p><p>9.1 串行外设接口SPI模块  <br>9.2 集成电路互联总线I2C模块<br>9.3 触摸感应控制器TSC模块<br>9.4 实验五 SPI通信实验</p><p><strong>10 CAN总线、DMA与位带操作</strong>  </p><p>10.1 CAN总线<br>10.2 DMA<br>10.3 位带操作</p><p><strong>11 系统时钟与其他功能模块</strong>  </p><p>11.1 时钟系统<br>11.2 复位模块与看门狗模块<br>11.3 电源控制模块与CRC校验模块<br>11.4 实验六 综合实验</p><p><strong>12 应用案例  </strong></p><p>12.1 嵌入式系统稳定性问题<br>12.2 外接传感器及执行部件的编程方法<br>12.3 实时操作系统的简明实例<br>12.4 嵌入式人工智能的简明实例<br>12.5 NB-IoT的应用简介<br>12.6 4G、Cat1、Wi-Fi及WSN的应用</p><h4><strong>05 预备知识</strong></h4><p>必须具备以下知识:</p><ul><li>计算机硬件基础(或模拟电路与数字电路、计算机组成、汇编语言、微机原理)</li><li>高级程序语言设计等(如C语言)</li></ul><p>学生通过学习上述课程,基本掌握构成计算机的基本部件原理,掌握计算机高级程序设计方法,为从寄存器级理解软件干预硬件提供基础。</p>
                                                    ]]></description>
            <pubDate>Wed, 31 Aug 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000350157</guid>
            <link>https://aijishu.com//a/1060000000350157</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】《软硬件融合--超大规模云计算架构创新之路》赠书名单公布]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/blog/armjiaoyushengta">极术读书</a>专栏。</blockquote><p>2022年7月27日至8月1日,极术社区联合安谋科技学堂赠送50本《<a href="https://aijishu.com/e/1120000000340363"><strong>软硬件融合-超大规模云计算创新之路</strong></a>》,非常感谢大家的积极参与,赠书名单如下,恭喜下方的小伙伴,下面每人将收到极术读书赠送的一本《软硬件融合--超大规模云计算架构创新之路》。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbBDd" alt="1659338014008.jpg" title="1659338014008.jpg"></p><blockquote><p>祝贺以上获奖的小伙伴!</p><p>极术读书工作人员将给中奖用户发送邮件通知并尽快安排寄出。</p><p>暂时没有获奖的的小伙伴也不要着急,接下来极术读书及安谋科技学堂会多多组织类似的活动,努力为大家谋福利!</p></blockquote><p><strong>活动原文</strong>:<a href="https://aijishu.com/e/1120000000340363">【极术读书赠书活动】50本《软硬件融合》免费领,学习从DPU到异构计算的超大规模计算创新之路</a></p><p><strong>资源推荐</strong>:关注<strong>安谋科技学堂</strong>公众号,回复 “<strong>软硬件融合</strong>” 获取软硬件融合相关资源!<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbiNv" alt="安谋科技学堂.png" title="安谋科技学堂.png"></p><p><strong>如何购买?</strong><br>京东旗舰店:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F12836605.html" target="blank">https://item.jd.com/12836605.html</a></p><blockquote>本活动最终解释权归极术社区所有。</blockquote>
                                                    ]]></description>
            <pubDate>Sun, 31 Jul 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000343915</guid>
            <link>https://aijishu.com//a/1060000000343915</link>
        </item>
    </channel>
</rss>

...

@github-actions
Copy link
Contributor

http://localhost:1200/aijishu/channel - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[极术社区 - 连接开发者与智能计算生态]]></title>
        <link>https://aijishu.com//api/channel/newest?page=1</link>
        <atom:link href="http://localhost:1200/aijishu/channel" rel="self" type="application/rss+xml" />
        <description><![CDATA[极术社区 - 连接开发者与智能计算生态 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 15:15:34 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[抢先入局AIGC,新华三底层能力何在?]]></title>
            <description><![CDATA[<p>2022年11月,智能对话机器人模型ChatGPT上线,其连续对话能力、强大的理解力、回答的准确度和创造性使其迅速走红。数据显示,ChatGPT发布短短两个月时间,全球用户数便突破1亿。  </p><p>可以说,这项火遍全球的突破性人工智能对话技术,为整个科技行业带来了全新的想象力。而在国内,由百度打造的首个“类ChatGPT”——百度文心一言(ERNIE Bot)也即将在今年3月呈现,这是先进的人工智能对话技术在国内数字化领域中的首次大规模落地尝试,其价值无疑深远而重大。  </p><p><img referrerpolicy="no-referrer" src="https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/6ded7ccf62ea480d89d72aa5f4f8be39~tplv-tt-shrink:640:0.image?traceid=20230227174332DA60910EFE6C344C7866&amp;x-expires=2147483647&amp;x-signature=PzGM3fUwuBa9BuJ%2F70g%2Fv1HfU3k%3D" alt="" title="">  </p><p>值得一提的是,紫光股份旗下新华三集团日前也宣布正式成为百度文心一言的首批生态合作伙伴。接下来,双方将会把领先的智能对话技术成果应用在数字化领域,深度赋能百行百业的数字化转型和智能化升级。  </p><p>回头来看,新华三之所以能够成为百度文心一言的首批生态合作伙伴,无疑是其长期在ICT基础设施领域深厚技术沉淀和释放的一种体现,而这背后也让整个产业看到了新的可能——那就是站在企业数字化转型和智能化升级的重要关口,新华三以其智算基础架构构筑的超大模型底座,无疑可以为百行百业创造出更多具有想象空间的新业态、新服务和新模式,让智能化的大潮 “普惠”每一家企业和每一个个人,释放智能化生产力的“乘数效应”。  </p><p><strong>新华三牵手百度文心一言背后</strong>  </p><p>目前,以ChatGPT为代表的AIGC内容生成方式通过学习人类的思考方式,查阅、挖掘大量素材,以低边际成本、少人力限制等高效率的方式生成大量满足人们差异化需求的内容。  </p><p><img referrerpolicy="no-referrer" src="https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/2f718b62e00544a7981e09717999fe9c~tplv-tt-shrink:640:0.image?traceid=20230227174332DA60910EFE6C344C7866&amp;x-expires=2147483647&amp;x-signature=efX7OTdHEhxAdShYjUSRZJikEnU%3D" alt="" title="">  </p><p>文心一言,正是百度基于文心大模型技术推出的生成式AI产品。作为国内少有的拥有大模型技术的企业,百度在人工智能领域深耕十余年,拥有产业级知识增强文心大模型ERNIE,具备跨模态、跨语言的深度语义理解与生成能力,而这种能力,也在搜索问答、云计算、内容创作生成、智能办公等众多领域具有较大的“用武之地”。  </p><p>而本次新华三之所以率先成为百度文心一言的首批生态合作伙伴,其实也在“情理之中”。据了解,新华三与百度的合作有着长久的历史积淀,双方在ICT基础设施优化升级、百度智能云建设、信息检索、自动驾驶、生态建设等众多领域均有研发级别的合作,目前相关成果已广泛落地,对双方的产品技术发展产生了积极而深远的影响。  </p><p>而展望未来,新华三也将继续携手百度,为智能交通、自动驾驶、智慧城市、智慧医疗、智慧教育、智慧金融、多域互联等领域推出更多场景化解决方案,开拓内容生态和智能服务领域的全新可能性,全面引领数字化时代的产业变革与升级。  </p><p><strong>以智算架构构筑超大模型底座</strong>  </p><p>接下来要追问的是,为什么是新华三能够率先成为百度文心一言的首批生态合作伙伴呢?其实,要回答这一问题,就不得不提到类似ChatGPT和百度文心一言这样的AI基础模型(基于大规模数据集和大规模算力训练的大型预训练模型),要训练出这样的超大基础模型,往往是需要多方面的关键技术作为支撑的——除了大模型算法、分布式训练系统、高质量数据集的相关工具等,对计算、网络、存储等基础设施做出了巨大挑战。  </p><p>例如,训练大模型首先就需要大规模算力资源做支撑;同时大型训练对显存以及数据集缓存要求同样很高,训练过程中还会面临显存墙问题(模型是否能跑起来)以及计算/通信墙问题(能否在合理时间内完成训练);此外,大模型的训练同样对网络也提出了更高的要求,即需高性能网络满足节点间参数同步,且GPU服务器节点间需要高速网络来实现模型训练参数交换和存取等等。  </p><p>正是由于大模型的训练对存储、计算、网络等各个层面都提出了比较严苛的要求,长期深耕ICT领域的新华三,也基于自身在存储、计算、网络等领域深厚的技术积淀,打造出了一套全新的智算基础架构,该架构分为两大区域,即智算训练区和智算推理区,由此能够为大模型的训练提供强大的技术底座能力,具体来看:  </p><p><img referrerpolicy="no-referrer" src="https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/5bd8f2b9a2d94617be87edd9202d9527~tplv-tt-shrink:640:0.image?traceid=20230227174332DA60910EFE6C344C7866&amp;x-expires=2147483647&amp;x-signature=okFNlp6zeraUxFTj8uGC3VkVV30%3D" alt="" title="">  </p><p><strong>一是,在训练集群方面,</strong>目前大模型的训练使用的服务器通常都是搭载NVIDIA NVLink GPU模块作为标准机,而新华三能够提供H3C UniServer R5500 G5这样机型,其搭载了NVIDIA HGX A800 8-GPU 80G模块,能够支持英特尔Whitley平台和AMD Milan平台,最大支持2颗Icelake(40C、270W)或2颗Milan(64C、280W)的CPU,存储方面能够最大支持12个U.2 NVMe SSD,其中8个支持GDS(GDS, GPU Direct Storage),可以最大化地满足训练集群的算力需求。  </p><p>不仅如此,在2023年初,新华三还发布了搭载NVIDIA H800 NVLink模块的新一代机型R5500 G6,支持英特尔EGS和AMD Genoa平台,PCIe 5.0及400GE网络的加持,也能够给大模型的训练带来更高的算力提升。  </p><p>另外,一些大型互联网公司还会使用自研GPU Box搭配计算节点的方式组建训练集群,GPU Box里面会搭载NVIDIA NVLink GPU模块或其他厂商的OAM模组,而OAM是开源的GPU模块,由OCP社区服务器项目组下的OAI小组开发并制定标准。在这方面,新华三也是OAI2.0规范制定的重要参与者,后续在R5500 G6上,新华三也可支持不同厂家GPU的OAM模组。  </p><p><strong>二是,在推理集群方面,</strong>GPU推理集群的规模主要取决于业务预期的QPS并发需求,一般会多机多卡多实例部署。同样,新华三也提供了相关的产品以满足实际的业务需求,以H3C UniServer R5300 G5为例,其最大支持2颗英特尔Icelake(40C、270W)CPU,并可搭配多厂家多种类型的GPU产品,包括GPU、XPU、NPU等。  </p><p>而在大规模推理场景下,新华三 UniServer R5300 G5也支持多种类型的GPU方案,包括4 PCIe GPU方案、8 PCIe GPU方案和16 PCIe GPU方案,以应对不同客户不同算力的推理集群搭建需求。此外,在去年11月份,新华三还发布了基于AMD Genoa平台的GPU服务器R5350 G6,可实现90%的CPU性能提升和50%的内核数量提升,应该说多种类型人工智能加速卡的支持,可以帮助客户应对人工智能不同场景下对异构算力的需求。  </p><p><strong>三是,高性能存储和网络也是大模型训练的重要组成部分。</strong>其中,高性能存储一般采用分布式并行文件存储,而新华三CX系列存储,就采用了全对称分布式架构,可结合IBM Spectrum Scale,为客户提供高带宽、低延时的存储服务。  </p><p>以新华三CX5036为例,配置2颗5218 CPU、4块1T NVMe和32块6T SATA HDD,4节点集群部署,测试大文件小IO(4KB)平均单节点IOPS可达2.55W(随机读)、2.36W(随机写),多客户端并发(16MB)平均单节点带宽可达3.57GB/s(顺序读)、2.08GB/s(顺序写),单客户端单流16MB IO聚合带宽可达5.45GB/s、1MB IO聚合带宽3.7GB/s。  </p><p>高性能网络方面,通常有两种网络搭建方式:第一种是RoCE网络,作为互联网400G领域的市场领头羊,基于新华三提供的S9825/S9855交换机配合AI ECN方案,也可以迅速搭建大模型训练所需的高性能网络。与此同时,随着大模型训练所需网络带宽的不断提升,网络主芯片性能也会迅速增加,当800G/1.6T时代来临时,CPO/NPO交换机将会登上互联网舞台,在这方面新华三也提前做了布局,其S9825-32D32DO交换机,同时支持32个400G光模块接口和32个400G光引擎接口,后续可以平滑升级至51.2T平台;第二种方式是DDC方案,DDC网络架构(分布式分解结构)可以很轻易解决负载均衡和阻塞问题,同时也能实现更优的网络性能和更快的网络收敛。在这方面,新华三的DDC方案也在进行相关验证中。  </p><p>由此可见,从新华三智算基础架构的技术细节中,可以看到新华三以智算基础架构为超大模型训练构筑了坚实的底座,不仅能够为包括AIGC为代表的超大模型提供关键技术支撑,同时也是新华三率先成为百度文心一言的首批生态合作伙伴的关键所在。  </p><p><strong>释放智能化生产力“乘数效应”</strong>  </p><p>客观地说,智能化已经成为了当下中国产业升级和企业数字化转型中的新动能和驱动力。特别是由于线上线下生态及场景远比其他国家丰富、多元,中国经济中结构性的差异,以及细分行业中不同的应用场景需求,都给了基于AIGC为代表的新技术的创新以巨大的想象力,而新华三以智算架构构筑的超大模型底座,不仅可以帮助企业借助AIGC提升效率,创造新价值,持续推动产业智能化的升级,同时也让AI真正“扎根”百行百业奠定了关键基础,背后更体现出了全新的价值,可以从两个方面来做观察:  </p><p><img referrerpolicy="no-referrer" src="https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/f3a59c74357546fe8fdb0c988f5ce441~tplv-tt-shrink:640:0.image?traceid=20230227174332DA60910EFE6C344C7866&amp;x-expires=2147483647&amp;x-signature=dEI4BKWYukYdL445%2Bjv%2B7jemLOk%3D" alt="" title="">  </p><p><strong>一方面,是为AI超大模型的训练提供了坚实的技术支撑。</strong>随着关键技术与基础理论不断突破,大算力、大数据、大模型将成为未来AI发展的重点发展方向,由此带动自然语言处理、翻译模型、生成算法和数据集等细分要素持续提升,推动产出的内容细节、类型更丰富、质量更高。  </p><p>这背后显然离不开强大的算力和网络的支撑。而新华三打造的智算基础架构,基于新华三长期在ICT基础设施领域的沉淀,充分融合了其在计算、存储和网络等领域的优势,就切实地为超大模型训练提供了技术支撑。  </p><p>在此基础上,新华三还积极坚持前沿技术创新,其中全面支持在网计算的H3C P4可编程交换机,就能够支持Pytorch框架和DPDK UDP、RoCE通信方式,将数据需求聚合统一操作,优化通信网络拥堵,减少主机的数据处理量。据新华三内部实验室测算,使用H3C P4可编程交换机加速数据并行训练,模型训练精度不受影响,计算节点间通信数据量平均减少30%,最多可以减少48%的训练时间,可大幅提升分布式集群的整体训练效率,创造更加出色的应用价值。可以说在产品、技术和方案上的领先性,是新华三差异化的优势所在,更是其能够助力各类企业AIGC展开研发和推进的价值所在。  </p><p><strong>另一方面,新华三还正与产业各方积极合作,探索新范式和新路径,推动普惠算力更为广泛地落地,使能百行百业的智能化升级,共同推进中国人工智能产业的发展。</strong>  </p><p>这方面,新华三率先成为百度文心一言首批生态合作伙伴就是具体的印证。众所周知,今天AI正在极大改变人们的生活方式,目前也正在开始加速渗透到企业的研发设计、生产制造、供应链管理、客户服务等各个环节,深刻改变着人们的生产方式。  </p><p>因此,以提升效率和优化配置为核心主题的AI应用和创新,是数字经济深化发展的全新阶段,更是传统产业转型升级的必然要求。在这种大背景下,新华三和包括百度在内的产业合作伙伴通力合作,并通过旗下丰富的产品和解决方案为百行百业的用户注入云原生及人工智能技术,也能加速整个行业的智能化升级,释放智能化生产力“乘数效应”。  </p><p>总的来说,中国产业智能化的转型升级,中国数字经济的落地和发展,任重而道远。在此过程中,新华三以全新的智算架构支撑超大模型训练,并与产业合作伙伴深度合作,让AIGC这样的新技术能够加速行业落地的步伐,而这种创新力、前瞻力和爆发力,相信也将能够推动中国的人工智能产业呈现出“百花齐放”的状态,更能够提速整个行业智能化时代的到来,这不仅是未来的趋势所在,也是新华三不断创新与突破的重要体现。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 10:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387147</guid>
            <link>https://aijishu.com//a/1060000000387147</link>
        </item>
        <item>
            <title><![CDATA[神奇的MTE Tag在哪里?]]></title>
            <description><![CDATA[<p>常有人问MTE Tag在哪里?</p><h4>MTE Tag存在于两个地方:</h4><ol><li>MTE tag放在访问地址的bit 56:59,比如通过LDR Xm, [Xn]访问内存,Xn里面存放的是访问地址,当MTE使能的时候,真正用于访问内存的地址是bit 0:47(不考虑arm的52bit地址扩展)和bit 55 (bit55用于决定是高虚拟地址空间还是低虚拟地址空间),bit 56:59 这4个bit用于存放该地址的tag<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSb" alt="1.jpg" title="1.jpg"></li></ol><p>Xn的Tag生成和插入可以IRG,ADDG,SUBG等这些指令来实现:</p><ul><li>IRG Xn, Xn:为Xn中的地址生成一个随机的Tag,并插入到Xn的bit 56:59</li><li>ADDG Xm,Xn,#offset,#Tag  or</li><li>ADDG Xm,Xn,#offset,#Tag: 对Xn中的地址进行加减操作,并将指令中的Tag值插入到目的寄存器中</li></ul><p>当然软件也可以直接通过一般的指令直接改Xn寄存器的bit 56:59,比如<br>AND Xn, Xn, #~(0xf&lt;&lt;56)</p><ol start="2"><li>MTE tag放在内存中(内存可以是cache或是外部内存):<br>  每16-bye的物理地址空间有与之对应的4-bit的Tag存储空间<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSc" alt="7.jpg" title="7.jpg"></li></ol><p>在cache中,可以如下类似方式存储一个cache line(较新处理器Data cache都是PIPT的)对应的Tag:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSd" alt="12.jpg" title="12.jpg"></p><p>对于外部内存,实际系统中设计上,可以设计为在同一系统内存中大部分内存作为正常的数据存储使用,一部分内存用于存储数据对应的Tag(其关系是4-bit/16-byte, 既Tag的存储空间大小是正常数据存储大小的1/32)。每16-byte的物理内存对可以找到与之对应的4-bit Tag存储物理内存。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSe" alt="8.jpg" title="8.jpg"></p><p>下面通过一实例来演示。<br>假设访问的地址放在X0中<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSb" alt="1.jpg" title="1.jpg"></p><ol><li>为这个地址产生设置一个Tag,可以通过IRG指令来实现<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSf" alt="2.jpg" title="2.jpg"></li><li>将这个Tag保存到Tag存储内存,可以通过,STG,STGZ, ST2G / STZ2G这些指令来实现<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSg" alt="3.jpg" title="3.jpg"></li><li>对Tagged内存进行load/store访问,这会触发硬件的tag check操作<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSh" alt="4.jpg" title="4.jpg"></li></ol><p>在这个例子里面X0里面的tag和内存中保存的tag是match的,因此Tag Check成功。</p><ol start="4"><li>通过ADDG指令修改Xn中地址的Tag<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSi" alt="5.jpg" title="5.jpg"></li><li>对Tagged内存进行load/store访问,这会触发硬件的tag check操作<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSj" alt="6.jpg" title="6.jpg"></li></ol><p>X0里面的tag和内存中保存的tag不match,因此Tag Check失败。</p><h4>Tag存储和check的示例</h4><p>以上内容阐述了tag存储和check的基本知识,下面以一个实际的例子来帮助更深入理解。<br>我们从上面的IRG,STG,LDR/STR等指令可以看出,Tag的存储在软件上看并没有独立的访问地址,对Tag的访问是使用其对应的数据访问地址:</p><ol><li>如果数据在处理器的cache中,那么其该数据所在的cache line也可以包含数据对应的Tag, MTE Tag check可以在CPU中进行。</li><li>但如果数据不在cache中(cache的大小有限),那么就需要将数据和Tag存放在系统内存(DRAM)中。那系统如何在系统内存中存放和访问数据和Tag呢?Tag check发生在哪里?<br>我们以一个使用CI-700的系统为例。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSk" alt="9.jpg" title="9.jpg"></li></ol><p>CI-700可以包含支持MTE Tag的system cache, 除此之外,它还可以包含MTSX,而MTSX包含:</p><ol><li>支持计算一个访问地址在DRAM中对应的Tag访问地址的split logic, 通过软件设置的Tag_base_address, split logic可以换算出一个地址对对应的Tag在DRAM存放的位置。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSe" alt="8.jpg" title="8.jpg"></li><li>支持Tag check (Tag 比较)</li><li>支持对专门只缓存Tag值的MTE Tag cache,这是一个可选的功能。</li></ol><p>MTSX split logic可以将CPU发送的Tagged address访问拆分成正常的数据访问和对Tag的访问,从而使DMC不需要区别正常数据访问和Tag访问(DMC对数据还是Tag访问无感,DMC不需要对MTE做特殊的支持)。</p><p>以STG X0,[X0]为例,这个指令如果在cache中miss,那么将产生一个TagOps为Update的CHI transaction,传输到MTSX,这个transaction包含放在X0中的数据访问地址和Tag Value。MTSX的split logic负责换算出这个数据访问地址对应的Tag在DRAM中的地址,然后使用这个地址将Tag value更新到DRAM中。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSl" alt="10.jpg" title="10.jpg"></p><p>如果一个Tagged address的数据从cache中write back到DRAM中,将产生一个TagOps为Match的CHI transaction, 传输到MTSX, 这个transaction包含数据访问地址,数据值和Tag Value,MTSX的split logic负责其拆分为:</p><ol><li>Tag访问:换算出这个数据访问地址对应的Tag在DRAM中的地址,从这个地址中取出Tag值,然后由MTSX的Tag Compare logic比较取出Tag值和transaction带有的Tag Value。</li><li>正常数据写操作<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSm" alt="11.jpg" title="11.jpg"></li></ol>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 09:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387141</guid>
            <link>https://aijishu.com//a/1060000000387141</link>
        </item>
        <item>
            <title><![CDATA[解密禾赛科技最新激光雷达专利]]></title>
            <description><![CDATA[<p>【爱集微点评】禾赛科技的激光雷达专利,通过色散偏折件实现多波长光源所产生光线的分光和出射,同时色散偏折件还能起到扩束的作用,能够有效增大激光雷达的口径,提升测远能力。而且不会过多增加激光雷达的光路高度,有效的压缩了激光雷达的高度和体积。</p><p>集微网消息,近日,禾赛科技在纳斯达克成功上市,意味着中国“激光雷达”向全球又迈进了一步,同时禾赛科技也成为中国“激光雷达第一股”。</p><p>激光雷达是一种常用的测距传感器,其工作原理是利用激光往返于雷达和目标之间所用的时间,或者调频连续光在雷达和目标之间往返所产生的频移来评估目标的距离或速度等信息。为了获得较大的视场范围,激光雷达通常采用扫描装置进行扫描。激光雷达常用的扫描方式有机械旋转式、反射镜扫描式、光学相控阵(OPA)扫描、Flash扫描等。另外,还有一种扫描方式是波长扫描。波长扫描的扫描装置是利用光栅、棱镜等色散元件基于波长将多波长光源产生的光线分开以达到扫描的效果。但是现有波长扫描的扫描装置往往存在装配不方便的问题。</p><p>为此,禾赛科技于2022年8月29日申请了一项名为“激光雷达的发射模块及激光雷达”的发明专利(申请号:202222291141.6),申请人为上海禾赛科技有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1126334138789.4883.png" alt="image" title="image"></p><p>图1 波长扫描装置的光路示意图</p><p>图1为传统波长扫描装置的光路示意图,在激光雷达的应用中,通过不同波长的光线向不同角度衍射来实现激光雷达对不同垂直角度的扫描。因此,为了使多束衍射光的出射方向靠近水平面,实现对垂直0°角和垂直方向正角度和负角度一定范围的扫描,如图1所示,通常在色散元件12下游的光路中会设置反射镜13。但是反射镜13的反射面与水平方向之间的夹角较大,所以会增大光路沿垂直方向的尺寸,使得激光雷达光路垂直方向的高度增大,从而不利于激光雷达体积的缩小。此外,也会使激光雷达光路的不同光学元件在不同高度的水平面上,从而造成了激光雷达的安装不便。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1342321041364.585.png" alt="image" title="image"></p><p>图2 新型激光雷达发射模块结构示意图</p><p>图2为本专利提出的一种新型激光雷达发射模块结构示意图,在此主要引入色散偏折件129,其主要包括光栅层127和导光体128。光栅层127朝向导光体128的表面并与导光体128的表面直接接触。导光体128的两个表面分别为第一面121和第二面122,第一光线131从第一面121入射至导光体128,第三光线133自第二面122从导光体128出射。色散面和偏折面集成于一体化结构的导光体128上,能够使光学元件体积大幅缩小,并且一体化的光学元件结构更加稳定,能够有效提高光路的鲁棒性。此外,一般而言,导光体128材料的折射率大于1。将导光体128的材料设置为比较常见的大于1的材料以控制折射角度,可以实现扩束效果。</p><p>简而言之,禾赛科技的激光雷达专利,通过色散偏折件实现多波长光源所产生光线的分光和出射,同时色散偏折件还能起到扩束的作用,能够有效增大激光雷达的口径,提升测远能力。而且不会过多增加激光雷达的光路高度,有效的压缩了激光雷达的高度和体积。</p><p>禾赛科技是一家致力于激光雷达研发与制造的全球化公司,其客户遍布全球主流汽车厂商、自动驾驶和机器人公司,覆盖40个国家和90多个城市。作为以技术为核心竞争力的公司,禾赛科技的成功并非偶然,而是在多年的产品打磨和技术投入中诞生的。中国需要有世界级自主研发能力的公司,相信禾赛科技也有实力成为全球领先企业。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 08:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387119</guid>
            <link>https://aijishu.com//a/1060000000387119</link>
        </item>
        <item>
            <title><![CDATA[聊聊身边的嵌入式:价格不菲的护眼灯,是眼睛保护神还是智商税?]]></title>
            <description><![CDATA[<p>神兽归笼这个词,不知道哪位大师发明的,充分表达了广大家长望子成龙,却又忧心忡忡,寝食难安的心情。让家长们焦虑的,不只是孩子的学习,还有健康。就拿视力来说,一份官方的报告,看了也是让人心中一惊。近视率从小学的35.6%,到初中的71.1%,再到到高中的80.5%,一路攀高,估计到大学生,就更没法看了。</p><p>众多的商家,从中嗅出了机会,护眼台灯就是其中一种。市场上的台灯,也是鱼龙混杂。对于但求最贵,不求最好的主,价格成千乃至上万。若是囊中羞涩,或者说但求最好,不求最贵的买家,在拼XX上,十块八块也能买一个,据称也是专为读书设计,国AA级照度的护眼灯。</p><p>这水挺深!</p><p>对于一种产品,即使你用一大堆指标去测试,区别好像也不大,似乎都挺好。只有我们深入了解了它的工作原理,才能清楚其中奥秘。我们今天拆个某东上卖的挺火的台灯,看一下究竟有什么高科技。</p><ol><li><strong>护眼台灯拆解</strong></li></ol><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRk" alt="image.png" title="image.png"></p><p>这灯外观看着还是挺漂亮的。面板采用了触控设计,打开电源开关后,手指在滑条滑动,可以调整光的亮度。这灯拿在手里,沉甸甸的,满满的科技感。我们接下来拆开看一下。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRm" alt="image.png" title="image.png"></p><p>这一拆开,首先被这一坨铁惊住了!据说某个乐善好施的活雷锋,早年卖医疗设备,为增加科技感,用的就是这一招。不过跟这个还真不一回事儿,这个台灯没有这坨铁,估计就头重脚轻站不住了。电路分为两个大部分,上面大板子是触摸控制板,下面小板子是电源变换和调光模块。</p><p>台灯外配220V转24V的电源,电源变换和调光模块把24V转换成5V供给控制板。反过来,控制板输出的PWM,控制此模块输出电流的大小,来调光亮度。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRn" alt="image.png" title="image.png"></p><p>翻过来看一下,两个带线圈的电感,用来滤除输入电源干扰。电路板的核心是一个LED调光芯片,上面的丝印比较模糊,最后我们会推测一下它的型号。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRo" alt="image.png" title="image.png"></p><p>灯的中间是圆形的白色导光板,然后四周围有91颗侧面发光的LED灯珠。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRp" alt="image.png" title="image.png"></p><p>再来看一下触摸控制板部分,有两颗芯片,一颗负责触摸按键和滑条的检测,一颗负责LED指示灯的控制,以及根据手指在滑条的位置,输出占空比不同的PWM波给电源控制和调光模块。这两颗芯片没有丝印,我们只好推测一下了。如果雷同,纯属巧合。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRq" alt="image.png" title="image.png"></p><p>触摸控制板用塑料柱锁死在面板上了,拆下来就废了。所以我们来透视一下,大概能看出四个按键,以及触摸滑条的样子。根据实测,台灯的亮度并不是连续可调的,而是有7级亮度,所以触摸滑条的分辨率也不用做的很高。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRr" alt="image.png" title="image.png"></p><ol start="2"><li><strong>原理框图</strong></li></ol><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRs" alt="image.png" title="image.png"></p><p>根据电路推测,这个方案应该是用到了台系的芯片,通泰的调光芯片TTP933和触控单片机TTP258。从手册来看,TTP933的性能还是不错的。而TTP258居然是一个4位机,厂家为压缩成本这也是拼了。作为对比,我们从拼XX上买了一款12块钱的护眼灯,还在运输途中,等货到了后再拆开和大家一起研究一下。</p><p>如果我们留意身边的家电,就会发现触摸控制,用的越来越多起来。我们后续也会持续关注这一技术,并和大家一起探讨它的神奇之处。</p><hr><blockquote>作者:Norman<br>来源: <a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FYTjf85HBOVs1dTPGU02t2Q" target="blank">TopSemic嵌入式</a><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bV7v5" alt="aijishu_TopSemic_1.jpg" title="aijishu_TopSemic_1.jpg"></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000379643">MCU如何实现对外部脉冲信号的计数功能?</a></li><li><a href="https://aijishu.com/a/1060000000375025">老前辈教你选 TVS</a></li><li><a href="https://aijishu.com/a/1060000000368824">初始化串口后,低功耗模式下电流高是怎么回事?</a></li><li><a href="https://aijishu.com/a/1060000000368608">一网打尽,国产MCU厂商</a></li><li><a href="https://aijishu.com/a/1060000000354916">到底什么是I/O的驱动能力?</a></li></ul><blockquote>更多芯片嵌入式电子技术分享请关注<a href="https://aijishu.com/blog/topsemicqianrush"><strong>Topsemic嵌入式</strong></a>极术专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387075</guid>
            <link>https://aijishu.com//a/1060000000387075</link>
        </item>
        <item>
            <title><![CDATA[用人工智能设计芯片及对IC设计就业市场的影响]]></title>
            <description><![CDATA[<p>集成电路 (IC) 设计是一项复杂的工作,不断突破密度和性能的界限。现在,人工智能 (AI)在 IC 设计中的作用越来越大。</p><p>虽然 AI 最近因其在 ChatGPT 等自然语言处理器方面的惊人能力而受到更多关注,但该工具也被用于 IC 设计的各个阶段,包括设计优化、布局、仿真和验证。人工智能算法还可以帮助更有效地探索设计空间,比传统方法更快地发现最佳设计配置。</p><h5>随着设计变得比以往任何时候都更加复杂,人工智能可以成为 IC 设计师的强大资产。</h5><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRe" alt="image.png" title="image.png"></p><p>本文重点介绍了AI如何被用作IC设计的工具,以及这项技术如何影响IC设计工程师的专业价值。</p><p><strong>利用 AI 来实现严格的设计约束</strong></p><h3>由于数十亿个晶体管被限制在一个很小的芯片区域,IC 设计师的任务是在严格约束的情况下优化设计。&nbsp;</h3><p>首先,芯片面积必须最小,以适应当今设备的小尺寸,并降低制造成本。布局的功耗也是值得关注的;功耗同样会影响部署成本以及芯片对环境的影响。某些密集区域和配置容易过热,需要冷却机制或更巧妙的布局。考虑到这些因素和许多其他因素,IC设计人员大约需要八到九个月的时间来生成一个满足每个严格要求的芯片布局。</p><p>为了加快和优化 IC 设计流程,许多公司(包括科技行业的一些最大公司)现在都在投资 AI 工具来完成一些繁重的工作。</p><p><strong>谷歌人工智能在几个小时内设计出芯片</strong></p><p>据谷歌称,谷歌的深度学习强化学习 (RL) 方法可以在比人类工程师少得多的时间内生成有效的布局,而且结果在质量上也不相上下。</p><p>谷歌表示,谷歌的深度学习强化学习(RL)方法可以在比人类少得多的时间内产生有效的布局,而且结果在质量上也不相上下。2022年3月,谷歌研究院推出了PRIME,这是一种深度学习方法,利用现有的数据,如功率和延迟来创建加速器设计,比用传统方法设计的芯片更快、更小。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRf" alt="image.png" title="image.png"></p><p>谷歌研究人员使用 10,000 个芯片平面图来训练他们的模型。人工智能生成的芯片设计时间不到六个小时。谷歌表示,这种方法已经被利用来实现谷歌的张量处理单元(TPU),这是谷歌基于云的机器学习应用的一部分。</p><p><strong>EDA公司在AI设计系统上加倍投入</strong></p><p>不仅仅是谷歌转向机器学习模型。像Synopsys和Cadence这样的EDA公司也在其最新工具中使用到AI技术。比如最近,Synopsys凭借其 Synopsys DSO.ai 自主芯片设计系统注册了 100 个商业流片。该系统最近的客户包括 意法半导体(ST)和 SK Hynix。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRg" alt="image.png" title="image.png"></p><p>ST 和 Synopsys 于 2022 年 2 月初首次在微软的云端使用 DSO.ai 来设计工作芯片。使用 Synopsys 的 DSO.ai 设计系统,结合 Microsoft Azure 上的 Synopsys Fusion Compiler 和 IC Compiler,该工具将功耗、性能和面积 (PPA) 指标提高了 3 倍以上,总功耗降低了 25%,并且显著缩小了芯片尺寸。</p><p>除了芯片设计,人工智能还在芯片测试和验证中找到了应用——芯片制造商在这两个领域花费了大量时间。为了解决这一设计阶段的问题,西门子发布了Questa Verification IQ,这是一个帮助IC设计工程师加快验证过程的软件平台。</p><p><strong>英伟达用GPU设计GPU</strong></p><p>NVIDIA(英伟达)为芯片设计设计了另一种深度学习方法。该公司制作了一个名为PrefixRL的 RL 模型,证明 AI 可以从头开始学习电路设计,并使用最新的 EDA 工具制造更小、更快的电路。NVIDIA 的架构由 13,000 个使用 AI 技术设计的电路组成。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRh" alt="image.png" title="image.png"></p><p>针对自动化单元迁移,该公司开发了NVCell,可以无错迁移92%的单元库。人类工程师可以对剩下的 8% 没有自动迁移的单元进行处理。NVIDIA 首席科学家 Bill Dally 表示:</p><p><em>“所以这就像一个 Atari 视频游戏,但它是一个用于修复标准单元中的设计规则错误的视频游戏。通过强化学习来研究和修复这些设计规则错误,我们能够基本完成我们标准的设计单元。”</em></p><p><strong>人工智能对 IC 设计就业市场的影响</strong></p><p>虽然人工智能可以自动执行传统上由IC设计人员执行的某些任务,例如布局设计和优化,但它也减少了设计过程中对手动方面的需求。虽然这提高了整体效率,但也可能导致IC设计的某些领域的最终工作被取代。</p><p>另一方面,人工智能还可以帮助 IC 设计人员更高效、更有效地开展工作。例如,AI 可以分析大量数据并提供见解,建议工程师以前可能没有考虑过的设计替代方案。这种趋势可以提高 IC 设计人员在行业中的价值,使他们能够专注于更复杂和更具创造性的设计方面,并最终生产出更好的产品。</p><p>不过人工智能不太可能完全取代对熟练IC设计师的需求。随着人工智能在行业中越来越普遍,对这类工程师的需求甚至可能会增加,因为在设计过程中,将需要能够准确验证和利用人工智能工具和算法的个人。</p><hr><blockquote>作者:  Darshil Patel <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FN_pgzMV26mvgCMAxWMgieQ" target="blank">EETOP</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000386323">行业前瞻,神奇的忆阻器</a></li><li><a href="https://aijishu.com/a/1060000000386135">芯片验证调研报告:首次流片成功率越来越低、Verilog 使用逐渐减少、UVM地位无法动摇</a></li><li><a href="https://aijishu.com/a/1060000000385729">PCIe 6.0:在有损HVM通道中使用PAM4实现64GT/s的挑战</a></li><li><a href="https://aijishu.com/a/1060000000385482">Wi-R 一种全新的通信方式,让你的身体充当媒介!芯片已推出!</a></li><li><a href="https://aijishu.com/a/1060000000383891">科普:DDR</a></li></ul><blockquote>更多IC设计技术干货请关注IC设计技术专栏。<br>迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387068</guid>
            <link>https://aijishu.com//a/1060000000387068</link>
        </item>
        <item>
            <title><![CDATA[南芯科技公开带预唤醒功能的Type-C接口插入检测电路方案]]></title>
            <description><![CDATA[<p>【爱集微点评】南芯科技公开的带预唤醒功能的Type-C接口插入检测电路方案,该方案通过增加Type‑C接口预唤醒电路,在接口电路休眠时,可以将Type‑C接口检测电路关闭。从而实现减低系统待机功耗的同时实现接口插入检测功能,通过简单的电路结构解决了Type‑C接口插入检测和低功耗之间的矛盾。</p><p>集微网消息,在集成电路应用当中,特别是手机或者充电设备的Type‑C接口电路应用中,通常为了降低系统待机功耗,在未检测到手机或者充电设备插入时,整个系统会进入休眠模式。</p><p>但是为了快速响应手机或者充电设备的插入,在休眠时Type‑C接口检测电路需要一直工作,这就大大增加了系统休眠时的待机电流,从而大大缩短电池的续航时间。</p><p>为此,南芯科技在2022年3月11日申请了一项名为“一种带预唤醒功能的Type-C接口插入检测电路”的发明专利(申请号:202210236444.X),申请人为上海南芯半导体科技股份有限公司。</p><p>根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/522483438041.0886.png" alt="image" title="image"></p><p>如上图,为该专利中公开的充电设备端和手机端上设置的Type‑C接口检测电路通过Type‑C数据线连接的结构示意图。可以看到,在手机或者充电设备(如适配器、充电宝等)的Type‑C接口电路应用中,为了快速响应手机或者充电设备的插入,在休眠时Type‑C接口检测电路需要一直工作。这就大大增加了系统休眠时的待机电流,从而大大缩短了手机或者充电设备的电池的续航时间。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1435664442736.5054.png" alt="image" title="image"></p><p>如上图,为现有方案中Type‑C接口检测电路的电路连接示意图。在充电设备端,P型开关管M2的源端连接电源VDD,栅端连接控制信号EN_Rp,漏端连接上拉电流源Irp的源端。Irp的输出端连接到引脚CC,引脚CC同时连接到检测比较器P的反向端,比较器P的正向端连接参考电压VREF,比较器P输出信号为CC_DET_P。</p><p>在手机端,N型开关管M1的源端连接GND(即接地),栅端连接控制信号EN_Rd,漏端连接下拉电阻Rd的一端,下拉电阻Rd另一端连接到引脚CC。引脚CC同时连接到检测比较器D的同向端,比较器D的反向端连接参考电压VREF,比较器D的输出电压为CC_DET_D。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/168830725881.94025.png" alt="image" title="image"><br>在该专利中,主要通过在Type‑C接口检测电路的基础上增加预唤醒电路,在休眠时关闭Type‑C接口检测电路,来降低系统待机功耗。在设备插入时,通过触发预唤醒电路,再将Type‑C接口检测电路使能,实现快速响应设备的插入。</p><p>如上图所示,该检测电路包括:Type‑C接口检测电路以及Type‑C接口预唤醒电路。该充电设备端接口检测电路包括P型开关管M2、上拉电流源Irp和比较器P。手机端接口检测电路包括N型开关管M1、下拉电阻Rd和比较器D。</p><p>充电设备端接口预唤醒电路包括P型开关管M3、上拉电阻Rp_Pre、P型开关管M4、电阻R1、电阻R2以及反相器PI1。手机端接口预唤醒电路复用手机端接口检测电路的N型开关管M1和下拉电阻Rd。此外,手机端接口预唤醒电路还包括N型开关管M5、电阻R3、电阻R4和反相器PI2。</p><p>该装置的工作原理如下:在充电设备端,通过开关管M3和上拉电阻Rp_Pre实现上拉功能,开关管M4、电阻R1以及R2实现Rd插入预唤醒功能。在充电设备接口休眠时,开关管M3栅极控制电压为0,开关管M2栅极控制电压为1,关闭Irp上拉电流源,同时比较器P处于关闭状态。在手机端,下拉电阻部分将复用接口检测电路部分,开关管M5、电阻R3以及R4实现上拉插入预唤醒功能。在手机端接口休眠时,开关管M1栅极控制电压为1,打开M1,通过电阻Rd实现下拉,同时比较器D处于关闭状态。</p><p>引脚CC没有插入上拉时,CC引脚被Rd和M1下拉至GND,CC引脚通过ESD保护电阻R4接到开关管M5栅极,M5处于关断状态,输出被电阻R3上拉至VDD。然后经过反相器,输出为低,整个Type‑C接口电路没有工作电流,系统功耗很低。</p><p>当引脚CC插入上拉时,CC引脚电压即为开关管M5栅极电压,M5被打开,将信号拉低,输出CC_DET_D_PRE即为高电平。从而实现上拉插入预唤醒,然后打开比较器D,Type‑C接口检测电路将开始工作。</p><p>以上就是南芯科技公开的带预唤醒功能的Type-C接口插入检测电路方案,该方案通过增加Type‑C接口预唤醒电路,在接口电路休眠时,可以将Type‑C接口检测电路关闭。从而实现减低系统待机功耗的同时实现接口插入检测功能,通过简单的电路结构解决了Type‑C接口插入检测和低功耗之间的矛盾。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387106</guid>
            <link>https://aijishu.com//a/1060000000387106</link>
        </item>
        <item>
            <title><![CDATA[兆芯如何保证处理器模拟/真实请求传输路径一致?]]></title>
            <description><![CDATA[<p>【爱集微点评】兆芯的处理器建模专利,采用两套信息来记录一个请求路径的关键信息,解决多个请求在汇聚点装置中路径不明确的问题。同时依据第二路径信息可以纠正第一路径信息在汇聚点装置导致的路径错误,使模拟请求传输路径的建模跟真实硬件传输路径更为一致。</p><p>集微网消息,近日,兆芯独家入选《上海金融科技发展白皮书》基础设施支持类科技企业,同时兆芯的新一代嵌入式处理器也一并入选白皮书。</p><p>在处理器建模领域中,当处理器传输数据的整个路径上只有一个源端发送请求时,功能加时序模型可以很好地模拟真实处理器的性能。但是,如果整个路径上有多个源端可以发送请求,由于功能模型是在请求生成的时候就进行调用,而多个源端到达请求汇聚点的路径延时是不确定的,汇聚点是指多个请求都会通过的路径节点或装置,这样会导致多个源端的请求在汇聚点看到的时序状态跟在请求生成时的差距较大。当大量的请求的处理路径跟功能模型不一致的情况下,最终建模呈现的性能指标就不能反映真实处理器的性能。因此,如何真实的模拟出处理器的性能,已成为本领域需解决的问题之一。</p><p>为此,兆芯于2020年9月29日申请了一项名为“处理器建模系统及处理器建模方法”的发明专利(申请号:202011054563.0),申请人为上海兆芯集成电路有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1141850468081.4688.png" alt="image" title="image"></p><p>图1 处理器建模系统的示意图</p><p>图1为本专利提出的一种处理器建模系统的示意图,处理器建模系统100包含多个源端装置A1~Am及一汇聚点装置PL。其中,源端装置A1~Am是向处理器发出请求的装置,例如输入输出装置、储存装置、图形处理器、预取装置等。</p><p>源端装置A1和An+1分别产生第一/二请求,并于第一/二传送时点传送两个请求。而汇聚点装置PL分别在第一接收时点和第二接收时点接收两个请求,并依据第一请求/第二请求选择传送路径(例如PT1)。其中,第一传送时点早于第二传送时点,第一接收时点接收晚于第二接收时点,且第一请求与第二请求欲存取的目标数据地址相同。如此一来,在多源端的处理器的仿真建模过程会发生多请求在到达汇聚点装置时出现路径不明的情况,最终导致建模结果呈现的性能指标与真实处理器不一致。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/538297132002.6487.png" alt="image" title="image"></p><p>图2 处理器建模方法的流程图</p><p>图2是本专利提出的一种处理器建模方法流程图,首先源端装置A1产生第一请求,第一请求为主路径请求。对于每一个请求,用第一路径信息来表示传统的功能模型的关键信息,用第二路径信息来表示真实时序的关键信息(可以真实反映时序的关键信息)(步骤210)。然后第一请求分别调用功能模型和时许模型,得到第一、二路径信息(步骤220、230)。然后第一请求被传送到汇聚点装置PL(步骤240),而汇聚点装置PL判断是否存在第二请求(步骤250)。汇聚点装置PL依据第二请求的第二路径信息选择传送路径PT1。因为目标数据地址中的信息已经先被先到汇聚点装置PL的第二请求取走了,所以依据第二请求的第二路径信息选择传送路径PT1(步骤260)。最后,汇聚点装置PL更新第二请求状态为合法的(步骤270)。</p><p>简而言之,兆芯的处理器建模专利,采用两套信息来记录一个请求路径的关键信息,解决多个请求在汇聚点装置中路径不明确的问题。同时依据第二路径信息可以纠正第一路径信息在汇聚点装置导致的路径错误,使模拟请求传输路径的建模跟真实硬件传输路径更为一致。</p><p>兆芯成立于2013年,掌握中央处理器、图形处理器、芯片组等三大核心技术。自从成立以来,兆芯已经成功研发、量产了多款通用处理产品,在业内得到了高度评价,并多次入围Silicon 100榜单、荣获各种“创新奖”、“成就奖”、“金奖”。希望在2023年成立十年之际,兆芯可以再创辉煌、更上一层楼!</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387102</guid>
            <link>https://aijishu.com//a/1060000000387102</link>
        </item>
        <item>
            <title><![CDATA[灵动微课堂 |FlexCAN OTA]]></title>
            <description><![CDATA[<h1><strong>1 简介</strong></h1><p>FlexCAN OTA 是由灵动提供的一种基于 UDS 协议使用 CAN 总线实现对 MCU 的 App 固件更新的解决方案。该解决方案的软件部分主要由:Bootloader、App和PC Tool三部分构成,硬件部分如图 1 所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRw" alt="image.png" title="image.png"></p><p><strong>1.1&nbsp; 关键特性&nbsp;&nbsp;</strong></p><p>基于 UDS(ISO14229) 标准</p><p>基于 CAN(ISO11891-1) 标准</p><p>具备对 App 固件 CRC 完整性校验功能</p><p>使用主机上传 Flash driver 到 MCU</p><p>在 Bootloader 中进行 App 有效性检查</p><p>提供用于验证 App 固件更新的 PC 端上位机工具</p><p><strong>1.2 &nbsp;什么是 FlexCAN ?&nbsp;</strong></p><p>CAN 是控制器域网 (Controller Area Network, CAN) 的简称,是一种功能丰富的车用总线标准,被设计用于在不需要主机(Host)的情况下,允许网络上的单芯片和仪器相互通信。是由研发和生产汽车电子产品著称的德国 BOSCH 公司开发,并最终成为国际标准(ISO11898),是国际上应用最广泛的现场总线之一。</p><p>FlexCAN 是 CAN 协议的一个高完成度版本。以灵动 MM32F0140 系列 MCU 内嵌的 FlexCAN 为例,其符合 ISO 11898-1 标准,支持 CAN 2.0B 版本协议,位速率高达 1 Mbps,具有非常灵活的用于传输和接收的邮箱系统,可以接收和发送 11 位标识符的标准帧,也可以接收和发送 29 位标识符的扩展帧,主要被设计用作车载串行总线,可满足实时处理、车辆在电磁干扰环境下的可靠操作、成本效益、带宽等要求。</p><p><strong>1.3 &nbsp;什么是 UDS ?&nbsp;</strong></p><p>UDS(Unified Diagnostic Services,统一诊断服务)是一种用于汽车电子控制器 ECU (Electronic Control Units) 环境下的一种诊断通信协议,可实现诊断、固件更新、日常测试等功能,在 ISO 14229 中规定了其实现标准。</p><p>在本实例中,UDS 通信是在客户端-服务端关系中执行的。客户端是上位机下载软件运行于 PC 机,服务端是带有FlexCAN IP模块的 MM32 MCU。例如,将 CAN 总线接口连接到 MCU,并将 UDS 请求发送到 MCU。当 MCU 支持 UDS 服务时,它将根据客户端发出的请求做出相应的响应。</p><p><strong>1.4 &nbsp;为什么用 Bootloader ?&nbsp;</strong></p><p>对于 MCU 而言,如果程序内置有基于FlexCAN 的 Bootloader,则每次更新 MCU 的固件则不需要拆开外壳也不必再使用烧录器进行烧录,而可直接通过 CAN 总线来更新程序,这样更方便也更安全,而且随着智能化的普及,甚至可以对 MCU 进行远程升级。Bootloader 程序结构对比如图 2 所示:</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRx" alt="image.png" title="image.png"></p><p><strong>1.5 &nbsp;为什么基于 UDS ?&nbsp;</strong></p><p>为了规范 Bootloader 的全过程,通过使用成熟的平台进而提供高质量 Bootloader。因 UDS 在设计时考虑了 Bootloader 的需求,并为 Bootloader 提供了相关服务以供使用,比如诊断会话控制、ECU 重置、读取数据、请求下载、传输数据、请求传输退出等,可以实现更高效和可靠的刷写功能。故主机厂普遍会要求在 UDS 规范的基础上完成 Bootloader 功能。</p><p><strong>1.6 &nbsp;用到了哪些 UDS 服务?&nbsp;</strong></p><p>在 Bootloader 中,使用到 UDS 的 $10、$11、$27 和 $3E 基础诊断服务,$22、$2E 读写 DID 服务,$31、$34、$36 和 $37 固件数据传输相关服务。UDS 服务概览如表 1-1 所示:</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRy" alt="image.png" title="image.png"></p><h1><strong>2 Bootloader</strong></h1><p>Bootloader 是一段允许在不使用烧录器的情况下更新App固件的代码,基于灵动 MindSDK 实现的 Bootloader 样例工程支持 MDK、IAR 和 ARMGCC 三种工具链进行开发。在实际的使用过程中只需要在第一次使用时通过烧录器将 Bootloader 烧录进 MCU,后续的 App 都可以通过使用基于 CAN 总线的 UDS协议完成固件更新。</p><p><strong>2.1&nbsp; Bootloader 功能特性&nbsp;&nbsp;</strong></p><p>支持 Service 27,用户可根据自身需求添加安全访问算法。</p><p>支持 Service 22 和 Service 2E,用户可以根据自身需求添加策略,进行信息读出与存储。</p><p>外置 Flash driver,使用时通过外部 PC 或后台将 Flash driver 加载到 MCU 的 RAM 中进行安全的 Flash 擦写操作。</p><p>提供看门狗监控功能,用户可根据自身需求选择性开启看门狗监控程序。</p><p><strong>2.2&nbsp; 客制化修改说明&nbsp;&nbsp;</strong></p><p><strong>修改诊断 ID</strong></p><p>可在样例工程的 board/FblHalCan.h 中修改诊断 ID 的值。</p><p><strong>指定数据填充值</strong></p><p>当需要发送的数据长度不满足 8 字节长度时,通过宏定义可以更改填充,用户可以在样例工程的 board/FblHalCan.h 中指定填充值。</p><p><strong>使能看门狗</strong></p><p>用户可以在样例工程的 board/FblMacros.h 中打开宏开关 WDG\_ENABLE 使能看门狗服务,并且实现 ResetWdg 操作。</p><p><strong>安全访问算法接口</strong></p><p>Bootloader中支持 27 Service,用户可在样例工程的 board/FblMacros.h 中使能宏开关 ENABLE_SECURITY_ALGORITHM_VERIFICATION 根据自身需求添加安全访问算法。</p><p><strong>2.3&nbsp; Flash driver 介绍&nbsp;&nbsp;</strong></p><p><strong>什么是Flash driver?</strong></p><p>在OTA程序升级过程中,发送App可执行文件之前,向底层先发送一段二进制文件,这段代码实现了对MCU片内 Flash 的擦写功能,称为 Flash driver。</p><p><strong>Flash driver存在的意义</strong></p><p>在车载ECU控制器中,为了安全考虑,会尽可能的避免在代码中固化有对flash进行擦写操作,主要为了避免在程序跑飞时误调用该部分代码,使软件代码部分受到破坏。</p><p><strong>Flash driver的实现方式</strong></p><p><strong>a.</strong> 将flash driver固化在底层flash中,在运行的时候将flash中的flash driver拷贝到ram中来运行,这是比较传统的方式,但是避免不了提到的安全性问题。</p><p><strong>b.</strong> 将flash driver这段代码保存在PC端或后台,在每次执行OTA升级前,将这段代码先发送给MCU,这样可以避免方式 a 中提到的安全性问题。</p><h1><strong>3 App</strong></h1><p>基于灵动 MindSDK 提供的 flexcan\_ota\_app 样例工程进行开发和生成用于更新的 HEX 格式 App 固件生成,无需任何适配操作即可生成用于 OTA 升级的 App 固件。</p><p><strong>3.1&nbsp; 使用说明&nbsp;&nbsp;</strong></p><p>将 Bootloader 通过下载器下载到 MCU 中后,可通过提供的 PC Tool 来刷写生成的固件,通过 PC Tool 下载成功后,一方面 PC 终端会有下载成功提示,另一方面也可以查看开发板上对应固件实现的功能是否开始执行。</p><p>关于 App 固件可从提供的 flexcan\_ota\_app 样例工程编译源码并将生成“.hex”格式的 App 固件进行加载。</p><p><strong>3.2&nbsp; App 设计规范&nbsp;&nbsp;</strong></p><p>App 与 Bootloader 存放在 MCU 的同一块 Flash 的两个不同区域中,为保证两个软件的正常使用,App 设计遵循表 2-1 和表 2-2 所述规范。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRz" alt="image.png" title="image.png"></p><h1><strong>4 PC Tool</strong></h1><p>Flexcan OTA PC Tool 是用于验证灵动 MindSDK 中提供的 FlexCAN OTA 解决方案的简易 PC 端上位机工具。</p><p><strong>4.1&nbsp; 功能特性&nbsp;&nbsp;</strong></p><p>支持 CAN 通信速率自定义</p><p>支持 Win10 操作系统下运行</p><p>支持默认参数直接运行和命令行下带参数运行</p><p>支持直接加载 MDK 和 IAR 工具链下生成的 HEX 格式文件</p><p>基于 Python 使用 python-udsoncan 开发,可根据不同需求灵活进行二次开发</p><p><strong>4.2&nbsp; 开发环境&nbsp;&nbsp;</strong></p><p>本工具在 Win10 平台使用 Python 进行开发,基于 UDS 使用 CAN 协议,支持 PEAK CAN卡与 MCU 进行通讯。</p><p><strong>4.3&nbsp; 使用说明&nbsp;&nbsp;</strong></p><p>请按照如下步骤进行操作:</p><p><strong>a 下载 Bootloader 到 MCU</strong></p><p>将提供的 flexcan_ota_bootloader 样例工程编译并下载到开发板中。</p><p><strong>b 安装 CAN 卡驱动并连接 MCU</strong></p><p>在这里我们用到的是PCAN-USB,下载并安装驱动(<a href="https://aijishu.com/link?target=https%3A%2F%2Fpeak-system.com.cn%2Fdriver%2F" target="blank">https://peak-system.com.cn/dr...</a>) ,并将 PCAN-USB 和开发板上的 CAN 收发器通过双绞线连接以及通过 USB 和 PC 机连接。</p><p><strong>c 运行 FlexCAN OTA PC Tool</strong></p><p>方式一:按照默认参数直接运行</p><p>直接双击 flexcan_ota_pc_tool_v1.0.exe,如图 3 所示,默认将按照 500Kbps 的比特率进行 CAN 通信,Flash_driver 文件的加载地址为当前路径下的文件(./flash_driver.hex), App 文件的加载路径为当前路径下文件(./app.hex)。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRA" alt="image.png" title="image.png"></p><p>方式二:按照指定参数运行</p><p>在 Win10 平台下启动命令行窗口并切换到当前路径下,获取帮助如图4所示,输入如下指令并按回车键:</p><pre><code>flexcan_ota_pc_tool_v1.0.exe&nbsp;-h&nbsp;</code></pre><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRB" alt="image.png" title="image.png"><br>按照指定参数运行如图 5 所示,输入如下指令并按回车键:</p><pre><code>flexcan_ota_pc_tool_v1.0.exe&nbsp;-b&nbsp;500000&nbsp;-f&nbsp;"./flash_driver.hex"&nbsp;-a&nbsp;"./app.hex"</code></pre><p>其中 flash_driver.hex 文件为用于安全地擦写片内 flash 的代码,在每次 OTA 更新中复用即可。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRC" alt="image.png" title="image.png"></p><p><strong>d 结束</strong></p><p>等待 FlexCAN OTA 固件更新流程结束,并按任意按键退出。</p><h1><strong>5 注意事项</strong></h1><p>FlexCAN OTA Tool 为用于验证基于 UDS 使用 CAN 协议进行 App 固件更新的上位机工具,PC 端使用 PEAK-CAN 与 MCU 通讯,仅支持在 Win 10 操作系统下运行,&nbsp;&nbsp; 且用于功能性验证,若遇到软件闪退等问题请重启该软件并复位 MCU。该工具可根据开发者项目需求进行二次开发。</p><p>以上介绍是基于MM32F0140 系列 MCU 进行介绍和示例演示,相关源码请访问灵动官网进行获取:</p><p><strong>01</strong></p><p>进入灵动官网(www.mm32mcu.com)</p><p><strong>02</strong></p><p>打开“产品”菜单下 MM32F0140 页面,浏览“文档”列表。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRD" alt="image.png" title="image.png"></p><p><strong>03</strong></p><p>在“应用笔记”中下载“AN0035_FlexCAN_OTA”文档,获取源码。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRE" alt="image.png" title="image.png"></p><p><strong>6 参考文献</strong></p><p>《ISO11898-1》</p><p>《ISO14229》</p><blockquote>作者:灵动MM32  <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2F87OMwn8rlluytkhuKJ-xXQ" target="blank">灵动MM32MCU</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000385095">灵动微课堂 |单独下载可执行文件到MM32F5微控制器</a></li><li><a href="https://aijishu.com/a/1060000000379844">基于灵动MM32 MCU的便携式血氧仪应用</a></li><li><a href="https://aijishu.com/a/1060000000378709">灵动微课堂 |使用MM32F3270基于Azure RTOS定时器组的应用</a></li><li><a href="https://aijishu.com/a/1060000000376861">灵动微课堂 | MM32L013x——LPTIM的应用介绍</a></li></ul><blockquote>更多MM32F5系列资料请关注<a href="https://aijishu.com/blog/lingdongmm32mcu">灵动MM32 MCU</a>专栏。如想进行MM32相关芯片技术交流,请添加极术小姐姐微信(id:aijishu20)加入微信群。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387086</guid>
            <link>https://aijishu.com//a/1060000000387086</link>
        </item>
        <item>
            <title><![CDATA[河南农信社数字化转型实践方案]]></title>
            <description><![CDATA[<p>农信机构立足地方“三农”,普遍规模较小,高地域集中度在县域和农村地区,容易受到地方农村经济脆弱性的影响。</p><p>农信机构由于信贷项目要求多,单笔贷款业务批复的额度相对较小,在信用档案登记环节,造成业务量和工作量相对较多。同时,信用信息采集不够精确,不能全面且合理地评定农民信用等级,最终结果就是贷款主题的信用评级被高估,部分贷款主题获得超出实际所需额度的贷款,不能予以偿还,提高了农信系统的不良率。</p><p><strong>农信社信贷普遍面临担保条件难以落实、营销运营成本高、人员操作道德风险大、客户授信主观化、办理速度慢等问题。</strong></p><p>数字化转型是一场科技革命,能够精准解决农村普惠金融推进过程中的痛点。农信社以数字综合治理为契机,加强数据全周期管理,建立数据治理长效机制,提升农信社核心竞争力,为数字化转型奠定基础。多举措提升创新研发和数字应用能力。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMrZ" alt="2.png" title="2.png"></p><h2>河南农信的数字化实践</h2><p>农信系统改革,是2023年银行业的“重头戏”。11月23日,《河南日报》报道了河南省农信社改革进展。据报道,河南省农信社改革方案已获得银保监会批复,将通过组建河南农商联合银行,自上而下理顺股权结构,完善公司治理,推进系统重塑,提升全省农信社体系健康度,充分发挥其地方金融“压舱石”的作用。基于对自身的调研、思考和探索,河南农信给出了数字化转型的应对之策。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRS" alt="图片1.png" title="图片1.png"></p><p><strong>建立高效的数字化架构。</strong>通过构建数字化的IT支撑平台,形成数据开发、共享、使用和管理流程机制,完成向现代银行、智慧银行的数字化转型,将存贷汇、融资理财、在线信贷、金融咨询等标准化产品嵌入各种场景,把金融服务融入客户工作和生活,从而吸引客户、留住客户,增强客户的黏性和忠诚度。</p><p><strong>建设数字化授信体系。</strong>全面推进农户、个体商户、社区居民的信息采集、加工、评价和维护、加快客户信息系统建设和大数据技术应用,对小微经营户、农户信用风险进行数量化精确计量,通过采集高度简化的现场客观信息和互联网大数据信息,实现低成本、高效率、客观准确的授信决策。</p><p><strong>增强业务风险管理水平。</strong>运用大数据、人工智能、建模等技术,引入顶象无感验证,发挥智能风控的决策支持作用,构建和不断优化风控分析模型,建立营销、评级、授信、用信、审批、预警、清收等端到端的反馈机制,强化贷前、贷中、贷后全流程风险管理,从根本上提升风险防控效率和水平。</p><p><strong>优化线上营销服务。</strong>开展范围广泛、影响力大的线上营销活动,统筹安排和有效支持精准营销活动,开展线上营销培训,提高全员线上营销服务意识和能力;要通过数据整合、数据分析和数据运算,形成数据洞察能力,对客户进行精准画像,采取交叉销售,定向推荐等差异化营销策略,实现精准营销、智能营销。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRU" alt="640.jfif" title="640.jfif"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMrZ" alt="2.png" title="2.png"></p><h2>验证码助力数字化转型</h2><p>验证码是智能风控的重要组成部分,作为人机交互界面经常出现的关键要素,是身份核验、防范风险的重要组成,也是用户交互体验的第一关口,广泛应用金融服务上。</p><p>2020年2月,中国人民银行发布新版《网上银行系统信息安全通用规范》提出,从系统构成、客户端运行环境、短信/图形验证码、生物特征、通信链路等环节要求。特别提到,金融机构应通过行为分析、机器学习等技术不断优化风险评估模型,结合生物探针、客户行为分析等手段,切实提升安全防护能力。</p><p>2020年7月,中国银保监发布《商业银行互联网贷款管理暂行办法》,要求商业银行应当对互联网贷款业务建立全面等下管理体系,在贷前、贷中、贷后全流程进行风险控制。</p><p>顶象无感验证以防御云为核心,集13种验证方式,多种防控策略,以智能验证码服务、验证决策引擎服务、设备指纹服务、人机模型服务为一体的云端交互安全验证系统。其汇集了4380条风险策略、112类风险情报、覆盖24个行业、118种风险类型,防控精准度&gt;99.9%,1天内便可实现从风险到情报的转化,行业风险感知能力实力加强,同时支持安全用户无感通过,实时对抗处置能力更是缩减至60s内。</p><p>截至目前,顶象无感验证已为100多家金融机构提供专业服务。</p><hr><p>业务安全大讲堂:<a href="https://aijishu.com/link?target=https%3A%2F%2Fjinshuju.net%2Ff%2FtYyi3u" target="blank">立即报名</a></p><p>业务安全产品:<a href="https://aijishu.com/link?target=https%3A%2F%2Fuser.dingxiang-inc.com%2Fuser%2Fregister%23%2F" target="blank">免费试用</a></p><p>业务安全交流群:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.dingxiang-inc.com%2Fblog%2Fpost%2F599" target="blank">加入畅聊</a></p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387115</guid>
            <link>https://aijishu.com//a/1060000000387115</link>
        </item>
        <item>
            <title><![CDATA[优秀的IC/FPGA开源项目(六)-手语字母翻译器]]></title>
            <description><![CDATA[<p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQU" alt="image.png" title="image.png"></p><p>《优秀的IC/FPGA开源项目》是新开的系列,旨在介绍单一项目,会比《优秀的 Verilog/FPGA开源项目》内容介绍更加详细,包括但不限于综合、上板测试等。两者相辅相成,互补互充~</p><hr><p>一种智能手套,可将手语字母翻译成带显示器的书面字母。</p><h1>绪论</h1><p>在这个项目中,我们的主要目的是开发一款智能手套,帮助使用手语的人在日常生活中轻松交流。</p><p>学习手语是一个要求很高的过程。因此,许多健康人并不了解这个过程。在这款智能手套的帮助下,那些健康的人将能够理解那些使用手语的人。智能手套还可以用作想要学习手语的健康人的模拟器。</p><p>这个项目主要涉及到模拟字母,字母是语言的基石。在这个项目中,我们使用 FPGA 来实现将手势模拟为视觉字母的算法。检测手势是通过手指上的柔性传感器测量出手的形状。vga监视器用于直观显示FPGA中转换为字母的手势。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQW" alt="image.png" title="image.png"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQX" alt="image.png" title="image.png"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQY" alt="image.png" title="image.png"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQZ" alt="image.png" title="image.png"></p><p>上三图说明了 VGA 控制器产生的时序信号。控制器包含两个计数器。一个计数器在像素时钟上递增并控制 h\_sync(水平同步)信号的时序。通过将其设置为显示时间从计数器值 0 开始,计数器值在显示时间内等于像素的列坐标。水平显示时间之后是消隐时间,消隐时间包括水平前沿、水平同步脉冲本身和水平后沿,每个都有指定的持续时间。在行的末尾,计数器重置以开始下一行。v\_sync 计数器在垂直轴内应用相同的操作。</p><p>使用这些计数器,VGA 控制器输出水平同步、垂直同步、显示启用和像素坐标信号。每个 VGA 模式的同步脉冲被指定为正极性或负极性。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ0" alt="image.png" title="image.png"></p><p>我们首先创建随机图像并使用 RGB 信号改变它们的颜色,如上图所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ1" alt="image.png" title="image.png"></p><p>要在屏幕上显示文本或字符串,有一个众所周知的 Font Rom Map -上图 - 包括所有 ASCII 字符(每个字符为 8x16 位)。通过使用 Font Rom,我们的代码现在能够在显示器上书写文本或字母,如下图所示 。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ2" alt="image.png" title="image.png"></p><p>为了转换来自柔性传感器的模拟数据,我们使用了ADC-每通道具有 12 位分辨率。由于 4 个手指足以执行大多数手语字母,因此一个 4 通道ADC就足够了。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ3" alt="image.png" title="image.png"></p><p>ADC的通信的逻辑如下图所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ4" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ5" alt="image.png" title="image.png"></p><p>作为总结,项目的架构如下图所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ6" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ7" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ8" alt="image.png" title="image.png"></p><p>作为参考手语,我们使用了ASL,它具有下图中的手势。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ9" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRa" alt="image.png" title="image.png"></p><p>现在执行工程就可以识别到上图中标记的字母。</p><p>工程链接:</p><blockquote><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fumuttoksoy%2F10ISTK---Sign-Language-Translator" target="blank">https://github.com/umuttoksoy/10ISTK---Sign-Language-Translator</a></blockquote><blockquote>原文:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FcvBboi8DlRSWQzCUUpyTsw" target="blank">OpenFPGA</a>  <br>作者:碎碎思</blockquote><p><strong>相关文章推荐</strong></p><ul><li><a href="https://aijishu.com/a/1060000000384570"><strong>从FPGA说起的深度学习(三)</strong></a></li><li><a href="https://aijishu.com/a/1060000000383485"><strong>从FPGA说起的深度学习(二)</strong></a></li><li><a href="https://aijishu.com/a/1060000000383015"><strong>使用 AXI CDMA 制作 FPGA AI 加速器通道</strong></a></li><li><a href="https://aijishu.com/a/1060000000381372"><strong>从FPGA说起的深度学习(一)</strong></a></li></ul><blockquote>更多FPGA干货请关注<a href="https://aijishu.com/blog/fpgadeluoji"><strong>FPGA的逻辑</strong></a>技术专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387048</guid>
            <link>https://aijishu.com//a/1060000000387048</link>
        </item>
        <item>
            <title><![CDATA[「微侃」特斯拉对智能汽车设计的考虑]]></title>
            <description><![CDATA[<p>聚焦汽车科技,剖析产业趋势和变革浪潮  <br>————————  </p><p>早在2016年,马斯克就在《特斯拉宏图计划第二篇章》提到要发展自动驾驶,但特斯拉与当时最热的自动驾驶技术路线有所不同——Google的Waymo为代表的众多自动驾驶企业,以L4级别和量产自动驾驶出租车Robetaxi为目标。  </p><p>特斯拉走的垂直整合路线:不仅自己开发自动驾驶相关的软件和硬件,还自己造车:开创了将自动驾驶与汽车量产结合的技术路线——简单来说,就是在量产车上安装低级别自动驾驶系统收集数据,凭借数据不断完善自动驾驶算法,最终实现由较低级别的自动驾驶向高级别自动驾驶间融合过渡。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQz" alt=" title=" 微信图片_20230227121317.png""="" title=" title=">  </p><p>目前来看,后者的自动驾驶技术方案是比较成功的。他的路线甚至从车成功复制到机器人。  </p><p>那么特斯拉是怎么考虑智能汽车的设计的呢?  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbtWN" alt=" title=" 微信图片_20230227121320.png""="" title=" title=">  </p><p>Part 1  </p><p>特斯拉的整车设计  </p><p>特斯拉与传统主机厂把设计开发交给供应商的方式不同,而是反过来,不断从供应商手中拿回主导开发权。我们看到,在整个EE架构里面,特斯拉不断在把大量的部件做成In-house Design然后再由非传统的一级供应商来代工的模式进行,不断把系统内化。  </p><p>●芯片层面的全面考虑  </p><p>特斯拉会和芯片企业直接交流设计开发,这样一方面在过去几年缺芯的状态下,可以优先获取支持。另一方面,这样的直接接触,可以把自己的设计思路传递到芯片企业,同时获取最新的设计方案。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQA" alt=" title=" 微信图片_20230227121326.png""="" title=" title=">  </p><p>◎最重要的计算类SOC芯片:座舱层面依靠Intel和AMD计算芯片、特斯拉自研FSD的芯片  </p><p>◎通信芯片:从以太网的Marvell扩展到下一代  </p><p>◎存储芯片:SK海力士和Sumsung  </p><p>◎功率芯片:由SiC的英飞凌和ST供应,低压小功率的主要包括安森美  </p><p>◎MCU:全方面的拥抱TI和ST  </p><p>◎其他芯片:也是和ADI、Microchip等战略芯片供应商合作  </p><p>●电子电气架构的设计  <br>特斯拉在设计电子电气架构时,不仅从Model 3 开始就采用了集中式的架构,还很早就导入了Zonal控制器的概念,这样的架构可以尽可能的简化线束,提高整车安装效率。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQB" alt=" title=" 微信图片_20230227121334.png""="" title=" title=">  </p><p>特斯拉设计了三个区域控制器,分布在车身的左、右和前部中间,这三个控制器大量合并了原有分布式系统的功能,比如:车身控制、热管理、驻车还有座椅控制等。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQC" alt=" title=" 微信图片_20230227121342.png""="" title=" title=">  </p><p>如果按其他车企的设计,至少会分为七八个模块(门模块、集成式车身控制器、座椅控制器、热管理控制器HVAC和前端冷却控制器Theraml Unit和泊车控制器、灯光控制)。  </p><p>但特斯拉通过这三个区域控制器既能实现基本功能,又可以做一些顶层的应用,实现系统的整体控制。整个控制逻辑复杂的部分都在上层,底层的可以实现冗余和执行功能。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQD" alt=" title=" 微信图片_20230227121349.png""="" title=" title=">  </p><p>比如热管理的控制中,复杂的热泵模式功能是在顶层的软件系统里面来定义的,再由区域控制器负责执行。这个创新性的设计,就让特斯拉把握了整体软件和系统方面的设计,供应商只负责做结构设计集成,特斯拉在热管理功能上实现了自主开发控制。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbuK9" alt=" title=" 微信图片_20230227121353.png""="" title=" title=">  </p><p>Part 2  </p><p>特斯拉的自动驾驶设计  </p><p>●自动驾驶软件部分  <br>2019 年前后,自动驾驶技术堆栈出现了颠覆性变化,特斯拉引领了这次变革。这次变革是从规则驱动,转向为数据驱动。这几乎改变了整个技术堆栈,甚至是工程师的思考方式。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQE" alt=" title=" 微信图片_20230227121400.png""="" title=" title=">  </p><p>所谓规则驱动,简单来说,以前的自动驾驶,是依靠提前设计好一定的规则;数据驱动,则是围绕AI的算法模型,通过感知AI、规控AI,以及数据改进自动驾驶的效果,跟现在很火热的ChatGPT类似。  </p><p>●自动驾驶硬件部分  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQF" alt=" title=" 微信图片_20230227121407.png""="" title=" title=">  </p><p>特斯拉的驾驶辅助硬件经过了HW1.0到3.0的迭代:  </p><p>◎ 1.0的版本硬件选型为成熟商品。特斯拉做了多传感器融合+应用层软件开发。  <br>◎ 2.0的版本,采用了英伟达的芯片,提升传感器数量提升,特斯拉在原有的技术基础上,增加了图像识别算法的开发。  <br>◎ 3.0 是特斯拉的驾驶辅助硬件的重大革新,首次采用自研的高度集成自动驾驶SoC+MCU芯片。此时的特斯拉已经具备:全套芯片设计能力。  <br>◎ 正在开发的基于自研的自动驾驶芯片的第二代控制器,也就是4.0版本,马上要发布,我们会持续地跟踪。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQG" alt=" title=" 微信图片_20230227121415.png""="" title=" title=">  </p><p>我们看到特斯拉在Model S、Model X、Model 3到Model Y上,一步步深化了自己的设计范围,而全球车企包括大量的中国汽车企业也开始了这个过程。  </p><p>总结  <br>虽说特斯拉的自动驾驶技术路线很成功,但并不是没有问题。首先就表现在有各种召回。这是因为自主设计的开发难度的确很大,随着车主增多,会遇到很多激进的工况。但换个角度来看,特斯拉就是通过量产车上收集到的数据不断完善自己的产品,最终要实现不仅是智能汽车,还有马斯克本人的Master plan。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 05:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387037</guid>
            <link>https://aijishu.com//a/1060000000387037</link>
        </item>
        <item>
            <title><![CDATA[「微侃」插电混动的技术路线分析(下篇)]]></title>
            <description><![CDATA[<p>聚焦汽车科技,剖析产业趋势和变革浪潮  <br>————————  </p><p>前段时间在梳理完中国汽车自主品牌产业格局以后,我们觉得2023年汽车市场最重要的竞争会来自插电混动领域。在上一期《插电混动的技术路线分析》中,我们盘点完比亚迪、长城和吉利的路线,今天我们接着来讲长安、奇瑞、上汽这三家企业的混动技术,为国内的插电混动技术做一个完整的画像(文末有汇总图)。  </p><p>● 上汽  <br>上汽混动开发主要有两个主体,一个是专门开发电动汽车的捷能,一个是传统动力总成部门,前两代的系统是由捷能主导开发的。  </p><p>上汽是国内很早开始自研混动系统的主机厂,2013年上汽第一代EDU是发动机+P1发电机+P2驱动电机+2档AMT结构 ,非常典型的串并联结构。这是典型的双电机方案,主要用于发电和调整发动机转速的ISG电机和另一个则是主要用于驱动的TM电机。 第一代上汽EDU混动系统加入了2挡变速机构(2AMT),设计的初衷是让「发动机」和「电机」都能维持在相对高效率的运转区间。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP6" alt=" title=" 微信图片_20230227120635.png""="" title=" title=">  </p><p>第一代系统的加入了2挡的变速机构,可以更好地实现电机和发动机的工作点的调节。  </p><p>这套系统的优点是:  </p><p>◎系统效率高,发动机可完全解耦工作在高效区间,油耗比较低  </p><p>◎控制策略灵活,串并联结构,可串联可并联,甚至可以发动机双电机并联,能2档调速  </p><p>◎在电池SOC高的时候,发动机双电机同时出力  </p><p>当然这套系统也是有缺点的,比如:  </p><p>◎平顺性和动力中断:2档AMT的换档速度慢,换档动力短暂中断以及换档顿挫这些问题始终是影响了性能。  </p><p>◎故障率和成本:由于整套系统设计初期参数方面需要优化,而切降低成本也比较困难。  </p><p>上汽在第一代的技术上最终选择了推翻重来,研发了第二代「上汽EDU混动系统」。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP7" alt=" title=" 微信图片_20230227120647.png""="" title=" title=">  </p><p>第二代上汽EDU混动系统,可以认为是单电机P2.5并联结构,发动机+6AMT+P2电机+4AMT并联,由发动机、驱动电机、齿轮轴系、离合器以及整车控制器等控制模块组成,属于三平行轴式的单电机电驱 方案。这套系统有18组齿轮,4个同步器,3组同步器与离合器主要用于调节整套系统的换挡逻辑,将发动机与电机相结合。  </p><p>◎油耗层面某些地方还是不错的,发动机和变速箱分别能在各自不同的最佳档位上并联输出  </p><p>◎动力特性比较好,单电机在电控和电机方面成本下降  </p><p>缺点是:  </p><p>◎这套基础结构是P2.5单电机,发动机无法解耦,因此在馈电情况下油耗也降不下去。  </p><p>由于整个系统比较复杂,通过多种机械耦合以后整体的效率并没有设想的更高  </p><p>在上汽乘用车的传统动力总成部门,也在开发P1P3的新混动架构,等正式发布以后我们可以再展开来说。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP8" alt=" title=" 微信图片_20230227120659.png""="" title=" title=">  </p><p>● 长安 iDD  <br>长安汽车的混动车型是从2008年开始筹划建立,2017年和2018年分别推出了搭载P2-7DCT的逸动PHEV和搭载P134串并联电四驱的CS75PHEV量产车型,2021年最新推出的蓝鲸iDD混动系统,采用P2-6DCT并联混动变速器。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP9" alt=" title=" 微信图片_20230227120705.png""="" title=" title=">  </p><p>长安iDD是一套P2架构的单电机混动类型,1.5T四缸发动机最大功率122千瓦、最大扭矩255牛米,与之搭档的电机最大功率85千瓦、最大扭矩330牛米。这两个动力源通过一台六挡三离合变速器传输,是典型的P2混动系统。2021年,长安UNI-K iDD改进了这套混合动力系统,最大功率可达122kW,最大峰值扭矩为255 N·m。通过安装了一块容量为30.74kWh的电池。  </p><p>长安这套系统目前来看并不是主流的方向,单电机并联式方案在欧洲采用比较多,目前最大的缺点是馈电油耗高。由于P2的结构特性,不能实现一边发电一边驱动,这就会导致车辆的主要动力输出是依靠发动机来实现的,那么在馈电状态下,油耗就会非常高。  </p><p>● 奇瑞  </p><p>奇瑞2021年发布了3挡串并联混动变速器鲲鹏混动系统。奇瑞鲲鹏混动系统是一套混联式混合动力,驱动核心是一台115kW的1.5T发动机加上两台(P2 55kW、P2.5 70kW)永磁同步电机。 动力系统的核心在于三档双离合的混动变速箱上,两台电机中的P2.5电机与双离合变速箱中的奇数轴相连,在驱动状态下有两个挡位可以切换。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQa" alt=" title=" 微信图片_20230227120713.png""="" title=" title=">  </p><p>P2电机则直接挂在发动机输出轴的离合器C1的另一端,可通过变速箱输出动力,也可在发动机带动下发电。发动机则是处在三档变速箱的最顶端,可直驱,也可增程。  </p><p>这套系统最大的特点是9种工作模式和11个组合挡位,包括单电机纯电模式、双电机纯电模式、串联增程模式、发动机直驱模式、并联驱动模式、驻车充电模式、行车充电模式、单电机制动能量回收,以及双电机制动回收模式。  </p><p>优点:理论上这套系统可以做得很牛,理论上可以覆盖更多的使用场景,而且将电机和发动机的效率最大化;  </p><p>缺点:缺点也很明显,整个动力系统的结构会非常复杂,电机、电池和发动机等不同配置调整以后,整个系统需要一遍遍调教,需要大量的车型推出来不断优化,这使得整车重量和调校会有难度。而且这套系统的BOM成本和制造成本来看,很短在初期降下来。  </p><p>小结:混动系统并不容易做,插电混动也是在新能源汽车鼓励政策下不断支持以后,才有今天的成绩。我们希望中国的混动系统越来越好,每家都有机会完善自己的方案。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQb" alt=" title=" 微信图片_20230227120720.png""="" title=" title="></p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 04:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387009</guid>
            <link>https://aijishu.com//a/1060000000387009</link>
        </item>
        <item>
            <title><![CDATA[南京大学&港中文提出首个支持超高分辨率(10000x10000)图像风格迁移方案]]></title>
            <description><![CDATA[<p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP4" alt="image.png" title="image.png"></p><p>paper:<a href="https://aijishu.com/link?target=https%3A%2F%2Farxiv.org%2Fabs%2F2103.11784" target="blank">https://arxiv.org/abs/2103.11784</a></p><p>code:<a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fczczup%2FURST" target="blank">https://github.com/czczup/URST</a></p><blockquote>本文是南京大学&amp;香港大学的路通&amp;罗平等人在风格迁移领域的一次突破性探索,提出了<strong>首个支持超高分辨率(比如10000x10000大小)图像风格迁移的方案URST</strong>。针对现有风格迁移模型在图像块处理时存在的块间不一致问题,<strong>提出了一种新颖的“Thumbnail Instance Normalization”</strong>;与此同时,针对高分辨率图像风格迁移存在的“small stroke size”问题,<strong>提出了一种新颖的辅助损失</strong>。所提方案可以轻易与现有风格迁移网络组合并取得性能提升。</blockquote><h2>Abstract</h2><p>本文提出一种非常简单的极限分辨率的风格迁移框架URST,首个可以处理任意高分辨率(比如)图像的进行风格迁移的方案。当处理超高分辨率图像时,受限于较大的内存占用与<code>small stroke size</code>问题,现有风格迁移方法往往难以真正应用。</p><p>URST通过以下两种策略避免了超高分辨率图像导致的内存问题:(1) 将图像划分成小的图像块进行处理;(2)提出一种新颖的<code>Thumbnail Instance Normalization (TIN)</code>进行块级风格迁移。具体来说,TIN可以提取缩略图的规范化统计信息并应用到小图像块上,确保了不同块之间的风格一致性。</p><p>总而言之,相比已有方案,本文所提URST具有这样几个优点:</p><ul><li>通过将图像拆分为小块并采用TIN成功的对任意高分辨图像进行风格迁移;</li><li>受益于所提感知损失,所提方法在超高分辨率图像上取得了超过其他SOTA方案的效果;</li><li>所提URST可以轻易的嵌入到现有风格迁移方案中,无需进行训练即可提升其性能。</li></ul><h2>Introduction</h2><p>超高分辨率图像风格迁移存在两个关键性挑战:</p><ul><li>超高分辨图像需要非常大的内存占用,甚至超出现有GPU的最大显存;</li><li>过小的笔画描边会导致不自然的纹理。</li></ul><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQd" alt="image.png" title="image.png"></p><p>针对第一个问题,现有方法往往采用轻量型网络、模型剪枝、知识蒸馏等方法降低显存占用。然而这些方法仅仅能起到缓和的作用,以上图为例,随着分辨率的提升,显存的占用呈指数增长,很快超出了现有GPU的峰值。这就驱动我们<strong>设计一种更有效的策略用于超高分辨率图像的风格迁移</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQe" alt="image.png" title="image.png"></p><p>超高分辨率图像的笔画边缘过小会呈现出不自然的现象,可参考上图(b)。增大笔画边缘是一种广泛采用的解决上述问题的方法;此外扩大风格迁移网络的感受野是另一种解决方案。然而这些方法并不适用于超高分辨率风格迁移。</p><p>为解决上述问题,本文提出了URST用于对任意高分辨率图像在有限内存约束下进行风格迁移,效果可参考上图(d)。</p><h2>Method</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQh" alt="image.png" title="image.png"></p><p>上图给出了本文所提URST的整体框架示意图。所提方案包含三个关键设计思想:</p><ul><li><strong>一种灵活的块级风格迁移</strong>,它可以将高计算量的风格迁移任务拆分为多个地计算量的块级风格迁移;</li><li>提出<strong>一种新颖的缩略图实例规范化TIN</strong>,它可以提取缩略图规范化统计信息并将其应用到小图像块上以确保不同块间的风格一致性;</li><li>精心设计了<strong>一种笔画感知损失</strong>以聚焦于笔画边缘的感知差异,促使风格迁移网络生成大的笔画边缘。</li></ul><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQi" alt="image.png" title="image.png"></p><p>由于该方案中的风格迁移网络可以是任意方法(比如AdaIN、LinearWCT),为方便起见,我们定义所选择方法原始损失为,在训练过程中,我们首先采用原始损失基于缩略图优化风格迁移网络。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQj" alt="image.png" title="image.png"></p><h3>Patch-wise Style Transfer</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQk" alt="image.png" title="image.png"></p><p>相比已有方法采用完整图像作为输入,所提框架可以灵活的处理任意高分辨率图像,同时也可以轻易嵌入到现有风格迁移方法(比如AdaIN、WCT、LinearWCT)中。正如前面所提到的,由于不同块的统计特性独立性,不同图像块的风格化可能存在不一致性问题。</p><h3>Thumbnail Instance Normalization</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQl" alt="image.png" title="image.png"></p><p>然而,我们发现IN并不适用于块级风格迁移,会导致块间风格不一致问题,可参考下图。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQm" alt="image.png" title="image.png"></p><p>在上图(a)中,我们对输入作为整体进行规范化;在上图(b)中我们将输入拆分为四块分贝进行规范化。这就导致最终的结果存在风格不一致问题。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQn" alt="image.png" title="image.png"></p><p>通过这种方式,TIN可以确保不同块间的风格一致性间,上图(c)。</p><h3>Stroke Perceptual Loss</h3><p>所提方法驱动我们提出一种辅助损失增大笔画边缘,该损失定义如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQo" alt="image.png" title="image.png"></p><h2>Experiments</h2><p>为验证所提方法的有效性,我们将其与AdaIN、WCT等方法进行了对比,见下图。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQp" alt="image.png" title="image.png"><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQp" alt="image.png" title="image.png"></p><p>从上图可以看到:(1) IN导致了明显的块间风格不一致问题;(2) <strong>所提方法取得了与全图相似的效果且显存占用更低</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQO" alt="image.png" title="image.png"></p><p>与此同时,我们还对比了所提损失函数的影响分析,见上图。可以看到:<strong>基于所提损失引导,这些模型可以生成更粗的线条与更稀疏的纹理,这有助于改善超高分辨率风格迁移</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQP" alt="image.png" title="image.png"><br>此外,我们还提供了不同风格迁移方案在不同输入分辨率输入时的显存占用对比。可以看到:大多方法甚至不能处理的高分辨率图像;而<strong>本文所提方法甚至可以处理分辨率图像且显存占用不超过5GB</strong>。理论上,本文所提方法可以处理任意高分辨率图像。</p><p>最后,我们提供一个超高分辨率图像风格迁移效果图作为结尾。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQQ" alt="image.png" title="image.png"></p><blockquote>来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FJqRUmFZLGtXDt814wH7ppA" target="blank">AIWalker</a><br>作者:   Happy</blockquote><p>推荐阅读</p><ul><li><a href="https://aijishu.com/a/1060000000386282"><strong>深入分析MobileAI图像超分最佳方案:ABPN</strong></a></li><li><a href="https://aijishu.com/a/1060000000385959"><strong>HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法</strong></a></li><li><a href="https://aijishu.com/a/1060000000385643"><strong>一层卷积能做啥?BOE告诉你:一层卷积可以做超分!</strong></a></li><li><a href="https://aijishu.com/a/1060000000385377"><strong>一层卷积能做啥?BOE告诉你:一层卷积可以做超分!</strong></a></li><li><a href="https://aijishu.com/a/1060000000380384"><strong>YOLOv6 v3.0 | 重磅升级!性能超越V8!</strong></a></li></ul><blockquote>本文章著作权归作者所有,任何形式的转载都请注明出处。更多动态滤波,图像质量,超分辨相关请关注我的专栏<a href="https://aijishu.com/blog/aiwalker">AIWalker</a>。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 04:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000386996</guid>
            <link>https://aijishu.com//a/1060000000386996</link>
        </item>
        <item>
            <title><![CDATA[ECCV'22 Oral|VQFR|基于矢量量化字典与双解码器的人脸盲修复网络]]></title>
            <description><![CDATA[<h2>ECCV'22 Oral|VQFR|基于矢量量化字典与双解码器的人脸盲修复网络</h2><p>ECCV'22 Oral - VQFR: Blind Face Restoration with Vector-Quantized Dictionary and Parallel Decoder</p><p>解读:Owen718 论文链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Farxiv.org%2Fpdf%2F2205.06803.pdf" target="blank">https://arxiv.org/pdf/2205.06803.pdf</a></p><h2>Background&amp;Motivation</h2><p>尽管生成式面部先验和结构化面部先验最近已经证明了可以生成高质量的人脸盲修复结果,稳定、可靠生成更细粒度的脸部细节仍然是一个具有挑战性的问题。这篇文章受最近基于字典的方法和基于矢量量化的方法启发,提出了一种 基于矢量量化(VQ-based)的人脸盲修复方法VQFR。VQFR从高质量的图像中抽取特征,构建low-level特征库从而恢复逼真的面部细节。</p><p>这篇工作重点关注如下两个问题:</p><ul><li>1.<strong>codebook中每个code对应的原图patch大小会极大影响人脸网络修复结果的质量与保真度权衡,而实际落地应用中,质量与保真度需要做到良好的平衡以获得最佳视觉效果。</strong></li><li>2.<strong>原图退化特征需要与来自codebook的高质量特征做融合,融合过程中,如何做到高质量特征不被退化特征所干扰而导致性能降低?</strong></li></ul><h2>详细介绍引入</h2><p>人脸恢复的目标是恢复低质量(LQ)面孔并纠正未知退化,例如噪声、模糊、下采样引起的退化等。在实际情况下,此任务变得更具挑战性,因为存在更复杂的退化、多样的面部姿势和表情。以前的作品通常利用特定于人脸的先验,包括几何先验、生成先验和参考先验。具体来说,几何先验通常包括面部标志、面部解析图和面部组件热图。它们可以为恢复准确的面部形状提供全局指导,但不能帮助生成逼真的细节。此外,几何先验是从退化图像中估计出来的,因此对于具有严重退化的输入变得不准确。这些特性促使研究人员寻找更好的先验。最近的人脸修复工作开始研究生成先验(GAN-Prior),并取了优异的性能。这些方法通常利用预先训练的人脸生成对抗网络(例如StyleGAN)的强大生成能力来生成逼真的纹理。这些方法通常将退化的图像投影回GAN潜在空间,然后使用预先训练的生成器解码高质量(HQ)人脸结果。尽管基于GAN先验的方法最初从整体上讲具有良好的恢复质量,但仍然无法生成细粒度的面部细节,特别是精细的头发和精致的面部组件。这是因为训练有素的GAN模型,其潜在空间仍然是不够完善的。基于参考的方法(Reference-based methods)—探索了高质量的指导面孔或面部组件字典来解决面部恢复问题。DFDNet是该类别中的代表方法,它不需要访问相同身份的面孔,就可以产生高质量的结果。它明确建立高质量的“纹理库”,用于几个面部组件,然后用字典中最近的高质量面部组件替换退化的面部组件。这种离散的替换操作可以直接弥合低质量面部部件与高质量部件之间的差距,因此具有提供良好面部细节的潜力。然而,DFDNet中的面部组件字典仍然有两个缺点。<strong>1)它使用预先训练的VGGFace网络进行离线生成,该网络是为识别任务优化的,明显并不适合恢复任务。2)它只关注几个面部组件(即眼睛、鼻子和嘴巴),但不包括其他重要区域,例如头发和皮肤。</strong></p><p>面部组件字典的局限性促使VQFR探索<strong>矢量量化(VQ)码本</strong>,这是一个为所有面部区域构建的字典。VQFR提出的人脸恢复方法VQFR既利用字典方法又利用GAN训练,但不需要任何几何或GAN先验。与面部组件字典相比,VQ码本可以提供更全面的低层特征库,而不局限于有限的面部组件。它也是通过面部重建任务以端到端的方式来学习的。此外,矢量量化的机制使其在不同的退化情况下更加稳健。尽管简单地应用VQ码本可以取得不错的效果,但要实现良好的结果也不容易。后续进一步介绍了两个特殊的网络设计以应对前文提到的两个problems,这将帮助VQFR在细节生成和身份保留方面都超越先前的方法。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPM" alt="image.png" title="image.png"></p><p>具体来说,为了生成逼真的细节,作者发现选择适当的压缩补丁大小至关重要,它表示codebook的一个code“由多大的补丁表示”。如图2所示,较大的patch可以带来更好的视觉质量,但是真实度却会下降。经过全面的调查,我们建议输入图像大小512x512时,32大小的patch size最合适。然而,这种选择只是在质量和真实度之间进行权衡。表情和身份也可能会因适当的压缩补丁大小而有很大的变化。一个直接的解决方案是将输入特征与不同的解码器层融合,这与GFP-GAN中的操作类似。尽管输入特征可以带来更多的真实度信息,但它们也会干扰从VQ代码本生成的逼真细节特征。这个问题引出了作者的第二个网络设计:并行解码器。具体而言,并行解码器结构包括纹理解码器和主解码器。VQFR的纹理解码器仅接收来自VQ代码本的潜在表示的信息,而主解码器将纹理解码器中的特征做变换以匹配退化输入的需保留的特征。<strong>为了避免高质量细节的损失并更好地匹配退化的面部,VQFR在主解码器中进一步采用了具有可变卷积的纹理变换模块。通过VQ codebook作为面部字典和并行解码器设计,VQFR可以实现更高质量的面部细节修复,同时尽可能得保留面部恢复的真实度。</strong></p><h2>VQFR方法概述</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPN" alt="image.png" title="image.png"></p><p>VQFR模型架构图。VQFR由一个编码器组成,用于映射退化的人脸 进入潜在和并行解码器以利用 HQ 代码和输入功能。编码器 和解码器由矢量量化模型和预训练的 HQ 码本,将编码的latent feature替换为 HQ 代码</p><p>Vector-Quantized Codebook最早在VQVAE中被引入,旨在学习离散的先验来编码图像。VQFR中的codebook部分与VQGAN中的基本一致。VQGAN 主要是采用了感知损失和对抗性损失以鼓励具有更好感知质量的重建。VQFR方法主要基于以下两个观察来提高修复性能:</p><ol><li><strong>通过采用合适的压缩补丁大小,可以用仅由高品质人脸训练的VQ码本来去除LQ人脸的退化。</strong></li><li><strong>在训练恢复任务时,在改进的细节纹理和保真度变化之间需要保持一个平衡。</strong></li></ol><p>针对观察现象一,VQFR采用合适的f大小来控制codebook效果,f取32最佳。针对观察现象二,VQFR提出利用双分支架构的decoder来逐渐将高质量纹理特征补充进待修复特征中,texture warp module利用可变形卷积很好的实现了这一目的。反观之前的相似工作,之前工作中单一分支decoder架构很难较好的融合低质特征和高质量特征,这导致了恢复性能不佳。</p><h2>实验</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPO" alt="image.png" title="image.png"></p><p>VQFR在CelebA-Test数据集和LFW数据集上均取得了领先的性能结果,值得关注的是其PSNR/SSIM指标并不十分出色,但是FID、NIQE、LMD指标非常不错,视觉效果也体现了该方法的优越性。</p><h3>真实度与保真度的平衡</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPP" alt="image.png" title="image.png"></p><p>可以看出VQFR取得了非常不错的真实度与保真度的平衡,实验效果很出色。</p><h2>总结</h2><p>本文提出的VQFR是一种性能非常不错的人脸盲修复方法,文章思路非常清晰,明确点出核心motivation和为解决的相关问题,最后的实验结果也非常精彩,很好的证明了方法的基本理论与出发点,更多细节建议大家参考原文。</p><blockquote>作者: owen      <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FxGhgltsOTeO6-2VILnJsLQ" target="blank">GiantPandaCV</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000386641">编译器优化那些事儿(4):归纳变量</a></li><li><a href="https://aijishu.com/a/1060000000386334">编译器优化那些事儿(3):Lazy Code Motion</a></li><li><a href="https://aijishu.com/a/1060000000386007">编译器优化那些事儿(2):常量传播</a></li></ul><blockquote>欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区<a href="https://aijishu.com/blog/qianrushikezhan">嵌入式客栈</a>专栏欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 03:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000386978</guid>
            <link>https://aijishu.com//a/1060000000386978</link>
        </item>
        <item>
            <title><![CDATA[【TVM 学习资料】TensorIR 快速入门]]></title>
            <description><![CDATA[<p>本篇文章译自英文文档  [Blitz Course to TensorIR<br>](<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2Ftutorial%2Ftensor_ir_blitz_course.html" target="blank">https://tvm.apache.org/docs/t...</a>) 作者是 Siyuan Feng。更多 TVM 中文文档可访问→<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.hyper.ai%2F" target="blank">TVM 中文站</a> </p><p>TensorIR 是深度学习领域的特定语言,主要有两个作用:</p><ul><li>在各种硬件后端转换和优化程序。</li><li>自动 <em>tensorized</em> 程序优化的抽象。</li></ul><pre><code class="bash">import tvm
from tvm.ir.module import IRModule
from tvm.script import tir as T
import numpy as np</code></pre><h1>IRModule</h1><p>IRModule 是 TVM 的核心数据结构,它包含深度学习程序,并且是 IR 转换和模型构建的基础。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/eab85e2bd22d4c2199a5245e93ab04a5.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>上图展示的是 IRModule 的生命周期,它可由 TVMScript 创建。转换 IRModule 的两种主要方法是 TensorIR 的 schedule 原语转换和 pass 转换。此外,也可直接对 IRModule 进行一系列转换。注意,可以在任何阶段将 IRModule 打印到 TVMScript。完成所有转换和优化后,可将 IRModule 构建为可运行模块,从而部署在目标设备上。</p><p>基于 TensorIR 和 IRModule 的设计,可创建一种新的编程方法:</p><ol><li>基于 Python-AST 语法,用 TVMScript 编写程序。</li><li>使用 Python API 转换和优化程序。</li><li>使用命令式转换 API 交互检查和提高性能。</li></ol><h1>创建 IRModule</h1><p>IRModule 是 TVM IR 的一种可往返语法,可通过编写 TVMScript 来创建。</p><p>与通过张量表达式创建计算表达式(使用张量表达式操作算子)不同,TensorIR 允许用户通过 TVMScript(一种嵌在 Python AST 中的语言)进行编程。新方法可以编写复杂的程序并进一步调度和优化。</p><p>下面是向量加法的示例:</p><pre><code class="bash">@tvm.script.ir_module
class MyModule:
    @T.prim_func
    def main(a: T.handle, b: T.handle):
        # 我们通过 T.handle 进行数据交换,类似于内存指针
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # 通过 handle 创建 Buffer
        A = T.match_buffer(a, (8,), dtype="float32")
        B = T.match_buffer(b, (8,), dtype="float32")
        for i in range(8):
            # block 是针对计算的抽象
            with T.block("B"):
                # 定义一个空间(可并行)block 迭代器,并且将它的值绑定成 i
                vi = T.axis.spatial(8, i)
                B[vi] = A[vi] + 1.0
ir_module = MyModule
print(type(ir_module))
print(ir_module.script())</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.ir.module.IRModule'&gt;
# from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i in T.serial(8):
            with T.block("B"):
                vi = T.axis.spatial(8, i)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><p>此外,我们还可以使用张量表达式 DSL 编写简单的运算符,并将它们转换为 IRModule。</p><pre><code class="bash">from tvm import te
A = te.placeholder((8,), dtype="float32", name="A")
B = te.compute((8,), lambda *i: A(*i) + 1.0, name="B")
func = te.create_prim_func([A, B])
ir_module_from_te = IRModule({"main": func})
print(ir_module_from_te.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i0 in T.serial(8):
            with T.block("B"):
                i0_1 = T.axis.spatial(8, i0)
                T.reads(A[i0_1])
                T.writes(B[i0_1])
                B[i0_1] = A[i0_1] + T.float32(1)</code></pre><h1>构建并运行 IRModule</h1><p>可将 IRModule 构建为特定 target 后端的可运行模块。</p><pre><code class="bash">mod = tvm.build(ir_module, target="llvm")  # CPU 后端的模块
print(type(mod))</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.driver.build_module.OperatorModule'&gt;</code></pre><p>准备输入数组和输出数组,然后运行模块:</p><pre><code class="bash">a = tvm.nd.array(np.arange(8).astype("float32"))
b = tvm.nd.array(np.zeros((8,)).astype("float32"))
mod(a, b)
print(a)
print(b)</code></pre><p>输出结果:</p><pre><code class="bash">[0. 1. 2. 3. 4. 5. 6. 7.]
[1. 2. 3. 4. 5. 6. 7. 8.]</code></pre><h1>转换 IRModule</h1><p>IRModule 是程序优化的核心数据结构,可通过 Schedule 进行转换。schedule 包含多个 primitive 方法来交互地转换程序。每个 primitive 都以特定方式对程序进行转换,从而优化性能。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f1d1c2925359488883e2cb5e0a43802f.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>上图是优化张量程序的典型工作流程。首先,用 TVMScript 或张量表达式创建一个初始 IRModule,然后在这个初始 IRModule 上创建 schedule。接下来,使用一系列调度原语来提高性能。最后,我们可以将其降低并构建成一个可运行模块。</p><p>上面只演示了一个简单的转换。首先,在输入 ir_module 上创建 schedule:</p><pre><code class="bash">sch = tvm.tir.Schedule(ir_module)
print(type(sch))</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.tir.schedule.schedule.Schedule'&gt;</code></pre><p>将嵌套循环展开成 3 个循环,并打印结果:</p><pre><code class="bash"># 通过名字获取 block
block_b = sch.get_block("B")
# 获取包围 block 的循环
(i,) = sch.get_loops(block_b)
# 展开嵌套循环
i_0, i_1, i_2 = sch.split(i, factors=[2, 2, 2])
print(sch.mod.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
     

...

@github-actions
Copy link
Contributor

http://localhost:1200/aijishu/channel/ai - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[AI 应用 - 极术社区]]></title>
        <link>https://aijishu.com//api/channel/1080000000000211?page=1</link>
        <atom:link href="http://localhost:1200/aijishu/channel/ai" rel="self" type="application/rss+xml" />
        <description><![CDATA[AI 应用 - 极术社区 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 15:15:38 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[用人工智能设计芯片及对IC设计就业市场的影响]]></title>
            <description><![CDATA[<p>集成电路 (IC) 设计是一项复杂的工作,不断突破密度和性能的界限。现在,人工智能 (AI)在 IC 设计中的作用越来越大。</p><p>虽然 AI 最近因其在 ChatGPT 等自然语言处理器方面的惊人能力而受到更多关注,但该工具也被用于 IC 设计的各个阶段,包括设计优化、布局、仿真和验证。人工智能算法还可以帮助更有效地探索设计空间,比传统方法更快地发现最佳设计配置。</p><h5>随着设计变得比以往任何时候都更加复杂,人工智能可以成为 IC 设计师的强大资产。</h5><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRe" alt="image.png" title="image.png"></p><p>本文重点介绍了AI如何被用作IC设计的工具,以及这项技术如何影响IC设计工程师的专业价值。</p><p><strong>利用 AI 来实现严格的设计约束</strong></p><h3>由于数十亿个晶体管被限制在一个很小的芯片区域,IC 设计师的任务是在严格约束的情况下优化设计。&nbsp;</h3><p>首先,芯片面积必须最小,以适应当今设备的小尺寸,并降低制造成本。布局的功耗也是值得关注的;功耗同样会影响部署成本以及芯片对环境的影响。某些密集区域和配置容易过热,需要冷却机制或更巧妙的布局。考虑到这些因素和许多其他因素,IC设计人员大约需要八到九个月的时间来生成一个满足每个严格要求的芯片布局。</p><p>为了加快和优化 IC 设计流程,许多公司(包括科技行业的一些最大公司)现在都在投资 AI 工具来完成一些繁重的工作。</p><p><strong>谷歌人工智能在几个小时内设计出芯片</strong></p><p>据谷歌称,谷歌的深度学习强化学习 (RL) 方法可以在比人类工程师少得多的时间内生成有效的布局,而且结果在质量上也不相上下。</p><p>谷歌表示,谷歌的深度学习强化学习(RL)方法可以在比人类少得多的时间内产生有效的布局,而且结果在质量上也不相上下。2022年3月,谷歌研究院推出了PRIME,这是一种深度学习方法,利用现有的数据,如功率和延迟来创建加速器设计,比用传统方法设计的芯片更快、更小。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRf" alt="image.png" title="image.png"></p><p>谷歌研究人员使用 10,000 个芯片平面图来训练他们的模型。人工智能生成的芯片设计时间不到六个小时。谷歌表示,这种方法已经被利用来实现谷歌的张量处理单元(TPU),这是谷歌基于云的机器学习应用的一部分。</p><p><strong>EDA公司在AI设计系统上加倍投入</strong></p><p>不仅仅是谷歌转向机器学习模型。像Synopsys和Cadence这样的EDA公司也在其最新工具中使用到AI技术。比如最近,Synopsys凭借其 Synopsys DSO.ai 自主芯片设计系统注册了 100 个商业流片。该系统最近的客户包括 意法半导体(ST)和 SK Hynix。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRg" alt="image.png" title="image.png"></p><p>ST 和 Synopsys 于 2022 年 2 月初首次在微软的云端使用 DSO.ai 来设计工作芯片。使用 Synopsys 的 DSO.ai 设计系统,结合 Microsoft Azure 上的 Synopsys Fusion Compiler 和 IC Compiler,该工具将功耗、性能和面积 (PPA) 指标提高了 3 倍以上,总功耗降低了 25%,并且显著缩小了芯片尺寸。</p><p>除了芯片设计,人工智能还在芯片测试和验证中找到了应用——芯片制造商在这两个领域花费了大量时间。为了解决这一设计阶段的问题,西门子发布了Questa Verification IQ,这是一个帮助IC设计工程师加快验证过程的软件平台。</p><p><strong>英伟达用GPU设计GPU</strong></p><p>NVIDIA(英伟达)为芯片设计设计了另一种深度学习方法。该公司制作了一个名为PrefixRL的 RL 模型,证明 AI 可以从头开始学习电路设计,并使用最新的 EDA 工具制造更小、更快的电路。NVIDIA 的架构由 13,000 个使用 AI 技术设计的电路组成。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRh" alt="image.png" title="image.png"></p><p>针对自动化单元迁移,该公司开发了NVCell,可以无错迁移92%的单元库。人类工程师可以对剩下的 8% 没有自动迁移的单元进行处理。NVIDIA 首席科学家 Bill Dally 表示:</p><p><em>“所以这就像一个 Atari 视频游戏,但它是一个用于修复标准单元中的设计规则错误的视频游戏。通过强化学习来研究和修复这些设计规则错误,我们能够基本完成我们标准的设计单元。”</em></p><p><strong>人工智能对 IC 设计就业市场的影响</strong></p><p>虽然人工智能可以自动执行传统上由IC设计人员执行的某些任务,例如布局设计和优化,但它也减少了设计过程中对手动方面的需求。虽然这提高了整体效率,但也可能导致IC设计的某些领域的最终工作被取代。</p><p>另一方面,人工智能还可以帮助 IC 设计人员更高效、更有效地开展工作。例如,AI 可以分析大量数据并提供见解,建议工程师以前可能没有考虑过的设计替代方案。这种趋势可以提高 IC 设计人员在行业中的价值,使他们能够专注于更复杂和更具创造性的设计方面,并最终生产出更好的产品。</p><p>不过人工智能不太可能完全取代对熟练IC设计师的需求。随着人工智能在行业中越来越普遍,对这类工程师的需求甚至可能会增加,因为在设计过程中,将需要能够准确验证和利用人工智能工具和算法的个人。</p><hr><blockquote>作者:  Darshil Patel <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FN_pgzMV26mvgCMAxWMgieQ" target="blank">EETOP</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000386323">行业前瞻,神奇的忆阻器</a></li><li><a href="https://aijishu.com/a/1060000000386135">芯片验证调研报告:首次流片成功率越来越低、Verilog 使用逐渐减少、UVM地位无法动摇</a></li><li><a href="https://aijishu.com/a/1060000000385729">PCIe 6.0:在有损HVM通道中使用PAM4实现64GT/s的挑战</a></li><li><a href="https://aijishu.com/a/1060000000385482">Wi-R 一种全新的通信方式,让你的身体充当媒介!芯片已推出!</a></li><li><a href="https://aijishu.com/a/1060000000383891">科普:DDR</a></li></ul><blockquote>更多IC设计技术干货请关注IC设计技术专栏。<br>迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387068</guid>
            <link>https://aijishu.com//a/1060000000387068</link>
        </item>
        <item>
            <title><![CDATA[南京大学&港中文提出首个支持超高分辨率(10000x10000)图像风格迁移方案]]></title>
            <description><![CDATA[<p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP4" alt="image.png" title="image.png"></p><p>paper:<a href="https://aijishu.com/link?target=https%3A%2F%2Farxiv.org%2Fabs%2F2103.11784" target="blank">https://arxiv.org/abs/2103.11784</a></p><p>code:<a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fczczup%2FURST" target="blank">https://github.com/czczup/URST</a></p><blockquote>本文是南京大学&amp;香港大学的路通&amp;罗平等人在风格迁移领域的一次突破性探索,提出了<strong>首个支持超高分辨率(比如10000x10000大小)图像风格迁移的方案URST</strong>。针对现有风格迁移模型在图像块处理时存在的块间不一致问题,<strong>提出了一种新颖的“Thumbnail Instance Normalization”</strong>;与此同时,针对高分辨率图像风格迁移存在的“small stroke size”问题,<strong>提出了一种新颖的辅助损失</strong>。所提方案可以轻易与现有风格迁移网络组合并取得性能提升。</blockquote><h2>Abstract</h2><p>本文提出一种非常简单的极限分辨率的风格迁移框架URST,首个可以处理任意高分辨率(比如)图像的进行风格迁移的方案。当处理超高分辨率图像时,受限于较大的内存占用与<code>small stroke size</code>问题,现有风格迁移方法往往难以真正应用。</p><p>URST通过以下两种策略避免了超高分辨率图像导致的内存问题:(1) 将图像划分成小的图像块进行处理;(2)提出一种新颖的<code>Thumbnail Instance Normalization (TIN)</code>进行块级风格迁移。具体来说,TIN可以提取缩略图的规范化统计信息并应用到小图像块上,确保了不同块之间的风格一致性。</p><p>总而言之,相比已有方案,本文所提URST具有这样几个优点:</p><ul><li>通过将图像拆分为小块并采用TIN成功的对任意高分辨图像进行风格迁移;</li><li>受益于所提感知损失,所提方法在超高分辨率图像上取得了超过其他SOTA方案的效果;</li><li>所提URST可以轻易的嵌入到现有风格迁移方案中,无需进行训练即可提升其性能。</li></ul><h2>Introduction</h2><p>超高分辨率图像风格迁移存在两个关键性挑战:</p><ul><li>超高分辨图像需要非常大的内存占用,甚至超出现有GPU的最大显存;</li><li>过小的笔画描边会导致不自然的纹理。</li></ul><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQd" alt="image.png" title="image.png"></p><p>针对第一个问题,现有方法往往采用轻量型网络、模型剪枝、知识蒸馏等方法降低显存占用。然而这些方法仅仅能起到缓和的作用,以上图为例,随着分辨率的提升,显存的占用呈指数增长,很快超出了现有GPU的峰值。这就驱动我们<strong>设计一种更有效的策略用于超高分辨率图像的风格迁移</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQe" alt="image.png" title="image.png"></p><p>超高分辨率图像的笔画边缘过小会呈现出不自然的现象,可参考上图(b)。增大笔画边缘是一种广泛采用的解决上述问题的方法;此外扩大风格迁移网络的感受野是另一种解决方案。然而这些方法并不适用于超高分辨率风格迁移。</p><p>为解决上述问题,本文提出了URST用于对任意高分辨率图像在有限内存约束下进行风格迁移,效果可参考上图(d)。</p><h2>Method</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQh" alt="image.png" title="image.png"></p><p>上图给出了本文所提URST的整体框架示意图。所提方案包含三个关键设计思想:</p><ul><li><strong>一种灵活的块级风格迁移</strong>,它可以将高计算量的风格迁移任务拆分为多个地计算量的块级风格迁移;</li><li>提出<strong>一种新颖的缩略图实例规范化TIN</strong>,它可以提取缩略图规范化统计信息并将其应用到小图像块上以确保不同块间的风格一致性;</li><li>精心设计了<strong>一种笔画感知损失</strong>以聚焦于笔画边缘的感知差异,促使风格迁移网络生成大的笔画边缘。</li></ul><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQi" alt="image.png" title="image.png"></p><p>由于该方案中的风格迁移网络可以是任意方法(比如AdaIN、LinearWCT),为方便起见,我们定义所选择方法原始损失为,在训练过程中,我们首先采用原始损失基于缩略图优化风格迁移网络。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQj" alt="image.png" title="image.png"></p><h3>Patch-wise Style Transfer</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQk" alt="image.png" title="image.png"></p><p>相比已有方法采用完整图像作为输入,所提框架可以灵活的处理任意高分辨率图像,同时也可以轻易嵌入到现有风格迁移方法(比如AdaIN、WCT、LinearWCT)中。正如前面所提到的,由于不同块的统计特性独立性,不同图像块的风格化可能存在不一致性问题。</p><h3>Thumbnail Instance Normalization</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQl" alt="image.png" title="image.png"></p><p>然而,我们发现IN并不适用于块级风格迁移,会导致块间风格不一致问题,可参考下图。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQm" alt="image.png" title="image.png"></p><p>在上图(a)中,我们对输入作为整体进行规范化;在上图(b)中我们将输入拆分为四块分贝进行规范化。这就导致最终的结果存在风格不一致问题。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQn" alt="image.png" title="image.png"></p><p>通过这种方式,TIN可以确保不同块间的风格一致性间,上图(c)。</p><h3>Stroke Perceptual Loss</h3><p>所提方法驱动我们提出一种辅助损失增大笔画边缘,该损失定义如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQo" alt="image.png" title="image.png"></p><h2>Experiments</h2><p>为验证所提方法的有效性,我们将其与AdaIN、WCT等方法进行了对比,见下图。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQp" alt="image.png" title="image.png"><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQp" alt="image.png" title="image.png"></p><p>从上图可以看到:(1) IN导致了明显的块间风格不一致问题;(2) <strong>所提方法取得了与全图相似的效果且显存占用更低</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQO" alt="image.png" title="image.png"></p><p>与此同时,我们还对比了所提损失函数的影响分析,见上图。可以看到:<strong>基于所提损失引导,这些模型可以生成更粗的线条与更稀疏的纹理,这有助于改善超高分辨率风格迁移</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQP" alt="image.png" title="image.png"><br>此外,我们还提供了不同风格迁移方案在不同输入分辨率输入时的显存占用对比。可以看到:大多方法甚至不能处理的高分辨率图像;而<strong>本文所提方法甚至可以处理分辨率图像且显存占用不超过5GB</strong>。理论上,本文所提方法可以处理任意高分辨率图像。</p><p>最后,我们提供一个超高分辨率图像风格迁移效果图作为结尾。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQQ" alt="image.png" title="image.png"></p><blockquote>来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FJqRUmFZLGtXDt814wH7ppA" target="blank">AIWalker</a><br>作者:   Happy</blockquote><p>推荐阅读</p><ul><li><a href="https://aijishu.com/a/1060000000386282"><strong>深入分析MobileAI图像超分最佳方案:ABPN</strong></a></li><li><a href="https://aijishu.com/a/1060000000385959"><strong>HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法</strong></a></li><li><a href="https://aijishu.com/a/1060000000385643"><strong>一层卷积能做啥?BOE告诉你:一层卷积可以做超分!</strong></a></li><li><a href="https://aijishu.com/a/1060000000385377"><strong>一层卷积能做啥?BOE告诉你:一层卷积可以做超分!</strong></a></li><li><a href="https://aijishu.com/a/1060000000380384"><strong>YOLOv6 v3.0 | 重磅升级!性能超越V8!</strong></a></li></ul><blockquote>本文章著作权归作者所有,任何形式的转载都请注明出处。更多动态滤波,图像质量,超分辨相关请关注我的专栏<a href="https://aijishu.com/blog/aiwalker">AIWalker</a>。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 04:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000386996</guid>
            <link>https://aijishu.com//a/1060000000386996</link>
        </item>
        <item>
            <title><![CDATA[ECCV'22 Oral|VQFR|基于矢量量化字典与双解码器的人脸盲修复网络]]></title>
            <description><![CDATA[<h2>ECCV'22 Oral|VQFR|基于矢量量化字典与双解码器的人脸盲修复网络</h2><p>ECCV'22 Oral - VQFR: Blind Face Restoration with Vector-Quantized Dictionary and Parallel Decoder</p><p>解读:Owen718 论文链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Farxiv.org%2Fpdf%2F2205.06803.pdf" target="blank">https://arxiv.org/pdf/2205.06803.pdf</a></p><h2>Background&amp;Motivation</h2><p>尽管生成式面部先验和结构化面部先验最近已经证明了可以生成高质量的人脸盲修复结果,稳定、可靠生成更细粒度的脸部细节仍然是一个具有挑战性的问题。这篇文章受最近基于字典的方法和基于矢量量化的方法启发,提出了一种 基于矢量量化(VQ-based)的人脸盲修复方法VQFR。VQFR从高质量的图像中抽取特征,构建low-level特征库从而恢复逼真的面部细节。</p><p>这篇工作重点关注如下两个问题:</p><ul><li>1.<strong>codebook中每个code对应的原图patch大小会极大影响人脸网络修复结果的质量与保真度权衡,而实际落地应用中,质量与保真度需要做到良好的平衡以获得最佳视觉效果。</strong></li><li>2.<strong>原图退化特征需要与来自codebook的高质量特征做融合,融合过程中,如何做到高质量特征不被退化特征所干扰而导致性能降低?</strong></li></ul><h2>详细介绍引入</h2><p>人脸恢复的目标是恢复低质量(LQ)面孔并纠正未知退化,例如噪声、模糊、下采样引起的退化等。在实际情况下,此任务变得更具挑战性,因为存在更复杂的退化、多样的面部姿势和表情。以前的作品通常利用特定于人脸的先验,包括几何先验、生成先验和参考先验。具体来说,几何先验通常包括面部标志、面部解析图和面部组件热图。它们可以为恢复准确的面部形状提供全局指导,但不能帮助生成逼真的细节。此外,几何先验是从退化图像中估计出来的,因此对于具有严重退化的输入变得不准确。这些特性促使研究人员寻找更好的先验。最近的人脸修复工作开始研究生成先验(GAN-Prior),并取了优异的性能。这些方法通常利用预先训练的人脸生成对抗网络(例如StyleGAN)的强大生成能力来生成逼真的纹理。这些方法通常将退化的图像投影回GAN潜在空间,然后使用预先训练的生成器解码高质量(HQ)人脸结果。尽管基于GAN先验的方法最初从整体上讲具有良好的恢复质量,但仍然无法生成细粒度的面部细节,特别是精细的头发和精致的面部组件。这是因为训练有素的GAN模型,其潜在空间仍然是不够完善的。基于参考的方法(Reference-based methods)—探索了高质量的指导面孔或面部组件字典来解决面部恢复问题。DFDNet是该类别中的代表方法,它不需要访问相同身份的面孔,就可以产生高质量的结果。它明确建立高质量的“纹理库”,用于几个面部组件,然后用字典中最近的高质量面部组件替换退化的面部组件。这种离散的替换操作可以直接弥合低质量面部部件与高质量部件之间的差距,因此具有提供良好面部细节的潜力。然而,DFDNet中的面部组件字典仍然有两个缺点。<strong>1)它使用预先训练的VGGFace网络进行离线生成,该网络是为识别任务优化的,明显并不适合恢复任务。2)它只关注几个面部组件(即眼睛、鼻子和嘴巴),但不包括其他重要区域,例如头发和皮肤。</strong></p><p>面部组件字典的局限性促使VQFR探索<strong>矢量量化(VQ)码本</strong>,这是一个为所有面部区域构建的字典。VQFR提出的人脸恢复方法VQFR既利用字典方法又利用GAN训练,但不需要任何几何或GAN先验。与面部组件字典相比,VQ码本可以提供更全面的低层特征库,而不局限于有限的面部组件。它也是通过面部重建任务以端到端的方式来学习的。此外,矢量量化的机制使其在不同的退化情况下更加稳健。尽管简单地应用VQ码本可以取得不错的效果,但要实现良好的结果也不容易。后续进一步介绍了两个特殊的网络设计以应对前文提到的两个problems,这将帮助VQFR在细节生成和身份保留方面都超越先前的方法。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPM" alt="image.png" title="image.png"></p><p>具体来说,为了生成逼真的细节,作者发现选择适当的压缩补丁大小至关重要,它表示codebook的一个code“由多大的补丁表示”。如图2所示,较大的patch可以带来更好的视觉质量,但是真实度却会下降。经过全面的调查,我们建议输入图像大小512x512时,32大小的patch size最合适。然而,这种选择只是在质量和真实度之间进行权衡。表情和身份也可能会因适当的压缩补丁大小而有很大的变化。一个直接的解决方案是将输入特征与不同的解码器层融合,这与GFP-GAN中的操作类似。尽管输入特征可以带来更多的真实度信息,但它们也会干扰从VQ代码本生成的逼真细节特征。这个问题引出了作者的第二个网络设计:并行解码器。具体而言,并行解码器结构包括纹理解码器和主解码器。VQFR的纹理解码器仅接收来自VQ代码本的潜在表示的信息,而主解码器将纹理解码器中的特征做变换以匹配退化输入的需保留的特征。<strong>为了避免高质量细节的损失并更好地匹配退化的面部,VQFR在主解码器中进一步采用了具有可变卷积的纹理变换模块。通过VQ codebook作为面部字典和并行解码器设计,VQFR可以实现更高质量的面部细节修复,同时尽可能得保留面部恢复的真实度。</strong></p><h2>VQFR方法概述</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPN" alt="image.png" title="image.png"></p><p>VQFR模型架构图。VQFR由一个编码器组成,用于映射退化的人脸 进入潜在和并行解码器以利用 HQ 代码和输入功能。编码器 和解码器由矢量量化模型和预训练的 HQ 码本,将编码的latent feature替换为 HQ 代码</p><p>Vector-Quantized Codebook最早在VQVAE中被引入,旨在学习离散的先验来编码图像。VQFR中的codebook部分与VQGAN中的基本一致。VQGAN 主要是采用了感知损失和对抗性损失以鼓励具有更好感知质量的重建。VQFR方法主要基于以下两个观察来提高修复性能:</p><ol><li><strong>通过采用合适的压缩补丁大小,可以用仅由高品质人脸训练的VQ码本来去除LQ人脸的退化。</strong></li><li><strong>在训练恢复任务时,在改进的细节纹理和保真度变化之间需要保持一个平衡。</strong></li></ol><p>针对观察现象一,VQFR采用合适的f大小来控制codebook效果,f取32最佳。针对观察现象二,VQFR提出利用双分支架构的decoder来逐渐将高质量纹理特征补充进待修复特征中,texture warp module利用可变形卷积很好的实现了这一目的。反观之前的相似工作,之前工作中单一分支decoder架构很难较好的融合低质特征和高质量特征,这导致了恢复性能不佳。</p><h2>实验</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPO" alt="image.png" title="image.png"></p><p>VQFR在CelebA-Test数据集和LFW数据集上均取得了领先的性能结果,值得关注的是其PSNR/SSIM指标并不十分出色,但是FID、NIQE、LMD指标非常不错,视觉效果也体现了该方法的优越性。</p><h3>真实度与保真度的平衡</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPP" alt="image.png" title="image.png"></p><p>可以看出VQFR取得了非常不错的真实度与保真度的平衡,实验效果很出色。</p><h2>总结</h2><p>本文提出的VQFR是一种性能非常不错的人脸盲修复方法,文章思路非常清晰,明确点出核心motivation和为解决的相关问题,最后的实验结果也非常精彩,很好的证明了方法的基本理论与出发点,更多细节建议大家参考原文。</p><blockquote>作者: owen      <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FxGhgltsOTeO6-2VILnJsLQ" target="blank">GiantPandaCV</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000386641">编译器优化那些事儿(4):归纳变量</a></li><li><a href="https://aijishu.com/a/1060000000386334">编译器优化那些事儿(3):Lazy Code Motion</a></li><li><a href="https://aijishu.com/a/1060000000386007">编译器优化那些事儿(2):常量传播</a></li></ul><blockquote>欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区<a href="https://aijishu.com/blog/qianrushikezhan">嵌入式客栈</a>专栏欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 03:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000386978</guid>
            <link>https://aijishu.com//a/1060000000386978</link>
        </item>
        <item>
            <title><![CDATA[【TVM 学习资料】TensorIR 快速入门]]></title>
            <description><![CDATA[<p>本篇文章译自英文文档  [Blitz Course to TensorIR<br>](<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2Ftutorial%2Ftensor_ir_blitz_course.html" target="blank">https://tvm.apache.org/docs/t...</a>) 作者是 Siyuan Feng。更多 TVM 中文文档可访问→<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.hyper.ai%2F" target="blank">TVM 中文站</a> </p><p>TensorIR 是深度学习领域的特定语言,主要有两个作用:</p><ul><li>在各种硬件后端转换和优化程序。</li><li>自动 <em>tensorized</em> 程序优化的抽象。</li></ul><pre><code class="bash">import tvm
from tvm.ir.module import IRModule
from tvm.script import tir as T
import numpy as np</code></pre><h1>IRModule</h1><p>IRModule 是 TVM 的核心数据结构,它包含深度学习程序,并且是 IR 转换和模型构建的基础。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/eab85e2bd22d4c2199a5245e93ab04a5.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>上图展示的是 IRModule 的生命周期,它可由 TVMScript 创建。转换 IRModule 的两种主要方法是 TensorIR 的 schedule 原语转换和 pass 转换。此外,也可直接对 IRModule 进行一系列转换。注意,可以在任何阶段将 IRModule 打印到 TVMScript。完成所有转换和优化后,可将 IRModule 构建为可运行模块,从而部署在目标设备上。</p><p>基于 TensorIR 和 IRModule 的设计,可创建一种新的编程方法:</p><ol><li>基于 Python-AST 语法,用 TVMScript 编写程序。</li><li>使用 Python API 转换和优化程序。</li><li>使用命令式转换 API 交互检查和提高性能。</li></ol><h1>创建 IRModule</h1><p>IRModule 是 TVM IR 的一种可往返语法,可通过编写 TVMScript 来创建。</p><p>与通过张量表达式创建计算表达式(使用张量表达式操作算子)不同,TensorIR 允许用户通过 TVMScript(一种嵌在 Python AST 中的语言)进行编程。新方法可以编写复杂的程序并进一步调度和优化。</p><p>下面是向量加法的示例:</p><pre><code class="bash">@tvm.script.ir_module
class MyModule:
    @T.prim_func
    def main(a: T.handle, b: T.handle):
        # 我们通过 T.handle 进行数据交换,类似于内存指针
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # 通过 handle 创建 Buffer
        A = T.match_buffer(a, (8,), dtype="float32")
        B = T.match_buffer(b, (8,), dtype="float32")
        for i in range(8):
            # block 是针对计算的抽象
            with T.block("B"):
                # 定义一个空间(可并行)block 迭代器,并且将它的值绑定成 i
                vi = T.axis.spatial(8, i)
                B[vi] = A[vi] + 1.0
ir_module = MyModule
print(type(ir_module))
print(ir_module.script())</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.ir.module.IRModule'&gt;
# from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i in T.serial(8):
            with T.block("B"):
                vi = T.axis.spatial(8, i)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><p>此外,我们还可以使用张量表达式 DSL 编写简单的运算符,并将它们转换为 IRModule。</p><pre><code class="bash">from tvm import te
A = te.placeholder((8,), dtype="float32", name="A")
B = te.compute((8,), lambda *i: A(*i) + 1.0, name="B")
func = te.create_prim_func([A, B])
ir_module_from_te = IRModule({"main": func})
print(ir_module_from_te.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i0 in T.serial(8):
            with T.block("B"):
                i0_1 = T.axis.spatial(8, i0)
                T.reads(A[i0_1])
                T.writes(B[i0_1])
                B[i0_1] = A[i0_1] + T.float32(1)</code></pre><h1>构建并运行 IRModule</h1><p>可将 IRModule 构建为特定 target 后端的可运行模块。</p><pre><code class="bash">mod = tvm.build(ir_module, target="llvm")  # CPU 后端的模块
print(type(mod))</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.driver.build_module.OperatorModule'&gt;</code></pre><p>准备输入数组和输出数组,然后运行模块:</p><pre><code class="bash">a = tvm.nd.array(np.arange(8).astype("float32"))
b = tvm.nd.array(np.zeros((8,)).astype("float32"))
mod(a, b)
print(a)
print(b)</code></pre><p>输出结果:</p><pre><code class="bash">[0. 1. 2. 3. 4. 5. 6. 7.]
[1. 2. 3. 4. 5. 6. 7. 8.]</code></pre><h1>转换 IRModule</h1><p>IRModule 是程序优化的核心数据结构,可通过 Schedule 进行转换。schedule 包含多个 primitive 方法来交互地转换程序。每个 primitive 都以特定方式对程序进行转换,从而优化性能。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f1d1c2925359488883e2cb5e0a43802f.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>上图是优化张量程序的典型工作流程。首先,用 TVMScript 或张量表达式创建一个初始 IRModule,然后在这个初始 IRModule 上创建 schedule。接下来,使用一系列调度原语来提高性能。最后,我们可以将其降低并构建成一个可运行模块。</p><p>上面只演示了一个简单的转换。首先,在输入 ir_module 上创建 schedule:</p><pre><code class="bash">sch = tvm.tir.Schedule(ir_module)
print(type(sch))</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.tir.schedule.schedule.Schedule'&gt;</code></pre><p>将嵌套循环展开成 3 个循环,并打印结果:</p><pre><code class="bash"># 通过名字获取 block
block_b = sch.get_block("B")
# 获取包围 block 的循环
(i,) = sch.get_loops(block_b)
# 展开嵌套循环
i_0, i_1, i_2 = sch.split(i, factors=[2, 2, 2])
print(sch.mod.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0, i_1, i_2 in T.grid(2, 2, 2):
            with T.block("B"):
                vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><p>还可对循环重新排序。例如,将循环 i_2 移到 i_1 之外:</p><pre><code class="bash">sch.reorder(i_0, i_2, i_1)
print(sch.mod.script())</code></pre><p>输出结果</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0, i_2, i_1 in T.grid(2, 2, 2):
            with T.block("B"):
                vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><h1>转换为 GPU 程序</h1><p>要在 GPU 上部署模型必须进行线程绑定。幸运的是,也可以用原语来增量转换。</p><pre><code class="bash">sch.bind(i_0, "blockIdx.x")
sch.bind(i_2, "threadIdx.x")
print(sch.mod.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0 in T.thread_binding(2, thread="blockIdx.x"):
            for i_2 in T.thread_binding(2, thread="threadIdx.x"):
                for i_1 in T.serial(2):
                    with T.block("B"):
                        vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                        T.reads(A[vi])
                        T.writes(B[vi])
                        B[vi] = A[vi] + T.float32(1)</code></pre><p>绑定线程后,用 cuda 后端来构建 IRModule:</p><pre><code class="bash">ctx = tvm.cuda(0)
cuda_mod = tvm.build(sch.mod, target="cuda")
cuda_a = tvm.nd.array(np.arange(8).astype("float32"), ctx)
cuda_b = tvm.nd.array(np.zeros((8,)).astype("float32"), ctx)
cuda_mod(cuda_a, cuda_b)
print(cuda_a)
print(cuda_b)</code></pre><p>输出结果:</p><pre><code class="bash">[0. 1. 2. 3. 4. 5. 6. 7.]
[1. 2. 3. 4. 5. 6. 7. 8.]</code></pre><p><a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2F_downloads%2Feac4389b114db015e95cb3cdf8b86b83%2Fauto_scheduler_matmul_x86.py" target="blank">下载 Python 源代码</a><br><a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2F_downloads%2F246d4b8509474fd9046e69f6cc9b7f87%2Fauto_scheduler_matmul_x86.ipynb" target="blank">下载 Jupyter Notebook</a></p><p>以上就是该文档的全部内容,查看更多 TVM 中文文档,请访问→<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.hyper.ai%2F" target="blank">TVM 中文站</a></p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 03:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000386987</guid>
            <link>https://aijishu.com//a/1060000000386987</link>
        </item>
        <item>
            <title><![CDATA[推荐系统[八]算法实践总结V0:腾讯音乐全民K歌推荐系统架构及粗排设计]]></title>
            <description><![CDATA[<h1>1.前言:召回排序流程策略算法简介</h1><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/44083e4c130841f894e36366a71f8d96.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>推荐可分为以下四个流程,分别是召回、粗排、精排以及重排:</p><ol><li>召回是源头,在某种意义上决定着整个推荐的天花板;</li><li>粗排是初筛,一般不会上复杂模型;</li><li>精排是整个推荐环节的重中之重,在特征和模型上都会做的比较复杂;</li><li>重排,一般是做打散或满足业务运营的特定强插需求,同样不会使用复杂模型;</li></ol><ul><li><p><strong>召回层</strong>:召回解决的是从海量候选item中召回千级别的item问题</p><ul><li>统计类,热度,LBS;</li><li>协同过滤类,UserCF、ItemCF;</li><li>U2T2I,如基于user tag召回;</li><li>I2I类,如Embedding(Word2Vec、FastText),GraphEmbedding(Node2Vec、DeepWalk、EGES);</li><li>U2I类,如DSSM、YouTube DNN、Sentence Bert;</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/b935ff75e3e84d7f88de39613bb02bad.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p></li><li><strong>模型类</strong>:模型类的模式是将用户和item分别映射到一个向量空间,然后用向量召回,这类有itemcf,usercf,embedding(word2vec),Graph embedding(node2vec等),DNN(如DSSM双塔召回,YouTubeDNN等),RNN(预测下一个点击的item得到用户emb和item emb);向量检索可以用Annoy(基于LSH),Faiss(基于矢量量化)。此外还见过用逻辑回归搞个预估模型,把权重大的交叉特征拿出来构建索引做召回</li><li><p><strong>排序策略</strong>,learning to rank 流程三大模式(pointwise、pairwise、listwise),主要是特征工程和CTR模型预估;</p><ul><li><p><strong>粗排层</strong>:本质上跟精排类似,只是特征和模型复杂度上会精简,此外也有将精排模型通过蒸馏得到简化版模型来做粗排</p><ul><li>常见的特征挖掘(user、item、context,以及相互交叉);</li></ul></li><li><p><strong>精排层</strong>:精排解决的是从千级别item到几十这个级别的问题</p><ul><li><strong>CTR预估</strong>:lr,gbdt,fm及其变种(fm是一个工程团队不太强又对算法精度有一定要求时比较好的选择),widedeep,deepfm,NCF各种交叉,DIN,BERT,RNN</li><li><strong>多目标</strong>:MOE,MMOE,MTL(多任务学习)</li><li><strong>打分公式融合</strong>: 随机搜索,CEM(性价比比较高的方法),在线贝叶斯优化(高斯过程),带模型CEM,强化学习等</li></ul></li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c764dfd7b65048f3a2ab2b97214135a3.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p></li><li><strong>重排层</strong>:重排层解决的是展示列表总体最优,模型有 MMR,DPP,RNN系列(参考阿里的globalrerank系列)</li><li><p><strong>展示层</strong>:</p><ul><li><strong>推荐理由</strong>:统计规则、行为规则、抽取式(一般从评论和内容中抽取)、生成式;排序可以用汤普森采样(简单有效),融合到精排模型排等等</li><li><strong>首图优选</strong>:CNN抽特征,汤普森采样</li></ul></li><li><strong>探索与利用</strong>:随机策略(简单有效),汤普森采样,bandit,强化学习(Q-Learning、DQN)等</li><li><strong>产品层</strong>:交互式推荐、分tab、多种类型物料融合</li></ul><h1>2.业务背景</h1><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/979ec768bf184537b6cdf2a4696229c5.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>全民K歌涉及多样化的推荐场景,涵盖内容、直播、歌房、用户等多种形态。</p><p>具体的推荐功能如上图所示,主要包括以下几类:</p><p>① 基于内容的推荐,包括优质UGC推荐、关注流推荐、同城社交推荐等功能模块。</p><ul><li>优质UGC推荐,将平台原生原创的优质音视频内容进行推荐</li><li>关注流推荐,对关注的内容进行混排</li><li>同城社交推荐,基于同城的社交进行推荐</li></ul><p>② 除了内容推荐外,我们也会负责一些其他类型的推荐,包括直播推荐、点歌推荐、歌房推荐和点评推荐,都是在K歌生态下独有的推荐。</p><h1>3.推荐系统架构及挑战</h1><p>推荐系统主要分为四个部分,包括召回层、粗排层、精排层及重排层。</p><h2>3.1召回层</h2><p>召回层的作用主要是从海量的item中筛选小量级的用户可能感兴趣的内容。在这个模块中最重要、大家了解最多的肯定就是召回模块本身。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/28d6ce28d0ad475ca1526f0714be96e9.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>一般来说,我们线上的召回方法会分为索引类的召回、泛社交的召回以及模型的召回。</p><ul><li>索引类的召回:主要根据画像的结果做精准的ID类召回,比如对用户感兴趣的歌曲进行召回,以及用户感兴趣的创作者进行召回。</li><li>泛社交的召回:主要基于用户在站内丰富的社交关系,比如用户可能会关注一些其他的用户,也可能加入一些家族,我们会根据这些社团的发现结果做泛化召回。</li><li>模型的召回:基于模型的召回的方法比较多,在后面会展开介绍。</li></ul><p>除了召回模块之外,我们在召回层认为另外一个比较重要的是内容的比例筛选,因为我们整体的内容发表量比较大,每天可能有500万的作品在平台内发表,如何从中筛选出合适的内容,需要基于音视频的理解,以及基于我们自己的流量策略来综合发现。</p><h2>3.2 粗排层</h2><p>粗排层到精排层相当于是一个承上启下的作用,它会把我们召回到的一些万量级的作品进一步筛选到千量级,既要考虑打分的性能问题,又要考虑排序粗排精准度的问题。一般来说,粗排模型会用一些模型蒸馏的方法,包括<strong>特征蒸馏或者基于模型本身的结构蒸馏</strong>,以及把这些不同的蒸馏方法组合起来等等。在粗排层,除了做粗排的打分外,我们还会重点做生态的控制,特别在一些内容推荐场景或者直播推荐场景中,我们会注重这里面的内容生态,包括时效性,内容的调性,多样性等等。</p><h2>3.3 精排层</h2><p>粗排层之后就来到了精排层,精排层主要根据千量级的作品进一步的进行精排打分来筛选到百量级的作品。在精排层,我们主要注意以下几方面:</p><ul><li>一个就是精排模型本身,我们早期也采用了类似LR的线性模型和LightGBM这样的树模型,之后随着深度模型的技术发展,我们所有的场景都切换到了深度模型,并且随着深度网络的设计复杂度,以及样本规模的逐步增加,让早期基于TF训练的一些深度模型引擎,在训练的速度以及对模型大小规模的限制,已经对我们产生了影响。所以我们现在已经过渡到基于参数服务器框架下,训练深度模型。</li><li>在精排前,除了模型怎么训练构造外,另外两个比较重要的是特征和样本的构造,以及在这个场景下的多目标设计。特别是多目标的问题,可能还涉及到具体的网络结构如何做,以及最后的结果如何融合。</li></ul><ol start="4"><li>重排层</li></ol><p>从精排层排序出百量级的作品后,就会进入到重排层。重排层会基于业务规则进行进一步的干预,比如同一首歌曲的视频不能连续出现,同一个创作者的视频不能连续出现等等。除了基于规则性的限制外,我们也会考虑使用模型化的方法做多样性的打散,并且在第4部分,我们也会具体介绍DPP算法的原理和思想。除了模型方法之外,我们也在考虑通过list wise的方法做内容的重排。</p><h1>4.粗排模块算法设计</h1><h2>4.1 粗排模块定位和方案路线</h2><p>粗排模型和精排模型不同,<strong>它可能既需要解决模型预测的准确性,又需要解决模型预测的效率</strong>。接下来,为大家介绍我们整个推荐系统如何在线上真实运转。</p><p>粗排模块主要包含两部分:</p><ul><li>第一部分是粗排的排序部分,这一部分主要就是为了解决一个大规模item的预排序问题。</li><li>第二个部分是多样性控制部分,作为一个UGC平台,我们需要考量内容在整个内容生态中的分发状况,以及均衡的考量生产者跟消费者之间的关系。我们是通过多样性调节算法来间接实现这个目的的。</li></ul><p>让我们再回顾下前面所提到的整个召回系统架构,我们可以看到它其实是一个典型的节点架构,从内容发现到召回,到粗排到精排,然后重排,最后把合适的内容推荐给用户。由于我们是一个比较大的UGC生产平台,从一个UGC平台的角度来考虑,我们倾向于分发较为新的作品,因为新的作品的分发会为那些活跃的创作者带来一定的流量激励,使得生产端跟消费端产生联动,促进了一种正向的循环。<br><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/a482dc35c51b4eb888e3ee59e8754550.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>我们以三个月内的站内发布作品为例,三个月内的站内发布作品大概会到十的九次方量级,然后我们通过一些内容挖掘跟优质内容发现的方式,从中找到更为优质的一部分内容,这部分内容仍然有十的七次方量级,相当于从百万量级的作品库做兴趣的召回。这是一个非常大的候选集场景,从优质内容的发现到召回,是整个UGC平台和推荐系统的连接,背后承载着我们对整个UGC的分发、内容生态的理解。这一部分我们会在第三个环节去做进一步详细的介绍。召回可以看到有十的七次方的候选集召回,通常完成召回过程之后仍然有十的五次方候选集,而精排通常只能去处理一个千级别的规模,所以我们看到这中间存在一个比较大的漏斗,很多时候会成为我们在效果或者一些收益上的瓶颈。这时,粗排模块的重要性就体现出来了。粗排模块的一个重要的作用就是防止召回到精排之间的漏斗过大,导致过多的信息损失。</p><p>大家可能比较了解的是,召回跟精排召回更像是一个集合,选择的过程更侧重于选择效率最高的方法,至于topk中item之间的先后顺序,其实不是最关心的因素;而精排环节相对来说它更强调次序,也就是说item A跟item B的先后顺序是非常敏感和关键的。</p><p>粗排夹在召回跟精排之间,它的定位是什么?相比于召回,粗排更强调排序性,也就是更强调topk内部的排序关系;相对于精排,粗排更强调性能,因为精排通常有非常复杂的网络结构,非常大的参数量,这也意味着它在实际应用的过程中比较难去处理一个较大规模量级的候选集的打分,这时粗排就必须要解决这个问题,所以它在性能上会相较于精排有更多的要求。现在主流的粗排方案有两条路线,这两条路线是基于两个出发点来思考的:</p><ul><li>第一条路线是把粗排当成是召回的一种延伸,它的技术选型会像是一种集合,<strong>选择的方案和目标是选出效率最高的子集</strong>。常用的方式,简单的可以通过实时的serving或者一些实时的指标对召回排序的结果做一个选择。总体来说,这条技术路线最大的优点是算力消耗非常小、性能非常好,但是它的缺点是本身的表达能力是有限的,可以明显预估到它的天花板。</li><li>第二条路线是从精排的角度,把粗排当成是精排的迁移或压缩,也就是说这是一条排序的路线,<strong>它的建模目标是预估值</strong>。这种方法的好处是它的表达能力很强,因为通常会用到一些比较复杂的网络结构,而且它跟精排的联动性是更好的,可以让粗排跟精排的目标保持某种程度上的一致性。同时,它的缺点也凸显出来了,就是我们用到了复杂的方法,算力的消耗一定也会相应的提升。因此,<strong>需要着重解决的是如何在有限的算力下尽可能地突破表达能力上限</strong>。在这种路线下,我们通常会在架构选择上选择双塔结构模型。</li></ul><h2>4.2 粗排双塔模型实践</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f5af219903eb4f7ba4be13edd86ecbaa.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><blockquote>我们通过把user和item的feature进行结构解耦与分开建模,然后完成整个架构的设计,在模型训练完毕之后,我们会通过user serving实时的产出user embedding,再通过索引服务把该用户所有的候选集合的ID给取出来,最后在userembedding跟item embedding之间做內积的运算,得到一个粗排的预估值,作为整个粗排阶段的排序依据。</blockquote><p><strong>这么做的优势是user/item 结构是解耦的,内积计算的算力消耗小。</strong></p><p>同时,它的缺点也非常的明显:</p><ul><li>第一个是它在特征表达上是缺失的,因为user跟item解耦之后,很难使用一些交叉特征,一旦用了交叉特征,有多少item就得进行多少次预估,这违背了我们使用双塔模型的初衷。</li><li>第二个是它在结构上也是有缺陷的,我们回忆一下上面这幅框架图,可以看到user跟item的交互非常少,这会限制它的表达能力的上限。</li></ul><p>如果我们选择了这种技术方案,我们可以保障它的性能,但是我们需要进一步的考虑如何避免这种简易的结构所带来的效果上的损失。在这种情况下,我们通常会使用一些模型蒸馏的方式。</p><p>模型蒸馏有两个关键词,第一个是它本质上是一种迁移学习,也就是transfer learning,第二个是transfer的方式是通过所谓的label,区别于我们平时理解的样本label离散值,变为了0到1之间的一个连续值。常见的蒸馏模型架构,会有涉及到两个模型,第一个模型叫做教师模型,叫做teacher,第二个模型是学生模型,叫做student。这两个模型的总体思路是teacher模型是一个非常大、非常复杂、学习到的东西非常多的模型,teacher模型会把学习到的知识传导给student模型,受限于某些原因,该模型没有办法做得很复杂,或者它的规模必须限制在一定范围内的子模型。</p><p>具体流程如下:</p><ol><li>准备训练样本,对teacher模型预训练,即得到了teacher模型;</li><li>把teacher模型最后一层或倒数第二层的输出结果,作为传递给student模型的信息,这部分通常是logits或softmax的形式,也叫做soft labels;</li><li>把soft labels传导到student模型,作为模型loss的一部分,因为student模型除了要拟合teacher模型传递的信息,也要去拟合样本真实的分布。</li></ol><p><strong>针对上述流程里涉及到了几个概念,有如下的进一步解释:</strong></p><ul><li><strong>关于logits</strong>:<strong>它是teacher模型层层映射后的一个抽象度很高且信息浓度很大的结果,是整个知识传递的媒介</strong>。在logits后,<strong>通常会接一个softmax,但是softmax会放大logits的两极差异,造成细节损失,而这些细节恰恰是帮助student模型更好学习的关键</strong>。为了克服以上问题,我们选用了改进的softmax,即softmax with temperature</li></ul><p>$q_i=\frac{\exp \left(z_i / T\right)}{\sum_j \exp \left(z_j / T\right)}$</p><p>这里,引入一个超参数T控制整个softmax分布的陡峭或平滑程度,间接控制蒸馏的强度。通常,T要设置成多少没有一个定论,与实际场景相关,依赖相应场景下的一些实验设计。</p><ul><li>关<strong>于loss</strong>:预训练好teacher模型后,转而关注student模型,它的最小化loss由两部分构成,<strong>一部分是尽可能拟合teacher模型的输出结果,另一部分是尽可能拟合真实样本</strong>。<strong>由于student模型的表达能力有限</strong>,直接用student模型拟合真实样本可能学不好或者学偏;<strong>teacher模型传递过来的信息对student模型做了约束和纠正,指导student模型的优化方向,进而加强了student模型的学习能力。</strong></li></ul><p><strong>整个模型蒸馏的收益表现如下:</strong></p><p>引入<strong>soft labels</strong>的概念,不再是原本的非零即一状况,<strong>需要考虑正样本有多正和负样本有多负</strong>。这看起来<em>类似把分类问题转换成回归问题,但实质并不是。如果构建样本时,用回归的方式构建,通常会基于作品的完播率或规则组合等,人工敲定样本的回归值,这种方式过于主观,没有一个非常合理或可矫正的指标进行后续比对</em>;<strong>而模型蒸馏的soft labels是基于teacher 模型,即由teacher 模型对真实样本进行充分训练后给出,包含更多的隐含信息且不受人为主观因素影响。</strong></p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/795f0ad3a0eb44a2b570e9dfa4910fd0.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>具体的,来看看我们如何做粗排模块的蒸馏,主要是分为两个大的方向:</p><ul><li><strong>模型蒸馏</strong>,主要适用于模型不同但特征相同的情况,比如,包含多个场景的框架里,某些场景对性能有要求;由于有一些额外的外部限制,使某场景无法用很复杂参数量非常大的模型,可以用一个子模型使用全部特征。此时,模型蒸馏主要是弥补子模型缺少复杂结构或交互结构导致的部分收益损失,本质上是一种模型压缩方案。</li><li><strong>特征蒸馏</strong>,主要适用于模型相同但特征不同的情况,比如,在某些场景,无法使用全量特征 ( 如交叉特征 ) 或部分特征必须是剪裁过的,即特征没被完全利用,存在一部分损失。这时,通过一个更大的teacher模型学习全量特征,再把学到的知识迁移到子模型,即弥补了上述的部分特征损失。</li></ul><p>基于以上描述可知,粗排模块可以通过蒸馏的方式,补足双塔模型在结构和特征上的缺陷。接下来的问题就是如何找到一个合适的teacher模型?精排模型通常是一个被充分训练的、参数量很大、表达能力很强的模型,如果通过蒸馏精排模型获取粗排模型,那么目标的一致性和学习能力的上限都符合我们预期的。</p><ul><li>teacher模型是精排模型,该模型使用全量的特征,包括三大类,即user侧特征、item侧特征及它们的交叉特征;曲线框里是一些复杂的拓扑结构;最后的softmax with temperature就是整个精排模型的输出内容,后续会给到粗排模型进行蒸馏。</li><li>中间的粗排模型,user tower只用user features,item tower只用item features,即整体上看,模型未使用交叉特征。在user tower和item tower交互后,加上精排模型传递过来的logits信息,共同的构成了粗排模型的优化目标。整个粗排模型的优化目标,同时对真实样本和teacher信息进行了拟合。</li><li><p>右侧展示的是训练完粗排模型后,在线上产出user serving,通过user serving产出user embedding,再与item embedding做内积运算,完成整个排序的过程。上述流程即实现了粗排和精排的联动过程,并且训练完粗排模型就可以进行一个非常高效的serving,进行粗排排序。</p><h2>4.3. 线上的粗排双塔模型</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/650b567c1a6e4efc95b4a7179cc99d40.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>实践中,粗排模型训练时,依赖的精排输出结果来自上报精排日志。如果在离线重新对样本进行预估再输出,其实是对线下资源的浪费,所以通常在线上精排预估时,就把一些结果作为日志进行上报。粗排模型异步训练,产出模型提供给Serving。</p></li></ul><p>Serving环节主要包括异步Serving和User Serving两部分,具体功能如下:</p><ul><li><strong>异步Serving</strong>,主要通过刷库Item Serving捕获所有的item embedding,以异步的方式反复刷库。大家经常会问的一个问题:如果模型更新了,item embedding有的是新的,有的是旧的,版本不一致怎么办?如果更新周期比较短,item embedding的分布不会发生较明显的偏移,即相邻版本比较接近,这间接保障了一致性,不需要版本是强一致性的,只要更新周期比较短就可以。</li><li><strong>User Serving</strong>,当用户请求推荐引擎后,获取该用户的user features,然后请求User Serving产出user embedding;同时,会拿到该用户的所有召回item集合,基于刷库结果产出的索引服务,取到所有的item embedding。由此可见,User Serving的最大优势是可以做实时计算且只需计算一次,效率非常高。并且,双塔粗排Serving阶段是做内积运算,这种高效的计算方式也使它更适合大规模的预排序场景。</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/74ad5786e33b4e38986c4697b77a5503.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>整个粗排模块上线后,我们关注的两类指标:互动类指标和播放类指标,都有非常明显的正向提升,具体的指标提升幅度可以参考上图的在线实验结果。</p><p>一般,粗排模块的表现和实际场景有较大的相关性:在候选集非常大的推荐场景下,粗排到精排间的漏斗有好几个量级,这时粗排模块会带来非常显著的收益;在候选集比较小的推荐场景下,从召回到精排间的漏斗不是很大,这时粗排的收益可能就比较有限。</p><h2>4.4 进一步优化</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/757af659b60344ea83de0fce27ee6a9a.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><ol><li>首先,上述粗排蒸馏过程本质上是pointwise,但通过上报精排日志可以拿到精排模型给出的完整再推荐列表,用pairwise学习精排排出来的序,可以进一步逼近精排结果,能更多的提取精排传递出的信息。</li><li>其次,前面虽然不断地用teacher模型和student模型描述整个过程,但实际效果上student模型不一定低于teacher模型。换一个角度,student模型其实是基于teacher模型做进一步训练,所以student模型的表征能力有可能超过teacher模型。事实上,如何让student模型通过反复的蒸馏,效果超过teacher模型,在模型蒸馏领域也有许多相关方法。</li><li>最后,粗排到底是召回的延伸,还是精排的压缩跟前置?虽然召回和精排都是一个检索的过程,但二者实际侧重点还有一些不同,比如,召回在多样性上有更多的考量,精排更强调排序次序的精准性,而粗排处于这两个环节之间,如何利用粗排模块更好地平衡召回和精排?通常而言,会考虑设计多样性调节算法解决这一问题。</li></ol><h1>5.多样性调节算法设计</h1><h2>5.1 推荐多样性的意义</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/1aa9fd0dfc36482e80aae6c92ab2e5a8.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>样性的概念在推荐系统里常被提到,在不同视角下,推荐多样性对应着不同的问题。</p><ul><li>在系统角度下,<strong>多样性是一种popularity bias,即流行度的偏置</strong>。流量在UGC作品上的分布,体现了系统层面的多样性:一个多样性弱的系统,更像是中心化分发的,只分发非常头部、非常类似的一部分作品;而一个多样性强的系统,则是一个去中心化分发的,<strong>会更多地兼顾中长尾内容流量的供给</strong>。实际上,在推荐系统中普遍会遇到如下问题:如果没有对推荐系统做额外的干预和纠偏,不可避免地会使推荐系统往多样性弱的方向发展。从数据层面解释,有丰富数据的那部分内容会在推荐过程被反复加强,使整个推荐循环链路越缩越小,<strong>马太效应越来越严重</strong>。对于一个ugc平台,需要考量生产者或创作者的利益,而这种聚集在部分创作者身上的马太效应是我们不愿意看到的。</li><li>在用户角度下,<strong>多样性就是Explore&amp;Exploit问题</strong>,对用户做兴趣的探索与聚焦。如果多样性弱,推荐的item同质化严重,都很像,那么推荐系统可能没办法发现用户的真实兴趣,因为系统可能都没给用户推荐过这类item;如果多样性强,那么用户的推荐流里的内容会很不一样,坏处可能是用户在持续消费过程的兴趣聚焦程度不同,比如用户看了五个item,明明对其中某一两个item更感兴趣,但和这一两个item相似的item的后续推送密度却跟不上,这对用户体验是有损的。如果不做额外的优化,用户角度的多样性会越来越小,因为通常选用的pointwise模型会导致同质化的现象,比如说用户喜欢的item是乐器类的,则pointwise在每一个单点上的预估都觉得乐器是最好的,最后可能连续给用户推了5个乐器,在单点上收益最高不代表用户对整个推荐结果 ( 5~10个item ) 的满意度是最高的,所以这里也需要做多样性控制,提升用户的满意度。</li></ul><h2>5.2 多样性控制的方案路线</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/6dca1c96e53d4bc384d56d050af2681d.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在具体实现上,多样性有三个主流的技术方案:<strong>规则打散、embedding打散和DPP</strong>,下面会详细介绍:</p><ul><li>基于规则打散,比如从item里抽象出发布作者、标签、伴奏等特征,基于这些特征去做一个session内的频控。这种方法的好处是易实现,缺点也非常明显,该方案本质上是进行枚举加排列组合,扩展性非常差,永远没办法枚举所有可能的情况,枚举出来的情况不一定能真实表征两个item间的相似或差异程度有多大。</li><li>基于embedding打散,一个连续值的方案。好处是它可以基于embedding对候选集做离散性的评估,相当于此时可以用向量化的方式表达item。缺点在于它虽然可以衡量离散性或多样性,但难以衡量相关性,从而无法实现联合的收益评估。事实上,多样性只是我们的一个目标,相关性也很重要,如果推了很多不同的东西,但和用户不怎么相关,可能会适得其反。</li><li>DPP概率模型,本质上是一种集合选择技术,选择出一个子集使得多样性和相关性联合建模的收益最大。直观理解,先基于多样性和相关性构建一个矩阵,该矩阵行列式的物理含义是矩阵中各向量张成的平行多面体体积的平方,这样就把问题转换成了一种可度量的方式:要想同时最大化多样性和相关性,只需要最大化平行多面体的体积。</li></ul><h2>5.3 DPP 技术细节</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/ca152d8173ad469fb201400664ab3ab3.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>DPP算法的具体实现比较复杂,这里主要介绍两个关键点:</p><p>①基于多样性和相关性构建矩阵L,该矩阵的行列式等价于最终要度量的目标。如何去定义相关性和多样性?</p><ul><li>多样性(diversity)是指两个item相似不相似,如果很相似就不多样。利用两个item各自的item embedding计算内积,即表示两个item的相似度。</li><li>相关性(relativity)是一个候选item与当前用户的匹配程度。在不同环节的实现有差异:在粗排层的DPP,一般是基于user embedding和item embedding计算内积。在精排层的DPP,需要精排的CTR或CVR预估结果,因为这些预估结果反映了当前用户对候选item的喜爱程度。</li></ul><p>基于上述定义的相关性和多样性就可以构建矩阵L:用户与itemi的相关性 ( 偏好程度 )、用户与itemj的相关性 ( 偏好程度 )、itemi与itemj的多样性三者乘积。通过最大化矩阵L,就可以实现相关性和多样性的联合度量。</p><p>②如何优化求矩阵L行列式的复杂度,该行列式的原始计算复杂度是三阶,线上难以支撑这样的运算性能消耗,可以通过贪婪算法把计算复杂度进一步降低至一阶。</p><ul><li>先进行矩阵分解,基于分解的结果将计算复杂度降低到二阶。</li><li>用增量的方式更新参数,绕过求解线性方程组的部分,将复杂度进一步降低到一阶。</li></ul><p>由此,行列式的求解过程由三阶降低到一阶,满足了线上的性能,上图最下方给出的paper就是相关方向的论述。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/343326d38df34378ae0a9b33fd5f3034.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在线上做多样性的相关实验,我们较关注的系统和数据两部分,都有明显收益:</p><ul><li>系统收益,作为一个ugc平台,会考量推荐系统分发覆盖了多少创作者、覆盖了多少作品以及内容的时效性,从上图右侧三条曲线可见,在加入多样性的控制后,三个指标都有稳步的提升。</li><li>数据收益,有关播放时长、关注渗透、点赞渗透相关的指标都有1~2个点的提升,这也体现了多样性是有必要的,因为它相当于对pointwise进行了简单的listwise化,形象化阐述就是,用户浏览多个session时,多样性调节避免了同质化内容扎堆。</li></ul><h2>5.4  DPP优化</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/6fbb98a7f2a2477d84c1dade671e47f9.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>针对上述基于多样性和相关性构建矩阵L的过程,有两方面可以做进一步优化:</p><ul><li>多样性本质上是定义什么样的item是相似的,用相似矩阵刻画这种相似关系。在我们K歌平台,会做一些内容的混排,比如音频跟视频的混排,如果在原始的item embedding构建出来的item similarity matrix基础上,加入一些预设的先验信息,判断什么样的item是更相似的,比如音频跟音频间更相似,视频跟视频间更相似,那么它最后的度量目标就加入了对作品类型的考量,这就间接实现了内容的混排。</li><li>相关性本质上是定义什么样的item更匹配当前用户,之前都是从消费者的角度去考量用户更喜欢什么样的item,而我们作为一个ugc平台,很多时候也要考量什么样的item更适合被分发,比如某item是不是更有平台的画风,更符合我们对内容分发的理解,这时,就是从平台系统或者生产者的角度去理解什么样的item更应该被优先推荐。如果已知一部分item更需要被优先推荐,在构建用户跟item间的相关性分时,可以对relativity score加调节权重进行干预,实现流量分配。比如,如果要使乐器类item比其他item有更高的权重,这时,可以调高乐器类item和用户的匹配权重。</li></ul><p>综上可知,DPP不只是一个多样性或相关性的度量,它本身是一种调控方式,具体调控的量和业务场景相关,具有非常大的挖掘空间。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 02:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000386964</guid>
            <link>https://aijishu.com//a/1060000000386964</link>
        </item>
        <item>
            <title><![CDATA[反其道而行,大学教授鼓励学生用 ChatGPT 写论文]]></title>
            <description><![CDATA[<p>新 AI 工具 ChatGPT 的到来,正在教育圈呈现出冰火两重天的态势,教授们几家欢喜几家愁。</p><p>这不近日,来自宾夕法尼亚大学沃顿商学院的一位专门研究创业与创新的资深教授 Ethan Mollick 发表了一篇长文呼吁,让学生拥抱 ChatGPT,也可以使用 ChatGPT 写论文,因为只有这样,才能让学生们经过事实核查从而能够很快理解 AI 的准确性和偏见问题。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPr" alt="1.png" title="1.png"></p><h2>反其道而行:使用 ChatGPT,大学生快上车!</h2><p>作为大学教授,这一不走寻常路的举措,引发了不少人的关注。</p><p>毕竟此前据调查显示,美国 89% 的大学生在用 ChatGPT 做作业。当时的这个结果让很多教育界的高校老师都感到头疼,来自弗曼大学哲学助理教授 Darren Hick 也曾发文斥责,「ChatGPT 都成学生的作弊神器了,这让我感到极度恐惧。」</p><p>为了让学生能够潜下心踏踏实实地学习,国内外多所学校发布相应应对措施,如美国纽约市教育部宣布,纽约市的学生和教师,无法再在教育部设备或互联网上访问 ChatGPT;斯坦福研究人员推出了 DetectGPT,便于检测出 AI 生成文本;香港大学向师生发出内部邮件,明确禁止在港大所有课堂、作业和评估中使用 ChatGPT 或其他 AI 工具......</p><p>可以说,ChatGPT 诞生的近三个月间,尤其是老师群体反对的声音颇为强烈。Ethan Mollick 如今的做法,似乎在反其道而行。</p><p>不过,在 Ethan Mollick 教授看来,倘若一味地禁止,只会适得其反。当然,也不能完全地放任学生使用 AI 工具而不顾,得有教学策略。</p><p>他表示,过去一学期已经在课堂上完全接受 AI 的存在,也会要求学生以多种方式使用 AI 工具。通过实践,Ethan Mollick 给出直观的总结:太好用了!而且我还已经学到了一些我认为值得传承的早期课程。效果非常成功,但也有一些教训要吸取。</p><h2>学术中使用 ChatGPT 的前提条件</h2><p>首先,在大的背景上,Ethan Mollick 教授要求在三个独立的面向本科和硕士级别的创业和创新课程中以稍微不同的方式使用 AI。具体模式如下:</p><ol><li>第一门课程整体建立在广泛使用人工智能的基础上。其要求学生使用人工智能来帮助他们产生想法、制作书面材料、帮助创建应用程序、生成图像等等。</li><li>第二门课程中的作业要求学生使用 AI。</li><li>第三门课程中,Ethan Mollick 向学生介绍了 AI 工具并提出了使用建议,但没有具体的 AI 作业。<br>在三种不同的课程中,Ethan Mollick 使用了相同的 AI 政策:</li></ol><p>我希望你在这门课上使用 AI(至少是 ChatGPT 和图像生成工具)。学习使用人工智能是一项新兴的技能,我在 Canvas 中提供关于如何使用它们的教程。我很乐意在办公时间或课后与学生见面并帮助他们使用这些工具。</p><p>请注意使用 ChatGPT 的限制:</p><ul><li>如果你提供最少的描述提示,你会得到低质量的结果。你需要改进你的提示,以获得良好的结果。这一点非常有用。</li><li>不要相信它说的任何东西。如果它给你一个数字或事实,除非你知道答案或可以通过其他来源查询验证,否则就一定要认为它是错误的。你将对该工具提供的任何错误或遗漏负责。它对你理解的主题效果最好。</li><li>Al 是一个工具,但你需要承认它的使用。请在任何使用人工智能工具的作业的结尾处附上一段话,解释你使用人工智能的目的以及你使用什么提示来获得结果。如果不这样做,就违反了学术诚信政策。</li><li>这个工具在用的时候要深思熟虑。如果它不适合相关的案例或情况,就不要使用它。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPs" alt="2.png" title="2.png"></li></ul><h2>没有培训,每个人都用错了 AI</h2><p>Ethan Mollick 表示,“我一直听到老师抱怨,说他们看到很多写得不好的人工智能文章,尽管 ChatGPT 其实能够写得相当好。我想我知道为什么,几乎每个人在使用人工智能方面的最初尝试都很糟糕。”</p><p>因此,他为了找到原因,在布置的一次作业中,要求学生用 ChatGPT "作弊"。学生们需要写一篇 5 段话的文章,题目与大家在课堂上学到的课程有关(如团队动力、选择领导者、行动后的回顾反思、沟通愿景,随大家自由选择)。前提条件是要让 AI 来写,同时这篇文章里面至少要插入 1 张应景的图片,且学生必须至少提供 5 个描述,而且他们必须在最后写一份关于人工智能如何做的反思稿件。</p><p>经过测试,Ethan Mollick 发现几乎每个学生提供的第一个描述提示都是非常直接了当的,他们往往会直接复制作业的要求,往 ChatGPT 的对话窗口粘贴,等待结果的自动生成,然后再将结果复制粘贴到新文本中,提交给老师审阅,由此出现了大多数老师疯狂吐槽各种论文的场景。</p><p>不过,在 Ethan Mollick 布置的作业中,其要求学生使用多个提示,这迫使学生不断思考如何提高 AI 产出内容的质量。在这一点上,学生们经过多轮的描述,往往会朝着下面三个方向走去:</p><p><strong>方法 1 :细微地变化,让 AI 完成作业</strong></p><ol><li>生成一篇关于选择领导者的 5 段话文章</li><li>生成一篇关于团队如何选择领导者的 5 段话文章</li><li>生成一篇关于团队如何选择领导者以及团队流程如何运作的 5 段话文章</li><li>生成一篇关于如何通过团队、团队流程和领导能力选择领导者的 5 段话文章</li><li>生成一篇关于如何通过团队、团队流程和领导能力选择领导者的 5 段话文章,250 字。</li></ol><p><strong>方法 2:增加一些限制和专业知识</strong></p><ol><li>生成一篇关于选择领导者的 5 段话文章</li><li>生成一篇关于选择领导者的 5 段话文章,内容包括:能说会道的能力、领导者地位影响和资历</li><li>生成一篇关于选择领导者的 5 段话文章,内容包括:能说会道的能力、领导者地位影响和资历。解释谁能说会道,谁就能成为领导者。</li><li>生成一篇关于选择领导者的 5 段话文章,内容包括:能说会道的能力、领导者地位影响和资历。解释谁能说会道,谁就能成为领导者。并举例说明。使用生动的语言,并从一个回国攻读 MBA 的管理顾问的角度出发。为 MBA 课程的教授写一篇关于团队战略和企业家精神的文章。</li><li>生成一篇关于选择领导者的 5 段话文章,内容包括:能说会道的能力、领导者地位影响和资历。解释谁能说会道,谁就能成为领导者。考虑每种能力的挑战和优势。举例说明。使用主动时态和讲故事的方式。使用生动的语言,并从一个回国攻读 MBA 的管理顾问的角度出发。为 MBA 课程的教授写一篇关于团队战略和企业家精神的文章。</li></ol><p><strong>方法 3:共同编辑</strong></p><ol><li>生成一篇关于选择领导者的 5 段话文章</li><li>那很好,但第三段不对。能说会道是指谁说得最多,谁就能成为领导者。纠正这一点,并增加更多关于如何使用这种能力的细节。在第 2 段中增加一个示例</li><li>第 2 段的示例不对,总统选举是每 4 年举行一次。让最后一段的语气更有趣。不要用 "总而言之 "这个短语</li><li>给我三个可以用在第 4 段中的示例,并确保它们具有更多的故事性和更生动的语言。不要使用仅以男性为特征的例子。</li><li>把这一段加回到故事中去,把第二段换成关于个人领导风格的一段。修正最后一段,使文字在以充满希望的感情上结束。</li></ol><p>毋庸置疑,第一种只有细微的修改,让 ChatGPT 生成的内容显得非常平庸,还很空洞。</p><p>第二种方法明显要好得多,但结果却不可控,因为学生要根据整个提示进行反复试验。这使得对一篇好文章进行微调变得很困难,使用这种方法的学生经常反馈称,他们觉得自己对 AI 的输出没有太多的控制权。</p><p>到目前为止,最好的方法便是第三种——采取“AI+人工”共同编辑的方法,这往往会带来一篇令人影响深刻的论文。不过,这种方法需要学生非常仔细地关注 AI 的输出,这也使得它对学生的学习非常有用。</p><p>因此,Ethan Mollick 建议,如果高校的老师们打算将 AI 引入进自己的课堂,那么第三种方式最为推荐。</p><h2>上至 CEO,下至程序员,ChatGPT 无处不在</h2><p>现如今,无论是否接受,AI 已经渗透到学术、产业、研究等领域。据《华尔街日报》最新报道,上至 CEO,下至程序员,从传统互联网公司 Google、微软、Netflix 再到石油和天然气生产商 Devon Energy,很多公司已经开始尝试使用生成式人工智能技术。</p><p>“它所服务的目的不是让你知道你不知道的事情。这真的是一个工具,让你能够更好地做你的工作”,人工智能研究初创公司 Hugging Face 的首席伦理科学家 Margaret Mitchell 说道。</p><p>对于学术界而言,学生本是一张空白纸,如果在新技术到来之际,与其想着如何避免学生去接触,Ethan Mollick 认为可以花更多的时间引导学生如何正确使用 AI 工具,譬如 ChatGPT 生成的内容质量与提示语有很大的相关性,很多学生在没有引导下使用,只会提供一个非常简单的描述,如上述方法 1 所示。因此,对 AI 工具的培训真的很重要,需要向学生展示提示语制作的基本知识。</p><p>最后,Ethan Mollick 对所有的老师呼吁,不要总是担心学生会被 ChatGPT 生成的虚假内容所吸引。事实上,如果遵循自己对自己论文中的事实负责原则,很多学生会进一步去进行查证,也有能力理解工具的局限性,对事实的查找学习会迫使学生进一步关注 AI 论文的细节,创造一些真正的可教时刻。</p><blockquote>参考链接:<br><a href="https://aijishu.com/link?target=https%3A%2F%2Foneusefulthing.substack.com%2Fp%2Fmy-class-required-ai-heres-what-ive" target="blank">https://oneusefulthing.substa...</a></blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 02:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000386961</guid>
            <link>https://aijishu.com//a/1060000000386961</link>
        </item>
        <item>
            <title><![CDATA[特斯拉重新捡回来的毫米波雷达,下一步脚落何处?-IOTE物联网展]]></title>
            <description><![CDATA[<p>一石激起千层浪。</p><p>最近,特斯拉又有大动作——搭载4D毫米波雷达的特斯拉要来了。</p><p>日前,Twitter博主Greetheonly曝光了特斯拉全新HW4.0硬件,指出该产品具备至少两个以太网接口。与此同时,近日特斯拉也向欧洲监管机构提交的车辆变更申请,证实最新自动驾驶硬件HW4.0即将量产上车。据悉,在即将到来的HW 4.0硬件系统中,特斯拉配置了一枚高精度4D毫米波雷达,且该车型可能率先在中国工厂生产。</p><p>曾经因“幽灵刹车”现象一直被人诟病,特斯拉一度抛弃了毫米波雷达,而且还提出“纯视觉方案”。如今,特斯拉又重新捡回毫米波雷达,引得“毫米波雷达”相关概念股在“狂飙”。</p><p>为何特斯拉重新拾回毫米波雷达?</p><p>毫米波雷达,是一种工作在毫米波频段(millimeter wave)的雷达传感器,可以精准探测目标的距离、速度、方位角和微动等信息。</p><p>毫米波雷达最早于1940年代开始研制,70年代中后期取得技术突破,90年代后期开始批量应用于车载领域,2000年后锗硅技术提高芯片集成度、降低成本,毫米波雷达迎来爆发式增长,2021年后技术较为成熟,成为主力传感器之一,未来将会向4D毫米波雷达路线发展。</p><p>4D毫米波雷达,又称4D成像毫米波雷达。所谓的4D,就是指在原有“距离、方位、速度”的基础上增加了对目标“高度”数据的解析,能够实现“3D+高度”四个维度的信息感知。</p><p>相比于普通毫米波雷达,4D毫米波雷达具有广视角、高精度、高分辨、能探测静物等优势;而且相较于激光雷达,它的成本也比较低。</p><p>了解特斯拉的都知道,特斯拉经常出现“幽灵刹车”等安全问题,而造成这种现象的重要原因是特斯拉曾配置的性能较差的ARS-4B毫米波雷达而促成的。对此,2021年特斯拉抛弃了毫米波雷达,并提出了“摄像头+算法”的纯视觉方案。</p><p>不过,现在的4D毫米波雷达比普通毫米波雷达的性能有了大大的提升,除了在原来距离、速度、方位等数据信息的基础上,4D毫米波雷达还增加了被测目标俯仰角的高度信息,并在速度分辨率等多方面均有提升,可通过高分辨率点云来感知汽车周围环境,增强了环境测绘和场景感知的能力,有效地弥补了传统毫米波雷达的性能短板。</p><p>德邦证券发布研究报告称,在L2+层级上,通过前置1颗4D毫米波雷达能够基本涵盖毫米波&amp;激光雷达的功能需求。因此,笔者认为,这极有可能也是特斯拉重新拾回毫米波雷达的重要原因。</p><p>“赛车手”过招</p><p>4D毫米波雷达或成主战场</p><p>得益于汽车产业的快速发展,尤其是汽车智能化、网联化的趋势越发显著,毫米波雷达市场需求十分旺盛。</p><p>作为ADAS的重要感知元器件,毫米波雷达并不仅仅只是一个硬件设备,它需要与车辆适配,才能较好地实现相应的功能。</p><p>在智能汽车L0~L2阶段,毫米波雷达主要应用于自动紧急制动、自适应巡航、前向碰撞预警、盲区监测、后向碰撞预警、倒车车侧预警、开门预警、自动泊车、变道辅助、乘客成员监测、驾驶员生命体征监测、手势识别等等。</p><p>根据GGAI、AIOT星图研究院整理统计,2022年1-6月中国市场(不含进出口)乘用车新车前装标配搭载前向毫米波雷达361.12万颗,同比增长12.55%;标配搭载角雷达(含后向)384.15万颗,同比增长37.89%。按照目前的新车搭载增速,预计2022年中国市场乘用车毫米波雷达搭载量将升至1800万颗左右。</p><p>现阶段,ADAS的市场渗透率还在不断攀升,尤其是伴随着自动驾驶等级的提升以及市场对自动驾驶能力需求的不断升级,市场对毫米波雷达的性能提出了更高的要求,而有着比普通毫米波雷达更高性能的4D毫米波雷达,成为了各车企的“眼中钉”,且4D毫米波雷达的渗透率也在逐渐增加。根据市场调研机构Yelo预测,2027年全球4D毫米波雷达市场将达到35亿美元。</p><p>当前,4D毫米波雷达这个赛道已经涌入诸多玩家,包括国外的Arbe、Waymo、大陆集团、采埃孚、安波福、博世、RADSee、Smart Radar等,以及国内的华为、华域汽车、森思泰克、安智杰、木牛科技、承泰科技、纳瓦电子、复睿智行、苏州毫米波、华域、楚航科技、威孚科技、几何伙伴等等。</p><p>此次特斯拉采用4D毫米波雷达的消息曝光后,更是带动了“4D毫米波雷达”概念股的涨停,预计将利好射频前端、信息处理系统以及后端算法。据盖世汽车研究院,射频部分占比约40%,其中MMIC(25%)、PCB(10%)、其他(5%),信息处理系统DSP占比10%,后端算法占比最高达50%。</p><p>综上所述,不难得出,在汽车智能化、网联化的催生下,毫米波雷达的成长速度会越来越快,其市场也会得到快速增长。</p><p>活力无限</p><p>毫米波雷达市场广阔</p><p>当然,不止于车端应用市场,毫米波雷达也常常被应用于交通、安防、工业、家居、康养等领域上。</p><p>在全球智能化变革浪潮之下,汽车、交通、安防、工业、家居、健康监护等诸多产业的蓬勃发展,创造了巨大的感知产品增量需求。</p><p>在交通领域,交通堵塞是许多城市发展都需要面临的难题,将毫米波雷达应用在车路协同系统,可以同时监控多个车道的平均速度、车流量、车道占有率等交通流基本信息,并根据交通流信息有效地调整交通信号灯,提高道路通行效率(可提高 10%),促进节能减排(可降低 10%-15% 的油耗),有效减轻交通堵塞等问题。当下,随着中国车路协同市场的发展,毫米波雷达的需求量也将随之上涨。</p><p>在智能家居、健康监护领域,毫米波雷达的应用案例也在不断增加。由于毫米波雷达可以监测到人体呼吸、心跳等健康信息,在全屋智能中也可实现精准的人体存在感知,从而与室内照明、窗帘、空调等产生联动;同时,随着老龄化进程的加速,毫米波雷达与智慧养老相结合已演化出跌倒报警、睡眠监控等很多新用例。</p><p>当然,还有安防、工业、民航、船舶等其他领域也应用了毫米波雷达,更多详细内容可见《中国毫米波雷达市场调研报告(2022年)》。</p><p>可以预见的是,智慧交通、智能家居、健康监护、安防、工业等领域,均是毫米波雷达的重要潜在市场。</p><p>未来,随着我国汽车、交通、安防、工业、家居、康养等产业的智能化升级不断推进,毫米波雷达的应用将进一步扩大。预计到2026年中国毫米波雷达市场规模将达到197亿元,年复合增长率为23.3%。</p><p>写在最后</p><p>不论是特斯拉采用4D毫米波雷达,还是眼下“毫米波雷达”相关概念股的涨停,可以肯定的是,随着中国各产业领域智能化、数字化的转型升级,必将给毫米波雷达创造更多的应用市场。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 02:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000386952</guid>
            <link>https://aijishu.com//a/1060000000386952</link>
        </item>
        <item>
            <title><![CDATA[推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结]]></title>
            <description><![CDATA[<h1>0.前言:召回排序流程策略算法简介</h1><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/44083e4c130841f894e36366a71f8d96.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>推荐可分为以下四个流程,分别是召回、粗排、精排以及重排:</p><ol><li>召回是源头,在某种意义上决定着整个推荐的天花板;</li><li>粗排是初筛,一般不会上复杂模型;</li><li>精排是整个推荐环节的重中之重,在特征和模型上都会做的比较复杂;</li><li>重排,一般是做打散或满足业务运营的特定强插需求,同样不会使用复杂模型;</li></ol><ul><li><p><strong>召回层</strong>:召回解决的是从海量候选item中召回千级别的item问题</p><ul><li>统计类,热度,LBS;</li><li>协同过滤类,UserCF、ItemCF;</li><li>U2T2I,如基于user tag召回;</li><li>I2I类,如Embedding(Word2Vec、FastText),GraphEmbedding(Node2Vec、DeepWalk、EGES);</li><li>U2I类,如DSSM、YouTube DNN、Sentence Bert;</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/b935ff75e3e84d7f88de39613bb02bad.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p></li><li><strong>模型类</strong>:模型类的模式是将用户和item分别映射到一个向量空间,然后用向量召回,这类有itemcf,usercf,embedding(word2vec),Graph embedding(node2vec等),DNN(如DSSM双塔召回,YouTubeDNN等),RNN(预测下一个点击的item得到用户emb和item emb);向量检索可以用Annoy(基于LSH),Faiss(基于矢量量化)。此外还见过用逻辑回归搞个预估模型,把权重大的交叉特征拿出来构建索引做召回</li><li><p><strong>排序策略</strong>,learning to rank 流程三大模式(pointwise、pairwise、listwise),主要是特征工程和CTR模型预估;</p><ul><li><p><strong>粗排层</strong>:本质上跟精排类似,只是特征和模型复杂度上会精简,此外也有将精排模型通过蒸馏得到简化版模型来做粗排</p><ul><li>常见的特征挖掘(user、item、context,以及相互交叉);</li></ul></li><li><p><strong>精排层</strong>:精排解决的是从千级别item到几十这个级别的问题</p><ul><li><strong>CTR预估</strong>:lr,gbdt,fm及其变种(fm是一个工程团队不太强又对算法精度有一定要求时比较好的选择),widedeep,deepfm,NCF各种交叉,DIN,BERT,RNN</li><li><strong>多目标</strong>:MOE,MMOE,MTL(多任务学习)</li><li><strong>打分公式融合</strong>: 随机搜索,CEM(性价比比较高的方法),在线贝叶斯优化(高斯过程),带模型CEM,强化学习等</li></ul></li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c764dfd7b65048f3a2ab2b97214135a3.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p></li><li><strong>重排层</strong>:重排层解决的是展示列表总体最优,模型有 MMR,DPP,RNN系列(参考阿里的globalrerank系列)</li><li><p><strong>展示层</strong>:</p><ul><li><strong>推荐理由</strong>:统计规则、行为规则、抽取式(一般从评论和内容中抽取)、生成式;排序可以用汤普森采样(简单有效),融合到精排模型排等等</li><li><strong>首图优选</strong>:CNN抽特征,汤普森采样</li></ul></li><li><strong>探索与利用</strong>:随机策略(简单有效),汤普森采样,bandit,强化学习(Q-Learning、DQN)等</li><li><strong>产品层</strong>:交互式推荐、分tab、多种类型物料融合</li></ul><h1>1.淘宝逛逛召回算法实践总结</h1><p>内容化这几年越来越成为电商的重点,用户来到网购的时候越来越不局限在只有明确需求的时候,而更多的是没有明确需求的时候,就像是逛街一样。逛逛就是在这样的背景下诞生的内容化产品,打造出有用、有趣、潮流、奇妙、新鲜的内容,为消费者提供全新的内容消费体验。在这个场景下的内容召回有很多问题需要探索,其中主要的特点和挑战有:</p><ol><li><strong>强时效性</strong>:内容推荐场景下的内容新旧汰换非常快,新内容的用户行为少,很难用用户历史行为去描述新内容,而用户行为正是老内容投放主要的依赖。所以当不能依靠用户行为数据来建模内容之间关系的时候,我们必须要找到其他可以表征内容的方法。</li><li><strong>多兴趣表征</strong>:多兴趣表征,特别是多峰召回是这几年比较主流的一个趋势。但是目前多峰模型中峰的数量是固定的,当用户行为高度集中的时候,强制的将用户行为拆分成多向量,又会影响单个向量的表达能力。如何去平衡不同用户行为特点,特别是收敛和发散的兴趣分布,就成了此类任务的挑战。</li></ol><p>在设计优化方向的时候,我们重点考虑上面描述问题的解法(召回本身也需要兼顾精准性和多样性,所以单一召回模型显然无法满足这些要求,我们的思路是开发多个互补的召回模型)。详细的介绍在后面的章节以及对应的后续文章中展开:</p><ol><li><strong>跨域联合召回</strong>:除了单纯把多域的信息平等输入到模型中,如何更好利用跨域之间的信息交互就变的尤为重要。目前有很多优秀的工作在讨论这样的问题,比如通过用户语义,通过差异学习和辅助loss等。我们提出了<strong>基于异构序列融合的多兴趣深度召回模型CMDM</strong>(a cross-domain multi-interest deep matching network),以及<strong>双序列融合网络Contextual Gate DAN</strong> 2种模型结构来解决这个问题。</li><li><strong>语义&amp;图谱&amp;多模态</strong>:解决时效性,最主要的问题就是怎么去建模新内容,最自然的就是content-based的思想。content-based的关键是真正理解内容本身,而content-based里主要的输入信息就是语义,图像,视频等多模态信息。目前有许多工作在讨论这样的问题,比如通过认知的方式来解决,多模态表征学习,结合bert和高阶张量等方式等等。在语义召回上,我们不仅仅满足于语义信息的融入,还通过<strong>Auxiliary Sequence Mask Learning</strong>去对行为序列进行高阶语义层面的提纯。更进一步,我们利用内容图谱信息来推荐,并且引入了个性化动态图谱的概念。对于新老内容上表达能力的差异问题,我们通过<strong>multi-view learning</strong>的思想去将id特征和多模态特征做融合。</li><li><strong>泛多峰</strong>:为了解决多峰强制将兴趣拆分的问题,我们考虑到单峰和多峰的各自特点,特别是在泛化和多样性上各自有不同的建模能力。基于此,我们提出了泛多峰的概念。</li></ol><h2>1.1 跨域联合召回</h2><h3>1.1.1 基于异构序列融合的多兴趣深度召回</h3><p>在单一推荐场景下,深度召回模型只需要考虑用户在当前场景下的消费行为,通过序列建模技术提取用户兴趣进而与目标商品或内容进行匹配建模。而在本推荐场景下,深度召回模型需要同时考虑用户内容消费行为和商品消费行为,进行跨场景建模。为此,我们提出了CMDM多兴趣召回模型架构,能够对用户的跨场景异构行为序列进行融合建模。在CMDM中,我们设计了用于异构序列建模的层级注意力模块,通过层级注意力模块提取的多个用户兴趣向量与目标内容向量进行匹配建模。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/5ec96266756549119c23db2c1be555e4.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h3>1.1.2 双序列融合网络Contextual Gate DAN</h3><p>除了通过层次注意力的方式,异构序列中还有个特点就是在时间上更接近交叉并存的状态。为了学习到两个序列之间的信息交叉,充分融合商品点击序列和内容点击序列,我们从自然语言处理的VQA任务中得到启发。VQA是用自然语言回答给定图像的问题的任务,常用做法是在图片上应用视觉注意力,在文本上应用文本注意力,再分别将图片、文字多模态向量输入到一个联合的学习空间,通过融合映射到共享语义空间。而DAN结构是VQA任务中一个十分有效的模型结构,DAN通过设计模块化网络,允许视觉和文本注意力在协作期间相互引导并共享语义信息。我们对DAN结构进行了改进,设计了Contextual Gate DAN 双序列融合网络:</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/667c7ec2baa446828f102eeecca1430e.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h2>1.2 语义&amp;图谱&amp;多模态</h2><h3>1.2.1 多模态语义召回</h3><p>在内容推荐场景内,存在大量新内容需要冷启动,我们主要通过语义和多模态2种方式。相对于搜索任务,语义匹配是一个从单点到多点,解空间更大更广的问题。首先是用户行为的不确定性,内容推荐场景下用户决策空间更大更广,从而导致用户对推荐系统的反馈信号本身就存在较大的不确定性;再就是语义空间表达的对齐问题,这里的对齐包含两个方面,第一个方面是单个序列里的内容表达的语义标签提取方式差别大(比如cpv、分词、语义标签、多模态表征等等),另外一个方面是多序列(内容和商品等)之间的语义空间对齐问题。多模态的召回方式融合了文本,图像,音频等大量模式跨域信息,由于与内容互动解耦,在缓解内容冷启动上具有一定的优势。多模态召回主要是通过理解内容多模态表征,先后进行了collaborative filtering、聚类中心召回、个性化多模态表征相关的探索工作,在多样性方面取得了一定的效果,深度语义召回方面针对用户行为去噪和更好的表达语义信息角度出发,迭代了cate-aware和query-aware和序列mask 自监督任务的模型。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/b02b18f872a848f1836a56964dc7665b.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h3>1.2.2 行为稀疏场景下的图模型实践</h3><p>更进一步,我们利用内容图谱信息来推荐。知识图谱构建的出发点就是对用户的深度认知,能够帮助系统以用户需求出发构建概念,从而可以帮助理解用户行为背后的语义和逻辑。这样可以将用户的每次点击行为,都用图谱的形式极大的丰富,图谱带来的可解释的能力还可以大大加快模型的收敛速度。知识图谱有个特点,就是其中的信息是相对固定的,或者说是静态的,因为知识图谱基本是由先验信息构成的。但是从各个用户的角度,知识图谱的数据中的链接重要度并不相同。比如一个电影,有的用户是因为主演看的,有的用户是因为导演看的,那么这个电影连接的主演边和导演边的权重就因人而异了。我们提出了一种新的方法来融合用户动态信息和静态图谱数据。每个行为都用图谱扩展,这样行为序列变成行为图谱序列, 并且加入KnowledgeGraph-guided gating的自适应的生成式门控图注意力,去影响知识图谱融入到模型中的点边的权重。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/1574f85900324ef58bf47f0ee8f25524.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h3>1.2.3 融合多模态信息的跨模态召回</h3><p>针对新内容冷启动的问题,我们提出了跨模态召回模型来兼顾content-based和behaviour-based的召回各自的优点。在跨模态召回模型构建前,我们首先引入了多模态meta信息为主的“语义” deep collaborative filtering召回,两者的显著差别主要在target side的特征组成中相较与behaviour-based的特征,多模态特征构建的模型去除了影响较大的内容id类的特征,将这些特征更换为了来自多模态预训练技术得到的多模态表征输入。除了上面的变化,我们还加入了triplet loss的部分使得embedding空间更具有区分度,效率指标也有了较大幅度的提升。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f0608e9fe8244ac7acf46b3c22ced524.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h2>1.3 用户多兴趣表征(多模型簇联合学习):泛多峰</h2><p>多峰召回模型通过对用户侧产生多个表征不同“兴趣”的向量进行多个向量的召回,是对于单峰的一个拓展,将单个用户的表达扩展成了多个兴趣表达, 更精确地刻画了用户, 从而取得更好的效果。我们通过对于单峰模型及多峰模型的观察发现,用户行为高度集中的序列单峰模型的线上效率相对于多峰模型会更有优势,而那些用户序列类目丰富度较高的则多峰模型的效率明显占优。所以这里提出了泛多峰u2i模型的概念,尝试将多峰模型容易拟合行为序列类目丰富度较高的用户,而单峰模型则更容易拟合行为序列类目丰富度较为集中的用户的优势进行结合。使得单一模型能够通过产生不同算法簇的多个不同表征的向量在不同簇的内容向量中进行召回,从而具备这两种召回范式的优点。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f9b12f3921e944289369a5f57d5e2301.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h2>1.4 提升优化:</h2><p>▐  认知推荐</p><p>我们正在尝试,将图谱用于user embedding投影,投影的平面空间就是语义空间,这样做到可控多维度语义可解释embedding。另外,对于召回,采样方式对模型效果影响非常大,结合知识图谱来进行graph-based Learning to sample的优化,对于正负样本的选取更加做到关联可控,加快迭代速度,提升效果。</p><p>▐  兴趣破圈</p><p>在内容化推荐领域,仅仅相似度提高的优化,会导致用户没有新鲜感,对平台粘性变低。如何帮助用户探索他更多的兴趣,是现在内容化推荐亟待解决的另一个问题。一种做法是兴趣近邻,从已有兴趣出发,慢慢通过兴趣之间的相似,扩展用户未知的领域,可以参考MIND,CLR一些思路。另一种做法是对兴趣构建推理引擎,在对已有兴趣推理过程建模之后,加入扰动来探索用户可能新的兴趣。</p><h1>2.阿里飞猪个性化推荐:召回篇</h1><blockquote>常见的有基于user profile的召回,基于协同过滤的召回,还有最近比较流程的基于embedding向量相似度的topN召回等等。方法大家都知道,但具体问题具体分析,对应到旅行场景中这些方法都面临着种种挑战。例如:旅行用户需求周期长,行为稀疏导致训练不足;行为兴趣点发散导致效果相关性较差;冷启动用户多导致整体召回不足,并且热门现象严重;同时,具备旅行特色的召回如何满足,例如:针对有明确行程的用户如何精准召回,差旅用户的周期性复购需求如何识别并召回等。</blockquote><p>本次分享将介绍在飞猪旅行场景下,是如何针对这些问题进行优化并提升效果的。主要内容包括:⻜猪旅行场景召回问题、冷启动用户的召回、行程的表达与召回、基于用户行为的召回、周期性复购的召回。</p><h2>2.1 飞猪旅行场景召回问题</h2><p>推荐系统流程</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/a1144942282b46bfb5b6be5179c2a300.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>首先介绍推荐的整体流程。整体上分为5个阶段。从全量的商品池开始,之后依此是召回阶段,粗排/精排阶段,最后的混排模块根据业务实际情况而定,并不是大多数推荐系统必须的。粗排和精排在另外一次分享中已经介绍过了,本次分享主要介绍一下飞猪推荐系统的召回问题,召回可以说决定了推荐系统效果的上限。</p><p>下面说一下召回和粗排/精排的区别。从召回到粗排再到精排模块,商品的数据量是递减的,模型的复杂度会增高。具体会体现在输入特征数量和模型复杂度的增加,更新往往也会更频繁。对应的训练和上线的方式也会不同,拿召回来讲,出于性能的考虑,往往采用离线训练+打分或者离线训练得到向量表达+向量检索的方式,而排序阶段为了更好的准确率和线上指标,更多的是离线训练+实时打分,甚至在线学习的方式。</p><p>召回的本质其实就是将用户和商品从不同维度关联起来。常见的方法比如content-base匹配,或者item/user based的协同过滤,还有最近比较流行的向量化召回。向量化召回常用做法是用深度学习将用户和商品都表达成向量,然后基于内积或欧式距离通过向量检索的方式找到和用户最匹配的商品。</p><h3>2.1.1 飞猪推荐场景</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c8a47ed183f14473b1b8b35f371f8784.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>飞猪的推荐页面有很多,比如首页,支付成功页,订单列表页,订单详情页都有猜你喜欢。不同页面对应了不同的场景,用户在不同场景下需求不同,也有一定的交叉。比如首页偏重逛/种草,但支付完成后推荐一些与订单相关的商品会更好。</p><p><strong>我们大致可以把用户分为三类:无行为、有行为,还有一种是飞猪场景下特殊的一类"有行程"。</strong></p><h3>2.1.2 主要问题</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/46d789608a884377baa09b9b5f9b59fe.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>本次分享的主要内容就是针对这三类用户在推荐过程中存在的问题+周期性复购场景 ( 出差/回家 ) 的解决。<br>航旅场景下的召回存在以下问题:</p><ul><li>冷启动:航旅商品的热门现象严重,user profile缺乏。</li><li>相关性vs搭配性:航旅场景下要求搭配性比较高,传统的I2I只偏重相关性。但用户的行程需求不是单点的,比如买了飞机票还要看住宿。行程受上下文影响比较多,比如季节、用户近期行为等。</li><li>相关性不足:航旅用户的行为稀疏又发散,目前的召回结果噪音较多。</li></ul><p>下面会对我们在优化过程中碰到的相关问题一一介绍。我们知道,召回处于推荐链路的底端,对召回常规的离线评估方式有预测用户未来点击的TopN准确率或者用户未来点击的商品在召回队列中平均位置等等。但是在工业系统中,为了召回的多样性和准确率,都是存在多路召回的,离线指标的提高并不代表线上效果的提升,一种常见的评估某路召回效果的方式就是对比同类召回通道的线上点击率,这种评估更能真实反映线上的召回效果,基于篇幅的考虑,后面的介绍主要展示了线上召回通道点击率的提升效果。</p><h2>2.2 冷启动用户召回</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/fd4c807bdd794d1091442f3d2a8dbd44.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h3>2.2.1 User冷启动召回</h3><p>用户冷启动召回主要有以下几种方案:Global Hot、Cross Domain、基于用户属性的召回。</p><ul><li>全局热门:缺点是和user无关,相关性差。</li><li>Cross domain:一种做法是基于不同域 ( 例如飞猪和淘宝 ) 共同用户的行为将不同域的用户映射到同一个向量空间,然后借助其他域的丰富行为提升本域冷启动用户的召回效果。</li><li><p>基于用户属性:单一属性的缺点是热门现象严重,个性化不足。我们采用了基于多属性组合的方法。</p><h3>2.2.2 UserAttr2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/ba11bfc0cdf24de6aa4fff068a31e847.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在这里介绍我们的方案UserAttr2I,使用类似排序模型的方法,输入用户+商品的属性,预测用户是否会点击一个商品。</p></li></ul><p>开始用线性FTRL模型,效果不是很好。原因是线性模型无法学习高阶特征,并且解释性比较差。针对这两个问题,通过DeepNet提高泛化性,同时用GBDT来做特征筛选。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/6724c7ef758a44c285efebb7ad1e642e.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>下面对比双塔结构和深度特征交叉两种方案,优缺点如图所示。最终选择了第二种,原因是目标用户是冷启动,能用到的特征比较少。如果放弃挖掘用户和宝贝之间的关系会导致相关性比较差。模型结构如下:<br><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/1c8b8e0fc2d54d3b9059cb59a0018e36.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>通过attention操作以及GBDT的叶子节点即可满足冷启动的可解释性。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/95ce5cec11004ae2b66176a7ca5d6f0b.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>对比其他冷启动的召回方式,Attribute2I的点击率最高。</p><h2>2.3 行程的表达与召回</h2><h3>2.3.1 Order2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c141e0757d8645c4b2c6a47ada2cea16.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在飞猪场景下用户有类似如下的需求:买了去某地的机票,用户很可能需要与之搭配的签证/wifi/酒店等等,而协同过滤通常只能推出同类型商品,比如门票推门票,酒店推酒店。另外飞猪不像淘宝用户可能会经常逛,有比较丰富的历史行为信息可以供我们去分析和计算,飞猪用户通常是"买完即走"。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/aba52ce8bb7549bd8232b975f2d2b670.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>通过数据分析我们发现订单附近的行为数据和订单有较高搭配关系,我们通过Graph Embedding的方式学习订单和宝贝的Embed,以此来学习搭配关系。</p><p>难点有以下几个:</p><ul><li>如何挖掘反映搭配关系的数据集合</li><li>搭配的限制性比较强,如果仅仅基于用户行为构建图,由于用户行为噪音多,会造成较多badcase</li><li>如果完全基于随机游走学习Embed,最后的召回结果相关性差,因此需要行业知识的约束</li><li>数据稀疏,覆盖商品少,冷启动效果差</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/d4e84017696741ab9c8ec83b375a1eee.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>**解决方案:<br>利用航旅知识图谱以及用户的行为序列进行加权异构图的构建 ( 机票/火车票节点利用业务线+出发地+目的地唯一标示、宝贝&amp;酒店利用其id唯一标示 )。之后的流程和传统的Graph Embedding类似。**</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/d3a417bea35b4f6192a0cea4f29c7d77.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br><strong>具体过程:</strong><br>① 以订单粒度对用户的行为做拆分和聚合,同时加入点击行为缓解稀疏问题。</p><p>② 边的权重的计算同时考虑知识图谱和用户行为,这种做法一方面可以增加约束控制效果,另一方面也可以抑制稀疏,解决冷启动的问题。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/eb64259ef2544b3296c7e5b512175907.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>③ 序列采样过程中会基于转移概率进行剪枝操作,用来抑制噪声和缓解热门问题。</p><p>④ skip-gram+负采样训练。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/560c1e09762c4309afa62ec8e33b345c.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>这里有一个具体的case,用户订了一张去曼谷的机票,order2I召回了曼谷的一些自助餐,落地签,热门景点等,体现了较好的搭配性。整体的指标上order2I的点击率也明显高于其他方式。</p><h3>2.3.2 journey2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/0f24570ee2ff49a88f5b750f31b3640f.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>Order2I将订单进行向量化表达,从而进行召回。<strong>但是它还有一些问题:用户的某次行程可能由多个订单组成,甚至有的订单只是中转的作用</strong>,Graph Embedding还是基于单个订单进行搭配的推荐;用户的某次行程不是一个出发地+目的地就能描述的,它不仅与行程本身属性 ( 例如出发/到达时间,目的地,行程意图等 ) 相关,还与用户的属性和偏好 ( 例如年龄,是否是亲子用户 ) 相关。因此行程既是User-Aware又是Context-Aware的。而Order2I学习的还是一种全局的整体偏好,与用户无关,不够个性化。因此我们尝试在行程的粒度做召回,综合考虑用户属性、行程意图、上下文等因素,更个性化的召回与用户这次行程以及用户自身强相关的的宝贝。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c34c3c6d8b9349a99873023b5ad597d4.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>以行程为粒度,对多个订单做聚合,并且增加行程相关的特征。融入用户的基础属性特征和历史行为序列。丰富行程特征并引入attention机制。采用双塔模型离线存储商品向量,在线做向量化召回。模型结构如下:<br><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/97ca47e2d5e44b52bfbdba9b76f29fed.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>模型左边主要是利用行程特征对订单序列以及用户的历史行为序列进行attention操作,用于识别关键订单以及用户关键行为。在此基础上融合行程特征和用户属性特征学习用户该段行程的Embed。模型右边是商品特征,经过多层MLP之后学习到的宝贝Embed。两边做内积运算,利用交叉熵损失进行优化,这样保证召回的结果不仅与行程相关还与用户行为相关。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/551cbcc2062d431f9a0b2ffb4eabbf97.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>两个同样是上海到西安的用户。用户1点击了历史博物馆和小吃,不仅召回了与机票搭配的接送机,还召回了与行为行为相关的小吃街附近的酒店以及历史博物馆相关的宝贝。</p><p>用户2点击了一个接送机,除了召回接送机还召回了机场附近的酒店和热门的POI景点门票。可以看出基于用户的不同行为,召回结果不仅满足搭配关系还与用户行为强相关。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/fdaf52164b224e699f4aee7595234630.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>从指标来看Journey2I相对Order2I有进一步明显的提升。</p><h2>2.4 基于用户行为的召回</h2><h3>2.4.1 Session-Based I2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/0bdcfe9e5d784df2a8172e5dd01cba16.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>航旅用户的行为有稀疏和发散的特点。利用右图一个具体的用户实例来说明这两个特点:用户在第一天点击了两个大理一日游,第20天点击了一些马尔代夫蜜月相关的商品,第21天又点击了大理的一日游。稀疏性体现在一个月只来了3次,点击了8个宝贝。发散性体现在用户大理一日游和出国蜜月游两个topic感兴趣。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/6392441264c04e219d9375727c0d1ae1.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在用户有行为的情况下进行召回,我们常采用的方法是基于User-Rate矩阵的协同过滤方法 ( 如ItemCF,Swing。ItemCF认为同时点击两个商品的用户越多则这两个商品越相似。Swing是在阿里多个业务被验证过非常有效的一种召回方式,它认为user-item-user的结构比itemCF的单边结构更稳定 ),但是由于航旅用户行为稀疏,基于User-Rate矩阵召回结果的准确率比较低,泛化性差。针对这两个问题我们可以通过扩充历史数据来增加样本覆盖。航旅场景因为用户点击数据比较稀疏,需要比电商 ( 淘宝 ) 扩充更多 ( 时间更长 ) 的数据才够。这又带来了兴趣点转移多的问题。在这里我们采用对行为序列进行session划分,保证相关性。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f39142d4548243afbf30e44fdc9f415c.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>这里以swing为例讲解一下构造约束的方式。我们以用户的行为意图为中心,将表示共同意图的商品聚合在一个序列中,如上图对用户行为序列的切分。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/203dd021745b41bd9774c33dff30a88d.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在这个case中,上面是传统swing的召回结果,下面是基于session的召回结果。当trigger是沙溪古镇一日游的时候,上面有一个杭州莫干山和玉龙雪山一日游,这两个不相关结果的出现是因为它们是热门商品,也称哈利波特效应。下面的召回结果就都是和沙溪古镇相关的了。从指标来看,session-based召回比swing和itemCF都高。</p><h3>2.4.2 Meta-Path Graph Embedding</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/1122cce89a984bd7b8399c209c9baaf3.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>基于I2I相关矩阵的优点是相关性好,缺点是覆盖率比较低。而Embed的方式虽然新颖性好但是相关性差。右边的case是Embed的召回结果,上海迪士尼乐园召回了一个珠海长隆的企鹅酒店和香港迪士尼。我们期望的应该是在上海具有亲子属性,或者在上海迪士尼附近的景点。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/eddd33153f5946a9bbfedabde0603dde.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>解决Embed相关性低的方式借鉴了session-based召回的经验,将航旅知识图谱融合,构建航旅特定的Meta-Path。效果上看meta-path的效果是比deepwalk更好。</p><h2>2.5周期性复购的召回</h2><p>复购场景的需求来自于:飞猪有大量的差旅和回家用户,该部分用户的行为有固定模式,会在特定的时间进行酒店和交通的购买,那么该如何满足这部分用户的需求?</p><h3>2.5.1 Rebuy2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c1a8b317a655413dbb858a651d2d8c58.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>我们的目标是在正确的时间点来给用户推出合适的复购商品,下面以酒店为例具体讲解 ( 其他的品类原理类似 )。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/11e827c034274aa6bb2fa0791e768f6d.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>输入用户在飞猪的酒店历史购买数据,输出是用户在某个时间点对某个酒店的复购概率。当有多个可复购酒店时,按照概率降序排序。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/463fa849ed85441cad16f4175bd3a9fc.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>常见做法有以下几种:</p><ul><li>利用酒店本身的复购概率</li><li>基于用户购买历史的Retarget</li><li>利用Poission-Gamma分布的统计建模</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/abefcb8bf5c24efeb356c45150cf391e.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>首先取用户对酒店的购买历史,利用矩估计/参数估计计算酒店的购买频次 ( 参数α和β )。接下来就可以调整每个用户的购买概率,k是购买次数,t是第一次购买距离最近一次购买的时间间隔。最后代入Possion分布计算复购概率,加入用户的平均购买周期来缓解刚刚完成购买的酒店复购概率最大的问题。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/46d024871f87424eae851ea5244b4f6f.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>从左图可以看出在购买一段时间以后,复购概率达到最大值,之后递减。实际使用中复购单独作为一路召回,效果比前面提到的retarget和热门召回更好。</p><h2>2.6 总结</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/5c2be163d48549799d0e0d665c46ea94.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>最后总结一下做好召回的几个思路:</

...

@github-actions
Copy link
Contributor

http://localhost:1200/aijishu/u/bandaotitouzilia - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[集微网 - 极术社区]]></title>
        <link>https://aijishu.com//api/user/1030000000106559/timeline?page=1</link>
        <atom:link href="http://localhost:1200/aijishu/u/bandaotitouzilia" rel="self" type="application/rss+xml" />
        <description><![CDATA[集微网 - 极术社区 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 15:16:13 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[解密禾赛科技最新激光雷达专利]]></title>
            <description><![CDATA[<p>【爱集微点评】禾赛科技的激光雷达专利,通过色散偏折件实现多波长光源所产生光线的分光和出射,同时色散偏折件还能起到扩束的作用,能够有效增大激光雷达的口径,提升测远能力。而且不会过多增加激光雷达的光路高度,有效的压缩了激光雷达的高度和体积。</p><p>集微网消息,近日,禾赛科技在纳斯达克成功上市,意味着中国“激光雷达”向全球又迈进了一步,同时禾赛科技也成为中国“激光雷达第一股”。</p><p>激光雷达是一种常用的测距传感器,其工作原理是利用激光往返于雷达和目标之间所用的时间,或者调频连续光在雷达和目标之间往返所产生的频移来评估目标的距离或速度等信息。为了获得较大的视场范围,激光雷达通常采用扫描装置进行扫描。激光雷达常用的扫描方式有机械旋转式、反射镜扫描式、光学相控阵(OPA)扫描、Flash扫描等。另外,还有一种扫描方式是波长扫描。波长扫描的扫描装置是利用光栅、棱镜等色散元件基于波长将多波长光源产生的光线分开以达到扫描的效果。但是现有波长扫描的扫描装置往往存在装配不方便的问题。</p><p>为此,禾赛科技于2022年8月29日申请了一项名为“激光雷达的发射模块及激光雷达”的发明专利(申请号:202222291141.6),申请人为上海禾赛科技有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1126334138789.4883.png" alt="image" title="image"></p><p>图1 波长扫描装置的光路示意图</p><p>图1为传统波长扫描装置的光路示意图,在激光雷达的应用中,通过不同波长的光线向不同角度衍射来实现激光雷达对不同垂直角度的扫描。因此,为了使多束衍射光的出射方向靠近水平面,实现对垂直0°角和垂直方向正角度和负角度一定范围的扫描,如图1所示,通常在色散元件12下游的光路中会设置反射镜13。但是反射镜13的反射面与水平方向之间的夹角较大,所以会增大光路沿垂直方向的尺寸,使得激光雷达光路垂直方向的高度增大,从而不利于激光雷达体积的缩小。此外,也会使激光雷达光路的不同光学元件在不同高度的水平面上,从而造成了激光雷达的安装不便。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1342321041364.585.png" alt="image" title="image"></p><p>图2 新型激光雷达发射模块结构示意图</p><p>图2为本专利提出的一种新型激光雷达发射模块结构示意图,在此主要引入色散偏折件129,其主要包括光栅层127和导光体128。光栅层127朝向导光体128的表面并与导光体128的表面直接接触。导光体128的两个表面分别为第一面121和第二面122,第一光线131从第一面121入射至导光体128,第三光线133自第二面122从导光体128出射。色散面和偏折面集成于一体化结构的导光体128上,能够使光学元件体积大幅缩小,并且一体化的光学元件结构更加稳定,能够有效提高光路的鲁棒性。此外,一般而言,导光体128材料的折射率大于1。将导光体128的材料设置为比较常见的大于1的材料以控制折射角度,可以实现扩束效果。</p><p>简而言之,禾赛科技的激光雷达专利,通过色散偏折件实现多波长光源所产生光线的分光和出射,同时色散偏折件还能起到扩束的作用,能够有效增大激光雷达的口径,提升测远能力。而且不会过多增加激光雷达的光路高度,有效的压缩了激光雷达的高度和体积。</p><p>禾赛科技是一家致力于激光雷达研发与制造的全球化公司,其客户遍布全球主流汽车厂商、自动驾驶和机器人公司,覆盖40个国家和90多个城市。作为以技术为核心竞争力的公司,禾赛科技的成功并非偶然,而是在多年的产品打磨和技术投入中诞生的。中国需要有世界级自主研发能力的公司,相信禾赛科技也有实力成为全球领先企业。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 08:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387119</guid>
            <link>https://aijishu.com//a/1060000000387119</link>
        </item>
        <item>
            <title><![CDATA[引领仪器设备产业“突围”,国产半导体责无旁贷]]></title>
            <description><![CDATA[引领仪器设备产业“突围”,国产半导体责无旁贷]]></description>
            <pubDate>Mon, 27 Feb 2023 07:15:40 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387113</guid>
            <link>https://aijishu.com//a/1060000000387113</link>
        </item>
        <item>
            <title><![CDATA[南芯科技公开带预唤醒功能的Type-C接口插入检测电路方案]]></title>
            <description><![CDATA[<p>【爱集微点评】南芯科技公开的带预唤醒功能的Type-C接口插入检测电路方案,该方案通过增加Type‑C接口预唤醒电路,在接口电路休眠时,可以将Type‑C接口检测电路关闭。从而实现减低系统待机功耗的同时实现接口插入检测功能,通过简单的电路结构解决了Type‑C接口插入检测和低功耗之间的矛盾。</p><p>集微网消息,在集成电路应用当中,特别是手机或者充电设备的Type‑C接口电路应用中,通常为了降低系统待机功耗,在未检测到手机或者充电设备插入时,整个系统会进入休眠模式。</p><p>但是为了快速响应手机或者充电设备的插入,在休眠时Type‑C接口检测电路需要一直工作,这就大大增加了系统休眠时的待机电流,从而大大缩短电池的续航时间。</p><p>为此,南芯科技在2022年3月11日申请了一项名为“一种带预唤醒功能的Type-C接口插入检测电路”的发明专利(申请号:202210236444.X),申请人为上海南芯半导体科技股份有限公司。</p><p>根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/522483438041.0886.png" alt="image" title="image"></p><p>如上图,为该专利中公开的充电设备端和手机端上设置的Type‑C接口检测电路通过Type‑C数据线连接的结构示意图。可以看到,在手机或者充电设备(如适配器、充电宝等)的Type‑C接口电路应用中,为了快速响应手机或者充电设备的插入,在休眠时Type‑C接口检测电路需要一直工作。这就大大增加了系统休眠时的待机电流,从而大大缩短了手机或者充电设备的电池的续航时间。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1435664442736.5054.png" alt="image" title="image"></p><p>如上图,为现有方案中Type‑C接口检测电路的电路连接示意图。在充电设备端,P型开关管M2的源端连接电源VDD,栅端连接控制信号EN_Rp,漏端连接上拉电流源Irp的源端。Irp的输出端连接到引脚CC,引脚CC同时连接到检测比较器P的反向端,比较器P的正向端连接参考电压VREF,比较器P输出信号为CC_DET_P。</p><p>在手机端,N型开关管M1的源端连接GND(即接地),栅端连接控制信号EN_Rd,漏端连接下拉电阻Rd的一端,下拉电阻Rd另一端连接到引脚CC。引脚CC同时连接到检测比较器D的同向端,比较器D的反向端连接参考电压VREF,比较器D的输出电压为CC_DET_D。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/168830725881.94025.png" alt="image" title="image"><br>在该专利中,主要通过在Type‑C接口检测电路的基础上增加预唤醒电路,在休眠时关闭Type‑C接口检测电路,来降低系统待机功耗。在设备插入时,通过触发预唤醒电路,再将Type‑C接口检测电路使能,实现快速响应设备的插入。</p><p>如上图所示,该检测电路包括:Type‑C接口检测电路以及Type‑C接口预唤醒电路。该充电设备端接口检测电路包括P型开关管M2、上拉电流源Irp和比较器P。手机端接口检测电路包括N型开关管M1、下拉电阻Rd和比较器D。</p><p>充电设备端接口预唤醒电路包括P型开关管M3、上拉电阻Rp_Pre、P型开关管M4、电阻R1、电阻R2以及反相器PI1。手机端接口预唤醒电路复用手机端接口检测电路的N型开关管M1和下拉电阻Rd。此外,手机端接口预唤醒电路还包括N型开关管M5、电阻R3、电阻R4和反相器PI2。</p><p>该装置的工作原理如下:在充电设备端,通过开关管M3和上拉电阻Rp_Pre实现上拉功能,开关管M4、电阻R1以及R2实现Rd插入预唤醒功能。在充电设备接口休眠时,开关管M3栅极控制电压为0,开关管M2栅极控制电压为1,关闭Irp上拉电流源,同时比较器P处于关闭状态。在手机端,下拉电阻部分将复用接口检测电路部分,开关管M5、电阻R3以及R4实现上拉插入预唤醒功能。在手机端接口休眠时,开关管M1栅极控制电压为1,打开M1,通过电阻Rd实现下拉,同时比较器D处于关闭状态。</p><p>引脚CC没有插入上拉时,CC引脚被Rd和M1下拉至GND,CC引脚通过ESD保护电阻R4接到开关管M5栅极,M5处于关断状态,输出被电阻R3上拉至VDD。然后经过反相器,输出为低,整个Type‑C接口电路没有工作电流,系统功耗很低。</p><p>当引脚CC插入上拉时,CC引脚电压即为开关管M5栅极电压,M5被打开,将信号拉低,输出CC_DET_D_PRE即为高电平。从而实现上拉插入预唤醒,然后打开比较器D,Type‑C接口检测电路将开始工作。</p><p>以上就是南芯科技公开的带预唤醒功能的Type-C接口插入检测电路方案,该方案通过增加Type‑C接口预唤醒电路,在接口电路休眠时,可以将Type‑C接口检测电路关闭。从而实现减低系统待机功耗的同时实现接口插入检测功能,通过简单的电路结构解决了Type‑C接口插入检测和低功耗之间的矛盾。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387106</guid>
            <link>https://aijishu.com//a/1060000000387106</link>
        </item>
        <item>
            <title><![CDATA[兆芯如何保证处理器模拟/真实请求传输路径一致?]]></title>
            <description><![CDATA[<p>【爱集微点评】兆芯的处理器建模专利,采用两套信息来记录一个请求路径的关键信息,解决多个请求在汇聚点装置中路径不明确的问题。同时依据第二路径信息可以纠正第一路径信息在汇聚点装置导致的路径错误,使模拟请求传输路径的建模跟真实硬件传输路径更为一致。</p><p>集微网消息,近日,兆芯独家入选《上海金融科技发展白皮书》基础设施支持类科技企业,同时兆芯的新一代嵌入式处理器也一并入选白皮书。</p><p>在处理器建模领域中,当处理器传输数据的整个路径上只有一个源端发送请求时,功能加时序模型可以很好地模拟真实处理器的性能。但是,如果整个路径上有多个源端可以发送请求,由于功能模型是在请求生成的时候就进行调用,而多个源端到达请求汇聚点的路径延时是不确定的,汇聚点是指多个请求都会通过的路径节点或装置,这样会导致多个源端的请求在汇聚点看到的时序状态跟在请求生成时的差距较大。当大量的请求的处理路径跟功能模型不一致的情况下,最终建模呈现的性能指标就不能反映真实处理器的性能。因此,如何真实的模拟出处理器的性能,已成为本领域需解决的问题之一。</p><p>为此,兆芯于2020年9月29日申请了一项名为“处理器建模系统及处理器建模方法”的发明专利(申请号:202011054563.0),申请人为上海兆芯集成电路有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1141850468081.4688.png" alt="image" title="image"></p><p>图1 处理器建模系统的示意图</p><p>图1为本专利提出的一种处理器建模系统的示意图,处理器建模系统100包含多个源端装置A1~Am及一汇聚点装置PL。其中,源端装置A1~Am是向处理器发出请求的装置,例如输入输出装置、储存装置、图形处理器、预取装置等。</p><p>源端装置A1和An+1分别产生第一/二请求,并于第一/二传送时点传送两个请求。而汇聚点装置PL分别在第一接收时点和第二接收时点接收两个请求,并依据第一请求/第二请求选择传送路径(例如PT1)。其中,第一传送时点早于第二传送时点,第一接收时点接收晚于第二接收时点,且第一请求与第二请求欲存取的目标数据地址相同。如此一来,在多源端的处理器的仿真建模过程会发生多请求在到达汇聚点装置时出现路径不明的情况,最终导致建模结果呈现的性能指标与真实处理器不一致。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/538297132002.6487.png" alt="image" title="image"></p><p>图2 处理器建模方法的流程图</p><p>图2是本专利提出的一种处理器建模方法流程图,首先源端装置A1产生第一请求,第一请求为主路径请求。对于每一个请求,用第一路径信息来表示传统的功能模型的关键信息,用第二路径信息来表示真实时序的关键信息(可以真实反映时序的关键信息)(步骤210)。然后第一请求分别调用功能模型和时许模型,得到第一、二路径信息(步骤220、230)。然后第一请求被传送到汇聚点装置PL(步骤240),而汇聚点装置PL判断是否存在第二请求(步骤250)。汇聚点装置PL依据第二请求的第二路径信息选择传送路径PT1。因为目标数据地址中的信息已经先被先到汇聚点装置PL的第二请求取走了,所以依据第二请求的第二路径信息选择传送路径PT1(步骤260)。最后,汇聚点装置PL更新第二请求状态为合法的(步骤270)。</p><p>简而言之,兆芯的处理器建模专利,采用两套信息来记录一个请求路径的关键信息,解决多个请求在汇聚点装置中路径不明确的问题。同时依据第二路径信息可以纠正第一路径信息在汇聚点装置导致的路径错误,使模拟请求传输路径的建模跟真实硬件传输路径更为一致。</p><p>兆芯成立于2013年,掌握中央处理器、图形处理器、芯片组等三大核心技术。自从成立以来,兆芯已经成功研发、量产了多款通用处理产品,在业内得到了高度评价,并多次入围Silicon 100榜单、荣获各种“创新奖”、“成就奖”、“金奖”。希望在2023年成立十年之际,兆芯可以再创辉煌、更上一层楼!</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000387102</guid>
            <link>https://aijishu.com//a/1060000000387102</link>
        </item>
        <item>
            <title><![CDATA[后ChatGPT时代,AI芯片如何继往开来]]></title>
            <description><![CDATA[<p>集微网消息:“英伟达是否低估了芯片危机?”</p><p>2022年9月,《经济学人》杂志向黄仁勋发出了这样的质疑,彼时的英伟达,正被加密货币泡沫破裂、高端GPU出口遭限等事件连番打击,股价创下两年新低,市值距离2021年末的高点已蒸发逾60%。</p><p>杂志记者略显刻薄地评论道:“当他透过眼镜打量他觉得会改变AI面貌的花哨新模型,以及像元宇宙这样更模糊的概念,他是否存在低估此时此地残酷性的危险?”</p><p>一百多天后如火如荼的ChatGPT热潮下,黄仁勋在加州大学伯克利分校喊出“这是人工智能的iPhone时刻”,一吐胸中块垒。</p><p>的确,ChatGPT既是热度空前的“杀手应用”,也为英伟达股价注入强心剂,伴随去年末ChatGPT热度起势,英伟达在几家大芯片巨头中,也走出了久违的领涨表现,同期在外围市场,但凡能编织出“ChatGPT与我的故事”,不少芯片企业也获得了投资者的追捧。</p><p>不过在短暂的集体狂欢后,“ChatGPT概念”也必将分化,各路企业描绘的新蓝图成色几何,需要一把技术的标尺加以衡量。</p><p>垂直一体化模式的松动</p><p>毋庸置疑,ChatGPT远超前辈AlphaGo的热度,已经像火炬般清晰照亮了大模型应用前景。然而回顾iPhone当年横空出世之时,不少外界观察者仍习惯以现有厂商格局线性外推,认为苹果公司探明的“新大陆”,最终仍将是诺基亚囊中之物。</p><p>在“人工智能的iPhone时刻”后,AI产业新机遇,同样并非理所当然应许给旧玩家。</p><p>值得指出的是,从0到1完成复现乃至超越ChatGPT实际体验的大模型,对许多团队而言面临工程能力和经济成本的双重约束。</p><p>从工程能力要求看,大型语言模型(LLM)参数量短短几年从亿级迈入千亿级,对算力需求已远超处理器性能迭代速度,分布式并行计算也因此进入“深水区”,易并行(embarrassingly parallel)方法撞上天花板,必须开发子计算任务与处理器之间更为复杂的调度方法,相关人才目前十分稀缺。</p><p>而在经济成本上,以ChatGPT的“母体”GPT-3模型为例,据称如使用英伟达V100 GPU集群训练一次,不考虑调参排故的理论最低成本也将达到460万美元,微软公司专门为其开发者OpenAI打造的超算系统据称拥有超过28万个CPU内核和1万个GPU,整体性能可以达到2020年时全球TOP500超级计算机榜单前五,如果这一宣传基本属实,则相当于OpenAI在用一套完整的天河2号超算系统专门支撑其模型训练,这对大多数企业而言无疑太过奢侈。</p><p>以此观之,人工智能厂商目前从数据、算法到AI芯片、硬件终端、项目实施的端到端垂直一体化模式,未来或将走向更明晰的专业分工,少数拥有巨型算力集群的科技巨头在云端进行大规模预训练模型迭代,并将接口开放给下游厂商、开发者,产业链下游则基于领域特定知识在边侧、端侧以更低代价、更短周期完成模型精调,实现对垂直应用场景的高可用交付。</p><p>面对呼之欲出的“范式转变”,对大多数新老厂商而言,比起抢发“我司也有类似模型开发中”的新闻,更重要的工作,恐怕是对如何挖掘特定场景商业价值深思熟虑。</p><p>针对该话题的采访中,思必驰研发总监樊帅指出,“从现实来讲,平台巨头企业在研发投入、团队投入等方面拥有优势,这是毋庸置疑的”。不过随着ChatGPT的应用延伸,上下游企业都将在产业链关键环节做出贡献,对于下游厂商而言,“探索类GPT产品的市场应用,实现技术的商业价值是企业关注的重点,无论是产品工具还是产品方案,挖掘潜力场景,进行技术融合,输出整体性、结果导向性的实用解决方案才是现实问题。”</p><p>作为国内专业的对话式人工智能平台型公司,思必驰在类GPT模型的应用落地上也有颇多洞察。</p><p>樊帅表示,现在ChatGPT是以文本交互机器人的形式呈现,这种文本生成的方式其实有很大的应用空间,比如在智能客服方向,现在的智能客服是检索式AI,但是生成式AI主动性更高,更具亲和力和有效性。不论是搜索引擎、电商客服还是AI辅助生成,ChatGPT应用级创新能力很强。</p><p>樊帅预测,在需要基于一定背景知识的创作型产业,以及刚需AIGC的场景、具有SOP(标准作业程序)的行业,比如智能写作、智能客服、文档管理、代码生成、甚至游戏NPC等,是ChatGPT适宜落地的土壤。大模型技术可通过强化上下文理解能力、思维链推理、增强指令学习,来实现场景的融合应用。例如,在会议场景下,根据上千字的会议记录,工具可以迅速根据需求指令,整理出会议纲要及重点,清晰列出待办事项。</p><p>进一步具体到语音交互领域,樊帅认为,“未来往语音对话机器人去进阶,强化语音、文本、图像等深度融合的多模态交互技术应用,应对复杂场景的变化。这些都给大家留下思考、应用和探索的空间。思必驰聚焦对话技术,从对话能力输出上来看,具备情感化、高度拟人化的语音TTS存在发展潜力”,他还介绍称,思必驰在这一方向上已进行了探索,推出过具有“高兴、撒娇、抱歉”情感的语音合成技术,应用在有声阅读、智能客服、语音助手、视频配音等行业场景,能够满足更接近真人情感化表达的语音效果。</p><p>AI芯片路线之辨</p><p>正如上文所述,类GPT大模型的开发极度依赖于算力支撑,随着大模型参数量从百亿、千亿向万亿演进,新的人工智能产业竞争将进一步向算力环节聚焦,与此同时,上下游推理、训练工作负载的需求差异将越来越显著,也对芯片技术演进带来了新的牵引。</p><p>围绕这一议题,集微网采访了国内通用GPU领域产业化步伐领先的天数智芯半导体有限公司(简称天数智芯),该公司是国内首家实现通用GPU产品量产及规模应用的厂商,其天垓100产品目前已支撑近百个客户应用,产品涵盖数百个人工智能模型的训练业务场景。</p><p>天数智芯产品线总裁邹翾分析,ChatGPT背后的GPT3.5是一种颠覆性的底层技术,其惊艳的应用效果建立在巨量语料库以及超大规模的AI算力基础之上。随着应用场景的演进, 核心技术会加速发展,包括AI模型的复杂度还会不断演进, 这将产生对算力的产生井喷需求。</p><p>国内顶尖的企业和机构正在进行ChatGPT相关的技术研究及商用级产品开发。面对国内应用环境及中文语料,相关算法及模型预计将在未来1年左右逐步成熟。在互联网入口,家庭接入设备,办公等各不同领域,针对不同的场景可能会有不同的算法及产品出现,而支撑这些模型的算力底座需要具有良好的通用性及扩展性,才能够快速的支持这些变化的需求,实现商业的可持续化演化。</p><p>邹翾表示,未来继续看好通用GPU架构训练产品的发展空间,其通用性、兼容性、以及生态成熟度仍是未来一段时间内人工智能算法及应用构建的主要支撑。</p><p>与云侧对通用性、扩展性的需求相比,</p><p>在边侧、端侧,推理芯片面对的需求则有所差异。</p><p>思必驰研发总监樊帅表示,AI专用芯片可以在侧重于场景化的端侧实现特定场景低能耗,高算力,从定制化来看,ASIC专用AI芯片从效率角度更具优势,随着大模型的普及及应用,能够提升相关芯片产品的性价比。</p><p>与此同时,由于数据量的急剧提升,无论在云侧还是端侧,对于数据的隐私保护也提出了更高要求。樊帅强调,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。基于AI的应用和其他衍生的工具级产品,在隐私安全、知识产权风险等方面亟待规范。</p><p>邹翾也谈到,在近期的客户交流中能够感受到各界对ChatGPT的关注及开发态度,希望其成为效率提升的有效工具。不过用户也有对数据隐私的担忧,未来随应用扩展,亟需提供隐私计算的技术方案,实现“可用不可见“的计算方式,这也要求更强及更通用的算力支撑。</p><p>值得一提的是,对于大模型训练芯片,特斯拉、Cerebras等海外厂商正试图探索另一条前无古人的道路—通过设计等效超算集群的单个处理器训练大模型,完全绕过分布式并行计算的调度瓶颈。</p><p>特斯拉近期公布的Dojo D1自研AI芯片,就是将25个裸片通过硅中介层互联,构成单块“Dojo Training Tile”,更为激进的Cerebras,则推出了面积达462平方厘米的WSE-2处理器,声称具有85万个用于张量运算的可编程内核,单张WSE-2支撑的CS-2机柜,据称最多可支撑万亿参数规模的大模型训练。</p><p>邹翾表示,新兴技术是针对目标问题的探索,会呈现出百花齐放的局面,在开放环境下竞争将驱使其收敛,市场是最终检测的试金石。在技术发展路线上需要从各个方向去尝试,最终都是为产业的发展贡献自己的力量。</p><p>结语</p><p>“人工智能的iPhone时刻”,的确代表了许多人对ChatGPT热潮的感受,全球公众与行业机构被“卷入”其中的速度,已经清晰昭示出未来更多、更大应用创新沿着这一方向喷薄而出的图景。</p><p>在警惕短期过度炒作和跟风的同时,类GPT模型对人工智能商业模式和产业格局带来的长期影响,亟需相关厂商冷静观察,沉着应付,有所作为。</p>
                                                    ]]></description>
            <pubDate>Fri, 24 Feb 2023 15:15:40 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000386766</guid>
            <link>https://aijishu.com//a/1060000000386766</link>
        </item>
        <item>
            <title><![CDATA[澜起科技提出系统安全防御方案 避免恶意程序攻击而崩溃]]></title>
            <description><![CDATA[<p>【爱集微点评】澜起科技提出的用于保护系统安全的安全防御方案,该方案通过双架构中的安全区对接收来自用户区的指令来源进行身份验证,从而避免了被恶意程序攻击而导致的系统安全问题。</p><p>集微网消息,目前,CPU和内存等芯片在物理设计时有其正常工作的电压和频率范围,超出正常范围则存在功耗过大烧毁或者时序、逻辑运算不稳定或者死机的情况,不稳定可能导致被攻击,防护程序被绕过或者密钥被窃取等问题。</p><p>电压和频率的控制是通过主板和内存条上的智能硬件电路来实现的,通过驱动程序等软件修改相应的CPU寄存器、主板相关电路的地址或端口、内存相应的参数区中的参数来实现电压和频率的调节。</p><p>为了系统安全,此类操作往往需要最高的系统权限,甚至在BIOS固件里进行调节,但是固件、木马或者攻破操作系统获得系统权限的恶意程序可以实现电压和频率配置,从而导致系统不安全。</p><p>为此,澜起科技在2022年3月16日申请了一项名为“一种安全防御方法、装置、设备及存储介质”的发明专利(申请号:202210259021.X),申请人为澜起科技股份有限公司。</p><p>根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/437905773410.57446.png" alt="image" title="image"></p><p>如上图,为该专利中公开的一种安全防御方法的流程图,该方法可以应用于中央处理器中的安全区。首先,系统接收加密的目标选项调节指令,以便利用预存储的密钥对加密的目标选项调节指令进行解密操作,以判断加密的目标选项调节指令的来源是否为用户区。</p><p>其次,当加密的目标选项调节指令的来源为用户区时,将本地存储区域内存储的第一随机码发送至选项控制单元,以便选项控制单元对第一随机码进行验证,并在验证成功后执行目标选项调节指令。在该过程中,当加密的目标选项调节指令的来源为用户区时,会将本地存储区域内存储的第一随机码发送至选项控制单元。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/690881846244.347.png" alt="image" title="image"></p><p>如上图,为上述安全防御方法的示意图。中央处理器采用双架构,将中央处理器分为用户区与安全区两部分,其中安全区是物理隔离,不会受到用户区的攻击。当目标调节指令为电压和频率调节指令时,图中左侧标有叉号的箭头直接连接用户区与电压和频率控制单元,表示现有技术中用户区会与电压和频率控制单元直接通信,可能会存在电压和频率控制单元执行来源为恶意程序的目标选项调节指令的情况发生。</p><p>在该方案中,中央处理器的安全区接收到电压和频率调节指令,然后利用预存储的密钥对加密的目电压和频率调节指令进行解密操作,即图中的验签操作。若电压和频率调节指令的来源为中央处理器的用户区时,将安全区中存储的随机码发送至电压和频率控制单元进行比对,比对成功后执行电压和频率调节指令。</p><p>最后,接收选项控制单元发送的第二随机码,并在本地存储区域内存储用于替换第一随机码的第二随机码。这是由于中央处理器中的安全区将第一随机码发送至选项控制单元后,第一随机码已失效。因此需要将接收到的选项控制单元发送的第二随机码存储在本地存储区域内,使用第二随机码覆盖第一随机码,使得本地存储区域内仍旧只存储一个随机码。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/330692839827.988.png" alt="image" title="image"></p><p>如上图,为上述安全防御装置的结构示意图。该装置包括有:指令接收模块11、随机码验证模块12和随机码更新模块13。指令接收模块用于接收加密的目标选项调节指令,以便利用预存储的密钥对加密的目标选项调节指令进行解密操作。随机码验证模块用于当加密的目标选项调节指令的来源为用户区时,将本地存储区域内存储的第一随机码发送至选项控制单元。随机码更新模块用于接收选项控制单元发送的第二随机码,并在本地存储区域内存储用于替换第一随机码的第二随机码。</p><p>以上就是澜起科技提出的用于保护系统安全的安全防御方案,该方案通过双架构中的安全区对接收来自用户区的指令来源进行身份验证,从而避免了被恶意程序攻击而导致的系统安全问题。</p>
                                                    ]]></description>
            <pubDate>Fri, 24 Feb 2023 15:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000386770</guid>
            <link>https://aijishu.com//a/1060000000386770</link>
        </item>
        <item>
            <title><![CDATA[3nm的“剧本杀”:有人吃饱,有人跌倒,有人意难平……]]></title>
            <description><![CDATA[<p>集微网报道(文/李映)开局不利,这会是代工巨头台积电在2023年首季的剧本吗?</p><p>面临行业景气度下行以及去库存消化的影响,台积电不仅下调Q1营收及全年资本支出,还放下身段松动代工价格,并在多方考量之下推迟欧洲建厂。在收缩战线之际,又传出英特尔推迟与台积电3nm合作订单的消息。</p><p>作为先进工艺的王者,台积电在今年3nm(N3)的规划是占其总营收的4-6%,估算下来为30-45亿美元。对于英特尔订单推迟,业界先有分析称将影响产能利用率,对其营运造成影响。</p><p>但反转比变脸还快。据透露,苹果已采购了100%的初始N3供应,很可能用于即将推出的 iPhone 15 Pro 系列以及计划于2023年下半年推出的新款 MacBook。且在手机去库存加速和HPC等需求高涨走势下,联发科、高通、AMD、英伟达等相比预计会加快下单3nm以及更具优化的N3E工艺,台积电全年3nm将走向满载。</p><p>反观3nm的先行者三星虽然率先量产,但目前买单者只有一些矿机企业,对比之下或不得不发出“起了大早赶个晚集”的喟叹。</p><p>英特尔数次推迟</p><p>推迟的戏码可谓是一再上演。</p><p>按照英特尔最初的计划,第14代Meteor Lake系列处理器采用多芯片堆叠设计,GPU部分将交付台积电3nm代工。但后来转向5/6nm制程,计划下一代即第15代Arrow Lake的GPU部分导入台积电3nm工艺。</p><p>没想到由于产品设计和工艺验证问题,该计划被推迟到2023年上半年,后来该产品的量产计划又因某种原因再次推迟到2023年底,现在则又要推迟到2024年4季度……</p><p>业内人士表示,这一推迟几乎完全取消了原定于2023年的3nm产能,只剩下少量的晶圆投入用于工程验证。</p><p>但从客户优先级来说,上述人士认为,在3nm工艺层面,苹果、AMD、英伟达下订单的时间都比英特尔更早,客观来说英特尔的订单优先级或相对靠后,而延后或是一种保护面子的“官方说法”。</p><p>再三推迟之下,英特尔原本期待的首发看来要变成“末发”了。英特尔近年流年不利,遭遇PC和服务器市场需求下滑和竞争对手的反击,导致PC平台蓝图频繁修改,产品上市延迟也进一步扰乱了供应链的节奏。</p><p>而英特尔的麻烦不止于此。面对2022年营收和利润快速下降的情形,英特尔不久前表示,正计划削减整个公司的管理层薪酬。且在PC市场疲软和竞争加剧的情况下,预计2023年第一季度仍将继续亏损。</p><p>台积电3nm将“满载”</p><p>在英特尔延后3nm订单仅仅两日,就爆出苹果包圆台积电3nm产能的消息,苹果这一举动着实给台积电送上了“定心丸”,特别是在代工业迎来“倒春寒”之际。</p><p>受经济下行叠加多重因素影响,有称台积电2023年上半年整体晶圆厂产能利用率预估跌至80%,其中7/6nm制程产能利用率跌幅扩大,5/4nm产能利用率从今年1月开始逐月下滑。台积电虽未直接松动代工价格,但私下按客户与订单规模不同,给予优惠。</p><p>但代工价格高昂的3nm制程却是“另一番天地”,在客户、产能等方面,正从一个胜利走向另一个胜利。</p><p>随着手机去库存加速,不仅苹果已获得了N3的所有可用订单,且高通、联发科也在加速下单。高通预计2023年第4季推出的Snapdragon 8 Gen 3将采用N3E制程;原预期2024年才会加入3nm行列的联发科,预计最快2023年12月就会推出首款N3E制程芯片。此外也传出Oppo已计划在台积电投片3nm。</p><p>N3E是3nm的升级工艺。目前N3工艺的EUV光罩层数为25层,预计二三季度量产的N3E工艺的EUV光罩层数则从25层减少到21层,可使芯片拥有更佳的效能、功耗和良率。</p><p>在手机芯片3nm起势之际,HPC需求也持续强劲,相应的AMD、英伟达等一众“拥趸”也将为台积电3nm节点营收贡献动能。</p><p>此外,在产能方面也会一扫稼动率不足的窘境。据悉台积电的3nm工艺于12月下旬开始,并在逐步扩大工艺产能,3月晶圆月产量将达到 45000片。有分析称,其3nm制程不仅在第一二季满载,在进入下半年后加上N3E的量产以及新客户的加持,全年3nm产能都呈现满载状况。</p><p>看起来,3nm俨然要成为台积电的新“台柱”。</p><p>三星“起大早赶晚集”</p><p>反观作为第一首发3nm的三星,市场天平却依旧没有向它倾斜。</p><p>三星抢先于2022年6月底进入3nm GAA世代,但据上述行业人士透露,从价格来看,相当于台积电价格打九折,相比于巨大的研发和设备开支,也算是诚意满满了。但目前只有一些中国矿机企业下单,对比台积电3nm“王者联盟”式的客户,仍有巨大落差。</p><p>而良率无疑是横亘其中的一大“障碍”。有关台积电及三星的3nm良率一直都是个谜,此前传闻说三星3nm良率仅有10-20%,台积电3nm良率可达70-80%,这恐有失偏颇。而且后者的良率也太高了,又被戳穿实际上只有不到50%的良率。</p><p>尽管实际对比不会这么悬殊,但三星3nm良率不如台积电应是实情。三星自然也在加足马力,通过全面合作和全力攻关,据悉三星3nm良率已大幅提高。</p><p>三星一位高管在日前受访时表示,相比于此前受困的良率问题,三星第一代的3nm制程良率已接近完美,第二代3nm工艺也迅速展开。</p><p>相应的,客户的积极性也在提升。据悉除了三星自用之外,其3nm工艺还锁定了四大客户,包括IBM、英伟达、高通及国内的百度公司,这些公司综合考虑了过去的战略合作伙伴关系、供应链的必要性等因素,选择三星作为芯片代工企业。</p><p>值得一提的是,英特尔计划于2023年底推出3nm(Intel 3)节点,在三大巨头皆进入3nm制程时代之后,未来3nm制程亦将成为先进工艺代工的主流。有预计到2025年,3nm制程市场的产值将会高达255亿美元,超越当时5nm制程预估的193亿美元产值。</p><p>而谁会笑在最后?</p>
                                                    ]]></description>
            <pubDate>Fri, 24 Feb 2023 15:15:33 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000386774</guid>
            <link>https://aijishu.com//a/1060000000386774</link>
        </item>
        <item>
            <title><![CDATA[ChatGPT席卷全球背后:中美人工智能差距几何?]]></title>
            <description><![CDATA[<p>集微网报道 (文/陈兴华)ChatGPT以迅雷不及掩耳之势席卷全球多国同时,在中国也掀起前所未有的舆论热议,同时多家互联网、人工智能及产业链企业均表示将推进类ChatGPT应用和相关AI技术。</p><p>然而,国内舆论主要聚焦在ChatGPT使用体验、产业链相关受益方以及对产业变革影响等方面,鲜有探讨其背后折射出的中美人工智能生态竞争差异,中国缘何没有率先创造出ChatGPT,以及应如何利用相关AI技术带来的新机遇赋能国内产业经济发展。</p><p>相比之下,主流外媒对这类话题从制度、创新环境和人才竞争等多个层面提供了一些可供参考的分析借鉴。此外,国内行业人士指出,ChatGPT将刺激开启AI经济新时代,推动中国相关数据、算法和算力技术开发建设,对万物互联的数字经济发展意义非凡。</p><p>为什么ChatGPT没有出现在中国?</p><p>作为科技产业、社会经济发展的一项变革性技术与关键性力量,人工智能未来将深刻影响各国经济、科技和军事等综合实力对比,甚至重塑世界竞争格局。而经过多年行业发展演变,目前全球人工智能发展呈现中美两国引领、主要国家激烈竞逐的总体格局。</p><p>对于为何ChatGPT这一现象级消费类AI应用没有率先出现在中国,纽约时报、路透社、南华早报、CNBC等国际主流媒体刊文和一些分析师观点均提及“审查制度”,包括中国正寻求加强与美国AI竞争以及技术监督之间的平衡,但审查管制阻碍了科技产业发展。即使中国开发出ChatGPT相关产品,“过多限制、内容监管也可能会阻碍其商业化和进一步创新。”</p><p>另一方面,以往基于政府支持及较宽松的发展环境,中国互联网科技企业曾创造出举世瞩目的成就,但后续也因一定程度的无序扩张等因素引致监管。如今,随着国际地缘和产业发展形势演变,如何权衡互联网及AI等科技领域的监管力度和方式已成为国内重要课题。</p><p>“任何重要技术方面的产品发展,其实都离不开制度和整个环境,”斯坦福中国经济与制度研究中心高级研究学者许成钢表示。他以TikTok的中国版抖音为例,称中国企业未来可能无法再实现此类创新。因为开放的环境一旦没有了,重大创新就很难出现。</p><p>对于中国未首先打造出ChatGPT类似产品,产经观察家、IT行业分析师丁少将对集微网表示,在当前宏观经济和产业环境下涉及多重原因,包括创新和文化环境、内容监管,行业企业的资本投入、技术实力以及资源整合和商用落地等多方面。另外,“这类产品推出之前还有很多确保内容安全等前置性工作需要去做,这在中国特别重要。”</p><p>从产业发展角度来看,这也考验的是国内企业家和投资者的魄力。丁少将指出,“ChatGPT背后AI的数据训练、数据建模和人力投入等成本其实非常高。但基于商业化前景不明朗和自身资源实力等判断,中国公司在这方面投入还有所欠缺,不及微软等巨头公司。”</p><p>不过,国外科技媒体Semafor表示,美国进行开放式人工智能研究的传统比中国要长得多,而且并非“只是受利润动机的限制”。OpenAI最初是一家非营利性研究组织,其唯一目的是开发先进的人工智能。从这一角度而言,或许可以引发国内产业界更多思考。</p><p>中美AI产业链底层技术尚存差距</p><p>正如百度创始人、董事长兼CEO李彦宏1月在百度Create开发者大会上所言,“芯片卡脖子很要紧,但软件卡脖子其实一样要紧”。需要客观承认的是,ChatGPT在全球多国势如破竹同时,也映衬出中国在AI产业链软硬件关键及底层技术存在的部分差距及相关挑战。</p><p>众所周知,ChatGPT是一种由OpenAI训练的大型语言模型。在业内人士看来,目前全球还没有能跟ChatGPT抗衡的大模型,业界共识是中美差距在两年以上。“中国必须要有自主基座、应用大模型。由于OpenAI关键模型不开源只给API使用,中国已经是被‘卡脖子’了。”清华大学计算机科学与技术系长聘副教授黄民烈日前对国内媒体表示。</p><p>此外,黄民烈还提到,在迭代至GPT-3过程中,OpenAI建立起了真实的用户调用和模型迭代之间的飞轮,以及非常重视真实世界数据的调用和数据对模型的迭代,同时也推动相关生态建立。但业内人士称,目前国内还没有比较好的公司把数据和模型的飞轮完整转起来。</p><p>“从已有资料看,ChatGPT、文心一言都使用了包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用技术。从这四方面,如果说相关技术被‘卡脖子’,芯片可能是一个,既要算得便宜还要算得快,需要至少6纳米芯片,将来还需要更精密的3纳米以下芯片。”中国电信首席专家、美国贝尔实验室院士毕奇日前接受《法制周末》表示。</p><p>另据国内外媒体和专家学者均指出,美国的半导体禁令和其他贸易制裁将可能导致中国在最新的人工智能竞赛中处于劣势。由于担心美国进一步制裁,中国大型科技企业已储备足够的先进芯片,但如果无法获得下一代芯片,人工智能技术的进一步发展可能会受到严重阻碍。</p><p>与此同时,顶尖AI人才外流也是重要挑战。根据智库MacroPolo的数据,虽然中国总体培养了大约30%的顶尖AI研究人员,但大多数流失到了美国。纽约时报曾刊文《美国人工智能领域的秘密武器:中国人才》指出,在人工智能尖端热门领域,很多来自美国的开创性工作都由华人的智慧推动。这便不难解释美国顶尖AI研究及学术机构、专家学者等不乏华人身影。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1354563635305.925.jpg" alt="image" title="image"></p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/100775343913.72034.jpg" alt="image" title="image"></p><p>图源:纽约时报</p><p>AI新技术应用将催化数字经济发展</p><p>尽管ChatGPT的大模型产品当前在全球相对领先,但由于中美在AI大数据、算法、大模型发展路径存在一定程度不同,中国在相关技术产品的发展上也有自身特有优势,其中包括中国产业界在ChatGPT等人工智能技术软件层面具有更好的传统开发实力,以及能够让更多大数据应用积极地与人工智能结合,尤其在如今系统芯片呈现算法固化的特点情况下等。</p><p>此外,麻省理工科技评论援引华盛顿大学政治学助理教授杰弗里·丁(Jeffrey Ding)的话进一步表示,中国可以更好获得中文AI训练材料,并且出于商业目的快速开发新的产品。OpenAI、微软主要是针对英语市场进行优化。相对而言,百度等中国公司并非要占领英语市场,会针对中文领域进行专门优化升级。这其中存在一个真实而独特的优势和机会。</p><p>毋庸置疑,ChatGPT的大热也将促进国内数据算法迭代升级、智算中心建设乃至整个人工智能产业生态的发展。例如以GPT为代表的大模型正在催化新一轮AI算力储备,国内智算中心项目近期密集公布新进展。目前,全国已有超过30个城市正在建设或提出建设智算中心,可带动人工智能核心产业和相关科技产业实现数倍级增长。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/573235005362.3618.jpg" alt="image" title="image"></p><p>湖北随州5A级智算中心 图源:中科曙光</p><p>在ChatGPT刺激推动下,创道投资咨询总经理步日欣表示,“AI如果进一步与工业、制造业、交通运输业等传统行业结合,将实质性提高生产力水平,并且有助于缓解即将到来的人口老龄化等社会经济问题,从而体现技术最根本的价值。”另据麦肯锡的报告表示,随着人工智能和机器学习技术渗透到各行各业,其每年可为中国经济带来达6000亿美元GDP。</p><p>为了释放这一庞大产业价值,中国需要对数据生态、前沿技术、各类人才和商业模式以及标准和法规进一步投资和完善,并利用相关优势应对挑战和“扬长补短”。如对于高性能芯片受制于人,相关专家表示,解决方法包括自研CPU芯片,采用Chiplet或分布式芯片替代。而弯道超车路径之一是,号召各类拥有数据的机构参与预训练及与芯片计算架构公司等深度合作。</p><p>对于如何把握AI新技术为国内产业发展带来的机遇,丁少将建议称,第一,对发展前沿科技而言,构建开放包容的环境至关重要。第二,国家及社会资本应更加活跃,并加大对创新型企业的激励和战略支持。第三,推动AI科技创新和各产业发展相融合,让其成为具有商业潜力和前景的新技术和产业,进而成为各企业新的增长引擎,乃至促进整个国民经济发展。</p><p>(校对/杜莎)</p>
                                                    ]]></description>
            <pubDate>Thu, 23 Feb 2023 15:15:40 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000386418</guid>
            <link>https://aijishu.com//a/1060000000386418</link>
        </item>
        <item>
            <title><![CDATA[关注设备电池健康 国轩高科提出电池健康状态实时监控及评估方案]]></title>
            <description><![CDATA[<p>【爱集微点评】国轩高科公开的电池健康状态实时监控及评估预测方案,针对当前传统三维度电池健康监控及评估的短板,基于四维度电池健康监控及评估方法,通过结构创新,采用三个不同层级分别对电池的实时压力进行采集。进而通过信号处理和分析,实现了电池健康的实时监控和评估。</p><p>集微网消息,锂离子电池在运行过程中,近似于一个黑匣子,它的安全始终是消费者关注的问题,能够实现电池健康状态可视化也是各大主机厂十分关心的难题。现有的用于电芯实时状态监控和评估的健康因子有电压(U)、电流(I)和温度(T)。</p><p>然而,在此基础上的健康状态评估存在一个短板,就是“U/I/T”在电池生命周期的不同状态下的差别并不大,仅会在一些突发状态下个别因子才会发生较大波动。而这已经不是真正意义上的健康评估,而是突发状态下的预警,这对于电池实时的健康评估和监控是远远不够的,存在安全隐患。</p><p>基于现有最新的研究成果,电池在生命周期运行过程中的压力和寿命之间有着密切联系,并且呈现出正相关的关系。当电池的寿命衰减加速时,对应的压力也呈现出相同的加速增长的趋势,当电池运行稳定时,其压力变化也相对稳定,不会发生较大的突变,完全可以通过压力的变化趋势,实现电池的健康评估。</p><p>该原理为通过压力的实时数值和离群度,实现电池的实时健康监控。并且将电池运行过程中的压力作为新的健康因子,建立电压(U)、电流(I)、温度(T)和压力(P)四个维度上的健康监管平台。从而辅助电池更准确、更及时的健康监控和评估,以弥补传统“U/I/T”三维度评估的短板。</p><p>因此,为了实现这种能够实时监控和评估电池健康状态的方案,国轩高科在2022年11月11日申请了一项名为“一种电池健康状态实时监控及评估预测装置”的发明专利(申请号:202211409572.6),申请人为合肥国轩高科动力能源有限公司。</p><p>该专利分别在电芯级别、多层电芯级别以及系统级别描述了如何实现电池的健康状态评估及实时监控。根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/818099872778.0901.png" alt="image" title="image"></p><p>首先,在电芯级别,如上图,为集成有喷涂式压力传感器的电池内部示意图。对于电芯内部极片102,根据极片的成组原理,沿着箭头方向,最外围的极片的远离电芯中心的面在电池运行过程中并不会参与电化学反应,也就是说该极片表面并没有被充分利用。</p><p>而为了实现电池健康状态的评估,可以选取该极片表面实现喷涂式压力传感器101的布置,进而在电芯制作过程中就实现电芯本体与压力传感器的集成,并且该种压力传感器可实现信号的无线传输。该种形式的电芯在模组或者系统成组后,可以完成本体的压力自测,后将压力信号输出后,配合电池管理系统实现信号的处理和分析,进而根据压力和电芯寿命的关系,实现电池的健康状态评估及实时监控。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/93603020343.23683.png" alt="image" title="image"></p><p>如上图,为该专利中展示的电芯压力与寿命之间关系示意图。可以看到,随着循环圈数的增加,电池容量保持率(电池寿命)和压力之间的关系。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1571811746644.0806.png" alt="image" title="image"></p><p>其次,在电芯级别中,还要考虑不同层之间电芯层级的关系,如上图所示,为集成有离电柔性压力传感器的电池内部示意图。电芯内部极片102之间插入离电柔性压力传感器201层,作为独立的一层。进而在电芯制作过程中就实现电芯本体与压力传感器的集成,并且该种压力传感器可实现信号的无线传输。该种形式的电芯在模组或者系统成组后,可以完成本体的压力自测。然后将压力信号输出后,配合电池管理系统实现信号的处理和分析,进而根据压力和电芯寿命的关系,实现电池的健康状态评估及实时监控。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1398234646315.2043.png" alt="image" title="image"><br>最后,在系统层级,如上图,为集成有圆环式力传感器的系统示意图。通过在成组电芯301与箱体401之间布置圆环式力传感器402,进而在系统制作过程中实现电芯与压力传感器的集成。该种形式的系统在完成装配后,可以完成电芯的压力监测,后将压力信号输出后,配合电池管理系统实现信号的处理和分析,进而根据压力和电芯寿命的关系,实现电池的健康状态评估及实时监控。</p><p>以上就是国轩高科公开的电池健康状态实时监控及评估预测方案,该方案针对当前传统三维度电池健康监控及评估的短板,基于四维度电池健康监控及评估方法,通过结构创新,采用三个不同层级分别对电池的实时压力进行采集。进而通过信号处理和分析,实现了电池健康的实时监控和评估。</p>
                                                    ]]></description>
            <pubDate>Thu, 23 Feb 2023 15:15:40 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000386469</guid>
            <link>https://aijishu.com//a/1060000000386469</link>
        </item>
        <item>
            <title><![CDATA[为提高电阻器抗浪涌能力 鼎声微电提出相关技术及加工设备方案]]></title>
            <description><![CDATA[<p>【爱集微点评】鼎声微电公开的抗浪涌电阻器及其加工设备方案,鉴于目前电阻器的发展受到尺寸的约束,该方案在电阻器本体的侧面增加了侧面电阻体,这样无需增加电阻器本体的尺寸,也可进一步提高电阻器本体的抗浪涌能力。</p><p>集微网消息,贴片电阻又名片式固定电阻器,常规的贴片电阻多是采用丝网印刷将电阻性材料淀积在绝缘基体上,然后烧结形成的,具有耐潮湿、耐高温和可靠度高的优点。贴片电阻是使用的过程中,常会遇到浪涌,浪涌也叫突波,顾名思义就是超出正常工作电压的瞬间过电压,电阻被施加这种浪涌电压时,过度的电应力会使电阻特性受到影响,最坏的情况下可能导致芯片损坏。</p><p>抗浪涌电阻器具有较好的抗浪涌能力,其原理是:拉长电极间距,使电位梯度平缓,从而减少对芯片的损坏。简单的说:正常情况下,贴片电阻上的电阻体在两个电极之间是直来直往的,呈一条直线状。而抗浪涌电阻器上的电阻体则呈波浪状,通过在电极之间设置长度较长的电阻体,使得电极间的导通路径变长,进而使得电位梯度变得平缓,从而提高抗浪涌能力。</p><p>在现有技术中,贴片电阻上的电阻体都是先通过丝网印刷的方式,将电阻性材料按照一定的形状印刷在绝缘基体上,然后再烧结而成的。常规的丝网印刷只能将电阻性材料印刷在绝缘基体的上表面处,但是绝缘基体的上表面的面积是有限的。当需要进一步提高电阻的抗浪涌能力时,只能采用增加电阻器尺寸的方式来实现,而大尺寸电阻器则需要更多的电路板空间,虽然增加了电阻器的抗浪涌能力,但是又会带来新的其他问题。</p><p>为此,鼎声微电在2021年11月16日申请了一项名为“一种抗浪涌电阻器及其加工设备”的发明专利(申请号:202111354948.3),申请人为宁波鼎声微电子科技有限公司。</p><p>根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1417490822062.9102.png" alt="image" title="image"></p><p>如上图,为该专利中公开的抗浪涌电阻器本体结构的示意图,在该电阻器的两端均设置有电极2和电阻3,电阻由端部电阻体301、表面电阻体302和侧面电阻体303三部分组成。表面电阻体呈长条状,均布在电阻器本体的上表面。侧面电阻体呈U形状,位于电阻器本体的两侧,通过侧面电阻体将表面电阻体相互连接在一起。端部电阻体位于电阻器本体的两端,通过端部电阻体使电极与表面电阻体连接在一起。</p><p>为了提高电阻器本体的抗浪涌能力,在本体上设置了由端部电阻体、表面电阻体和侧面电阻体组成的电阻,端部电阻体和表面电阻体均位于电阻器本体的上表面。正常情况下,电阻器本体上表面的面积是有限的,如果采用增加电阻长度的方式来提高电阻器本体的抗浪涌能力,当电阻器本体上表面的电阻的长度无法再增加时,只能增加电阻器本体的尺寸。</p><p>当电阻器本体的尺寸变大后,这样电阻器本体的上表面就可排布更多的电阻,但是电阻器本体的尺寸变大后,则会带来新的问题。该专利中的方案对电阻器本体进行改进时,在电阻器本体的侧面增加了侧面电阻体,端部电阻体、表面电阻体和侧面电阻体为一个整体,这样就无需增加电阻器本体的尺寸,也可进一步提高电阻器本体的抗浪涌能力。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1576156235607.1685.png" alt="image" title="image"></p><p>为了能够方便加工该抗浪涌电阻器,在该专利中还公开了一种抗浪涌电阻器的加工设备,如上图所示。印刷台4的上侧设有丝网印刷机构,该结构包括丝网印板5、第一升降板6和第二升降板7。第一升降板上对称设有第一气缸8,第二升降板位于第一升降板的一侧,且第二升降板与第一气缸的活塞杆固定连接。第二升降板的下端设有刮板,丝网印板上设有若干个第一开口501。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1361348511722.1265.png" alt="image" title="image"></p><p>如上图,为丝网印板、第一固定座和第二固定座的剖视图。丝网印板的下侧设有若干个侧面印刷组件,且侧面印刷组件包括第一固定座10和第二固定座11,二者均为空心结构,并与丝网印板滑动连接。且两个固定座的一侧均设有走料槽12,走料槽与第一开口连通。</p><p>在该结构中,通过对现有的电阻印刷设备进行改进,使得在对电阻进行丝网印刷时,可以在电阻器本体的上表面及侧面均印刷上电阻体,加工更加方便。具体的工作原理:在印刷台上设有丝网印刷机构,丝网印刷机构的下侧设有若干个侧面印刷组件,丝网印刷机构与侧面印刷组件配合使用,共同完成电阻器本体上表面和侧面的电阻体的印刷。</p><p>在使用时,浆液状的电阻性材料通过管接口13进入第一固定座和第二固定座内,在充满两个固定座的内部空腔后,会通过走料槽流出。走料槽的形状与侧面电阻体相同,而且走料槽的上端与第一开口连通。物料通过走料槽进入第一开口并聚集,随着物料的聚集,部分物料会堆积在第一开口内,然后管接口停止进料,第二气缸工作,使第一升降板向下运动。</p><p>此时,第一升降板会带着第一气缸及第二升降板一起运动,第二升降板上的刮板与丝网印板抵触。随后第一气缸工作,推动第二升降板和刮板往复运动,通过刮板来将第一开口处的物料刮平。同时,在印刷台一侧设有刮料机构,通过刮料机构可以将走料槽处的物料刮平,随后第一固定座和第二固定座反向运动,接着第一升降板和第二升降板回归原位。侧面电阻体和上表面电阻体同时印刷完成,然后将丝网印板取下,将带有印刷工件的载料板取走即可。</p><p>以上就是鼎声微电公开的抗浪涌电阻器及其加工设备方案,鉴于目前电阻器的发展受到尺寸的约束,该方案在电阻器本体的侧面增加了侧面电阻体,这样无需增加电阻器本体的尺寸,也可进一步提高电阻器本体的抗浪涌能力。</p>
                                                    ]]></description>
            <pubDate>Wed, 22 Feb 2023 15:15:40 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000386150</guid>
            <link>https://aijishu.com//a/1060000000386150</link>
        </item>
        <item>
            <title><![CDATA[一手、二手设备进口同步承压,光刻机自立自强该如何破题?]]></title>
            <description><![CDATA[<p>集微网消息,对华先进半导体制造设备的管制之网,正越收越紧、越撒越广。</p><p>2月16日,美国商务部、司法部、FBI、国土安全调查局与12个州的检察官办公室联合组建出口管制执法“特别工作组”,以“打击非法行为者”并保护先进半导体制造设备等关键技术不被“民族国家对手”获取。</p><p>织密自家网眼的同时,这张瞄准先进半导体制造设备贸易的大网也已纳入日本、荷兰,外界普遍预计两国将看齐美商务部去年10月7日新规。</p><p>正如中国半导体行业协会严正声明所述,此举如果成为现实,将对中国半导体产业造成巨大伤害。</p><p>作为半导体制造设备中公认“最短的短板”,光刻机再次成为各界关注这一问题的焦点,不过遍观行业内外当前堪称汗牛充栋的讨论,在“要做什么”(What)的层面往往过于宏观、流于务虚,对“怎样去做”(How)更甚少着墨。</p><p>比设备禁运更巨大的威胁是什么?</p><p>回顾去年10月7日以来的不少“专家”观点,往往对美国当局的政策影响和“后手”布局预期不足,以至于在一步紧似一步的快节奏地缘因素变化中,颇有“今日割五城,明日割十城,然后得一夕安寝。起视四境,而秦兵又至矣”的被动感。</p><p>按照目前推测,日本、荷兰光刻机对华出口管制标准将是能否实现28纳米以下产品制造。部分高端DUV浸没式光刻机如ASML NXT:2050i,由于具备通过多次曝光等工艺增强方法制造7纳米、甚至5纳米先进制程产品的技术潜力,因此尽管其良率、精度上都无法与EUV光刻机媲美,但此次恐怕将很难幸免于管制罗网。</p><p>ASML财报预计,荷兰管制新规起草生效将需要“很多个月”(many months),因此在2023年内不会产生实质性影响,但这绝不意味着能够喘口气,歇歇脚。这一新规对光刻机的限制是否会涵盖相应零配件和运维服务,目前仍有相当大不确定性,需要引起国内高度关注。</p><p>作为技术复杂度极高的设备,光刻机使用过程中需要持续、高强度的运维保障,如定期针对光学镜头磨损进行像差、焦距的调整;不定期更新定标、校正、运动控制的大量软件算法;或根据晶圆厂工艺技术研发需求协助改装升级产品,提升产量或分辨率。</p><p>以ASML为例,这家“光刻巨人”配备超过9000人的客户支持团队,在中国、韩国等客户密集区域就近设有维修厂站,2022年服务板块收入就达到了57亿欧元。深入晶圆制造一线的现场工程师团队,也如同毛细血管一样,源源不断将基础数据与knowhow反馈给公司研发部门,为新产品迭代建立了坚实基础。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/600664647912.70261374332161306.1428.png" alt="image" title="image"></p><p>正因如此,假如ASML等厂商被迫停止对特定型号浸没式光刻机的运维支持,即便相关设备已经“抢购”、“抢运”到位,后续的技术升级乃至基础运维也有巨大的不确定性。有近二十年半导体厂设备材料实务经验的工程师杜元贺向集微网表示,没有原厂支持,光刻机部分软件功能将无法更新升级,而如果说软件受限还能勉强“凑合”,一旦出现大的故障,专用备件又该从何而来?</p><p>外界有观点认为,目前东亚、东南亚区域的二手半导体设备流通网络可以解决这一问题,然而在美国当局将组建“特别工作组”强化执行的情况下,这一网络的可靠性面临考验。事实上,2012年、2014年,就先后有两位中国公民因万机仪器(MKS Instruments)敏感设备转售伊朗,而遭美国执法部门海外诱捕,其中一位还是MKS中国分支机构销售经理。值得一提的是,MKS也同样是ASML的重要上游供应商,从这一案例,不难窥见美国一旦“认真起来”,对敏感技术海外地下市场流通的控制力。</p><p>更进一步展望,杜工向集微网指出,在尝到甜头后,美国当局或许会越来越激进地将光刻机等关键核心半导体设备“武器化”:“这就是高悬在我国半导体事业上的达摩克里斯之剑。随时都有可能对我进行封锁禁运,如果参照俄乌冲突,我们有任何一个地方忤逆或者没有按照美国的意愿行事,这个达摩克里斯之剑随时都会砸到我们的头上。何止DUV光刻机,哪怕美国,日本,荷兰I线光刻机,包括二手光刻机禁运,我们也将十分被动。”<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/998220003584.1417400574149634.22784.png" alt="image" title="image"></p><p>此外,在光刻工艺量测设备领域,ASML与KLA也具有垄断性优势。在KLA业已受限的情况下,ASML量测设备接着断供,影响或将向成熟制程领域进一步扩散。</p><p>破解卡脖子难关,航发带来的启示</p><p>短期来看,在日本、荷兰设备出口新规出台前,抓紧机会超量采购是国内下游厂商的当务之急。放眼长远,光刻机等关键半导体设备的自立自强无疑是必由之路。除了胜利,我们别无选择。</p><p>不过在当下,怎样实现光刻机的自立自强,舆论场上存在着相当明显的分歧。尽管多数有识之士呼吁依靠新型举国体制突围,但也有难以忽视的声音认为,过多的产业政策干预很难起到设想的作用,国产光刻机在前道制程环节的应用现状,是其核心论据。</p><p>客观地说,我国高端光刻机研发与产业化现状,的确与当下的应用急需存在一定落差,例如科技部2017年印发的《“十三五”先进制造技术领域科技创新专项规划》明确提出,光刻机及核心部件领域应实现“研制28纳米浸没式光刻机产品,进入大生产线考核;开展配套光学系统、双工件台等核心部件产品研发,并集成到整机。”</p><p>为什么历经02专项和“大基金”十余年接力,光刻机的进展依然不尽如人意?围绕这一问题,众多所谓“专家”开出了令人眼花缭乱的“诊断”和“药方”,却少有人实际梳理过相关投入情况。</p><p>事实上,回望02专项启动之初的2009年,该重大专项面向全国广泛征集项目,经过严格的筛选及“三评两审”立项程序,拟启动54个项目,其中装备整机15项、成套工艺11项、关键材料9项、关键技术与零部件11项、前瞻性研究等8项。</p><p>以上所有项目,总投资180多亿元人民币,其中光刻机能够分到多大的蛋糕不难想象,而同在2009年,ASML单年的研发投入就达到约45亿元人民币,这还是该公司遭遇产业寒冬,大幅削减研发经费的结果。</p><p>与菲薄的投入相比,我国光刻机乃至更广泛半导体制程设备的自主研发能够达到目前的进展,可以说已经堪称“奇迹”。不可否认,在02专项和“大基金”的具体推进中,也存在一些不足,杜工就谈到,国内在光刻机研发上“有点急功近利,走没有学会就想学跑。结果企业的发展就是基础不牢地动山摇。光刻机慢工出细活,那点投资杯水车薪,指望一个公司能做通光刻机全产业链是不可能的”。</p><p>对高技术复杂度产品研发规律认识不足,并非当时半导体领域所独有,事实上,今天已经彻底摆脱“卡脖子”痛楚的我国军用航空发动机,十多年前同样存在类似痼疾,以至于行业泰斗感言:“墨守单纯‘解决有无’理念,不尊重科学规律,反而阻碍发动机技术发展。事实证明,材料尚未研究成功,抗疲劳技术尚未研究,使关键基础构件成为无源之水。未研究关键基础构件就装配发动机,使发动机成为无本之木。在型号研制中‘材料、工艺攻关’、‘型号带材料’、‘型号带制造’、‘设计牵头材料、制造技术’等不科学理念和急于求成、急功近利的方法不仅研制周期较国外长,各种风险集中在型号上。”</p><p>我国航空工业之所以能够突破军用航发这一同样多学科高度综合的现代制造业结晶,关键在于咬牙吃劲的关头能够克服走捷径的诱惑,果断改变通过试验验证,基于研仿原型逐次修改的传统研制方法,咬牙走通了一个突破单项关键技术-部件验证-核心机-验证机-型号研制的完整过程,打破了0和1之间的反复循环,打开了从10到100的迭代空间。</p><p>以此观之,我国光刻机自立自强,或许也应真正经历一场关键机型完整的正向研发“洗礼”。</p><p>杜工也向集微网表示,光刻机的研发应该先学会走路,再学会跑步,与其被美国制裁指挥棒调动,疲于追赶EUV、先进DUV风口,不妨从基础的KrF乃至I线光刻机扎扎实实吃透,真正建立起技术和系统的迭代基础,而这一过程,正是新型举国体制大有作为的舞台。</p><p>他同样以军工领域两弹一星为例,指出类似中央专委、国防科工委等高层级专责机构在重大科技攻关中必不可少:“国家不仅仅应该规划光刻机研发的结果,更必须亲历亲为管理过程,单靠一家企业‘揭榜挂帅’,坐等到点验收,不适合光刻机这样高度复杂的系统,必须要协调全产业链,集中攻关突破,对于光刻机的重要零部件和系统集成,应该国家有统一的协调调度,大学科研院所,国有民营公司都要参与进来,发挥各自的优势做关键零部件,然后由有实力的公司进行系统协调,先打通上下游供应链,再系统集成。”</p><p>结语</p><p>面对拍向半导体产业链的“惊涛骇浪”,我们已无需再抱有过多侥幸、缅怀和幻想,光刻机为代表的关键核心装备自立自强,是对外部霸凌的最有力回答。</p><p>已然化身科技自立自强进程“试金石”的光刻机,当下无疑承载了太多应有或不应有、合理或不合理的焦虑指点,但从另一个角度看,这样的喧嚣,恰恰也折射出全社会对技术进步的渴望和期待,这样的志气和心气在,终将推动我们不屈不挠地抵达胜利彼岸。</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 15:15:40 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000385768</guid>
            <link>https://aijishu.com//a/1060000000385768</link>
        </item>
        <item>
            <title><![CDATA[极海如何做到后视镜“丝滑”调控?]]></title>
            <description><![CDATA[<p>【爱集微点评】极海的后视镜调节专利,通过提供方向盘域控制器、行驶域控制器、后视镜控制器以及后视镜电机等设备,使其能够根据方向盘角度信号和车辆速度信号对后视镜进行连续调控。</p><p>集微网消息,近日极海推出性能高、存储强、连接广的车规级MCU,其实随着汽车电子的多样性发展,极海在汽车电子领域已经为用户展现了众多技术实力,其中就包括车辆相关芯片。</p><p>目前,车辆的后视镜调节技术通常是通过采集车辆的角度信息、全球定位系统(Global Positioning System,GPS)接收器信息和地图信息等进行后视镜的自动控制,需要获取的信息冗余,设计复杂。实际使用中,由于变道的转向角不同,视野存在差异且随着转向过程中盲区也是不断发生变化,因此无法实现对后视镜的连续调控。</p><p>为此,极海于2021年11月24日申请了一项名为“后视镜调节系统、方法和微处理芯片”的发明专利(申请号:202111410716.5),申请人为珠海极海半导体有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1124881063527.1484.png" alt="image" title="image"></p><p>图1 后视镜调节系统的结构示意图</p><p>图1为本专利提出的一种后视镜调节系统的结构示意图,后视镜调节系统10所包含的模块如上图所示。其中,方向盘角度传感器11和车辆速度传感器12分别用于采集车辆的方向盘角度信号、车辆速度信号。方向盘域控制器13可以用来接收方向盘角度传感器11采集的方向盘角度信号,并将方向盘角度信号传递至后视镜控制器15。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1412352318357.311.png" alt="image" title="image"></p><p>图2 后视镜调节系统的具体结构示意图</p><p>图2为图1中从方向盘角度传感器到后视镜电机的示意图,方向盘域控制器13包括:A/D转换器131、中央处理器132、电源135、复位136、存储器137、第一CAN控制器138和第一CAN收发器139。</p><p>A/D转换器131用于将模拟信号的方向盘角度信号转换为数字信号的方向盘角度信号,并将转换为数字信号的方向盘角度信号发送至中央处理器122。中央处理器132用于处理数字信号的方向盘角度信号,并根据上述的方向盘角度信号生成“驱动”后视镜控制器15的处理单元151开始计时的命令信号。此外还将数字信号的方向盘角度信号传递至第一CAN控制器138,其用于将方向盘角度信号打包成CAN数据包,并将CAN数据包发送至第一CAN收发器139。第一CAN收发器139用于将CAN数据包转换为电压信号,并将电压信号发送至总线17,以使电压信号通过总线17传输至后视镜控制器15,在后视镜控制器15中可执行相关CAN数据的解包获得方向盘角度信号。</p><p>后视镜控制器15在接收到方向盘角度信号或车辆速度信号后开始计时并生成计时信息。根据方向盘角度信号、车辆速度信号和计时信息得到目标角度以及生成电机控制信号,同时将电机控制信号发送至后视镜电机16。能够优化后视镜调节的智能响应,避免意外触发后视镜转向,保证行驶安全。</p><p>简而言之,极海的后视镜调节专利,通过提供方向盘域控制器、行驶域控制器、后视镜控制器以及后视镜电机等设备,使其能够根据方向盘角度信号和车辆速度信号对后视镜进行连续调控。</p><p>极海是一家致力于开发工业级/车规级微控制器、高性能模拟芯片及系统级芯片的集成电路设计型企业,其团队拥有多年集成电路设计经验和嵌入式系统开发能力。极海在科技创新中持续投入了大量的精力,不断加速产业升级,为广大用户带来更优质的产品及方案。</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 15:15:40 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000385764</guid>
            <link>https://aijishu.com//a/1060000000385764</link>
        </item>
        <item>
            <title><![CDATA[一线机构纷纷出手,国产线控底盘加速突围]]></title>
            <description><![CDATA[<p>集微网报道 (文/王丽英) 如果说电动化是新能源汽车变革的上半场,那么智能化无疑将是下半场变革的核心。作为汽车智能化的终极目标-自动驾驶要想落地实施,线控底盘是其中离不开的一项关键技术。</p><p>最近,一则小米子公司投资线控底盘企业千顾科技的消息引发热议,毕竟,小米造车正在关键推进期,围绕汽车领域的一举一动自然备受关注,事实上,小米产投在去年就曾领投同为线控底盘企业的同驭汽车。</p><p>除小米产投外,其他一些头部投资机构也纷纷出手线控底盘领域,多家创业企业都拿到了不菲的融资,线控底盘技术上车有望迎来加速期。</p><p>自动驾驶的基石,渗透率有望快速提升</p><p>在新的电子电气架构下,汽车执行系统同步发生变革,底盘系统逐步走向智能化、线控化。</p><p>汽车线控底盘主要由线控转向、线控制动、线控驱动(包含线控换挡、线控油门)和线控悬架(例如,线控空气悬架)四部分组成。线控底盘使用电信号取代传统的机械、液压或气动等形式来实现车辆的转向、制动和前进等操控。相比传统底盘,线控底盘可以实现对执行机构高效、精准的主动控制,是实现自动驾驶的基石。</p><p>从目前的装车量来看,这四部分中,线控油门技术已较为成熟,渗透率接近 100%;线控换挡技术难度较小,目前渗透率也比较高;线控制动与线控悬架技术部分已相对成熟,但装配率较低;线控转向技术仍处于发展中,渗透率极低。</p><p>线控制动是线控底盘的核心,技术难度高。它可实现底盘与车身之间的解耦,更好地适配L3级别以上智能驾驶方案。预计随着高级别自动驾驶车型渗透率不断提升,线控制动有望实现新的增长点。</p><p>根据传输介质的不同,线控制动系统可分为电子液压制动系统(EHB)和电子机械制动系统(EMB)。相较于EHB,EMB 完全摒弃了传统制动系统的制动液及液压管路等部件,是真正意义上的线控制动系统,但目前技术成熟度还有待提升。</p><p>线控空气悬架是底盘智能化的重要组成部分,可显著提高汽车操纵性和舒适性,在燃油车时代,是高端车型的豪华选项配置。对于电动汽车,线控空气悬架不仅提升驾乘体验,还有助于底盘轻量化,减少能耗提高续航里程,成为众多品牌追求的配置亮点。目前蔚来、理想、小鹏、东风、吉利、红旗、上汽大众均已推出配备或可选配空气悬架的车型。</p><p>作为自动驾驶的执行机构,线控底盘的性能好坏将直接影响自动驾驶的使用效果和安全性能。随着自动驾驶向更高级别发展,对感知层、决策层、执行层都提出了更高的要求,要进一步满足响应快、延迟低、精度高等要求。线控底盘通过电信号传导可以实现对执行机构高效、精准的主动控制,实现快速响应,有望替代传统底盘加速上车。</p><p>机构预测,2025年我国线控制动渗透率有望达30%以上,市场规模或达200亿元,2022~2025 年年复合增长率43%;2025年我国空气悬架市场有望达331亿元,2022~2025 年年复合增长率69%。</p><p>机构纷纷出手,国产力量加速突围</p><p>全球线控底盘市场多年来主要由国际Tier 1 厂商垄断,例如,博世、大陆集团、采埃孚、日立等,其中,在线控制动领域,博世的市占率更是超过90%。头部企业在技术研发、市场等方面掌握主要话语权,对本土OEM的开放度较低,导致国内线控底盘技术整体发展缓慢。</p><p>随着燃油车向新能源汽车的转型,传统汽车供应链体系正在被打破。尤其是过去两年汽车缺芯事件,推动了国内汽车供应链的自主建设,缺芯使得国内整车企业更重视供应链的安全可控。把握难得的供应链切入窗口期,国内多个线控底盘厂商获得知名整车厂定点,国产线控底盘企业在逐渐崛起。</p><p>例如,线控制动领域有拿森科技 英创汇智、同驭汽车、伯特利、比亚迪 、利氪科技、精工底盘、亚太股份、千顾科技等,线控空气悬架领域有保隆科技、中鼎股份、拓普集团等。</p><p>资本的嗅觉最敏锐,面对中国在新能源汽车市场产销量NO.1的强大市场背景,线控底盘市场呈现出了诱人的增量应用前景,头部机构纷纷出手,同时,线控底盘赛道涌现出了多家本土创业企业,并获得融资。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/702124138724.4385646038517716.1816.png" alt="image" title="image"></p><p>2021年12月,成立于2016年的拿森科技宣布完成5亿元的C轮融资,由中银投资、宁德时代、国投招商、高瓴创投等联合领投,将持续加强线控底盘的新产品开发、产业化以及客户服务能力,实现配套量产规模增长;2022年3月,同样成立于2016年的同驭科技完成由小米产投与东风交银联合领投的近2亿元A+轮融资,将助力其线控底盘新技术与新产品的开发投入、新产能建设。其后,线控底盘领域的初创企业融资接续而来,格陆博、利氪科技、千顾科技、英创汇智、比博斯特、时驾科技、济驭科技等先后拿到产业头部机构的投资。</p><p>尽管有资本护航,又面临应用爆发的黄金时期,但国内的线控底盘企业仍挑战重重。</p><p>业内人士指出,线控底盘整体渗透率不高,作为自动驾驶的关键基础,安全性要求苛刻,特别是线控制动技术门槛颇高,国产化率水平极低,国内厂商基本处于从0 到1的发展阶段,亟待整体性能提升,整车企业提供试用上车机会也非常关键。</p><p>与此同时,线控底盘行业需要发展出一套统一的行业基准。目前,不同品牌、不同车型底盘性能各不相同,各机构和厂家对线控底盘的评价指标和评价方法各不相同,在自动驾驶系统量产过程中,需要针对不同性能车型进行重复适配开发,造成资源浪费。</p><p>在汽车供应链自主可控的大趋势下,以及汽车智能化发展不断向L3等高级别自动驾驶系统升级推进下,国内线控底盘企业唯有以产品技术作为突发点,打破原有线控底盘核心技术壁垒,赢得整车企业及市场认可,才能逐步建立起国产化线控底盘的技术护城河,在这一新兴蓝海市场中获得主导权。</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 15:15:40 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000385760</guid>
            <link>https://aijishu.com//a/1060000000385760</link>
        </item>
        <item>
            <title><![CDATA[欧洲推迟建厂 台积电今年日子不好过]]></title>
            <description><![CDATA[<p>集微网报道(文/李映)继被注重自由现金流的“股神”巴菲特去年第四季度重砍台积电ADR股票达5176万股、减持幅度高达86%之后,台积电又传出欧洲建厂将延后两年的消息,让业界心头一紧,台积电现金流真的吃紧了吗?</p><p>复盘台积电延后欧洲建厂的逻辑,或许不止于现金流的考量,更是在市场供需变化、投资回报率权衡之后做出的理性选择。</p><p>大幅抛售引发现金流忧虑?</p><p>被“股神”巴菲特仅仅“青睐”一季之后就被大幅抛售,对台积电来说不啻一场次生灾难,股价重挫4%即是实证。</p><p>而在集微网“买进卖出只一季 “股神”看不懂半导体?”文章中已分析出这一举动背后的逻辑:即台积电在日本、美国、中国台湾都将进行大笔投资,还有可能在德国进一步投建晶圆代工厂,而在日本、美国、德国投建晶圆代工厂成本非常高,需占用大量的资本,初期可能会持续亏损,并不断稀释台积电的利润,影响未来的自由现金流,这与巴菲特看重自由现金流的投资逻辑相违背。</p><p>就现金流而言,2022年台积电的全年资本开支为363亿美元,或1.1万亿新台币,产生了经营现金流1.6万亿新台币,自由现金流为5280亿新台币,算得上财才雄厚。</p><p>伴随着地缘政治思维的抬头,将半导体业视为攸关战略产业的美国、欧洲、日本等相继推出数千亿美元大手笔投资计划力促半导体制造业回流。台积电作为代工业第一巨头,成为各国争抛橄榄枝的主力,也频频释出重大投资或扩产计划。</p><p>有半导体行业人士指出,尽管有各国政府的补贴,但建厂尤其是先进工艺厂的成本支出十分庞大。原本台积电在日本晶圆代工厂计划投资86亿美元,在美国晶圆厂投资120亿美元,但在去年12月台积电将美国晶圆厂投资从120亿美元增加到了400美元,且台积电还计划在中国台湾、欧洲德国投建代工厂,未来几年台积电将产生大量的资本支出,对其持续稳定的自由现金流造成影响。</p><p>加之有台积电在美建8英寸厂Wafertech成本高企、长期亏损之后才转为盈利、2021年营收仅为77.35亿元新台币形同鸡肋的“珠玉”在前,台积电在美国、日本、欧洲等地建厂如何不拖累整体业绩、如何快速产生正反馈都成为台积电不得不直面的问题。</p><p>更值得忧虑的是,台积电已处于地缘政治风暴眼之中。近日由于担忧台海风险,由美国前副总统高尔(Al Gore)联合创建的Generation Investment Management金融服务公司也出清台积电ADR共326,654股持股,换算价值达2240万美元。</p><p>多重因素导致暂时搁置</p><p>急行军的台积电在此时为欧洲建厂按下了“刹车”,但这背后的考量或不止现金流那么简单。</p><p>去年底又传出台积电将计划在欧洲设厂的消息。今年1月12日,在台积电的财报发布会上,台积电也表示正考虑到欧洲德国建设汽车芯片工厂,但仅过了一月,台积电就宣布单方“推迟”,变化总比计划更快。</p><p>业内人士对集微网指出,这既有行业环境变化的因素,也涉及台积电投资建厂的策略调整。</p><p>前两年受多重因素影响汽车芯片持续短缺,导致多家整车厂家停产或减产汽车。据AFS的最新数据显示,截至去年12月11日,今年全球汽车市场累计减产约435.1万辆汽车。不过受疫情放开和包括英飞凌、瑞萨、TI等汽车芯片大厂陆续释出大手笔投资扩产的消息,芯片短缺将有所缓解。</p><p>因而上述人士分析,台积电在欧洲建厂的政治诉求与商业因素相比美国、日本的权重本身就较弱,且考虑到汽车芯片供需将放缓,产能可转至中国台湾甚至转往日本、美国等地新厂生产,有助于更好地调配产能,因而台积电将欧洲新厂时程延后亦在情理之中。</p><p>此外,更现实的因子还在于,在欧洲建厂面临资金、人才、水电供应等诸多压力,且赴欧洲设厂成本估计更高于美国与日本,将对台积电资本支出、人力投入和运维造成更多的考验。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/187541081557.0785.png" alt="image" title="image"></p><p>甚至还有消息称,环球晶收购德国同业世创因德国官方以“审核时间来不及”为由而失利,引起了连锁效应。有消息人士透露,原本称赴德国设厂还处于“非常非常早期”的台积电,恐因环球晶收购世创未成,欧洲新厂落脚地点或将转向评估捷克。</p><p>联想到台积电在去年回应欧洲建厂所言:“设厂地点选择有诸多考量因素,台积电拓展全球制造版图是基于客户需求、商机、运营效率和成本等多方面的考量,不排除任何可能性,一切以公司正式对外公告为主。”</p><p>或许一切变数都藏在“不排除”之中。</p><p>今年日子不太好过?</p><p>虽然现代工业在2022年整体表现出“逃逸”下行周期的强大力场,但由于终端需求反映到代工订单的滞后性,这一份“寒意”传导至2023年之际冲击已然更加强烈。</p><p>反映到现实就是各大代工厂的产能利用率在不断下探,有的甚至直接接近“腰斩”。代工厂不得不使出浑身解数,无论是裁员、代工降价、资本支出削减等举措频出,为今年走势蒙上了阴霾。</p><p>尽管台积电经营有年,长期致力于平台建设、工艺多元化,相对受损面较小,但在寒潮大势之下,台积电亦无法独善其身。</p><p>在台积电的产能利用率中,8英寸相对健康,但12英寸先进制程的较低。即便代工报价并未变化,但据称私下按客户与订单规模不同,给予优惠。并且,已调低今年第一季度营收值,预计营收为167亿~175亿美元,将同比下降12.2%~16.2%;毛利率也因产能利用率及3nm初期折旧提升,预计下降到53.5%~55.5%。</p><p>或许这还只是开始。</p><p>更有报道称,由于苹果和AMD的订单减少,台积电2023年首季5/4nm工艺节点的产能利用率将降至约75%,第二季度有可能降至70%以下。作为台积电的主要营收入来源,5/4nm工艺的产能利用率在第二季度如果进一步下滑,将导致这一工艺的营收进一步降低,如果其他工艺不能有效弥补,其营收在第二季度也就可能继续环比下滑。</p><p>从2023年全年来看,台积电面临下行周期冲击,且海外投资建厂背负高昂资本支出、各项成本大增等因素也将进一步蚕食其盈利水平,台积电的毛利率也不得不打折扣,将全年毛利率回调至53%。</p><p>至于海外建厂之路,考虑到国外产业环境与商业诉求,行业人士最后表示,台积电在美国建厂是“逼不得已”,不做也得做,但欧洲建厂对台积电来说并没有太多的利好,今年产能稼动率在持续走低,后续或犹存变局。(校对 林美炳)</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 15:15:40 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000385740</guid>
            <link>https://aijishu.com//a/1060000000385740</link>
        </item>
        <item>
            <title><![CDATA[比克电池最新圆柱电池专利]]></title>
            <description><![CDATA[<p>【爱集微点评】比克电池的圆柱电池专利,通过将正极多极耳、负极多极耳设置在电极组件中同侧,减少了装配工艺流程,降低生产成本。同时便于观察到焊点尺寸及形貌,降低了电池单体制程检测难度,提高异常品检出率。</p><p>集微网消息,比克电池官宣大圆柱电池项目落户常州,该项目计划总投资高达130亿元,如果未来大圆柱电池成为发展主流,那么本土产业链将因此受益。</p><p>现有圆柱锂二次电池结构采用的结构大多为极性相反的极耳从圆柱体电极组件两端引出,导致正极耳、负极耳与二次电池金属外壳进行焊接加工或其他电连接加工时需要采取不同的方案、使用不同的设备,造成装配工序的增加、工艺难度的提高和制造成本的上升。</p><p>为此,比克电池于2022年8月12日申请了一项名为“一种新型圆柱锂电池结构”的发明专利(申请号:202210967642.3),申请人为郑州比克电池有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/609808775485.0284.png" alt="image" title="image"></p><p>图1 集流构件式剖面结构示意图</p><p>图1为本专利提出的一种新型圆柱锂电池结构,壳体1为一端有底封闭,一端开口的空心圆柱型容器,一般采用镀镍钢板或不锈钢板通过冲压拉伸一体成型。</p><p>在壳体1内部设有容置腔,容置腔内放置电极组件2。电极组件2由正极极片、负极极片、隔膜卷绕而成,电极组件2的中心为中心孔14。电极组件2的上部向上引出正极多极耳4与负极多极耳3,正极多极耳4极片箔材一般采用铝箔,负极多极耳3极片箔材一般采用铜箔,通过激光模切或其他模切方式,极片边缘的未涂覆空箔区域形成间隔分布的极耳,并在卷绕后位于电极组件2的同侧且对称于中心孔14分布。使极性相同的极耳收拢、聚合在一起。</p><p>另外,电极组件2的上方设置端盖,端盖包括主体5、极柱6、绝缘构件7、密封构件8。主体5一般选用镀镍钢或不锈钢圆片,其中心开设通孔,主体接近边缘位置设有注液孔13,可以用于封口后注入电解液及开口化成。绝缘构件7包裹极柱6外圆周表面,极柱6位于通孔内,绝缘构件7密封极柱6与端盖间隙,密封构件8采用聚丙烯(PP)、聚对苯二甲酸丁二醇酯(PBT)、可溶性聚四氟乙烯(PFA)、聚苯硫醚(PPS)或其他绝缘且耐电解液腐蚀的材料注塑成型,密封主体5与壳体1上沿。壳体1的上沿向内弯折至少90°,压合密封构件8,主体5与壳体1组成密闭空间。</p><p>此外,负极多极耳3和正极多极耳4分别电连接主体5和极柱6。极柱6的横切面为工字形,极柱6的上下两部分分别将绝缘构件7压合在主体5的上下表面上。而且壳体1上设置有向内凹陷的环形的内凹槽路9,内凹槽路9位于电极组件2与密封构件8之间,其下沿紧密贴合电极组件2上端,端盖与电极组件2之间安装正极集流构件12与负极集流构件11。</p><p>简而言之,比克电池的圆柱电池专利,通过将正极多极耳、负极多极耳设置在电极组件中同侧,减少了装配工艺流程,降低生产成本。同时便于观察到焊点尺寸及形貌,降低了电池单体制程检测难度,提高异常品检出率。</p><p>比克电池早在2005年就在深圳成立了,其核心业务包括消费数码电池、动力电池以及电池回收。其中比克电池在动力电池领域的应用范围遍布全系车型,服务全球十余家一线汽车制造商。而且自从21年发布全极耳大圆柱电池至今,比克电池已经在该领域持续领先。</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 15:15:40 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000385788</guid>
            <link>https://aijishu.com//a/1060000000385788</link>
        </item>
        <item>
            <title><![CDATA[本源量子提出量子计算任务异常发现方法]]></title>
            <description><![CDATA[<p>【爱集微点评】本源量子的量子计算机专利,通过提出的量子计算机架构使得在量子计算任务的执行过程中及时发现异常,有效提高了量子计算机执行量子计算任务的效率。</p><p>集微网消息,本源量子作为中国第一家量子计算公司,一直钻研量子相关技术,近日中国最新量子计算机“悟空”即将在这里诞生。</p><p>量子计算机与经典计算机一样,其核心都是为了解决某种问题而进行的数学计算。在量子计算机执行量子计算任务时,在各个阶段均有可能会出现异常情况,现有技术中判断量子计算机运行过程中是否出现异常时需要人工参与,且只能在量子计算任务的执行结果出现错误时才能发现,效率极低。目前在量子芯片中量子比特位数不多的情况下,采用现有的方案尚能勉强支持,但是随着量子技术的不断研究,在可预期的未来,必然会出现大规模甚至超大规模的量子芯片,届时需要解决的量子计算任务肯定会更加复杂。与之对应地,量子计算机需要面临的异常情况也将更加频繁且复杂。如果还是按照现有的技术方案,那么量子计算机在执行量子计算任务时的效率将会极低。</p><p>为此,本源量子于2022年2月28日申请了一项名为“量子计算机”的发明专利(申请号:202210191402.9),申请人为合肥本源量子计算科技有限责任公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1569703232406.8203.png" alt="image" title="image"><br>图1 量子计算机的结构示意图</p><p>图1为本专利提出的一种量子计算机的结构示意图,主要包括量子计算任务接收设备100、编译设备200、量子控制设备300、量子处理器400以及与编译模块和量子控制设备300通信连接的监控设备500。</p><p>其中量子计算任务接收设备100被配置为接受量子计算任务,编译设备200可以对量子计算任务进行编译处理,并输出对应的任务数据包。量子控制设备300和量子处理器400分别用于对当前任务数据包输出相应的调控信号以及执行量子计算任务。而监控设备500可以对编译设备200和量子控制设备300进行状态监控并分析编译设备200和/量子控制设备300是否发生异常情况。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/235340009981.79117.png" alt="image" title="image"></p><p>图2 量子计算机监控设备的结构示意图</p><p>图2为量子计算机监控设备具体的结构示意图,监控设备主要包括信息采集模块501、异常判断模块502、异常类型辨别模块503、异常存储模块504、异常更新模块505以及异常处理模块506。</p><p>其中,信息采集模块501和异常判断模块502分别从编译设备200/量子控制设备300中获取编译处理以及调控信号的第一相关信息,并判断是否发生异常情况。异常类型辨别模块503在得到异常判断模块502的结果后用于分辨具体的异常类型(硬件异常和软件异常)。异常存储模块504会预先存储设置的异常情况以及对应的异常类型,而异常更新模块505则对该存储数据进行更新,以便在后面碰到相同问题时可以及时辨别以及处理。最后,异常处理模块506会对相应的异常进行处理,解决策略包括重新启动编译设备200或对量子控制设备300进行复位等。</p><p>简而言之,本源量子的量子计算机专利,通过提出的量子计算机架构使得在量子计算任务的执行过程中及时发现异常,有效提高了量子计算机执行量子计算任务的效率。</p><p>本源量子是国内量子计算龙头企业,聚焦于量子计算产业生态建设,打造自主可控工程化量子计算机,积极推动量子计算产业落地,并探索量子计算产业应用。随着量子计算成果的逐渐推进,相信在不久将来,本源量子一定可以实现“让量子计算走出实验室,真正为人类服务”这一宗旨。</p>
                                                    ]]></description>
            <pubDate>Sun, 19 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000385458</guid>
            <link>https://aijishu.com//a/1060000000385458</link>
        </item>
        <item>
            <title><![CDATA[小鹏汽车减少充电桩终端器件的损耗]]></title>
            <description><![CDATA[<p>【爱集微点评】小鹏汽车的充电桩专利,在充电枪供电或断电的切换过程中,摒弃了纯终端实现的方式,而是采用主机开启或关闭供电,实现了对于充电枪供电和断电的切换过程中减少终端器件损耗的效果。</p><p>集微网消息,据统计超过九成的充电桩生产企业近日已经复工了,今年充电桩在生产淡季产量仍迎来突破,随着新能源汽车销量的不断增长,充电桩的需求水涨船高。</p><p>随着新能源的不断发展,充电桩也正在不断的增设中。现有的充电桩主要由两部分组成,一部分是用于控制充电枪的充电控制结构,通常习惯于称之为终端,另一部分是用于对输入电源进行整流的整流控制结构称为主机。充电桩的使用过程中会存在供电和断电的切换,例如断电切换包括带电拔枪或出现异常断开等情况,此时需要迅速切断提供给充电枪的电能,传统技术中往往是在通流状态下直接关断充电控制结构一侧的接触器,该方式较为简单快速,但是长期使用该方式进行切换容易造成充电控制结构一侧的接触器主触点粘连,此时非但达不到切断电能的目的还具备一定的危险性,而且还加快了充电控制结构一侧的接触器损耗速度,增加运维成本的问题。</p><p>为此,小鹏汽车于2022年6月27日申请了一项名为“充电桩控制系统、充电桩及充电桩系统”的发明专利(申请号:202210744552.8),申请人为广州小鹏汽车科技有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/440317574971.7564.png" alt="image" title="image"></p><p>图1 充电桩控制系统的结构示意图</p><p>图1为本专利提出的一种充电桩控制系统的结构示意图,主要包括主机2和一个或多个终端1,终端1与主机2设于不同柜体内。其中终端1用于检测充电枪的状态信息,基于状态信息生成第一控制指令,并将第一控制指令发送至主机2。主机2包括一个或多个供电模块21,供电模块21用于为充电枪提供电能,而主机2基于第一控制指令控制对应的供电模块21的开启或关闭。</p><p>在实际使用时,上面场景主要应用于分体式的直流充电桩,主机2主要起到与电网连接将电网的交流电转换为直流电的作用,并将转换后的电源输送至终端1;而终端1则主要起到与充电枪连接的作用,例如终端1通过获取充电枪是否与电动汽车进行连接、用户是否对终端1进行充电操作如扫码或刷卡等信息,确定需要为充电枪进行供电或者断电。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1087328373158.4751.png" alt="image" title="image"></p><p>图2 充电桩控制系统的使用场景示意图</p><p>图2为充电桩控制系统的使用场景示意图,当充电枪4从电动汽车5上拔出时,此时终端1检测到充电枪4的状态信息为充电枪4与电动汽车5断开连接的电信号,因此生成需要关闭供电的第一控制指令,并将关闭供电的第一控制指令发送至主机2。主机2接收到关闭供电的第一控制指令时,基于第一控制指令确定为该充电枪4供电的一个供电模块21,并关闭该供电模块21,以此实现通过主机2断开充电枪4电流的效果。最后在终端1检测到无供电模块21的电流输出时,则关闭终端1用于控制充电枪4的开关元件如接触器进行断开,以此起到了开关元件在无电流的情况下进行闭合,大大减低了开关元件的损耗。</p><p>简而言之,小鹏汽车的充电桩专利,在充电枪供电或断电的切换过程中,摒弃了纯终端实现的方式,而是采用主机开启或关闭供电,实现了对于充电枪供电和断电的切换过程中减少终端器件损耗的效果。</p><p>作为一家专注未来出行的科技公司,小鹏汽车自成立的7年多以来,在国内、北美等地均设立研发中心,完成了全球化布局。同时坚持以开放包容的态度,吸纳全球各界人才,现在已经成为国内领先的智能电动汽车公司之一。相信在未来,小鹏可以在智能电车领域中取得更多硕果。</p>
                                                    ]]></description>
            <pubDate>Sun, 19 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000385445</guid>
            <link>https://aijishu.com//a/1060000000385445</link>
        </item>
        <item>
            <title><![CDATA[普莱信智能提高芯片封装效率和精度]]></title>
            <description><![CDATA[<p>【爱集微点评】普莱信智能的芯片封装专利,通过对点位轨迹速度曲线进行优化调节,降低总运动时间。同时限制允许激起能量强度值,能够提高芯片封装效率、防止速度规划超调、提高芯片封装控制的精度。</p><p>集微网消息,普莱信智能深耕半导体封装领域多年,近日,普莱信智能从15737家广东省创新型中小企业中脱颖而出,荣获广东省“专精特新”中小企业。</p><p>随着集成电路产业的快速发展和芯片制造工艺的不断提高,小型化、多引脚、细间距的芯片对其封装设备高加速运动系统的响应能力、定位精度、定位时间等伺服性能提出了更高的要求。芯片封装的快速高精度定位要求主要通过加速度、定位精度和运行时间三个方面的参数进行体现。但是,由于芯片封装控制系统具有短行程高加速高速高精度定位的特点,且位移相对固定,现有技术方案难以发挥作用。因此,亟需一种用于芯片封装控制的速度规划方法,以提高芯片封装精度、降低所需时间。</p><p>为此,普莱信智能于2021年4月7日申请了一项名为“芯片封装控制的速度规划方法及芯片封装控制装置”的发明专利(申请号:202110373352.1),申请人为东莞普莱信智能技术有限公司。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1279684058249.9426.png" alt="image" title="image"></p><p>图1 芯片封装控制的速度规划方法示意图</p><p>图1为本专利提出的一种芯片封装控制的速度规划方法示意图,封装控制的点位轨迹速度曲线为非对称S曲线,点位的运动通过轴电机驱动。其中非对称S曲线按加减速特征划分为七个运行阶段:加加速段0T1、匀加速段T1T2、减加速段T2T3、匀速段T3T4、加减速段T4T5、匀减速段T5T6和减减速段T6T7。</p><p>实现的具体规划方法如下,首先设定插补周期、启动端插补周期数量、停止端插补周期数量、允许激起能量强度值、调节变化率上限、速度修改分辨率、加速度修改分辨率。根据如图1所示的各个参数间关系,设定初始速度Vs、结束速度Ve、最大速度Vmax、最大加速度A、最大减速度D、加加速度Ja、减加速度Jd、位移值S。</p><p>之后通过Vs、Vmax、A、D、Ja、Jd、S,计算点位轨迹速度曲线,获取总运动时间Tb;若是首次计算Tb,使Ta=Tb。接着根据插补周期、启动端插补周期数量、点位轨迹速度曲线,计算启动端各单个插补周期设备运行速度频率所激起的能量强度。然后计算得到各个插补周期的能量强度之和,并判断是否大于允许激起能量强度值,最后根据两者大小以及Ta、Tb的值对相关参数进行调节。</p><p>比如当能量强度之和大于允许激起能量强度值时对A、D、Ja、Jd进行优化调节,直至能量强度之和小于允许激起能量强度值,从而抑制芯片封装系统中轴电机的震动造成的残余振动,提高芯片封装控制的精度。此外,还可以调节A、D、Ja、Jd使总运动时间Tb减小,从而提高芯片封装效率。同时通过速度修改分辨率、加速度修改分辨率约束A、D、Ja、Jd的调节幅度,以此控制参数调节结果的变化率,防止速度规划超调。</p><p>简而言之,普莱信智能的芯片封装专利,通过对点位轨迹速度曲线进行优化调节,降低总运动时间。同时限制允许激起能量强度值,能够提高芯片封装效率、防止速度规划超调、提高芯片封装控制的精度。</p><p>普莱信智能在创立之初,就汇聚了运动控制、算法、机器视觉、直线电机、半导体设备和自动化设备领域的资深人士,希望在未来,普莱信智能可以继续通过国际级的先进技术来提高国内制造业水平,最终助力实现中国制造的智能化升级。</p>
                                                    ]]></description>
            <pubDate>Thu, 16 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000385153</guid>
            <link>https://aijishu.com//a/1060000000385153</link>
        </item>
        <item>
            <title><![CDATA[PA去库存临近尾声 2023或成模组化元年]]></title>
            <description><![CDATA[<p>集微网报道(文/王小方) 阴云笼聚于上空,一道期待已久的曙光终于浮现眼前。据供应链消息,在经历了近一年半库存去化阶段后,随着智能手机厂商2022年囤积的PA库存不断出清,库存去化已逐渐步入尾声,并有望于今年Q1或Q2正式完结。</p><p>预计2023年伴随着终端厂商库存去化及消费者预期转好,智能手机等消费电子终端需求将逐步复苏。不过,由于需求端尚未产生十分明朗的复苏信号,PA厂商在短期内的压力依旧很大,它们既要应对当下的内卷困局,也需要瞄准未来的市场机会抢先下注。</p><p>5G仍是最强增长动能</p><p>对国内PA厂商而言,深陷长达一年半的库存去化周期,着实是一段备受煎熬的日子。不过,想要真正理解这一漫长的库存去化周期,还得追溯前因。</p><p>据IDC发布的数据显示,2020年全球智能手机市场出货量为12.92亿台,同比下跌5.9%。进入2021年后显露出些许回温势头,智能手机市场似乎已经从“黑暗期”中走出,再加上华为遭受美方制裁,释放出大块市场份额,各大手机厂商自然想要抓住这一难得契机,在2021年下半年间纷纷超额下单、致使库存水位快速上涨。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1284795508459.52441587226810157.241.png" alt="image" title="image"></p><p>图 集微网整理(数据来源 IDC)</p><p>由此可见,后来的库存积压与此前的“囤货潮”有着密切关联,根本原因在于彼时手机厂商对市场预期过于乐观,不曾料想仅数月后便转入库存调整期。而后在俄乌战争、通货膨胀、加息等因素的影响下,用户的消费需求进一步萎缩,库存去化不得不拉长战线。为了缓解库存压力,手机厂商也不得不减缓线下渠道的扩张节奏,追求更稳健的渠道布局。</p><p>在下游吃紧的形势下,寒气早已弥散至产业链各大环节。从代工方面看,受手机厂商库存去化影响,在2022年里稳懋、宏捷科、全新等上游砷化镓代工厂的产能利用率一再下滑,营收都跌至近年来的最低点。据一位业界资深人士透露,目前砷化镓代工产能存在一定程度过剩,几大头部厂商的平均产能利用率估计还不到60%。不过,砷化镓的富余产能可能会逐渐用于高性能滤波器、氮化镓等第三代半半导体的开发和规模化生产。</p><p>据IDC于不久前披露的数据显示,2022年全球智能手机出货量同比下降11.3%至12.1亿台,创下2013年以来的最低年度出货量。就国内市场而言,2022年中国智能手机市场出货量约为2.86亿台,同比下降13.2%。不过,IDC认为2023年销量将会出现反弹,预计2023年全球智能手机出货量达12.7亿部,同比增长2.8%。</p><p>“就国内一月的增长情况看还是不错的,智能手机的销量每周都在攀升,这可能源自疫情放开后报复性的消费反弹,最终全年销量有望超乎先前预期。总体而言,今年国内智能手机市场最终销量小幅上涨的概率是比较大的,但全球市场的情况则没有这么乐观。”爱集微咨询业务部副总赵翼说道。</p><p>即便面临库存积压和需求不振的挑战,但5G带来的巨大市场机会并未消退。同时,5G也给设计带来了不小的挑战,射频前端的采购流程、系统设计的复杂度都大幅提升,射频前端方案也在加快由分立射频元件向整合型模组化方向演变。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1022597149254.901346882222080.9907.png" alt="image" title="image"></p><p>图 集微网整理(数据来源 IDC)</p><p>就长期趋势而言,在5G的牵引下,国产射频前端向高端化、模组化突破的大方向不会动摇。本月初,据中国台湾省媒体报道,联发科和高通均决定不再推出新4G手机芯片,这反映出国际厂商主推5G、退出4G的决心,将导致5G总体市场份额增加,也将推动相关厂商增加对5G PA的布局。</p><p>目前,国内智能手机市场已初步显现回暖迹象,但由于这一观察时间区段较短,如果增长势头能持续到2023年Q1末,整个市场止跌回升的概率将大幅增加,届时产业链对于市场复苏的信心也将明显回升。</p><p>2023年有望成为PA模组化元年</p><p>就长期发展而言,射频前端行业在2022年出现的波动是暂时的,大趋势仍将是产业的长期增势。目前,去库存阶段已经逐渐不再是问题,在通货膨胀的背景下,需求端何时真正复苏才是当下业界真正关心的问题。</p><p>“目前,在国内射频前端产业中,头部PA厂商具有明显的规模效应优势,有了4G上的积累,相信5G也将是国产公司的天下。”赵翼进一步指出,“接下来,对射频前端的资源整合能力将更加凸显,能不能做好PA与滤波器之间的融合,将是PA公司制胜的关键。此外,在库存压力逐步缓解和疫情政策放开的双重刺激下,头部PA公司的产值预计将稳定增长。”</p><p>盛世投资管理合伙人、盛世智达总经理陈立志认为,国内PA厂商正逐步向高端产品市场迈进,呈现出高度集成化的趋势,模组化和射频前端全覆盖成为主力方向。长远来看,国内PA领域具有马太效应,龙头厂商与其他厂商的差距将会越来越大,行业有望迎来并购、合作的潮流。</p><p>从投融资方面看,随着资本市场逐渐趋于理性,对芯片设计公司的投资趋于谨慎,初创公司融资愈加困难,加上PA产能过剩导致的竞争加剧,面临较高的洗牌风险,正在加速市场出清;另一方面,头部PA厂商纷纷冲刺IPO,追求更高层次的发展,整个行业将逐渐淡出价格战,行业竞争将逐渐进入相对合理的阶段。</p><p>一位业界资深人士表示,随着PA厂商在高集成度模组产品上不断取得突破,2023年有望成为中国PA公司的模组化元年。目前,对于当前的内卷局面,PA厂商应该从设计层面下功夫,通过新颖的设计降低成本,为客户提供更具性价比的产品方案,这样才能既保障自身的毛利率,又能给客户带来更好的成本优势,而不是靠融资去补贴客户,从而将行业拉入内卷的泥淖。</p><p>目前,大多数国内PA厂商几乎全部收入都来自于手机业务,而国际巨头厂商非手机业务收入占比较高,如Skyworks的非手机业务收入占比在2022年已达36%。因此,对于国内PA厂商而言,还需在手机之外开拓更多市场,丰富产品线并进一步提升竞争力,寻找新的增长点。</p><p>陈立志认为,虽然不免受到行业内卷与市场需求低迷的直接影响,但对于国内PA厂商而言,机遇与挑战并存,一方面在5G基站、AIoT、可穿戴设备、汽车电子等方面,对于高端化、集成化PA产品的需求持续旺盛;另一方面,受国际局势影响,下游客户对于国产替代的意愿十分强烈。</p><p>“近年来,国际局势愈加扑朔迷离,贸易摩擦和专利冲突增加,这要求国内厂商提高知识产权保护意识,加快建设知识产权体系。”陈立志还特别提及。</p><p>就产业发展趋势而言,随着手机厂商逐渐走出库存去化周期,5G依旧会带来巨大的成长机会,模组化的突破也逐渐显露成效,国产射频前端的成长步伐不会减慢。</p>
                                                    ]]></description>
            <pubDate>Thu, 16 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000385145</guid>
            <link>https://aijishu.com//a/1060000000385145</link>
        </item>
        <item>
            <title><![CDATA[代工业亮出“家底”:狂欢之后准备过冬?]]></title>
            <description><![CDATA[<p>集微网报道(文/李映)代工业的“全家桶”在财报陆续出炉之后基本集齐,也都亮出了各自的家底。</p><p>受宏观经济下行影响,全球2022年消费电子市场需求走向疲软,而代工业可谓逆风而行,</p><p>交出了一份“普涨”的成绩单。</p><p>但要看到的是,由于终端需求反映到代工订单的滞后性,代工厂在去年第三和第四季度已在承压前行。当这一份“寒意”传导至2023年之际,眼见冲击更甚,无论是代工降价、产能稼动率降低、资本支出削减等举措频出,为今年代工业走势蒙上了阴霾。</p><p>全年营收“普涨” 但季收已现跌势</p><p>久坐“铁王座”的台积电表现依旧抢眼。2022年营收创下751亿美元的纪录,同比增长42.6%。而利润增长逾70%,同样创历史新高。以第四季度来看,台积电营收约合1386.8亿元,毛利率超过此前预期,达到62.2%,营业利润率为52.0%,毛利率和营业利率双双创新高。</p><p>作为全球代工“榜眼”的三星,尽管受多重因素影响利润暴跌90%以上,但在代工方面,上季和2022年全年营收都创新高,其利润或超过约109.79亿人民币,这一数字反映了其先进制程产能的扩大。据透露,三星全年8nm以下营收占总营收的六成。</p><p>反观英特尔虽然2022年第四季度和全年营收大幅下挫,但代工业务增势明显。2022年其代工服务同比增长14%,第四季度营收为3.19亿美元,同比增长30%。</p><p>可以说,先进工艺三雄能够在下行周期逆势增长,一方面说明凭借多年的积淀,有着较强的抗周期和风险能力,另一方面消费市场疲软对成熟制程代工冲击较大,而对先进工艺影响甚微。</p><p>围绕着成熟制程的争夺,联电、格芯、中芯国际、华虹等代工厂商也冲出了下行“风暴”,交出了飘红的答卷。2022全年度联电营收折合人民币约622.41亿元,年增30.84%;格芯2022年营收同比增长23%,为81.08亿美元。</p><p>同为国内半导体代工双雄,中芯国际2022年全年营收突破72亿美元,同比增长34%,实现2021年、2022连续两年年增幅超过三成;而华虹得益于在成熟工艺上的深耕,以及汽车芯片、功率器件等需求的大幅增长,实现全年营收达24.75亿美元,逆势增长51.8%,创下历史新高。</p><p>但受行业下行周期所致,大多数代工厂商第四季度的产能利用率已开始下探,让行业切身感受到寒潮已至。如联电晶圆出货量比前年同期减少14.8%,整体产能利用率降至90%。</p><p>毛利润“分化” 产能利用率持续下探</p><p>如果说2022年全年营收还在基本水准之上,但从毛利率变化也可看出成熟工艺与先进工艺之前仍存“落差”。</p><p>台积电的毛利率依旧维持“高位”。2022年全年毛利率高达59.6%,比2021财年的51.6%涨了8个百分点,不得不说先进工艺居功至伟。据财报显示,其16nm占比13%,7nm占比27%,5nm占比26%,总计超66%。而且有,随着台积电在3nm工艺量产在加速推进,据预计3nm及升级版3nm制程的产品将贡献台积电2023年营收的4%至6%。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1615500030471.139195447789652.77463.jpg" alt="image" title="image"></p><p>同为成熟制程工艺擂台上的竞技者,联电表现相对出色,平均毛利率增至45.1%,比去年33.8%大增一成以上,而格芯、中芯国际和华虹的毛利率则集中于30%左右,完全竞争市场的激烈度可见一斑。</p><p>而且由于各家Fab厂工艺定位、产品结构、合作客户的不同,一位业内人士表示,下行周期对于经营有年,长期致力于平台建设、制造平台多元化的代工厂的影响相对较小。</p><p>如华虹营收保持长期成长,其有竞争力的特色工艺组合功不可没,且抓住了国内汽车电子和工业电子等高成长产业,进一步提升了营收质量。而格芯第一大收入来源智能设备业绩在第四季度大幅下滑至8.23亿美元,同比、环比下降幅度分别达7%和14%,但家庭与工业物联网、通信和数据中心业务则同比大增64%和27%,汽车业务也在强劲增长,因而对冲之下业绩依旧飘红。</p><p>但代工业看似已行至“龙卷风”中心,避无可避。集微咨询认为,从业绩表现来看,代工业整体处于向上发展态势,但毛利率均有所下降,且由于终端需求变化反馈到代工的时间差,去年第三季度和第四季度已释放出了危险信号,今年第一、二季度行情不太乐观,产能利用率下滑明显,代工厂需多管齐下开源节流。</p><p>有分析称第二梯队的晶圆代工厂,12英寸产能利用率在2023年第一季度平均落在70~80%,有部分到60%;而8英寸平均落在60~70%,也有部分落在50%左右,可谓是断崖式下跌。</p><p>不得不说,产能利用率的大幅下降对营收和毛利率的冲击也是“立竿见影”。台积电率先承认,受半导体产业持续调整库存及季节性淡季的双重影响,2023年第一季度营收为167~175亿美元,将同比下降12.2%~16.2%;毛利率也因产能利用率及3nm初期折旧提升,预计下降到53.5%~55.5%。格芯也预计第一季度营收将处于18.10亿至18.50亿美元之间,毛利率降至27.1%。格芯称,产能利用率的下降同步拉低了毛利率。</p><p>多方救火 2023年上半年准备过冬</p><p>产能还是产能,看来已成为代工业的新“魔咒”。而产业共识是代工产能利用率的回升将从第二季度开始,真正回到接近满载的产能利用率要到下半年甚至是年底。</p><p>上述人士也指出,从产品结构来看,消费类如手机、笔记本电脑等还处于库存消化阶段,加之终端需求的恢复和消费信心的提振还需要时间,反映到产能利用率的提升也就需要更长的周期。</p><p>为此集微咨询建议,代工厂一方面可减少人力成本,一些企业已祭出裁员的举措;另一方面则着力降低资本支出,包括设备支出、扩产调整等。此外,可为客户提供相应的优惠价格,以维持更多的订单量。</p><p>各大代工看似已在准备“过冬”,均在谨慎调整资本支出。</p><p>台积电2023年的资本支出为320亿-360亿美元,而最初估计为400亿美元。联电也称,应对需求低迷,联电已进行严格的成本管控措施,并尽可能推迟部分资本支出。而中芯国际因着力成熟产能扩产及新厂基建,2023年的资本开支将与2022年大致持平。</p><p>此外,最近传出的代工价格降价成为这一“艰难”时期的注解。</p><p>据报道,三星、力积电、格芯等传出直接降价消息;台积电、联电、世界先进等代工价并未变化,但私下与客户协调给予优惠,以维持ASP(平均销售价格)与毛利率。由 “供不应求”到纷纷降价,代工厂商的价格战已然打响。</p><p>值得一提的是,尽管产能利用率均在降低,但3nm等先进制程的进度仍在不断推进。有分析称,台积电4/5nm甚至3nm工艺的产品仍可维持产销平衡。</p><p>无论如何,2023年上半年对于代工业来说或许真的是“凛冬已至”。</p>
                                                    ]]></description>
            <pubDate>Thu, 16 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com//a/1060000000385139</guid>
            <link>https://aijishu.com//a/1060000000385139</link>
        </item>
    </channel>
</rss>

...

@github-actions
Copy link
Contributor

Successfully generated as following:

http://localhost:1200/aijishu/blog/armsoft - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[Arm服务器 - 极术社区]]></title>
        <link>https://aijishu.com//api/blog/1070000000002249/contents?page=1</link>
        <atom:link href="http://localhost:1200/aijishu/blog/armsoft" rel="self" type="application/rss+xml" />
        <description><![CDATA[Arm服务器 - 极术社区 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 15:26:49 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[StratoVirt 的 vCPU 拓扑(SMP)]]></title>
            <description><![CDATA[<p>CPU 拓扑用来表示 CPU 在硬件层面的组合方式,本文主要讲解 CPU 拓扑中的 SMP(Symmetric Multi-Processor,对称多处理器系统)架构,CPU 拓扑还包括其他信息,比如:cache 等,这些部分会在后面进行补充。CPU 拓扑除了描述 CPU 的组成关系外,还为内核的调度器提供服务,从而提供更好的性能。在 StratoVirt 中,支持 CPU 拓扑为后续的 CPU 热插拔开发打下一个基础。</p><p>常见的 CPU SMP 结构是:</p><pre><code>Socket --&gt; die --&gt; cluster --&gt; core --&gt; thread
</code></pre><ul><li>socket:对应主板上的 CPU 插槽</li><li>die:处理器在生产过程中,从晶圆上切割下来的一个个小方块,Die 之间的组件是通过片内总线互联的。</li><li>cluster:簇,大核或者小核的一种组合</li><li>core:表示独立的物理 CPU</li><li>thread:逻辑 CPU,英特尔超线程技术引入的新概念</li></ul><h2>CPU 拓扑的获取原理</h2><p>因为 x86 和 ARM 的拓扑获取方式不同,下面将会分开进行介绍。</p><h3>x86</h3><p>在 x86 架构下面,操作系统会通过读取 CPUID 来获取 CPU 拓扑结构。在 x86 体系结构中,CPUID 指令(由 CPUID 操作码标识)是处理器补充指令(其名称源自 CPU 标识),允许软件发现处理器的细节。程序可以使用 CPUID 来确定处理器类型。</p><p>CPUID 隐式使用 EAX 寄存器来确定返回的信息的主要类别,这被称为 CPUID 叶。跟 CPU 拓扑相关的 CPUID 叶分别是:0BH 和 1FH。1FH 是 0BH 的扩展,可以用来表示更多的层级。Intel 建议先检查 1FH 是否存在,如果 1FH 存在会优先使用它。当 EAX 的值被初始化为 0BH 的时候,CPUID 会在 EAX,EBX,ECX 和 EDX 寄存器中返回 core/logical 处理器拓扑信息。这个函数(EAX=0BH)要求 ECX 同时被初始化为一个 index,这个 index 表示的是在 core 层级还是 logical processor 层级。OS 调用这个函数是按 ECX=0,1,2..n 这个顺序调用的。返回处理器拓扑级别的顺序是特定的,因为每个级别报告一些累积数据,因此一些信息依赖于从先前级别检索到的信息。在 0BH 下,ECX 可以表示的层级有:SMT 和 Core,在 1FH 下,可以表示的层级有:SMT,Core,Module,Tile 和 Die。</p><p>下表是一个更详细的一个解释:</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMdP" alt="image.png" title="image.png"></p><p>来源: Intel 64 and IA-32 Architectures Software Developer's Manual</p><h3>ARM</h3><p>在 ARM 架构下,如果操作系统是依靠 Device Tree 启动的,则会通过 Device Tree 去获取 CPU 拓扑。如果是以 ACPI 的方式启动的话,操作系统会通过解析 ACPI 的 PPTT 表去获取 CPU 拓扑结构。</p><h3>ACPI——PPTT</h3><p>ACPI 是 Advanced Configuration and Power Interface (高级配置和电源接口)的缩写,ACPI 是一种与体系结构无关的电源管理和配置框架。这个框架建立了一个硬件寄存器集合来定义电源状态。ACPI 是操作系统和固件之间的一个中间层,是他们两者之间的一个接口。ACPI 定义了两种数据结构:data tables 和 definition blocks。data tables 用于存储给设备驱动使用的 raw data。definition blocks 由一些字节码组成,这些码可以被解释器执行。</p><p>为了使硬件供应商在选择其实施时具有灵活性,ACPI 使用表格来描述系统信息、功能和控制这些功能的方法。这些表列出了系统主板上的设备或无法使用其他硬件标准检测或电源管理的设备,以及 ACPI 概念中所述的功能。它们还列出了系统功能,如支持的睡眠电源状态、系统中可用的电源平面和时钟源的说明、电池、系统指示灯等。这使 OSPM 能够控制系统设备,而不需要知道系统控制是如何实现的。</p><p>PPTT 表就是其中的一个表格,PPTT 表全称是 Processor Properties Topology Table,处理器属性拓扑表用于描述处理器的拓扑结构,该表还可以描述附加信息,例如处理器拓扑中的哪些节点构成物理包。</p><p>下表是 PPTT 表的结构,包含一个表头和主体,表头和其他的 ACPI 表差别不大。其中<code>Signature</code>用于表示这是 PPTT 表,<code>Length</code>是整张表的大小,其他的信息可以查看下面的这张表。表的主体是一系列处理器拓扑结构。<img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/01-pptt-header.bea002f9.png" alt="01-pptt-header" title="01-pptt-header">下面的表表示处理器层级节点结构,表示处理器结构的话<code>Type</code>要设置为 0,<code>Length</code>表示这个节点的字节数。<code>Flags</code>用来描述跟处理器相关的信息,详细的看后面关于<code>Flags</code>的详细信息。<code>Parent</code>用于指向这个节点的上一级节点,存放的是一个偏移量地址<img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/02-pptt-node-structure.88b66c70.png" alt="02-pptt-node-structure" title="02-pptt-node-structure">下表是<code>Flags</code>的结构,<code>Flags</code>占据 4 个字节的长度。<code>Physical package</code>:如果处理器拓扑的此节点表示物理封装的边界,则设置<code>Physical package</code>为 1。如果处理器拓扑的此实例不表示物理软件包的边界,则设置为 0。<code>Processor is a Thread</code>:对于叶条目:如果代表此处理器的处理元素与兄弟节点共享功能单元,则必须将其设置为 1。对于非叶条目:必须设置为 0。<code>Node is a Leaf</code>:如果节点是处理器层次结构中的叶,则必须设置为 1。否则必须设置为 0。<img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/03-pptt-flags.8ccf1dd9.png" alt="03-pptt-flags" title="03-pptt-flags">参考:<a href="https://aijishu.com/link?target=https%3A%2F%2Fuefi.org%2Fspecs%2FACPI%2F6.4%2F05_ACPI_Software_Programming_Model%2FACPI_Software_Programming_Model.html%23processor-properties-topology-table-pptt" target="blank">https://uefi.org/specs/ACPI/6.4/05_ACPI_Software_Programming_Model/ACPI_Software_Programming_Model.html#processor-properties-topology-table-pptt</a></p><h3>Device Tree</h3><p>Device Tree 是一种描述硬件的数据结构。内核的启动程序会将设备树加载入内存中,然后通过解析 Device Tree 来获取硬件细节。Device Tree 是树形结构,由一系列被命名的节点和属性组成,节点可以包含子节点,它们之间的关系构成一棵树。属性就是 name 和 value 的键值对。</p><p>一个典型的设备树如下图:<img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/04-device-tree.1348daa5.png" alt="04-device-tree" title="04-device-tree"></p><p>ARM 的 CPU 拓扑是定义在 cpu-map 节点内,cpu-map 是 cpu 节点的子节点。在 cpu-map 节点里可以包含三种子节点:cluster 节点,core 节点,thread 节点。整个 dts 的例子如下:</p><pre><code>cpus {
    #size-cells = &lt;0&gt;;
    #address-cells = &lt;2&gt;;
    cpu-map {
        cluster0 {
            cluster0 {
                core0 {
                    thread0 {
                        cpu = &lt;&amp;CPU0&gt;;
                    };
                    thread1 {
                        cpu = &lt;&amp;CPU1&gt;;
                    };
                };
                core1 {
                    thread0 {
                        cpu = &lt;&amp;CPU2&gt;;
                    };
                    thread1 {
                        cpu = &lt;&amp;CPU3&gt;;
                    };
                };
            };
            cluster1 {
                core0 {
                    thread0 {
                        cpu = &lt;&amp;CPU4&gt;;
                    };
                    thread1 {
                        cpu = &lt;&amp;CPU5&gt;;
                    };
                };
                core1 {
                    thread0 {
                        cpu = &lt;&amp;CPU6&gt;;
                    };
                    thread1 {
                        cpu = &lt;&amp;CPU7&gt;;
                    };
                };
            };
        };
    };
    //...
};
</code></pre><p>参考:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.kernel.org%2Fdoc%2FDocumentation%2Fdevicetree%2Fbindings%2Farm%2Ftopology.txt" target="blank">https://www.kernel.org/doc/Documentation/devicetree/bindings/arm/topology.txt</a></p><p>图来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.devicetree.org%2Fspecifications%2F" target="blank">https://www.devicetree.org/specifications/</a></p><h2>StratoVirt 具体实现</h2><h3>CPUID</h3><p>首先我们需要计算每个拓扑结构唯一的 topology ID,然后获取或者自己建立相对应的 CPUID entry,当 entry 的 function 的值等于 0xB 和 0X1F 的时候,我们需要根据 CPUID 的规范去设置相对应的 EAX, EBX, ECX 的值。EAX 设置为拓扑 ID,EBX 用来表示那个层级的有几个逻辑处理器,ECX 表示层级号。0xB 需要配置 index 等于 0,1 对应的值,0x1F 需要配置 index 等于 0,1,2 对应的值。下面是相对应的代码:</p><pre><code>// cpu/src/x86_64/mod.rs
const ECX_INVALID: u32 = 0u32 &lt;&lt; 8;
const ECX_THREAD: u32 = 1u32 &lt;&lt; 8;
const ECX_CORE: u32 = 2u32 &lt;&lt; 8;
const ECX_DIE: u32 = 5u32 &lt;&lt; 8;
impl X86CPUState {
    fn setup_cpuid(&amp;self, vcpu_fd: &amp;Arc&lt;VcpuFd&gt;) -&gt; Result&lt;()&gt; {
        // 计算 topology ID
        let core_offset = 32u32 - (self.nr_threads - 1).leading_zeros();
        let die_offset = (32u32 - (self.nr_cores - 1).leading_zeros()) + core_offset;
        let pkg_offset = (32u32 - (self.nr_dies - 1).leading_zeros()) + die_offset;
        // 获取 KVM 的 fd 和 获取它支持的 CPUID entries
        for entry in entries.iter_mut() {
            match entry.function {
                // ...
                0xb =&gt; {
                    // Extended Topology Enumeration Leaf
                    entry.edx = self.apic_id as u32;
                    entry.ecx = entry.index &amp; 0xff;
                    match entry.index {
                        0 =&gt; {
                            entry.eax = core_offset;
                            entry.ebx = self.nr_threads;
                            entry.ecx |= ECX_THREAD;
                        }
                        1 =&gt; {
                            entry.eax = pkg_offset;
                            entry.ebx = self.nr_threads * self.nr_cores;
                            entry.ecx |= ECX_CORE;
                        }
                        _ =&gt; {
                            entry.eax = 0;
                            entry.ebx = 0;
                            entry.ecx |= ECX_INVALID;
                        }
                    }
                }
                // 0x1f 扩展,支持 die 层级
                0x1f =&gt; {
                    if self.nr_dies &lt; 2 {
                        entry.eax = 0;
                        entry.ebx = 0;
                        entry.ecx = 0;
                        entry.edx = 0;
                        continue;
                    }
                    entry.edx = self.apic_id as u32;
                    entry.ecx = entry.index &amp; 0xff;
                    match entry.index {
                        0 =&gt; {
                            entry.eax = core_offset;
                            entry.ebx = self.nr_threads;
                            entry.ecx |= ECX_THREAD;
                        }
                        1 =&gt; {
                            entry.eax = die_offset;
                            entry.ebx = self.nr_cores * self.nr_threads;
                            entry.ecx |= ECX_CORE;
                        }
                        2 =&gt; {
                            entry.eax = pkg_offset;
                            entry.ebx = self.nr_dies * self.nr_cores * self.nr_threads;
                            entry.ecx |= ECX_DIE;
                        }
                        _ =&gt; {
                            entry.eax = 0;
                            entry.ebx = 0;
                            entry.ecx |= ECX_INVALID;
                        }
                    }
                }
                // ...
            }
        }
}
</code></pre><h3>PPTT</h3><p>根据 ACPI PPTT 表的标准来构建,我们需要计算每个节点的偏移值用于其子节点指向它。我们还需要计算每个节点的 uid,uid 初始化为 0,每增加一个节点 uid 的值加一。还需要根据 PPTT 表的标准计算 Flags 的值。最后需要计算整张表的大小然后修改原来的长度的值。</p><pre><code>// machine/src/standard_vm/aarch64/mod.rs
impl AcpiBuilder for StdMachine {
    fn build_pptt_table(
        &amp;self,
        acpi_data: &amp;Arc&lt;Mutex&lt;Vec&lt;u8&gt;&gt;&gt;,
        loader: &amp;mut TableLoader,
    ) -&gt; super::errors::Result&lt;u64&gt; {
        // ...
        // 配置 PPTT 表头
        // 添加 socket 节点
        for socket in 0..self.cpu_topo.sockets {
            // 计算到起始地址的偏移量
            let socket_offset = pptt.table_len() - pptt_start;
            let socket_hierarchy_node = ProcessorHierarchyNode::new(0, 0x2, 0, socket as u32);
            // ...
            for cluster in 0..self.cpu_topo.clusters {
                let cluster_offset = pptt.table_len() - pptt_start;
                let cluster_hierarchy_node =
                    ProcessorHierarchyNode::new(0, 0x0, socket_offset as u32, cluster as u32);
                // ...
                for core in 0..self.cpu_topo.cores {
                    let core_offset = pptt.table_len() - pptt_start;
                    // 判断是否需要添加 thread 节点
                    if self.cpu_topo.threads &gt; 1 {
                        let core_hierarchy_node =
                            ProcessorHierarchyNode::new(0, 0x0, cluster_offset as u32, core as u32);
                        // ...
                        for _thread in 0..self.cpu_topo.threads {
                            let thread_hierarchy_node =
                                ProcessorHierarchyNode::new(0, 0xE, core_offset as u32, uid as u32);
                            // ...
                            uid += 1;
                        }
                    } else {
                        let thread_hierarchy_node =
                            ProcessorHierarchyNode::new(0, 0xA, cluster_offset as u32, uid as u32);
                        // ...
                        uid += 1;
                    }
                }
            }
        }
        // 将 PPTT 表添加到 loader 中
    }
}
</code></pre><h3>Device Tree</h3><p>StratoVirt 的 microvm 使用 device tree 启动,所以我们需要配置 device tree 中的 cpus 节点下的 cpu-map 来使 microvm 支持解析 CPU 拓扑。在 StratoVirt 中,我们支持两层 cluster。我们使用了多层循环来创建这个 tree,第一层是创建第一层 cluster,第二层对应创建第二层的 cluster,第三层创建 core,第四层创建 thread。</p><pre><code>impl CompileFDTHelper for LightMachine {
    fn generate_cpu_nodes(&amp;self, fdt: &amp;mut FdtBuilder) -&gt; util::errors::Result&lt;()&gt; {
        // 创建 cpus 节点
        // ...
        // Generate CPU topology
        // 创建 cpu-map 节点
        let cpu_map_node_dep = fdt.begin_node("cpu-map")?;
        // 创建第一层 cluster 节点
        for socket in 0..self.cpu_topo.sockets {
            let sock_name = format!("cluster{}", socket);
            let sock_node_dep = fdt.begin_node(&amp;sock_name)?;
            // 创建第二层 cluster 节点
            for cluster in 0..self.cpu_topo.clusters {
                let clster = format!("cluster{}", cluster);
                let cluster_node_dep = fdt.begin_node(&amp;clster)?;
                // 创建 core 节点
                for core in 0..self.cpu_topo.cores {
                    let core_name = format!("core{}", core);
                    let core_node_dep = fdt.begin_node(&amp;core_name)?;
                    // 创建 thread 节点
                    for thread in 0..self.cpu_topo.threads {
                        let thread_name = format!("thread{}", thread);
                        let thread_node_dep = fdt.begin_node(&amp;thread_name)?;
                        // 计算 cpu 的 id
                        // let vcpuid = ...
                        // 然后添加到节点中
                    }
                    fdt.end_node(core_node_dep)?;
                }
                fdt.end_node(cluster_node_dep)?;
            }
            fdt.end_node(sock_node_dep)?;
        }
        fdt.end_node(cpu_map_node_dep)?;
        Ok(())
    }
}
</code></pre><p>这个代码构建出来设备树的结构和前面原理中展示的结构基本一致</p><h2>验证方法</h2><p>我们可以通过下面的命令启动一个虚拟机,<code>smp</code>参数用来配置 vCPU 拓扑</p><pre><code>sudo ./target/release/stratovirt \
    -machine virt \
    -kernel /home/hwy/std-vmlinux.bin.1 \
    -append console=ttyAMA0 root=/dev/vda rw reboot=k panic=1 \
    -drive file=/usr/share/edk2/aarch64/QEMU_EFI-pflash.raw,if=pflash,unit=0,readonly=true \
    -drive file=/home/hwy/openEuler-22.03-LTS-stratovirt-aarch64.img,id=rootfs,readonly=false \
    -device virtio-blk-pci,drive=rootfs,bus=pcie.0,addr=0x1c.0x0,id=rootfs \
    -qmp unix:/var/tmp/hwy.socket,server,nowait \
    -serial stdio \
    -m 2048 \
    -smp 4,sockets=2,clusters=1,cores=2,threads=1
</code></pre><p>接着,我们可以通过观察<code>/sys/devices/system/cpu/cpu0/topology</code>下面的文件来查看配置的 topology。</p><pre><code>[root@StratoVirt topology] ll
total 0
-r--r--r-- 1 root root 64K Jul 18 09:04 cluster_cpus
-r--r--r-- 1 root root 64K Jul 18 09:04 cluster_cpus_list
-r--r--r-- 1 root root 64K Jul 18 09:04 cluster_id
-r--r--r-- 1 root root 64K Jul 18 09:04 core_cpus
-r--r--r-- 1 root root 64K Jul 18 09:04 core_cpus_list
-r--r--r-- 1 root root 64K Jul 18 09:01 core_id
-r--r--r-- 1 root root 64K Jul 18 09:01 core_siblings
-r--r--r-- 1 root root 64K Jul 18 09:04 core_siblings_list
-r--r--r-- 1 root root 64K Jul 18 09:04 die_cpus
-r--r--r-- 1 root root 64K Jul 18 09:04 die_cpus_list
-r--r--r-- 1 root root 64K Jul 18 09:04 die_id
-r--r--r-- 1 root root 64K Jul 18 09:04 package_cpus
-r--r--r-- 1 root root 64K Jul 18 09:04 package_cpus_list
-r--r--r-- 1 root root 64K Jul 18 09:01 physical_package_id
-r--r--r-- 1 root root 64K Jul 18 09:01 thread_siblings
-r--r--r-- 1 root root 64K Jul 18 09:04 thread_siblings_list
</code></pre><p>比如:</p><pre><code>cat core_cpus_list
</code></pre><p>结果是</p><pre><code>0
</code></pre><p>表示和 cpu0 同一个 core 的 cpu 只有 cpu0。</p><pre><code>cat package_cpus_list
</code></pre><p>会显示</p><pre><code>0-1
</code></pre><p>表示和 cpu0 同一个 socket 的 cpu 有从 cpu0 到 cpu1。</p><p>下面这些工具也可以辅助进行验证。</p><p>比如:lscpu</p><pre><code>lscpu
</code></pre><p>通过执行<code>lscpu</code>命令会出现下面结果</p><pre><code>Architecture:            aarch64
  CPU op-mode(s):        32-bit, 64-bit
  Byte Order:            Little Endian
CPU(s):                  64
  On-line CPU(s) list:   0-63
Vendor ID:               ARM
  Model name:            Cortex-A72
    Model:               2
    Thread(s) per core:  1
    Core(s) per cluster: 16
    Socket(s):           -
    Cluster(s):          4
    Stepping:            r0p2
    BogoMIPS:            100.00
    Flags:               fp asimd evtstrm aes pmull sha1 sha2 crc32 cpuid
NUMA:
  NUMA node(s):          4
  NUMA node0 CPU(s):     0-15
  NUMA node1 CPU(s):     16-31
  NUMA node2 CPU(s):     32-47
  NUMA node3 CPU(s):     48-63
Vulnerabilities:
  Itlb multihit:         Not affected
  L1tf:                  Not affected
  Mds:                   Not affected
  Meltdown:              Not affected
  Spec store bypass:     Vulnerable
  Spectre v1:            Mitigation; __user pointer sanitization
  Spectre v2:            Vulnerable
  Srbds:                 Not affected
  Tsx async abort:       Not affected
</code></pre><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2F2022-08-27%2FStratoVirt-vCPU.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000384438">Virtio-Net 技术分析</a></li><li><a href="https://aijishu.com/a/1060000000380775">VFIO设备直通原理(二)</a></li><li><a href="https://aijishu.com/a/1060000000380640">VFIO设备直通原理(一)</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000380076">DAOS ARM64调测之旅</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Tue, 14 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000384628</guid>
            <link>https://aijishu.com/a/1060000000384628</link>
        </item>
        <item>
            <title><![CDATA[Virtio-Net 技术分析]]></title>
            <description><![CDATA[<p>简介</p><p>传统的设备模拟中,虚拟机内部设备驱动完全不知道自己处于虚拟化环境中。对于网络,存储,IO 等操作完全由虚拟机内核到 qemu,最后到宿主机内核处理,这样会产生很多的 VM exit 和 VM entry,因此性能很差。virtio 技术提高了虚拟机的性能,在该方案中,虚拟机能够感知到子集处于虚拟机环境中,并且会加载 virtio 总线驱动和 virtio 设备驱动。</p><p>virtio-net 方案,包括前端驱动和后端设备,以及自身定义的 virtio 传输协议。虚拟机作为前端驱动,安装了 virtio-net 的driver,在 qemu 中加载 virtio-net 后端设备,用来接收前端发送的 I/O 请求,然后从接收的数据中按照传输协议进行解析。最后 qemu 通过操作虚拟tap设备,对物理设备进行操作,从而完成请求,并且会通过中断机制通知前端驱动。</p><p>virtio-net网络包的发送过程:</p><p><img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/2020-11-23-virtionet.4b41c976.png" alt="2020-11-23-virtionet" title="2020-11-23-virtionet"></p><h2>Virtio-Net 后端</h2><h3>收包流程</h3><p>当网卡有数据包时,tap 设备首先会收到报文,对应 virtio-net 的 tap 设备 fd 变为可读。qemu 通过 epoll 方式监测到有网络数据包,调用回调函数发起收报流程。virtio_net_receive 函数把数据拷贝到虚拟机的 virtio 网卡接收队列。然后向虚拟机注入一个中断,虚拟机便感知到有网络数据报文。</p><pre><code>qemu/hw/net/virtio-net.c
virtio_net_receive
    virtio_net_do_receive
        virtio_net_receive_rcu
</code></pre><p>上述是 virtio-net 的函数调用关系,virtio-net 最终调用 virtio_net_receive_rcu 函数,对网络数据包添加到 virtio queue。</p><pre><code>virtio_net_receive_rcu {
    virtio_net_can_receive     // 根据vm running状态,queue和设备状态判断virtio-net是否可以收包
    virtio_net_has_buffers     // 检查缓冲区,避免出现竞争状况
    receive_filter             // 对网络包进行过滤
    while (offset &lt; size) {
        elem = virtqueue_pop     // 从vring中取出一个请求,将信息传递给elem域中
        len = iov_from_buf         // 负责将报文拷贝到buffer中,实现向guest物理地址写入数据
        virtqueue_fill             // 当数据写完后,撤销映射,更新VRingAvail.ring[]的相关字段
    }
    virtqueue_flush         // 更新VRingUsed.ring的idx,表明可以回收
    virtio_notify             // 负责注入中断,通知前端虚拟机
}
</code></pre><h3>发包流程</h3><p>虚拟机的 virtio 网卡驱动向网卡缓冲区填好报文,然后写 queue notify 寄存器。这样,触发 VM exit ,虚拟机就会退出到root 模式,在 qemu 的 vcpu 线程 virtio_mmio_write 对其处理。</p><pre><code>qemu/hw/net/virtio-net.c
virtio_net_add_queue
    virtio_net_handle_tx_bh
        qemu_bh_schedule
            virtio_net_tx_bh
                virtio_net_flush_tx
            virtio_queue_set_notification
</code></pre><p>这里将 virtio_net_handle_tx_bh 函数绑定到 tx_vq。内部调用 qemu_bh_schedule 运行指定的函数,这里绑定的是virtio_net_tx_bh。最终调用 virtio_net_flush_tx 函数发送报文。</p><pre><code>virtio_net_flush_tx
    for (;;) {
        elem = virtqueue_pop     // 从vring中取出一个请求
        qemu_sendv_packet_async // qemu发包函数
    }
</code></pre><p>在 virtio_net_flush_tx 函数中,获取报文 elem,写 tap 设备的 fd,最终发给 tap 设备,投递出去。qemu_sendv_packet_async 发送网络包的调用链为: qemu_sendv_packet_async-&gt;qemu_net_queue_send_iov-&gt;qemu_net_queue_flush- &gt;qemu_net_queue_deliver。qemu 后端最终调用 tap_write_packet- &gt;writev 写入 tap 字符设备。</p><p>接着在内核的字符设备驱动中,tun_chr_write_iter 会被调用,在 TCP/IP 协议栈进一步处理网络包。</p><h3>创建设备</h3><pre><code>virtio_net_class_init
    virtio_net_device_realize
    virtio_net_get_config
    virtio_net_get_features
    ...
</code></pre><p>virtio_net_device_realize 完成对 virtio-net 设备的初始化过程。</p><pre><code>virtio_net_device_realize
    virtio_net_set_config_size
    virtio_init
    virtio_net_set_default_queue_size
    virtio_net_add_queue
    n-&gt;ctrl_vq = virtio_add_queue(virtio_net_handle_ctrl)
    qemu_new_nic
</code></pre><p>这个函数创建了一个 VirtIODevice,virtio_init 用来初始化这个设备。接着调用 virtio_net_add_queue 初始化队列。当设置多队列特性,还要额外增加一个 ctrl_vq 队列,用作控制队列。最后,qemu_new_nic 会创建一个虚拟机里面的网卡。这里的网卡对应的是后端 tap 设备。</p><h3>模拟网卡</h3><p>tap 设备的使用:qemu 使用 tap 作为网络后端。首先需要在宿主机上创建 tap 设备,并添加到网桥 br0 上。</p><pre><code># brctl addbr br0
# ip tuntap add dev tap0 mode tap
# brctl addif br0 tap0
# ip link set dev tap0 up
</code></pre><p>在使用 qemu 命令启动虚拟机的过程中,传递参数:net,nic,model,netdev,ifname...</p><p>其中 nic 表示前端虚拟机网卡,model 表示创建网卡类型,netdev 定义后端 tap 设备,ifname 表示 tap 设备的名字。</p><p>qemu 的 main 函数会调用 net\_init\_clients 进行网络设备的初始化 ,在该函数内对 netdev 参数进行解析。</p><pre><code>net_init_clients
    qemu_opts_foreach(qemu_find_opts("netdev"),net_init_netdev, NULL, errp))
        net_init_netdev
            net_client_init-&gt;net_client_init1 // 根据不同的driver类型,调用不同的初始化函数
                net_init_tap
                    net_tap_init
                        tap_open
</code></pre><p>tap_open 函数打开一个文件 "/dev/net/tun" ,然后通过 ioctl 操作这个文件。</p><pre><code>tap_open{
    fd = open(PATH_NET_TUN, O_RDWR)
    ioctl(fd, TUNGETFEATURES, &amp;features)
    ioctl(fd, TUNSETVNETHDRSZ, &amp;len)
    ioctl(fd, TUNSETIFF, (void *) &amp;ifr)
}
</code></pre><p>最终,通过宿主机内核复杂的网络协议栈,形成一个网络包,发送到外部网络中。这样做的原因是:虚拟机将网络包发送给 qemu,qemu 没有自己的网络协议栈,因此,qemu 将网络包转换成文件流,写入 "/dev/net/tun" 字符设备。内核TUN/TAP 字符设备驱动收到这个写入的文件流,然后交给 TUN/TAP 虚拟网卡驱动。驱动将文件流再次转成网络包,交给TCP/IP 协议栈,从 tap 设备发出标准的网络包。</p><h2>Virtio-Net 前端</h2><p>虚拟机里面的进程发送一个网络包,通过文件系统和 Socket 调用网络协议栈,到达网络设备层。 这里将调用 virtio-net 驱动做进一步处理。</p><p>前端 driver 将报文发送出去,注册的 ops 函数定义如下,其中指定的发送函数为 start_xmit。</p><pre><code>kernel/drivers/net/virtio_net.c
static const struct net_device_ops virtnet_netdev = {
    .ndo_open            = virtnet_open,
    .ndo_stop            = virtnet_close,
    .ndo_start_xmit      = start_xmit,
    ...
};
</code></pre><p>调用 start\_xmit 函数,将 skb 发送到 virtqueue 中, 然后调用 virtqueue\_kick 通知 qemu 后端将数据包发送出去。</p><pre><code>start_xmit{
    free_old_xmit_skbs // 释放backend处理过的desc
    xmit_skb           // 发包
        sg_init_table
        sg_set_buf(sq-&gt;sg, hdr, hdr_len);                      // 数据包头部填入scatterlist
        num_sg = skb_to_sgvec(skb, sq-&gt;sg + 1, 0, skb-&gt;len);  // 数据包填入scatterlist
        virtqueue_add_outbuf // sg table 写入desc描述符表,head desc信息写vring.avail
    virtqueue_kick_prepare(sq-&gt;vq) &amp;&amp; virtqueue_notify(sq-&gt;vq) // kick通知qemu后端
}
</code></pre><p>当虚拟机写入一个 I/O 会使得 qemu 触发 VM exit 。接下来进入 qemu 做 virtio-net 相关处理。</p><h2>流程总结</h2><ol><li>在虚拟机里面的用户态,应用程序通过 write 系统调用写入 socket。</li><li>写入的内容经过 VFS 层,内核协议栈,到达虚拟机里面的内核的网络设备驱动,即 virtio_net。</li><li>virtio_net 网络设备有一个操作结构 struct net_device_ops,里面定义了发送一个网络包调用的函数为 start_xmit。</li><li>在 virtio_net 的前端驱动和 qemu 中的后端驱动之间,有两个队列 virtqueue,一个用于发送,一个用于接收。然后,我们需要在 start_xmit 中调用 virtqueue_add,将网络包放入发送队列,然后调用 virtqueue_notify 通知 qemu。</li><li>qemu 本来处于 KVM_RUN 的状态,收到通知后,通过 VM exit 指令退出客户机模式,进入宿主机模式。发送网络包的时候,virtio_net_handle_tx_bh 函数会被调用。</li><li>接下来是一个 for 循环,我们需要在循环中调用 virtqueue_pop,从传输队列中获取要发送的数据,然后调用 qemu_sendv_packet_async 进行发送。</li><li>qemu 会调用 writev 向字符设备文件写入,进入宿主机的内核。</li><li>在宿主机内核中字符设备文件的 file_operations 里面的 write_iter 会被调用,也即会调用 tun_chr_write_iter。</li><li>在 tun_chr_write_iter 函数中,tun_get_user 将要发送的网络包从 qemu 拷贝到宿主机内核里面来,然后调用 netif_rx_ni 开始调用宿主机内核协议栈进行处理。</li><li>宿主机内核协议栈处理完毕之后,会发送给 tap 虚拟网卡,完成从虚拟机里面到宿主机的整个发送过程。</li></ol><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2Fxinleguo%2F2020-11-23-Virtio_Net_Technology.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000380775">VFIO设备直通原理(二)</a></li><li><a href="https://aijishu.com/a/1060000000380640">VFIO设备直通原理(一)</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000380076">DAOS ARM64调测之旅</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000376121">回顾2022年计算机视觉领域最激动人心的进展</a></li><li><a href="https://aijishu.com/a/1060000000375922">量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 13 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000384438</guid>
            <link>https://aijishu.com/a/1060000000384438</link>
        </item>
        <item>
            <title><![CDATA[VFIO设备直通原理(二)]]></title>
            <description><![CDATA[<p>设备直通给虚拟机能够极大提升虚拟机对物理设备访问的性能,本文通过vfio内核模块和qemu用户态实现介绍vfio设备直通时的关键部分,包括:用户态访问设备IO地址空间,DMA重映射,中断重映射等.</p><h2>VFIO访问直通设备IO地址空间</h2><p>1.PIO和MMIO</p><p>设备的IO地址空间的访问有PIO和MMIO两种方式,前者通过独立的IO端口访问设备,而MMIO是在物理内存中映射一段区间,直接访问该内存就可以访问设备的配置空间.在虚拟化的场景下,虚拟机通过PIO访问直通设备时,首先会VM-exit到qemu,由qemu通过转换表完成对该PIO操作的转发.对于PCI设备而言,其bar空间地址是通过PIO的方式设置的,如果将设备的PIO访问完全暴露给虚拟机,虚拟机修改了真实的物理设备的PCI Bar空间基地址配置,与host上不一致,可能会出现严重的问题,所以对于设备的PIO访问需要建立转换表,在VM-exit之后由qemu来完成设置的转发.</p><p>对于设备的MMIO空间访问,则可以通过建立EPT页表将设备的MMIO物理内存映射到虚拟的MMIO地址空间,让虚拟机能够直接通过MMIO访问PCI设备的bar空间,提高IO性能.</p><p>2.获取直通设备信息</p><p>通过VFIO提供的接口可以获取到设备的基本信息,包括设备的描述符、region的数量等。</p><pre><code>vfio_get_device:
    fd = ioctl(group-&gt;fd, VFIO_GROUP_GET_DEVICE_FD, name);
    ret = ioctl(fd, VFIO_DEVICE_GET_INFO, &amp;dev_info);
    vbasedev-&gt;fd = fd;
    vbasedev-&gt;group = group;
    QLIST_INSERT_HEAD(&amp;group-&gt;device_list, vbasedev, next);
    vbasedev-&gt;num_irqs = dev_info.num_irqs;
    vbasedev-&gt;num_regions = dev_info.num_regions;
    vbasedev-&gt;flags = dev_info.flags;
</code></pre><p>2.直通设备PCI配置空间模拟</p><p>Qemu为每个PCI直通设备都建立一个虚拟数据结构 VFIOPCIDevice,保存物理PCI设备的相关信息,由vfio\_get\_device来获取,保存到vbasedev中。</p><pre><code>typedef struct VFIOPCIDevice {
    PCIDevice pdev;
    VFIODevice vbasedev;
</code></pre><p>VFIO设备作为qemu的设备模型的一部分,qemu对直通设备的模拟初始化入口在 vfio\_realize,通过vfio\_get_device获取到直通设备的基本信息之后,会调用pread设备的fd获取到设备的配置空间信息的一份拷贝,qemu会写入一些自定义的config配置。</p><pre><code>vfio_realize:
    /* Get a copy of config space */
    ret = pread(vdev-&gt;vbasedev.fd, vdev-&gt;pdev.config,
                MIN(pci_config_size(&amp;vdev-&gt;pdev), vdev-&gt;config_size),
                vdev-&gt;config_offset);
    if (ret &lt; (int)MIN(pci_config_size(&amp;vdev-&gt;pdev), vdev-&gt;config_size)) {
        ret = ret &lt; 0 ? -errno : -EFAULT;
        error_setg_errno(errp, -ret, "failed to read device config space");
        goto error;
    }
    /* vfio emulates a lot for us, but some bits need extra love */
    vdev-&gt;emulated_config_bits = g_malloc0(vdev-&gt;config_size);
    /* QEMU can choose to expose the ROM or not */
    memset(vdev-&gt;emulated_config_bits + PCI_ROM_ADDRESS, 0xff, 4);
    /* QEMU can change multi-function devices to single function, or reverse */
    vdev-&gt;emulated_config_bits[PCI_HEADER_TYPE] =
                                              PCI_HEADER_TYPE_MULTI_FUNCTION;
    /* Restore or clear multifunction, this is always controlled by QEMU */
    if (vdev-&gt;pdev.cap_present &amp; QEMU_PCI_CAP_MULTIFUNCTION) {
        vdev-&gt;pdev.config[PCI_HEADER_TYPE] |= PCI_HEADER_TYPE_MULTI_FUNCTION;
    } else {
        vdev-&gt;pdev.config[PCI_HEADER_TYPE] &amp;= ~PCI_HEADER_TYPE_MULTI_FUNCTION;
    }
    /*
     * Clear host resource mapping info.  If we choose not to register a
     * BAR, such as might be the case with the option ROM, we can get
     * confusing, unwritable, residual addresses from the host here.
     */
    memset(&amp;vdev-&gt;pdev.config[PCI_BASE_ADDRESS_0], 0, 24);
    memset(&amp;vdev-&gt;pdev.config[PCI_ROM_ADDRESS], 0, 4);
</code></pre><p>3.直通设备MMIO映射</p><p>直通PCI设备的MMIO内存主要是指其Bar空间,qemu使用vfio\_populate\_device函数调用VFIO接口获取到PCI设备的Bar空间信息,然后通过vfio\_region\_setup获取到对应region的信息,并将qemu内存虚拟化的MemoryRegion设置为IO类型的region。重要的是,qemu会为该IO类型的MemoryRegion设置ops为vfio\_region\_ops,这样后续对于该块内存的读写会经过qemu VFIO模块注册的接口来进行。</p><pre><code>vfio_populate_device:
    for (i = VFIO_PCI_BAR0_REGION_INDEX; i &lt; VFIO_PCI_ROM_REGION_INDEX; i++) {
        char *name = g_strdup_printf("%s BAR %d", vbasedev-&gt;name, i);
        ret = vfio_region_setup(OBJECT(vdev), vbasedev, &amp;vdev-&gt;bars[i].region, i, name);
            -&gt; vfio_get_region_info
            -&gt; memory_region_init_io(region-&gt;mem, obj, &amp;vfio_region_ops,
                              region, name, region-&gt;size);
        QLIST_INIT(&amp;vdev-&gt;bars[i].quirks);
    }
    ret = vfio_get_region_info(vbasedev, VFIO_PCI_CONFIG_REGION_INDEX, &amp;reg_info);
            -&gt;    ioctl(vbasedev-&gt;fd, VFIO_DEVICE_GET_REGION_INFO, *info))
    ret = ioctl(vdev-&gt;vbasedev.fd, VFIO_DEVICE_GET_IRQ_INFO, &amp;irq_info);
</code></pre><p>到这里已经获取到了PCI设备的MMIO内存信息,但是还没有真正的将物理内存中的Bar空间映射到qemu,这一动作在vfio\_bars\_setup中完成,vfio\_region\_mmap会对region中每个需要map的内存地址完成映射,然后将映射的物理内存通过qemu注册到虚拟机作为一段虚拟机的物理地址空间。</p><pre><code>vfio_bars_setup:
    for (i = 0; i &lt; PCI_ROM_SLOT; i++)
        vfio_bar_setup(vdev, i);
            vfio_region_mmap(&amp;bar-&gt;region)
                    for (i = 0; i &lt; region-&gt;nr_mmaps; i++) {
                    region-&gt;mmaps[i].mmap = mmap(NULL, region-&gt;mmaps[i].size, prot,
                                                MAP_SHARED, region-&gt;vbasedev-&gt;fd,
                                                region-&gt;fd_offset +
                                                region-&gt;mmaps[i].offset);
                    memory_region_init_ram_device_ptr
                    memory_region_add_subregion
            pci_register_bar(&amp;vdev-&gt;pdev, nr, type, bar-&gt;region.mem);
</code></pre><p>这里的映射mmap接口对应的是VFIO设备在内核中注册的vfio\_pci\_mmap 函数,在内核中,该函数会为vma注册一个mmap的ops,对应着注册了一个缺页处理函数,当用户态程序访问该段虚拟内存缺页时,调用注册的缺页处理函数,完成虚拟地址到实际物理地址的映射。</p><pre><code>vfio_pci_mmap:
    vma-&gt;vm_flags |= VM_IO | VM_PFNMAP | VM_DONTEXPAND | VM_DONTDUMP;
    vma-&gt;vm_ops = &amp;vfio_pci_mmap_ops;
        -&gt; .fault = vfio_pci_mmap_fault,
                -&gt; if (remap_pfn_range(vma, vma-&gt;vm_start, vma-&gt;vm_pgoff,
                    vma-&gt;vm_end - vma-&gt;vm_start, vma-&gt;vm_page_prot))
</code></pre><p>简单来说,对于MMIO内存的的映射,主要是将物理内存中的MMIO空间映射到了qemu的虚拟地址空间,然后再由qemu将该段内存注册进虚拟机作为虚拟机的一段物理内存,在这个过程中会建立从gpa到hpa的EPT页表映射,提升MMIO的性能。</p><h2>DMA重映射</h2><p>首先关于DMA,设备通过DMA可以直接使用iova地址访问物理内存,从iova到实际物理地址的映射是在IOMMU中完成的,一般在dma_allooc分配设备能够访问的内存的时候,会分配iova地址和实际的物理地址空间,并在iommu中建立映射关系。 所以说要让设备进行DMA最关键的几个部分:</p><ul><li>设备能够识别的地址:IOVA</li><li>一段物理内存</li><li>IOVA到物理内存在IOMMU中的映射关系</li></ul><p>基于这几点来看VFIO的DMA重映射就比较清晰,首先从VFIO设备的初始化开始,在获取设备信息之前会先获取到设备所属的group和Container,并调用VFIO\_SET\_IOMMU完成container和IOMMU的绑定,并attach由VFIO管理的所有设备。此外注意到这里的 pci\_device\_iommu\_address\_space 函数,意思是qemu为设备dma注册了一段专门的地址空间,这段内存作为虚拟机的一段物理内存存在,在VFIO\_SET\_IOMMU之后,注册该地址空间,其region\_add函数为 vfio\_listener\_region\_add,意思是当内存空间布局发生变化这里是增加内存的时候都会调用该接口。</p><pre><code>vfio_realize:
    group = vfio_get_group(groupid, pci_device_iommu_address_space(pdev), errp);
        vfio_connect_container(group, as, errp)
            ret = ioctl(fd, VFIO_SET_IOMMU, container-&gt;iommu_type);
            container-&gt;listener = vfio_memory_listener;
            memory_listener_register(&amp;container-&gt;listener, container-&gt;space-&gt;as);
                    -&gt; .region_add = vfio_listener_region_add,
</code></pre><p>那么跟DMA有什么关系呢,当为设备进行DMA分配一块内存时,实际是以MemoryRegion的形式存在的,也就是说虚拟机进行dma alloc 会调用region\_add函数,进而调用注册的memory\_listener\_region\_add函数,MemoryRegion有了意味着分配了一块物理内存,还需要IOVA和映射关系才行。这里,IOVA地址使用的是section-&gt;offset\_within\_address_space,为什么可以这样,因为IOVA地址只是作为设备识别的地址,只要建立了映射关系就有意义。</p><pre><code>vfio_listener_region_add:
    iova = TARGET_PAGE_ALIGN(section-&gt;offset_within_address_space);
    /* Here we assume that memory_region_is_ram(section-&gt;mr)==true */
    vaddr = memory_region_get_ram_ptr(section-&gt;mr) +
            section-&gt;offset_within_region +
            (iova - section-&gt;offset_within_address_space);
    ret = vfio_dma_map(container, iova, int128_get64(llsize),
                       vaddr, section-&gt;readonly);
vfio_dma_map:
    struct vfio_iommu_type1_dma_map map = {
        .argsz = sizeof(map),
        .flags = VFIO_DMA_MAP_FLAG_READ,
        .vaddr = (__u64)(uintptr_t)vaddr,
        .iova = iova,
        .size = size,
    };
    ioctl(container-&gt;fd, VFIO_IOMMU_MAP_DMA, &amp;map)
</code></pre><p>建立映射的关键在于vfio\_dma\_map,通过ioctl调用container-&gt;fd接口VFIO\_IOMMU\_MAP_DMA完成DMA重映射。为什么是container-&gt;fd,因为VFIO Container管理内存资源,与IOMMU直接绑定,而IOMMU是完成IOVA到实际物理内存映射的关键。值得注意的是qemu只知道这一段内存的虚拟地址vaddr,所以将vaddr,iova和size传给内核,由内核获取物理内存信息完成映射。</p><pre><code>vfio_dma_do_map:
    vfio_pin_map_dma
        while (size) {
            /* Pin a contiguous chunk of memory */
            npage = vfio_pin_pages_remote(dma, vaddr + dma-&gt;size,
                                size &gt;&gt; PAGE_SHIFT, &amp;pfn, limit);
            /* Map it! */
            vfio_iommu_map(iommu, iova + dma-&gt;size, pfn, npage,
                            dma-&gt;prot);
                list_for_each_entry(d, &amp;iommu-&gt;domain_list, next)
                    iommu_map(d-&gt;domain, iova, (phys_addr_t)pfn &lt;&lt; PAGE_SHIFT,
                            npage &lt;&lt; PAGE_SHIFT, prot | d-&gt;prot);
                        arm_smmu_map
                            __arm_lpae_map
            size -= npage &lt;&lt; PAGE_SHIFT;
            dma-&gt;size += npage &lt;&lt; PAGE_SHIFT;
        }
</code></pre><p>内核完成建立iova到物理内存的映射之前会将分配的DMA内存给pin住,使用vfio\_pin\_pages\_remote接口可以获取到虚拟地址对应的物理地址和pin住的页数量,然后vfio\_iommu_map进而调用iommu以及smmu的map函数,最终用iova,物理地址信息pfn以及要映射的页数量在设备IO页表中建立映射关系。</p><pre><code>+--------+  iova  +--------+  gpa  +----+
| device |   -&gt;   | memory |   &lt;-  | vm |
+--------+        +--------+       +----+
</code></pre><p>最终完成了DMA重映射,设备使用qemu分配的iova地址通过IOMMU映射访问内存,虚拟机使用gpa通过Stage 2页表映射访问内存</p><h2>中断重映射</h2><p>对于PCI直通设备中断的虚拟化,主要包括三种类型INTx,Msi和Msi-X。</p><p>1.INTx中断初始化及enable</p><p>对于INTx类型的中断,在初始化的时候就进行使能了,qemu通过VFIO device的接口将中断irq set设置到内核中,并且会注册一个eventfd,设置了eventfd的handler,当发生intx类型的中断时,内核会通过eventfd通知qemu进行处理,qemu会通知虚拟机进行处理。</p><pre><code>vfio_realize:
    if (vfio_pci_read_config(&amp;vdev-&gt;pdev, PCI_INTERRUPT_PIN, 1)) {
        pci_device_set_intx_routing_notifier(&amp;vdev-&gt;pdev, vfio_intx_update);
        ret = vfio_intx_enable(vdev, errp);
            *pfd = event_notifier_get_fd(&amp;vdev-&gt;intx.interrupt);
            qemu_set_fd_handler(*pfd, vfio_intx_interrupt, NULL, vdev);
            ret = ioctl(vdev-&gt;vbasedev.fd, VFIO_DEVICE_SET_IRQS, irq_set);
</code></pre><p>2.MSI-X初始化</p><p>MSIX在vfio_realzie初始化时,首先获取到物理设备的中断相关的配置信息,将其设置到注册给对应的MMIO内存中</p><pre><code>vfio_msix_early_setup:
    pos = pci_find_capability(&amp;vdev-&gt;pdev, PCI_CAP_ID_MSIX);
    if (pread(fd, &amp;ctrl, sizeof(ctrl),
            vdev-&gt;config_offset + pos + PCI_MSIX_FLAGS) != sizeof(ctrl)) {
    if (pread(fd, &amp;table, sizeof(table),
            vdev-&gt;config_offset + pos + PCI_MSIX_TABLE) != sizeof(table)) {
    if (pread(fd, &amp;pba, sizeof(pba),
            vdev-&gt;config_offset + pos + PCI_MSIX_PBA) != sizeof(pba)) {
    ctrl = le16_to_cpu(ctrl);
    table = le32_to_cpu(table);
    pba = le32_to_cpu(pba);
    msix = g_malloc0(sizeof(*msix));
    msix-&gt;table_bar = table &amp; PCI_MSIX_FLAGS_BIRMASK;
    msix-&gt;table_offset = table &amp; ~PCI_MSIX_FLAGS_BIRMASK;
    msix-&gt;pba_bar = pba &amp; PCI_MSIX_FLAGS_BIRMASK;
    msix-&gt;pba_offset = pba &amp; ~PCI_MSIX_FLAGS_BIRMASK;
    msix-&gt;entries = (ctrl &amp; PCI_MSIX_FLAGS_QSIZE) + 1;
vfio_msix_setup:
    msix_init(&amp;vdev-&gt;pdev, vdev-&gt;msix-&gt;entries,
                    vdev-&gt;bars[vdev-&gt;msix-&gt;table_bar].region.mem,
                    vdev-&gt;msix-&gt;table_bar, vdev-&gt;msix-&gt;table_offset,
                    vdev-&gt;bars[vdev-&gt;msix-&gt;pba_bar].region.mem,
                    vdev-&gt;msix-&gt;pba_bar, vdev-&gt;msix-&gt;pba_offset, pos);
        memory_region_init_io(&amp;dev-&gt;msix_table_mmio, OBJECT(dev), &amp;msix_table_mmio_ops, dev,
                          "msix-table", table_size);
        memory_region_add_subregion(table_bar, table_offset, &amp;dev-&gt;msix_table_mmio);
        memory_region_init_io(&amp;dev-&gt;msix_pba_mmio, OBJECT(dev), &amp;msix_pba_mmio_ops, dev,
                            "msix-pba", pba_size);
        memory_region_add_subregion(pba_bar, pba_offset, &amp;dev-&gt;msix_pba_mmio);
vfio_realize:
    /* QEMU emulates all of MSI &amp; MSIX */
    if (pdev-&gt;cap_present &amp; QEMU_PCI_CAP_MSIX) {
        memset(vdev-&gt;emulated_config_bits + pdev-&gt;msix_cap, 0xff,
               MSIX_CAP_LENGTH);
    if (pdev-&gt;cap_present &amp; QEMU_PCI_CAP_MSI) {
        memset(vdev-&gt;emulated_config_bits + pdev-&gt;msi_cap, 0xff,
               vdev-&gt;msi_cap_size);
</code></pre><ol start="3"><li>MSI/MSI-X enable 与 irqfd的注册</li></ol><p>当虚拟机因为写PCI配置空间而发生VM-exit时,最终会完成msi和msix的使能,以MSIX的使能为例,在qemu侧会设置eventfd的处理函数,并通过kvm将irqfd注册到内核中,进而注册虚拟中断给虚拟机。</p><pre><code>kvm_cpu_exec:
    vfio_pci_write_config:
        vfio_msi_enable(vdev);
        vfio_msix_enable(vdev);
            for (i = 0; i &lt; vdev-&gt;nr_vectors; i++) {
                if (event_notifier_init(&amp;vector-&gt;interrupt, 0)) {
                qemu_set_fd_handler(event_notifier_get_fd(&amp;vector-&gt;interrupt),
                                    vfio_msi_interrupt, NULL, vector);
                vfio_add_kvm_msi_virq(vdev, vector, i, false);
                    kvm_irqchip_add_msi_route(kvm_state, vector_n, &amp;vdev-&gt;pdev);
                    vfio_add_kvm_msi_virq
                        kvm_irqchip_add_irqfd_notifier_gsi
                            kvm_vm_ioctl(s, KVM_IRQFD, &amp;irqfd);
            /* Set interrupt type prior to possible interrupts */
            vdev-&gt;interrupt = VFIO_INT_MSI;
            ret = vfio_enable_vectors(vdev, false);
                ret = ioctl(vdev-&gt;vbasedev.fd, VFIO_DEVICE_SET_IRQS, irq_set);
</code></pre><h2>小结</h2><p>要让设备直通给虚拟机,需要将设备的DMA能力、中断响应和IO地址空间访问安全地暴露给用户态,本文主要介绍了VFIO设备直通关键的几个环节,包括如何在用户态访问物理设备的IO地址空间、如何进行DMA重映射和中断重映射。</p><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2Fwxggg%2F2020-11-29-vfio-passthrough-2.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000380640">VFIO设备直通原理(一)</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000380076">DAOS ARM64调测之旅</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000376121">回顾2022年计算机视觉领域最激动人心的进展</a></li><li><a href="https://aijishu.com/a/1060000000375922">量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!</a></li><li><a href="https://aijishu.com/a/1060000000375779">自制深度学习推理框架-前言-第一课</a></li><li><a href="https://aijishu.com/a/1060000000375145">YOLOv6精度提升的又一根稻草,感知量化的重参再设计,QARep值得内卷</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Wed, 18 Jan 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000380775</guid>
            <link>https://aijishu.com/a/1060000000380775</link>
        </item>
        <item>
            <title><![CDATA[VFIO设备直通原理(一)]]></title>
            <description><![CDATA[<p>现代系统大多提供DMA和中断重映射功能来确保I/O设备在有限的范围内运行,比如x86平台的AMD-Vi和Intel VT-d。VFIO(Virtual Function I/O)是一个可以将设备I/O、中断和DMA等能力安全的暴露到用户态空间,从而使用用户态驱动实现设备驱动的框架。通过VFIO进行设备直通到虚拟机,可以获得更高的设备I/O性能。</p><p>实现用户态驱动最关键的问题在于如何安全可控的将设备的DMA能力暴露到用户空间,IOMMU的出现可以限制设备对内存的访问,恶意的设备不能直接读写物理内存,经过IOMMU映射之后才能使用IOVA或者虚拟地址进行访存,由IOMMU来保证访存的安全性。</p><h2>VFIO内核组件</h2><p>VFIO内核组件主要包括如下图所示,通过设备文件向用户态提供统一访问接口vfio interface层,包括:</p><ul><li>VFIO container</li><li>VFIO group</li><li>VFIO device</li></ul><pre><code>+-----------------------------------------+
|            vfio interface               |
+-----------------------------------------+
|  vfio_iommu_driver |       vfio_pci     |
+--------------------+--------------------+
|        iommu       |       pci_bus      |
+--------------------+--------------------+
</code></pre><p>vfio interface 封装了vfio\_iommu\_driver和vfio\_pci分别和底层的IOMMU、PCI驱动进行交互,vfio\_iommu\_driver为VFIO提供了IOMMU重映射驱动,向用户态暴露DMA操作,主要是vfio\_iommu\_type1驱动,利用IOMMU管理IO页表的能力来进行IO重映射。vfio\_pci模块封装pci设备驱动并和用户态程序进行配合完成用户态的设备配置模拟、Bar空间重定向及中断重映射等功能。</p><p>VFIO框架中比较重要的几个概念包括:Container、Group和Device,其相互之间的关系如图所示,一个container可以理解为实际的物理资源集合,每个container中可以有多个group,group描述了设备在物理上的划分,一个group可以有多个device,划分的逻辑取决于硬件上的IOMMU拓扑结构。</p><pre><code>container
+------------------------+
|    group0    group1    |
|  +-------+  +------+   |
|  | dev0  |  | dev2 |   |
|  | dev1  |  +------+   |
|  +-------+             |
+------------------------+
</code></pre><p>可以结合内核中vfio.txt文件来理解Container、Group、Device和IOMMU之间的关系。</p><h2>VFIO Container</h2><pre><code>// container: /dev/vfio/vfio
struct vfio_container {
    struct kref            kref;
    struct list_head        group_list;
    struct rw_semaphore        group_lock;
    struct vfio_iommu_driver    *iommu_driver;
    void                *iommu_data;
    bool                noiommu;
};
</code></pre><p>Container是管理内存资源,和IOMMU、DMA及地址空间相关,可以通过打开设备文件/dev/vfio/vfio来获取container对应的文件描述符,在内核vfio/vfio.c中有对应该vfio设备文件的具体操作实现,ioctl主要是可以获取IOMMU相关的信息,vfio会将用户态对IOMMU相关操作发给底层的vfio_iommu驱动进行操作,通过vfio ioctl提供的接口如下:</p><ul><li>获取API versio</li><li>设置IOMMU的类型,如设置为常用的VFIO\_TYPE1\_IOMMU</li><li>获取IOMMU的信息</li><li>分配空间并进行DMA映射</li></ul><pre><code>int container, group, device, i;
struct vfio_iommu_type1_info iommu_info = { .argsz = sizeof(iommu_info) };
struct vfio_iommu_type1_dma_map dma_map = { .argsz = sizeof(dma_map) };
/* Create a new container */
container = open("/dev/vfio/vfio", O_RDWR);
if (ioctl(container, VFIO_GET_API_VERSION) != VFIO_API_VERSION)
    /* Unknown API version */
if (!ioctl(container, VFIO_CHECK_EXTENSION, VFIO_TYPE1_IOMMU))
    /* Doesn't support the IOMMU driver we want. */
/* Enable the IOMMU model we want */
ioctl(container, VFIO_SET_IOMMU, VFIO_TYPE1_IOMMU);
/* Get addition IOMMU info */
ioctl(container, VFIO_IOMMU_GET_INFO, &amp;iommu_info);
/* Allocate some space and setup a DMA mapping */
dma_map.vaddr = mmap(0, 1024 * 1024, PROT_READ | PROT_WRITE,
                MAP_PRIVATE | MAP_ANONYMOUS, 0, 0);
dma_map.size = 1024 * 1024;
dma_map.iova = 0; /* 1MB starting at 0x0 from device view */
dma_map.flags = VFIO_DMA_MAP_FLAG_READ | VFIO_DMA_MAP_FLAG_WRITE;
ioctl(container, VFIO_IOMMU_MAP_DMA, &amp;dma_map);
</code></pre><h2>VFIO Group</h2><pre><code>// group: /dev/vfio/%group_id
struct vfio_group {
    struct kref            kref;
    int                minor;
    atomic_t            container_users;
    struct iommu_group        *iommu_group;
    struct vfio_container        *container;
    struct list_head        device_list;
    struct mutex            device_lock;
    struct device            *dev;
    struct notifier_block        nb;
    struct list_head        vfio_next;
    struct list_head        container_next;
    struct list_head        unbound_list;
    struct mutex            unbound_lock;
    atomic_t            opened;
    wait_queue_head_t        container_q;
    bool                noiommu;
    struct kvm            *kvm;
    struct blocking_notifier_head    notifier;
};
</code></pre><p>Group是IOMMU进行DMA隔离的最小硬件单元,设备属于哪个group取决于IOMMU和设备的物理结构,在设备直通时需要将一个group里的所有设备都分配给一个虚拟机,其实就是多个group可以从属于一个container,而group下的所有设备也随着该group从属于该container。这样能够做到DMA隔离,避免一个container里的device通过DMA来攻击获取另一个container里的数据。</p><p>对于一个PCI设备0000:06:0d.0::,通过readlink可以在sys文件目录下获取其iommu_group,比如该PCI设备在ID为26的IOMMU group中。</p><pre><code>$ readlink /sys/bus/pci/devices/0000:06:0d.0/iommu_group
../../../../kernel/iommu_groups/26
</code></pre><p>设备挂载在pci bus下,可以使用 vfio-pci 来管理这个group。使用vfio-pci来管理设备时,首先从原来的驱动里unbind该PCI设备,然后将id写入新的vfio-pci路径下,会为这个group创建一个字符设备。</p><pre><code>$ lspci -n -s 0000:06:0d.0
06:0d.0 0401: 1102:0002 (rev 08)
$ echo 0000:06:0d.0 &gt; /sys/bus/pci/devices/0000:06:0d.0/driver/unbind
$ echo 1102 0002 &gt; /sys/bus/pci/drivers/vfio-pci/new_id
</code></pre><p>当设备绑定到vfio之后,在/dev/vfio/路径下面会产生一个新的group id,通过该id可以获取到group,完成以下操作:</p><ul><li>查询group状态,是否所有设备都绑定到vfio驱动</li><li>设置group的container</li><li>根据设备的BDF号为设备分配一个文件描述符</li></ul><pre><code>struct vfio_group_status group_status =
                { .argsz = sizeof(group_status) };
/* Open the group */
group = open("/dev/vfio/26", O_RDWR);
/* Test the group is viable and available */
ioctl(group, VFIO_GROUP_GET_STATUS, &amp;group_status);
if (!(group_status.flags &amp; VFIO_GROUP_FLAGS_VIABLE))
    /* Group is not viable (ie, not all devices bound for vfio) */
/* Add the group to the container */
ioctl(group, VFIO_GROUP_SET_CONTAINER, &amp;container);
/* Get a file descriptor for the device */
device = ioctl(group, VFIO_GROUP_GET_DEVICE_FD, "0000:06:0d.0");
</code></pre><h2>VFIO Device</h2><pre><code>struct vfio_device {
    struct kref            kref;
    struct device            *dev;
    const struct vfio_device_ops    *ops;
    struct vfio_group        *group;
    struct list_head        group_next;
    void                *device_data;
};
</code></pre><p>为了兼顾platform和pci设备,vfio统一对外提供<code>struct vfio_device</code>来描述vfio设备,并用device_data来指向如<code>struct vfio_pci_device</code>。Device即设备,但与真正的物理设备有区别的是,对于一个在硬件上独立的设备,单独构成一个iommu group,而如果是multi-function的设备,多个function之间是互联的,相互可以访问对方的数据,所以必须放到一个group里面。</p><p>通过group的ioctl操作和设备的的BDF号获取到设备描述符之后,在vfio_pci中有对应描述符的内核操作vfio_pci_ops,这个ops是在vfio_pci设备驱动vfio_pci_probe调用的时候注册到PCI设备的,probe的时候还会将设备加入到对应的group中。vfio_pci设备的ops中比较重要的是 vfio_pci_ioctl函数,提供了如下功能:</p><ul><li>VFIO_DEVICE_GET_INFO:获取设备信息,region数量、irq数量等</li><li>VFIO_DEVICE_GET_REGION_INFO:获取vfio_region的信息,包括配置空间的region和bar空间的region等</li><li>VFIO_DEVICE_GET_IRQ_INFO:获取设备中断相关的信息</li><li>VFIO_DEVICE_SET_IRQS:完成中断相关的设置</li><li>VFIO_DEVICE_RESET:设备复位</li><li>VFIO_DEVICE_GET_PCI_HOT_RESET_INFO:获取PCI设备hot reset信息</li><li>VFIO_DEVICE_PCI_HOT_RESET:设置PCI设备 hot reset</li><li>VFIO_DEVICE_IOEVENTFD:设置ioeventfd</li></ul><p>要暴露设备的能力到用户态空间,要让用户态能够直接访问设备配置空间并处理设备中断,对于PCI设备而言,其配置其配置空间是一个VFIO region,对应着一块MMIO内存,通过建立dma重映射让用户态能够直接访问设备配置空间,另外还需要建立中断重映射以让用户态驱动处理设备中断事件。</p><pre><code>struct vfio_device_info device_info = { .argsz = sizeof(device_info) };
/* Get a file descriptor for the device */
device = ioctl(group, VFIO_GROUP_GET_DEVICE_FD, "0000:06:0d.0");
/* Test and setup the device */
ioctl(device, VFIO_DEVICE_GET_INFO, &amp;device_info);
for (i = 0; i &lt; device_info.num_regions; i++) {
    struct vfio_region_info reg = { .argsz = sizeof(reg) };
    reg.index = i;
    ioctl(device, VFIO_DEVICE_GET_REGION_INFO, &amp;reg);
    /* Setup mappings... read/write offsets, mmaps
        * For PCI devices, config space is a region */
}
for (i = 0; i &lt; device_info.num_irqs; i++) {
    struct vfio_irq_info irq = { .argsz = sizeof(irq) };
    irq.index = i;
    ioctl(device, VFIO_DEVICE_GET_IRQ_INFO, &amp;irq);
    /* Setup IRQs... eventfds, VFIO_DEVICE_SET_IRQS */
}
/* Gratuitous device reset and go... */
ioctl(device, VFIO_DEVICE_RESET);
</code></pre><h2>Container,group和device绑定</h2><p>1.VFIO_SET_IOMMU: Container 绑定 IOMMU:</p><p>首先,VFIO的Container和IOMMU之间的绑定,通过在用户态通过ioctl调用VFIO_SET_IOMMU完成,绑定意味着将container管理的所有group都attach到IOMMU中,最终会将每个group中的每个设备都attach到IOMMU中,这意味着为设备建立IO页表完成初始化</p><pre><code>ioctl(container, VFIO_SET_IOMMU, VFIO_TYPE1_IOMMU)
    vfio_ioctl_set_iommu
        list_for_each_entry(group, &amp;container-&gt;group_list, container_next) {
        ret = driver-&gt;ops-&gt;attach_group(data, group-&gt;iommu_group);
            __iommu_attach_group
                ret = __iommu_group_for_each_dev(group, domain,
                     iommu_group_do_attach_device);
                        __iommu_attach_device
                            arm_smmu_attach_dev
                                建立设备的IO页表
</code></pre><p>2.VFIO\_GROUP\_SET_CONTAINER: 将Group设置到对应的Container:</p><p>VFIO提供接口由用户态指定Group绑定到哪个Container中,这个绑定操作会将group记录到container的链表中进行管理,并且如果已经设置好了vfio\_iommu\_driver,会进行group的attach操作,并进而完成该group中的设备的IO页表初始化</p><pre><code>VFIO_GROUP_SET_CONTAINER:
    vfio_group_set_container
        driver = container-&gt;iommu_driver;
        if (driver) {
            ret = driver-&gt;ops-&gt;attach_group(container-&gt;iommu_data,
                            group-&gt;iommu_group);
            if (ret)
                goto unlock_out;
        }
        group-&gt;container = container;
        container-&gt;noiommu = group-&gt;noiommu;
        list_add(&amp;group-&gt;container_next, &amp;container-&gt;group_list);
</code></pre><p>3.Device和Group之间的绑定关系源自设备和IOMMU的物理拓扑结构</p><h2>小结</h2><p>VFIO内核组件的实现与Linux内核的IOMMU、设备模型等紧密相连,通过抽象出VFIO的概念来完成对Linux内核组件的封装。本文主要通过VFIO的用户态接口的使用来介绍了VFIO的几个基本概念,包括VFIO Container、Group和Device。要让物理设备通过VFIO驱动暴露给用户态,需要完成以下步骤:</p><ul><li>首先将设备与原有驱动进行解绑,并重新绑定到VFIO驱动,VFIO驱动会为设备指定对应的group,设备属于哪个IOMMU group与设备和IOMMU的物理拓扑结构有关。</li><li>完成上述绑定之后,用户态驱动就可以通过<code>/dev/vfio/vfio</code>获取到VFIO 的container,设置vfio_iommu_driver的类型,通过container可以间接访问IOMMU完成dma映射。</li><li>然后可以通过<code>/dev/vfio/%group_id</code>获取到设备所属的group,通过ioctl将该group上的所有设备加入到container中。</li><li>然后通过group和设备BDF号可以获取到VFIO device的fd,并通过vfio提供的接口访问设备的配置空间和irq信息等,完成在用户态访问物理设备。</li></ul><p>VFIO设备直通有几个关键问题需要关注,如何访问直通设备的IO地址空间,如何完成中断重映射和DMA重映射让用户态驱动访问物理设备能力.</p><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2Fwxggg%2F2020-11-29-vfio-passthrough-1.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000380076">DAOS ARM64调测之旅</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000376121">回顾2022年计算机视觉领域最激动人心的进展</a></li><li><a href="https://aijishu.com/a/1060000000375922">量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!</a></li><li><a href="https://aijishu.com/a/1060000000375779">自制深度学习推理框架-前言-第一课</a></li><li><a href="https://aijishu.com/a/1060000000375145">YOLOv6精度提升的又一根稻草,感知量化的重参再设计,QARep值得内卷</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Tue, 17 Jan 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000380640</guid>
            <link>https://aijishu.com/a/1060000000380640</link>
        </item>
        <item>
            <title><![CDATA[DAOS ARM64调测之旅]]></title>
            <description><![CDATA[<p>背景概述</p><p>从IO500榜单上了解到,前10名有一半是DAOS,这是什么样一款存储软件,能如此优秀?从HDD到SSD,仅仅是性能提升、延迟降低,从SSD到SCM,不仅仅是性能提升,还支持按字节事务性访问,异常后回滚。SCM不带DMA,访问过程消耗大量的CPU资源,从软件架构上优化,就是想办法减少拷贝过程,诞生了RDMA零拷贝;从硬件上优化,intel推出了DSA加速器。DAOS+SCM新架构值得在ARM64上尝试。</p><h2>编译问题</h2><p>DAOS官网上明确说仅支持x86+Optane内存+NVMe SSD商用化,同时提供了用内存模拟Optane内存的实验特性。ARM64跑DAOS就有了可能。我们首先进行了版本编译,碰到了静态检查结构体大小报错。通过分析发现根因是pthread\_mutex在不同平台上,长度是不一样的,x86 64是40字节,ARM64是48字节,多了8字节,触发了结构体大小断言报错。提问题单,社区帮忙调整数据结构解决了断言错误。接下来就是依赖的SPDK组件编译报错,DAOS设置spdk\_arch是x86,修改为读编译主机arch,是ARM64就使用native方式编译,解决了SPDK编译报错问题。再下来是缺少libipmctl.so,ipmctl是intel Optane的管理工具,只有x86版本,ARM64需要去掉libipmctl依赖,增加ipmctl空接口后,解决了依赖报错问题。telemetry的go代码限制只有amd64编译,修改为amd64、arm64都编译。最后一个问题是Dup2在ARM64上不支持,使用Dup3来支持Dup2。</p><h2>IO500调测</h2><p>版本编译出来后,在ARM64上部署测试,一跑就挂死,调用栈是问号,打开所有调试信息,每次挂死前都是在mercury网络模块,无法进一步定位。直觉判定可能是内核页大小问题导致的,x86只支持4K页,ARM64支持4K、16K、64K页,改成4K页后,就能正常跑起来不挂死了。又出现了新问题,找不到网络接口,异常退出了。看日志,不支持bond、vlan等虚拟网络设备,改成使用物理网卡后,网络正常识别,集群正常起来。不一会就出现网络超时故障,查看日志有的是4秒超时,有的是请求发出去立即就超时了,看起来是集群间时间没有同步,对端收到后时间差超过超时门限,触发超时流程,时间同步后,几秒超时问题消失。跑一段时间后还是出现超时,且系统明显卡顿,查看CPU并不忙,查看内存free情况,发现内存很少,perf抓火焰图,发现内存申请走了慢路径申请,减少模拟Optane的内存大小后,网络超时问题消失。IO500测试60~70秒左右,就出现集群空间满,测试终止。查看SCM空间已用完,NVMe空间剩余还很大。上社区论坛查到,元数据只保留在SCM上,SCM空间不足也不会转存到NVMe中,直接上报空间不足错误。只能加大物理内存,从256GB加到512GB后,保留了更多的内存,IO500能测试到200秒左右还是耗光了SCM,IO500需要测试300秒,成绩才是有效的,因此需要想办法减少SCM空间使用。从DAOS架构图上看到SCM内存用来存放元数据、非对齐的数据、小块数据,查看代码,小块数据默认是4K以下就存SCM。修改容器属性,io门限值降低到2K,这样IO500终于能测试完。增加target个数,增加并发度,又出现了SCM耗尽,仔细读DAOS文档,提到每个target会预留SCM、NVMe内存做聚合使用,查看代码找到了SCM会保留2GB、NVMe保留10GB,没有设置接口,直接修改代码SCM保留512MB,每个target节省了1.5GB,一个rank 16个target共节省了24GB内存,每个rank总共分配了90GB,节省了26%的内存。IO500跑完再没出现过SCM耗尽,性能也得到了大幅提升。逐步增加客户端个数,发现mdtest部分测试项随着并发度增加能一直增加,说明客户端有瓶颈,10台客户端里有4台性能较差,更换性能更好的客户端后,性能进一步提升。开启端到端校验后测试,发现sha512新建容器大概率失败,X86每次都是成功的。执行isal_crypto下的sha512测试用例,都是通过的。看github问题列表,发现2021年就有人上报了在ARM64上sha512值错误并提供了测试程序。分析sha512代码,发现缺少了多次更新不足一块数据的追加处理,修复后,测试程序通过,DAOS端到端sha512校验也通过了。</p><h2>功能验证</h2><p>由于IO500只跑性能,没有校验数据是否正确,我们通过复制大量不同大小的文件到DAOS文件系统,重启DAOS集群后,再复制回来,检查前后的md5值是否一致,来校验数据是否正确。前后md5值是一致的,确认数据一致性没有问题。压力测试大概率出现复制回来过程中,服务端coredump,看log是池版本号为NULL触发断言,待分析。扩展测试了2/3副本、EC 2+1 2+2 4+2,数据校验均正确。</p><p>在社区上看到DAOS计划用容器来支持块设备,目前容器不支持预先指定容量。DAOS提供dfs插件支持fio测试,实际还是文件系统,并不是块设备。fio测试了单IO时延,写4K随机写110us、读160us、混合读写150us,接近100us。单台服务器4K多并发随机写测试420K IOPS。fusionstorage、阿里云已经能做到50us,100万IOPS,看来还有优化空间。</p><p>ARM64运行DAOS还有哪些问题?我们执行了daos_test、run_test.sh,跟x86对比测试,发现ARM64上出现vos小io测试错误、epoch错误、对象检查错误,分析测试代码,发现是测试代码本身的问题,x86能通过是因为局部变量初始值是0,ARM64初始值是随机的,修改测试代码后,这三个用例能通过。还发现EC一个用例失败,正在分析中,其他测试都跟x86一致。</p><h2>总结展望</h2><p>DAOS ARM64调测过程总体来说,比较顺利,主要是断言比较多,能快速定位问题。大量使用spdk、isal、isal_ctypto,pmdk模块,ARM64已经很好的适配过这些模块,因此很少补丁改动,即可在arm64上编译通过,运行稳定。dashboard使用promethues+grafana,性能测试过程可视化,方便诊断性能。每个target单线程,没有多线程并发冲突问题,也就没有ARM64弱序问题。问题分析过程中,大量参考了DAOS社区问题单,分析步骤详细,提供了分析思路。</p><p>后续重点在社区添加ARM64 CI,覆盖多种OS编译、单元测试,定期取主线版本进行性能测试。使用内存备电验证pmdk刷cache、数据校验正确性验证。社区版本支持UCX、NVMe of RDMA模块后,进行ARM64UCX、NoF功能测试。</p><h2>ARM64补丁列表</h2><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F8998" target="blank">DAOS-10569 client: fix build on aarch64</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F8984" target="blank">DAOS-10148 tse: fix TSE task buffer to account for aarch64</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9398" target="blank">DAOS-10871 build: Fix aarch64 build SPDK error</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9401" target="blank">DAOS-10872 control: Fix aarch64 build control errors</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9505" target="blank">DAOS-10922 control: Implement ipmctl for aarch64</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9487" target="blank">DAOS-10899 test: use expected variable to do assert checking</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9486" target="blank">DAOS-10898 obj: fix the assert in small_io test</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9456" target="blank">DAOS-10891 tests: fix incorrect assert in check_oclass</a></p><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2Ffengchunsong%2FDAOS%2520ARM64%E8%B0%83%E6%B5%8B%E4%B9%8B%E6%97%85.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000376121">回顾2022年计算机视觉领域最激动人心的进展</a></li><li><a href="https://aijishu.com/a/1060000000375922">量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!</a></li><li><a href="https://aijishu.com/a/1060000000375779">自制深度学习推理框架-前言-第一课</a></li><li><a href="https://aijishu.com/a/1060000000375145">YOLOv6精度提升的又一根稻草,感知量化的重参再设计,QARep值得内卷</a></li><li><a href="https://aijishu.com/a/1060000000374982">xNN:支付宝端侧深度学习框架</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Thu, 12 Jan 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000380076</guid>
            <link>https://aijishu.com/a/1060000000380076</link>
        </item>
        <item>
            <title><![CDATA[Virtio协议概述]]></title>
            <description><![CDATA[<p>摘要</p><p>半虚拟化设备(Virtio Device)在当前云计算虚拟化场景下已经得到了非常广泛的应用, 并且现在也有越来越多的物理设备也开始支持Virtio协议,即所谓的<code>Virtio Offload</code>, 通过将virtio协议卸载到硬件上(例如virtio-net网卡卸载,virtio-scsi卸载)让物理机和虚拟机都能够获得加速体验。 本文中我们来重点了解一下virtio技术中的一些关键点,方便我们加深对半虚拟化的理解。 本文适合对IO虚拟化有一定了解的人群阅读,本文的目的是对想要了解virtio内部机制的读者提供帮助。</p><p>在开始了解virtio之前,我们先思考一下几个相关问题:</p><ul><li>virtio设备有哪几种呈现方式?</li><li>virtio-pci设备的配置空间都有哪些内容?</li><li>virtio前端和后端基于共享内存机制进行通信,它是凭什么可以做到无锁的?</li><li>virtio机制中有那几个关键的数据结构?virtio配置接口存放在哪里?virtio是如何工作的?</li><li>virtio前后端是如何进行通信的?irqfd和ioeventfd是什么回事儿?在virtio前后端通信中是怎么用到的?</li><li>virtio设备支持MSIx,在qemu/kvm中具体是怎么实现对MSIx的模拟呢?</li><li>virtio modern相对于virtio legay多了哪些新特性?</li></ul><h2>0. 简单了解一下Virtio Spec协议</h2><p>virtio协议标准最早由IBM提出,virtio作为一套标准协议现在有专门的技术委员会进行管理, 具体的标准可以访问<a href="https://aijishu.com/link?target=http%3A%2F%2Fdocs.oasis-open.org%2Fvirtio%2Fvirtio%2Fv1.0%2Fvirtio-v1.0.html" target="blank"><code>virtio</code>官网</a>, 开发者可以向技术委员会提供新的virtio设备提案(<code>RFC</code>),经过委员会通过后可以增加新的virtio设备类型。</p><p>组成一个virtio设备的四要素包括:<strong>设备状态域,<code>feature bits</code>,设备配置空间,一个或者多个<code>virtqueue</code></strong>。 其中设备状态域包含6种状态:</p><ul><li>ACKNOWLEDGE(1):GuestOS发现了这个设备,并且认为这是一个有效的virtio设备;</li><li>DRIVER (2) : GuestOS知道该如何驱动这个设备;</li><li>FAILED (128) : GuestOS无法正常驱动这个设备,Something is wriong;</li><li>FEATURES_OK (8) : GuestOS认识所有的feature,并且feature协商一完成;</li><li>DRIVER_OK (4) : 驱动加载完成,设备可以投入使用了;</li><li>DEVICE_NEEDS_RESET (64) :设备触发了错误,需要重置才能继续工作。</li></ul><p><code>feature bits</code>用来标志设备支持那个特性,其中bit0-bit23是特定设备可以使用的<code>feature bits</code>, bit24-bit37预给队列和feature协商机制,bit38以上保留给未来其他用途。 例如:对于virtio-net设备而言,feature bit0表示网卡设备支持checksum校验。<code>VIRTIO_F_VERSION_1</code>这个feature bit用来表示设备是否支持virtio 1.0 spec标准。</p><p>在virtio协议中,所有的设备都使用virtqueue来进行数据的传输。<strong>每个设备可以有0个或者多个virtqueue,每个virtqueue占用2个或者更多个4K的物理页</strong>。 virtqueue有<code>Split Virtqueues</code>和<code>Packed Virtqueues</code>两种模式, 在<code>Split virtqueues</code>模式下virtqueue被分成若干个部分, 每个部分都是前端驱动或者后端单向可写的(不能两端同时写)。 每个virtqueue都有一个16bit的queue size参数,表示队列的总长度。 每个virtqueue由3个部分组成:</p><pre><code>    +-------------------+--------------------------------+-----------------------+
    | Descriptor Table  |   Available Ring  (padding)    |       Used Ring       |
    +-------------------+--------------------------------+-----------------------+
</code></pre><ul><li>Descriptor Table:存放IO传输请求信息;</li><li>Available Ring:记录了Descriptor Table表中的哪些项被更新了,前端Driver可写但后端只读;</li><li>Used Ring:记录Descriptor Table表中哪些请求已经被提交到硬件,前端Driver只读但后端可写。</li></ul><p>整个virtio协议中设备IO请求的工作机制可以简单地概括为:</p><ol><li>前端驱动将IO请求放到<code>Descriptor Table</code>中,然后将索引更新到<code>Available Ring</code>中,然后kick后端去取数据;</li><li>后端取出IO请求进行处理,然后结果刷新到<code>Descriptor Table</code>中再更新<code>Using Ring</code>,然后发送中断notify前端。</li></ol><p>从virtio协议可以了解到<strong>virtio设备支持3种设备呈现模式</strong>:</p><ul><li>Virtio Over PCI BUS,依旧遵循PCI规范,挂在到PCI总线上,作为virtio-pci设备呈现;</li><li>Virtio Over MMIO,部分不支持PCI协议的虚拟化平台可以使用这种工作模式,直接挂载到系统总线上;</li><li>Virtio Over Channel I/O:主要用在s390平台上,virtio-ccw使用这种基于channel I/O的机制。</li></ul><p>其中,Virtio Over PCI BUS的使用比较广泛,作为PCI设备需按照规范要通过PCI配置空间来向操作系统报告设备支持的特性集合, 这样操作系统才知道这是一个什么类型的virtio设备,并调用对应的前端驱动和这个设备进行握手,进而将设备驱动起来。 QEMU会给virtio设备模拟PCI配置空间,对于virtio设备来说PCI Vendor ID固定为0x1AF4, PCI Device ID 为 0x1000到0x107F之间的是virtio设备。 同时,在不支持PCI协议的虚拟化平台上,virtio设备也可以直接通过MMIO进行呈现, virtio-spec 4.2<a href="https://aijishu.com/link?target=https%3A%2F%2Fdocs.oasis-open.org%2Fvirtio%2Fvirtio%2Fv1.1%2Fcsprd01%2Fvirtio-v1.1-csprd01.html%23x1-1440002" target="blank">Virtio Over MMIO</a>有针对virtio-mmio设备呈现方式的详细描述,mmio相关信息可以直接通过内核参数报告给Linux操作系统。 本文主要基于virtio-pci展开讨论。</p><p>前面提到virtio设备有<code>feature bits</code>,<code>virtqueue</code>等四要素,那么在virtio-pci模式下是如何呈现的呢? 从virtio spec来看,老的virtio协议和新的virtio协议在这一块有很大改动。 virtio legacy(virtio 0.95)协议规定,对应的配置数据结构(virtio common configuration structure) 应该存放在设备的BAR0里面,我们称之为<code>virtio legay interface</code>,其结构如下:</p><pre><code>                       virtio legacy ==&gt; Mapped into PCI BAR0
    +------------------------------------------------------------------+
    |                    Host Feature Bits[0:31]                       |
    +------------------------------------------------------------------+
    |                    Guest Feature Bits[0:31]                      |
    +------------------------------------------------------------------+
    |                    Virtqueue Address PFN                         |
    +---------------------------------+--------------------------------+
    |           Queue Select          |           Queue Size           |
    +----------------+----------------+--------------------------------+
    |   ISR Status   | Device Stat    |           Queue Notify         |
    +----------------+----------------+--------------------------------+
    |       MSI Config Vector         |         MSI Queue Vector       |
    +---------------------------------+--------------------------------+
</code></pre><p>对于新的<code>virtio modern</code>,协议将配置结构划分为5种类型:</p><pre><code>/* Common configuration */
#define VIRTIO_PCI_CAP_COMMON_CFG        1
/* Notifications */
#define VIRTIO_PCI_CAP_NOTIFY_CFG        2
/* ISR Status */
#define VIRTIO_PCI_CAP_ISR_CFG           3
/* Device specific configuration */
#define VIRTIO_PCI_CAP_DEVICE_CFG        4
/* PCI configuration access */
#define VIRTIO_PCI_CAP_PCI_CFG           5
</code></pre><p>以上的每种配置结构是直接映射到virtio设备的BAR空间内,那么如何指定每种配置结构的位置呢? 答案是通过<code>PCI Capability list</code>方式去指定,这和物理PCI设备是一样的,体现了virtio-pci的协议兼容性。</p><pre><code>struct virtio_pci_cap {
        u8 cap_vndr;    /* Generic PCI field: PCI_CAP_ID_VNDR */
        u8 cap_next;    /* Generic PCI field: next ptr. */
        u8 cap_len;     /* Generic PCI field: capability length */
        u8 cfg_type;    /* Identifies the structure. */
        u8 bar;         /* Where to find it. */
        u8 padding[3];  /* Pad to full dword. */
        le32 offset;    /* Offset within bar. */
        le32 length;    /* Length of the structure, in bytes. */
};
</code></pre><p>只是略微不同的是,virtio-pci的Capability有一个统一的结构, 其中<code>cfg_type</code>表示Cap的类型,bar表示这个配置结构被映射到的BAR空间号。 这样每个配置结构都可以通过BAR空间直接访问,或者通过PCI配置空间的<code>VIRTIO_PCI_CAP_PCI_CFG</code>域进行访问。 每个Cap的具体结构定义可以参考virtio spec 4.1.4.3小节。</p><h1>1. 前后端数据共享</h1><p>传统的纯模拟设备在工作的时候,会触发频繁的陷入陷出, 而且IO请求的内容要进行多次拷贝传递,严重影响了设备的IO性能。 virtio为了提升设备的IO性能,采用了共享内存机制,<strong>前端驱动会提前申请好一段物理地址空间用来存放IO请求,然后将这段地址的GPA告诉QEMU</strong>。 前端驱动在下发IO请求后,QEMU可以直接从共享内存中取出请求,然后将完成后的结果又直接写到虚拟机对应地址上去。<strong>整个过程中可以做到直投直取,省去了不必要的数据拷贝开销</strong>。</p><p><strong><code>Virtqueue</code>是整个virtio方案的灵魂所在</strong>。每个virtqueue都包含3张表,<code>Descriptor Table</code>存放了IO请求描述符,<code>Available Ring</code>记录了当前哪些描述符是可用的,<code>Used Ring</code>记录了哪些描述符已经被后端使用了。</p><pre><code>                          +------------------------------------+
                          |       virtio  guest driver         |
                          +-----------------+------------------+
                            /               |              ^
                           /                |               \
                          put            update             get
                         /                  |                 \
                        V                   V                  \
                   +----------+      +------------+        +----------+
                   |          |      |            |        |          |
                   +----------+      +------------+        +----------+
                   | available|      | descriptor |        |   used   |
                   |   ring   |      |   

...

@github-actions
Copy link
Contributor

http://localhost:1200/aijishu/blog/readings - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[极术读书 - 极术社区]]></title>
        <link>https://aijishu.com//api/blog/1070000000080366/contents?page=1</link>
        <atom:link href="http://localhost:1200/aijishu/blog/readings" rel="self" type="application/rss+xml" />
        <description><![CDATA[极术读书 - 极术社区 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 15:26:53 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[免费国家精品课程:《嵌入式系统及应用》MOOC在线课程,第13次开课!]]></title>
            <description><![CDATA[<blockquote>极术读书是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>。</blockquote><p>和安谋科技技术人才生态有非常深入合作的苏州大学王宜怀教授,正在授课的基于Arm® Cortex®-M处理器的<strong>《嵌入式系统及应用》在线开放课程</strong>一直是我们极力推荐的。该课程连续几年被评为<strong>国家精品课程</strong>。</p><p>嵌入式系统是嵌入式人工智能与物联网的重要基础,该课程以Arm Cortex-M微处理器为蓝本,以软硬件构件为主线,基于嵌入式软件工程基本原理,按照"<strong>通用知识—驱动构件使用方法—测试实例—芯片编程结构—构件设计方法</strong>”的线条,逐步阐述嵌入式系统基本知识要素及较为规范的底层软硬件相结合的设计方法。</p><p><strong>目前是本课程的第13次开课,开课时间是2023年02月20日 ~ 2023年06月16日。</strong>如果你想掌握构成计算机的基本部件原理,掌握计算机高级程序设计方法,为从寄存器级理解软件干预硬件提供基础,那就赶快查看下方信息,报名学习吧!现在加入还来得及喔~</p><h2>《嵌入式系统及应用》在线开放课程</h2><p><a href="https://v.qq.com/x/page/j3325qf1xro.html">https://v.qq.com/x/page/j3325qf1xro.html</a></p><p>本视频由授课教师提供</p><h3><strong>01 基本介绍</strong></h3><ul><li><strong>课程名称:</strong>《嵌入式系统及应用》</li><li><strong>授课单位:</strong>苏州大学</li><li><strong>授课教师:</strong>王宜怀、张建、刘长勇</li><li><strong>在线学习网址:</strong>  <a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.icourse163.org%2Fcourse%2FSUDA-1001754273" target="blank">[<strong>爱课程-中国大学MOOC</strong>]</a></li><li><strong>本次开课时间:</strong>2023年02月20日 ~ 2023年06月16日</li></ul><h3>02 课程概述</h3><p>《嵌入式系统及应用》课程作为嵌入式人工智能与物联网相关专业的基础课程,以Arm Cortex-M微处理器为蓝本,采用构件化开发,针对每个知识点,提供样本程序(葫芦),学生通过模仿该程序稍加修改后可完成符合自我要求的程序(照葫芦画瓢)。课程按照<strong>“通用知识—驱动构件使用方法—测试实例—芯片编程结构—构件设计方法”</strong>的线条,逐步阐述嵌入式系统基本知识要素及较为规范的底层软硬件相结合的设计方法。</p><h3>03 课程用书</h3><p>本课程教学用书《嵌入式技术基础与实践(第6版)—基于STM32L431微控制器》,该教材历经十多年凝练,仔细梳理了嵌入式系统的通用基础知识要素,注重把握通用知识与芯片相关知识之间的平衡、把握硬件与软件的关系、对底层驱动进行构件化封装、设计合理的测试用例,教材内含简明实验套件,结合网上电子资源,方便读者进行实践与应用。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbqNk" alt="51546da303679fd168b5fe7d75d10e65.jpg" title="51546da303679fd168b5fe7d75d10e65.jpg"></p><p><strong>《嵌入式技术基础与实践(第6版)》(王宜怀主编)</strong></p><blockquote>【书内含通用嵌入式计算机GEC,型号:AHL-STM32L431,可完成书中基本实验】</blockquote><p><strong>电子资源下载地址及路径:</strong></p><p>“<a href="https://aijishu.com/link?target=https%3A%2F%2Fsumcu.suda.edu.cn%2F" target="blank">https://sumcu.suda.edu.cn/</a>”→“金葫芦专区”→“嵌入式书6版”,右边为下载索引</p><p><strong>点击<a href="https://aijishu.com/link?target=https%3A%2F%2Ftuicashier.youzan.com%2Fpay%2Fwscgoods_order%3Fbanner_id%3Dseach.16152946%7Esearch%7E7%7E7LEMSxlm%26words%3D%E5%B5%8C%E5%85%A5%E5%BC%8F%26alg%3D0%26slg%3Dconsumer-search%2CstandardModify%2C30be7fd3-df55-4535-c709-11c1b3a78e09%2C711.545_c9498a9569324a1ab4d18b403e0cc497%26reft%3D1630934839602%26spm%3Dseach.16152946%26is_share%3D1%26shopAutoEnter%3D1%26sl%3D3NTPzP%26from_params%3Dsl%7E3NTPzP%21online_kdt_id%7E16152946%26sub_kdt_id%3D16152946%26st%3D3%26alias%3D3f579wrkbwq9es4%26is_silence_auth%3D1" target="blank">链接</a>即可购买教材:</strong></p><h3><strong>04 课程大纲</strong></h3><p><strong>01 概述</strong></p><p>1.1 初识嵌入式系统<br>1.2 嵌入式系统的定义、发展简史、分类及特点<br>1.3 嵌入式系统的学习困惑、知识体系及学习建议<br>1.4 微控制器与应用处理器简介<br>1.5 嵌入式系统常用术语</p><p><strong>02 Arm Cortex-M4微处理器</strong></p><p>2.1 Arm Cortex-M4微处理器简介<br>2.2 寻址方式与机器码的获取方法<br>2.3 基本指令分类解析<br>2.4 汇编语言的基本语法</p><p><strong>03 存储器映像、中断源与硬件最小系统</strong></p><p>3.1 STM32L系列MCU概述<br>3.2 STM32L4的引脚图与硬件最小系统<br>3.3 由MCU构建通用嵌入式计算机</p><p><strong>04 GPIO及程序框架</strong></p><p>4.1 GPIO通用基础知识<br>4.2 软件干预硬件的方法<br>4.3 认识工程框架<br>4.4 GPIO构件的制作过程<br>4.5 第一个汇编语言工程:控制小灯闪烁<br>4.6 实验一 熟悉实验开发环境及GPIO编程</p><p><strong>05 嵌入式硬件构件与底层驱动构件基本规范</strong></p><p>5.1 嵌入式硬件构件<br>5.2 嵌入式底层驱动构件的概念与层次模型<br>5.3 底层驱动构件的封装规范<br>5.4 硬件构件及其驱动构件的复用与移植方法</p><p><strong>06 串行通信模块及第一个中断程序结构</strong></p><p>6.1 异步串行通信的通用基础知识<br>6.2 基于构件的串行通信编程方法<br>6.3 UART构件的制作过程<br>6.4 中断机制及中断编程步骤<br>6.5 实验二 串口通信及中断实验</p><p><strong>07 定时器相关模块</strong></p><p>7.1 定时器通用基础知识<br>7.2 STM32L431中的定时器<br>7.3 脉宽调制<br>7.4 输入捕捉与输出比较<br>7.5 实验三 定时器及PWM实验</p><p><strong>08 Flash在线编程、ADC与DAC  </strong></p><p>8.1 Flash在线编程  <br>8.2 ADC<br>8.3 DAC<br>8.4 实验四 ADC实验</p><p><strong>09&nbsp;SPI、I2C与TSC模块  </strong></p><p>9.1 串行外设接口SPI模块  <br>9.2 集成电路互联总线I2C模块<br>9.3 触摸感应控制器TSC模块<br>9.4 实验五 SPI通信实验</p><p><strong>10 CAN总线、DMA与位带操作</strong>  </p><p>10.1 CAN总线<br>10.2 DMA<br>10.3 位带操作</p><p><strong>11 系统时钟与其他功能模块</strong>  </p><p>11.1 时钟系统<br>11.2 复位模块与看门狗模块<br>11.3 电源控制模块与CRC校验模块<br>11.4 实验六 综合实验</p><p><strong>12 应用案例  </strong></p><p>12.1 嵌入式系统稳定性问题<br>12.2 外接传感器及执行部件的编程方法<br>12.3 实时操作系统的简明实例<br>12.4 嵌入式人工智能的简明实例<br>12.5 NB-IoT的应用简介<br>12.6 4G、Cat1、Wi-Fi及WSN的应用</p><h3><strong>05 预备知识</strong></h3><p>必须具备以下知识:</p><ul><li>计算机硬件基础(或模拟电路与数字电路、计算机组成、汇编语言、微机原理)</li><li>高级程序语言设计等(如C语言)</li></ul><p>学生通过学习上述课程,基本掌握构成计算机的基本部件原理,掌握计算机高级程序设计方法,为从寄存器级理解软件干预硬件提供基础。</p>
                                                    ]]></description>
            <pubDate>Wed, 22 Feb 2023 15:26:51 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385950</guid>
            <link>https://aijishu.com/a/1060000000385950</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】2023年元宵50本《嵌入式系统设计》赠书名单公布]]></title>
            <description><![CDATA[<p>2023年元宵节,极术社区联合安谋科技组织了<a href="https://aijishu.com/e/1120000000381671">【元宵赠书】50本《嵌入式系统设计—基于Cortex-M处理器与RTOS构建》新书免费领</a>,获得了很多工程师的支持。下面将中奖名单公布如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLPU" alt="1675672651957.jpg" title="1675672651957.jpg"></p><p>恭喜上面的中奖者,极术读书工作人员稍后将会发送邮件给中奖人员,请注意查收邮件。没有中奖的用户也不用灰心,极术读书会定期组织精选好书的活动,欢迎关注。</p>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000383140</guid>
            <link>https://aijishu.com/a/1060000000383140</link>
        </item>
        <item>
            <title><![CDATA[9位院士12位专家联合撰文:智能计算的新进展、挑战与未来 | Science合作期刊]]></title>
            <description><![CDATA[<blockquote>文章作者:允中  <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2Fd7PpTEHjfH33fVRTsOaucg" target="blank">量子位</a></blockquote><p>2023年1月3日,海内外9位院士及12位专家在Science《科学》合作期刊Intelligent Computing发表长篇综述论文《智能计算的最新进展、挑战和未来》。文章全面阐述了智能计算的理论基础、智能与计算的技术融合、重要应用、重大挑战和未来前景,将为学术界和工业界的相关研究人员提供全方位的参考和对智能计算领域的指引性见解。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKa" alt="image.png" title="image.png"></p><p>论文地址:<a href="https://aijishu.com/link?target=https%3A%2F%2Fspj.science.org%2Fdoi%2F10.34133%2Ficomputing.0006" target="blank">https://spj.science.org/doi/10.34133/icomputing.0006</a></p><h2>简介</h2><p>人类社会正从信息社会进入智能社会,计算已成为推动社会发展的关键要素。在万物互联的数字文明新时代,传统的基于数据的计算已经远远不能满足人类对更高智能水平的追求。</p><p>近年来,计算和信息技术飞速发展,深度学习的空前普及和成功将人工智能(AI)确立为人类探索机器智能的前沿领域。自此产生了一系列突破性的研究成果,包括Yann LeCun提出的卷积神经网络和Yoshua Bengio在深度学习因果推理领域的成果。</p><p>2016年3月,DeepMind推出的AI围棋程序<strong>AlphaGo</strong>与世界顶尖围棋高手李世石对战,在世界范围内引起了前所未有的关注。这场划时代的人机大战以AI的压倒性胜利而告终,成为将AI浪潮推向全新高度的催化剂。</p><p>AI的另一个重要推动者是<strong>大型预训练模型的出现</strong>,这些模型已经开始广泛应用于自然语言和图像处理,以在迁移学习的帮助下处理各种各样的应用。其中最具代表性的是自然语言处理模型GPT-3,已经证明具有高度结构复杂性和大量参数的大模型可以提高深度学习的性能。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKb" alt="image.png" title="image.png"></p><p>计算能力是支撑智能计算的重要因素之一。面对信息社会中庞大的数据源、异构的硬件配置和不断变化的计算需求,智能计算主要通过<strong>垂直和水平</strong>架构来满足智能任务的计算能力要求。</p><p><strong>垂直架构</strong>的特点是同质化的计算基础设施,主要通过应用智能方法提高资源利用效率来提升计算能力。</p><p>相比之下,<strong>水平架构</strong>对异构和广域计算资源进行协调和调度,使协作计算的效果最大化。例如,2020年4月,针对全球COVID-19研究的计算需求,Folding@home在三周内联合40万名计算志愿者,实现了2.5Exaflops的计算量,超过了世界上任何一台超级计算机。</p><p>尽管在智能和计算方面取得了巨大成功,但我们在这两个领域仍然面临着一些重大挑战:</p><p><strong>智能方面的挑战。</strong></p><p>使用深度学习的AI目前在可解释性、通用性、可进化性和自主性方面面临着重大挑战。与人类智能相比,当前大多数AI技术的作用都很弱,而且只能在特定领域或任务中发挥良好作用。从基于数据的智能升级到更多样化的智能,包括感知智能、认知智能、自主智能和人机融合智能等,也面临着重大的理论和技术挑战。</p><p><strong>计算方面的挑战。</strong></p><p>数字化浪潮带来了应用、连接、终端、用户以及数据量前所未有的增长,所有这些都需要巨大的计算能力。满足如此快速增长的计算能力需求变得越来越具有挑战性。智能社会中的巨型任务依赖于各种特定计算资源的高效组合。此外,传统的硬件模式不能很好地适应智能算法,制约了软件的发展。</p><p>迄今为止,智能计算还没有一个被普遍接受的定义。考虑到世界的三个基本空间,即人类社会空间、物理空间和信息空间日益紧密融合,我们从解决复杂的科学和社会问题的角度提出了智能计算的新定义:</p><blockquote><strong>智能计算是支撑万物互联的数字文明时代新的计算理论方法、架构体系和技术能力的总称。智能计算根据具体的实际需求,以最小的代价完成计算任务,匹配足够的计算能力,调用最好的算法,获得最优的结果。</strong></blockquote><p>智能计算的新定义是为响应人类社会、物理世界和信息空间三元融合快速增长的计算需求而提出的。智能计算以人为本,追求高计算能力、高能效、智能和安全。其目标是提供通用、高效、安全、自主、可靠、透明的计算服务,以支持大规模、复杂的计算任务。图1为智能计算的整体理论框架,它体现了支持人类社会—物理世界—信息空间集成的多种计算范式。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKc" alt="image.png" title="image.png"></p><h2>智能计算基础</h2><p>智能计算是数字文明时代支撑万物互联的新型计算理论方法、架构体系和技术能力的总称。利用智能计算可以实现许多经典和前沿研究领域的创新,以解决复杂的科学和社会问题。智能计算的基本要素包括人的智能、机器的能力以及由万物组成的物理世界。</p><p>在理论框架中,人是智能计算的核心和智慧的源泉,代表着原始的、与生俱来的智能,称为<strong>元智能</strong>。</p><p>元智能包括理解、表达、抽象、推理、创造和反思等人类高级能力,其中包含人类积累的知识。元智能以碳基生命为载体,是由个体和生物群体经过百万年的进化产生的,它包括生物具身智能、脑智能(尤其是人脑)和群体智能。所有的智能系统都是由人类设计和建造的。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKd" alt="image.png" title="image.png"></p><p>因此,在智能计算的理论体系中,人类的智慧是智能的源泉,计算机是人类智能的赋能。我们称计算机的智能为<strong>通用智能</strong>。</p><p>通用智能代表计算机解决具有广泛外延的复杂问题的能力,以硅基设施为载体,由个体和群体计算设备产生。生物智能可以在以下四个层次上移植到计算机上:数据智能、感知智能、认知智能和自主智能。元智能和通用智能如图2所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKe" alt="image.png" title="image.png"></p><p>智能计算面临大场景、大数据、大问题、泛在需求的挑战。算法模型变得越来越复杂,需要超级计算能力来支持越来越大的模型训练。目前,计算资源已经成为提高计算机智能研究水平的障碍。随着智能算法的发展,拥有丰富计算资源的机构可能形成系统的技术垄断。经典的超级计算机已经难以满足AI对计算能力的需求。</p><p>虽然通过算法优化可以在一定程度上降低算力需求,但并不能从根本上解决这个问题。需要从架构、加速模块、集成模式、软件栈等多个维度进行全面优化,如图3所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKf" alt="image.png" title="image.png"></p><p>智能计算在理论技术上具有以下特点(图4):理论技术上的自学习和可进化性,架构上的高计算能力和高能效,系统方法上的安全性和可靠性,运行机制上的自动化和精确性,以及服务性上的协作和泛在性。智能计算包括两个本质方面:<strong>智能和计算,两者相辅相成</strong>。</p><p>智能促进了计算技术的发展,计算是智能的基础。提高计算系统性能和效率的高级智能技术范式是<strong>“智能驱动的计算”</strong>。支持计算机智能发展的高效、强大的计算技术范式是<strong>“面向智能的计算”</strong>。</p><p>两种基本范式从五个方面进行创新,提升计算能力、能源效率、数据使用、知识表达和算法能力,实现泛在、透明、可靠、实时、自动化的服务。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKg" alt="image.png" title="image.png"></p><h2>智能驱动的计算</h2><p>提高计算的普适性对智能计算至关重要。现实场景中的问题,例如模拟、图(gragh)(图5)等,需要进行各种计算。智能计算的另一个关键点是如何提高计算的智能化水平。从经验上来说,我们常常需要向自然界的智能生物学习,计算也不例外,例如三大经典智能方法:人工神经网络(图6)、模糊系统和进化计算,都是受生物智能启发提出的算法。智能计算理论包括但不限于以上几种计算,以实现高度的泛在化和智能化。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKh" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKi" alt="image.png" title="image.png"></p><p>智能系统在开始工作之前,首先要进行<strong>智能感知</strong>。因此,感知智能在所有智能系统中都起着至关重要的作用。感知智能的重点是多模态感知、数据融合、智能信号提取和处理。</p><p>典型的例子包括智慧城市管理、自动潜水系统、智能防御系统和自主机器人。感知智能研究中最热门的领域是模拟人类的五种感觉能力,视觉、听觉、嗅觉、味觉和触觉。</p><p>此外,智能传感还包括温度、压力、湿度、高度、速度、重力等,需要大量的计算或数据训练来提高其性能。</p><p>近年来,随着模式识别和深度学习技术的全面应用,机器的感知智能已经超过人类,在语音、视觉和触觉识别方面取得了重大进展。由于其日益增长的重要性和日益拓宽的应用领域,智能传感器受到了广泛关注。如图7所示,智能传感器具有各种形式以满足不同应用的需求,并且更新更好的型号正在被不断的开发出来。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKj" alt="image.png" title="image.png"></p><p><strong>认知智能</strong>是指机器具有像人一样的逻辑理解和认知能力,特别是思考、理解、总结和主动应用知识的能力。它描述了智能体在真实环境中处理复杂事实和情况的能力。</p><p>数据识别是感知智能的核心功能,需要对图像、视频、声音等各类数据进行大规模的数据采集和特征提取,完成结构化处理。相比之下,认知智能需要理解数据元素之间的关系,分析结构化数据中的逻辑,并根据提炼出的知识做出响应。</p><p>认知智能计算主要研究机器的自然语言处理、因果推理和知识推理(图8)等领域。通过对人脑的神经生物学过程和认知机制的启发式研究,可以提高机器的认知水平,以使其获得帮助、理解、决策、洞察和发现的能力。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKk" alt="image.png" title="image.png"></p><p>驱动机器从被动输出到主动创造有两个关键要素:强泛化模型和与外部环境的持续交互。<strong>自主智能</strong>的发展路径从学习单一任务开始,举一反三,逐步达到与环境动态交互的主动学习,最终实现自我进化的高级智能。当前可以通过迁移学习、元学习和自主学习等技术寻找生成自主智能的可行路径。</p><p>尽管在智能的四个层面上(数据智能,感知智能,认知智能,自主智能)取得了重大进展,但目前仅通过计算/统计模型还难以从极其复杂的场景中实现完全的智能。</p><p>在这些场景中,人类应该继续在解决问题和决策中发挥不可或缺的作用,来探索人类认知过程中涉及的要素,并将其与机器智能相结合。下一步,将聚焦于人机交互、人机融合和脑机接口等技术。</p><h2>面向智能的计算</h2><p>AI的发现不断涌现,这在很大程度上归功于不断增长的计算能力。AI的快速变化是由新思想或革命性理论推动的。通常,最新的先进模型仅依赖于更大的神经网络和更强大的处理系统。</p><p>Open AI研究人员在2018年进行了一项研究,追踪基于计算能力的最大模型的增长情况。利用AI研究史上训练的一些最著名的AI模型所需的计算量,他们发现了计算资源快速增长的两个趋势。</p><p><strong>开发突破性模型所需的计算能力的增长速度与摩尔定律大致相同</strong>,即在2012年之前,单个微芯片的计算能力往往每两年翻一番。但图像识别系统AlexNet在2012年发布时引起了人们的新兴趣。AlexNet的引入刺激了顶级模型的计算需求急剧增加,从2012年到2018年,这种需求每3到4个月翻一番,如图9所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKl" alt="image.png" title="image.png"></p><p>当摩尔定律失效时,超大算力主要依赖于海量计算、内存和存储资源的并行叠加。</p><p>例如,“高性能计算”是指将大量计算机快速联网成一个“集群”以进行密集计算的做法,使用户能够比传统计算机更快地处理大量数据,从而获得更深入的洞察力和竞争优势。</p><p>此外,得益于云计算(图10),用户现在可以选择增加其高性能计算程序的容量,从而继续提高算力。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKn" alt="image.png" title="image.png"></p><p>推进智能计算架构创新的目标包括更高效的能源管理、更低的功耗、更便宜的总芯片成本以及更快速的错误检测和纠正。当涉及某些无法在CPU上执行的AI操作时,AI加速器可能会大大减少训练和执行时间。</p><p>在短期内,所使用加速器的架构专业化将是保持计算能力增长的最佳方式,如图11所示为已公开发布的AI加速器和处理器的峰值性能与功耗。</p><p>另外,<strong>内存计算</strong>(图12)是一个非常有效的方案,它能够使内存单元执行原始逻辑操作,因此它们可以在不需要与处理器交互的情况下进行计算,这是内存和处理器之间不断扩大速度差距的主要原因。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKo" alt="image.png" title="image.png"></p><p><strong>复杂性</strong>是传统计算机进一步突破的瓶颈。当今高度复杂的AI模型(例如深度神经网络)在边缘设备中仍然难以实现普遍使用。这是由于运行这些模型的高级GPU和加速器存在功率和带宽紧缩的缺陷,导致处理时间长并且架构设计繁琐。</p><p>由于这些问题,研究人员开始创造新的计算模式,主要包括:</p><p><strong>量子计算</strong>(图13),因为其具有纠缠或其他非经典相关性带来的量子优势,可以在许多复杂的计算问题中实现指数速度;</p><p><strong>神经形态计算</strong>(图14)的构造和操作受到大脑中神经元和突触的启发,因其能源效率高而非常适合计算,神经形态计算是事件驱动和高度并行化的,这意味着只有小部分系统同时工作,所以消耗的功率非常小;</p><p><strong>光子计算</strong>(图15)与电神经网络相比具有许多优势,包括超高带宽、快速计算速度和高并行性,所有这些都是通过使用光子硬件加速来计算复杂的矩阵向量乘法来实现的;</p><p><strong>生物计算</strong>(图16)是利用生物系统固有的信息处理机制发展起来的一种新的计算模型,主要包括蛋白质计算机、RNA计算机和DNA计算机,具有并行和分布式计算能力强、功耗低的优势。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKp" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKr" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKs" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKt" alt="image.png" title="image.png"></p><h2>智能计算的应用</h2><p>如果要跟上当前科学的快速发展,就必须不断的进行革新。现在正在进行的计算机革命的融合将以前所未有的方式极大地推动科学发现的进步。</p><p>几十年来,<strong>计算材料</strong>(图17)已成为研究材料特性和设计新材料的有力手段。然而,由于材料和材料行为的复杂性,它们的应用面临许多挑战,包括缺乏许多原子、离子以及原子和离子相互作用的力场和电位,分子动力学模拟中的不同热力学相,以及优化材料成分和工艺参数的巨大搜索空间。作为一种新的研究范式,AI集成到计算材料中是对传统计算材料的革命,并且已经在多长度、多时间尺度、多物理场耦合计算方面取得了巨大成功。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKu" alt="image.png" title="image.png"></p><p>作为最古老的观测科学之一,<strong>天文学</strong>在历史上收集了大量数据。由于望远镜技术的突破,收集到的数据爆炸性增长。天文学和天体物理学领域的特点是拥有丰富的数据和各种大口径的地面望远镜,例如即将推出的大型巡天望远镜和天基望远镜。使用高分辨率相机和相关工具,数据收集现在更加高效,并且在很大程度上实现了自动化,必须进行更高效的数据分析。因此,需要智能计算技术来解释和评估数据集。</p><p><strong>药物设计</strong>同样受益于AI(图18),AI可以帮助科学家建立蛋白质的3D结构、模拟药物和蛋白质之间的化学反应以及预测药物的功效。在药理学中,AI可以用于创建靶向化合物和多靶点药物。利用AI还可以设计合成路线、预测反应产率并了解化学合成背后的机制。AI让重新利用现有药物来治疗新的治疗目标变得更加容易。此外,AI对于识别不良反应、测定生物活性和获得药物筛选结果至关重要。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKv" alt="image.png" title="image.png"></p><p>随着大数据和AI技术使用的增长,<strong>作物育种</strong>开始进行融合与突破(图19)。AI技术可以支持服务的创建、模型的识别以及农业食品应用和供应链阶段的决策过程。AI在农业中的主要目标是准确预测结果并提高产量,同时最大限度地减少资源使用。因此,AI工具提供的算法可以评估产量,预测难以预见的问题或事件以及发生趋势。从种植到收获再到销售,AI促进了整个农业价值链。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKw" alt="image.png" title="image.png"></p><p>智能计算加速转型变革,导致经济和社会秩序的转变。由于技术进步,商品和劳动力市场正在发生巨大变化,<strong>数字社会</strong>正在逐渐形成(图20)。AI应该成为数字经济中每一个数据驱动战略的核心,包括工业4.0。例如,人工智能可以应用于预测性维护。预测性维护包括涉及通用设备或生产机械的维护,并使用来自生产线或运营线的传感器数据帮助降低运营费用或停机时间。</p><p>另外。AI可以应用于城市治理,通过开发新的策略和方法,使城市更智能。智慧城市治理旨在利用最先进的信息技术同步数据、程序、权限等,造福城市居民,主要包含四个方面:</p><blockquote>智慧决策、智慧城市治理、智慧行政和智慧城市合作。</blockquote><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKx" alt="image.png" title="image.png"></p><h2>展望</h2><p>从新兴产业生态的角度来看,智能计算产业仍面临着一系列挑战,决定着其未来发展。</p><p><strong>第一,与传统计算理论相比,智能计算是语言和生物学驱动的计算范式的应用和发展。</strong></p><p>这意味着机器可以根据不同的场景模仿人脑解决问题和决策的能力。然而,硅基和碳基运算的底层逻辑存在根本差异,大脑智能的机制仍有待进一步探索。智能计算的下一步是通过深入探索类人智能的基本要素,其在宏观层面的相互作用机制以及在微观层面上支持不确定性生成的计算理论,进行彻底的改革。</p><p><strong>第二,探索人类如何学习并将其应用到AI的研究中具有重要意义。</strong></p><p>知识驱动的机器智能可以从人类活动中学习,模仿人脑的决策能力,使机器能够像人一样感知、识别、思考、学习和协作。需要探索多知识驱动的知识推理和持续学习的理论和关键技术,使智能系统具有类人的学习、感知、表示和决策能力,促进智能计算从数据驱动向知识驱动演进。</p><p><strong>第三,软硬件适配面临着巨大的挑战,如精度损失、调用困难、协作效率低下等。</strong></p><p>未来,计算机必须突破冯·诺依曼体系结构下固定的输入和处理范式,大力发展交叉学科的智能计算和仿生学。在算法层面进行设计,突破现有架构的局限,以更低的计算和硬件设计成本尝试更灵活、更人性化的数据处理方式。此外,开发高性能、低能耗的新型组件设计方案,提高软件和硬件的计算能力和效率,以满足快速增长的需求和智能计算应用也很重要。</p><p><strong>第四,智能计算的理论技术架构是一个复杂的系统,具有多个与其他学科相互作用的子系统。</strong></p><p>系统中的各种硬件需要更复杂的系统设计,更好的优化技术,以及系统调优的更大成本。高维计算理论复杂性的缺乏是大规模计算系统面临的主要挑战。</p><h2>结论</h2><p>当前,我们正迎来<strong>人类发展的第四次浪潮</strong>,正处于从信息社会向<strong>人类社会-物理世界-信息空间</strong>融合的智能社会的关键转型期。在这种转变中,计算技术正在经历变革,甚至是颠覆性的变化。</p><p>智能计算被认为是未来计算的发展方向,不仅是面向智能的计算,而且是智能赋能的计算。它将提供通用、高效、安全、自主、可靠和透明的计算服务,以支持当今智能社会中大规模和复杂的计算任务。</p><p>本文全面回顾了智能计算的理论基础、智能与计算的技术融合、重要应用、挑战和未来方向。</p><p>我们希望这篇综述能为研究人员和从业者提供一个很好的参考,并促进未来智能计算领域的理论和技术创新。</p><blockquote>文章作者:允中  <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2Fd7PpTEHjfH33fVRTsOaucg" target="blank">量子位</a></blockquote><blockquote>更多FPGA干货请关注<a href="https://aijishu.com/blog/readings">极术读书</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000382786</guid>
            <link>https://aijishu.com/a/1060000000382786</link>
        </item>
        <item>
            <title><![CDATA[招募 | 基于Arm MCU数字控制系统的低代码开发方面的技术专著翻译合作]]></title>
            <description><![CDATA[<p>兔年伊始,机械工业出版社又来邀请各位技术专家合作翻译Arm相关国外技术专著啦,欢迎大家关注联系~</p><h2>关于书籍《Embedded Digital Control with Microcontrollers: Implementation with C and Python (IEEE Press) 》</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLto" alt="image.png" title="image.png"></p><p>《Embedded Digital Control with Microcontrollers: Implementation with C and Python (IEEE Press)》是关于Arm MCU数控系统低代码开发的参考书,图书介绍了简洁实用的微控制器数字控制系统实现方法和理论。</p><p>图书作者通过三个阶段的介绍,让读者更好得来进行学习。</p><ul><li>首先,图书描述了如何通过 Python 编程语言实现原型数字控制系统,以帮助读者更好地理解理论数字控制概念。</li><li>其次,本书为读者提供了使用 C 编程语言在实际微控制器上实现数字控制系统的指导。这将使读者能够解决涉及数字控制、机器人和机电一体化的现实问题。</li><li>最后,读者将学习如何通过在实际应用中实施数字控制系统,将书中讨论的理论问题与实践问题结合起来。在整本书中,使用 Python 编程语言的数字控制系统的应用确保读者可以应用其中包含的理论。</li></ul><p>书籍链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.amazon.com%2FEmbedded-Digital-Control-Microcontrollers-Implementation%2Fdp%2F1119576520%2Fref%3Dsr_1_1%3Fkeywords%3D9781119576525%26qid%3D1675070337%26s%3Dbooks%26sr%3D1-1" target="blank">https://www.amazon.com/Embedded-Digital-Control-Microcontrollers-Implementation/dp/1119576520/ref=sr_1_1?keywords=9781119576525&amp;qid=1675070337&amp;s=books&amp;sr=1-1</a></p><h2>翻译合作招募</h2><p>如果有对Arm嵌入式技术感兴趣的,并且有嵌入式编程经验的,专业和英语都不错的工程师们,欢迎联系翻译合作,具体合作细节可和负责人详细沟通。</p><p>联系人:<strong>机工社朱经理</strong><br>微信号:<strong>jack1967_zhu</strong>,添加微信请备注“Arm”<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbupq" alt="image.png" title="image.png"><br>扫一扫添加微信沟通翻译合作</p>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000381770</guid>
            <link>https://aijishu.com/a/1060000000381770</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】2023年元旦50本《Arm64体系架构编程与实践》赠书名单公布]]></title>
            <description><![CDATA[<p>为了感谢大家对极术社区的支持,2023年元旦极术社区微信服务号联合安谋科技学堂微信号组织了<a href="https://aijishu.com/e/1120000000376650">50本《Arm64体系架构编程与实践》的赠书活动</a>,近一千人参与了抽奖活动,抽奖名单已有微信抽奖助手自动公布,截图如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbKzy" alt="image.png" title="image.png"></p><p>恭喜以上中奖者,请私信兑奖码,极术社区微信号截图以及安谋科技微信号截图给极术小姐姐,如活动中未关注或者已取关的中奖用户不予兑换。</p><p>感谢大家的支持,更多读书活动请关注极术读书栏目:<a href="https://aijishu.com/books">https://aijishu.com/books</a></p>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000378287</guid>
            <link>https://aijishu.com/a/1060000000378287</link>
        </item>
        <item>
            <title><![CDATA[学习STM32/GD32开发设计,推荐《嵌入式系统设计—基于Cortex-M处理器与RTOS构建》]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>。</blockquote><p>本期极术社区推荐的是由杭州电子科技大学曾毓和黄继业老师编写,清华大学出版社出版的新书《嵌入式系统设计——基于Cortex-M处理器与RTOS构建》。该书系统介绍了基于ARM Cortex-M体系的嵌入式系统设计,同时配套有STM32芯片和GD32芯片的开发板,让工程师可以同时掌握两种芯片的开发及设计。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbKyC" alt="image.png" title="image.png"></p><h2>内容简介</h2><p>全书系统介绍了基于ARM Cortex-M体系的嵌入式系统设计,将微控制器技术、RTOS概念、传感器应用、编程技巧和实用方法与实际工程开发技术在STM32F407/GD32F407硬件平台上很好地结合起来,使读者通过本书的学习能迅速了解并掌握基于STM32/GD32的嵌入式系统设计方法和工程开发实用技术,为后续的深入学习和发展打下坚实的理论与实践基础。</p><h2>书籍特色</h2><ul><li><strong>紧跟嵌入式技术发展</strong>,基于图形化配置工具的和多任务系统设计视角介绍嵌入式系统应用设计流程。</li><li><strong>主要内容基于业内流行的FreeRTOS嵌入式实时系统</strong>,多实例演示RTOS的任务管理、优先级、信号、消息和任务通知等基础概念应用方法。</li><li><strong>应用示例丰富实用</strong>,操作讲解详实易懂,所有示例都通过了配套嵌入式平台的硬件验证,有较高的工程实践参考性。</li><li><strong>详实的嵌入式鸿蒙系统移植教程</strong>,涵盖环境搭建和工程创建、移植、编译下载过程完整步骤,帮你从零开始鸿蒙嵌入式应用开发。</li><li><strong>全书使用工具软件皆为免费、开源或作者自制软件</strong>,配套实验板资料全部开放,板载MCU器件也都可用国产MCU替代,可极大降低教学和学习成本。</li></ul><h2>配套开发板介绍</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbKyE" alt="image.png" title="image.png"><br>配套HX32F4学习板主要特点:</p><ul><li>核心芯片选用基于Cortex-M4内核的主流高性能MCU,型号STM32F407VET6/VGT6。(HX32F4的国产版本选用引脚兼容的GD32F407VET6或GD32F470VET6)</li><li>板载DAP下载调试器,仅需一根TYPE-C接口就能完成供电,下载,调试,串口调试。</li><li>板载嵌入式学习基础资源包括:8个LED、6个独立按键、4位数码管、无源蜂鸣器、麦克风、电容触摸按键,外接16MB SPI FLASH。</li><li>板载外设接口包括:3.5mm音频输出、ADC、DAC、CAN接口、ESP8266模块接口、HC05蓝牙接口、IIC接口、单总线模块接口、SD卡接口、以太网接口、USB Host和USB Device接口。</li><li>板上还提供15x2扩展接口,可直插2.4寸LCD触摸液晶屏或作为外设扩展接口,涵盖USART、SPI、IIC、ADC、DAC、定时器等外设引脚,方便进行其他的扩展实验。</li><li>原理图和PCB资料全部开放,开源地址:<a href="https://aijishu.com/link?target=https%3A%2F%2Fgitee.com%2Fzalileo%2FHX32F4-Board" target="blank">https://gitee.com/zalileo/HX32F4-Board</a></li></ul><h2>书籍目录</h2><ul><li><p>第1章 基于Cortex-M的嵌入式系统概述</p><ul><li>1.1 嵌入式系统基本概念</li><li>1.2 ARM Cortex体系结构</li><li>1.3 ARM Cortex-M各系列特点</li><li>1.4 STM32F407结构简介</li><li>1.5 实时操作系统RTOS简介</li><li>1.6 嵌入式系统在物联网中的发展</li></ul></li><li><p>第2章 Cortex-M嵌入式硬件平台</p><ul><li>2.1 硬件平台简介</li><li>2.2 主要器件</li><li>2.3 主要功能模块</li></ul></li><li><p>第3章 嵌入式开发工具与设计流程</p><ul><li>3.1 STM32开发工具</li><li><p>3.2 ARM Keil MDK工具</p><ul><li>3.3 STM32CubeMX使用方法</li><li>3.3.1 STM32Cube简介</li><li>3.3.2 STM32CubeMX软件安装</li></ul></li><li><p>3.4    基于HAL库的程序设计流程</p><ul><li>3.4.1 STM32 HAL介绍</li><li>3.4.2 CubeMX工程创建流程</li></ul></li><li>3.5 第一个LED点灯程序</li><li>实验1 按键扫描与流水灯设计</li></ul></li><li><p>第4章 FreeRTOS操作系统</p><ul><li>4.1 FreeRTOS系统简介</li><li>4.2 FreeRTOS系统移植</li><li><p>4.3 多任务系统基本概念</p><ul><li>4.3.1 任务及任务管理</li><li>4.3.2 优先级</li><li>4.3.3 消息队列</li><li>4.3.4 信号量</li><li>4.3.5 互斥量</li><li>4.3.6 事件</li><li>4.3.7 任务通知</li><li>4.3.8 内存管理</li></ul></li><li><p>4.4 创建第一个RTOS工程</p><ul><li>4.4.1 CubeMX工程配置</li><li>4.4.2 导出MDK工程</li><li>4.4.3 编写功能代码</li></ul></li><li>实验2 多任务键盘与流水灯实验</li></ul></li><li><p>第5章 简单外设应用</p><ul><li>5.1 数码管应用</li><li>5.2 按键与外部中断</li><li><p>5.3 麦克风与ADC应用</p><ul><li>5.3.1 添加串口打印输出</li><li>5.3.2 ADC模块介绍</li><li>5.3.3 麦克风AD采样示例</li></ul></li><li>5.4 单总线温湿度传感器应用</li><li>5.5 IIC接口陀螺仪传感器应用</li><li>实验3 声控延时亮灯实验</li><li>实验4 温度报警与倾角检测实验</li></ul></li><li><p>第6章 串口通信应用</p><ul><li>6.1 学习板虚拟串口概述</li><li>6.2 轮询接收方式串口通信</li><li><p>6.3 中断接收方式串口通信</p><ul><li>6.3.1 串口接收中断示例</li><li>6.3.2 DMA空闲中断示例</li><li>6.3.3 流水灯串口通信应用</li></ul></li><li>6.4    使用SWO调试</li></ul></li><li>实验5 简单串口通信实验</li><li>实验6 数据采集与串口通信实验</li><li><p>第7章 无线通信应用</p><ul><li><p>7.1 蓝牙HC05通信模块介绍</p><ul><li>7.1.1 HC05蓝牙模块用法介绍</li><li>7.1.2 HC05蓝牙模块AT指令介绍</li></ul></li><li>7.2 蓝牙通信实践</li><li><p>7.3 ESP8266WiFi通信模块介绍</p><ul><li>7.3.1 ESP01模块用法介绍</li><li>7.3.2 ESP01模块AT指令介绍</li></ul></li><li>7.4 WIFI通信实践</li><li><p>7.5    物联网连接应用实践</p><ul><li>7.5.1 创建OneNET平台设备</li><li>7.5.2 连接OneNET平台</li></ul></li><li>实验7 蓝牙手机遥控实验</li><li>实验8 数据采集及Wifi通信实验</li></ul></li><li><p>第8章     GUI显示应用</p><ul><li><p>8.1 OLED应用介绍</p><ul><li>8.1.1 单色IIC接口OLED介绍</li><li>8.1.2 OLED显示屏驱动程序介绍</li><li>8.1.3 GUISlim图形库介绍</li><li>8.1.4 汉字点阵文件介绍</li></ul></li><li>8.2 OLED应用实践</li><li>8.3 MCU接口LCD介绍</li><li><p>8.4 LCD应用实践</p><ul><li>8.4.1 emWin图形库介绍</li><li>8.4.2 FSMC总线配置</li><li>8.4.3 LCD屏驱动移植接口</li><li><p>8.4.4 GUI应用设计</p><ul><li>实验9 OLED显示屏数据曲线绘制实验</li></ul></li></ul></li><li>实验10 LCD液晶屏GUI设计实验</li></ul></li><li><p>第9章 定时器应用</p><ul><li><p>9.1 STM32F4定时器介绍</p><ul><li>9.1.1 常规定时器</li><li>9.1.2 HAL库定时器模块设计方法</li><li>9.1.3 定时器基本概念介绍</li></ul></li><li>9.2 定时器基本功能应用</li><li>9.3 PWM输出应用</li><li>9.4 信号捕捉应用</li><li>9.5 外部脉冲计数应用</li><li>实验11 简易闹铃设计实验</li><li>实验12 呼吸灯设计实验</li><li>实验13 简易频率计设计实验</li><li>实验14 简单录音机设计实验</li></ul></li><li><p>第10章 RTC与低功耗应用</p><ul><li>10.1 RTC实时时钟应用</li><li>10.2 STM32低功耗模式介绍</li><li>10.3 STM32低功耗应用</li><li>实验15 基于RTC的电子钟设计</li><li>实验16 低功耗待机与唤醒实验</li></ul></li><li><p>第11章 FatFs文件系统应用</p><ul><li>11.1 FatFs介绍</li><li><p>11.2 SPI FLASH应用实践</p><ul><li>11.2.1 添加配置SPI外设</li><li>11.2.2 添加SPI FLASH驱动</li><li>11.2.3 SPI FLASH直接读写操作实践</li><li>11.2.4 SPI FLASH文件读写操作实践</li></ul></li><li><p>11.3 SD卡应用实践</p><ul><li>11.3.1 添加配置SDIO外设</li><li>11.3.2 SD卡文件读写操作实践</li></ul></li><li><p>11.4 U盘挂载应用实践</p><ul><li>11.4.1 添加配置USB HOST组件</li><li>11.4.2 U盘文件读写操作实践</li></ul></li><li>实验17 数据存储实验</li><li>实验18 文件传输实验</li></ul></li><li><p>第12章 STM32 IAP程序设计</p><ul><li>12.1 STM32 IAP概念介绍</li><li>12.2 STM32内部FLASH介绍</li><li>12.3 STM32内部FLASH读写实践</li><li>12.4 程序跳转应用实践</li><li>12.5 IAP程序设计实践</li><li>实验19 串口IAP设计实验</li><li>实验20 U盘IAP设计实验</li></ul></li><li><p>第13章 鸿蒙嵌入式系统移植</p><ul><li><p>13.1 OpenHarmony介绍</p><ul><li>13.1.1 LiteOS-M内核简介</li><li>13.1.2 开发环境配置</li></ul></li><li><p>13.2 OpenHarmony系统移植</p><ul><li>13.2.1 创建裸机工程</li><li>13.2.2 系统编译构建移植</li><li>13.2.3 系统启动过程适配</li><li>13.2.4 编译及烧录</li></ul></li><li><p>13.3 OpenHarmony应用开发示例</p><ul><li>13.3.1 hello world示例</li><li>13.3.2 流水灯示例</li></ul></li><li>实验21 OpenHarmony系统移植实验</li></ul></li></ul><h2>作者介绍</h2><p>本书适用对象:电子、计算机类相关专业的高等院校本专科学生。<br>本书适用课程:单片机、嵌入式实践和电子系统综合设计等相关实践课程。</p><h2>书籍购买</h2><p>书籍购买链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13603919.html" target="blank">https://item.jd.com/13603919.html</a></p><p>相关课件及教学资料下载:<a href="https://aijishu.com/link?target=https%3A%2F%2Fgitee.com%2Fzalileo%2FHX32F4-Board" target="blank">https://gitee.com/zalileo/HX32F4-Board</a>,书籍课件在其下的“07 相关资料”目录中,书籍实验示例工程在其下的“05 学习板配套教材示例代码”目录中,如有下载问题,可联系邮箱:<a href="https://aijishu.com/link?target=mailto%3Azyu20%40hdu.edu.cn" target="blank">zyu20@hdu.edu.cn</a></p><p>老师可以免费申请该书籍,申请链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fdocs.qq.com%2Fform%2Fpage%2FDYkNBY2hVWGVvdG1v%23%2Ffill" target="blank">https://docs.qq.com/form/page/DYkNBY2hVWGVvdG1v#/fill</a><br>配套开发板购买:<br><a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.taobao.com%2Fitem.htm%3Fspm%3Da1z10.5-c-s.w4002-23113581213.10.1f823de1YJY0ga%26id%3D696813161080" target="blank">https://item.taobao.com/item.htm?spm=a1z10.5-c-s.w4002-23113581213.10.1f823de1YJY0ga&amp;id=696813161080</a></p><blockquote>更多书籍推荐及赠书活动请关注<a href="https://aijishu.com/books">极术读书</a>页面。</blockquote>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000378231</guid>
            <link>https://aijishu.com/a/1060000000378231</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】50本《智能网联汽车计算平台测试装调》赠书名单公布]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>栏目。</blockquote><p>2022年11月30日至12月5日,极术社区联合安谋科技学堂,机械工业出版社赠送50本《<a href="https://aijishu.com/e/1120000000368246"><strong>智能网联汽车计算平台测试装调</strong></a>》,非常感谢大家的积极参与,赠书名单如下,恭喜下方的小伙伴,下面每人将收到极术读书赠送的一本《智能网联汽车计算平台测试装调》。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbI8e" alt="df93aa6972e82e1338bfd90b7f03c6a.png" title="df93aa6972e82e1338bfd90b7f03c6a.png"></p><blockquote><p>祝贺以上获奖的小伙伴!</p><p>极术读书工作人员将给中奖用户发送邮件通知确认后尽快安排寄出。</p><p>暂时没有获奖的的小伙伴也不要着急,接下来极术读书及安谋科技学堂会多多组织类似的活动,努力为大家谋福利!<br>本次赠书活动感谢机械工业出版社和书籍作者上海交大刘彦博老师的大力支持!</p></blockquote><p><strong>活动原文</strong>:<a href="https://aijishu.com/e/1120000000368246">【极术读书】冬季送50本《智能网联汽车计算平台测试装调》,带你全面掌握智能汽车计算平台软硬件!</a></p><blockquote>关注<a href="https://aijishu.com/books">极术读书栏目</a>,即时获取最新推荐好书以及读书活动。</blockquote><p><strong>学习公号推荐</strong>:关注<strong>安谋科技学堂</strong>公众号,学习更多技术知识!<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbiNv" alt="安谋科技学堂.png" title="安谋科技学堂.png"></p><p><strong>如何购买?</strong><br>京东旗舰店:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13457369.html" target="blank">https://item.jd.com/13457369.html</a></p><blockquote>本活动最终解释权归极术社区所有。</blockquote>
                                                    ]]></description>
            <pubDate>Sun, 04 Dec 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000372749</guid>
            <link>https://aijishu.com/a/1060000000372749</link>
        </item>
        <item>
            <title><![CDATA[新书推荐| 《智能网联汽车计算平台测试装调》带你全面学习智能汽车计算平台]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>。</blockquote><p>在政策、技术与市场等多重因素的影响下,汽车这一传统产业与能源、交通、信息通信等领域有关技术加速融合,正在形成电动化、智能化、网联化的发展格局。智能网联汽车的发展已经进入快车道。而随着无人驾驶技术的发展,智能网联汽车计算平台在智能驾驶中的作用也愈发重要。为了让大家更快掌握智能网联汽车计算平台,极术读书给大家推荐由北京电子科技职业学院汽车工程学院院长冯志新和上海交大刘彦博编写,机械工业出版社最新出版的《智能网联汽车计算平台测试装调》。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbHXm" alt="image.png" title="image.png"></p><h2>内容简介</h2><p>本书是智能网联计算平台测试应用与调试开发的初级教材,主要是为了满足行业对智能网联汽车技术专业人才的需求,促进高职院校汽车专业的建设。</p><p>全书共8章,以学习任务为出发点贯穿教学,通过任务导入、任务分析、任务资讯、任务准备、任务实施、任务检查与评价逐层深入实践。</p><p>本书内容包括智能网联车载计算平台的基础知识、框架结构和硬件认知,Python 语言和Linux 系统的相关操作和基础知识,华为MDC 平台和智行者计算平台的拆装与调试,以及相关软件的环境部署和操作技巧。</p><h2>书籍特色</h2><p>本书具有以下特点:</p><p>1)紧跟汽车新技术的发展步伐,结合智能网联汽车技术专业的职业取向、培养目标进行内容设置,及时反映产业升级和行业发展需求,体现新知识、新技术、新工艺、新方法、新材料。</p><p>2)采用学习任务式编写体例。每一个学习任务都对应有相关的任务驱动,且配备有对应的技能操作步骤,可操作性强。</p><p>3)注重实践应用能力的培养和技能的提升,实现“理实一体”,旨在为行业培养高素质的汽车智能技术技能人才。</p><p>本书在编写过程中大量参考了<strong>华为、百度、英伟达、安谋科技、亚马逊、迈斯沃克、恩智浦、盛心杰缘智能科技、九州华海科技、盛子智能科技</strong>等知名公司的工程技术专家提供的资料,具备一定的先进性和工程性。</p><h2>书籍目录</h2><ul><li>1 计算平台认知</li><li>2 计算平台架构认知</li><li>3 计算平台硬件认知</li><li>4 Python 基础知识</li><li>5 Linux 基础知识</li><li>6 华为MDC 300F 平台的拆装与调试</li><li>7 智行者计算平台的拆装与调试</li><li>8 软件部署</li></ul><h2>作者介绍</h2><ul><li><strong>冯志新</strong>,工学博士,教授,北京电子科技职业学院 汽车工程学院院长,北京市级专业带头人,教育部课程思政教学名师,教育部汽车职业教育教学指导委员会委员。全国“双高”汽车制造与装配技术专业群建设负责人,北京市市级教师教学创新团队和高校继续教育高水平教学团队负责人。曽获教育教学成果一等奖1项,获北京市级教育教学成果一等奖2项,主持和参与厅局级以上课题8项,主编教材4部。兼任中国机械工业教育协会第五届理事,国家职业技能鉴定高级考评员和质量督导员,机械工业人才评价工作专家委员会委员。</li><li><strong>刘彦博</strong> ,中国汽车产品高级工程师,上海交通大学教辅系列青年教师<br>,华为云MVP专家/华为鲲鹏计算先锋教师,百度自动驾驶培训讲师,英伟达自动驾驶培训讲师,IEEE上海会员。主要研究方向为汽车电子、智能网联感知融合技术、智能网联网络拓扑优化等。精通嵌入式系统、硬件电路设计,熟悉多种智能网联车载平台系统。主要参与的项目有信息产业部中国电子科技集团公司2U/3U车载计算平台设计、车载采集监控系统、北斗车载控制系统、车载电子控制系统,教育部产学研华为云智能驾驶开发设计、教育部产学研无人驾驶课程开发、教育部产学研5G车路协同开发等项目。发表EI核心论文30余篇、发明专利5篇、软件著作5篇,著有《 智能网联汽车计算平台测试装调》《新能源汽车技术研究进展微探》,《电子控制技术》等教材。</li></ul><h2>书籍购买</h2><p>京东链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13457369.html" target="blank">https://item.jd.com/13457369.html</a></p><blockquote>更多书籍推荐及赠书活动请关注<a href="https://aijishu.com/books">极术读书</a>页面。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 21 Nov 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000368242</guid>
            <link>https://aijishu.com/a/1060000000368242</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】赠卡活动第二期名单公布]]></title>
            <description><![CDATA[<p>11月第一周,极术读书栏目又组织了<a href="https://aijishu.com/e/1120000000361727">第二次极客时间月卡赠送活动</a>。活动获得了很多社区用户的支持,恭喜以下的用户获得极客时间超级会员月卡。<br>姓名    手机<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbG7u" alt="jikeshijian.png" title="jikeshijian.png"></p><blockquote>工作人员会在1~2个工作日发邮件到大家登记邮箱说明如何免费兑换卡券,敬请关注邮件。请在<strong>2022年12月2日</strong>前兑换,超过时间则不予兑换。如有任何问题欢迎微信联系极术小姐姐(微信:aijishu20)</blockquote><p><strong>推荐目前极术社区正在组织的活动</strong></p><ul><li><a href="https://aijishu.com/e/1120000000359788">「免费申请」基于Arm Cortex-M4的兆易创新GD32F427高性能开发板试用活动</a></li></ul><p>更多赠书赠卡活动敬请关注<a href="https://aijishu.com/books"><strong>极术读书</strong></a>。</p>
                                                    ]]></description>
            <pubDate>Sun, 06 Nov 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000365015</guid>
            <link>https://aijishu.com/a/1060000000365015</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】国庆《嵌入式实时操作系统 ―基于ARM Mbed OS的应用实践》赠书名单公布]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>栏目。</blockquote><p>2022年9月28日至10月8日,极术社区联合安谋科技学堂赠送50本《<a href="https://aijishu.com/e/1120000000355587"><strong>嵌入式实时操作系统 ―基于ARM Mbed OS的应用实践</strong></a>》,非常感谢大家的积极参与,赠书名单如下,恭喜下方的小伙伴,下面每人将收到极术读书赠送的一本《嵌入式实时操作系统 ―基于ARM Mbed OS的应用实践》。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbFwu" alt="2022年国庆赠书.png" title="2022年国庆赠书.png"></p><blockquote><p>祝贺以上获奖的小伙伴!</p><p>极术读书工作人员将给中奖用户发送邮件通知确认后尽快安排寄出。</p><p>暂时没有获奖的的小伙伴也不要着急,接下来极术读书及安谋科技学堂会多多组织类似的活动,努力为大家谋福利!<br>本次赠书活动感谢电子工业出版社和书籍作者王宜怀教授的大力支持!</p></blockquote><p><strong>活动原文</strong>:<a href="https://aijishu.com/e/1120000000355587">【极术读书】国庆赠书50本《嵌入式实时操作系统 ―基于ARM Mbed OS的应用实践》,掌握实时操作系统应用及原理!</a></p><blockquote>关注<a href="https://aijishu.com/books">极术读书栏目</a>,即时获取最新推荐好书以及读书活动。</blockquote><p><strong>学习公号推荐</strong>:关注<strong>安谋科技学堂</strong>公众号,学习更多技术知识!<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbiNv" alt="安谋科技学堂.png" title="安谋科技学堂.png"></p><p><strong>如何购买?</strong><br>京东旗舰店:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13237887.html" target="blank">https://item.jd.com/13237887.html</a></p><blockquote>本活动最终解释权归极术社区所有。</blockquote>
                                                    ]]></description>
            <pubDate>Fri, 07 Oct 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000358877</guid>
            <link>https://aijishu.com/a/1060000000358877</link>
        </item>
        <item>
            <title><![CDATA[极术读书 | 新书推荐《嵌入式实时操作系统 ――基于ARM Mbed OS的应用实践》]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>。</blockquote><p>嵌入式实时操作系统是嵌入式人工智能与物联网终端的重要工具和运行载体,也是嵌入式工程师必备知识。本篇极术读书将推荐安谋科技合作图书,苏州大学王宜怀教授所著《<strong>嵌入式实时操作系统 ――基于ARM Mbed OS的应用实践</strong>》。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbEw2" alt="image.png" title="image.png"></p><h2>内容介绍</h2><p>虽然实时操作系统种类繁多,有国外的,也有国产的;有收费的,也有免费的;有开发者持续维护升级的,也有依赖爱好者更新升级的。但是无论哪一种, 学习实时操作系统时都必须以一个具体的实时操作系统为蓝本。实际上,不同的实时操作系统,其应用方法及原理大同小异,掌握其共性是学习的关键,这样才能达到举一反三的效果。</p><p>本书推荐的Mbed OS是ARM公司于2014年开始推出并逐步完善的一款免费的 开源嵌入式实时操作系统,Mbed OS专为基于ARM Cortex-M内核的MCU设计, 主要面向物联网终端。该书以ARM Mbed OS实时操作系统为背景,阐述实时操作系统的线程、调度、延时函数、事件、消息队列、线程信号、信号量、互斥量等基本要素,给出实时操作系统下的程序设计方法。</p><p>本书分为基础应用篇(第1~7章)、原理剖析篇(第8~12章)及综合实践篇(第13、14章)三大部分,如果读者只做实时操作系统下的应用开发,可只阅读基础应用篇与综合实践篇;如果希望理解实时操作系统原理,那么建议通读全书。</p><p>本书适合软件开发工程师,可作为实时操作系统的技术培训书籍,书籍配套有实践的开发板。</p><h2>书籍目录</h2><p><strong>第1篇 基础应用篇</strong></p><ul><li><p>第1章 实时操作系统的基本概念与线程基础知识 3</p><ul><li><p>1.1 实时操作系统的基本含义 3</p><ul><li>1.1.1 嵌入式系统的基本分类 3</li><li>1.1.2 无操作系统与实时操作系统 4</li><li>1.1.3 实时操作系统与非实时操作系统 5</li></ul></li><li><p>1.2 实时操作系统中的基本概念 6</p><ul><li>1.2.1 线程与调度的基本含义 6</li><li>1.2.2 内核的基本概念 7</li><li>1.2.3 线程的基本概念 9</li></ul></li><li><p>1.3 线程的三要素、四种状态及三种基本形式 10</p><ul><li>1.3.1 线程的三要素 10</li><li>1.3.2 线程的四种状态 11</li><li>1.3.3 线程的三种基本形式 13</li></ul></li><li>1.4 本章小结 14</li></ul></li><li><p>第2章 相关基础知识 17</p><ul><li><p>2.1 CPU内部寄存器的分类及ARM Cortex-M处理器的主要寄存器 17</p><ul><li>2.1.1 CPU内部寄存器的分类 17</li><li>2.1.2 ARM Cortex-M处理器的主要寄存器 18</li></ul></li><li><p>2.2 C语言中的构造类型及编译相关问题 21</p><ul><li>2.2.1 C语言中的构造类型 21</li><li>2.2.2 编译相关问题 25</li></ul></li><li><p>2.3 实时操作系统内核使用的数据结构 26</p><ul><li>2.3.1 栈与堆 26</li><li>2.3.2 队列 28</li><li>2.3.3 链表 29</li></ul></li><li><p>2.4 汇编语言概述 36</p><ul><li>2.4.1 汇编语言格式 36</li><li>2.4.2 常用伪指令简介 38</li></ul></li><li>2.5 本章小结 40</li></ul></li><li><p>第3章 Mbed OS第一个样例工程 41</p><ul><li>3.1 Mbed OS简介 41</li><li><p>3.2 软件和硬件开发平台 42</p><ul><li>3.2.1 GEC架构简介 42</li><li>3.2.2 硬件平台 43</li><li>3.2.3 软件平台 44</li><li>3.2.4 网上电子资源 45</li></ul></li><li><p>3.3 第一个样例工程 46</p><ul><li>3.3.1 样例程序功能 46</li><li>3.3.2 工程框架设计原则 46</li><li>3.3.3 无操作系统的工程框架 47</li><li>3.3.4 Mbed OS的工程框架 51</li></ul></li><li>3.4 本章小结 56</li></ul></li><li><p>第4章 实时操作系统下应用程序的基本要素 57</p><ul><li><p>4.1 中断的基本概念及处理过程 57</p><ul><li>4.1.1 中断的基本概念 57</li><li>4.1.2 中断处理的基本过程 58</li></ul></li><li><p>4.2 时间嘀嗒与延时函数 60</p><ul><li>4.2.1 时间嘀嗒 60</li><li>4.2.2 延时函数 60</li></ul></li><li><p>4.3 调度策略 61</p><ul><li>4.3.1 调度基础知识 61</li><li>4.3.2 Mbed OS中使用的调度策略 62</li><li>4.3.3 Mbed OS中的固有线程 63</li></ul></li><li><p>4.4 实时操作系统中的功能列表 64</p><ul><li>4.4.1 就绪列表 64</li><li>4.4.2 延时列表 64</li><li>4.4.3 等待列表 64</li><li>4.4.4 条件阻塞列表 64</li></ul></li><li>4.5 本章小结 65</li></ul></li><li><p>第5章 同步与通信的应用方法 67</p><ul><li><p>5.1 实时操作系统中同步与通信的基本概念 67</p><ul><li>5.1.1 同步的含义与通信手段 67</li><li>5.1.2 同步类型 68</li></ul></li><li><p>5.2 事件 69</p><ul><li>5.2.1 事件的含义及应用场合 69</li><li>5.2.2 事件的常用函数 69</li><li>5.2.3 事件的编程举例:通过事件实现中断与线程的通信 71</li><li>5.2.4 事件的编程举例:通过事件实现线程之间的通信 74</li></ul></li><li><p>5.3 消息队列 76</p><ul><li>5.3.1 消息队列的含义及应用场合 76</li><li>5.3.2 消息队列的常用函数 76</li><li>5.3.3 消息队列的编程举例 78</li></ul></li><li><p>5.4 线程信号 82</p><ul><li>5.4.1 线程信号的含义及应用场合 82</li><li>5.4.2 线程信号的常用函数 83</li><li>5.4.3 线程信号的编程举例 84</li></ul></li><li><p>5.5 信号量 87</p><ul><li>5.5.1 信号量的含义及应用场合 87</li><li>5.5.2 信号量的常用函数 88</li><li>5.5.3 信号量的编程举例 89</li></ul></li><li><p>5.6 互斥量 92</p><ul><li>5.6.1 互斥量的含义及应用场合 92</li><li>5.6.2 互斥量的常用函数 94</li><li>5.6.3 互斥量的编程举例 95</li></ul></li><li>5.7 本章小结 98</li></ul></li><li><p>第6章 底层硬件驱动构件 99</p><ul><li><p>6.1 嵌入式构件概述 99</p><ul><li>6.1.1 制作构件的必要性 99</li><li>6.1.2 构件的基本概念 99</li><li>6.1.3 嵌入式开发中构件的分类 100</li><li>6.1.4 构件的基本特征与表达形式 101</li></ul></li><li><p>6.2 底层硬件驱动构件设计原则与方法 102</p><ul><li>6.2.1 底层硬件驱动构件设计的基本原则 102</li><li>6.2.2 底层硬件驱动构件设计要点分析 103</li><li>6.2.3 底层硬件驱动构件封装规范概要 104</li><li>6.2.4 封装的前期准备 105</li></ul></li><li><p>6.3 底层硬件驱动构件设计举例 106</p><ul><li>6.3.1 GPIO构件 106</li><li>6.3.2 UART构件 114</li><li>6.3.3 Flash构件 119</li><li>6.3.4 ADC构件 123</li><li>6.3.5 PWM构件 127</li></ul></li><li><p>6.4 应用构件及软件构件设计实例 131</p><ul><li>6.4.1 应用构件设计实例 131</li><li>6.4.2 软件构件设计实例 133</li></ul></li><li>6.5 本章小结 142</li></ul></li><li><p>第7章 实时操作系统下的程序设计方法 143</p><ul><li><p>7.1 程序稳定性问题 143</p><ul><li>7.1.1 稳定性的基本要求 143</li><li>7.1.2 看门狗复位与定期复位的应用 144</li><li>7.1.3 临界区的处理 147</li></ul></li><li><p>7.2 中断服务程序设计、线程划分及优先级安排问题 148</p><ul><li>7.2.1 中断服务程序设计的基本问题 148</li><li>7.2.2 线程划分的简明方法 149</li><li>7.2.3 线程优先级安排问题 149</li></ul></li><li><p>7.3 利用信号量解决并发与资源共享的问题 150</p><ul><li>7.3.1 并发与资源共享的问题 150</li><li>7.3.2 应用实例 151</li></ul></li><li><p>7.4 优先级反转问题 155</p><ul><li>7.4.1 优先级反转问题的出现 155</li><li>7.4.2 Mbed OS中避免优先级反转问题的方法 157</li></ul></li><li>7.5 本章小结 162<br> <strong>第2篇 原理剖析篇</strong></li></ul></li><li><p>第8章 理解Mbed OS的启动过程 165</p><ul><li><p>8.1 芯片启动到main函数之前的运行过程 165</p><ul><li>8.1.1 寻找第一条被执行指令的存放处 165</li><li>8.1.2 通过启动文件理解芯片启动过程 167</li></ul></li><li><p>8.2 Mbed OS启动流程概要 169</p><ul><li>8.2.1 相关宏定义及结构体 169</li><li>8.2.2 栈和堆的配置 176</li><li>8.2.3 启动过程概述 179</li><li>8.2.4 如何运行到主线程 181</li><li>8.2.5 启动过程总流程源代码 182</li></ul></li><li><p>8.3 深入理解启动过程(一):内核初始化解析 183</p><ul><li>8.3.1 内核初始化准备工作 183</li><li>8.3.2 进入SVC中断服务程序SVC_Handler 186</li><li>8.3.3 实际内核初始化函数 187</li><li>8.3.4 返回流程 199</li></ul></li><li><p>8.4 深入理解启动过程(二):创建主线程、启动内核 200</p><ul><li>8.4.1 创建主线程 201</li><li>8.4.2 启动内核 215</li><li>8.4.3 定时器线程函数 226</li><li>8.4.4 消息获取与处理函数 228</li><li>8.4.5 线程延时等待函数 238</li></ul></li><li><p>8.5 中断服务程序SVC_Handler详解 240</p><ul><li>8.5.1 SVC_Handler功能概要 241</li><li>8.5.2 SVC_Handler完整流程 241</li><li>8.5.3 SVC_Handler功能分段解析 243</li><li>8.5.4 SVC_Handler完整代码注释 246</li><li>8.6 函数调用关系总结及存储空间分析 249</li><li>8.6.1 启动过程中函数的调用关系总结 250</li><li>8.6.2 启动过程存储空间分析 253</li></ul></li><li>8.7 本章小结 257</li></ul></li><li><p>第9章 理解时间嘀嗒 259</p><ul><li><p>9.1 时间嘀嗒的建立与使用 259</p><ul><li>9.1.1 SysTick定时器的寄存器 259</li><li>9.1.2 SysTick定时器的初始化 260</li><li>9.1.3 SysTick中断服务程序 263</li></ul></li><li><p>9.2 延时函数 266</p><ul><li>9.2.1 线程延时等待函数 266</li><li>9.2.2 线程延时嘀嗒函数 267</li><li>9.2.3 其他时间嘀嗒函数 269</li></ul></li><li><p>9.3 延时等待列表工作机制 271</p><ul><li>9.3.1 线程插入延时等待列表函数 271</li><li>9.3.2 从延时等待列表中移除线程的函数 274</li><li>9.3.3 延时函数调度过程实例剖析 275</li></ul></li><li><p>9.4 与时间相关的函数 279</p><ul><li>9.4.1 获取系统运行时间函数 280</li><li>9.4.2 日期转时间戳函数 281</li><li>9.4.3 时间戳转日期函数 283</li></ul></li><li>9.5 本章小结 286</li></ul></li><li><p>第10章 理解调度机制 287</p><ul><li><p>10.1 ARM Cortex-M4的SVC和PendSV中断的调度作用 287</p><ul><li>10.1.1 SVC中断的调度作用 287</li><li>10.1.2 PendSV中断的调度作用 288</li><li>10.1.3 列表分析 288</li></ul></li><li><p>10.2 中断服务程序PendSV_Handler剖析 289</p><ul><li>10.2.1 osRtxPendSV _Handler的功能概要 289</li><li>10.2.2 osRtxPendSV_Handler函数源代码解析 290</li><li>10.2.3 跳转到SVC_Context进行上下文切换 291</li><li>10.2.4 PendSV_Handler函数完整代码注释 291</li></ul></li><li><p>10.3 PendSV应用举例 292</p><ul><li>10.3.1 PendSV在事件中的应用 292</li><li>10.3.2 PendSV在线程信号中的应用 296</li></ul></li><li>10.4 本章小结 300</li></ul></li><li><p>第11章 理解事件与消息队列 301</p><ul><li><p>11.1 事件 301</p><ul><li>11.1.1 事件的相关结构体 301</li><li>11.1.2 事件函数深入剖析 302</li><li>11.1.3 事件调度剖析 307</li></ul></li><li><p>11.2 消息队列 311</p><ul><li>11.2.1 消息或消息队列结构体 311</li><li>11.2.2 消息队列函数深入剖析 313</li><li>11.2.3 消息队列调度剖析 318</li></ul></li><li>11.3 本章小结 322</li></ul></li><li><p>第12章 理解线程信号、信号量与互斥量 323</p><ul><li><p>12.1 线程信号 323</p><ul><li>12.1.1 线程操作函数 323</li><li>12.1.2 线程信号函数深入剖析 329</li><li>12.1.3 线程信号调度剖析 333</li></ul></li><li><p>12.2 信号量 337</p><ul><li>12.2.1 信号量控制块结构体 337</li><li>12.2.2 信号量函数深入剖析 337</li><li>12.2.3 信号量调度剖析 341</li></ul></li><li><p>12.3 互斥量 345</p><ul><li>12.3.1 互斥量结构体 345</li><li>12.3.2 互斥量函数深入剖析 346</li><li>12.3.3 互斥量调度剖析 352</li><li>12.3.4 互斥量避免优先级反转问题调度剖析 356</li></ul></li><li>12.4 本章小结 359<br><strong>第3篇 综合实践篇</strong></li></ul></li><li><p>第13章 基于Mbed OS的AHL-EORS应用 363</p><ul><li><p>13.1 AHL-EORS简介 363</p><ul><li>13.1.1 硬件清单 363</li><li>13.1.2 硬件测试导引 364</li></ul></li><li><p>13.2 卷积神经网络概述 364</p><ul><li>13.2.1 卷积神经网络的技术特点 364</li><li>13.2.2 卷积神经网络原理 365</li></ul></li><li><p>13.3 AHL-EORS选用模型分析 368</p><ul><li>13.3.1 MobileNetV2模型 369</li><li>13.3.2 NCP模型 370</li></ul></li><li><p>13.4 AHL-EORS的数据采集与训练过程 373</p><ul><li>13.4.1 数据采集程序 373</li><li>13.4.2 模型训练与部署 376</li></ul></li><li>13.5 在通用嵌入式计算机GEC上进行的推理过程 377</li><li>13.6 本章小结 380</li></ul></li><li><p>第14章 基于Mbed OS的NB-IoT应用开发 381</p><ul><li><p>14.1 窄带物联网应用开发概述 381</p><ul><li>14.1.1 窄带物联网简介 381</li><li>14.1.2 NB-IoT应用开发所面临的难题及解决思路 382</li><li>14.1.3 直观体验NB-IoT数据传输 383</li><li>14.1.4 金葫芦NB-IoT开发套件简介 384</li></ul></li><li><p>14.2 NB-IoT应用架构及通信基本过程 386</p><ul><li>14.2.1 建立NB-IoT应用架构的基本原则 386</li><li>14.2.2 终端UE、信息邮局MPO与人机交互系统HCI的基本定义 386</li><li>14.2.3 基于信息邮局粗略了解基本通信过程 387</li></ul></li><li><p>14.3 终端UE与云侦听程序的通信过程 388</p><ul><li>14.3.1 基于mbed的终端UE模板工程设计 389</li><li>14.3.2 云侦听模板工程功能简介 391</li><li>14.3.3 建立云侦听程序的运行场景 392</li><li>14.3.4 运行云侦听与终端UE模板工程 394</li><li>14.3.5 通信过程中的常见错误说明 396</li></ul></li><li><p>14.4 通过Web网页的数据访问 397</p><ul><li>14.4.1 运行Web模板观察自己终端UE的数据 397</li><li>14.4.2 NB-IoT的Web网页模板工程结构 398</li></ul></li><li><p>14.5 通过微信小程序的数据访问 399</p><ul><li>14.5.1 运行小程序模板观察自己终端UE的数据 399</li><li>14.5.2 NB-IoT的微信小程序模板工程结构 401</li></ul></li></ul></li><li>参考文献 403</li></ul><h2>作者简介</h2><p>王宜怀,博士,教授、博士生导师、网络工程系主任;苏州大学嵌入式系统与物联网研究所所长;苏州市政协常委、中国农工民主党苏州市委常委;江苏省计算机学会嵌入式系统与物联网专业委员会主任、中国软件行业协会嵌入式系统分会理事。主要研究方向:嵌入式系统、物联网与智能控制技术。</p><h2>书籍购买</h2><p>书籍购买:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13237887.html" target="blank">https://item.jd.com/13237887.html</a><br>试读链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fcread.jd.com%2Fread%2FstartRead.action%3FbookId%3D30817514%26readType%3D1" target="blank">https://cread.jd.com/read/startRead.action?bookId=30817514&amp;readType=1</a></p><p>配套电子资源获取(包含文档和源代码):点击<a href="https://aijishu.com/link?target=http%3A%2F%2Fsumcu.suda.edu.cn%2FmbedOS%2Flist.htm" target="blank">苏州大学嵌入式学习社区官网</a>,在【<strong>著作</strong>】-【<strong>mebdOS</strong>】下栏目下获得电子资源。</p><blockquote>更多书籍推荐请关注<a href="https://aijishu.com/blog/armjiaoyushengta"><strong>极术读书专栏</strong></a>,用知识武装头脑,增强个人竞争力。</blockquote>
                                                    ]]></description>
            <pubDate>Tue, 20 Sep 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000355068</guid>
            <link>https://aijishu.com/a/1060000000355068</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】极客时间月卡赠卡第一期获奖名单]]></title>
            <description><![CDATA[<p>上周<a href="https://aijishu.com/books">极术读书栏目</a>组织了极客时间月卡赠卡第一期活动,收到了很多社区用户的支持。下方为社区中奖用户名单,非常感谢大家的支持。欢迎大家继续关注<a href="https://aijishu.com/books">极术读书栏目</a>,我们会推荐更多嵌入式,AI,芯片设计,安全等领域的好书以及组织webinar和赠书活动。</p><p>中奖名单如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbDzn" alt="a5d1f6022a5601cc6cc20a95a6630b2.png" title="a5d1f6022a5601cc6cc20a95a6630b2.png"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbDzo" alt="bfb41fd344bc64dd5fd8c4922c2cd6e.jpg" title="bfb41fd344bc64dd5fd8c4922c2cd6e.jpg"></p><blockquote><p>恭喜以上用户,我们将尽快将月卡兑换码发到您的申请邮箱。没有获奖的小伙伴也不要灰心,请关注我们更多活动。</p><p>暂时没有获奖的的小伙伴也不要着急,接下来极术读书及安谋科技学堂会多多组织类似的活动,努力为大家谋福利!</p></blockquote><p><strong>活动原文</strong>:<a href="https://aijishu.com/e/1120000000346486">【极术读书】赠卡活动第一期,200张极客时间月卡免费领,从零开始学芯片</a></p><p><strong>学习推荐</strong>:关注<strong>安谋科技学堂</strong>公众号<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbiNv" alt="安谋科技学堂.png" title="安谋科技学堂.png"></p><blockquote>本活动最终解释权归极术社区所有。</blockquote>
                                                    ]]></description>
            <pubDate>Sun, 04 Sep 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000351369</guid>
            <link>https://aijishu.com/a/1060000000351369</link>
        </item>
        <item>
            <title><![CDATA[免费学习国家精品课程:《嵌入式系统及应用》在线课程,第12次开课!]]></title>
            <description><![CDATA[<p>和安谋科技教育计划有非常深入合作的苏州大学王宜怀教授,正在授课的基于Arm® Cortex®-M处理器的<strong>《嵌入式系统及应用》在线开放课程</strong>一直是我们极力推荐的。目前该课程已经被评为<strong>国家精品课程</strong>。</p><p>嵌入式系统是嵌入式人工智能与物联网的重要基础,该课程以Arm Cortex-M微处理器为蓝本,以软硬件构件为主线,基于嵌入式软件工程基本原理,按照"通用知识—驱动构件使用方法—测试实例—芯片编程结构—构件设计方法”的线条,逐步阐述嵌入式系统基本知识要素及较为规范的底层软硬件相结合的设计方法。</p><p><strong>目前是本课程的第12次开课,开课时间是2022年09月05日 ~ 2023年01月06日。</strong>如果你想掌握构成计算机的基本部件原理,掌握计算机高级程序设计方法,为从寄存器级理解软件干预硬件提供基础,那就赶快查看下方信息,报名学习吧!现在加入还来得及喔~</p><h2>《嵌入式系统及应用》在线开放课程</h2><p><a href="https://v.qq.com/x/page/j3325qf1xro.html">https://v.qq.com/x/page/j3325qf1xro.html</a></p><p>本视频由授课教师提供</p><h4><strong>01 基本介绍</strong></h4><ul><li><strong>课程名称:</strong>《嵌入式系统及应用》</li><li><strong>授课单位:</strong>苏州大学</li><li><strong>授课教师:</strong>王宜怀、张建、刘长勇</li><li><strong>在线学习网址:</strong>  <a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.icourse163.org%2Fcourse%2FSUDA-1001754273" target="blank">[爱课程-中国大学MOOC]</a></li></ul><h4><strong>02 课程概述</strong></h4><p>《嵌入式系统及应用》课程作为嵌入式人工智能与物联网相关专业的基础课程,以Arm Cortex-M微处理器为蓝本,采用构件化开发,针对每个知识点,提供样本程序(葫芦),学生通过模仿该程序稍加修改后可完成符合自我要求的程序(照葫芦画瓢)。课程按照<strong>“通用知识—驱动构件使用方法—测试实例—芯片编程结构—构件设计方法”</strong>的线条,逐步阐述嵌入式系统基本知识要素及较为规范的底层软硬件相结合的设计方法。</p><h4><strong>03 课程用书</strong></h4><p>本课程教学用书《嵌入式技术基础与实践(第6版)—基于STM32L431微控制器》,该教材历经十多年凝练,仔细梳理了嵌入式系统的通用基础知识要素,注重把握通用知识与芯片相关知识之间的平衡、把握硬件与软件的关系、对底层驱动进行构件化封装、设计合理的测试用例,教材内含简明实验套件,结合网上电子资源,方便读者进行实践与应用。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbqNk" alt="51546da303679fd168b5fe7d75d10e65.jpg" title="51546da303679fd168b5fe7d75d10e65.jpg"></p><p><strong>《嵌入式技术基础与实践(第6版)》(王宜怀主编)</strong></p><blockquote>【书内含通用嵌入式计算机GEC,型号:AHL-STM32L431,可完成书中基本实验】</blockquote><p><strong>电子资源下载地址及路径:</strong></p><p>“<a href="https://aijishu.com/link?target=https%3A%2F%2Fsumcu.suda.edu.cn%2F" target="blank">https://sumcu.suda.edu.cn/</a>”→“金葫芦专区”→“嵌入式书6版”,右边为下载索引</p><p><strong>点击<a href="https://aijishu.com/link?target=https%3A%2F%2Ftuicashier.youzan.com%2Fpay%2Fwscgoods_order%3Fbanner_id%3Dseach.16152946%7Esearch%7E7%7E7LEMSxlm%26words%3D%E5%B5%8C%E5%85%A5%E5%BC%8F%26alg%3D0%26slg%3Dconsumer-search%2CstandardModify%2C30be7fd3-df55-4535-c709-11c1b3a78e09%2C711.545_c9498a9569324a1ab4d18b403e0cc497%26reft%3D1630934839602%26spm%3Dseach.16152946%26is_share%3D1%26shopAutoEnter%3D1%26sl%3D3NTPzP%26from_params%3Dsl%7E3NTPzP%21online_kdt_id%7E16152946%26sub_kdt_id%3D16152946%26st%3D3%26alias%3D3f579wrkbwq9es4%26is_silence_auth%3D1" target="blank">链接</a>即可购买教材:</strong></p><h4><strong>04 课程大纲</strong></h4><p><strong>01 概述</strong></p><p>1.1 初识嵌入式系统<br>1.2 嵌入式系统的定义、发展简史、分类及特点<br>1.3 嵌入式系统的学习困惑、知识体系及学习建议<br>1.4 微控制器与应用处理器简介<br>1.5 嵌入式系统常用术语</p><p><strong>02 Arm Cortex-M4微处理器</strong></p><p>2.1 Arm Cortex-M4微处理器简介<br>2.2 寻址方式与机器码的获取方法<br>2.3 基本指令分类解析<br>2.4 汇编语言的基本语法</p><p><strong>03 存储器映像、中断源与硬件最小系统</strong></p><p>3.1 STM32L系列MCU概述<br>3.2 STM32L4的引脚图与硬件最小系统<br>3.3 由MCU构建通用嵌入式计算机</p><p><strong>04 GPIO及程序框架</strong></p><p>4.1 GPIO通用基础知识<br>4.2 软件干预硬件的方法<br>4.3 认识工程框架<br>4.4 GPIO构件的制作过程<br>4.5 第一个汇编语言工程:控制小灯闪烁<br>4.6 实验一 熟悉实验开发环境及GPIO编程</p><p><strong>05 嵌入式硬件构件与底层驱动构件基本规范</strong></p><p>5.1 嵌入式硬件构件<br>5.2 嵌入式底层驱动构件的概念与层次模型<br>5.3 底层驱动构件的封装规范<br>5.4 硬件构件及其驱动构件的复用与移植方法</p><p><strong>06 串行通信模块及第一个中断程序结构</strong></p><p>6.1 异步串行通信的通用基础知识<br>6.2 基于构件的串行通信编程方法<br>6.3 UART构件的制作过程<br>6.4 中断机制及中断编程步骤<br>6.5 实验二 串口通信及中断实验</p><p><strong>07 定时器相关模块</strong></p><p>7.1 定时器通用基础知识<br>7.2 STM32L431中的定时器<br>7.3 脉宽调制<br>7.4 输入捕捉与输出比较<br>7.5 实验三 定时器及PWM实验</p><p><strong>08 Flash在线编程、ADC与DAC  </strong></p><p>8.1 Flash在线编程  <br>8.2 ADC<br>8.3 DAC<br>8.4 实验四 ADC实验</p><p><strong>09&nbsp;SPI、I2C与TSC模块  </strong></p><p>9.1 串行外设接口SPI模块  <br>9.2 集成电路互联总线I2C模块<br>9.3 触摸感应控制器TSC模块<br>9.4 实验五 SPI通信实验</p><p><strong>10 CAN总线、DMA与位带操作</strong>  </p><p>10.1 CAN总线<br>10.2 DMA<br>10.3 位带操作</p><p><strong>11 系统时钟与其他功能模块</strong>  </p><p>11.1 时钟系统<br>11.2 复位模块与看门狗模块<br>11.3 电源控制模块与CRC校验模块<br>11.4 实验六 综合实验</p><p><strong>12 应用案例  </strong></p><p>12.1 嵌入式系统稳定性问题<br>12.2 外接传感器及执行部件的编程方法<br>12.3 实时操作系统的简明实例<br>12.4 嵌入式人工智能的简明实例<br>12.5 NB-IoT的应用简介<br>12.6 4G、Cat1、Wi-Fi及WSN的应用</p><h4><strong>05 预备知识</strong></h4><p>必须具备以下知识:</p><ul><li>计算机硬件基础(或模拟电路与数字电路、计算机组成、汇编语言、微机原理)</li><li>高级程序语言设计等(如C语言)</li></ul><p>学生通过学习上述课程,基本掌握构成计算机的基本部件原理,掌握计算机高级程序设计方法,为从寄存器级理解软件干预硬件提供基础。</p>
                                                    ]]></description>
            <pubDate>Wed, 31 Aug 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000350157</guid>
            <link>https://aijishu.com/a/1060000000350157</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】《软硬件融合--超大规模云计算架构创新之路》赠书名单公布]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/blog/armjiaoyushengta">极术读书</a>专栏。</blockquote><p>2022年7月27日至8月1日,极术社区联合安谋科技学堂赠送50本《<a href="https://aijishu.com/e/1120000000340363"><strong>软硬件融合-超大规模云计算创新之路</strong></a>》,非常感谢大家的积极参与,赠书名单如下,恭喜下方的小伙伴,下面每人将收到极术读书赠送的一本《软硬件融合--超大规模云计算架构创新之路》。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbBDd" alt="1659338014008.jpg" title="1659338014008.jpg"></p><blockquote><p>祝贺以上获奖的小伙伴!</p><p>极术读书工作人员将给中奖用户发送邮件通知并尽快安排寄出。</p><p>暂时没有获奖的的小伙伴也不要着急,接下来极术读书及安谋科技学堂会多多组织类似的活动,努力为大家谋福利!</p></blockquote><p><strong>活动原文</strong>:<a href="https://aijishu.com/e/1120000000340363">【极术读书赠书活动】50本《软硬件融合》免费领,学习从DPU到异构计算的超大规模计算创新之路</a></p><p><strong>资源推荐</strong>:关注<strong>安谋科技学堂</strong>公众号,回复 “<strong>软硬件融合</strong>” 获取软硬件融合相关资源!<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbiNv" alt="安谋科技学堂.png" title="安谋科技学堂.png"></p><p><strong>如何购买?</strong><br>京东旗舰店:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F12836605.html" target="blank">https://item.jd.com/12836605.html</a></p><blockquote>本活动最终解释权归极术社区所有。</blockquote>
                                                    ]]></description>
            <pubDate>Sun, 31 Jul 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000343915</guid>
            <link>https://aijishu.com/a/1060000000343915</link>
        </item>
    </channel>
</rss>

...

@github-actions
Copy link
Contributor

http://localhost:1200/aijishu/channel - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[极术社区 - 连接开发者与智能计算生态]]></title>
        <link>https://aijishu.com//api/channel/newest?page=1</link>
        <atom:link href="http://localhost:1200/aijishu/channel" rel="self" type="application/rss+xml" />
        <description><![CDATA[极术社区 - 连接开发者与智能计算生态 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 15:26:56 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[抢先入局AIGC,新华三底层能力何在?]]></title>
            <description><![CDATA[<p>2022年11月,智能对话机器人模型ChatGPT上线,其连续对话能力、强大的理解力、回答的准确度和创造性使其迅速走红。数据显示,ChatGPT发布短短两个月时间,全球用户数便突破1亿。  </p><p>可以说,这项火遍全球的突破性人工智能对话技术,为整个科技行业带来了全新的想象力。而在国内,由百度打造的首个“类ChatGPT”——百度文心一言(ERNIE Bot)也即将在今年3月呈现,这是先进的人工智能对话技术在国内数字化领域中的首次大规模落地尝试,其价值无疑深远而重大。  </p><p><img referrerpolicy="no-referrer" src="https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/6ded7ccf62ea480d89d72aa5f4f8be39~tplv-tt-shrink:640:0.image?traceid=20230227174332DA60910EFE6C344C7866&amp;x-expires=2147483647&amp;x-signature=PzGM3fUwuBa9BuJ%2F70g%2Fv1HfU3k%3D" alt="" title="">  </p><p>值得一提的是,紫光股份旗下新华三集团日前也宣布正式成为百度文心一言的首批生态合作伙伴。接下来,双方将会把领先的智能对话技术成果应用在数字化领域,深度赋能百行百业的数字化转型和智能化升级。  </p><p>回头来看,新华三之所以能够成为百度文心一言的首批生态合作伙伴,无疑是其长期在ICT基础设施领域深厚技术沉淀和释放的一种体现,而这背后也让整个产业看到了新的可能——那就是站在企业数字化转型和智能化升级的重要关口,新华三以其智算基础架构构筑的超大模型底座,无疑可以为百行百业创造出更多具有想象空间的新业态、新服务和新模式,让智能化的大潮 “普惠”每一家企业和每一个个人,释放智能化生产力的“乘数效应”。  </p><p><strong>新华三牵手百度文心一言背后</strong>  </p><p>目前,以ChatGPT为代表的AIGC内容生成方式通过学习人类的思考方式,查阅、挖掘大量素材,以低边际成本、少人力限制等高效率的方式生成大量满足人们差异化需求的内容。  </p><p><img referrerpolicy="no-referrer" src="https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/2f718b62e00544a7981e09717999fe9c~tplv-tt-shrink:640:0.image?traceid=20230227174332DA60910EFE6C344C7866&amp;x-expires=2147483647&amp;x-signature=efX7OTdHEhxAdShYjUSRZJikEnU%3D" alt="" title="">  </p><p>文心一言,正是百度基于文心大模型技术推出的生成式AI产品。作为国内少有的拥有大模型技术的企业,百度在人工智能领域深耕十余年,拥有产业级知识增强文心大模型ERNIE,具备跨模态、跨语言的深度语义理解与生成能力,而这种能力,也在搜索问答、云计算、内容创作生成、智能办公等众多领域具有较大的“用武之地”。  </p><p>而本次新华三之所以率先成为百度文心一言的首批生态合作伙伴,其实也在“情理之中”。据了解,新华三与百度的合作有着长久的历史积淀,双方在ICT基础设施优化升级、百度智能云建设、信息检索、自动驾驶、生态建设等众多领域均有研发级别的合作,目前相关成果已广泛落地,对双方的产品技术发展产生了积极而深远的影响。  </p><p>而展望未来,新华三也将继续携手百度,为智能交通、自动驾驶、智慧城市、智慧医疗、智慧教育、智慧金融、多域互联等领域推出更多场景化解决方案,开拓内容生态和智能服务领域的全新可能性,全面引领数字化时代的产业变革与升级。  </p><p><strong>以智算架构构筑超大模型底座</strong>  </p><p>接下来要追问的是,为什么是新华三能够率先成为百度文心一言的首批生态合作伙伴呢?其实,要回答这一问题,就不得不提到类似ChatGPT和百度文心一言这样的AI基础模型(基于大规模数据集和大规模算力训练的大型预训练模型),要训练出这样的超大基础模型,往往是需要多方面的关键技术作为支撑的——除了大模型算法、分布式训练系统、高质量数据集的相关工具等,对计算、网络、存储等基础设施做出了巨大挑战。  </p><p>例如,训练大模型首先就需要大规模算力资源做支撑;同时大型训练对显存以及数据集缓存要求同样很高,训练过程中还会面临显存墙问题(模型是否能跑起来)以及计算/通信墙问题(能否在合理时间内完成训练);此外,大模型的训练同样对网络也提出了更高的要求,即需高性能网络满足节点间参数同步,且GPU服务器节点间需要高速网络来实现模型训练参数交换和存取等等。  </p><p>正是由于大模型的训练对存储、计算、网络等各个层面都提出了比较严苛的要求,长期深耕ICT领域的新华三,也基于自身在存储、计算、网络等领域深厚的技术积淀,打造出了一套全新的智算基础架构,该架构分为两大区域,即智算训练区和智算推理区,由此能够为大模型的训练提供强大的技术底座能力,具体来看:  </p><p><img referrerpolicy="no-referrer" src="https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/5bd8f2b9a2d94617be87edd9202d9527~tplv-tt-shrink:640:0.image?traceid=20230227174332DA60910EFE6C344C7866&amp;x-expires=2147483647&amp;x-signature=okFNlp6zeraUxFTj8uGC3VkVV30%3D" alt="" title="">  </p><p><strong>一是,在训练集群方面,</strong>目前大模型的训练使用的服务器通常都是搭载NVIDIA NVLink GPU模块作为标准机,而新华三能够提供H3C UniServer R5500 G5这样机型,其搭载了NVIDIA HGX A800 8-GPU 80G模块,能够支持英特尔Whitley平台和AMD Milan平台,最大支持2颗Icelake(40C、270W)或2颗Milan(64C、280W)的CPU,存储方面能够最大支持12个U.2 NVMe SSD,其中8个支持GDS(GDS, GPU Direct Storage),可以最大化地满足训练集群的算力需求。  </p><p>不仅如此,在2023年初,新华三还发布了搭载NVIDIA H800 NVLink模块的新一代机型R5500 G6,支持英特尔EGS和AMD Genoa平台,PCIe 5.0及400GE网络的加持,也能够给大模型的训练带来更高的算力提升。  </p><p>另外,一些大型互联网公司还会使用自研GPU Box搭配计算节点的方式组建训练集群,GPU Box里面会搭载NVIDIA NVLink GPU模块或其他厂商的OAM模组,而OAM是开源的GPU模块,由OCP社区服务器项目组下的OAI小组开发并制定标准。在这方面,新华三也是OAI2.0规范制定的重要参与者,后续在R5500 G6上,新华三也可支持不同厂家GPU的OAM模组。  </p><p><strong>二是,在推理集群方面,</strong>GPU推理集群的规模主要取决于业务预期的QPS并发需求,一般会多机多卡多实例部署。同样,新华三也提供了相关的产品以满足实际的业务需求,以H3C UniServer R5300 G5为例,其最大支持2颗英特尔Icelake(40C、270W)CPU,并可搭配多厂家多种类型的GPU产品,包括GPU、XPU、NPU等。  </p><p>而在大规模推理场景下,新华三 UniServer R5300 G5也支持多种类型的GPU方案,包括4 PCIe GPU方案、8 PCIe GPU方案和16 PCIe GPU方案,以应对不同客户不同算力的推理集群搭建需求。此外,在去年11月份,新华三还发布了基于AMD Genoa平台的GPU服务器R5350 G6,可实现90%的CPU性能提升和50%的内核数量提升,应该说多种类型人工智能加速卡的支持,可以帮助客户应对人工智能不同场景下对异构算力的需求。  </p><p><strong>三是,高性能存储和网络也是大模型训练的重要组成部分。</strong>其中,高性能存储一般采用分布式并行文件存储,而新华三CX系列存储,就采用了全对称分布式架构,可结合IBM Spectrum Scale,为客户提供高带宽、低延时的存储服务。  </p><p>以新华三CX5036为例,配置2颗5218 CPU、4块1T NVMe和32块6T SATA HDD,4节点集群部署,测试大文件小IO(4KB)平均单节点IOPS可达2.55W(随机读)、2.36W(随机写),多客户端并发(16MB)平均单节点带宽可达3.57GB/s(顺序读)、2.08GB/s(顺序写),单客户端单流16MB IO聚合带宽可达5.45GB/s、1MB IO聚合带宽3.7GB/s。  </p><p>高性能网络方面,通常有两种网络搭建方式:第一种是RoCE网络,作为互联网400G领域的市场领头羊,基于新华三提供的S9825/S9855交换机配合AI ECN方案,也可以迅速搭建大模型训练所需的高性能网络。与此同时,随着大模型训练所需网络带宽的不断提升,网络主芯片性能也会迅速增加,当800G/1.6T时代来临时,CPO/NPO交换机将会登上互联网舞台,在这方面新华三也提前做了布局,其S9825-32D32DO交换机,同时支持32个400G光模块接口和32个400G光引擎接口,后续可以平滑升级至51.2T平台;第二种方式是DDC方案,DDC网络架构(分布式分解结构)可以很轻易解决负载均衡和阻塞问题,同时也能实现更优的网络性能和更快的网络收敛。在这方面,新华三的DDC方案也在进行相关验证中。  </p><p>由此可见,从新华三智算基础架构的技术细节中,可以看到新华三以智算基础架构为超大模型训练构筑了坚实的底座,不仅能够为包括AIGC为代表的超大模型提供关键技术支撑,同时也是新华三率先成为百度文心一言的首批生态合作伙伴的关键所在。  </p><p><strong>释放智能化生产力“乘数效应”</strong>  </p><p>客观地说,智能化已经成为了当下中国产业升级和企业数字化转型中的新动能和驱动力。特别是由于线上线下生态及场景远比其他国家丰富、多元,中国经济中结构性的差异,以及细分行业中不同的应用场景需求,都给了基于AIGC为代表的新技术的创新以巨大的想象力,而新华三以智算架构构筑的超大模型底座,不仅可以帮助企业借助AIGC提升效率,创造新价值,持续推动产业智能化的升级,同时也让AI真正“扎根”百行百业奠定了关键基础,背后更体现出了全新的价值,可以从两个方面来做观察:  </p><p><img referrerpolicy="no-referrer" src="https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/f3a59c74357546fe8fdb0c988f5ce441~tplv-tt-shrink:640:0.image?traceid=20230227174332DA60910EFE6C344C7866&amp;x-expires=2147483647&amp;x-signature=dEI4BKWYukYdL445%2Bjv%2B7jemLOk%3D" alt="" title="">  </p><p><strong>一方面,是为AI超大模型的训练提供了坚实的技术支撑。</strong>随着关键技术与基础理论不断突破,大算力、大数据、大模型将成为未来AI发展的重点发展方向,由此带动自然语言处理、翻译模型、生成算法和数据集等细分要素持续提升,推动产出的内容细节、类型更丰富、质量更高。  </p><p>这背后显然离不开强大的算力和网络的支撑。而新华三打造的智算基础架构,基于新华三长期在ICT基础设施领域的沉淀,充分融合了其在计算、存储和网络等领域的优势,就切实地为超大模型训练提供了技术支撑。  </p><p>在此基础上,新华三还积极坚持前沿技术创新,其中全面支持在网计算的H3C P4可编程交换机,就能够支持Pytorch框架和DPDK UDP、RoCE通信方式,将数据需求聚合统一操作,优化通信网络拥堵,减少主机的数据处理量。据新华三内部实验室测算,使用H3C P4可编程交换机加速数据并行训练,模型训练精度不受影响,计算节点间通信数据量平均减少30%,最多可以减少48%的训练时间,可大幅提升分布式集群的整体训练效率,创造更加出色的应用价值。可以说在产品、技术和方案上的领先性,是新华三差异化的优势所在,更是其能够助力各类企业AIGC展开研发和推进的价值所在。  </p><p><strong>另一方面,新华三还正与产业各方积极合作,探索新范式和新路径,推动普惠算力更为广泛地落地,使能百行百业的智能化升级,共同推进中国人工智能产业的发展。</strong>  </p><p>这方面,新华三率先成为百度文心一言首批生态合作伙伴就是具体的印证。众所周知,今天AI正在极大改变人们的生活方式,目前也正在开始加速渗透到企业的研发设计、生产制造、供应链管理、客户服务等各个环节,深刻改变着人们的生产方式。  </p><p>因此,以提升效率和优化配置为核心主题的AI应用和创新,是数字经济深化发展的全新阶段,更是传统产业转型升级的必然要求。在这种大背景下,新华三和包括百度在内的产业合作伙伴通力合作,并通过旗下丰富的产品和解决方案为百行百业的用户注入云原生及人工智能技术,也能加速整个行业的智能化升级,释放智能化生产力“乘数效应”。  </p><p>总的来说,中国产业智能化的转型升级,中国数字经济的落地和发展,任重而道远。在此过程中,新华三以全新的智算架构支撑超大模型训练,并与产业合作伙伴深度合作,让AIGC这样的新技术能够加速行业落地的步伐,而这种创新力、前瞻力和爆发力,相信也将能够推动中国的人工智能产业呈现出“百花齐放”的状态,更能够提速整个行业智能化时代的到来,这不仅是未来的趋势所在,也是新华三不断创新与突破的重要体现。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 10:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387147</guid>
            <link>https://aijishu.com/a/1060000000387147</link>
        </item>
        <item>
            <title><![CDATA[神奇的MTE Tag在哪里?]]></title>
            <description><![CDATA[<p>常有人问MTE Tag在哪里?</p><h4>MTE Tag存在于两个地方:</h4><ol><li>MTE tag放在访问地址的bit 56:59,比如通过LDR Xm, [Xn]访问内存,Xn里面存放的是访问地址,当MTE使能的时候,真正用于访问内存的地址是bit 0:47(不考虑arm的52bit地址扩展)和bit 55 (bit55用于决定是高虚拟地址空间还是低虚拟地址空间),bit 56:59 这4个bit用于存放该地址的tag<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSb" alt="1.jpg" title="1.jpg"></li></ol><p>Xn的Tag生成和插入可以IRG,ADDG,SUBG等这些指令来实现:</p><ul><li>IRG Xn, Xn:为Xn中的地址生成一个随机的Tag,并插入到Xn的bit 56:59</li><li>ADDG Xm,Xn,#offset,#Tag  or</li><li>ADDG Xm,Xn,#offset,#Tag: 对Xn中的地址进行加减操作,并将指令中的Tag值插入到目的寄存器中</li></ul><p>当然软件也可以直接通过一般的指令直接改Xn寄存器的bit 56:59,比如<br>AND Xn, Xn, #~(0xf&lt;&lt;56)</p><ol start="2"><li>MTE tag放在内存中(内存可以是cache或是外部内存):<br>  每16-bye的物理地址空间有与之对应的4-bit的Tag存储空间<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSc" alt="7.jpg" title="7.jpg"></li></ol><p>在cache中,可以如下类似方式存储一个cache line(较新处理器Data cache都是PIPT的)对应的Tag:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSd" alt="12.jpg" title="12.jpg"></p><p>对于外部内存,实际系统中设计上,可以设计为在同一系统内存中大部分内存作为正常的数据存储使用,一部分内存用于存储数据对应的Tag(其关系是4-bit/16-byte, 既Tag的存储空间大小是正常数据存储大小的1/32)。每16-byte的物理内存对可以找到与之对应的4-bit Tag存储物理内存。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSe" alt="8.jpg" title="8.jpg"></p><p>下面通过一实例来演示。<br>假设访问的地址放在X0中<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSb" alt="1.jpg" title="1.jpg"></p><ol><li>为这个地址产生设置一个Tag,可以通过IRG指令来实现<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSf" alt="2.jpg" title="2.jpg"></li><li>将这个Tag保存到Tag存储内存,可以通过,STG,STGZ, ST2G / STZ2G这些指令来实现<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSg" alt="3.jpg" title="3.jpg"></li><li>对Tagged内存进行load/store访问,这会触发硬件的tag check操作<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSh" alt="4.jpg" title="4.jpg"></li></ol><p>在这个例子里面X0里面的tag和内存中保存的tag是match的,因此Tag Check成功。</p><ol start="4"><li>通过ADDG指令修改Xn中地址的Tag<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSi" alt="5.jpg" title="5.jpg"></li><li>对Tagged内存进行load/store访问,这会触发硬件的tag check操作<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSj" alt="6.jpg" title="6.jpg"></li></ol><p>X0里面的tag和内存中保存的tag不match,因此Tag Check失败。</p><h4>Tag存储和check的示例</h4><p>以上内容阐述了tag存储和check的基本知识,下面以一个实际的例子来帮助更深入理解。<br>我们从上面的IRG,STG,LDR/STR等指令可以看出,Tag的存储在软件上看并没有独立的访问地址,对Tag的访问是使用其对应的数据访问地址:</p><ol><li>如果数据在处理器的cache中,那么其该数据所在的cache line也可以包含数据对应的Tag, MTE Tag check可以在CPU中进行。</li><li>但如果数据不在cache中(cache的大小有限),那么就需要将数据和Tag存放在系统内存(DRAM)中。那系统如何在系统内存中存放和访问数据和Tag呢?Tag check发生在哪里?<br>我们以一个使用CI-700的系统为例。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSk" alt="9.jpg" title="9.jpg"></li></ol><p>CI-700可以包含支持MTE Tag的system cache, 除此之外,它还可以包含MTSX,而MTSX包含:</p><ol><li>支持计算一个访问地址在DRAM中对应的Tag访问地址的split logic, 通过软件设置的Tag_base_address, split logic可以换算出一个地址对对应的Tag在DRAM存放的位置。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSe" alt="8.jpg" title="8.jpg"></li><li>支持Tag check (Tag 比较)</li><li>支持对专门只缓存Tag值的MTE Tag cache,这是一个可选的功能。</li></ol><p>MTSX split logic可以将CPU发送的Tagged address访问拆分成正常的数据访问和对Tag的访问,从而使DMC不需要区别正常数据访问和Tag访问(DMC对数据还是Tag访问无感,DMC不需要对MTE做特殊的支持)。</p><p>以STG X0,[X0]为例,这个指令如果在cache中miss,那么将产生一个TagOps为Update的CHI transaction,传输到MTSX,这个transaction包含放在X0中的数据访问地址和Tag Value。MTSX的split logic负责换算出这个数据访问地址对应的Tag在DRAM中的地址,然后使用这个地址将Tag value更新到DRAM中。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSl" alt="10.jpg" title="10.jpg"></p><p>如果一个Tagged address的数据从cache中write back到DRAM中,将产生一个TagOps为Match的CHI transaction, 传输到MTSX, 这个transaction包含数据访问地址,数据值和Tag Value,MTSX的split logic负责其拆分为:</p><ol><li>Tag访问:换算出这个数据访问地址对应的Tag在DRAM中的地址,从这个地址中取出Tag值,然后由MTSX的Tag Compare logic比较取出Tag值和transaction带有的Tag Value。</li><li>正常数据写操作<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSm" alt="11.jpg" title="11.jpg"></li></ol>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 09:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387141</guid>
            <link>https://aijishu.com/a/1060000000387141</link>
        </item>
        <item>
            <title><![CDATA[解密禾赛科技最新激光雷达专利]]></title>
            <description><![CDATA[<p>【爱集微点评】禾赛科技的激光雷达专利,通过色散偏折件实现多波长光源所产生光线的分光和出射,同时色散偏折件还能起到扩束的作用,能够有效增大激光雷达的口径,提升测远能力。而且不会过多增加激光雷达的光路高度,有效的压缩了激光雷达的高度和体积。</p><p>集微网消息,近日,禾赛科技在纳斯达克成功上市,意味着中国“激光雷达”向全球又迈进了一步,同时禾赛科技也成为中国“激光雷达第一股”。</p><p>激光雷达是一种常用的测距传感器,其工作原理是利用激光往返于雷达和目标之间所用的时间,或者调频连续光在雷达和目标之间往返所产生的频移来评估目标的距离或速度等信息。为了获得较大的视场范围,激光雷达通常采用扫描装置进行扫描。激光雷达常用的扫描方式有机械旋转式、反射镜扫描式、光学相控阵(OPA)扫描、Flash扫描等。另外,还有一种扫描方式是波长扫描。波长扫描的扫描装置是利用光栅、棱镜等色散元件基于波长将多波长光源产生的光线分开以达到扫描的效果。但是现有波长扫描的扫描装置往往存在装配不方便的问题。</p><p>为此,禾赛科技于2022年8月29日申请了一项名为“激光雷达的发射模块及激光雷达”的发明专利(申请号:202222291141.6),申请人为上海禾赛科技有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1126334138789.4883.png" alt="image" title="image"></p><p>图1 波长扫描装置的光路示意图</p><p>图1为传统波长扫描装置的光路示意图,在激光雷达的应用中,通过不同波长的光线向不同角度衍射来实现激光雷达对不同垂直角度的扫描。因此,为了使多束衍射光的出射方向靠近水平面,实现对垂直0°角和垂直方向正角度和负角度一定范围的扫描,如图1所示,通常在色散元件12下游的光路中会设置反射镜13。但是反射镜13的反射面与水平方向之间的夹角较大,所以会增大光路沿垂直方向的尺寸,使得激光雷达光路垂直方向的高度增大,从而不利于激光雷达体积的缩小。此外,也会使激光雷达光路的不同光学元件在不同高度的水平面上,从而造成了激光雷达的安装不便。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1342321041364.585.png" alt="image" title="image"></p><p>图2 新型激光雷达发射模块结构示意图</p><p>图2为本专利提出的一种新型激光雷达发射模块结构示意图,在此主要引入色散偏折件129,其主要包括光栅层127和导光体128。光栅层127朝向导光体128的表面并与导光体128的表面直接接触。导光体128的两个表面分别为第一面121和第二面122,第一光线131从第一面121入射至导光体128,第三光线133自第二面122从导光体128出射。色散面和偏折面集成于一体化结构的导光体128上,能够使光学元件体积大幅缩小,并且一体化的光学元件结构更加稳定,能够有效提高光路的鲁棒性。此外,一般而言,导光体128材料的折射率大于1。将导光体128的材料设置为比较常见的大于1的材料以控制折射角度,可以实现扩束效果。</p><p>简而言之,禾赛科技的激光雷达专利,通过色散偏折件实现多波长光源所产生光线的分光和出射,同时色散偏折件还能起到扩束的作用,能够有效增大激光雷达的口径,提升测远能力。而且不会过多增加激光雷达的光路高度,有效的压缩了激光雷达的高度和体积。</p><p>禾赛科技是一家致力于激光雷达研发与制造的全球化公司,其客户遍布全球主流汽车厂商、自动驾驶和机器人公司,覆盖40个国家和90多个城市。作为以技术为核心竞争力的公司,禾赛科技的成功并非偶然,而是在多年的产品打磨和技术投入中诞生的。中国需要有世界级自主研发能力的公司,相信禾赛科技也有实力成为全球领先企业。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 08:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387119</guid>
            <link>https://aijishu.com/a/1060000000387119</link>
        </item>
        <item>
            <title><![CDATA[兆芯如何保证处理器模拟/真实请求传输路径一致?]]></title>
            <description><![CDATA[<p>【爱集微点评】兆芯的处理器建模专利,采用两套信息来记录一个请求路径的关键信息,解决多个请求在汇聚点装置中路径不明确的问题。同时依据第二路径信息可以纠正第一路径信息在汇聚点装置导致的路径错误,使模拟请求传输路径的建模跟真实硬件传输路径更为一致。</p><p>集微网消息,近日,兆芯独家入选《上海金融科技发展白皮书》基础设施支持类科技企业,同时兆芯的新一代嵌入式处理器也一并入选白皮书。</p><p>在处理器建模领域中,当处理器传输数据的整个路径上只有一个源端发送请求时,功能加时序模型可以很好地模拟真实处理器的性能。但是,如果整个路径上有多个源端可以发送请求,由于功能模型是在请求生成的时候就进行调用,而多个源端到达请求汇聚点的路径延时是不确定的,汇聚点是指多个请求都会通过的路径节点或装置,这样会导致多个源端的请求在汇聚点看到的时序状态跟在请求生成时的差距较大。当大量的请求的处理路径跟功能模型不一致的情况下,最终建模呈现的性能指标就不能反映真实处理器的性能。因此,如何真实的模拟出处理器的性能,已成为本领域需解决的问题之一。</p><p>为此,兆芯于2020年9月29日申请了一项名为“处理器建模系统及处理器建模方法”的发明专利(申请号:202011054563.0),申请人为上海兆芯集成电路有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1141850468081.4688.png" alt="image" title="image"></p><p>图1 处理器建模系统的示意图</p><p>图1为本专利提出的一种处理器建模系统的示意图,处理器建模系统100包含多个源端装置A1~Am及一汇聚点装置PL。其中,源端装置A1~Am是向处理器发出请求的装置,例如输入输出装置、储存装置、图形处理器、预取装置等。</p><p>源端装置A1和An+1分别产生第一/二请求,并于第一/二传送时点传送两个请求。而汇聚点装置PL分别在第一接收时点和第二接收时点接收两个请求,并依据第一请求/第二请求选择传送路径(例如PT1)。其中,第一传送时点早于第二传送时点,第一接收时点接收晚于第二接收时点,且第一请求与第二请求欲存取的目标数据地址相同。如此一来,在多源端的处理器的仿真建模过程会发生多请求在到达汇聚点装置时出现路径不明的情况,最终导致建模结果呈现的性能指标与真实处理器不一致。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/538297132002.6487.png" alt="image" title="image"></p><p>图2 处理器建模方法的流程图</p><p>图2是本专利提出的一种处理器建模方法流程图,首先源端装置A1产生第一请求,第一请求为主路径请求。对于每一个请求,用第一路径信息来表示传统的功能模型的关键信息,用第二路径信息来表示真实时序的关键信息(可以真实反映时序的关键信息)(步骤210)。然后第一请求分别调用功能模型和时许模型,得到第一、二路径信息(步骤220、230)。然后第一请求被传送到汇聚点装置PL(步骤240),而汇聚点装置PL判断是否存在第二请求(步骤250)。汇聚点装置PL依据第二请求的第二路径信息选择传送路径PT1。因为目标数据地址中的信息已经先被先到汇聚点装置PL的第二请求取走了,所以依据第二请求的第二路径信息选择传送路径PT1(步骤260)。最后,汇聚点装置PL更新第二请求状态为合法的(步骤270)。</p><p>简而言之,兆芯的处理器建模专利,采用两套信息来记录一个请求路径的关键信息,解决多个请求在汇聚点装置中路径不明确的问题。同时依据第二路径信息可以纠正第一路径信息在汇聚点装置导致的路径错误,使模拟请求传输路径的建模跟真实硬件传输路径更为一致。</p><p>兆芯成立于2013年,掌握中央处理器、图形处理器、芯片组等三大核心技术。自从成立以来,兆芯已经成功研发、量产了多款通用处理产品,在业内得到了高度评价,并多次入围Silicon 100榜单、荣获各种“创新奖”、“成就奖”、“金奖”。希望在2023年成立十年之际,兆芯可以再创辉煌、更上一层楼!</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387102</guid>
            <link>https://aijishu.com/a/1060000000387102</link>
        </item>
        <item>
            <title><![CDATA[灵动微课堂 |FlexCAN OTA]]></title>
            <description><![CDATA[<h1><strong>1 简介</strong></h1><p>FlexCAN OTA 是由灵动提供的一种基于 UDS 协议使用 CAN 总线实现对 MCU 的 App 固件更新的解决方案。该解决方案的软件部分主要由:Bootloader、App和PC Tool三部分构成,硬件部分如图 1 所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRw" alt="image.png" title="image.png"></p><p><strong>1.1&nbsp; 关键特性&nbsp;&nbsp;</strong></p><p>基于 UDS(ISO14229) 标准</p><p>基于 CAN(ISO11891-1) 标准</p><p>具备对 App 固件 CRC 完整性校验功能</p><p>使用主机上传 Flash driver 到 MCU</p><p>在 Bootloader 中进行 App 有效性检查</p><p>提供用于验证 App 固件更新的 PC 端上位机工具</p><p><strong>1.2 &nbsp;什么是 FlexCAN ?&nbsp;</strong></p><p>CAN 是控制器域网 (Controller Area Network, CAN) 的简称,是一种功能丰富的车用总线标准,被设计用于在不需要主机(Host)的情况下,允许网络上的单芯片和仪器相互通信。是由研发和生产汽车电子产品著称的德国 BOSCH 公司开发,并最终成为国际标准(ISO11898),是国际上应用最广泛的现场总线之一。</p><p>FlexCAN 是 CAN 协议的一个高完成度版本。以灵动 MM32F0140 系列 MCU 内嵌的 FlexCAN 为例,其符合 ISO 11898-1 标准,支持 CAN 2.0B 版本协议,位速率高达 1 Mbps,具有非常灵活的用于传输和接收的邮箱系统,可以接收和发送 11 位标识符的标准帧,也可以接收和发送 29 位标识符的扩展帧,主要被设计用作车载串行总线,可满足实时处理、车辆在电磁干扰环境下的可靠操作、成本效益、带宽等要求。</p><p><strong>1.3 &nbsp;什么是 UDS ?&nbsp;</strong></p><p>UDS(Unified Diagnostic Services,统一诊断服务)是一种用于汽车电子控制器 ECU (Electronic Control Units) 环境下的一种诊断通信协议,可实现诊断、固件更新、日常测试等功能,在 ISO 14229 中规定了其实现标准。</p><p>在本实例中,UDS 通信是在客户端-服务端关系中执行的。客户端是上位机下载软件运行于 PC 机,服务端是带有FlexCAN IP模块的 MM32 MCU。例如,将 CAN 总线接口连接到 MCU,并将 UDS 请求发送到 MCU。当 MCU 支持 UDS 服务时,它将根据客户端发出的请求做出相应的响应。</p><p><strong>1.4 &nbsp;为什么用 Bootloader ?&nbsp;</strong></p><p>对于 MCU 而言,如果程序内置有基于FlexCAN 的 Bootloader,则每次更新 MCU 的固件则不需要拆开外壳也不必再使用烧录器进行烧录,而可直接通过 CAN 总线来更新程序,这样更方便也更安全,而且随着智能化的普及,甚至可以对 MCU 进行远程升级。Bootloader 程序结构对比如图 2 所示:</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRx" alt="image.png" title="image.png"></p><p><strong>1.5 &nbsp;为什么基于 UDS ?&nbsp;</strong></p><p>为了规范 Bootloader 的全过程,通过使用成熟的平台进而提供高质量 Bootloader。因 UDS 在设计时考虑了 Bootloader 的需求,并为 Bootloader 提供了相关服务以供使用,比如诊断会话控制、ECU 重置、读取数据、请求下载、传输数据、请求传输退出等,可以实现更高效和可靠的刷写功能。故主机厂普遍会要求在 UDS 规范的基础上完成 Bootloader 功能。</p><p><strong>1.6 &nbsp;用到了哪些 UDS 服务?&nbsp;</strong></p><p>在 Bootloader 中,使用到 UDS 的 $10、$11、$27 和 $3E 基础诊断服务,$22、$2E 读写 DID 服务,$31、$34、$36 和 $37 固件数据传输相关服务。UDS 服务概览如表 1-1 所示:</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRy" alt="image.png" title="image.png"></p><h1><strong>2 Bootloader</strong></h1><p>Bootloader 是一段允许在不使用烧录器的情况下更新App固件的代码,基于灵动 MindSDK 实现的 Bootloader 样例工程支持 MDK、IAR 和 ARMGCC 三种工具链进行开发。在实际的使用过程中只需要在第一次使用时通过烧录器将 Bootloader 烧录进 MCU,后续的 App 都可以通过使用基于 CAN 总线的 UDS协议完成固件更新。</p><p><strong>2.1&nbsp; Bootloader 功能特性&nbsp;&nbsp;</strong></p><p>支持 Service 27,用户可根据自身需求添加安全访问算法。</p><p>支持 Service 22 和 Service 2E,用户可以根据自身需求添加策略,进行信息读出与存储。</p><p>外置 Flash driver,使用时通过外部 PC 或后台将 Flash driver 加载到 MCU 的 RAM 中进行安全的 Flash 擦写操作。</p><p>提供看门狗监控功能,用户可根据自身需求选择性开启看门狗监控程序。</p><p><strong>2.2&nbsp; 客制化修改说明&nbsp;&nbsp;</strong></p><p><strong>修改诊断 ID</strong></p><p>可在样例工程的 board/FblHalCan.h 中修改诊断 ID 的值。</p><p><strong>指定数据填充值</strong></p><p>当需要发送的数据长度不满足 8 字节长度时,通过宏定义可以更改填充,用户可以在样例工程的 board/FblHalCan.h 中指定填充值。</p><p><strong>使能看门狗</strong></p><p>用户可以在样例工程的 board/FblMacros.h 中打开宏开关 WDG\_ENABLE 使能看门狗服务,并且实现 ResetWdg 操作。</p><p><strong>安全访问算法接口</strong></p><p>Bootloader中支持 27 Service,用户可在样例工程的 board/FblMacros.h 中使能宏开关 ENABLE_SECURITY_ALGORITHM_VERIFICATION 根据自身需求添加安全访问算法。</p><p><strong>2.3&nbsp; Flash driver 介绍&nbsp;&nbsp;</strong></p><p><strong>什么是Flash driver?</strong></p><p>在OTA程序升级过程中,发送App可执行文件之前,向底层先发送一段二进制文件,这段代码实现了对MCU片内 Flash 的擦写功能,称为 Flash driver。</p><p><strong>Flash driver存在的意义</strong></p><p>在车载ECU控制器中,为了安全考虑,会尽可能的避免在代码中固化有对flash进行擦写操作,主要为了避免在程序跑飞时误调用该部分代码,使软件代码部分受到破坏。</p><p><strong>Flash driver的实现方式</strong></p><p><strong>a.</strong> 将flash driver固化在底层flash中,在运行的时候将flash中的flash driver拷贝到ram中来运行,这是比较传统的方式,但是避免不了提到的安全性问题。</p><p><strong>b.</strong> 将flash driver这段代码保存在PC端或后台,在每次执行OTA升级前,将这段代码先发送给MCU,这样可以避免方式 a 中提到的安全性问题。</p><h1><strong>3 App</strong></h1><p>基于灵动 MindSDK 提供的 flexcan\_ota\_app 样例工程进行开发和生成用于更新的 HEX 格式 App 固件生成,无需任何适配操作即可生成用于 OTA 升级的 App 固件。</p><p><strong>3.1&nbsp; 使用说明&nbsp;&nbsp;</strong></p><p>将 Bootloader 通过下载器下载到 MCU 中后,可通过提供的 PC Tool 来刷写生成的固件,通过 PC Tool 下载成功后,一方面 PC 终端会有下载成功提示,另一方面也可以查看开发板上对应固件实现的功能是否开始执行。</p><p>关于 App 固件可从提供的 flexcan\_ota\_app 样例工程编译源码并将生成“.hex”格式的 App 固件进行加载。</p><p><strong>3.2&nbsp; App 设计规范&nbsp;&nbsp;</strong></p><p>App 与 Bootloader 存放在 MCU 的同一块 Flash 的两个不同区域中,为保证两个软件的正常使用,App 设计遵循表 2-1 和表 2-2 所述规范。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRz" alt="image.png" title="image.png"></p><h1><strong>4 PC Tool</strong></h1><p>Flexcan OTA PC Tool 是用于验证灵动 MindSDK 中提供的 FlexCAN OTA 解决方案的简易 PC 端上位机工具。</p><p><strong>4.1&nbsp; 功能特性&nbsp;&nbsp;</strong></p><p>支持 CAN 通信速率自定义</p><p>支持 Win10 操作系统下运行</p><p>支持默认参数直接运行和命令行下带参数运行</p><p>支持直接加载 MDK 和 IAR 工具链下生成的 HEX 格式文件</p><p>基于 Python 使用 python-udsoncan 开发,可根据不同需求灵活进行二次开发</p><p><strong>4.2&nbsp; 开发环境&nbsp;&nbsp;</strong></p><p>本工具在 Win10 平台使用 Python 进行开发,基于 UDS 使用 CAN 协议,支持 PEAK CAN卡与 MCU 进行通讯。</p><p><strong>4.3&nbsp; 使用说明&nbsp;&nbsp;</strong></p><p>请按照如下步骤进行操作:</p><p><strong>a 下载 Bootloader 到 MCU</strong></p><p>将提供的 flexcan_ota_bootloader 样例工程编译并下载到开发板中。</p><p><strong>b 安装 CAN 卡驱动并连接 MCU</strong></p><p>在这里我们用到的是PCAN-USB,下载并安装驱动(<a href="https://aijishu.com/link?target=https%3A%2F%2Fpeak-system.com.cn%2Fdriver%2F" target="blank">https://peak-system.com.cn/dr...</a>) ,并将 PCAN-USB 和开发板上的 CAN 收发器通过双绞线连接以及通过 USB 和 PC 机连接。</p><p><strong>c 运行 FlexCAN OTA PC Tool</strong></p><p>方式一:按照默认参数直接运行</p><p>直接双击 flexcan_ota_pc_tool_v1.0.exe,如图 3 所示,默认将按照 500Kbps 的比特率进行 CAN 通信,Flash_driver 文件的加载地址为当前路径下的文件(./flash_driver.hex), App 文件的加载路径为当前路径下文件(./app.hex)。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRA" alt="image.png" title="image.png"></p><p>方式二:按照指定参数运行</p><p>在 Win10 平台下启动命令行窗口并切换到当前路径下,获取帮助如图4所示,输入如下指令并按回车键:</p><pre><code>flexcan_ota_pc_tool_v1.0.exe&nbsp;-h&nbsp;</code></pre><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRB" alt="image.png" title="image.png"><br>按照指定参数运行如图 5 所示,输入如下指令并按回车键:</p><pre><code>flexcan_ota_pc_tool_v1.0.exe&nbsp;-b&nbsp;500000&nbsp;-f&nbsp;"./flash_driver.hex"&nbsp;-a&nbsp;"./app.hex"</code></pre><p>其中 flash_driver.hex 文件为用于安全地擦写片内 flash 的代码,在每次 OTA 更新中复用即可。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRC" alt="image.png" title="image.png"></p><p><strong>d 结束</strong></p><p>等待 FlexCAN OTA 固件更新流程结束,并按任意按键退出。</p><h1><strong>5 注意事项</strong></h1><p>FlexCAN OTA Tool 为用于验证基于 UDS 使用 CAN 协议进行 App 固件更新的上位机工具,PC 端使用 PEAK-CAN 与 MCU 通讯,仅支持在 Win 10 操作系统下运行,&nbsp;&nbsp; 且用于功能性验证,若遇到软件闪退等问题请重启该软件并复位 MCU。该工具可根据开发者项目需求进行二次开发。</p><p>以上介绍是基于MM32F0140 系列 MCU 进行介绍和示例演示,相关源码请访问灵动官网进行获取:</p><p><strong>01</strong></p><p>进入灵动官网(www.mm32mcu.com)</p><p><strong>02</strong></p><p>打开“产品”菜单下 MM32F0140 页面,浏览“文档”列表。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRD" alt="image.png" title="image.png"></p><p><strong>03</strong></p><p>在“应用笔记”中下载“AN0035_FlexCAN_OTA”文档,获取源码。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRE" alt="image.png" title="image.png"></p><p><strong>6 参考文献</strong></p><p>《ISO11898-1》</p><p>《ISO14229》</p><blockquote>作者:灵动MM32  <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2F87OMwn8rlluytkhuKJ-xXQ" target="blank">灵动MM32MCU</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000385095">灵动微课堂 |单独下载可执行文件到MM32F5微控制器</a></li><li><a href="https://aijishu.com/a/1060000000379844">基于灵动MM32 MCU的便携式血氧仪应用</a></li><li><a href="https://aijishu.com/a/1060000000378709">灵动微课堂 |使用MM32F3270基于Azure RTOS定时器组的应用</a></li><li><a href="https://aijishu.com/a/1060000000376861">灵动微课堂 | MM32L013x——LPTIM的应用介绍</a></li></ul><blockquote>更多MM32F5系列资料请关注<a href="https://aijishu.com/blog/lingdongmm32mcu">灵动MM32 MCU</a>专栏。如想进行MM32相关芯片技术交流,请添加极术小姐姐微信(id:aijishu20)加入微信群。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387086</guid>
            <link>https://aijishu.com/a/1060000000387086</link>
        </item>
        <item>
            <title><![CDATA[河南农信社数字化转型实践方案]]></title>
            <description><![CDATA[<p>农信机构立足地方“三农”,普遍规模较小,高地域集中度在县域和农村地区,容易受到地方农村经济脆弱性的影响。</p><p>农信机构由于信贷项目要求多,单笔贷款业务批复的额度相对较小,在信用档案登记环节,造成业务量和工作量相对较多。同时,信用信息采集不够精确,不能全面且合理地评定农民信用等级,最终结果就是贷款主题的信用评级被高估,部分贷款主题获得超出实际所需额度的贷款,不能予以偿还,提高了农信系统的不良率。</p><p><strong>农信社信贷普遍面临担保条件难以落实、营销运营成本高、人员操作道德风险大、客户授信主观化、办理速度慢等问题。</strong></p><p>数字化转型是一场科技革命,能够精准解决农村普惠金融推进过程中的痛点。农信社以数字综合治理为契机,加强数据全周期管理,建立数据治理长效机制,提升农信社核心竞争力,为数字化转型奠定基础。多举措提升创新研发和数字应用能力。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMrZ" alt="2.png" title="2.png"></p><h2>河南农信的数字化实践</h2><p>农信系统改革,是2023年银行业的“重头戏”。11月23日,《河南日报》报道了河南省农信社改革进展。据报道,河南省农信社改革方案已获得银保监会批复,将通过组建河南农商联合银行,自上而下理顺股权结构,完善公司治理,推进系统重塑,提升全省农信社体系健康度,充分发挥其地方金融“压舱石”的作用。基于对自身的调研、思考和探索,河南农信给出了数字化转型的应对之策。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRS" alt="图片1.png" title="图片1.png"></p><p><strong>建立高效的数字化架构。</strong>通过构建数字化的IT支撑平台,形成数据开发、共享、使用和管理流程机制,完成向现代银行、智慧银行的数字化转型,将存贷汇、融资理财、在线信贷、金融咨询等标准化产品嵌入各种场景,把金融服务融入客户工作和生活,从而吸引客户、留住客户,增强客户的黏性和忠诚度。</p><p><strong>建设数字化授信体系。</strong>全面推进农户、个体商户、社区居民的信息采集、加工、评价和维护、加快客户信息系统建设和大数据技术应用,对小微经营户、农户信用风险进行数量化精确计量,通过采集高度简化的现场客观信息和互联网大数据信息,实现低成本、高效率、客观准确的授信决策。</p><p><strong>增强业务风险管理水平。</strong>运用大数据、人工智能、建模等技术,引入顶象无感验证,发挥智能风控的决策支持作用,构建和不断优化风控分析模型,建立营销、评级、授信、用信、审批、预警、清收等端到端的反馈机制,强化贷前、贷中、贷后全流程风险管理,从根本上提升风险防控效率和水平。</p><p><strong>优化线上营销服务。</strong>开展范围广泛、影响力大的线上营销活动,统筹安排和有效支持精准营销活动,开展线上营销培训,提高全员线上营销服务意识和能力;要通过数据整合、数据分析和数据运算,形成数据洞察能力,对客户进行精准画像,采取交叉销售,定向推荐等差异化营销策略,实现精准营销、智能营销。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRU" alt="640.jfif" title="640.jfif"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMrZ" alt="2.png" title="2.png"></p><h2>验证码助力数字化转型</h2><p>验证码是智能风控的重要组成部分,作为人机交互界面经常出现的关键要素,是身份核验、防范风险的重要组成,也是用户交互体验的第一关口,广泛应用金融服务上。</p><p>2020年2月,中国人民银行发布新版《网上银行系统信息安全通用规范》提出,从系统构成、客户端运行环境、短信/图形验证码、生物特征、通信链路等环节要求。特别提到,金融机构应通过行为分析、机器学习等技术不断优化风险评估模型,结合生物探针、客户行为分析等手段,切实提升安全防护能力。</p><p>2020年7月,中国银保监发布《商业银行互联网贷款管理暂行办法》,要求商业银行应当对互联网贷款业务建立全面等下管理体系,在贷前、贷中、贷后全流程进行风险控制。</p><p>顶象无感验证以防御云为核心,集13种验证方式,多种防控策略,以智能验证码服务、验证决策引擎服务、设备指纹服务、人机模型服务为一体的云端交互安全验证系统。其汇集了4380条风险策略、112类风险情报、覆盖24个行业、118种风险类型,防控精准度&gt;99.9%,1天内便可实现从风险到情报的转化,行业风险感知能力实力加强,同时支持安全用户无感通过,实时对抗处置能力更是缩减至60s内。</p><p>截至目前,顶象无感验证已为100多家金融机构提供专业服务。</p><hr><p>业务安全大讲堂:<a href="https://aijishu.com/link?target=https%3A%2F%2Fjinshuju.net%2Ff%2FtYyi3u" target="blank">立即报名</a></p><p>业务安全产品:<a href="https://aijishu.com/link?target=https%3A%2F%2Fuser.dingxiang-inc.com%2Fuser%2Fregister%23%2F" target="blank">免费试用</a></p><p>业务安全交流群:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.dingxiang-inc.com%2Fblog%2Fpost%2F599" target="blank">加入畅聊</a></p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387115</guid>
            <link>https://aijishu.com/a/1060000000387115</link>
        </item>
        <item>
            <title><![CDATA[南芯科技公开带预唤醒功能的Type-C接口插入检测电路方案]]></title>
            <description><![CDATA[<p>【爱集微点评】南芯科技公开的带预唤醒功能的Type-C接口插入检测电路方案,该方案通过增加Type‑C接口预唤醒电路,在接口电路休眠时,可以将Type‑C接口检测电路关闭。从而实现减低系统待机功耗的同时实现接口插入检测功能,通过简单的电路结构解决了Type‑C接口插入检测和低功耗之间的矛盾。</p><p>集微网消息,在集成电路应用当中,特别是手机或者充电设备的Type‑C接口电路应用中,通常为了降低系统待机功耗,在未检测到手机或者充电设备插入时,整个系统会进入休眠模式。</p><p>但是为了快速响应手机或者充电设备的插入,在休眠时Type‑C接口检测电路需要一直工作,这就大大增加了系统休眠时的待机电流,从而大大缩短电池的续航时间。</p><p>为此,南芯科技在2022年3月11日申请了一项名为“一种带预唤醒功能的Type-C接口插入检测电路”的发明专利(申请号:202210236444.X),申请人为上海南芯半导体科技股份有限公司。</p><p>根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/522483438041.0886.png" alt="image" title="image"></p><p>如上图,为该专利中公开的充电设备端和手机端上设置的Type‑C接口检测电路通过Type‑C数据线连接的结构示意图。可以看到,在手机或者充电设备(如适配器、充电宝等)的Type‑C接口电路应用中,为了快速响应手机或者充电设备的插入,在休眠时Type‑C接口检测电路需要一直工作。这就大大增加了系统休眠时的待机电流,从而大大缩短了手机或者充电设备的电池的续航时间。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1435664442736.5054.png" alt="image" title="image"></p><p>如上图,为现有方案中Type‑C接口检测电路的电路连接示意图。在充电设备端,P型开关管M2的源端连接电源VDD,栅端连接控制信号EN_Rp,漏端连接上拉电流源Irp的源端。Irp的输出端连接到引脚CC,引脚CC同时连接到检测比较器P的反向端,比较器P的正向端连接参考电压VREF,比较器P输出信号为CC_DET_P。</p><p>在手机端,N型开关管M1的源端连接GND(即接地),栅端连接控制信号EN_Rd,漏端连接下拉电阻Rd的一端,下拉电阻Rd另一端连接到引脚CC。引脚CC同时连接到检测比较器D的同向端,比较器D的反向端连接参考电压VREF,比较器D的输出电压为CC_DET_D。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/168830725881.94025.png" alt="image" title="image"><br>在该专利中,主要通过在Type‑C接口检测电路的基础上增加预唤醒电路,在休眠时关闭Type‑C接口检测电路,来降低系统待机功耗。在设备插入时,通过触发预唤醒电路,再将Type‑C接口检测电路使能,实现快速响应设备的插入。</p><p>如上图所示,该检测电路包括:Type‑C接口检测电路以及Type‑C接口预唤醒电路。该充电设备端接口检测电路包括P型开关管M2、上拉电流源Irp和比较器P。手机端接口检测电路包括N型开关管M1、下拉电阻Rd和比较器D。</p><p>充电设备端接口预唤醒电路包括P型开关管M3、上拉电阻Rp_Pre、P型开关管M4、电阻R1、电阻R2以及反相器PI1。手机端接口预唤醒电路复用手机端接口检测电路的N型开关管M1和下拉电阻Rd。此外,手机端接口预唤醒电路还包括N型开关管M5、电阻R3、电阻R4和反相器PI2。</p><p>该装置的工作原理如下:在充电设备端,通过开关管M3和上拉电阻Rp_Pre实现上拉功能,开关管M4、电阻R1以及R2实现Rd插入预唤醒功能。在充电设备接口休眠时,开关管M3栅极控制电压为0,开关管M2栅极控制电压为1,关闭Irp上拉电流源,同时比较器P处于关闭状态。在手机端,下拉电阻部分将复用接口检测电路部分,开关管M5、电阻R3以及R4实现上拉插入预唤醒功能。在手机端接口休眠时,开关管M1栅极控制电压为1,打开M1,通过电阻Rd实现下拉,同时比较器D处于关闭状态。</p><p>引脚CC没有插入上拉时,CC引脚被Rd和M1下拉至GND,CC引脚通过ESD保护电阻R4接到开关管M5栅极,M5处于关断状态,输出被电阻R3上拉至VDD。然后经过反相器,输出为低,整个Type‑C接口电路没有工作电流,系统功耗很低。</p><p>当引脚CC插入上拉时,CC引脚电压即为开关管M5栅极电压,M5被打开,将信号拉低,输出CC_DET_D_PRE即为高电平。从而实现上拉插入预唤醒,然后打开比较器D,Type‑C接口检测电路将开始工作。</p><p>以上就是南芯科技公开的带预唤醒功能的Type-C接口插入检测电路方案,该方案通过增加Type‑C接口预唤醒电路,在接口电路休眠时,可以将Type‑C接口检测电路关闭。从而实现减低系统待机功耗的同时实现接口插入检测功能,通过简单的电路结构解决了Type‑C接口插入检测和低功耗之间的矛盾。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387106</guid>
            <link>https://aijishu.com/a/1060000000387106</link>
        </item>
        <item>
            <title><![CDATA[用人工智能设计芯片及对IC设计就业市场的影响]]></title>
            <description><![CDATA[<p>集成电路 (IC) 设计是一项复杂的工作,不断突破密度和性能的界限。现在,人工智能 (AI)在 IC 设计中的作用越来越大。</p><p>虽然 AI 最近因其在 ChatGPT 等自然语言处理器方面的惊人能力而受到更多关注,但该工具也被用于 IC 设计的各个阶段,包括设计优化、布局、仿真和验证。人工智能算法还可以帮助更有效地探索设计空间,比传统方法更快地发现最佳设计配置。</p><h5>随着设计变得比以往任何时候都更加复杂,人工智能可以成为 IC 设计师的强大资产。</h5><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRe" alt="image.png" title="image.png"></p><p>本文重点介绍了AI如何被用作IC设计的工具,以及这项技术如何影响IC设计工程师的专业价值。</p><p><strong>利用 AI 来实现严格的设计约束</strong></p><h3>由于数十亿个晶体管被限制在一个很小的芯片区域,IC 设计师的任务是在严格约束的情况下优化设计。&nbsp;</h3><p>首先,芯片面积必须最小,以适应当今设备的小尺寸,并降低制造成本。布局的功耗也是值得关注的;功耗同样会影响部署成本以及芯片对环境的影响。某些密集区域和配置容易过热,需要冷却机制或更巧妙的布局。考虑到这些因素和许多其他因素,IC设计人员大约需要八到九个月的时间来生成一个满足每个严格要求的芯片布局。</p><p>为了加快和优化 IC 设计流程,许多公司(包括科技行业的一些最大公司)现在都在投资 AI 工具来完成一些繁重的工作。</p><p><strong>谷歌人工智能在几个小时内设计出芯片</strong></p><p>据谷歌称,谷歌的深度学习强化学习 (RL) 方法可以在比人类工程师少得多的时间内生成有效的布局,而且结果在质量上也不相上下。</p><p>谷歌表示,谷歌的深度学习强化学习(RL)方法可以在比人类少得多的时间内产生有效的布局,而且结果在质量上也不相上下。2022年3月,谷歌研究院推出了PRIME,这是一种深度学习方法,利用现有的数据,如功率和延迟来创建加速器设计,比用传统方法设计的芯片更快、更小。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRf" alt="image.png" title="image.png"></p><p>谷歌研究人员使用 10,000 个芯片平面图来训练他们的模型。人工智能生成的芯片设计时间不到六个小时。谷歌表示,这种方法已经被利用来实现谷歌的张量处理单元(TPU),这是谷歌基于云的机器学习应用的一部分。</p><p><strong>EDA公司在AI设计系统上加倍投入</strong></p><p>不仅仅是谷歌转向机器学习模型。像Synopsys和Cadence这样的EDA公司也在其最新工具中使用到AI技术。比如最近,Synopsys凭借其 Synopsys DSO.ai 自主芯片设计系统注册了 100 个商业流片。该系统最近的客户包括 意法半导体(ST)和 SK Hynix。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRg" alt="image.png" title="image.png"></p><p>ST 和 Synopsys 于 2022 年 2 月初首次在微软的云端使用 DSO.ai 来设计工作芯片。使用 Synopsys 的 DSO.ai 设计系统,结合 Microsoft Azure 上的 Synopsys Fusion Compiler 和 IC Compiler,该工具将功耗、性能和面积 (PPA) 指标提高了 3 倍以上,总功耗降低了 25%,并且显著缩小了芯片尺寸。</p><p>除了芯片设计,人工智能还在芯片测试和验证中找到了应用——芯片制造商在这两个领域花费了大量时间。为了解决这一设计阶段的问题,西门子发布了Questa Verification IQ,这是一个帮助IC设计工程师加快验证过程的软件平台。</p><p><strong>英伟达用GPU设计GPU</strong></p><p>NVIDIA(英伟达)为芯片设计设计了另一种深度学习方法。该公司制作了一个名为PrefixRL的 RL 模型,证明 AI 可以从头开始学习电路设计,并使用最新的 EDA 工具制造更小、更快的电路。NVIDIA 的架构由 13,000 个使用 AI 技术设计的电路组成。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRh" alt="image.png" title="image.png"></p><p>针对自动化单元迁移,该公司开发了NVCell,可以无错迁移92%的单元库。人类工程师可以对剩下的 8% 没有自动迁移的单元进行处理。NVIDIA 首席科学家 Bill Dally 表示:</p><p><em>“所以这就像一个 Atari 视频游戏,但它是一个用于修复标准单元中的设计规则错误的视频游戏。通过强化学习来研究和修复这些设计规则错误,我们能够基本完成我们标准的设计单元。”</em></p><p><strong>人工智能对 IC 设计就业市场的影响</strong></p><p>虽然人工智能可以自动执行传统上由IC设计人员执行的某些任务,例如布局设计和优化,但它也减少了设计过程中对手动方面的需求。虽然这提高了整体效率,但也可能导致IC设计的某些领域的最终工作被取代。</p><p>另一方面,人工智能还可以帮助 IC 设计人员更高效、更有效地开展工作。例如,AI 可以分析大量数据并提供见解,建议工程师以前可能没有考虑过的设计替代方案。这种趋势可以提高 IC 设计人员在行业中的价值,使他们能够专注于更复杂和更具创造性的设计方面,并最终生产出更好的产品。</p><p>不过人工智能不太可能完全取代对熟练IC设计师的需求。随着人工智能在行业中越来越普遍,对这类工程师的需求甚至可能会增加,因为在设计过程中,将需要能够准确验证和利用人工智能工具和算法的个人。</p><hr><blockquote>作者:  Darshil Patel <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FN_pgzMV26mvgCMAxWMgieQ" target="blank">EETOP</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000386323">行业前瞻,神奇的忆阻器</a></li><li><a href="https://aijishu.com/a/1060000000386135">芯片验证调研报告:首次流片成功率越来越低、Verilog 使用逐渐减少、UVM地位无法动摇</a></li><li><a href="https://aijishu.com/a/1060000000385729">PCIe 6.0:在有损HVM通道中使用PAM4实现64GT/s的挑战</a></li><li><a href="https://aijishu.com/a/1060000000385482">Wi-R 一种全新的通信方式,让你的身体充当媒介!芯片已推出!</a></li><li><a href="https://aijishu.com/a/1060000000383891">科普:DDR</a></li></ul><blockquote>更多IC设计技术干货请关注IC设计技术专栏。<br>迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387068</guid>
            <link>https://aijishu.com/a/1060000000387068</link>
        </item>
        <item>
            <title><![CDATA[优秀的IC/FPGA开源项目(六)-手语字母翻译器]]></title>
            <description><![CDATA[<p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQU" alt="image.png" title="image.png"></p><p>《优秀的IC/FPGA开源项目》是新开的系列,旨在介绍单一项目,会比《优秀的 Verilog/FPGA开源项目》内容介绍更加详细,包括但不限于综合、上板测试等。两者相辅相成,互补互充~</p><hr><p>一种智能手套,可将手语字母翻译成带显示器的书面字母。</p><h1>绪论</h1><p>在这个项目中,我们的主要目的是开发一款智能手套,帮助使用手语的人在日常生活中轻松交流。</p><p>学习手语是一个要求很高的过程。因此,许多健康人并不了解这个过程。在这款智能手套的帮助下,那些健康的人将能够理解那些使用手语的人。智能手套还可以用作想要学习手语的健康人的模拟器。</p><p>这个项目主要涉及到模拟字母,字母是语言的基石。在这个项目中,我们使用 FPGA 来实现将手势模拟为视觉字母的算法。检测手势是通过手指上的柔性传感器测量出手的形状。vga监视器用于直观显示FPGA中转换为字母的手势。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQW" alt="image.png" title="image.png"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQX" alt="image.png" title="image.png"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQY" alt="image.png" title="image.png"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQZ" alt="image.png" title="image.png"></p><p>上三图说明了 VGA 控制器产生的时序信号。控制器包含两个计数器。一个计数器在像素时钟上递增并控制 h\_sync(水平同步)信号的时序。通过将其设置为显示时间从计数器值 0 开始,计数器值在显示时间内等于像素的列坐标。水平显示时间之后是消隐时间,消隐时间包括水平前沿、水平同步脉冲本身和水平后沿,每个都有指定的持续时间。在行的末尾,计数器重置以开始下一行。v\_sync 计数器在垂直轴内应用相同的操作。</p><p>使用这些计数器,VGA 控制器输出水平同步、垂直同步、显示启用和像素坐标信号。每个 VGA 模式的同步脉冲被指定为正极性或负极性。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ0" alt="image.png" title="image.png"></p><p>我们首先创建随机图像并使用 RGB 信号改变它们的颜色,如上图所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ1" alt="image.png" title="image.png"></p><p>要在屏幕上显示文本或字符串,有一个众所周知的 Font Rom Map -上图 - 包括所有 ASCII 字符(每个字符为 8x16 位)。通过使用 Font Rom,我们的代码现在能够在显示器上书写文本或字母,如下图所示 。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ2" alt="image.png" title="image.png"></p><p>为了转换来自柔性传感器的模拟数据,我们使用了ADC-每通道具有 12 位分辨率。由于 4 个手指足以执行大多数手语字母,因此一个 4 通道ADC就足够了。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ3" alt="image.png" title="image.png"></p><p>ADC的通信的逻辑如下图所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ4" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ5" alt="image.png" title="image.png"></p><p>作为总结,项目的架构如下图所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ6" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ7" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ8" alt="image.png" title="image.png"></p><p>作为参考手语,我们使用了ASL,它具有下图中的手势。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ9" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRa" alt="image.png" title="image.png"></p><p>现在执行工程就可以识别到上图中标记的字母。</p><p>工程链接:</p><blockquote><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fumuttoksoy%2F10ISTK---Sign-Language-Translator" target="blank">https://github.com/umuttoksoy/10ISTK---Sign-Language-Translator</a></blockquote><blockquote>原文:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FcvBboi8DlRSWQzCUUpyTsw" target="blank">OpenFPGA</a>  <br>作者:碎碎思</blockquote><p><strong>相关文章推荐</strong></p><ul><li><a href="https://aijishu.com/a/1060000000384570"><strong>从FPGA说起的深度学习(三)</strong></a></li><li><a href="https://aijishu.com/a/1060000000383485"><strong>从FPGA说起的深度学习(二)</strong></a></li><li><a href="https://aijishu.com/a/1060000000383015"><strong>使用 AXI CDMA 制作 FPGA AI 加速器通道</strong></a></li><li><a href="https://aijishu.com/a/1060000000381372"><strong>从FPGA说起的深度学习(一)</strong></a></li></ul><blockquote>更多FPGA干货请关注<a href="https://aijishu.com/blog/fpgadeluoji"><strong>FPGA的逻辑</strong></a>技术专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387048</guid>
            <link>https://aijishu.com/a/1060000000387048</link>
        </item>
        <item>
            <title><![CDATA[聊聊身边的嵌入式:价格不菲的护眼灯,是眼睛保护神还是智商税?]]></title>
            <description><![CDATA[<p>神兽归笼这个词,不知道哪位大师发明的,充分表达了广大家长望子成龙,却又忧心忡忡,寝食难安的心情。让家长们焦虑的,不只是孩子的学习,还有健康。就拿视力来说,一份官方的报告,看了也是让人心中一惊。近视率从小学的35.6%,到初中的71.1%,再到到高中的80.5%,一路攀高,估计到大学生,就更没法看了。</p><p>众多的商家,从中嗅出了机会,护眼台灯就是其中一种。市场上的台灯,也是鱼龙混杂。对于但求最贵,不求最好的主,价格成千乃至上万。若是囊中羞涩,或者说但求最好,不求最贵的买家,在拼XX上,十块八块也能买一个,据称也是专为读书设计,国AA级照度的护眼灯。</p><p>这水挺深!</p><p>对于一种产品,即使你用一大堆指标去测试,区别好像也不大,似乎都挺好。只有我们深入了解了它的工作原理,才能清楚其中奥秘。我们今天拆个某东上卖的挺火的台灯,看一下究竟有什么高科技。</p><ol><li><strong>护眼台灯拆解</strong></li></ol><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRk" alt="image.png" title="image.png"></p><p>这灯外观看着还是挺漂亮的。面板采用了触控设计,打开电源开关后,手指在滑条滑动,可以调整光的亮度。这灯拿在手里,沉甸甸的,满满的科技感。我们接下来拆开看一下。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRm" alt="image.png" title="image.png"></p><p>这一拆开,首先被这一坨铁惊住了!据说某个乐善好施的活雷锋,早年卖医疗设备,为增加科技感,用的就是这一招。不过跟这个还真不一回事儿,这个台灯没有这坨铁,估计就头重脚轻站不住了。电路分为两个大部分,上面大板子是触摸控制板,下面小板子是电源变换和调光模块。</p><p>台灯外配220V转24V的电源,电源变换和调光模块把24V转换成5V供给控制板。反过来,控制板输出的PWM,控制此模块输出电流的大小,来调光亮度。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRn" alt="image.png" title="image.png"></p><p>翻过来看一下,两个带线圈的电感,用来滤除输入电源干扰。电路板的核心是一个LED调光芯片,上面的丝印比较模糊,最后我们会推测一下它的型号。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRo" alt="image.png" title="image.png"></p><p>灯的中间是圆形的白色导光板,然后四周围有91颗侧面发光的LED灯珠。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRp" alt="image.png" title="image.png"></p><p>再来看一下触摸控制板部分,有两颗芯片,一颗负责触摸按键和滑条的检测,一颗负责LED指示灯的控制,以及根据手指在滑条的位置,输出占空比不同的PWM波给电源控制和调光模块。这两颗芯片没有丝印,我们只好推测一下了。如果雷同,纯属巧合。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRq" alt="image.png" title="image.png"></p><p>触摸控制板用塑料柱锁死在面板上了,拆下来就废了。所以我们来透视一下,大概能看出四个按键,以及触摸滑条的样子。根据实测,台灯的亮度并不是连续可调的,而是有7级亮度,所以触摸滑条的分辨率也不用做的很高。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRr" alt="image.png" title="image.png"></p><ol start="2"><li><strong>原理框图</strong></li></ol><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRs" alt="image.png" title="image.png"></p><p>根据电路推测,这个方案应该是用到了台系的芯片,通泰的调光芯片TTP933和触控单片机TTP258。从手册来看,TTP933的性能还是不错的。而TTP258居然是一个4位机,厂家为压缩成本这也是拼了。作为对比,我们从拼XX上买了一款12块钱的护眼灯,还在运输途中,等货到了后再拆开和大家一起研究一下。</p><p>如果我们留意身边的家电,就会发现触摸控制,用的越来越多起来。我们后续也会持续关注这一技术,并和大家一起探讨它的神奇之处。</p><hr><blockquote>作者:Norman<br>来源: <a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FYTjf85HBOVs1dTPGU02t2Q" target="blank">TopSemic嵌入式</a><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bV7v5" alt="aijishu_TopSemic_1.jpg" title="aijishu_TopSemic_1.jpg"></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000379643">MCU如何实现对外部脉冲信号的计数功能?</a></li><li><a href="https://aijishu.com/a/1060000000375025">老前辈教你选 TVS</a></li><li><a href="https://aijishu.com/a/1060000000368824">初始化串口后,低功耗模式下电流高是怎么回事?</a></li><li><a href="https://aijishu.com/a/1060000000368608">一网打尽,国产MCU厂商</a></li><li><a href="https://aijishu.com/a/1060000000354916">到底什么是I/O的驱动能力?</a></li></ul><blockquote>更多芯片嵌入式电子技术分享请关注<a href="https://aijishu.com/blog/topsemicqianrush"><strong>Topsemic嵌入式</strong></a>极术专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387075</guid>
            <link>https://aijishu.com/a/1060000000387075</link>
        </item>
        <item>
            <title><![CDATA[「微侃」特斯拉对智能汽车设计的考虑]]></title>
            <description><![CDATA[<p>聚焦汽车科技,剖析产业趋势和变革浪潮  <br>————————  </p><p>早在2016年,马斯克就在《特斯拉宏图计划第二篇章》提到要发展自动驾驶,但特斯拉与当时最热的自动驾驶技术路线有所不同——Google的Waymo为代表的众多自动驾驶企业,以L4级别和量产自动驾驶出租车Robetaxi为目标。  </p><p>特斯拉走的垂直整合路线:不仅自己开发自动驾驶相关的软件和硬件,还自己造车:开创了将自动驾驶与汽车量产结合的技术路线——简单来说,就是在量产车上安装低级别自动驾驶系统收集数据,凭借数据不断完善自动驾驶算法,最终实现由较低级别的自动驾驶向高级别自动驾驶间融合过渡。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQz" alt=" title=" 微信图片_20230227121317.png""="" title=" title=">  </p><p>目前来看,后者的自动驾驶技术方案是比较成功的。他的路线甚至从车成功复制到机器人。  </p><p>那么特斯拉是怎么考虑智能汽车的设计的呢?  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbtWN" alt=" title=" 微信图片_20230227121320.png""="" title=" title=">  </p><p>Part 1  </p><p>特斯拉的整车设计  </p><p>特斯拉与传统主机厂把设计开发交给供应商的方式不同,而是反过来,不断从供应商手中拿回主导开发权。我们看到,在整个EE架构里面,特斯拉不断在把大量的部件做成In-house Design然后再由非传统的一级供应商来代工的模式进行,不断把系统内化。  </p><p>●芯片层面的全面考虑  </p><p>特斯拉会和芯片企业直接交流设计开发,这样一方面在过去几年缺芯的状态下,可以优先获取支持。另一方面,这样的直接接触,可以把自己的设计思路传递到芯片企业,同时获取最新的设计方案。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQA" alt=" title=" 微信图片_20230227121326.png""="" title=" title=">  </p><p>◎最重要的计算类SOC芯片:座舱层面依靠Intel和AMD计算芯片、特斯拉自研FSD的芯片  </p><p>◎通信芯片:从以太网的Marvell扩展到下一代  </p><p>◎存储芯片:SK海力士和Sumsung  </p><p>◎功率芯片:由SiC的英飞凌和ST供应,低压小功率的主要包括安森美  </p><p>◎MCU:全方面的拥抱TI和ST  </p><p>◎其他芯片:也是和ADI、Microchip等战略芯片供应商合作  </p><p>●电子电气架构的设计  <br>特斯拉在设计电子电气架构时,不仅从Model 3 开始就采用了集中式的架构,还很早就导入了Zonal控制器的概念,这样的架构可以尽可能的简化线束,提高整车安装效率。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQB" alt=" title=" 微信图片_20230227121334.png""="" title=" title=">  </p><p>特斯拉设计了三个区域控制器,分布在车身的左、右和前部中间,这三个控制器大量合并了原有分布式系统的功能,比如:车身控制、热管理、驻车还有座椅控制等。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQC" alt=" title=" 微信图片_20230227121342.png""="" title=" title=">  </p><p>如果按其他车企的设计,至少会分为七八个模块(门模块、集成式车身控制器、座椅控制器、热管理控制器HVAC和前端冷却控制器Theraml Unit和泊车控制器、灯光控制)。  </p><p>但特斯拉通过这三个区域控制器既能实现基本功能,又可以做一些顶层的应用,实现系统的整体控制。整个控制逻辑复杂的部分都在上层,底层的可以实现冗余和执行功能。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQD" alt=" title=" 微信图片_20230227121349.png""="" title=" title=">  </p><p>比如热管理的控制中,复杂的热泵模式功能是在顶层的软件系统里面来定义的,再由区域控制器负责执行。这个创新性的设计,就让特斯拉把握了整体软件和系统方面的设计,供应商只负责做结构设计集成,特斯拉在热管理功能上实现了自主开发控制。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbuK9" alt=" title=" 微信图片_20230227121353.png""="" title=" title=">  </p><p>Part 2  </p><p>特斯拉的自动驾驶设计  </p><p>●自动驾驶软件部分  <br>2019 年前后,自动驾驶技术堆栈出现了颠覆性变化,特斯拉引领了这次变革。这次变革是从规则驱动,转向为数据驱动。这几乎改变了整个技术堆栈,甚至是工程师的思考方式。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQE" alt=" title=" 微信图片_20230227121400.png""="" title=" title=">  </p><p>所谓规则驱动,简单来说,以前的自动驾驶,是依靠提前设计好一定的规则;数据驱动,则是围绕AI的算法模型,通过感知AI、规控AI,以及数据改进自动驾驶的效果,跟现在很火热的ChatGPT类似。  </p><p>●自动驾驶硬件部分  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQF" alt=" title=" 微信图片_20230227121407.png""="" title=" title=">  </p><p>特斯拉的驾驶辅助硬件经过了HW1.0到3.0的迭代:  </p><p>◎ 1.0的版本硬件选型为成熟商品。特斯拉做了多传感器融合+应用层软件开发。  <br>◎ 2.0的版本,采用了英伟达的芯片,提升传感器数量提升,特斯拉在原有的技术基础上,增加了图像识别算法的开发。  <br>◎ 3.0 是特斯拉的驾驶辅助硬件的重大革新,首次采用自研的高度集成自动驾驶SoC+MCU芯片。此时的特斯拉已经具备:全套芯片设计能力。  <br>◎ 正在开发的基于自研的自动驾驶芯片的第二代控制器,也就是4.0版本,马上要发布,我们会持续地跟踪。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQG" alt=" title=" 微信图片_20230227121415.png""="" title=" title=">  </p><p>我们看到特斯拉在Model S、Model X、Model 3到Model Y上,一步步深化了自己的设计范围,而全球车企包括大量的中国汽车企业也开始了这个过程。  </p><p>总结  <br>虽说特斯拉的自动驾驶技术路线很成功,但并不是没有问题。首先就表现在有各种召回。这是因为自主设计的开发难度的确很大,随着车主增多,会遇到很多激进的工况。但换个角度来看,特斯拉就是通过量产车上收集到的数据不断完善自己的产品,最终要实现不仅是智能汽车,还有马斯克本人的Master plan。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 05:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387037</guid>
            <link>https://aijishu.com/a/1060000000387037</link>
        </item>
        <item>
            <title><![CDATA[「微侃」插电混动的技术路线分析(下篇)]]></title>
            <description><![CDATA[<p>聚焦汽车科技,剖析产业趋势和变革浪潮  <br>————————  </p><p>前段时间在梳理完中国汽车自主品牌产业格局以后,我们觉得2023年汽车市场最重要的竞争会来自插电混动领域。在上一期《插电混动的技术路线分析》中,我们盘点完比亚迪、长城和吉利的路线,今天我们接着来讲长安、奇瑞、上汽这三家企业的混动技术,为国内的插电混动技术做一个完整的画像(文末有汇总图)。  </p><p>● 上汽  <br>上汽混动开发主要有两个主体,一个是专门开发电动汽车的捷能,一个是传统动力总成部门,前两代的系统是由捷能主导开发的。  </p><p>上汽是国内很早开始自研混动系统的主机厂,2013年上汽第一代EDU是发动机+P1发电机+P2驱动电机+2档AMT结构 ,非常典型的串并联结构。这是典型的双电机方案,主要用于发电和调整发动机转速的ISG电机和另一个则是主要用于驱动的TM电机。 第一代上汽EDU混动系统加入了2挡变速机构(2AMT),设计的初衷是让「发动机」和「电机」都能维持在相对高效率的运转区间。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP6" alt=" title=" 微信图片_20230227120635.png""="" title=" title=">  </p><p>第一代系统的加入了2挡的变速机构,可以更好地实现电机和发动机的工作点的调节。  </p><p>这套系统的优点是:  </p><p>◎系统效率高,发动机可完全解耦工作在高效区间,油耗比较低  </p><p>◎控制策略灵活,串并联结构,可串联可并联,甚至可以发动机双电机并联,能2档调速  </p><p>◎在电池SOC高的时候,发动机双电机同时出力  </p><p>当然这套系统也是有缺点的,比如:  </p><p>◎平顺性和动力中断:2档AMT的换档速度慢,换档动力短暂中断以及换档顿挫这些问题始终是影响了性能。  </p><p>◎故障率和成本:由于整套系统设计初期参数方面需要优化,而切降低成本也比较困难。  </p><p>上汽在第一代的技术上最终选择了推翻重来,研发了第二代「上汽EDU混动系统」。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP7" alt=" title=" 微信图片_20230227120647.png""="" title=" title=">  </p><p>第二代上汽EDU混动系统,可以认为是单电机P2.5并联结构,发动机+6AMT+P2电机+4AMT并联,由发动机、驱动电机、齿轮轴系、离合器以及整车控制器等控制模块组成,属于三平行轴式的单电机电驱 方案。这套系统有18组齿轮,4个同步器,3组同步器与离合器主要用于调节整套系统的换挡逻辑,将发动机与电机相结合。  </p><p>◎油耗层面某些地方还是不错的,发动机和变速箱分别能在各自不同的最佳档位上并联输出  </p><p>◎动力特性比较好,单电机在电控和电机方面成本下降  </p><p>缺点是:  </p><p>◎这套基础结构是P2.5单电机,发动机无法解耦,因此在馈电情况下油耗也降不下去。  </p><p>由于整个系统比较复杂,通过多种机械耦合以后整体的效率并没有设想的更高  </p><p>在上汽乘用车的传统动力总成部门,也在开发P1P3的新混动架构,等正式发布以后我们可以再展开来说。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP8" alt=" title=" 微信图片_20230227120659.png""="" title=" title=">  </p><p>● 长安 iDD  <br>长安汽车的混动车型是从2008年开始筹划建立,2017年和2018年分别推出了搭载P2-7DCT的逸动PHEV和搭载P134串并联电四驱的CS75PHEV量产车型,2021年最新推出的蓝鲸iDD混动系统,采用P2-6DCT并联混动变速器。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP9" alt=" title=" 微信图片_20230227120705.png""="" title=" title=">  </p><p>长安iDD是一套P2架构的单电机混动类型,1.5T四缸发动机最大功率122千瓦、最大扭矩255牛米,与之搭档的电机最大功率85千瓦、最大扭矩330牛米。这两个动力源通过一台六挡三离合变速器传输,是典型的P2混动系统。2021年,长安UNI-K iDD改进了这套混合动力系统,最大功率可达122kW,最大峰值扭矩为255 N·m。通过安装了一块容量为30.74kWh的电池。  </p><p>长安这套系统目前来看并不是主流的方向,单电机并联式方案在欧洲采用比较多,目前最大的缺点是馈电油耗高。由于P2的结构特性,不能实现一边发电一边驱动,这就会导致车辆的主要动力输出是依靠发动机来实现的,那么在馈电状态下,油耗就会非常高。  </p><p>● 奇瑞  </p><p>奇瑞2021年发布了3挡串并联混动变速器鲲鹏混动系统。奇瑞鲲鹏混动系统是一套混联式混合动力,驱动核心是一台115kW的1.5T发动机加上两台(P2 55kW、P2.5 70kW)永磁同步电机。 动力系统的核心在于三档双离合的混动变速箱上,两台电机中的P2.5电机与双离合变速箱中的奇数轴相连,在驱动状态下有两个挡位可以切换。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQa" alt=" title=" 微信图片_20230227120713.png""="" title=" title=">  </p><p>P2电机则直接挂在发动机输出轴的离合器C1的另一端,可通过变速箱输出动力,也可在发动机带动下发电。发动机则是处在三档变速箱的最顶端,可直驱,也可增程。  </p><p>这套系统最大的特点是9种工作模式和11个组合挡位,包括单电机纯电模式、双电机纯电模式、串联增程模式、发动机直驱模式、并联驱动模式、驻车充电模式、行车充电模式、单电机制动能量回收,以及双电机制动回收模式。  </p><p>优点:理论上这套系统可以做得很牛,理论上可以覆盖更多的使用场景,而且将电机和发动机的效率最大化;  </p><p>缺点:缺点也很明显,整个动力系统的结构会非常复杂,电机、电池和发动机等不同配置调整以后,整个系统需要一遍遍调教,需要大量的车型推出来不断优化,这使得整车重量和调校会有难度。而且这套系统的BOM成本和制造成本来看,很短在初期降下来。  </p><p>小结:混动系统并不容易做,插电混动也是在新能源汽车鼓励政策下不断支持以后,才有今天的成绩。我们希望中国的混动系统越来越好,每家都有机会完善自己的方案。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQb" alt=" title=" 微信图片_20230227120720.png""="" title=" title="></p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 04:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387009</guid>
            <link>https://aijishu.com/a/1060000000387009</link>
        </item>
        <item>
            <title><![CDATA[南京大学&港中文提出首个支持超高分辨率(10000x10000)图像风格迁移方案]]></title>
            <description><![CDATA[<p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP4" alt="image.png" title="image.png"></p><p>paper:<a href="https://aijishu.com/link?target=https%3A%2F%2Farxiv.org%2Fabs%2F2103.11784" target="blank">https://arxiv.org/abs/2103.11784</a></p><p>code:<a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fczczup%2FURST" target="blank">https://github.com/czczup/URST</a></p><blockquote>本文是南京大学&amp;香港大学的路通&amp;罗平等人在风格迁移领域的一次突破性探索,提出了<strong>首个支持超高分辨率(比如10000x10000大小)图像风格迁移的方案URST</strong>。针对现有风格迁移模型在图像块处理时存在的块间不一致问题,<strong>提出了一种新颖的“Thumbnail Instance Normalization”</strong>;与此同时,针对高分辨率图像风格迁移存在的“small stroke size”问题,<strong>提出了一种新颖的辅助损失</strong>。所提方案可以轻易与现有风格迁移网络组合并取得性能提升。</blockquote><h2>Abstract</h2><p>本文提出一种非常简单的极限分辨率的风格迁移框架URST,首个可以处理任意高分辨率(比如)图像的进行风格迁移的方案。当处理超高分辨率图像时,受限于较大的内存占用与<code>small stroke size</code>问题,现有风格迁移方法往往难以真正应用。</p><p>URST通过以下两种策略避免了超高分辨率图像导致的内存问题:(1) 将图像划分成小的图像块进行处理;(2)提出一种新颖的<code>Thumbnail Instance Normalization (TIN)</code>进行块级风格迁移。具体来说,TIN可以提取缩略图的规范化统计信息并应用到小图像块上,确保了不同块之间的风格一致性。</p><p>总而言之,相比已有方案,本文所提URST具有这样几个优点:</p><ul><li>通过将图像拆分为小块并采用TIN成功的对任意高分辨图像进行风格迁移;</li><li>受益于所提感知损失,所提方法在超高分辨率图像上取得了超过其他SOTA方案的效果;</li><li>所提URST可以轻易的嵌入到现有风格迁移方案中,无需进行训练即可提升其性能。</li></ul><h2>Introduction</h2><p>超高分辨率图像风格迁移存在两个关键性挑战:</p><ul><li>超高分辨图像需要非常大的内存占用,甚至超出现有GPU的最大显存;</li><li>过小的笔画描边会导致不自然的纹理。</li></ul><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQd" alt="image.png" title="image.png"></p><p>针对第一个问题,现有方法往往采用轻量型网络、模型剪枝、知识蒸馏等方法降低显存占用。然而这些方法仅仅能起到缓和的作用,以上图为例,随着分辨率的提升,显存的占用呈指数增长,很快超出了现有GPU的峰值。这就驱动我们<strong>设计一种更有效的策略用于超高分辨率图像的风格迁移</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQe" alt="image.png" title="image.png"></p><p>超高分辨率图像的笔画边缘过小会呈现出不自然的现象,可参考上图(b)。增大笔画边缘是一种广泛采用的解决上述问题的方法;此外扩大风格迁移网络的感受野是另一种解决方案。然而这些方法并不适用于超高分辨率风格迁移。</p><p>为解决上述问题,本文提出了URST用于对任意高分辨率图像在有限内存约束下进行风格迁移,效果可参考上图(d)。</p><h2>Method</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQh" alt="image.png" title="image.png"></p><p>上图给出了本文所提URST的整体框架示意图。所提方案包含三个关键设计思想:</p><ul><li><strong>一种灵活的块级风格迁移</strong>,它可以将高计算量的风格迁移任务拆分为多个地计算量的块级风格迁移;</li><li>提出<strong>一种新颖的缩略图实例规范化TIN</strong>,它可以提取缩略图规范化统计信息并将其应用到小图像块上以确保不同块间的风格一致性;</li><li>精心设计了<strong>一种笔画感知损失</strong>以聚焦于笔画边缘的感知差异,促使风格迁移网络生成大的笔画边缘。</li></ul><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQi" alt="image.png" title="image.png"></p><p>由于该方案中的风格迁移网络可以是任意方法(比如AdaIN、LinearWCT),为方便起见,我们定义所选择方法原始损失为,在训练过程中,我们首先采用原始损失基于缩略图优化风格迁移网络。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQj" alt="image.png" title="image.png"></p><h3>Patch-wise Style Transfer</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQk" alt="image.png" title="image.png"></p><p>相比已有方法采用完整图像作为输入,所提框架可以灵活的处理任意高分辨率图像,同时也可以轻易嵌入到现有风格迁移方法(比如AdaIN、WCT、LinearWCT)中。正如前面所提到的,由于不同块的统计特性独立性,不同图像块的风格化可能存在不一致性问题。</p><h3>Thumbnail Instance Normalization</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQl" alt="image.png" title="image.png"></p><p>然而,我们发现IN并不适用于块级风格迁移,会导致块间风格不一致问题,可参考下图。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQm" alt="image.png" title="image.png"></p><p>在上图(a)中,我们对输入作为整体进行规范化;在上图(b)中我们将输入拆分为四块分贝进行规范化。这就导致最终的结果存在风格不一致问题。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQn" alt="image.png" title="image.png"></p><p>通过这种方式,TIN可以确保不同块间的风格一致性间,上图(c)。</p><h3>Stroke Perceptual Loss</h3><p>所提方法驱动我们提出一种辅助损失增大笔画边缘,该损失定义如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQo" alt="image.png" title="image.png"></p><h2>Experiments</h2><p>为验证所提方法的有效性,我们将其与AdaIN、WCT等方法进行了对比,见下图。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQp" alt="image.png" title="image.png"><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQp" alt="image.png" title="image.png"></p><p>从上图可以看到:(1) IN导致了明显的块间风格不一致问题;(2) <strong>所提方法取得了与全图相似的效果且显存占用更低</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQO" alt="image.png" title="image.png"></p><p>与此同时,我们还对比了所提损失函数的影响分析,见上图。可以看到:<strong>基于所提损失引导,这些模型可以生成更粗的线条与更稀疏的纹理,这有助于改善超高分辨率风格迁移</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQP" alt="image.png" title="image.png"><br>此外,我们还提供了不同风格迁移方案在不同输入分辨率输入时的显存占用对比。可以看到:大多方法甚至不能处理的高分辨率图像;而<strong>本文所提方法甚至可以处理分辨率图像且显存占用不超过5GB</strong>。理论上,本文所提方法可以处理任意高分辨率图像。</p><p>最后,我们提供一个超高分辨率图像风格迁移效果图作为结尾。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQQ" alt="image.png" title="image.png"></p><blockquote>来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FJqRUmFZLGtXDt814wH7ppA" target="blank">AIWalker</a><br>作者:   Happy</blockquote><p>推荐阅读</p><ul><li><a href="https://aijishu.com/a/1060000000386282"><strong>深入分析MobileAI图像超分最佳方案:ABPN</strong></a></li><li><a href="https://aijishu.com/a/1060000000385959"><strong>HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法</strong></a></li><li><a href="https://aijishu.com/a/1060000000385643"><strong>一层卷积能做啥?BOE告诉你:一层卷积可以做超分!</strong></a></li><li><a href="https://aijishu.com/a/1060000000385377"><strong>一层卷积能做啥?BOE告诉你:一层卷积可以做超分!</strong></a></li><li><a href="https://aijishu.com/a/1060000000380384"><strong>YOLOv6 v3.0 | 重磅升级!性能超越V8!</strong></a></li></ul><blockquote>本文章著作权归作者所有,任何形式的转载都请注明出处。更多动态滤波,图像质量,超分辨相关请关注我的专栏<a href="https://aijishu.com/blog/aiwalker">AIWalker</a>。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 04:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386996</guid>
            <link>https://aijishu.com/a/1060000000386996</link>
        </item>
        <item>
            <title><![CDATA[【TVM 学习资料】TensorIR 快速入门]]></title>
            <description><![CDATA[<p>本篇文章译自英文文档  [Blitz Course to TensorIR<br>](<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2Ftutorial%2Ftensor_ir_blitz_course.html" target="blank">https://tvm.apache.org/docs/t...</a>) 作者是 Siyuan Feng。更多 TVM 中文文档可访问→<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.hyper.ai%2F" target="blank">TVM 中文站</a> </p><p>TensorIR 是深度学习领域的特定语言,主要有两个作用:</p><ul><li>在各种硬件后端转换和优化程序。</li><li>自动 <em>tensorized</em> 程序优化的抽象。</li></ul><pre><code class="bash">import tvm
from tvm.ir.module import IRModule
from tvm.script import tir as T
import numpy as np</code></pre><h1>IRModule</h1><p>IRModule 是 TVM 的核心数据结构,它包含深度学习程序,并且是 IR 转换和模型构建的基础。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/eab85e2bd22d4c2199a5245e93ab04a5.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>上图展示的是 IRModule 的生命周期,它可由 TVMScript 创建。转换 IRModule 的两种主要方法是 TensorIR 的 schedule 原语转换和 pass 转换。此外,也可直接对 IRModule 进行一系列转换。注意,可以在任何阶段将 IRModule 打印到 TVMScript。完成所有转换和优化后,可将 IRModule 构建为可运行模块,从而部署在目标设备上。</p><p>基于 TensorIR 和 IRModule 的设计,可创建一种新的编程方法:</p><ol><li>基于 Python-AST 语法,用 TVMScript 编写程序。</li><li>使用 Python API 转换和优化程序。</li><li>使用命令式转换 API 交互检查和提高性能。</li></ol><h1>创建 IRModule</h1><p>IRModule 是 TVM IR 的一种可往返语法,可通过编写 TVMScript 来创建。</p><p>与通过张量表达式创建计算表达式(使用张量表达式操作算子)不同,TensorIR 允许用户通过 TVMScript(一种嵌在 Python AST 中的语言)进行编程。新方法可以编写复杂的程序并进一步调度和优化。</p><p>下面是向量加法的示例:</p><pre><code class="bash">@tvm.script.ir_module
class MyModule:
    @T.prim_func
    def main(a: T.handle, b: T.handle):
        # 我们通过 T.handle 进行数据交换,类似于内存指针
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # 通过 handle 创建 Buffer
        A = T.match_buffer(a, (8,), dtype="float32")
        B = T.match_buffer(b, (8,), dtype="float32")
        for i in range(8):
            # block 是针对计算的抽象
            with T.block("B"):
                # 定义一个空间(可并行)block 迭代器,并且将它的值绑定成 i
                vi = T.axis.spatial(8, i)
                B[vi] = A[vi] + 1.0
ir_module = MyModule
print(type(ir_module))
print(ir_module.script())</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.ir.module.IRModule'&gt;
# from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i in T.serial(8):
            with T.block("B"):
                vi = T.axis.spatial(8, i)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><p>此外,我们还可以使用张量表达式 DSL 编写简单的运算符,并将它们转换为 IRModule。</p><pre><code class="bash">from tvm import te
A = te.placeholder((8,), dtype="float32", name="A")
B = te.compute((8,), lambda *i: A(*i) + 1.0, name="B")
func = te.create_prim_func([A, B])
ir_module_from_te = IRModule({"main": func})
print(ir_module_from_te.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i0 in T.serial(8):
            with T.block("B"):
                i0_1 = T.axis.spatial(8, i0)
                T.reads(A[i0_1])
                T.writes(B[i0_1])
                B[i0_1] = A[i0_1] + T.float32(1)</code></pre><h1>构建并运行 IRModule</h1><p>可将 IRModule 构建为特定 target 后端的可运行模块。</p><pre><code class="bash">mod = tvm.build(ir_module, target="llvm")  # CPU 后端的模块
print(type(mod))</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.driver.build_module.OperatorModule'&gt;</code></pre><p>准备输入数组和输出数组,然后运行模块:</p><pre><code class="bash">a = tvm.nd.array(np.arange(8).astype("float32"))
b = tvm.nd.array(np.zeros((8,)).astype("float32"))
mod(a, b)
print(a)
print(b)</code></pre><p>输出结果:</p><pre><code class="bash">[0. 1. 2. 3. 4. 5. 6. 7.]
[1. 2. 3. 4. 5. 6. 7. 8.]</code></pre><h1>转换 IRModule</h1><p>IRModule 是程序优化的核心数据结构,可通过 Schedule 进行转换。schedule 包含多个 primitive 方法来交互地转换程序。每个 primitive 都以特定方式对程序进行转换,从而优化性能。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f1d1c2925359488883e2cb5e0a43802f.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>上图是优化张量程序的典型工作流程。首先,用 TVMScript 或张量表达式创建一个初始 IRModule,然后在这个初始 IRModule 上创建 schedule。接下来,使用一系列调度原语来提高性能。最后,我们可以将其降低并构建成一个可运行模块。</p><p>上面只演示了一个简单的转换。首先,在输入 ir_module 上创建 schedule:</p><pre><code class="bash">sch = tvm.tir.Schedule(ir_module)
print(type(sch))</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.tir.schedule.schedule.Schedule'&gt;</code></pre><p>将嵌套循环展开成 3 个循环,并打印结果:</p><pre><code class="bash"># 通过名字获取 block
block_b = sch.get_block("B")
# 获取包围 block 的循环
(i,) = sch.get_loops(block_b)
# 展开嵌套循环
i_0, i_1, i_2 = sch.split(i, factors=[2, 2, 2])
print(sch.mod.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0, i_1, i_2 in T.grid(2, 2, 2):
            with T.block("B"):
                vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><p>还可对循环重新排序。例如,将循环 i_2 移到 i_1 之外:</p><pre><code class="bash">sch.reorder(i_0, i_2, i_1)
print(sch.mod.script())</code></pre><p>输出结果</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0, i_2, i_1 in T.grid(2, 2, 2):
            with T.block("B"):
                vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><h1>转换为 GPU 程序</h1><p>要在 GPU 上部署模型必须进行线程绑定。幸运的是,也可以用原语来增量转换。</p><pre><code class="bash">sch.bind(i_0, "blockIdx.x")
sch.bind(i_2, "threadIdx.x")
print(sch.mod.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0 in T.thread_binding(2, thread="blockIdx.x"):
            for i_2 in T.thread_binding(2, thread="threadIdx.x"):
                for i_1 in T.serial(2):
                    with T.block("B"):
                        vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                        T.reads(A[vi])
                        T.writes(B[vi])
                        B[vi] = A[vi] + T.float32(1)</code></pre><p>绑定线程后,用 cuda 后端来构建 IRModule:</p><pre><code class="bash">ctx = tvm.cuda(0)
cuda_mod = tvm.build(sch.mod, target="cuda")
cuda_a = tvm.nd.array(np.arange(8).astype("float32"), ctx)
cuda_b = tvm.nd.array(np.zeros((8,)).astype("float32"), ctx)
cuda_mod(cuda_a, cuda_b)
print(cuda_a)
print(cuda_b)</code></pre><p>输出结果:</p><pre><code class="bash">[0. 1. 2. 3. 4. 5. 6. 7.]
[1. 2. 3. 4. 5. 6. 7. 8.]</code></pre><p><a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2F_downloads%2Feac4389b114db015e95cb3cdf8b86b83%2Fauto_scheduler_matmul_x86.py" target="blank">下载 Python 源代码</a><br><a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2F_downloads%2F246d4b8509474fd9046e69f6cc9b7f87%2Fauto_scheduler_matmul_x86.ipynb" target="blank">下载 Jupyter Notebook</a></p><p>以上就是该文档的全部内容,查看更多 TVM 中文文档,请访问→<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.hyper.ai%2F" target="blank">TVM 中文站</a></p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 03:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386987</guid>
            <link>https://aijishu.com/a/1060000000386987</link>
        </item>
        <item>
            <title><![CDATA[ECCV'22 Oral|VQFR|基于矢量量化字典与双解码器的人脸盲修复网络]]></title>
            <description><![CDATA[<h2>ECCV'22 Oral|VQFR|基于矢量量化字典与双解码器的人脸盲修复网络</h2><p>ECCV'22 Oral - VQFR: Blind Face Restoration with Vector-Quantized Dictionary and Parallel Decoder</p><p>解读:Owen718 论文链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Farxiv.org%2Fpdf%2F2205.06803.pdf" target="blank">https://arxiv.org/pdf/2205.06803.pdf</a></p><h2>Background&amp;Motivation</h2><p>尽管生成式面部先验和结构化面部先验最近已经证明了可以生成高质量的人脸盲修复结果,稳定、可靠生成更细粒度的脸部细节仍然是一个具有挑战性的问题。这篇文章受最近基于字典的方法和基于矢量量化的方法启发,提出了一种 基于矢量量化(VQ-based)的人脸盲修复方法VQFR。VQFR从高质量的图像中抽取特征,构建low-level特征库从而恢复逼真的面部细节。</p><p>这篇工作重点关注如下两个问题:</p><ul><li>1.<strong>codebook中每个code对应的原图patch大小会极大影响人脸网络修复结果的质量与保真度权衡,而实际落地应用中,质量与保真度需要做到良好的平衡以获得最佳视觉效果。</strong></li><li>2.<strong>原图退化特征需要与来自codebook的高质量特征做融合,融合过程中,如何做到高质量特征不被退化特征所干扰而导致性能降低?</strong></li></ul><h2>详细介绍引入</h2><p>人脸恢复的目标是恢复低质量(LQ)面孔并纠正未知退化,例如噪声、模糊、下采样引起的退化等。在实际情况下,此任务变得更具挑战性,因为存在更复杂的退化、多样的面部姿势和表情。以前的作品通常利用特定于人脸的先验,包括几何先验、生成先验和参考先验。具体来说,几何先验通常包括面部标志、面部解析图和面部组件热图。它们可以为恢复准确的面部形状提供全局指导,但不能帮助生成逼真的细节。此外,几何先验是从退化图像中估计出来的,因此对于具有严重退化的输入变得不准确。这些特性促使研究人员寻找更好的先验。最近的人脸修复工作开始研究生成先验(GAN-Prior),并取了优异的性能。这些方法通常利用预先训练的人脸生成对抗网络(例如StyleGAN)的强大生成能力来生成逼真的纹理。这些方法通常将退化的图像投影回GAN潜在空间,然后使用预先训练的生成器解码高质量(HQ)人脸结果。尽管基于GAN先验的方法最初从整体上讲具有良好的恢复质量,但仍然无法生成细粒度的面部细节,特别是精细的头发和精致的面部组件。这是因为训练有素的GAN模型,其潜在空间仍然是不够完善的。基于参考的方法(Reference-based methods)—探索了高质量的指导面孔或面部组件字典来解决面部恢复问题。DFDNet是该类别中的代表方法,它不需要访问相同身份的面孔,就可以产生高质量的结果。它明确建立高质量的“纹理库”,用于几个面部组件,然后用字典中最近的高质量面部组件替换退化的面部组件。这种离散的替换操作可以直接弥合低质量面部部件与高质量部件之间的差距,因此具有提供良好面部细节的潜力。然而,DFDNet中的面部组件字典仍然有两个缺点。<strong>1)它使用预先训练的VGGFace网络进行离线生成,该网络是为识别任务优化的,明显并不适合恢复任务。2)它只关注几个面部组件(即眼睛、鼻子和嘴巴),但不包括其他重要区域,例如

...

@github-actions
Copy link
Contributor

http://localhost:1200/aijishu/channel/ai - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[AI 应用 - 极术社区]]></title>
        <link>https://aijishu.com//api/channel/1080000000000211?page=1</link>
        <atom:link href="http://localhost:1200/aijishu/channel/ai" rel="self" type="application/rss+xml" />
        <description><![CDATA[AI 应用 - 极术社区 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 15:27:00 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[用人工智能设计芯片及对IC设计就业市场的影响]]></title>
            <description><![CDATA[<p>集成电路 (IC) 设计是一项复杂的工作,不断突破密度和性能的界限。现在,人工智能 (AI)在 IC 设计中的作用越来越大。</p><p>虽然 AI 最近因其在 ChatGPT 等自然语言处理器方面的惊人能力而受到更多关注,但该工具也被用于 IC 设计的各个阶段,包括设计优化、布局、仿真和验证。人工智能算法还可以帮助更有效地探索设计空间,比传统方法更快地发现最佳设计配置。</p><h5>随着设计变得比以往任何时候都更加复杂,人工智能可以成为 IC 设计师的强大资产。</h5><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRe" alt="image.png" title="image.png"></p><p>本文重点介绍了AI如何被用作IC设计的工具,以及这项技术如何影响IC设计工程师的专业价值。</p><p><strong>利用 AI 来实现严格的设计约束</strong></p><h3>由于数十亿个晶体管被限制在一个很小的芯片区域,IC 设计师的任务是在严格约束的情况下优化设计。&nbsp;</h3><p>首先,芯片面积必须最小,以适应当今设备的小尺寸,并降低制造成本。布局的功耗也是值得关注的;功耗同样会影响部署成本以及芯片对环境的影响。某些密集区域和配置容易过热,需要冷却机制或更巧妙的布局。考虑到这些因素和许多其他因素,IC设计人员大约需要八到九个月的时间来生成一个满足每个严格要求的芯片布局。</p><p>为了加快和优化 IC 设计流程,许多公司(包括科技行业的一些最大公司)现在都在投资 AI 工具来完成一些繁重的工作。</p><p><strong>谷歌人工智能在几个小时内设计出芯片</strong></p><p>据谷歌称,谷歌的深度学习强化学习 (RL) 方法可以在比人类工程师少得多的时间内生成有效的布局,而且结果在质量上也不相上下。</p><p>谷歌表示,谷歌的深度学习强化学习(RL)方法可以在比人类少得多的时间内产生有效的布局,而且结果在质量上也不相上下。2022年3月,谷歌研究院推出了PRIME,这是一种深度学习方法,利用现有的数据,如功率和延迟来创建加速器设计,比用传统方法设计的芯片更快、更小。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRf" alt="image.png" title="image.png"></p><p>谷歌研究人员使用 10,000 个芯片平面图来训练他们的模型。人工智能生成的芯片设计时间不到六个小时。谷歌表示,这种方法已经被利用来实现谷歌的张量处理单元(TPU),这是谷歌基于云的机器学习应用的一部分。</p><p><strong>EDA公司在AI设计系统上加倍投入</strong></p><p>不仅仅是谷歌转向机器学习模型。像Synopsys和Cadence这样的EDA公司也在其最新工具中使用到AI技术。比如最近,Synopsys凭借其 Synopsys DSO.ai 自主芯片设计系统注册了 100 个商业流片。该系统最近的客户包括 意法半导体(ST)和 SK Hynix。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRg" alt="image.png" title="image.png"></p><p>ST 和 Synopsys 于 2022 年 2 月初首次在微软的云端使用 DSO.ai 来设计工作芯片。使用 Synopsys 的 DSO.ai 设计系统,结合 Microsoft Azure 上的 Synopsys Fusion Compiler 和 IC Compiler,该工具将功耗、性能和面积 (PPA) 指标提高了 3 倍以上,总功耗降低了 25%,并且显著缩小了芯片尺寸。</p><p>除了芯片设计,人工智能还在芯片测试和验证中找到了应用——芯片制造商在这两个领域花费了大量时间。为了解决这一设计阶段的问题,西门子发布了Questa Verification IQ,这是一个帮助IC设计工程师加快验证过程的软件平台。</p><p><strong>英伟达用GPU设计GPU</strong></p><p>NVIDIA(英伟达)为芯片设计设计了另一种深度学习方法。该公司制作了一个名为PrefixRL的 RL 模型,证明 AI 可以从头开始学习电路设计,并使用最新的 EDA 工具制造更小、更快的电路。NVIDIA 的架构由 13,000 个使用 AI 技术设计的电路组成。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRh" alt="image.png" title="image.png"></p><p>针对自动化单元迁移,该公司开发了NVCell,可以无错迁移92%的单元库。人类工程师可以对剩下的 8% 没有自动迁移的单元进行处理。NVIDIA 首席科学家 Bill Dally 表示:</p><p><em>“所以这就像一个 Atari 视频游戏,但它是一个用于修复标准单元中的设计规则错误的视频游戏。通过强化学习来研究和修复这些设计规则错误,我们能够基本完成我们标准的设计单元。”</em></p><p><strong>人工智能对 IC 设计就业市场的影响</strong></p><p>虽然人工智能可以自动执行传统上由IC设计人员执行的某些任务,例如布局设计和优化,但它也减少了设计过程中对手动方面的需求。虽然这提高了整体效率,但也可能导致IC设计的某些领域的最终工作被取代。</p><p>另一方面,人工智能还可以帮助 IC 设计人员更高效、更有效地开展工作。例如,AI 可以分析大量数据并提供见解,建议工程师以前可能没有考虑过的设计替代方案。这种趋势可以提高 IC 设计人员在行业中的价值,使他们能够专注于更复杂和更具创造性的设计方面,并最终生产出更好的产品。</p><p>不过人工智能不太可能完全取代对熟练IC设计师的需求。随着人工智能在行业中越来越普遍,对这类工程师的需求甚至可能会增加,因为在设计过程中,将需要能够准确验证和利用人工智能工具和算法的个人。</p><hr><blockquote>作者:  Darshil Patel <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FN_pgzMV26mvgCMAxWMgieQ" target="blank">EETOP</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000386323">行业前瞻,神奇的忆阻器</a></li><li><a href="https://aijishu.com/a/1060000000386135">芯片验证调研报告:首次流片成功率越来越低、Verilog 使用逐渐减少、UVM地位无法动摇</a></li><li><a href="https://aijishu.com/a/1060000000385729">PCIe 6.0:在有损HVM通道中使用PAM4实现64GT/s的挑战</a></li><li><a href="https://aijishu.com/a/1060000000385482">Wi-R 一种全新的通信方式,让你的身体充当媒介!芯片已推出!</a></li><li><a href="https://aijishu.com/a/1060000000383891">科普:DDR</a></li></ul><blockquote>更多IC设计技术干货请关注IC设计技术专栏。<br>迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387068</guid>
            <link>https://aijishu.com/a/1060000000387068</link>
        </item>
        <item>
            <title><![CDATA[南京大学&港中文提出首个支持超高分辨率(10000x10000)图像风格迁移方案]]></title>
            <description><![CDATA[<p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP4" alt="image.png" title="image.png"></p><p>paper:<a href="https://aijishu.com/link?target=https%3A%2F%2Farxiv.org%2Fabs%2F2103.11784" target="blank">https://arxiv.org/abs/2103.11784</a></p><p>code:<a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fczczup%2FURST" target="blank">https://github.com/czczup/URST</a></p><blockquote>本文是南京大学&amp;香港大学的路通&amp;罗平等人在风格迁移领域的一次突破性探索,提出了<strong>首个支持超高分辨率(比如10000x10000大小)图像风格迁移的方案URST</strong>。针对现有风格迁移模型在图像块处理时存在的块间不一致问题,<strong>提出了一种新颖的“Thumbnail Instance Normalization”</strong>;与此同时,针对高分辨率图像风格迁移存在的“small stroke size”问题,<strong>提出了一种新颖的辅助损失</strong>。所提方案可以轻易与现有风格迁移网络组合并取得性能提升。</blockquote><h2>Abstract</h2><p>本文提出一种非常简单的极限分辨率的风格迁移框架URST,首个可以处理任意高分辨率(比如)图像的进行风格迁移的方案。当处理超高分辨率图像时,受限于较大的内存占用与<code>small stroke size</code>问题,现有风格迁移方法往往难以真正应用。</p><p>URST通过以下两种策略避免了超高分辨率图像导致的内存问题:(1) 将图像划分成小的图像块进行处理;(2)提出一种新颖的<code>Thumbnail Instance Normalization (TIN)</code>进行块级风格迁移。具体来说,TIN可以提取缩略图的规范化统计信息并应用到小图像块上,确保了不同块之间的风格一致性。</p><p>总而言之,相比已有方案,本文所提URST具有这样几个优点:</p><ul><li>通过将图像拆分为小块并采用TIN成功的对任意高分辨图像进行风格迁移;</li><li>受益于所提感知损失,所提方法在超高分辨率图像上取得了超过其他SOTA方案的效果;</li><li>所提URST可以轻易的嵌入到现有风格迁移方案中,无需进行训练即可提升其性能。</li></ul><h2>Introduction</h2><p>超高分辨率图像风格迁移存在两个关键性挑战:</p><ul><li>超高分辨图像需要非常大的内存占用,甚至超出现有GPU的最大显存;</li><li>过小的笔画描边会导致不自然的纹理。</li></ul><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQd" alt="image.png" title="image.png"></p><p>针对第一个问题,现有方法往往采用轻量型网络、模型剪枝、知识蒸馏等方法降低显存占用。然而这些方法仅仅能起到缓和的作用,以上图为例,随着分辨率的提升,显存的占用呈指数增长,很快超出了现有GPU的峰值。这就驱动我们<strong>设计一种更有效的策略用于超高分辨率图像的风格迁移</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQe" alt="image.png" title="image.png"></p><p>超高分辨率图像的笔画边缘过小会呈现出不自然的现象,可参考上图(b)。增大笔画边缘是一种广泛采用的解决上述问题的方法;此外扩大风格迁移网络的感受野是另一种解决方案。然而这些方法并不适用于超高分辨率风格迁移。</p><p>为解决上述问题,本文提出了URST用于对任意高分辨率图像在有限内存约束下进行风格迁移,效果可参考上图(d)。</p><h2>Method</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQh" alt="image.png" title="image.png"></p><p>上图给出了本文所提URST的整体框架示意图。所提方案包含三个关键设计思想:</p><ul><li><strong>一种灵活的块级风格迁移</strong>,它可以将高计算量的风格迁移任务拆分为多个地计算量的块级风格迁移;</li><li>提出<strong>一种新颖的缩略图实例规范化TIN</strong>,它可以提取缩略图规范化统计信息并将其应用到小图像块上以确保不同块间的风格一致性;</li><li>精心设计了<strong>一种笔画感知损失</strong>以聚焦于笔画边缘的感知差异,促使风格迁移网络生成大的笔画边缘。</li></ul><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQi" alt="image.png" title="image.png"></p><p>由于该方案中的风格迁移网络可以是任意方法(比如AdaIN、LinearWCT),为方便起见,我们定义所选择方法原始损失为,在训练过程中,我们首先采用原始损失基于缩略图优化风格迁移网络。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQj" alt="image.png" title="image.png"></p><h3>Patch-wise Style Transfer</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQk" alt="image.png" title="image.png"></p><p>相比已有方法采用完整图像作为输入,所提框架可以灵活的处理任意高分辨率图像,同时也可以轻易嵌入到现有风格迁移方法(比如AdaIN、WCT、LinearWCT)中。正如前面所提到的,由于不同块的统计特性独立性,不同图像块的风格化可能存在不一致性问题。</p><h3>Thumbnail Instance Normalization</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQl" alt="image.png" title="image.png"></p><p>然而,我们发现IN并不适用于块级风格迁移,会导致块间风格不一致问题,可参考下图。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQm" alt="image.png" title="image.png"></p><p>在上图(a)中,我们对输入作为整体进行规范化;在上图(b)中我们将输入拆分为四块分贝进行规范化。这就导致最终的结果存在风格不一致问题。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQn" alt="image.png" title="image.png"></p><p>通过这种方式,TIN可以确保不同块间的风格一致性间,上图(c)。</p><h3>Stroke Perceptual Loss</h3><p>所提方法驱动我们提出一种辅助损失增大笔画边缘,该损失定义如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQo" alt="image.png" title="image.png"></p><h2>Experiments</h2><p>为验证所提方法的有效性,我们将其与AdaIN、WCT等方法进行了对比,见下图。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQp" alt="image.png" title="image.png"><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQp" alt="image.png" title="image.png"></p><p>从上图可以看到:(1) IN导致了明显的块间风格不一致问题;(2) <strong>所提方法取得了与全图相似的效果且显存占用更低</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQO" alt="image.png" title="image.png"></p><p>与此同时,我们还对比了所提损失函数的影响分析,见上图。可以看到:<strong>基于所提损失引导,这些模型可以生成更粗的线条与更稀疏的纹理,这有助于改善超高分辨率风格迁移</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQP" alt="image.png" title="image.png"><br>此外,我们还提供了不同风格迁移方案在不同输入分辨率输入时的显存占用对比。可以看到:大多方法甚至不能处理的高分辨率图像;而<strong>本文所提方法甚至可以处理分辨率图像且显存占用不超过5GB</strong>。理论上,本文所提方法可以处理任意高分辨率图像。</p><p>最后,我们提供一个超高分辨率图像风格迁移效果图作为结尾。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQQ" alt="image.png" title="image.png"></p><blockquote>来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FJqRUmFZLGtXDt814wH7ppA" target="blank">AIWalker</a><br>作者:   Happy</blockquote><p>推荐阅读</p><ul><li><a href="https://aijishu.com/a/1060000000386282"><strong>深入分析MobileAI图像超分最佳方案:ABPN</strong></a></li><li><a href="https://aijishu.com/a/1060000000385959"><strong>HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法</strong></a></li><li><a href="https://aijishu.com/a/1060000000385643"><strong>一层卷积能做啥?BOE告诉你:一层卷积可以做超分!</strong></a></li><li><a href="https://aijishu.com/a/1060000000385377"><strong>一层卷积能做啥?BOE告诉你:一层卷积可以做超分!</strong></a></li><li><a href="https://aijishu.com/a/1060000000380384"><strong>YOLOv6 v3.0 | 重磅升级!性能超越V8!</strong></a></li></ul><blockquote>本文章著作权归作者所有,任何形式的转载都请注明出处。更多动态滤波,图像质量,超分辨相关请关注我的专栏<a href="https://aijishu.com/blog/aiwalker">AIWalker</a>。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 04:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386996</guid>
            <link>https://aijishu.com/a/1060000000386996</link>
        </item>
        <item>
            <title><![CDATA[【TVM 学习资料】TensorIR 快速入门]]></title>
            <description><![CDATA[<p>本篇文章译自英文文档  [Blitz Course to TensorIR<br>](<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2Ftutorial%2Ftensor_ir_blitz_course.html" target="blank">https://tvm.apache.org/docs/t...</a>) 作者是 Siyuan Feng。更多 TVM 中文文档可访问→<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.hyper.ai%2F" target="blank">TVM 中文站</a> </p><p>TensorIR 是深度学习领域的特定语言,主要有两个作用:</p><ul><li>在各种硬件后端转换和优化程序。</li><li>自动 <em>tensorized</em> 程序优化的抽象。</li></ul><pre><code class="bash">import tvm
from tvm.ir.module import IRModule
from tvm.script import tir as T
import numpy as np</code></pre><h1>IRModule</h1><p>IRModule 是 TVM 的核心数据结构,它包含深度学习程序,并且是 IR 转换和模型构建的基础。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/eab85e2bd22d4c2199a5245e93ab04a5.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>上图展示的是 IRModule 的生命周期,它可由 TVMScript 创建。转换 IRModule 的两种主要方法是 TensorIR 的 schedule 原语转换和 pass 转换。此外,也可直接对 IRModule 进行一系列转换。注意,可以在任何阶段将 IRModule 打印到 TVMScript。完成所有转换和优化后,可将 IRModule 构建为可运行模块,从而部署在目标设备上。</p><p>基于 TensorIR 和 IRModule 的设计,可创建一种新的编程方法:</p><ol><li>基于 Python-AST 语法,用 TVMScript 编写程序。</li><li>使用 Python API 转换和优化程序。</li><li>使用命令式转换 API 交互检查和提高性能。</li></ol><h1>创建 IRModule</h1><p>IRModule 是 TVM IR 的一种可往返语法,可通过编写 TVMScript 来创建。</p><p>与通过张量表达式创建计算表达式(使用张量表达式操作算子)不同,TensorIR 允许用户通过 TVMScript(一种嵌在 Python AST 中的语言)进行编程。新方法可以编写复杂的程序并进一步调度和优化。</p><p>下面是向量加法的示例:</p><pre><code class="bash">@tvm.script.ir_module
class MyModule:
    @T.prim_func
    def main(a: T.handle, b: T.handle):
        # 我们通过 T.handle 进行数据交换,类似于内存指针
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # 通过 handle 创建 Buffer
        A = T.match_buffer(a, (8,), dtype="float32")
        B = T.match_buffer(b, (8,), dtype="float32")
        for i in range(8):
            # block 是针对计算的抽象
            with T.block("B"):
                # 定义一个空间(可并行)block 迭代器,并且将它的值绑定成 i
                vi = T.axis.spatial(8, i)
                B[vi] = A[vi] + 1.0
ir_module = MyModule
print(type(ir_module))
print(ir_module.script())</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.ir.module.IRModule'&gt;
# from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i in T.serial(8):
            with T.block("B"):
                vi = T.axis.spatial(8, i)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><p>此外,我们还可以使用张量表达式 DSL 编写简单的运算符,并将它们转换为 IRModule。</p><pre><code class="bash">from tvm import te
A = te.placeholder((8,), dtype="float32", name="A")
B = te.compute((8,), lambda *i: A(*i) + 1.0, name="B")
func = te.create_prim_func([A, B])
ir_module_from_te = IRModule({"main": func})
print(ir_module_from_te.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i0 in T.serial(8):
            with T.block("B"):
                i0_1 = T.axis.spatial(8, i0)
                T.reads(A[i0_1])
                T.writes(B[i0_1])
                B[i0_1] = A[i0_1] + T.float32(1)</code></pre><h1>构建并运行 IRModule</h1><p>可将 IRModule 构建为特定 target 后端的可运行模块。</p><pre><code class="bash">mod = tvm.build(ir_module, target="llvm")  # CPU 后端的模块
print(type(mod))</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.driver.build_module.OperatorModule'&gt;</code></pre><p>准备输入数组和输出数组,然后运行模块:</p><pre><code class="bash">a = tvm.nd.array(np.arange(8).astype("float32"))
b = tvm.nd.array(np.zeros((8,)).astype("float32"))
mod(a, b)
print(a)
print(b)</code></pre><p>输出结果:</p><pre><code class="bash">[0. 1. 2. 3. 4. 5. 6. 7.]
[1. 2. 3. 4. 5. 6. 7. 8.]</code></pre><h1>转换 IRModule</h1><p>IRModule 是程序优化的核心数据结构,可通过 Schedule 进行转换。schedule 包含多个 primitive 方法来交互地转换程序。每个 primitive 都以特定方式对程序进行转换,从而优化性能。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f1d1c2925359488883e2cb5e0a43802f.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>上图是优化张量程序的典型工作流程。首先,用 TVMScript 或张量表达式创建一个初始 IRModule,然后在这个初始 IRModule 上创建 schedule。接下来,使用一系列调度原语来提高性能。最后,我们可以将其降低并构建成一个可运行模块。</p><p>上面只演示了一个简单的转换。首先,在输入 ir_module 上创建 schedule:</p><pre><code class="bash">sch = tvm.tir.Schedule(ir_module)
print(type(sch))</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.tir.schedule.schedule.Schedule'&gt;</code></pre><p>将嵌套循环展开成 3 个循环,并打印结果:</p><pre><code class="bash"># 通过名字获取 block
block_b = sch.get_block("B")
# 获取包围 block 的循环
(i,) = sch.get_loops(block_b)
# 展开嵌套循环
i_0, i_1, i_2 = sch.split(i, factors=[2, 2, 2])
print(sch.mod.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0, i_1, i_2 in T.grid(2, 2, 2):
            with T.block("B"):
                vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><p>还可对循环重新排序。例如,将循环 i_2 移到 i_1 之外:</p><pre><code class="bash">sch.reorder(i_0, i_2, i_1)
print(sch.mod.script())</code></pre><p>输出结果</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0, i_2, i_1 in T.grid(2, 2, 2):
            with T.block("B"):
                vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><h1>转换为 GPU 程序</h1><p>要在 GPU 上部署模型必须进行线程绑定。幸运的是,也可以用原语来增量转换。</p><pre><code class="bash">sch.bind(i_0, "blockIdx.x")
sch.bind(i_2, "threadIdx.x")
print(sch.mod.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0 in T.thread_binding(2, thread="blockIdx.x"):
            for i_2 in T.thread_binding(2, thread="threadIdx.x"):
                for i_1 in T.serial(2):
                    with T.block("B"):
                        vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                        T.reads(A[vi])
                        T.writes(B[vi])
                        B[vi] = A[vi] + T.float32(1)</code></pre><p>绑定线程后,用 cuda 后端来构建 IRModule:</p><pre><code class="bash">ctx = tvm.cuda(0)
cuda_mod = tvm.build(sch.mod, target="cuda")
cuda_a = tvm.nd.array(np.arange(8).astype("float32"), ctx)
cuda_b = tvm.nd.array(np.zeros((8,)).astype("float32"), ctx)
cuda_mod(cuda_a, cuda_b)
print(cuda_a)
print(cuda_b)</code></pre><p>输出结果:</p><pre><code class="bash">[0. 1. 2. 3. 4. 5. 6. 7.]
[1. 2. 3. 4. 5. 6. 7. 8.]</code></pre><p><a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2F_downloads%2Feac4389b114db015e95cb3cdf8b86b83%2Fauto_scheduler_matmul_x86.py" target="blank">下载 Python 源代码</a><br><a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2F_downloads%2F246d4b8509474fd9046e69f6cc9b7f87%2Fauto_scheduler_matmul_x86.ipynb" target="blank">下载 Jupyter Notebook</a></p><p>以上就是该文档的全部内容,查看更多 TVM 中文文档,请访问→<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.hyper.ai%2F" target="blank">TVM 中文站</a></p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 03:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386987</guid>
            <link>https://aijishu.com/a/1060000000386987</link>
        </item>
        <item>
            <title><![CDATA[ECCV'22 Oral|VQFR|基于矢量量化字典与双解码器的人脸盲修复网络]]></title>
            <description><![CDATA[<h2>ECCV'22 Oral|VQFR|基于矢量量化字典与双解码器的人脸盲修复网络</h2><p>ECCV'22 Oral - VQFR: Blind Face Restoration with Vector-Quantized Dictionary and Parallel Decoder</p><p>解读:Owen718 论文链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Farxiv.org%2Fpdf%2F2205.06803.pdf" target="blank">https://arxiv.org/pdf/2205.06803.pdf</a></p><h2>Background&amp;Motivation</h2><p>尽管生成式面部先验和结构化面部先验最近已经证明了可以生成高质量的人脸盲修复结果,稳定、可靠生成更细粒度的脸部细节仍然是一个具有挑战性的问题。这篇文章受最近基于字典的方法和基于矢量量化的方法启发,提出了一种 基于矢量量化(VQ-based)的人脸盲修复方法VQFR。VQFR从高质量的图像中抽取特征,构建low-level特征库从而恢复逼真的面部细节。</p><p>这篇工作重点关注如下两个问题:</p><ul><li>1.<strong>codebook中每个code对应的原图patch大小会极大影响人脸网络修复结果的质量与保真度权衡,而实际落地应用中,质量与保真度需要做到良好的平衡以获得最佳视觉效果。</strong></li><li>2.<strong>原图退化特征需要与来自codebook的高质量特征做融合,融合过程中,如何做到高质量特征不被退化特征所干扰而导致性能降低?</strong></li></ul><h2>详细介绍引入</h2><p>人脸恢复的目标是恢复低质量(LQ)面孔并纠正未知退化,例如噪声、模糊、下采样引起的退化等。在实际情况下,此任务变得更具挑战性,因为存在更复杂的退化、多样的面部姿势和表情。以前的作品通常利用特定于人脸的先验,包括几何先验、生成先验和参考先验。具体来说,几何先验通常包括面部标志、面部解析图和面部组件热图。它们可以为恢复准确的面部形状提供全局指导,但不能帮助生成逼真的细节。此外,几何先验是从退化图像中估计出来的,因此对于具有严重退化的输入变得不准确。这些特性促使研究人员寻找更好的先验。最近的人脸修复工作开始研究生成先验(GAN-Prior),并取了优异的性能。这些方法通常利用预先训练的人脸生成对抗网络(例如StyleGAN)的强大生成能力来生成逼真的纹理。这些方法通常将退化的图像投影回GAN潜在空间,然后使用预先训练的生成器解码高质量(HQ)人脸结果。尽管基于GAN先验的方法最初从整体上讲具有良好的恢复质量,但仍然无法生成细粒度的面部细节,特别是精细的头发和精致的面部组件。这是因为训练有素的GAN模型,其潜在空间仍然是不够完善的。基于参考的方法(Reference-based methods)—探索了高质量的指导面孔或面部组件字典来解决面部恢复问题。DFDNet是该类别中的代表方法,它不需要访问相同身份的面孔,就可以产生高质量的结果。它明确建立高质量的“纹理库”,用于几个面部组件,然后用字典中最近的高质量面部组件替换退化的面部组件。这种离散的替换操作可以直接弥合低质量面部部件与高质量部件之间的差距,因此具有提供良好面部细节的潜力。然而,DFDNet中的面部组件字典仍然有两个缺点。<strong>1)它使用预先训练的VGGFace网络进行离线生成,该网络是为识别任务优化的,明显并不适合恢复任务。2)它只关注几个面部组件(即眼睛、鼻子和嘴巴),但不包括其他重要区域,例如头发和皮肤。</strong></p><p>面部组件字典的局限性促使VQFR探索<strong>矢量量化(VQ)码本</strong>,这是一个为所有面部区域构建的字典。VQFR提出的人脸恢复方法VQFR既利用字典方法又利用GAN训练,但不需要任何几何或GAN先验。与面部组件字典相比,VQ码本可以提供更全面的低层特征库,而不局限于有限的面部组件。它也是通过面部重建任务以端到端的方式来学习的。此外,矢量量化的机制使其在不同的退化情况下更加稳健。尽管简单地应用VQ码本可以取得不错的效果,但要实现良好的结果也不容易。后续进一步介绍了两个特殊的网络设计以应对前文提到的两个problems,这将帮助VQFR在细节生成和身份保留方面都超越先前的方法。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPM" alt="image.png" title="image.png"></p><p>具体来说,为了生成逼真的细节,作者发现选择适当的压缩补丁大小至关重要,它表示codebook的一个code“由多大的补丁表示”。如图2所示,较大的patch可以带来更好的视觉质量,但是真实度却会下降。经过全面的调查,我们建议输入图像大小512x512时,32大小的patch size最合适。然而,这种选择只是在质量和真实度之间进行权衡。表情和身份也可能会因适当的压缩补丁大小而有很大的变化。一个直接的解决方案是将输入特征与不同的解码器层融合,这与GFP-GAN中的操作类似。尽管输入特征可以带来更多的真实度信息,但它们也会干扰从VQ代码本生成的逼真细节特征。这个问题引出了作者的第二个网络设计:并行解码器。具体而言,并行解码器结构包括纹理解码器和主解码器。VQFR的纹理解码器仅接收来自VQ代码本的潜在表示的信息,而主解码器将纹理解码器中的特征做变换以匹配退化输入的需保留的特征。<strong>为了避免高质量细节的损失并更好地匹配退化的面部,VQFR在主解码器中进一步采用了具有可变卷积的纹理变换模块。通过VQ codebook作为面部字典和并行解码器设计,VQFR可以实现更高质量的面部细节修复,同时尽可能得保留面部恢复的真实度。</strong></p><h2>VQFR方法概述</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPN" alt="image.png" title="image.png"></p><p>VQFR模型架构图。VQFR由一个编码器组成,用于映射退化的人脸 进入潜在和并行解码器以利用 HQ 代码和输入功能。编码器 和解码器由矢量量化模型和预训练的 HQ 码本,将编码的latent feature替换为 HQ 代码</p><p>Vector-Quantized Codebook最早在VQVAE中被引入,旨在学习离散的先验来编码图像。VQFR中的codebook部分与VQGAN中的基本一致。VQGAN 主要是采用了感知损失和对抗性损失以鼓励具有更好感知质量的重建。VQFR方法主要基于以下两个观察来提高修复性能:</p><ol><li><strong>通过采用合适的压缩补丁大小,可以用仅由高品质人脸训练的VQ码本来去除LQ人脸的退化。</strong></li><li><strong>在训练恢复任务时,在改进的细节纹理和保真度变化之间需要保持一个平衡。</strong></li></ol><p>针对观察现象一,VQFR采用合适的f大小来控制codebook效果,f取32最佳。针对观察现象二,VQFR提出利用双分支架构的decoder来逐渐将高质量纹理特征补充进待修复特征中,texture warp module利用可变形卷积很好的实现了这一目的。反观之前的相似工作,之前工作中单一分支decoder架构很难较好的融合低质特征和高质量特征,这导致了恢复性能不佳。</p><h2>实验</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPO" alt="image.png" title="image.png"></p><p>VQFR在CelebA-Test数据集和LFW数据集上均取得了领先的性能结果,值得关注的是其PSNR/SSIM指标并不十分出色,但是FID、NIQE、LMD指标非常不错,视觉效果也体现了该方法的优越性。</p><h3>真实度与保真度的平衡</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPP" alt="image.png" title="image.png"></p><p>可以看出VQFR取得了非常不错的真实度与保真度的平衡,实验效果很出色。</p><h2>总结</h2><p>本文提出的VQFR是一种性能非常不错的人脸盲修复方法,文章思路非常清晰,明确点出核心motivation和为解决的相关问题,最后的实验结果也非常精彩,很好的证明了方法的基本理论与出发点,更多细节建议大家参考原文。</p><blockquote>作者: owen      <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FxGhgltsOTeO6-2VILnJsLQ" target="blank">GiantPandaCV</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000386641">编译器优化那些事儿(4):归纳变量</a></li><li><a href="https://aijishu.com/a/1060000000386334">编译器优化那些事儿(3):Lazy Code Motion</a></li><li><a href="https://aijishu.com/a/1060000000386007">编译器优化那些事儿(2):常量传播</a></li></ul><blockquote>欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区<a href="https://aijishu.com/blog/qianrushikezhan">嵌入式客栈</a>专栏欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 03:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386978</guid>
            <link>https://aijishu.com/a/1060000000386978</link>
        </item>
        <item>
            <title><![CDATA[推荐系统[八]算法实践总结V0:腾讯音乐全民K歌推荐系统架构及粗排设计]]></title>
            <description><![CDATA[<h1>1.前言:召回排序流程策略算法简介</h1><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/44083e4c130841f894e36366a71f8d96.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>推荐可分为以下四个流程,分别是召回、粗排、精排以及重排:</p><ol><li>召回是源头,在某种意义上决定着整个推荐的天花板;</li><li>粗排是初筛,一般不会上复杂模型;</li><li>精排是整个推荐环节的重中之重,在特征和模型上都会做的比较复杂;</li><li>重排,一般是做打散或满足业务运营的特定强插需求,同样不会使用复杂模型;</li></ol><ul><li><p><strong>召回层</strong>:召回解决的是从海量候选item中召回千级别的item问题</p><ul><li>统计类,热度,LBS;</li><li>协同过滤类,UserCF、ItemCF;</li><li>U2T2I,如基于user tag召回;</li><li>I2I类,如Embedding(Word2Vec、FastText),GraphEmbedding(Node2Vec、DeepWalk、EGES);</li><li>U2I类,如DSSM、YouTube DNN、Sentence Bert;</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/b935ff75e3e84d7f88de39613bb02bad.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p></li><li><strong>模型类</strong>:模型类的模式是将用户和item分别映射到一个向量空间,然后用向量召回,这类有itemcf,usercf,embedding(word2vec),Graph embedding(node2vec等),DNN(如DSSM双塔召回,YouTubeDNN等),RNN(预测下一个点击的item得到用户emb和item emb);向量检索可以用Annoy(基于LSH),Faiss(基于矢量量化)。此外还见过用逻辑回归搞个预估模型,把权重大的交叉特征拿出来构建索引做召回</li><li><p><strong>排序策略</strong>,learning to rank 流程三大模式(pointwise、pairwise、listwise),主要是特征工程和CTR模型预估;</p><ul><li><p><strong>粗排层</strong>:本质上跟精排类似,只是特征和模型复杂度上会精简,此外也有将精排模型通过蒸馏得到简化版模型来做粗排</p><ul><li>常见的特征挖掘(user、item、context,以及相互交叉);</li></ul></li><li><p><strong>精排层</strong>:精排解决的是从千级别item到几十这个级别的问题</p><ul><li><strong>CTR预估</strong>:lr,gbdt,fm及其变种(fm是一个工程团队不太强又对算法精度有一定要求时比较好的选择),widedeep,deepfm,NCF各种交叉,DIN,BERT,RNN</li><li><strong>多目标</strong>:MOE,MMOE,MTL(多任务学习)</li><li><strong>打分公式融合</strong>: 随机搜索,CEM(性价比比较高的方法),在线贝叶斯优化(高斯过程),带模型CEM,强化学习等</li></ul></li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c764dfd7b65048f3a2ab2b97214135a3.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p></li><li><strong>重排层</strong>:重排层解决的是展示列表总体最优,模型有 MMR,DPP,RNN系列(参考阿里的globalrerank系列)</li><li><p><strong>展示层</strong>:</p><ul><li><strong>推荐理由</strong>:统计规则、行为规则、抽取式(一般从评论和内容中抽取)、生成式;排序可以用汤普森采样(简单有效),融合到精排模型排等等</li><li><strong>首图优选</strong>:CNN抽特征,汤普森采样</li></ul></li><li><strong>探索与利用</strong>:随机策略(简单有效),汤普森采样,bandit,强化学习(Q-Learning、DQN)等</li><li><strong>产品层</strong>:交互式推荐、分tab、多种类型物料融合</li></ul><h1>2.业务背景</h1><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/979ec768bf184537b6cdf2a4696229c5.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>全民K歌涉及多样化的推荐场景,涵盖内容、直播、歌房、用户等多种形态。</p><p>具体的推荐功能如上图所示,主要包括以下几类:</p><p>① 基于内容的推荐,包括优质UGC推荐、关注流推荐、同城社交推荐等功能模块。</p><ul><li>优质UGC推荐,将平台原生原创的优质音视频内容进行推荐</li><li>关注流推荐,对关注的内容进行混排</li><li>同城社交推荐,基于同城的社交进行推荐</li></ul><p>② 除了内容推荐外,我们也会负责一些其他类型的推荐,包括直播推荐、点歌推荐、歌房推荐和点评推荐,都是在K歌生态下独有的推荐。</p><h1>3.推荐系统架构及挑战</h1><p>推荐系统主要分为四个部分,包括召回层、粗排层、精排层及重排层。</p><h2>3.1召回层</h2><p>召回层的作用主要是从海量的item中筛选小量级的用户可能感兴趣的内容。在这个模块中最重要、大家了解最多的肯定就是召回模块本身。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/28d6ce28d0ad475ca1526f0714be96e9.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>一般来说,我们线上的召回方法会分为索引类的召回、泛社交的召回以及模型的召回。</p><ul><li>索引类的召回:主要根据画像的结果做精准的ID类召回,比如对用户感兴趣的歌曲进行召回,以及用户感兴趣的创作者进行召回。</li><li>泛社交的召回:主要基于用户在站内丰富的社交关系,比如用户可能会关注一些其他的用户,也可能加入一些家族,我们会根据这些社团的发现结果做泛化召回。</li><li>模型的召回:基于模型的召回的方法比较多,在后面会展开介绍。</li></ul><p>除了召回模块之外,我们在召回层认为另外一个比较重要的是内容的比例筛选,因为我们整体的内容发表量比较大,每天可能有500万的作品在平台内发表,如何从中筛选出合适的内容,需要基于音视频的理解,以及基于我们自己的流量策略来综合发现。</p><h2>3.2 粗排层</h2><p>粗排层到精排层相当于是一个承上启下的作用,它会把我们召回到的一些万量级的作品进一步筛选到千量级,既要考虑打分的性能问题,又要考虑排序粗排精准度的问题。一般来说,粗排模型会用一些模型蒸馏的方法,包括<strong>特征蒸馏或者基于模型本身的结构蒸馏</strong>,以及把这些不同的蒸馏方法组合起来等等。在粗排层,除了做粗排的打分外,我们还会重点做生态的控制,特别在一些内容推荐场景或者直播推荐场景中,我们会注重这里面的内容生态,包括时效性,内容的调性,多样性等等。</p><h2>3.3 精排层</h2><p>粗排层之后就来到了精排层,精排层主要根据千量级的作品进一步的进行精排打分来筛选到百量级的作品。在精排层,我们主要注意以下几方面:</p><ul><li>一个就是精排模型本身,我们早期也采用了类似LR的线性模型和LightGBM这样的树模型,之后随着深度模型的技术发展,我们所有的场景都切换到了深度模型,并且随着深度网络的设计复杂度,以及样本规模的逐步增加,让早期基于TF训练的一些深度模型引擎,在训练的速度以及对模型大小规模的限制,已经对我们产生了影响。所以我们现在已经过渡到基于参数服务器框架下,训练深度模型。</li><li>在精排前,除了模型怎么训练构造外,另外两个比较重要的是特征和样本的构造,以及在这个场景下的多目标设计。特别是多目标的问题,可能还涉及到具体的网络结构如何做,以及最后的结果如何融合。</li></ul><ol start="4"><li>重排层</li></ol><p>从精排层排序出百量级的作品后,就会进入到重排层。重排层会基于业务规则进行进一步的干预,比如同一首歌曲的视频不能连续出现,同一个创作者的视频不能连续出现等等。除了基于规则性的限制外,我们也会考虑使用模型化的方法做多样性的打散,并且在第4部分,我们也会具体介绍DPP算法的原理和思想。除了模型方法之外,我们也在考虑通过list wise的方法做内容的重排。</p><h1>4.粗排模块算法设计</h1><h2>4.1 粗排模块定位和方案路线</h2><p>粗排模型和精排模型不同,<strong>它可能既需要解决模型预测的准确性,又需要解决模型预测的效率</strong>。接下来,为大家介绍我们整个推荐系统如何在线上真实运转。</p><p>粗排模块主要包含两部分:</p><ul><li>第一部分是粗排的排序部分,这一部分主要就是为了解决一个大规模item的预排序问题。</li><li>第二个部分是多样性控制部分,作为一个UGC平台,我们需要考量内容在整个内容生态中的分发状况,以及均衡的考量生产者跟消费者之间的关系。我们是通过多样性调节算法来间接实现这个目的的。</li></ul><p>让我们再回顾下前面所提到的整个召回系统架构,我们可以看到它其实是一个典型的节点架构,从内容发现到召回,到粗排到精排,然后重排,最后把合适的内容推荐给用户。由于我们是一个比较大的UGC生产平台,从一个UGC平台的角度来考虑,我们倾向于分发较为新的作品,因为新的作品的分发会为那些活跃的创作者带来一定的流量激励,使得生产端跟消费端产生联动,促进了一种正向的循环。<br><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/a482dc35c51b4eb888e3ee59e8754550.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>我们以三个月内的站内发布作品为例,三个月内的站内发布作品大概会到十的九次方量级,然后我们通过一些内容挖掘跟优质内容发现的方式,从中找到更为优质的一部分内容,这部分内容仍然有十的七次方量级,相当于从百万量级的作品库做兴趣的召回。这是一个非常大的候选集场景,从优质内容的发现到召回,是整个UGC平台和推荐系统的连接,背后承载着我们对整个UGC的分发、内容生态的理解。这一部分我们会在第三个环节去做进一步详细的介绍。召回可以看到有十的七次方的候选集召回,通常完成召回过程之后仍然有十的五次方候选集,而精排通常只能去处理一个千级别的规模,所以我们看到这中间存在一个比较大的漏斗,很多时候会成为我们在效果或者一些收益上的瓶颈。这时,粗排模块的重要性就体现出来了。粗排模块的一个重要的作用就是防止召回到精排之间的漏斗过大,导致过多的信息损失。</p><p>大家可能比较了解的是,召回跟精排召回更像是一个集合,选择的过程更侧重于选择效率最高的方法,至于topk中item之间的先后顺序,其实不是最关心的因素;而精排环节相对来说它更强调次序,也就是说item A跟item B的先后顺序是非常敏感和关键的。</p><p>粗排夹在召回跟精排之间,它的定位是什么?相比于召回,粗排更强调排序性,也就是更强调topk内部的排序关系;相对于精排,粗排更强调性能,因为精排通常有非常复杂的网络结构,非常大的参数量,这也意味着它在实际应用的过程中比较难去处理一个较大规模量级的候选集的打分,这时粗排就必须要解决这个问题,所以它在性能上会相较于精排有更多的要求。现在主流的粗排方案有两条路线,这两条路线是基于两个出发点来思考的:</p><ul><li>第一条路线是把粗排当成是召回的一种延伸,它的技术选型会像是一种集合,<strong>选择的方案和目标是选出效率最高的子集</strong>。常用的方式,简单的可以通过实时的serving或者一些实时的指标对召回排序的结果做一个选择。总体来说,这条技术路线最大的优点是算力消耗非常小、性能非常好,但是它的缺点是本身的表达能力是有限的,可以明显预估到它的天花板。</li><li>第二条路线是从精排的角度,把粗排当成是精排的迁移或压缩,也就是说这是一条排序的路线,<strong>它的建模目标是预估值</strong>。这种方法的好处是它的表达能力很强,因为通常会用到一些比较复杂的网络结构,而且它跟精排的联动性是更好的,可以让粗排跟精排的目标保持某种程度上的一致性。同时,它的缺点也凸显出来了,就是我们用到了复杂的方法,算力的消耗一定也会相应的提升。因此,<strong>需要着重解决的是如何在有限的算力下尽可能地突破表达能力上限</strong>。在这种路线下,我们通常会在架构选择上选择双塔结构模型。</li></ul><h2>4.2 粗排双塔模型实践</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f5af219903eb4f7ba4be13edd86ecbaa.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><blockquote>我们通过把user和item的feature进行结构解耦与分开建模,然后完成整个架构的设计,在模型训练完毕之后,我们会通过user serving实时的产出user embedding,再通过索引服务把该用户所有的候选集合的ID给取出来,最后在userembedding跟item embedding之间做內积的运算,得到一个粗排的预估值,作为整个粗排阶段的排序依据。</blockquote><p><strong>这么做的优势是user/item 结构是解耦的,内积计算的算力消耗小。</strong></p><p>同时,它的缺点也非常的明显:</p><ul><li>第一个是它在特征表达上是缺失的,因为user跟item解耦之后,很难使用一些交叉特征,一旦用了交叉特征,有多少item就得进行多少次预估,这违背了我们使用双塔模型的初衷。</li><li>第二个是它在结构上也是有缺陷的,我们回忆一下上面这幅框架图,可以看到user跟item的交互非常少,这会限制它的表达能力的上限。</li></ul><p>如果我们选择了这种技术方案,我们可以保障它的性能,但是我们需要进一步的考虑如何避免这种简易的结构所带来的效果上的损失。在这种情况下,我们通常会使用一些模型蒸馏的方式。</p><p>模型蒸馏有两个关键词,第一个是它本质上是一种迁移学习,也就是transfer learning,第二个是transfer的方式是通过所谓的label,区别于我们平时理解的样本label离散值,变为了0到1之间的一个连续值。常见的蒸馏模型架构,会有涉及到两个模型,第一个模型叫做教师模型,叫做teacher,第二个模型是学生模型,叫做student。这两个模型的总体思路是teacher模型是一个非常大、非常复杂、学习到的东西非常多的模型,teacher模型会把学习到的知识传导给student模型,受限于某些原因,该模型没有办法做得很复杂,或者它的规模必须限制在一定范围内的子模型。</p><p>具体流程如下:</p><ol><li>准备训练样本,对teacher模型预训练,即得到了teacher模型;</li><li>把teacher模型最后一层或倒数第二层的输出结果,作为传递给student模型的信息,这部分通常是logits或softmax的形式,也叫做soft labels;</li><li>把soft labels传导到student模型,作为模型loss的一部分,因为student模型除了要拟合teacher模型传递的信息,也要去拟合样本真实的分布。</li></ol><p><strong>针对上述流程里涉及到了几个概念,有如下的进一步解释:</strong></p><ul><li><strong>关于logits</strong>:<strong>它是teacher模型层层映射后的一个抽象度很高且信息浓度很大的结果,是整个知识传递的媒介</strong>。在logits后,<strong>通常会接一个softmax,但是softmax会放大logits的两极差异,造成细节损失,而这些细节恰恰是帮助student模型更好学习的关键</strong>。为了克服以上问题,我们选用了改进的softmax,即softmax with temperature</li></ul><p>$q_i=\frac{\exp \left(z_i / T\right)}{\sum_j \exp \left(z_j / T\right)}$</p><p>这里,引入一个超参数T控制整个softmax分布的陡峭或平滑程度,间接控制蒸馏的强度。通常,T要设置成多少没有一个定论,与实际场景相关,依赖相应场景下的一些实验设计。</p><ul><li>关<strong>于loss</strong>:预训练好teacher模型后,转而关注student模型,它的最小化loss由两部分构成,<strong>一部分是尽可能拟合teacher模型的输出结果,另一部分是尽可能拟合真实样本</strong>。<strong>由于student模型的表达能力有限</strong>,直接用student模型拟合真实样本可能学不好或者学偏;<strong>teacher模型传递过来的信息对student模型做了约束和纠正,指导student模型的优化方向,进而加强了student模型的学习能力。</strong></li></ul><p><strong>整个模型蒸馏的收益表现如下:</strong></p><p>引入<strong>soft labels</strong>的概念,不再是原本的非零即一状况,<strong>需要考虑正样本有多正和负样本有多负</strong>。这看起来<em>类似把分类问题转换成回归问题,但实质并不是。如果构建样本时,用回归的方式构建,通常会基于作品的完播率或规则组合等,人工敲定样本的回归值,这种方式过于主观,没有一个非常合理或可矫正的指标进行后续比对</em>;<strong>而模型蒸馏的soft labels是基于teacher 模型,即由teacher 模型对真实样本进行充分训练后给出,包含更多的隐含信息且不受人为主观因素影响。</strong></p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/795f0ad3a0eb44a2b570e9dfa4910fd0.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>具体的,来看看我们如何做粗排模块的蒸馏,主要是分为两个大的方向:</p><ul><li><strong>模型蒸馏</strong>,主要适用于模型不同但特征相同的情况,比如,包含多个场景的框架里,某些场景对性能有要求;由于有一些额外的外部限制,使某场景无法用很复杂参数量非常大的模型,可以用一个子模型使用全部特征。此时,模型蒸馏主要是弥补子模型缺少复杂结构或交互结构导致的部分收益损失,本质上是一种模型压缩方案。</li><li><strong>特征蒸馏</strong>,主要适用于模型相同但特征不同的情况,比如,在某些场景,无法使用全量特征 ( 如交叉特征 ) 或部分特征必须是剪裁过的,即特征没被完全利用,存在一部分损失。这时,通过一个更大的teacher模型学习全量特征,再把学到的知识迁移到子模型,即弥补了上述的部分特征损失。</li></ul><p>基于以上描述可知,粗排模块可以通过蒸馏的方式,补足双塔模型在结构和特征上的缺陷。接下来的问题就是如何找到一个合适的teacher模型?精排模型通常是一个被充分训练的、参数量很大、表达能力很强的模型,如果通过蒸馏精排模型获取粗排模型,那么目标的一致性和学习能力的上限都符合我们预期的。</p><ul><li>teacher模型是精排模型,该模型使用全量的特征,包括三大类,即user侧特征、item侧特征及它们的交叉特征;曲线框里是一些复杂的拓扑结构;最后的softmax with temperature就是整个精排模型的输出内容,后续会给到粗排模型进行蒸馏。</li><li>中间的粗排模型,user tower只用user features,item tower只用item features,即整体上看,模型未使用交叉特征。在user tower和item tower交互后,加上精排模型传递过来的logits信息,共同的构成了粗排模型的优化目标。整个粗排模型的优化目标,同时对真实样本和teacher信息进行了拟合。</li><li><p>右侧展示的是训练完粗排模型后,在线上产出user serving,通过user serving产出user embedding,再与item embedding做内积运算,完成整个排序的过程。上述流程即实现了粗排和精排的联动过程,并且训练完粗排模型就可以进行一个非常高效的serving,进行粗排排序。</p><h2>4.3. 线上的粗排双塔模型</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/650b567c1a6e4efc95b4a7179cc99d40.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>实践中,粗排模型训练时,依赖的精排输出结果来自上报精排日志。如果在离线重新对样本进行预估再输出,其实是对线下资源的浪费,所以通常在线上精排预估时,就把一些结果作为日志进行上报。粗排模型异步训练,产出模型提供给Serving。</p></li></ul><p>Serving环节主要包括异步Serving和User Serving两部分,具体功能如下:</p><ul><li><strong>异步Serving</strong>,主要通过刷库Item Serving捕获所有的item embedding,以异步的方式反复刷库。大家经常会问的一个问题:如果模型更新了,item embedding有的是新的,有的是旧的,版本不一致怎么办?如果更新周期比较短,item embedding的分布不会发生较明显的偏移,即相邻版本比较接近,这间接保障了一致性,不需要版本是强一致性的,只要更新周期比较短就可以。</li><li><strong>User Serving</strong>,当用户请求推荐引擎后,获取该用户的user features,然后请求User Serving产出user embedding;同时,会拿到该用户的所有召回item集合,基于刷库结果产出的索引服务,取到所有的item embedding。由此可见,User Serving的最大优势是可以做实时计算且只需计算一次,效率非常高。并且,双塔粗排Serving阶段是做内积运算,这种高效的计算方式也使它更适合大规模的预排序场景。</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/74ad5786e33b4e38986c4697b77a5503.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>整个粗排模块上线后,我们关注的两类指标:互动类指标和播放类指标,都有非常明显的正向提升,具体的指标提升幅度可以参考上图的在线实验结果。</p><p>一般,粗排模块的表现和实际场景有较大的相关性:在候选集非常大的推荐场景下,粗排到精排间的漏斗有好几个量级,这时粗排模块会带来非常显著的收益;在候选集比较小的推荐场景下,从召回到精排间的漏斗不是很大,这时粗排的收益可能就比较有限。</p><h2>4.4 进一步优化</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/757af659b60344ea83de0fce27ee6a9a.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><ol><li>首先,上述粗排蒸馏过程本质上是pointwise,但通过上报精排日志可以拿到精排模型给出的完整再推荐列表,用pairwise学习精排排出来的序,可以进一步逼近精排结果,能更多的提取精排传递出的信息。</li><li>其次,前面虽然不断地用teacher模型和student模型描述整个过程,但实际效果上student模型不一定低于teacher模型。换一个角度,student模型其实是基于teacher模型做进一步训练,所以student模型的表征能力有可能超过teacher模型。事实上,如何让student模型通过反复的蒸馏,效果超过teacher模型,在模型蒸馏领域也有许多相关方法。</li><li>最后,粗排到底是召回的延伸,还是精排的压缩跟前置?虽然召回和精排都是一个检索的过程,但二者实际侧重点还有一些不同,比如,召回在多样性上有更多的考量,精排更强调排序次序的精准性,而粗排处于这两个环节之间,如何利用粗排模块更好地平衡召回和精排?通常而言,会考虑设计多样性调节算法解决这一问题。</li></ol><h1>5.多样性调节算法设计</h1><h2>5.1 推荐多样性的意义</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/1aa9fd0dfc36482e80aae6c92ab2e5a8.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>样性的概念在推荐系统里常被提到,在不同视角下,推荐多样性对应着不同的问题。</p><ul><li>在系统角度下,<strong>多样性是一种popularity bias,即流行度的偏置</strong>。流量在UGC作品上的分布,体现了系统层面的多样性:一个多样性弱的系统,更像是中心化分发的,只分发非常头部、非常类似的一部分作品;而一个多样性强的系统,则是一个去中心化分发的,<strong>会更多地兼顾中长尾内容流量的供给</strong>。实际上,在推荐系统中普遍会遇到如下问题:如果没有对推荐系统做额外的干预和纠偏,不可避免地会使推荐系统往多样性弱的方向发展。从数据层面解释,有丰富数据的那部分内容会在推荐过程被反复加强,使整个推荐循环链路越缩越小,<strong>马太效应越来越严重</strong>。对于一个ugc平台,需要考量生产者或创作者的利益,而这种聚集在部分创作者身上的马太效应是我们不愿意看到的。</li><li>在用户角度下,<strong>多样性就是Explore&amp;Exploit问题</strong>,对用户做兴趣的探索与聚焦。如果多样性弱,推荐的item同质化严重,都很像,那么推荐系统可能没办法发现用户的真实兴趣,因为系统可能都没给用户推荐过这类item;如果多样性强,那么用户的推荐流里的内容会很不一样,坏处可能是用户在持续消费过程的兴趣聚焦程度不同,比如用户看了五个item,明明对其中某一两个item更感兴趣,但和这一两个item相似的item的后续推送密度却跟不上,这对用户体验是有损的。如果不做额外的优化,用户角度的多样性会越来越小,因为通常选用的pointwise模型会导致同质化的现象,比如说用户喜欢的item是乐器类的,则pointwise在每一个单点上的预估都觉得乐器是最好的,最后可能连续给用户推了5个乐器,在单点上收益最高不代表用户对整个推荐结果 ( 5~10个item ) 的满意度是最高的,所以这里也需要做多样性控制,提升用户的满意度。</li></ul><h2>5.2 多样性控制的方案路线</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/6dca1c96e53d4bc384d56d050af2681d.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在具体实现上,多样性有三个主流的技术方案:<strong>规则打散、embedding打散和DPP</strong>,下面会详细介绍:</p><ul><li>基于规则打散,比如从item里抽象出发布作者、标签、伴奏等特征,基于这些特征去做一个session内的频控。这种方法的好处是易实现,缺点也非常明显,该方案本质上是进行枚举加排列组合,扩展性非常差,永远没办法枚举所有可能的情况,枚举出来的情况不一定能真实表征两个item间的相似或差异程度有多大。</li><li>基于embedding打散,一个连续值的方案。好处是它可以基于embedding对候选集做离散性的评估,相当于此时可以用向量化的方式表达item。缺点在于它虽然可以衡量离散性或多样性,但难以衡量相关性,从而无法实现联合的收益评估。事实上,多样性只是我们的一个目标,相关性也很重要,如果推了很多不同的东西,但和用户不怎么相关,可能会适得其反。</li><li>DPP概率模型,本质上是一种集合选择技术,选择出一个子集使得多样性和相关性联合建模的收益最大。直观理解,先基于多样性和相关性构建一个矩阵,该矩阵行列式的物理含义是矩阵中各向量张成的平行多面体体积的平方,这样就把问题转换成了一种可度量的方式:要想同时最大化多样性和相关性,只需要最大化平行多面体的体积。</li></ul><h2>5.3 DPP 技术细节</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/ca152d8173ad469fb201400664ab3ab3.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>DPP算法的具体实现比较复杂,这里主要介绍两个关键点:</p><p>①基于多样性和相关性构建矩阵L,该矩阵的行列式等价于最终要度量的目标。如何去定义相关性和多样性?</p><ul><li>多样性(diversity)是指两个item相似不相似,如果很相似就不多样。利用两个item各自的item embedding计算内积,即表示两个item的相似度。</li><li>相关性(relativity)是一个候选item与当前用户的匹配程度。在不同环节的实现有差异:在粗排层的DPP,一般是基于user embedding和item embedding计算内积。在精排层的DPP,需要精排的CTR或CVR预估结果,因为这些预估结果反映了当前用户对候选item的喜爱程度。</li></ul><p>基于上述定义的相关性和多样性就可以构建矩阵L:用户与itemi的相关性 ( 偏好程度 )、用户与itemj的相关性 ( 偏好程度 )、itemi与itemj的多样性三者乘积。通过最大化矩阵L,就可以实现相关性和多样性的联合度量。</p><p>②如何优化求矩阵L行列式的复杂度,该行列式的原始计算复杂度是三阶,线上难以支撑这样的运算性能消耗,可以通过贪婪算法把计算复杂度进一步降低至一阶。</p><ul><li>先进行矩阵分解,基于分解的结果将计算复杂度降低到二阶。</li><li>用增量的方式更新参数,绕过求解线性方程组的部分,将复杂度进一步降低到一阶。</li></ul><p>由此,行列式的求解过程由三阶降低到一阶,满足了线上的性能,上图最下方给出的paper就是相关方向的论述。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/343326d38df34378ae0a9b33fd5f3034.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在线上做多样性的相关实验,我们较关注的系统和数据两部分,都有明显收益:</p><ul><li>系统收益,作为一个ugc平台,会考量推荐系统分发覆盖了多少创作者、覆盖了多少作品以及内容的时效性,从上图右侧三条曲线可见,在加入多样性的控制后,三个指标都有稳步的提升。</li><li>数据收益,有关播放时长、关注渗透、点赞渗透相关的指标都有1~2个点的提升,这也体现了多样性是有必要的,因为它相当于对pointwise进行了简单的listwise化,形象化阐述就是,用户浏览多个session时,多样性调节避免了同质化内容扎堆。</li></ul><h2>5.4  DPP优化</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/6fbb98a7f2a2477d84c1dade671e47f9.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>针对上述基于多样性和相关性构建矩阵L的过程,有两方面可以做进一步优化:</p><ul><li>多样性本质上是定义什么样的item是相似的,用相似矩阵刻画这种相似关系。在我们K歌平台,会做一些内容的混排,比如音频跟视频的混排,如果在原始的item embedding构建出来的item similarity matrix基础上,加入一些预设的先验信息,判断什么样的item是更相似的,比如音频跟音频间更相似,视频跟视频间更相似,那么它最后的度量目标就加入了对作品类型的考量,这就间接实现了内容的混排。</li><li>相关性本质上是定义什么样的item更匹配当前用户,之前都是从消费者的角度去考量用户更喜欢什么样的item,而我们作为一个ugc平台,很多时候也要考量什么样的item更适合被分发,比如某item是不是更有平台的画风,更符合我们对内容分发的理解,这时,就是从平台系统或者生产者的角度去理解什么样的item更应该被优先推荐。如果已知一部分item更需要被优先推荐,在构建用户跟item间的相关性分时,可以对relativity score加调节权重进行干预,实现流量分配。比如,如果要使乐器类item比其他item有更高的权重,这时,可以调高乐器类item和用户的匹配权重。</li></ul><p>综上可知,DPP不只是一个多样性或相关性的度量,它本身是一种调控方式,具体调控的量和业务场景相关,具有非常大的挖掘空间。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 02:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386964</guid>
            <link>https://aijishu.com/a/1060000000386964</link>
        </item>
        <item>
            <title><![CDATA[反其道而行,大学教授鼓励学生用 ChatGPT 写论文]]></title>
            <description><![CDATA[<p>新 AI 工具 ChatGPT 的到来,正在教育圈呈现出冰火两重天的态势,教授们几家欢喜几家愁。</p><p>这不近日,来自宾夕法尼亚大学沃顿商学院的一位专门研究创业与创新的资深教授 Ethan Mollick 发表了一篇长文呼吁,让学生拥抱 ChatGPT,也可以使用 ChatGPT 写论文,因为只有这样,才能让学生们经过事实核查从而能够很快理解 AI 的准确性和偏见问题。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPr" alt="1.png" title="1.png"></p><h2>反其道而行:使用 ChatGPT,大学生快上车!</h2><p>作为大学教授,这一不走寻常路的举措,引发了不少人的关注。</p><p>毕竟此前据调查显示,美国 89% 的大学生在用 ChatGPT 做作业。当时的这个结果让很多教育界的高校老师都感到头疼,来自弗曼大学哲学助理教授 Darren Hick 也曾发文斥责,「ChatGPT 都成学生的作弊神器了,这让我感到极度恐惧。」</p><p>为了让学生能够潜下心踏踏实实地学习,国内外多所学校发布相应应对措施,如美国纽约市教育部宣布,纽约市的学生和教师,无法再在教育部设备或互联网上访问 ChatGPT;斯坦福研究人员推出了 DetectGPT,便于检测出 AI 生成文本;香港大学向师生发出内部邮件,明确禁止在港大所有课堂、作业和评估中使用 ChatGPT 或其他 AI 工具......</p><p>可以说,ChatGPT 诞生的近三个月间,尤其是老师群体反对的声音颇为强烈。Ethan Mollick 如今的做法,似乎在反其道而行。</p><p>不过,在 Ethan Mollick 教授看来,倘若一味地禁止,只会适得其反。当然,也不能完全地放任学生使用 AI 工具而不顾,得有教学策略。</p><p>他表示,过去一学期已经在课堂上完全接受 AI 的存在,也会要求学生以多种方式使用 AI 工具。通过实践,Ethan Mollick 给出直观的总结:太好用了!而且我还已经学到了一些我认为值得传承的早期课程。效果非常成功,但也有一些教训要吸取。</p><h2>学术中使用 ChatGPT 的前提条件</h2><p>首先,在大的背景上,Ethan Mollick 教授要求在三个独立的面向本科和硕士级别的创业和创新课程中以稍微不同的方式使用 AI。具体模式如下:</p><ol><li>第一门课程整体建立在广泛使用人工智能的基础上。其要求学生使用人工智能来帮助他们产生想法、制作书面材料、帮助创建应用程序、生成图像等等。</li><li>第二门课程中的作业要求学生使用 AI。</li><li>第三门课程中,Ethan Mollick 向学生介绍了 AI 工具并提出了使用建议,但没有具体的 AI 作业。<br>在三种不同的课程中,Ethan Mollick 使用了相同的 AI 政策:</li></ol><p>我希望你在这门课上使用 AI(至少是 ChatGPT 和图像生成工具)。学习使用人工智能是一项新兴的技能,我在 Canvas 中提供关于如何使用它们的教程。我很乐意在办公时间或课后与学生见面并帮助他们使用这些工具。</p><p>请注意使用 ChatGPT 的限制:</p><ul><li>如果你提供最少的描述提示,你会得到低质量的结果。你需要改进你的提示,以获得良好的结果。这一点非常有用。</li><li>不要相信它说的任何东西。如果它给你一个数字或事实,除非你知道答案或可以通过其他来源查询验证,否则就一定要认为它是错误的。你将对该工具提供的任何错误或遗漏负责。它对你理解的主题效果最好。</li><li>Al 是一个工具,但你需要承认它的使用。请在任何使用人工智能工具的作业的结尾处附上一段话,解释你使用人工智能的目的以及你使用什么提示来获得结果。如果不这样做,就违反了学术诚信政策。</li><li>这个工具在用的时候要深思熟虑。如果它不适合相关的案例或情况,就不要使用它。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPs" alt="2.png" title="2.png"></li></ul><h2>没有培训,每个人都用错了 AI</h2><p>Ethan Mollick 表示,“我一直听到老师抱怨,说他们看到很多写得不好的人工智能文章,尽管 ChatGPT 其实能够写得相当好。我想我知道为什么,几乎每个人在使用人工智能方面的最初尝试都很糟糕。”</p><p>因此,他为了找到原因,在布置的一次作业中,要求学生用 ChatGPT "作弊"。学生们需要写一篇 5 段话的文章,题目与大家在课堂上学到的课程有关(如团队动力、选择领导者、行动后的回顾反思、沟通愿景,随大家自由选择)。前提条件是要让 AI 来写,同时这篇文章里面至少要插入 1 张应景的图片,且学生必须至少提供 5 个描述,而且他们必须在最后写一份关于人工智能如何做的反思稿件。</p><p>经过测试,Ethan Mollick 发现几乎每个学生提供的第一个描述提示都是非常直接了当的,他们往往会直接复制作业的要求,往 ChatGPT 的对话窗口粘贴,等待结果的自动生成,然后再将结果复制粘贴到新文本中,提交给老师审阅,由此出现了大多数老师疯狂吐槽各种论文的场景。</p><p>不过,在 Ethan Mollick 布置的作业中,其要求学生使用多个提示,这迫使学生不断思考如何提高 AI 产出内容的质量。在这一点上,学生们经过多轮的描述,往往会朝着下面三个方向走去:</p><p><strong>方法 1 :细微地变化,让 AI 完成作业</strong></p><ol><li>生成一篇关于选择领导者的 5 段话文章</li><li>生成一篇关于团队如何选择领导者的 5 段话文章</li><li>生成一篇关于团队如何选择领导者以及团队流程如何运作的 5 段话文章</li><li>生成一篇关于如何通过团队、团队流程和领导能力选择领导者的 5 段话文章</li><li>生成一篇关于如何通过团队、团队流程和领导能力选择领导者的 5 段话文章,250 字。</li></ol><p><strong>方法 2:增加一些限制和专业知识</strong></p><ol><li>生成一篇关于选择领导者的 5 段话文章</li><li>生成一篇关于选择领导者的 5 段话文章,内容包括:能说会道的能力、领导者地位影响和资历</li><li>生成一篇关于选择领导者的 5 段话文章,内容包括:能说会道的能力、领导者地位影响和资历。解释谁能说会道,谁就能成为领导者。</li><li>生成一篇关于选择领导者的 5 段话文章,内容包括:能说会道的能力、领导者地位影响和资历。解释谁能说会道,谁就能成为领导者。并举例说明。使用生动的语言,并从一个回国攻读 MBA 的管理顾问的角度出发。为 MBA 课程的教授写一篇关于团队战略和企业家精神的文章。</li><li>生成一篇关于选择领导者的 5 段话文章,内容包括:能说会道的能力、领导者地位影响和资历。解释谁能说会道,谁就能成为领导者。考虑每种能力的挑战和优势。举例说明。使用主动时态和讲故事的方式。使用生动的语言,并从一个回国攻读 MBA 的管理顾问的角度出发。为 MBA 课程的教授写一篇关于团队战略和企业家精神的文章。</li></ol><p><strong>方法 3:共同编辑</strong></p><ol><li>生成一篇关于选择领导者的 5 段话文章</li><li>那很好,但第三段不对。能说会道是指谁说得最多,谁就能成为领导者。纠正这一点,并增加更多关于如何使用这种能力的细节。在第 2 段中增加一个示例</li><li>第 2 段的示例不对,总统选举是每 4 年举行一次。让最后一段的语气更有趣。不要用 "总而言之 "这个短语</li><li>给我三个可以用在第 4 段中的示例,并确保它们具有更多的故事性和更生动的语言。不要使用仅以男性为特征的例子。</li><li>把这一段加回到故事中去,把第二段换成关于个人领导风格的一段。修正最后一段,使文字在以充满希望的感情上结束。</li></ol><p>毋庸置疑,第一种只有细微的修改,让 ChatGPT 生成的内容显得非常平庸,还很空洞。</p><p>第二种方法明显要好得多,但结果却不可控,因为学生要根据整个提示进行反复试验。这使得对一篇好文章进行微调变得很困难,使用这种方法的学生经常反馈称,他们觉得自己对 AI 的输出没有太多的控制权。</p><p>到目前为止,最好的方法便是第三种——采取“AI+人工”共同编辑的方法,这往往会带来一篇令人影响深刻的论文。不过,这种方法需要学生非常仔细地关注 AI 的输出,这也使得它对学生的学习非常有用。</p><p>因此,Ethan Mollick 建议,如果高校的老师们打算将 AI 引入进自己的课堂,那么第三种方式最为推荐。</p><h2>上至 CEO,下至程序员,ChatGPT 无处不在</h2><p>现如今,无论是否接受,AI 已经渗透到学术、产业、研究等领域。据《华尔街日报》最新报道,上至 CEO,下至程序员,从传统互联网公司 Google、微软、Netflix 再到石油和天然气生产商 Devon Energy,很多公司已经开始尝试使用生成式人工智能技术。</p><p>“它所服务的目的不是让你知道你不知道的事情。这真的是一个工具,让你能够更好地做你的工作”,人工智能研究初创公司 Hugging Face 的首席伦理科学家 Margaret Mitchell 说道。</p><p>对于学术界而言,学生本是一张空白纸,如果在新技术到来之际,与其想着如何避免学生去接触,Ethan Mollick 认为可以花更多的时间引导学生如何正确使用 AI 工具,譬如 ChatGPT 生成的内容质量与提示语有很大的相关性,很多学生在没有引导下使用,只会提供一个非常简单的描述,如上述方法 1 所示。因此,对 AI 工具的培训真的很重要,需要向学生展示提示语制作的基本知识。</p><p>最后,Ethan Mollick 对所有的老师呼吁,不要总是担心学生会被 ChatGPT 生成的虚假内容所吸引。事实上,如果遵循自己对自己论文中的事实负责原则,很多学生会进一步去进行查证,也有能力理解工具的局限性,对事实的查找学习会迫使学生进一步关注 AI 论文的细节,创造一些真正的可教时刻。</p><blockquote>参考链接:<br><a href="https://aijishu.com/link?target=https%3A%2F%2Foneusefulthing.substack.com%2Fp%2Fmy-class-required-ai-heres-what-ive" target="blank">https://oneusefulthing.substa...</a></blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 02:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386961</guid>
            <link>https://aijishu.com/a/1060000000386961</link>
        </item>
        <item>
            <title><![CDATA[特斯拉重新捡回来的毫米波雷达,下一步脚落何处?-IOTE物联网展]]></title>
            <description><![CDATA[<p>一石激起千层浪。</p><p>最近,特斯拉又有大动作——搭载4D毫米波雷达的特斯拉要来了。</p><p>日前,Twitter博主Greetheonly曝光了特斯拉全新HW4.0硬件,指出该产品具备至少两个以太网接口。与此同时,近日特斯拉也向欧洲监管机构提交的车辆变更申请,证实最新自动驾驶硬件HW4.0即将量产上车。据悉,在即将到来的HW 4.0硬件系统中,特斯拉配置了一枚高精度4D毫米波雷达,且该车型可能率先在中国工厂生产。</p><p>曾经因“幽灵刹车”现象一直被人诟病,特斯拉一度抛弃了毫米波雷达,而且还提出“纯视觉方案”。如今,特斯拉又重新捡回毫米波雷达,引得“毫米波雷达”相关概念股在“狂飙”。</p><p>为何特斯拉重新拾回毫米波雷达?</p><p>毫米波雷达,是一种工作在毫米波频段(millimeter wave)的雷达传感器,可以精准探测目标的距离、速度、方位角和微动等信息。</p><p>毫米波雷达最早于1940年代开始研制,70年代中后期取得技术突破,90年代后期开始批量应用于车载领域,2000年后锗硅技术提高芯片集成度、降低成本,毫米波雷达迎来爆发式增长,2021年后技术较为成熟,成为主力传感器之一,未来将会向4D毫米波雷达路线发展。</p><p>4D毫米波雷达,又称4D成像毫米波雷达。所谓的4D,就是指在原有“距离、方位、速度”的基础上增加了对目标“高度”数据的解析,能够实现“3D+高度”四个维度的信息感知。</p><p>相比于普通毫米波雷达,4D毫米波雷达具有广视角、高精度、高分辨、能探测静物等优势;而且相较于激光雷达,它的成本也比较低。</p><p>了解特斯拉的都知道,特斯拉经常出现“幽灵刹车”等安全问题,而造成这种现象的重要原因是特斯拉曾配置的性能较差的ARS-4B毫米波雷达而促成的。对此,2021年特斯拉抛弃了毫米波雷达,并提出了“摄像头+算法”的纯视觉方案。</p><p>不过,现在的4D毫米波雷达比普通毫米波雷达的性能有了大大的提升,除了在原来距离、速度、方位等数据信息的基础上,4D毫米波雷达还增加了被测目标俯仰角的高度信息,并在速度分辨率等多方面均有提升,可通过高分辨率点云来感知汽车周围环境,增强了环境测绘和场景感知的能力,有效地弥补了传统毫米波雷达的性能短板。</p><p>德邦证券发布研究报告称,在L2+层级上,通过前置1颗4D毫米波雷达能够基本涵盖毫米波&amp;激光雷达的功能需求。因此,笔者认为,这极有可能也是特斯拉重新拾回毫米波雷达的重要原因。</p><p>“赛车手”过招</p><p>4D毫米波雷达或成主战场</p><p>得益于汽车产业的快速发展,尤其是汽车智能化、网联化的趋势越发显著,毫米波雷达市场需求十分旺盛。</p><p>作为ADAS的重要感知元器件,毫米波雷达并不仅仅只是一个硬件设备,它需要与车辆适配,才能较好地实现相应的功能。</p><p>在智能汽车L0~L2阶段,毫米波雷达主要应用于自动紧急制动、自适应巡航、前向碰撞预警、盲区监测、后向碰撞预警、倒车车侧预警、开门预警、自动泊车、变道辅助、乘客成员监测、驾驶员生命体征监测、手势识别等等。</p><p>根据GGAI、AIOT星图研究院整理统计,2022年1-6月中国市场(不含进出口)乘用车新车前装标配搭载前向毫米波雷达361.12万颗,同比增长12.55%;标配搭载角雷达(含后向)384.15万颗,同比增长37.89%。按照目前的新车搭载增速,预计2022年中国市场乘用车毫米波雷达搭载量将升至1800万颗左右。</p><p>现阶段,ADAS的市场渗透率还在不断攀升,尤其是伴随着自动驾驶等级的提升以及市场对自动驾驶能力需求的不断升级,市场对毫米波雷达的性能提出了更高的要求,而有着比普通毫米波雷达更高性能的4D毫米波雷达,成为了各车企的“眼中钉”,且4D毫米波雷达的渗透率也在逐渐增加。根据市场调研机构Yelo预测,2027年全球4D毫米波雷达市场将达到35亿美元。</p><p>当前,4D毫米波雷达这个赛道已经涌入诸多玩家,包括国外的Arbe、Waymo、大陆集团、采埃孚、安波福、博世、RADSee、Smart Radar等,以及国内的华为、华域汽车、森思泰克、安智杰、木牛科技、承泰科技、纳瓦电子、复睿智行、苏州毫米波、华域、楚航科技、威孚科技、几何伙伴等等。</p><p>此次特斯拉采用4D毫米波雷达的消息曝光后,更是带动了“4D毫米波雷达”概念股的涨停,预计将利好射频前端、信息处理系统以及后端算法。据盖世汽车研究院,射频部分占比约40%,其中MMIC(25%)、PCB(10%)、其他(5%),信息处理系统DSP占比10%,后端算法占比最高达50%。</p><p>综上所述,不难得出,在汽车智能化、网联化的催生下,毫米波雷达的成长速度会越来越快,其市场也会得到快速增长。</p><p>活力无限</p><p>毫米波雷达市场广阔</p><p>当然,不止于车端应用市场,毫米波雷达也常常被应用于交通、安防、工业、家居、康养等领域上。</p><p>在全球智能化变革浪潮之下,汽车、交通、安防、工业、家居、健康监护等诸多产业的蓬勃发展,创造了巨大的感知产品增量需求。</p><p>在交通领域,交通堵塞是许多城市发展都需要面临的难题,将毫米波雷达应用在车路协同系统,可以同时监控多个车道的平均速度、车流量、车道占有率等交通流基本信息,并根据交通流信息有效地调整交通信号灯,提高道路通行效率(可提高 10%),促进节能减排(可降低 10%-15% 的油耗),有效减轻交通堵塞等问题。当下,随着中国车路协同市场的发展,毫米波雷达的需求量也将随之上涨。</p><p>在智能家居、健康监护领域,毫米波雷达的应用案例也在不断增加。由于毫米波雷达可以监测到人体呼吸、心跳等健康信息,在全屋智能中也可实现精准的人体存在感知,从而与室内照明、窗帘、空调等产生联动;同时,随着老龄化进程的加速,毫米波雷达与智慧养老相结合已演化出跌倒报警、睡眠监控等很多新用例。</p><p>当然,还有安防、工业、民航、船舶等其他领域也应用了毫米波雷达,更多详细内容可见《中国毫米波雷达市场调研报告(2022年)》。</p><p>可以预见的是,智慧交通、智能家居、健康监护、安防、工业等领域,均是毫米波雷达的重要潜在市场。</p><p>未来,随着我国汽车、交通、安防、工业、家居、康养等产业的智能化升级不断推进,毫米波雷达的应用将进一步扩大。预计到2026年中国毫米波雷达市场规模将达到197亿元,年复合增长率为23.3%。</p><p>写在最后</p><p>不论是特斯拉采用4D毫米波雷达,还是眼下“毫米波雷达”相关概念股的涨停,可以肯定的是,随着中国各产业领域智能化、数字化的转型升级,必将给毫米波雷达创造更多的应用市场。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 02:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386952</guid>
            <link>https://aijishu.com/a/1060000000386952</link>
        </item>
        <item>
            <title><![CDATA[推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结]]></title>
            <description><![CDATA[<h1>0.前言:召回排序流程策略算法简介</h1><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/44083e4c130841f894e36366a71f8d96.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>推荐可分为以下四个流程,分别是召回、粗排、精排以及重排:</p><ol><li>召回是源头,在某种意义上决定着整个推荐的天花板;</li><li>粗排是初筛,一般不会上复杂模型;</li><li>精排是整个推荐环节的重中之重,在特征和模型上都会做的比较复杂;</li><li>重排,一般是做打散或满足业务运营的特定强插需求,同样不会使用复杂模型;</li></ol><ul><li><p><strong>召回层</strong>:召回解决的是从海量候选item中召回千级别的item问题</p><ul><li>统计类,热度,LBS;</li><li>协同过滤类,UserCF、ItemCF;</li><li>U2T2I,如基于user tag召回;</li><li>I2I类,如Embedding(Word2Vec、FastText),GraphEmbedding(Node2Vec、DeepWalk、EGES);</li><li>U2I类,如DSSM、YouTube DNN、Sentence Bert;</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/b935ff75e3e84d7f88de39613bb02bad.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p></li><li><strong>模型类</strong>:模型类的模式是将用户和item分别映射到一个向量空间,然后用向量召回,这类有itemcf,usercf,embedding(word2vec),Graph embedding(node2vec等),DNN(如DSSM双塔召回,YouTubeDNN等),RNN(预测下一个点击的item得到用户emb和item emb);向量检索可以用Annoy(基于LSH),Faiss(基于矢量量化)。此外还见过用逻辑回归搞个预估模型,把权重大的交叉特征拿出来构建索引做召回</li><li><p><strong>排序策略</strong>,learning to rank 流程三大模式(pointwise、pairwise、listwise),主要是特征工程和CTR模型预估;</p><ul><li><p><strong>粗排层</strong>:本质上跟精排类似,只是特征和模型复杂度上会精简,此外也有将精排模型通过蒸馏得到简化版模型来做粗排</p><ul><li>常见的特征挖掘(user、item、context,以及相互交叉);</li></ul></li><li><p><strong>精排层</strong>:精排解决的是从千级别item到几十这个级别的问题</p><ul><li><strong>CTR预估</strong>:lr,gbdt,fm及其变种(fm是一个工程团队不太强又对算法精度有一定要求时比较好的选择),widedeep,deepfm,NCF各种交叉,DIN,BERT,RNN</li><li><strong>多目标</strong>:MOE,MMOE,MTL(多任务学习)</li><li><strong>打分公式融合</strong>: 随机搜索,CEM(性价比比较高的方法),在线贝叶斯优化(高斯过程),带模型CEM,强化学习等</li></ul></li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c764dfd7b65048f3a2ab2b97214135a3.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p></li><li><strong>重排层</strong>:重排层解决的是展示列表总体最优,模型有 MMR,DPP,RNN系列(参考阿里的globalrerank系列)</li><li><p><strong>展示层</strong>:</p><ul><li><strong>推荐理由</strong>:统计规则、行为规则、抽取式(一般从评论和内容中抽取)、生成式;排序可以用汤普森采样(简单有效),融合到精排模型排等等</li><li><strong>首图优选</strong>:CNN抽特征,汤普森采样</li></ul></li><li><strong>探索与利用</strong>:随机策略(简单有效),汤普森采样,bandit,强化学习(Q-Learning、DQN)等</li><li><strong>产品层</strong>:交互式推荐、分tab、多种类型物料融合</li></ul><h1>1.淘宝逛逛召回算法实践总结</h1><p>内容化这几年越来越成为电商的重点,用户来到网购的时候越来越不局限在只有明确需求的时候,而更多的是没有明确需求的时候,就像是逛街一样。逛逛就是在这样的背景下诞生的内容化产品,打造出有用、有趣、潮流、奇妙、新鲜的内容,为消费者提供全新的内容消费体验。在这个场景下的内容召回有很多问题需要探索,其中主要的特点和挑战有:</p><ol><li><strong>强时效性</strong>:内容推荐场景下的内容新旧汰换非常快,新内容的用户行为少,很难用用户历史行为去描述新内容,而用户行为正是老内容投放主要的依赖。所以当不能依靠用户行为数据来建模内容之间关系的时候,我们必须要找到其他可以表征内容的方法。</li><li><strong>多兴趣表征</strong>:多兴趣表征,特别是多峰召回是这几年比较主流的一个趋势。但是目前多峰模型中峰的数量是固定的,当用户行为高度集中的时候,强制的将用户行为拆分成多向量,又会影响单个向量的表达能力。如何去平衡不同用户行为特点,特别是收敛和发散的兴趣分布,就成了此类任务的挑战。</li></ol><p>在设计优化方向的时候,我们重点考虑上面描述问题的解法(召回本身也需要兼顾精准性和多样性,所以单一召回模型显然无法满足这些要求,我们的思路是开发多个互补的召回模型)。详细的介绍在后面的章节以及对应的后续文章中展开:</p><ol><li><strong>跨域联合召回</strong>:除了单纯把多域的信息平等输入到模型中,如何更好利用跨域之间的信息交互就变的尤为重要。目前有很多优秀的工作在讨论这样的问题,比如通过用户语义,通过差异学习和辅助loss等。我们提出了<strong>基于异构序列融合的多兴趣深度召回模型CMDM</strong>(a cross-domain multi-interest deep matching network),以及<strong>双序列融合网络Contextual Gate DAN</strong> 2种模型结构来解决这个问题。</li><li><strong>语义&amp;图谱&amp;多模态</strong>:解决时效性,最主要的问题就是怎么去建模新内容,最自然的就是content-based的思想。content-based的关键是真正理解内容本身,而content-based里主要的输入信息就是语义,图像,视频等多模态信息。目前有许多工作在讨论这样的问题,比如通过认知的方式来解决,多模态表征学习,结合bert和高阶张量等方式等等。在语义召回上,我们不仅仅满足于语义信息的融入,还通过<strong>Auxiliary Sequence Mask Learning</strong>去对行为序列进行高阶语义层面的提纯。更进一步,我们利用内容图谱信息来推荐,并且引入了个性化动态图谱的概念。对于新老内容上表达能力的差异问题,我们通过<strong>multi-view learning</strong>的思想去将id特征和多模态特征做融合。</li><li><strong>泛多峰</strong>:为了解决多峰强制将兴趣拆分的问题,我们考虑到单峰和多峰的各自特点,特别是在泛化和多样性上各自有不同的建模能力。基于此,我们提出了泛多峰的概念。</li></ol><h2>1.1 跨域联合召回</h2><h3>1.1.1 基于异构序列融合的多兴趣深度召回</h3><p>在单一推荐场景下,深度召回模型只需要考虑用户在当前场景下的消费行为,通过序列建模技术提取用户兴趣进而与目标商品或内容进行匹配建模。而在本推荐场景下,深度召回模型需要同时考虑用户内容消费行为和商品消费行为,进行跨场景建模。为此,我们提出了CMDM多兴趣召回模型架构,能够对用户的跨场景异构行为序列进行融合建模。在CMDM中,我们设计了用于异构序列建模的层级注意力模块,通过层级注意力模块提取的多个用户兴趣向量与目标内容向量进行匹配建模。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/5ec96266756549119c23db2c1be555e4.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h3>1.1.2 双序列融合网络Contextual Gate DAN</h3><p>除了通过层次注意力的方式,异构序列中还有个特点就是在时间上更接近交叉并存的状态。为了学习到两个序列之间的信息交叉,充分融合商品点击序列和内容点击序列,我们从自然语言处理的VQA任务中得到启发。VQA是用自然语言回答给定图像的问题的任务,常用做法是在图片上应用视觉注意力,在文本上应用文本注意力,再分别将图片、文字多模态向量输入到一个联合的学习空间,通过融合映射到共享语义空间。而DAN结构是VQA任务中一个十分有效的模型结构,DAN通过设计模块化网络,允许视觉和文本注意力在协作期间相互引导并共享语义信息。我们对DAN结构进行了改进,设计了Contextual Gate DAN 双序列融合网络:</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/667c7ec2baa446828f102eeecca1430e.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h2>1.2 语义&amp;图谱&amp;多模态</h2><h3>1.2.1 多模态语义召回</h3><p>在内容推荐场景内,存在大量新内容需要冷启动,我们主要通过语义和多模态2种方式。相对于搜索任务,语义匹配是一个从单点到多点,解空间更大更广的问题。首先是用户行为的不确定性,内容推荐场景下用户决策空间更大更广,从而导致用户对推荐系统的反馈信号本身就存在较大的不确定性;再就是语义空间表达的对齐问题,这里的对齐包含两个方面,第一个方面是单个序列里的内容表达的语义标签提取方式差别大(比如cpv、分词、语义标签、多模态表征等等),另外一个方面是多序列(内容和商品等)之间的语义空间对齐问题。多模态的召回方式融合了文本,图像,音频等大量模式跨域信息,由于与内容互动解耦,在缓解内容冷启动上具有一定的优势。多模态召回主要是通过理解内容多模态表征,先后进行了collaborative filtering、聚类中心召回、个性化多模态表征相关的探索工作,在多样性方面取得了一定的效果,深度语义召回方面针对用户行为去噪和更好的表达语义信息角度出发,迭代了cate-aware和query-aware和序列mask 自监督任务的模型。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/b02b18f872a848f1836a56964dc7665b.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h3>1.2.2 行为稀疏场景下的图模型实践</h3><p>更进一步,我们利用内容图谱信息来推荐。知识图谱构建的出发点就是对用户的深度认知,能够帮助系统以用户需求出发构建概念,从而可以帮助理解用户行为背后的语义和逻辑。这样可以将用户的每次点击行为,都用图谱的形式极大的丰富,图谱带来的可解释的能力还可以大大加快模型的收敛速度。知识图谱有个特点,就是其中的信息是相对固定的,或者说是静态的,因为知识图谱基本是由先验信息构成的。但是从各个用户的角度,知识图谱的数据中的链接重要度并不相同。比如一个电影,有的用户是因为主演看的,有的用户是因为导演看的,那么这个电影连接的主演边和导演边的权重就因人而异了。我们提出了一种新的方法来融合用户动态信息和静态图谱数据。每个行为都用图谱扩展,这样行为序列变成行为图谱序列, 并且加入KnowledgeGraph-guided gating的自适应的生成式门控图注意力,去影响知识图谱融入到模型中的点边的权重。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/1574f85900324ef58bf47f0ee8f25524.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h3>1.2.3 融合多模态信息的跨模态召回</h3><p>针对新内容冷启动的问题,我们提出了跨模态召回模型来兼顾content-based和behaviour-based的召回各自的优点。在跨模态召回模型构建前,我们首先引入了多模态meta信息为主的“语义” deep collaborative filtering召回,两者的显著差别主要在target side的特征组成中相较与behaviour-based的特征,多模态特征构建的模型去除了影响较大的内容id类的特征,将这些特征更换为了来自多模态预训练技术得到的多模态表征输入。除了上面的变化,我们还加入了triplet loss的部分使得embedding空间更具有区分度,效率指标也有了较大幅度的提升。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f0608e9fe8244ac7acf46b3c22ced524.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h2>1.3 用户多兴趣表征(多模型簇联合学习):泛多峰</h2><p>多峰召回模型通过对用户侧产生多个表征不同“兴趣”的向量进行多个向量的召回,是对于单峰的一个拓展,将单个用户的表达扩展成了多个兴趣表达, 更精确地刻画了用户, 从而取得更好的效果。我们通过对于单峰模型及多峰模型的观察发现,用户行为高度集中的序列单峰模型的线上效率相对于多峰模型会更有优势,而那些用户序列类目丰富度较高的则多峰模型的效率明显占优。所以这里提出了泛多峰u2i模型的概念,尝试将多峰模型容易拟合行为序列类目丰富度较高的用户,而单峰模型则更容易拟合行为序列类目丰富度较为集中的用户的优势进行结合。使得单一模型能够通过产生不同算法簇的多个不同表征的向量在不同簇的内容向量中进行召回,从而具备这两种召回范式的优点。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f9b12f3921e944289369a5f57d5e2301.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h2>1.4 提升优化:</h2><p>▐  认知推荐</p><p>我们正在尝试,将图谱用于user embedding投影,投影的平面空间就是语义空间,这样做到可控多维度语义可解释embedding。另外,对于召回,采样方式对模型效果影响非常大,结合知识图谱来进行graph-based Learning to sample的优化,对于正负样本的选取更加做到关联可控,加快迭代速度,提升效果。</p><p>▐  兴趣破圈</p><p>在内容化推荐领域,仅仅相似度提高的优化,会导致用户没有新鲜感,对平台粘性变低。如何帮助用户探索他更多的兴趣,是现在内容化推荐亟待解决的另一个问题。一种做法是兴趣近邻,从已有兴趣出发,慢慢通过兴趣之间的相似,扩展用户未知的领域,可以参考MIND,CLR一些思路。另一种做法是对兴趣构建推理引擎,在对已有兴趣推理过程建模之后,加入扰动来探索用户可能新的兴趣。</p><h1>2.阿里飞猪个性化推荐:召回篇</h1><blockquote>常见的有基于user profile的召回,基于协同过滤的召回,还有最近比较流程的基于embedding向量相似度的topN召回等等。方法大家都知道,但具体问题具体分析,对应到旅行场景中这些方法都面临着种种挑战。例如:旅行用户需求周期长,行为稀疏导致训练不足;行为兴趣点发散导致效果相关性较差;冷启动用户多导致整体召回不足,并且热门现象严重;同时,具备旅行特色的召回如何满足,例如:针对有明确行程的用户如何精准召回,差旅用户的周期性复购需求如何识别并召回等。</blockquote><p>本次分享将介绍在飞猪旅行场景下,是如何针对这些问题进行优化并提升效果的。主要内容包括:⻜猪旅行场景召回问题、冷启动用户的召回、行程的表达与召回、基于用户行为的召回、周期性复购的召回。</p><h2>2.1 飞猪旅行场景召回问题</h2><p>推荐系统流程</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/a1144942282b46bfb5b6be5179c2a300.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>首先介绍推荐的整体流程。整体上分为5个阶段。从全量的商品池开始,之后依此是召回阶段,粗排/精排阶段,最后的混排模块根据业务实际情况而定,并不是大多数推荐系统必须的。粗排和精排在另外一次分享中已经介绍过了,本次分享主要介绍一下飞猪推荐系统的召回问题,召回可以说决定了推荐系统效果的上限。</p><p>下面说一下召回和粗排/精排的区别。从召回到粗排再到精排模块,商品的数据量是递减的,模型的复杂度会增高。具体会体现在输入特征数量和模型复杂度的增加,更新往往也会更频繁。对应的训练和上线的方式也会不同,拿召回来讲,出于性能的考虑,往往采用离线训练+打分或者离线训练得到向量表达+向量检索的方式,而排序阶段为了更好的准确率和线上指标,更多的是离线训练+实时打分,甚至在线学习的方式。</p><p>召回的本质其实就是将用户和商品从不同维度关联起来。常见的方法比如content-base匹配,或者item/user based的协同过滤,还有最近比较流行的向量化召回。向量化召回常用做法是用深度学习将用户和商品都表达成向量,然后基于内积或欧式距离通过向量检索的方式找到和用户最匹配的商品。</p><h3>2.1.1 飞猪推荐场景</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c8a47ed183f14473b1b8b35f371f8784.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>飞猪的推荐页面有很多,比如首页,支付成功页,订单列表页,订单详情页都有猜你喜欢。不同页面对应了不同的场景,用户在不同场景下需求不同,也有一定的交叉。比如首页偏重逛/种草,但支付完成后推荐一些与订单相关的商品会更好。</p><p><strong>我们大致可以把用户分为三类:无行为、有行为,还有一种是飞猪场景下特殊的一类"有行程"。</strong></p><h3>2.1.2 主要问题</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/46d789608a884377baa09b9b5f9b59fe.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>本次分享的主要内容就是针对这三类用户在推荐过程中存在的问题+周期性复购场景 ( 出差/回家 ) 的解决。<br>航旅场景下的召回存在以下问题:</p><ul><li>冷启动:航旅商品的热门现象严重,user profile缺乏。</li><li>相关性vs搭配性:航旅场景下要求搭配性比较高,传统的I2I只偏重相关性。但用户的行程需求不是单点的,比如买了飞机票还要看住宿。行程受上下文影响比较多,比如季节、用户近期行为等。</li><li>相关性不足:航旅用户的行为稀疏又发散,目前的召回结果噪音较多。</li></ul><p>下面会对我们在优化过程中碰到的相关问题一一介绍。我们知道,召回处于推荐链路的底端,对召回常规的离线评估方式有预测用户未来点击的TopN准确率或者用户未来点击的商品在召回队列中平均位置等等。但是在工业系统中,为了召回的多样性和准确率,都是存在多路召回的,离线指标的提高并不代表线上效果的提升,一种常见的评估某路召回效果的方式就是对比同类召回通道的线上点击率,这种评估更能真实反映线上的召回效果,基于篇幅的考虑,后面的介绍主要展示了线上召回通道点击率的提升效果。</p><h2>2.2 冷启动用户召回</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/fd4c807bdd794d1091442f3d2a8dbd44.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h3>2.2.1 User冷启动召回</h3><p>用户冷启动召回主要有以下几种方案:Global Hot、Cross Domain、基于用户属性的召回。</p><ul><li>全局热门:缺点是和user无关,相关性差。</li><li>Cross domain:一种做法是基于不同域 ( 例如飞猪和淘宝 ) 共同用户的行为将不同域的用户映射到同一个向量空间,然后借助其他域的丰富行为提升本域冷启动用户的召回效果。</li><li><p>基于用户属性:单一属性的缺点是热门现象严重,个性化不足。我们采用了基于多属性组合的方法。</p><h3>2.2.2 UserAttr2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/ba11bfc0cdf24de6aa4fff068a31e847.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在这里介绍我们的方案UserAttr2I,使用类似排序模型的方法,输入用户+商品的属性,预测用户是否会点击一个商品。</p></li></ul><p>开始用线性FTRL模型,效果不是很好。原因是线性模型无法学习高阶特征,并且解释性比较差。针对这两个问题,通过DeepNet提高泛化性,同时用GBDT来做特征筛选。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/6724c7ef758a44c285efebb7ad1e642e.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>下面对比双塔结构和深度特征交叉两种方案,优缺点如图所示。最终选择了第二种,原因是目标用户是冷启动,能用到的特征比较少。如果放弃挖掘用户和宝贝之间的关系会导致相关性比较差。模型结构如下:<br><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/1c8b8e0fc2d54d3b9059cb59a0018e36.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>通过attention操作以及GBDT的叶子节点即可满足冷启动的可解释性。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/95ce5cec11004ae2b66176a7ca5d6f0b.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>对比其他冷启动的召回方式,Attribute2I的点击率最高。</p><h2>2.3 行程的表达与召回</h2><h3>2.3.1 Order2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c141e0757d8645c4b2c6a47ada2cea16.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在飞猪场景下用户有类似如下的需求:买了去某地的机票,用户很可能需要与之搭配的签证/wifi/酒店等等,而协同过滤通常只能推出同类型商品,比如门票推门票,酒店推酒店。另外飞猪不像淘宝用户可能会经常逛,有比较丰富的历史行为信息可以供我们去分析和计算,飞猪用户通常是"买完即走"。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/aba52ce8bb7549bd8232b975f2d2b670.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>通过数据分析我们发现订单附近的行为数据和订单有较高搭配关系,我们通过Graph Embedding的方式学习订单和宝贝的Embed,以此来学习搭配关系。</p><p>难点有以下几个:</p><ul><li>如何挖掘反映搭配关系的数据集合</li><li>搭配的限制性比较强,如果仅仅基于用户行为构建图,由于用户行为噪音多,会造成较多badcase</li><li>如果完全基于随机游走学习Embed,最后的召回结果相关性差,因此需要行业知识的约束</li><li>数据稀疏,覆盖商品少,冷启动效果差</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/d4e84017696741ab9c8ec83b375a1eee.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>**解决方案:<br>利用航旅知识图谱以及用户的行为序列进行加权异构图的构建 ( 机票/火车票节点利用业务线+出发地+目的地唯一标示、宝贝&amp;酒店利用其id唯一标示 )。之后的流程和传统的Graph Embedding类似。**</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/d3a417bea35b4f6192a0cea4f29c7d77.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br><strong>具体过程:</strong><br>① 以订单粒度对用户的行为做拆分和聚合,同时加入点击行为缓解稀疏问题。</p><p>② 边的权重的计算同时考虑知识图谱和用户行为,这种做法一方面可以增加约束控制效果,另一方面也可以抑制稀疏,解决冷启动的问题。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/eb64259ef2544b3296c7e5b512175907.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>③ 序列采样过程中会基于转移概率进行剪枝操作,用来抑制噪声和缓解热门问题。</p><p>④ skip-gram+负采样训练。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/560c1e09762c4309afa62ec8e33b345c.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>这里有一个具体的case,用户订了一张去曼谷的机票,order2I召回了曼谷的一些自助餐,落地签,热门景点等,体现了较好的搭配性。整体的指标上order2I的点击率也明显高于其他方式。</p><h3>2.3.2 journey2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/0f24570ee2ff49a88f5b750f31b3640f.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>Order2I将订单进行向量化表达,从而进行召回。<strong>但是它还有一些问题:用户的某次行程可能由多个订单组成,甚至有的订单只是中转的作用</strong>,Graph Embedding还是基于单个订单进行搭配的推荐;用户的某次行程不是一个出发地+目的地就能描述的,它不仅与行程本身属性 ( 例如出发/到达时间,目的地,行程意图等 ) 相关,还与用户的属性和偏好 ( 例如年龄,是否是亲子用户 ) 相关。因此行程既是User-Aware又是Context-Aware的。而Order2I学习的还是一种全局的整体偏好,与用户无关,不够个性化。因此我们尝试在行程的粒度做召回,综合考虑用户属性、行程意图、上下文等因素,更个性化的召回与用户这次行程以及用户自身强相关的的宝贝。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c34c3c6d8b9349a99873023b5ad597d4.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>以行程为粒度,对多个订单做聚合,并且增加行程相关的特征。融入用户的基础属性特征和历史行为序列。丰富行程特征并引入attention机制。采用双塔模型离线存储商品向量,在线做向量化召回。模型结构如下:<br><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/97ca47e2d5e44b52bfbdba9b76f29fed.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>模型左边主要是利用行程特征对订单序列以及用户的历史行为序列进行attention操作,用于识别关键订单以及用户关键行为。在此基础上融合行程特征和用户属性特征学习用户该段行程的Embed。模型右边是商品特征,经过多层MLP之后学习到的宝贝Embed。两边做内积运算,利用交叉熵损失进行优化,这样保证召回的结果不仅与行程相关还与用户行为相关。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/551cbcc2062d431f9a0b2ffb4eabbf97.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>两个同样是上海到西安的用户。用户1点击了历史博物馆和小吃,不仅召回了与机票搭配的接送机,还召回了与行为行为相关的小吃街附近的酒店以及历史博物馆相关的宝贝。</p><p>用户2点击了一个接送机,除了召回接送机还召回了机场附近的酒店和热门的POI景点门票。可以看出基于用户的不同行为,召回结果不仅满足搭配关系还与用户行为强相关。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/fdaf52164b224e699f4aee7595234630.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>从指标来看Journey2I相对Order2I有进一步明显的提升。</p><h2>2.4 基于用户行为的召回</h2><h3>2.4.1 Session-Based I2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/0bdcfe9e5d784df2a8172e5dd01cba16.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>航旅用户的行为有稀疏和发散的特点。利用右图一个具体的用户实例来说明这两个特点:用户在第一天点击了两个大理一日游,第20天点击了一些马尔代夫蜜月相关的商品,第21天又点击了大理的一日游。稀疏性体现在一个月只来了3次,点击了8个宝贝。发散性体现在用户大理一日游和出国蜜月游两个topic感兴趣。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/6392441264c04e219d9375727c0d1ae1.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在用户有行为的情况下进行召回,我们常采用的方法是基于User-Rate矩阵的协同过滤方法 ( 如ItemCF,Swing。ItemCF认为同时点击两个商品的用户越多则这两个商品越相似。Swing是在阿里多个业务被验证过非常有效的一种召回方式,它认为user-item-user的结构比itemCF的单边结构更稳定 ),但是由于航旅用户行为稀疏,基于User-Rate矩阵召回结果的准确率比较低,泛化性差。针对这两个问题我们可以通过扩充历史数据来增加样本覆盖。航旅场景因为用户点击数据比较稀疏,需要比电商 ( 淘宝 ) 扩充更多 ( 时间更长 ) 的数据才够。这又带来了兴趣点转移多的问题。在这里我们采用对行为序列进行session划分,保证相关性。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f39142d4548243afbf30e44fdc9f415c.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>这里以swing为例讲解一下构造约束的方式。我们以用户的行为意图为中心,将表示共同意图的商品聚合在一个序列中,如上图对用户行为序列的切分。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/203dd021745b41bd9774c33dff30a88d.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在这个case中,上面是传统swing的召回结果,下面是基于session的召回结果。当trigger是沙溪古镇一日游的时候,上面有一个杭州莫干山和玉龙雪山一日游,这两个不相关结果的出现是因为它们是热门商品,也称哈利波特效应。下面的召回结果就都是和沙溪古镇相关的了。从指标来看,session-based召回比swing和itemCF都高。</p><h3>2.4.2 Meta-Path Graph Embedding</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/1122cce89a984bd7b8399c209c9baaf3.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>基于I2I相关矩阵的优点是相关性好,缺点是覆盖率比较低。而Embed的方式虽然新颖性好但是相关性差。右边的case是Embed的召回结果,上海迪士尼乐园召回了一个珠海长隆的企鹅酒店和香港迪士尼。我们期望的应该是在上海具有亲子属性,或者在上海迪士尼附近的景点。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/eddd33153f5946a9bbfedabde0603dde.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>解决Embed相关性低的方式借鉴了session-based召回的经验,将航旅知识图谱融合,构建航旅特定的Meta-Path。效果上看meta-path的效果是比deepwalk更好。</p><h2>2.5周期性复购的召回</h2><p>复购场景的需求来自于:飞猪有大量的差旅和回家用户,该部分用户的行为有固定模式,会在特定的时间进行酒店和交通的购买,那么该如何满足这部分用户的需求?</p><h3>2.5.1 Rebuy2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c1a8b317a655413dbb858a651d2d8c58.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>我们的目标是在正确的时间点来给用户推出合适的复购商品,下面以酒店为例具体讲解 ( 其他的品类原理类似 )。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/11e827c034274aa6bb2fa0791e768f6d.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>输入用户在飞猪的酒店历史购买数据,输出是用户在某个时间点对某个酒店的复购概率。当有多个可复购酒店时,按照概率降序排序。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/463fa849ed85441cad16f4175bd3a9fc.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>常见做法有以下几种:</p><ul><li>利用酒店本身的复购概率</li><li>基于用户购买历史的Retarget</li><li>利用Poission-Gamma分布的统计建模</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/abefcb8bf5c24efeb356c45150cf391e.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>首先取用户对酒店的购买历史,利用矩估计/参数估计计算酒店的购买频次 ( 参数α和β )。接下来就可以调整每个用户的购买概率,k是购买次数,t是第一次购买距离最近一次购买的时间间隔。最后代入Possion分布计算复购概率,加入用户的平均购买周期来缓解刚刚完成购买的酒店复购概率最大的问题。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/46d024871f87424eae851ea5244b4f6f.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>从左图可以看出在购买一段时间以后,复购概率达到最大值,之后递减。实际使用中复购单独作为一路召回,效果比前面提到的retarget和热门召回更好。</p><h2>2.6 总结</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/5c2be163d48549799d0e0d665c46ea94.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>最后总结一下做好召回的几个思路:</p><p>首先要基于业务场景

...

@github-actions
Copy link
Contributor

http://localhost:1200/aijishu/u/bandaotitouzilia - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[集微网 - 极术社区]]></title>
        <link>https://aijishu.com//api/user/1030000000106559/timeline?page=1</link>
        <atom:link href="http://localhost:1200/aijishu/u/bandaotitouzilia" rel="self" type="application/rss+xml" />
        <description><![CDATA[集微网 - 极术社区 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 15:27:04 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[解密禾赛科技最新激光雷达专利]]></title>
            <description><![CDATA[<p>【爱集微点评】禾赛科技的激光雷达专利,通过色散偏折件实现多波长光源所产生光线的分光和出射,同时色散偏折件还能起到扩束的作用,能够有效增大激光雷达的口径,提升测远能力。而且不会过多增加激光雷达的光路高度,有效的压缩了激光雷达的高度和体积。</p><p>集微网消息,近日,禾赛科技在纳斯达克成功上市,意味着中国“激光雷达”向全球又迈进了一步,同时禾赛科技也成为中国“激光雷达第一股”。</p><p>激光雷达是一种常用的测距传感器,其工作原理是利用激光往返于雷达和目标之间所用的时间,或者调频连续光在雷达和目标之间往返所产生的频移来评估目标的距离或速度等信息。为了获得较大的视场范围,激光雷达通常采用扫描装置进行扫描。激光雷达常用的扫描方式有机械旋转式、反射镜扫描式、光学相控阵(OPA)扫描、Flash扫描等。另外,还有一种扫描方式是波长扫描。波长扫描的扫描装置是利用光栅、棱镜等色散元件基于波长将多波长光源产生的光线分开以达到扫描的效果。但是现有波长扫描的扫描装置往往存在装配不方便的问题。</p><p>为此,禾赛科技于2022年8月29日申请了一项名为“激光雷达的发射模块及激光雷达”的发明专利(申请号:202222291141.6),申请人为上海禾赛科技有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1126334138789.4883.png" alt="image" title="image"></p><p>图1 波长扫描装置的光路示意图</p><p>图1为传统波长扫描装置的光路示意图,在激光雷达的应用中,通过不同波长的光线向不同角度衍射来实现激光雷达对不同垂直角度的扫描。因此,为了使多束衍射光的出射方向靠近水平面,实现对垂直0°角和垂直方向正角度和负角度一定范围的扫描,如图1所示,通常在色散元件12下游的光路中会设置反射镜13。但是反射镜13的反射面与水平方向之间的夹角较大,所以会增大光路沿垂直方向的尺寸,使得激光雷达光路垂直方向的高度增大,从而不利于激光雷达体积的缩小。此外,也会使激光雷达光路的不同光学元件在不同高度的水平面上,从而造成了激光雷达的安装不便。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1342321041364.585.png" alt="image" title="image"></p><p>图2 新型激光雷达发射模块结构示意图</p><p>图2为本专利提出的一种新型激光雷达发射模块结构示意图,在此主要引入色散偏折件129,其主要包括光栅层127和导光体128。光栅层127朝向导光体128的表面并与导光体128的表面直接接触。导光体128的两个表面分别为第一面121和第二面122,第一光线131从第一面121入射至导光体128,第三光线133自第二面122从导光体128出射。色散面和偏折面集成于一体化结构的导光体128上,能够使光学元件体积大幅缩小,并且一体化的光学元件结构更加稳定,能够有效提高光路的鲁棒性。此外,一般而言,导光体128材料的折射率大于1。将导光体128的材料设置为比较常见的大于1的材料以控制折射角度,可以实现扩束效果。</p><p>简而言之,禾赛科技的激光雷达专利,通过色散偏折件实现多波长光源所产生光线的分光和出射,同时色散偏折件还能起到扩束的作用,能够有效增大激光雷达的口径,提升测远能力。而且不会过多增加激光雷达的光路高度,有效的压缩了激光雷达的高度和体积。</p><p>禾赛科技是一家致力于激光雷达研发与制造的全球化公司,其客户遍布全球主流汽车厂商、自动驾驶和机器人公司,覆盖40个国家和90多个城市。作为以技术为核心竞争力的公司,禾赛科技的成功并非偶然,而是在多年的产品打磨和技术投入中诞生的。中国需要有世界级自主研发能力的公司,相信禾赛科技也有实力成为全球领先企业。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 08:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387119</guid>
            <link>https://aijishu.com/a/1060000000387119</link>
        </item>
        <item>
            <title><![CDATA[引领仪器设备产业“突围”,国产半导体责无旁贷]]></title>
            <description><![CDATA[引领仪器设备产业“突围”,国产半导体责无旁贷]]></description>
            <pubDate>Mon, 27 Feb 2023 07:27:03 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387113</guid>
            <link>https://aijishu.com/a/1060000000387113</link>
        </item>
        <item>
            <title><![CDATA[兆芯如何保证处理器模拟/真实请求传输路径一致?]]></title>
            <description><![CDATA[<p>【爱集微点评】兆芯的处理器建模专利,采用两套信息来记录一个请求路径的关键信息,解决多个请求在汇聚点装置中路径不明确的问题。同时依据第二路径信息可以纠正第一路径信息在汇聚点装置导致的路径错误,使模拟请求传输路径的建模跟真实硬件传输路径更为一致。</p><p>集微网消息,近日,兆芯独家入选《上海金融科技发展白皮书》基础设施支持类科技企业,同时兆芯的新一代嵌入式处理器也一并入选白皮书。</p><p>在处理器建模领域中,当处理器传输数据的整个路径上只有一个源端发送请求时,功能加时序模型可以很好地模拟真实处理器的性能。但是,如果整个路径上有多个源端可以发送请求,由于功能模型是在请求生成的时候就进行调用,而多个源端到达请求汇聚点的路径延时是不确定的,汇聚点是指多个请求都会通过的路径节点或装置,这样会导致多个源端的请求在汇聚点看到的时序状态跟在请求生成时的差距较大。当大量的请求的处理路径跟功能模型不一致的情况下,最终建模呈现的性能指标就不能反映真实处理器的性能。因此,如何真实的模拟出处理器的性能,已成为本领域需解决的问题之一。</p><p>为此,兆芯于2020年9月29日申请了一项名为“处理器建模系统及处理器建模方法”的发明专利(申请号:202011054563.0),申请人为上海兆芯集成电路有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1141850468081.4688.png" alt="image" title="image"></p><p>图1 处理器建模系统的示意图</p><p>图1为本专利提出的一种处理器建模系统的示意图,处理器建模系统100包含多个源端装置A1~Am及一汇聚点装置PL。其中,源端装置A1~Am是向处理器发出请求的装置,例如输入输出装置、储存装置、图形处理器、预取装置等。</p><p>源端装置A1和An+1分别产生第一/二请求,并于第一/二传送时点传送两个请求。而汇聚点装置PL分别在第一接收时点和第二接收时点接收两个请求,并依据第一请求/第二请求选择传送路径(例如PT1)。其中,第一传送时点早于第二传送时点,第一接收时点接收晚于第二接收时点,且第一请求与第二请求欲存取的目标数据地址相同。如此一来,在多源端的处理器的仿真建模过程会发生多请求在到达汇聚点装置时出现路径不明的情况,最终导致建模结果呈现的性能指标与真实处理器不一致。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/538297132002.6487.png" alt="image" title="image"></p><p>图2 处理器建模方法的流程图</p><p>图2是本专利提出的一种处理器建模方法流程图,首先源端装置A1产生第一请求,第一请求为主路径请求。对于每一个请求,用第一路径信息来表示传统的功能模型的关键信息,用第二路径信息来表示真实时序的关键信息(可以真实反映时序的关键信息)(步骤210)。然后第一请求分别调用功能模型和时许模型,得到第一、二路径信息(步骤220、230)。然后第一请求被传送到汇聚点装置PL(步骤240),而汇聚点装置PL判断是否存在第二请求(步骤250)。汇聚点装置PL依据第二请求的第二路径信息选择传送路径PT1。因为目标数据地址中的信息已经先被先到汇聚点装置PL的第二请求取走了,所以依据第二请求的第二路径信息选择传送路径PT1(步骤260)。最后,汇聚点装置PL更新第二请求状态为合法的(步骤270)。</p><p>简而言之,兆芯的处理器建模专利,采用两套信息来记录一个请求路径的关键信息,解决多个请求在汇聚点装置中路径不明确的问题。同时依据第二路径信息可以纠正第一路径信息在汇聚点装置导致的路径错误,使模拟请求传输路径的建模跟真实硬件传输路径更为一致。</p><p>兆芯成立于2013年,掌握中央处理器、图形处理器、芯片组等三大核心技术。自从成立以来,兆芯已经成功研发、量产了多款通用处理产品,在业内得到了高度评价,并多次入围Silicon 100榜单、荣获各种“创新奖”、“成就奖”、“金奖”。希望在2023年成立十年之际,兆芯可以再创辉煌、更上一层楼!</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387102</guid>
            <link>https://aijishu.com/a/1060000000387102</link>
        </item>
        <item>
            <title><![CDATA[南芯科技公开带预唤醒功能的Type-C接口插入检测电路方案]]></title>
            <description><![CDATA[<p>【爱集微点评】南芯科技公开的带预唤醒功能的Type-C接口插入检测电路方案,该方案通过增加Type‑C接口预唤醒电路,在接口电路休眠时,可以将Type‑C接口检测电路关闭。从而实现减低系统待机功耗的同时实现接口插入检测功能,通过简单的电路结构解决了Type‑C接口插入检测和低功耗之间的矛盾。</p><p>集微网消息,在集成电路应用当中,特别是手机或者充电设备的Type‑C接口电路应用中,通常为了降低系统待机功耗,在未检测到手机或者充电设备插入时,整个系统会进入休眠模式。</p><p>但是为了快速响应手机或者充电设备的插入,在休眠时Type‑C接口检测电路需要一直工作,这就大大增加了系统休眠时的待机电流,从而大大缩短电池的续航时间。</p><p>为此,南芯科技在2022年3月11日申请了一项名为“一种带预唤醒功能的Type-C接口插入检测电路”的发明专利(申请号:202210236444.X),申请人为上海南芯半导体科技股份有限公司。</p><p>根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/522483438041.0886.png" alt="image" title="image"></p><p>如上图,为该专利中公开的充电设备端和手机端上设置的Type‑C接口检测电路通过Type‑C数据线连接的结构示意图。可以看到,在手机或者充电设备(如适配器、充电宝等)的Type‑C接口电路应用中,为了快速响应手机或者充电设备的插入,在休眠时Type‑C接口检测电路需要一直工作。这就大大增加了系统休眠时的待机电流,从而大大缩短了手机或者充电设备的电池的续航时间。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1435664442736.5054.png" alt="image" title="image"></p><p>如上图,为现有方案中Type‑C接口检测电路的电路连接示意图。在充电设备端,P型开关管M2的源端连接电源VDD,栅端连接控制信号EN_Rp,漏端连接上拉电流源Irp的源端。Irp的输出端连接到引脚CC,引脚CC同时连接到检测比较器P的反向端,比较器P的正向端连接参考电压VREF,比较器P输出信号为CC_DET_P。</p><p>在手机端,N型开关管M1的源端连接GND(即接地),栅端连接控制信号EN_Rd,漏端连接下拉电阻Rd的一端,下拉电阻Rd另一端连接到引脚CC。引脚CC同时连接到检测比较器D的同向端,比较器D的反向端连接参考电压VREF,比较器D的输出电压为CC_DET_D。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/168830725881.94025.png" alt="image" title="image"><br>在该专利中,主要通过在Type‑C接口检测电路的基础上增加预唤醒电路,在休眠时关闭Type‑C接口检测电路,来降低系统待机功耗。在设备插入时,通过触发预唤醒电路,再将Type‑C接口检测电路使能,实现快速响应设备的插入。</p><p>如上图所示,该检测电路包括:Type‑C接口检测电路以及Type‑C接口预唤醒电路。该充电设备端接口检测电路包括P型开关管M2、上拉电流源Irp和比较器P。手机端接口检测电路包括N型开关管M1、下拉电阻Rd和比较器D。</p><p>充电设备端接口预唤醒电路包括P型开关管M3、上拉电阻Rp_Pre、P型开关管M4、电阻R1、电阻R2以及反相器PI1。手机端接口预唤醒电路复用手机端接口检测电路的N型开关管M1和下拉电阻Rd。此外,手机端接口预唤醒电路还包括N型开关管M5、电阻R3、电阻R4和反相器PI2。</p><p>该装置的工作原理如下:在充电设备端,通过开关管M3和上拉电阻Rp_Pre实现上拉功能,开关管M4、电阻R1以及R2实现Rd插入预唤醒功能。在充电设备接口休眠时,开关管M3栅极控制电压为0,开关管M2栅极控制电压为1,关闭Irp上拉电流源,同时比较器P处于关闭状态。在手机端,下拉电阻部分将复用接口检测电路部分,开关管M5、电阻R3以及R4实现上拉插入预唤醒功能。在手机端接口休眠时,开关管M1栅极控制电压为1,打开M1,通过电阻Rd实现下拉,同时比较器D处于关闭状态。</p><p>引脚CC没有插入上拉时,CC引脚被Rd和M1下拉至GND,CC引脚通过ESD保护电阻R4接到开关管M5栅极,M5处于关断状态,输出被电阻R3上拉至VDD。然后经过反相器,输出为低,整个Type‑C接口电路没有工作电流,系统功耗很低。</p><p>当引脚CC插入上拉时,CC引脚电压即为开关管M5栅极电压,M5被打开,将信号拉低,输出CC_DET_D_PRE即为高电平。从而实现上拉插入预唤醒,然后打开比较器D,Type‑C接口检测电路将开始工作。</p><p>以上就是南芯科技公开的带预唤醒功能的Type-C接口插入检测电路方案,该方案通过增加Type‑C接口预唤醒电路,在接口电路休眠时,可以将Type‑C接口检测电路关闭。从而实现减低系统待机功耗的同时实现接口插入检测功能,通过简单的电路结构解决了Type‑C接口插入检测和低功耗之间的矛盾。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387106</guid>
            <link>https://aijishu.com/a/1060000000387106</link>
        </item>
        <item>
            <title><![CDATA[后ChatGPT时代,AI芯片如何继往开来]]></title>
            <description><![CDATA[<p>集微网消息:“英伟达是否低估了芯片危机?”</p><p>2022年9月,《经济学人》杂志向黄仁勋发出了这样的质疑,彼时的英伟达,正被加密货币泡沫破裂、高端GPU出口遭限等事件连番打击,股价创下两年新低,市值距离2021年末的高点已蒸发逾60%。</p><p>杂志记者略显刻薄地评论道:“当他透过眼镜打量他觉得会改变AI面貌的花哨新模型,以及像元宇宙这样更模糊的概念,他是否存在低估此时此地残酷性的危险?”</p><p>一百多天后如火如荼的ChatGPT热潮下,黄仁勋在加州大学伯克利分校喊出“这是人工智能的iPhone时刻”,一吐胸中块垒。</p><p>的确,ChatGPT既是热度空前的“杀手应用”,也为英伟达股价注入强心剂,伴随去年末ChatGPT热度起势,英伟达在几家大芯片巨头中,也走出了久违的领涨表现,同期在外围市场,但凡能编织出“ChatGPT与我的故事”,不少芯片企业也获得了投资者的追捧。</p><p>不过在短暂的集体狂欢后,“ChatGPT概念”也必将分化,各路企业描绘的新蓝图成色几何,需要一把技术的标尺加以衡量。</p><p>垂直一体化模式的松动</p><p>毋庸置疑,ChatGPT远超前辈AlphaGo的热度,已经像火炬般清晰照亮了大模型应用前景。然而回顾iPhone当年横空出世之时,不少外界观察者仍习惯以现有厂商格局线性外推,认为苹果公司探明的“新大陆”,最终仍将是诺基亚囊中之物。</p><p>在“人工智能的iPhone时刻”后,AI产业新机遇,同样并非理所当然应许给旧玩家。</p><p>值得指出的是,从0到1完成复现乃至超越ChatGPT实际体验的大模型,对许多团队而言面临工程能力和经济成本的双重约束。</p><p>从工程能力要求看,大型语言模型(LLM)参数量短短几年从亿级迈入千亿级,对算力需求已远超处理器性能迭代速度,分布式并行计算也因此进入“深水区”,易并行(embarrassingly parallel)方法撞上天花板,必须开发子计算任务与处理器之间更为复杂的调度方法,相关人才目前十分稀缺。</p><p>而在经济成本上,以ChatGPT的“母体”GPT-3模型为例,据称如使用英伟达V100 GPU集群训练一次,不考虑调参排故的理论最低成本也将达到460万美元,微软公司专门为其开发者OpenAI打造的超算系统据称拥有超过28万个CPU内核和1万个GPU,整体性能可以达到2020年时全球TOP500超级计算机榜单前五,如果这一宣传基本属实,则相当于OpenAI在用一套完整的天河2号超算系统专门支撑其模型训练,这对大多数企业而言无疑太过奢侈。</p><p>以此观之,人工智能厂商目前从数据、算法到AI芯片、硬件终端、项目实施的端到端垂直一体化模式,未来或将走向更明晰的专业分工,少数拥有巨型算力集群的科技巨头在云端进行大规模预训练模型迭代,并将接口开放给下游厂商、开发者,产业链下游则基于领域特定知识在边侧、端侧以更低代价、更短周期完成模型精调,实现对垂直应用场景的高可用交付。</p><p>面对呼之欲出的“范式转变”,对大多数新老厂商而言,比起抢发“我司也有类似模型开发中”的新闻,更重要的工作,恐怕是对如何挖掘特定场景商业价值深思熟虑。</p><p>针对该话题的采访中,思必驰研发总监樊帅指出,“从现实来讲,平台巨头企业在研发投入、团队投入等方面拥有优势,这是毋庸置疑的”。不过随着ChatGPT的应用延伸,上下游企业都将在产业链关键环节做出贡献,对于下游厂商而言,“探索类GPT产品的市场应用,实现技术的商业价值是企业关注的重点,无论是产品工具还是产品方案,挖掘潜力场景,进行技术融合,输出整体性、结果导向性的实用解决方案才是现实问题。”</p><p>作为国内专业的对话式人工智能平台型公司,思必驰在类GPT模型的应用落地上也有颇多洞察。</p><p>樊帅表示,现在ChatGPT是以文本交互机器人的形式呈现,这种文本生成的方式其实有很大的应用空间,比如在智能客服方向,现在的智能客服是检索式AI,但是生成式AI主动性更高,更具亲和力和有效性。不论是搜索引擎、电商客服还是AI辅助生成,ChatGPT应用级创新能力很强。</p><p>樊帅预测,在需要基于一定背景知识的创作型产业,以及刚需AIGC的场景、具有SOP(标准作业程序)的行业,比如智能写作、智能客服、文档管理、代码生成、甚至游戏NPC等,是ChatGPT适宜落地的土壤。大模型技术可通过强化上下文理解能力、思维链推理、增强指令学习,来实现场景的融合应用。例如,在会议场景下,根据上千字的会议记录,工具可以迅速根据需求指令,整理出会议纲要及重点,清晰列出待办事项。</p><p>进一步具体到语音交互领域,樊帅认为,“未来往语音对话机器人去进阶,强化语音、文本、图像等深度融合的多模态交互技术应用,应对复杂场景的变化。这些都给大家留下思考、应用和探索的空间。思必驰聚焦对话技术,从对话能力输出上来看,具备情感化、高度拟人化的语音TTS存在发展潜力”,他还介绍称,思必驰在这一方向上已进行了探索,推出过具有“高兴、撒娇、抱歉”情感的语音合成技术,应用在有声阅读、智能客服、语音助手、视频配音等行业场景,能够满足更接近真人情感化表达的语音效果。</p><p>AI芯片路线之辨</p><p>正如上文所述,类GPT大模型的开发极度依赖于算力支撑,随着大模型参数量从百亿、千亿向万亿演进,新的人工智能产业竞争将进一步向算力环节聚焦,与此同时,上下游推理、训练工作负载的需求差异将越来越显著,也对芯片技术演进带来了新的牵引。</p><p>围绕这一议题,集微网采访了国内通用GPU领域产业化步伐领先的天数智芯半导体有限公司(简称天数智芯),该公司是国内首家实现通用GPU产品量产及规模应用的厂商,其天垓100产品目前已支撑近百个客户应用,产品涵盖数百个人工智能模型的训练业务场景。</p><p>天数智芯产品线总裁邹翾分析,ChatGPT背后的GPT3.5是一种颠覆性的底层技术,其惊艳的应用效果建立在巨量语料库以及超大规模的AI算力基础之上。随着应用场景的演进, 核心技术会加速发展,包括AI模型的复杂度还会不断演进, 这将产生对算力的产生井喷需求。</p><p>国内顶尖的企业和机构正在进行ChatGPT相关的技术研究及商用级产品开发。面对国内应用环境及中文语料,相关算法及模型预计将在未来1年左右逐步成熟。在互联网入口,家庭接入设备,办公等各不同领域,针对不同的场景可能会有不同的算法及产品出现,而支撑这些模型的算力底座需要具有良好的通用性及扩展性,才能够快速的支持这些变化的需求,实现商业的可持续化演化。</p><p>邹翾表示,未来继续看好通用GPU架构训练产品的发展空间,其通用性、兼容性、以及生态成熟度仍是未来一段时间内人工智能算法及应用构建的主要支撑。</p><p>与云侧对通用性、扩展性的需求相比,</p><p>在边侧、端侧,推理芯片面对的需求则有所差异。</p><p>思必驰研发总监樊帅表示,AI专用芯片可以在侧重于场景化的端侧实现特定场景低能耗,高算力,从定制化来看,ASIC专用AI芯片从效率角度更具优势,随着大模型的普及及应用,能够提升相关芯片产品的性价比。</p><p>与此同时,由于数据量的急剧提升,无论在云侧还是端侧,对于数据的隐私保护也提出了更高要求。樊帅强调,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。基于AI的应用和其他衍生的工具级产品,在隐私安全、知识产权风险等方面亟待规范。</p><p>邹翾也谈到,在近期的客户交流中能够感受到各界对ChatGPT的关注及开发态度,希望其成为效率提升的有效工具。不过用户也有对数据隐私的担忧,未来随应用扩展,亟需提供隐私计算的技术方案,实现“可用不可见“的计算方式,这也要求更强及更通用的算力支撑。</p><p>值得一提的是,对于大模型训练芯片,特斯拉、Cerebras等海外厂商正试图探索另一条前无古人的道路—通过设计等效超算集群的单个处理器训练大模型,完全绕过分布式并行计算的调度瓶颈。</p><p>特斯拉近期公布的Dojo D1自研AI芯片,就是将25个裸片通过硅中介层互联,构成单块“Dojo Training Tile”,更为激进的Cerebras,则推出了面积达462平方厘米的WSE-2处理器,声称具有85万个用于张量运算的可编程内核,单张WSE-2支撑的CS-2机柜,据称最多可支撑万亿参数规模的大模型训练。</p><p>邹翾表示,新兴技术是针对目标问题的探索,会呈现出百花齐放的局面,在开放环境下竞争将驱使其收敛,市场是最终检测的试金石。在技术发展路线上需要从各个方向去尝试,最终都是为产业的发展贡献自己的力量。</p><p>结语</p><p>“人工智能的iPhone时刻”,的确代表了许多人对ChatGPT热潮的感受,全球公众与行业机构被“卷入”其中的速度,已经清晰昭示出未来更多、更大应用创新沿着这一方向喷薄而出的图景。</p><p>在警惕短期过度炒作和跟风的同时,类GPT模型对人工智能商业模式和产业格局带来的长期影响,亟需相关厂商冷静观察,沉着应付,有所作为。</p>
                                                    ]]></description>
            <pubDate>Fri, 24 Feb 2023 15:27:03 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386766</guid>
            <link>https://aijishu.com/a/1060000000386766</link>
        </item>
        <item>
            <title><![CDATA[3nm的“剧本杀”:有人吃饱,有人跌倒,有人意难平……]]></title>
            <description><![CDATA[<p>集微网报道(文/李映)开局不利,这会是代工巨头台积电在2023年首季的剧本吗?</p><p>面临行业景气度下行以及去库存消化的影响,台积电不仅下调Q1营收及全年资本支出,还放下身段松动代工价格,并在多方考量之下推迟欧洲建厂。在收缩战线之际,又传出英特尔推迟与台积电3nm合作订单的消息。</p><p>作为先进工艺的王者,台积电在今年3nm(N3)的规划是占其总营收的4-6%,估算下来为30-45亿美元。对于英特尔订单推迟,业界先有分析称将影响产能利用率,对其营运造成影响。</p><p>但反转比变脸还快。据透露,苹果已采购了100%的初始N3供应,很可能用于即将推出的 iPhone 15 Pro 系列以及计划于2023年下半年推出的新款 MacBook。且在手机去库存加速和HPC等需求高涨走势下,联发科、高通、AMD、英伟达等相比预计会加快下单3nm以及更具优化的N3E工艺,台积电全年3nm将走向满载。</p><p>反观3nm的先行者三星虽然率先量产,但目前买单者只有一些矿机企业,对比之下或不得不发出“起了大早赶个晚集”的喟叹。</p><p>英特尔数次推迟</p><p>推迟的戏码可谓是一再上演。</p><p>按照英特尔最初的计划,第14代Meteor Lake系列处理器采用多芯片堆叠设计,GPU部分将交付台积电3nm代工。但后来转向5/6nm制程,计划下一代即第15代Arrow Lake的GPU部分导入台积电3nm工艺。</p><p>没想到由于产品设计和工艺验证问题,该计划被推迟到2023年上半年,后来该产品的量产计划又因某种原因再次推迟到2023年底,现在则又要推迟到2024年4季度……</p><p>业内人士表示,这一推迟几乎完全取消了原定于2023年的3nm产能,只剩下少量的晶圆投入用于工程验证。</p><p>但从客户优先级来说,上述人士认为,在3nm工艺层面,苹果、AMD、英伟达下订单的时间都比英特尔更早,客观来说英特尔的订单优先级或相对靠后,而延后或是一种保护面子的“官方说法”。</p><p>再三推迟之下,英特尔原本期待的首发看来要变成“末发”了。英特尔近年流年不利,遭遇PC和服务器市场需求下滑和竞争对手的反击,导致PC平台蓝图频繁修改,产品上市延迟也进一步扰乱了供应链的节奏。</p><p>而英特尔的麻烦不止于此。面对2022年营收和利润快速下降的情形,英特尔不久前表示,正计划削减整个公司的管理层薪酬。且在PC市场疲软和竞争加剧的情况下,预计2023年第一季度仍将继续亏损。</p><p>台积电3nm将“满载”</p><p>在英特尔延后3nm订单仅仅两日,就爆出苹果包圆台积电3nm产能的消息,苹果这一举动着实给台积电送上了“定心丸”,特别是在代工业迎来“倒春寒”之际。</p><p>受经济下行叠加多重因素影响,有称台积电2023年上半年整体晶圆厂产能利用率预估跌至80%,其中7/6nm制程产能利用率跌幅扩大,5/4nm产能利用率从今年1月开始逐月下滑。台积电虽未直接松动代工价格,但私下按客户与订单规模不同,给予优惠。</p><p>但代工价格高昂的3nm制程却是“另一番天地”,在客户、产能等方面,正从一个胜利走向另一个胜利。</p><p>随着手机去库存加速,不仅苹果已获得了N3的所有可用订单,且高通、联发科也在加速下单。高通预计2023年第4季推出的Snapdragon 8 Gen 3将采用N3E制程;原预期2024年才会加入3nm行列的联发科,预计最快2023年12月就会推出首款N3E制程芯片。此外也传出Oppo已计划在台积电投片3nm。</p><p>N3E是3nm的升级工艺。目前N3工艺的EUV光罩层数为25层,预计二三季度量产的N3E工艺的EUV光罩层数则从25层减少到21层,可使芯片拥有更佳的效能、功耗和良率。</p><p>在手机芯片3nm起势之际,HPC需求也持续强劲,相应的AMD、英伟达等一众“拥趸”也将为台积电3nm节点营收贡献动能。</p><p>此外,在产能方面也会一扫稼动率不足的窘境。据悉台积电的3nm工艺于12月下旬开始,并在逐步扩大工艺产能,3月晶圆月产量将达到 45000片。有分析称,其3nm制程不仅在第一二季满载,在进入下半年后加上N3E的量产以及新客户的加持,全年3nm产能都呈现满载状况。</p><p>看起来,3nm俨然要成为台积电的新“台柱”。</p><p>三星“起大早赶晚集”</p><p>反观作为第一首发3nm的三星,市场天平却依旧没有向它倾斜。</p><p>三星抢先于2022年6月底进入3nm GAA世代,但据上述行业人士透露,从价格来看,相当于台积电价格打九折,相比于巨大的研发和设备开支,也算是诚意满满了。但目前只有一些中国矿机企业下单,对比台积电3nm“王者联盟”式的客户,仍有巨大落差。</p><p>而良率无疑是横亘其中的一大“障碍”。有关台积电及三星的3nm良率一直都是个谜,此前传闻说三星3nm良率仅有10-20%,台积电3nm良率可达70-80%,这恐有失偏颇。而且后者的良率也太高了,又被戳穿实际上只有不到50%的良率。</p><p>尽管实际对比不会这么悬殊,但三星3nm良率不如台积电应是实情。三星自然也在加足马力,通过全面合作和全力攻关,据悉三星3nm良率已大幅提高。</p><p>三星一位高管在日前受访时表示,相比于此前受困的良率问题,三星第一代的3nm制程良率已接近完美,第二代3nm工艺也迅速展开。</p><p>相应的,客户的积极性也在提升。据悉除了三星自用之外,其3nm工艺还锁定了四大客户,包括IBM、英伟达、高通及国内的百度公司,这些公司综合考虑了过去的战略合作伙伴关系、供应链的必要性等因素,选择三星作为芯片代工企业。</p><p>值得一提的是,英特尔计划于2023年底推出3nm(Intel 3)节点,在三大巨头皆进入3nm制程时代之后,未来3nm制程亦将成为先进工艺代工的主流。有预计到2025年,3nm制程市场的产值将会高达255亿美元,超越当时5nm制程预估的193亿美元产值。</p><p>而谁会笑在最后?</p>
                                                    ]]></description>
            <pubDate>Fri, 24 Feb 2023 15:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386774</guid>
            <link>https://aijishu.com/a/1060000000386774</link>
        </item>
        <item>
            <title><![CDATA[澜起科技提出系统安全防御方案 避免恶意程序攻击而崩溃]]></title>
            <description><![CDATA[<p>【爱集微点评】澜起科技提出的用于保护系统安全的安全防御方案,该方案通过双架构中的安全区对接收来自用户区的指令来源进行身份验证,从而避免了被恶意程序攻击而导致的系统安全问题。</p><p>集微网消息,目前,CPU和内存等芯片在物理设计时有其正常工作的电压和频率范围,超出正常范围则存在功耗过大烧毁或者时序、逻辑运算不稳定或者死机的情况,不稳定可能导致被攻击,防护程序被绕过或者密钥被窃取等问题。</p><p>电压和频率的控制是通过主板和内存条上的智能硬件电路来实现的,通过驱动程序等软件修改相应的CPU寄存器、主板相关电路的地址或端口、内存相应的参数区中的参数来实现电压和频率的调节。</p><p>为了系统安全,此类操作往往需要最高的系统权限,甚至在BIOS固件里进行调节,但是固件、木马或者攻破操作系统获得系统权限的恶意程序可以实现电压和频率配置,从而导致系统不安全。</p><p>为此,澜起科技在2022年3月16日申请了一项名为“一种安全防御方法、装置、设备及存储介质”的发明专利(申请号:202210259021.X),申请人为澜起科技股份有限公司。</p><p>根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/437905773410.57446.png" alt="image" title="image"></p><p>如上图,为该专利中公开的一种安全防御方法的流程图,该方法可以应用于中央处理器中的安全区。首先,系统接收加密的目标选项调节指令,以便利用预存储的密钥对加密的目标选项调节指令进行解密操作,以判断加密的目标选项调节指令的来源是否为用户区。</p><p>其次,当加密的目标选项调节指令的来源为用户区时,将本地存储区域内存储的第一随机码发送至选项控制单元,以便选项控制单元对第一随机码进行验证,并在验证成功后执行目标选项调节指令。在该过程中,当加密的目标选项调节指令的来源为用户区时,会将本地存储区域内存储的第一随机码发送至选项控制单元。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/690881846244.347.png" alt="image" title="image"></p><p>如上图,为上述安全防御方法的示意图。中央处理器采用双架构,将中央处理器分为用户区与安全区两部分,其中安全区是物理隔离,不会受到用户区的攻击。当目标调节指令为电压和频率调节指令时,图中左侧标有叉号的箭头直接连接用户区与电压和频率控制单元,表示现有技术中用户区会与电压和频率控制单元直接通信,可能会存在电压和频率控制单元执行来源为恶意程序的目标选项调节指令的情况发生。</p><p>在该方案中,中央处理器的安全区接收到电压和频率调节指令,然后利用预存储的密钥对加密的目电压和频率调节指令进行解密操作,即图中的验签操作。若电压和频率调节指令的来源为中央处理器的用户区时,将安全区中存储的随机码发送至电压和频率控制单元进行比对,比对成功后执行电压和频率调节指令。</p><p>最后,接收选项控制单元发送的第二随机码,并在本地存储区域内存储用于替换第一随机码的第二随机码。这是由于中央处理器中的安全区将第一随机码发送至选项控制单元后,第一随机码已失效。因此需要将接收到的选项控制单元发送的第二随机码存储在本地存储区域内,使用第二随机码覆盖第一随机码,使得本地存储区域内仍旧只存储一个随机码。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/330692839827.988.png" alt="image" title="image"></p><p>如上图,为上述安全防御装置的结构示意图。该装置包括有:指令接收模块11、随机码验证模块12和随机码更新模块13。指令接收模块用于接收加密的目标选项调节指令,以便利用预存储的密钥对加密的目标选项调节指令进行解密操作。随机码验证模块用于当加密的目标选项调节指令的来源为用户区时,将本地存储区域内存储的第一随机码发送至选项控制单元。随机码更新模块用于接收选项控制单元发送的第二随机码,并在本地存储区域内存储用于替换第一随机码的第二随机码。</p><p>以上就是澜起科技提出的用于保护系统安全的安全防御方案,该方案通过双架构中的安全区对接收来自用户区的指令来源进行身份验证,从而避免了被恶意程序攻击而导致的系统安全问题。</p>
                                                    ]]></description>
            <pubDate>Fri, 24 Feb 2023 15:26:55 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386770</guid>
            <link>https://aijishu.com/a/1060000000386770</link>
        </item>
        <item>
            <title><![CDATA[关注设备电池健康 国轩高科提出电池健康状态实时监控及评估方案]]></title>
            <description><![CDATA[<p>【爱集微点评】国轩高科公开的电池健康状态实时监控及评估预测方案,针对当前传统三维度电池健康监控及评估的短板,基于四维度电池健康监控及评估方法,通过结构创新,采用三个不同层级分别对电池的实时压力进行采集。进而通过信号处理和分析,实现了电池健康的实时监控和评估。</p><p>集微网消息,锂离子电池在运行过程中,近似于一个黑匣子,它的安全始终是消费者关注的问题,能够实现电池健康状态可视化也是各大主机厂十分关心的难题。现有的用于电芯实时状态监控和评估的健康因子有电压(U)、电流(I)和温度(T)。</p><p>然而,在此基础上的健康状态评估存在一个短板,就是“U/I/T”在电池生命周期的不同状态下的差别并不大,仅会在一些突发状态下个别因子才会发生较大波动。而这已经不是真正意义上的健康评估,而是突发状态下的预警,这对于电池实时的健康评估和监控是远远不够的,存在安全隐患。</p><p>基于现有最新的研究成果,电池在生命周期运行过程中的压力和寿命之间有着密切联系,并且呈现出正相关的关系。当电池的寿命衰减加速时,对应的压力也呈现出相同的加速增长的趋势,当电池运行稳定时,其压力变化也相对稳定,不会发生较大的突变,完全可以通过压力的变化趋势,实现电池的健康评估。</p><p>该原理为通过压力的实时数值和离群度,实现电池的实时健康监控。并且将电池运行过程中的压力作为新的健康因子,建立电压(U)、电流(I)、温度(T)和压力(P)四个维度上的健康监管平台。从而辅助电池更准确、更及时的健康监控和评估,以弥补传统“U/I/T”三维度评估的短板。</p><p>因此,为了实现这种能够实时监控和评估电池健康状态的方案,国轩高科在2022年11月11日申请了一项名为“一种电池健康状态实时监控及评估预测装置”的发明专利(申请号:202211409572.6),申请人为合肥国轩高科动力能源有限公司。</p><p>该专利分别在电芯级别、多层电芯级别以及系统级别描述了如何实现电池的健康状态评估及实时监控。根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/818099872778.0901.png" alt="image" title="image"></p><p>首先,在电芯级别,如上图,为集成有喷涂式压力传感器的电池内部示意图。对于电芯内部极片102,根据极片的成组原理,沿着箭头方向,最外围的极片的远离电芯中心的面在电池运行过程中并不会参与电化学反应,也就是说该极片表面并没有被充分利用。</p><p>而为了实现电池健康状态的评估,可以选取该极片表面实现喷涂式压力传感器101的布置,进而在电芯制作过程中就实现电芯本体与压力传感器的集成,并且该种压力传感器可实现信号的无线传输。该种形式的电芯在模组或者系统成组后,可以完成本体的压力自测,后将压力信号输出后,配合电池管理系统实现信号的处理和分析,进而根据压力和电芯寿命的关系,实现电池的健康状态评估及实时监控。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/93603020343.23683.png" alt="image" title="image"></p><p>如上图,为该专利中展示的电芯压力与寿命之间关系示意图。可以看到,随着循环圈数的增加,电池容量保持率(电池寿命)和压力之间的关系。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1571811746644.0806.png" alt="image" title="image"></p><p>其次,在电芯级别中,还要考虑不同层之间电芯层级的关系,如上图所示,为集成有离电柔性压力传感器的电池内部示意图。电芯内部极片102之间插入离电柔性压力传感器201层,作为独立的一层。进而在电芯制作过程中就实现电芯本体与压力传感器的集成,并且该种压力传感器可实现信号的无线传输。该种形式的电芯在模组或者系统成组后,可以完成本体的压力自测。然后将压力信号输出后,配合电池管理系统实现信号的处理和分析,进而根据压力和电芯寿命的关系,实现电池的健康状态评估及实时监控。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1398234646315.2043.png" alt="image" title="image"><br>最后,在系统层级,如上图,为集成有圆环式力传感器的系统示意图。通过在成组电芯301与箱体401之间布置圆环式力传感器402,进而在系统制作过程中实现电芯与压力传感器的集成。该种形式的系统在完成装配后,可以完成电芯的压力监测,后将压力信号输出后,配合电池管理系统实现信号的处理和分析,进而根据压力和电芯寿命的关系,实现电池的健康状态评估及实时监控。</p><p>以上就是国轩高科公开的电池健康状态实时监控及评估预测方案,该方案针对当前传统三维度电池健康监控及评估的短板,基于四维度电池健康监控及评估方法,通过结构创新,采用三个不同层级分别对电池的实时压力进行采集。进而通过信号处理和分析,实现了电池健康的实时监控和评估。</p>
                                                    ]]></description>
            <pubDate>Thu, 23 Feb 2023 15:27:03 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386469</guid>
            <link>https://aijishu.com/a/1060000000386469</link>
        </item>
        <item>
            <title><![CDATA[ChatGPT席卷全球背后:中美人工智能差距几何?]]></title>
            <description><![CDATA[<p>集微网报道 (文/陈兴华)ChatGPT以迅雷不及掩耳之势席卷全球多国同时,在中国也掀起前所未有的舆论热议,同时多家互联网、人工智能及产业链企业均表示将推进类ChatGPT应用和相关AI技术。</p><p>然而,国内舆论主要聚焦在ChatGPT使用体验、产业链相关受益方以及对产业变革影响等方面,鲜有探讨其背后折射出的中美人工智能生态竞争差异,中国缘何没有率先创造出ChatGPT,以及应如何利用相关AI技术带来的新机遇赋能国内产业经济发展。</p><p>相比之下,主流外媒对这类话题从制度、创新环境和人才竞争等多个层面提供了一些可供参考的分析借鉴。此外,国内行业人士指出,ChatGPT将刺激开启AI经济新时代,推动中国相关数据、算法和算力技术开发建设,对万物互联的数字经济发展意义非凡。</p><p>为什么ChatGPT没有出现在中国?</p><p>作为科技产业、社会经济发展的一项变革性技术与关键性力量,人工智能未来将深刻影响各国经济、科技和军事等综合实力对比,甚至重塑世界竞争格局。而经过多年行业发展演变,目前全球人工智能发展呈现中美两国引领、主要国家激烈竞逐的总体格局。</p><p>对于为何ChatGPT这一现象级消费类AI应用没有率先出现在中国,纽约时报、路透社、南华早报、CNBC等国际主流媒体刊文和一些分析师观点均提及“审查制度”,包括中国正寻求加强与美国AI竞争以及技术监督之间的平衡,但审查管制阻碍了科技产业发展。即使中国开发出ChatGPT相关产品,“过多限制、内容监管也可能会阻碍其商业化和进一步创新。”</p><p>另一方面,以往基于政府支持及较宽松的发展环境,中国互联网科技企业曾创造出举世瞩目的成就,但后续也因一定程度的无序扩张等因素引致监管。如今,随着国际地缘和产业发展形势演变,如何权衡互联网及AI等科技领域的监管力度和方式已成为国内重要课题。</p><p>“任何重要技术方面的产品发展,其实都离不开制度和整个环境,”斯坦福中国经济与制度研究中心高级研究学者许成钢表示。他以TikTok的中国版抖音为例,称中国企业未来可能无法再实现此类创新。因为开放的环境一旦没有了,重大创新就很难出现。</p><p>对于中国未首先打造出ChatGPT类似产品,产经观察家、IT行业分析师丁少将对集微网表示,在当前宏观经济和产业环境下涉及多重原因,包括创新和文化环境、内容监管,行业企业的资本投入、技术实力以及资源整合和商用落地等多方面。另外,“这类产品推出之前还有很多确保内容安全等前置性工作需要去做,这在中国特别重要。”</p><p>从产业发展角度来看,这也考验的是国内企业家和投资者的魄力。丁少将指出,“ChatGPT背后AI的数据训练、数据建模和人力投入等成本其实非常高。但基于商业化前景不明朗和自身资源实力等判断,中国公司在这方面投入还有所欠缺,不及微软等巨头公司。”</p><p>不过,国外科技媒体Semafor表示,美国进行开放式人工智能研究的传统比中国要长得多,而且并非“只是受利润动机的限制”。OpenAI最初是一家非营利性研究组织,其唯一目的是开发先进的人工智能。从这一角度而言,或许可以引发国内产业界更多思考。</p><p>中美AI产业链底层技术尚存差距</p><p>正如百度创始人、董事长兼CEO李彦宏1月在百度Create开发者大会上所言,“芯片卡脖子很要紧,但软件卡脖子其实一样要紧”。需要客观承认的是,ChatGPT在全球多国势如破竹同时,也映衬出中国在AI产业链软硬件关键及底层技术存在的部分差距及相关挑战。</p><p>众所周知,ChatGPT是一种由OpenAI训练的大型语言模型。在业内人士看来,目前全球还没有能跟ChatGPT抗衡的大模型,业界共识是中美差距在两年以上。“中国必须要有自主基座、应用大模型。由于OpenAI关键模型不开源只给API使用,中国已经是被‘卡脖子’了。”清华大学计算机科学与技术系长聘副教授黄民烈日前对国内媒体表示。</p><p>此外,黄民烈还提到,在迭代至GPT-3过程中,OpenAI建立起了真实的用户调用和模型迭代之间的飞轮,以及非常重视真实世界数据的调用和数据对模型的迭代,同时也推动相关生态建立。但业内人士称,目前国内还没有比较好的公司把数据和模型的飞轮完整转起来。</p><p>“从已有资料看,ChatGPT、文心一言都使用了包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用技术。从这四方面,如果说相关技术被‘卡脖子’,芯片可能是一个,既要算得便宜还要算得快,需要至少6纳米芯片,将来还需要更精密的3纳米以下芯片。”中国电信首席专家、美国贝尔实验室院士毕奇日前接受《法制周末》表示。</p><p>另据国内外媒体和专家学者均指出,美国的半导体禁令和其他贸易制裁将可能导致中国在最新的人工智能竞赛中处于劣势。由于担心美国进一步制裁,中国大型科技企业已储备足够的先进芯片,但如果无法获得下一代芯片,人工智能技术的进一步发展可能会受到严重阻碍。</p><p>与此同时,顶尖AI人才外流也是重要挑战。根据智库MacroPolo的数据,虽然中国总体培养了大约30%的顶尖AI研究人员,但大多数流失到了美国。纽约时报曾刊文《美国人工智能领域的秘密武器:中国人才》指出,在人工智能尖端热门领域,很多来自美国的开创性工作都由华人的智慧推动。这便不难解释美国顶尖AI研究及学术机构、专家学者等不乏华人身影。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1354563635305.925.jpg" alt="image" title="image"></p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/100775343913.72034.jpg" alt="image" title="image"></p><p>图源:纽约时报</p><p>AI新技术应用将催化数字经济发展</p><p>尽管ChatGPT的大模型产品当前在全球相对领先,但由于中美在AI大数据、算法、大模型发展路径存在一定程度不同,中国在相关技术产品的发展上也有自身特有优势,其中包括中国产业界在ChatGPT等人工智能技术软件层面具有更好的传统开发实力,以及能够让更多大数据应用积极地与人工智能结合,尤其在如今系统芯片呈现算法固化的特点情况下等。</p><p>此外,麻省理工科技评论援引华盛顿大学政治学助理教授杰弗里·丁(Jeffrey Ding)的话进一步表示,中国可以更好获得中文AI训练材料,并且出于商业目的快速开发新的产品。OpenAI、微软主要是针对英语市场进行优化。相对而言,百度等中国公司并非要占领英语市场,会针对中文领域进行专门优化升级。这其中存在一个真实而独特的优势和机会。</p><p>毋庸置疑,ChatGPT的大热也将促进国内数据算法迭代升级、智算中心建设乃至整个人工智能产业生态的发展。例如以GPT为代表的大模型正在催化新一轮AI算力储备,国内智算中心项目近期密集公布新进展。目前,全国已有超过30个城市正在建设或提出建设智算中心,可带动人工智能核心产业和相关科技产业实现数倍级增长。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/573235005362.3618.jpg" alt="image" title="image"></p><p>湖北随州5A级智算中心 图源:中科曙光</p><p>在ChatGPT刺激推动下,创道投资咨询总经理步日欣表示,“AI如果进一步与工业、制造业、交通运输业等传统行业结合,将实质性提高生产力水平,并且有助于缓解即将到来的人口老龄化等社会经济问题,从而体现技术最根本的价值。”另据麦肯锡的报告表示,随着人工智能和机器学习技术渗透到各行各业,其每年可为中国经济带来达6000亿美元GDP。</p><p>为了释放这一庞大产业价值,中国需要对数据生态、前沿技术、各类人才和商业模式以及标准和法规进一步投资和完善,并利用相关优势应对挑战和“扬长补短”。如对于高性能芯片受制于人,相关专家表示,解决方法包括自研CPU芯片,采用Chiplet或分布式芯片替代。而弯道超车路径之一是,号召各类拥有数据的机构参与预训练及与芯片计算架构公司等深度合作。</p><p>对于如何把握AI新技术为国内产业发展带来的机遇,丁少将建议称,第一,对发展前沿科技而言,构建开放包容的环境至关重要。第二,国家及社会资本应更加活跃,并加大对创新型企业的激励和战略支持。第三,推动AI科技创新和各产业发展相融合,让其成为具有商业潜力和前景的新技术和产业,进而成为各企业新的增长引擎,乃至促进整个国民经济发展。</p><p>(校对/杜莎)</p>
                                                    ]]></description>
            <pubDate>Thu, 23 Feb 2023 15:27:03 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386418</guid>
            <link>https://aijishu.com/a/1060000000386418</link>
        </item>
        <item>
            <title><![CDATA[为提高电阻器抗浪涌能力 鼎声微电提出相关技术及加工设备方案]]></title>
            <description><![CDATA[<p>【爱集微点评】鼎声微电公开的抗浪涌电阻器及其加工设备方案,鉴于目前电阻器的发展受到尺寸的约束,该方案在电阻器本体的侧面增加了侧面电阻体,这样无需增加电阻器本体的尺寸,也可进一步提高电阻器本体的抗浪涌能力。</p><p>集微网消息,贴片电阻又名片式固定电阻器,常规的贴片电阻多是采用丝网印刷将电阻性材料淀积在绝缘基体上,然后烧结形成的,具有耐潮湿、耐高温和可靠度高的优点。贴片电阻是使用的过程中,常会遇到浪涌,浪涌也叫突波,顾名思义就是超出正常工作电压的瞬间过电压,电阻被施加这种浪涌电压时,过度的电应力会使电阻特性受到影响,最坏的情况下可能导致芯片损坏。</p><p>抗浪涌电阻器具有较好的抗浪涌能力,其原理是:拉长电极间距,使电位梯度平缓,从而减少对芯片的损坏。简单的说:正常情况下,贴片电阻上的电阻体在两个电极之间是直来直往的,呈一条直线状。而抗浪涌电阻器上的电阻体则呈波浪状,通过在电极之间设置长度较长的电阻体,使得电极间的导通路径变长,进而使得电位梯度变得平缓,从而提高抗浪涌能力。</p><p>在现有技术中,贴片电阻上的电阻体都是先通过丝网印刷的方式,将电阻性材料按照一定的形状印刷在绝缘基体上,然后再烧结而成的。常规的丝网印刷只能将电阻性材料印刷在绝缘基体的上表面处,但是绝缘基体的上表面的面积是有限的。当需要进一步提高电阻的抗浪涌能力时,只能采用增加电阻器尺寸的方式来实现,而大尺寸电阻器则需要更多的电路板空间,虽然增加了电阻器的抗浪涌能力,但是又会带来新的其他问题。</p><p>为此,鼎声微电在2021年11月16日申请了一项名为“一种抗浪涌电阻器及其加工设备”的发明专利(申请号:202111354948.3),申请人为宁波鼎声微电子科技有限公司。</p><p>根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1417490822062.9102.png" alt="image" title="image"></p><p>如上图,为该专利中公开的抗浪涌电阻器本体结构的示意图,在该电阻器的两端均设置有电极2和电阻3,电阻由端部电阻体301、表面电阻体302和侧面电阻体303三部分组成。表面电阻体呈长条状,均布在电阻器本体的上表面。侧面电阻体呈U形状,位于电阻器本体的两侧,通过侧面电阻体将表面电阻体相互连接在一起。端部电阻体位于电阻器本体的两端,通过端部电阻体使电极与表面电阻体连接在一起。</p><p>为了提高电阻器本体的抗浪涌能力,在本体上设置了由端部电阻体、表面电阻体和侧面电阻体组成的电阻,端部电阻体和表面电阻体均位于电阻器本体的上表面。正常情况下,电阻器本体上表面的面积是有限的,如果采用增加电阻长度的方式来提高电阻器本体的抗浪涌能力,当电阻器本体上表面的电阻的长度无法再增加时,只能增加电阻器本体的尺寸。</p><p>当电阻器本体的尺寸变大后,这样电阻器本体的上表面就可排布更多的电阻,但是电阻器本体的尺寸变大后,则会带来新的问题。该专利中的方案对电阻器本体进行改进时,在电阻器本体的侧面增加了侧面电阻体,端部电阻体、表面电阻体和侧面电阻体为一个整体,这样就无需增加电阻器本体的尺寸,也可进一步提高电阻器本体的抗浪涌能力。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1576156235607.1685.png" alt="image" title="image"></p><p>为了能够方便加工该抗浪涌电阻器,在该专利中还公开了一种抗浪涌电阻器的加工设备,如上图所示。印刷台4的上侧设有丝网印刷机构,该结构包括丝网印板5、第一升降板6和第二升降板7。第一升降板上对称设有第一气缸8,第二升降板位于第一升降板的一侧,且第二升降板与第一气缸的活塞杆固定连接。第二升降板的下端设有刮板,丝网印板上设有若干个第一开口501。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1361348511722.1265.png" alt="image" title="image"></p><p>如上图,为丝网印板、第一固定座和第二固定座的剖视图。丝网印板的下侧设有若干个侧面印刷组件,且侧面印刷组件包括第一固定座10和第二固定座11,二者均为空心结构,并与丝网印板滑动连接。且两个固定座的一侧均设有走料槽12,走料槽与第一开口连通。</p><p>在该结构中,通过对现有的电阻印刷设备进行改进,使得在对电阻进行丝网印刷时,可以在电阻器本体的上表面及侧面均印刷上电阻体,加工更加方便。具体的工作原理:在印刷台上设有丝网印刷机构,丝网印刷机构的下侧设有若干个侧面印刷组件,丝网印刷机构与侧面印刷组件配合使用,共同完成电阻器本体上表面和侧面的电阻体的印刷。</p><p>在使用时,浆液状的电阻性材料通过管接口13进入第一固定座和第二固定座内,在充满两个固定座的内部空腔后,会通过走料槽流出。走料槽的形状与侧面电阻体相同,而且走料槽的上端与第一开口连通。物料通过走料槽进入第一开口并聚集,随着物料的聚集,部分物料会堆积在第一开口内,然后管接口停止进料,第二气缸工作,使第一升降板向下运动。</p><p>此时,第一升降板会带着第一气缸及第二升降板一起运动,第二升降板上的刮板与丝网印板抵触。随后第一气缸工作,推动第二升降板和刮板往复运动,通过刮板来将第一开口处的物料刮平。同时,在印刷台一侧设有刮料机构,通过刮料机构可以将走料槽处的物料刮平,随后第一固定座和第二固定座反向运动,接着第一升降板和第二升降板回归原位。侧面电阻体和上表面电阻体同时印刷完成,然后将丝网印板取下,将带有印刷工件的载料板取走即可。</p><p>以上就是鼎声微电公开的抗浪涌电阻器及其加工设备方案,鉴于目前电阻器的发展受到尺寸的约束,该方案在电阻器本体的侧面增加了侧面电阻体,这样无需增加电阻器本体的尺寸,也可进一步提高电阻器本体的抗浪涌能力。</p>
                                                    ]]></description>
            <pubDate>Wed, 22 Feb 2023 15:27:03 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386150</guid>
            <link>https://aijishu.com/a/1060000000386150</link>
        </item>
        <item>
            <title><![CDATA[欧洲推迟建厂 台积电今年日子不好过]]></title>
            <description><![CDATA[<p>集微网报道(文/李映)继被注重自由现金流的“股神”巴菲特去年第四季度重砍台积电ADR股票达5176万股、减持幅度高达86%之后,台积电又传出欧洲建厂将延后两年的消息,让业界心头一紧,台积电现金流真的吃紧了吗?</p><p>复盘台积电延后欧洲建厂的逻辑,或许不止于现金流的考量,更是在市场供需变化、投资回报率权衡之后做出的理性选择。</p><p>大幅抛售引发现金流忧虑?</p><p>被“股神”巴菲特仅仅“青睐”一季之后就被大幅抛售,对台积电来说不啻一场次生灾难,股价重挫4%即是实证。</p><p>而在集微网“买进卖出只一季 “股神”看不懂半导体?”文章中已分析出这一举动背后的逻辑:即台积电在日本、美国、中国台湾都将进行大笔投资,还有可能在德国进一步投建晶圆代工厂,而在日本、美国、德国投建晶圆代工厂成本非常高,需占用大量的资本,初期可能会持续亏损,并不断稀释台积电的利润,影响未来的自由现金流,这与巴菲特看重自由现金流的投资逻辑相违背。</p><p>就现金流而言,2022年台积电的全年资本开支为363亿美元,或1.1万亿新台币,产生了经营现金流1.6万亿新台币,自由现金流为5280亿新台币,算得上财才雄厚。</p><p>伴随着地缘政治思维的抬头,将半导体业视为攸关战略产业的美国、欧洲、日本等相继推出数千亿美元大手笔投资计划力促半导体制造业回流。台积电作为代工业第一巨头,成为各国争抛橄榄枝的主力,也频频释出重大投资或扩产计划。</p><p>有半导体行业人士指出,尽管有各国政府的补贴,但建厂尤其是先进工艺厂的成本支出十分庞大。原本台积电在日本晶圆代工厂计划投资86亿美元,在美国晶圆厂投资120亿美元,但在去年12月台积电将美国晶圆厂投资从120亿美元增加到了400美元,且台积电还计划在中国台湾、欧洲德国投建代工厂,未来几年台积电将产生大量的资本支出,对其持续稳定的自由现金流造成影响。</p><p>加之有台积电在美建8英寸厂Wafertech成本高企、长期亏损之后才转为盈利、2021年营收仅为77.35亿元新台币形同鸡肋的“珠玉”在前,台积电在美国、日本、欧洲等地建厂如何不拖累整体业绩、如何快速产生正反馈都成为台积电不得不直面的问题。</p><p>更值得忧虑的是,台积电已处于地缘政治风暴眼之中。近日由于担忧台海风险,由美国前副总统高尔(Al Gore)联合创建的Generation Investment Management金融服务公司也出清台积电ADR共326,654股持股,换算价值达2240万美元。</p><p>多重因素导致暂时搁置</p><p>急行军的台积电在此时为欧洲建厂按下了“刹车”,但这背后的考量或不止现金流那么简单。</p><p>去年底又传出台积电将计划在欧洲设厂的消息。今年1月12日,在台积电的财报发布会上,台积电也表示正考虑到欧洲德国建设汽车芯片工厂,但仅过了一月,台积电就宣布单方“推迟”,变化总比计划更快。</p><p>业内人士对集微网指出,这既有行业环境变化的因素,也涉及台积电投资建厂的策略调整。</p><p>前两年受多重因素影响汽车芯片持续短缺,导致多家整车厂家停产或减产汽车。据AFS的最新数据显示,截至去年12月11日,今年全球汽车市场累计减产约435.1万辆汽车。不过受疫情放开和包括英飞凌、瑞萨、TI等汽车芯片大厂陆续释出大手笔投资扩产的消息,芯片短缺将有所缓解。</p><p>因而上述人士分析,台积电在欧洲建厂的政治诉求与商业因素相比美国、日本的权重本身就较弱,且考虑到汽车芯片供需将放缓,产能可转至中国台湾甚至转往日本、美国等地新厂生产,有助于更好地调配产能,因而台积电将欧洲新厂时程延后亦在情理之中。</p><p>此外,更现实的因子还在于,在欧洲建厂面临资金、人才、水电供应等诸多压力,且赴欧洲设厂成本估计更高于美国与日本,将对台积电资本支出、人力投入和运维造成更多的考验。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/187541081557.0785.png" alt="image" title="image"></p><p>甚至还有消息称,环球晶收购德国同业世创因德国官方以“审核时间来不及”为由而失利,引起了连锁效应。有消息人士透露,原本称赴德国设厂还处于“非常非常早期”的台积电,恐因环球晶收购世创未成,欧洲新厂落脚地点或将转向评估捷克。</p><p>联想到台积电在去年回应欧洲建厂所言:“设厂地点选择有诸多考量因素,台积电拓展全球制造版图是基于客户需求、商机、运营效率和成本等多方面的考量,不排除任何可能性,一切以公司正式对外公告为主。”</p><p>或许一切变数都藏在“不排除”之中。</p><p>今年日子不太好过?</p><p>虽然现代工业在2022年整体表现出“逃逸”下行周期的强大力场,但由于终端需求反映到代工订单的滞后性,这一份“寒意”传导至2023年之际冲击已然更加强烈。</p><p>反映到现实就是各大代工厂的产能利用率在不断下探,有的甚至直接接近“腰斩”。代工厂不得不使出浑身解数,无论是裁员、代工降价、资本支出削减等举措频出,为今年走势蒙上了阴霾。</p><p>尽管台积电经营有年,长期致力于平台建设、工艺多元化,相对受损面较小,但在寒潮大势之下,台积电亦无法独善其身。</p><p>在台积电的产能利用率中,8英寸相对健康,但12英寸先进制程的较低。即便代工报价并未变化,但据称私下按客户与订单规模不同,给予优惠。并且,已调低今年第一季度营收值,预计营收为167亿~175亿美元,将同比下降12.2%~16.2%;毛利率也因产能利用率及3nm初期折旧提升,预计下降到53.5%~55.5%。</p><p>或许这还只是开始。</p><p>更有报道称,由于苹果和AMD的订单减少,台积电2023年首季5/4nm工艺节点的产能利用率将降至约75%,第二季度有可能降至70%以下。作为台积电的主要营收入来源,5/4nm工艺的产能利用率在第二季度如果进一步下滑,将导致这一工艺的营收进一步降低,如果其他工艺不能有效弥补,其营收在第二季度也就可能继续环比下滑。</p><p>从2023年全年来看,台积电面临下行周期冲击,且海外投资建厂背负高昂资本支出、各项成本大增等因素也将进一步蚕食其盈利水平,台积电的毛利率也不得不打折扣,将全年毛利率回调至53%。</p><p>至于海外建厂之路,考虑到国外产业环境与商业诉求,行业人士最后表示,台积电在美国建厂是“逼不得已”,不做也得做,但欧洲建厂对台积电来说并没有太多的利好,今年产能稼动率在持续走低,后续或犹存变局。(校对 林美炳)</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 15:27:03 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385740</guid>
            <link>https://aijishu.com/a/1060000000385740</link>
        </item>
        <item>
            <title><![CDATA[一手、二手设备进口同步承压,光刻机自立自强该如何破题?]]></title>
            <description><![CDATA[<p>集微网消息,对华先进半导体制造设备的管制之网,正越收越紧、越撒越广。</p><p>2月16日,美国商务部、司法部、FBI、国土安全调查局与12个州的检察官办公室联合组建出口管制执法“特别工作组”,以“打击非法行为者”并保护先进半导体制造设备等关键技术不被“民族国家对手”获取。</p><p>织密自家网眼的同时,这张瞄准先进半导体制造设备贸易的大网也已纳入日本、荷兰,外界普遍预计两国将看齐美商务部去年10月7日新规。</p><p>正如中国半导体行业协会严正声明所述,此举如果成为现实,将对中国半导体产业造成巨大伤害。</p><p>作为半导体制造设备中公认“最短的短板”,光刻机再次成为各界关注这一问题的焦点,不过遍观行业内外当前堪称汗牛充栋的讨论,在“要做什么”(What)的层面往往过于宏观、流于务虚,对“怎样去做”(How)更甚少着墨。</p><p>比设备禁运更巨大的威胁是什么?</p><p>回顾去年10月7日以来的不少“专家”观点,往往对美国当局的政策影响和“后手”布局预期不足,以至于在一步紧似一步的快节奏地缘因素变化中,颇有“今日割五城,明日割十城,然后得一夕安寝。起视四境,而秦兵又至矣”的被动感。</p><p>按照目前推测,日本、荷兰光刻机对华出口管制标准将是能否实现28纳米以下产品制造。部分高端DUV浸没式光刻机如ASML NXT:2050i,由于具备通过多次曝光等工艺增强方法制造7纳米、甚至5纳米先进制程产品的技术潜力,因此尽管其良率、精度上都无法与EUV光刻机媲美,但此次恐怕将很难幸免于管制罗网。</p><p>ASML财报预计,荷兰管制新规起草生效将需要“很多个月”(many months),因此在2023年内不会产生实质性影响,但这绝不意味着能够喘口气,歇歇脚。这一新规对光刻机的限制是否会涵盖相应零配件和运维服务,目前仍有相当大不确定性,需要引起国内高度关注。</p><p>作为技术复杂度极高的设备,光刻机使用过程中需要持续、高强度的运维保障,如定期针对光学镜头磨损进行像差、焦距的调整;不定期更新定标、校正、运动控制的大量软件算法;或根据晶圆厂工艺技术研发需求协助改装升级产品,提升产量或分辨率。</p><p>以ASML为例,这家“光刻巨人”配备超过9000人的客户支持团队,在中国、韩国等客户密集区域就近设有维修厂站,2022年服务板块收入就达到了57亿欧元。深入晶圆制造一线的现场工程师团队,也如同毛细血管一样,源源不断将基础数据与knowhow反馈给公司研发部门,为新产品迭代建立了坚实基础。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/600664647912.70261374332161306.1428.png" alt="image" title="image"></p><p>正因如此,假如ASML等厂商被迫停止对特定型号浸没式光刻机的运维支持,即便相关设备已经“抢购”、“抢运”到位,后续的技术升级乃至基础运维也有巨大的不确定性。有近二十年半导体厂设备材料实务经验的工程师杜元贺向集微网表示,没有原厂支持,光刻机部分软件功能将无法更新升级,而如果说软件受限还能勉强“凑合”,一旦出现大的故障,专用备件又该从何而来?</p><p>外界有观点认为,目前东亚、东南亚区域的二手半导体设备流通网络可以解决这一问题,然而在美国当局将组建“特别工作组”强化执行的情况下,这一网络的可靠性面临考验。事实上,2012年、2014年,就先后有两位中国公民因万机仪器(MKS Instruments)敏感设备转售伊朗,而遭美国执法部门海外诱捕,其中一位还是MKS中国分支机构销售经理。值得一提的是,MKS也同样是ASML的重要上游供应商,从这一案例,不难窥见美国一旦“认真起来”,对敏感技术海外地下市场流通的控制力。</p><p>更进一步展望,杜工向集微网指出,在尝到甜头后,美国当局或许会越来越激进地将光刻机等关键核心半导体设备“武器化”:“这就是高悬在我国半导体事业上的达摩克里斯之剑。随时都有可能对我进行封锁禁运,如果参照俄乌冲突,我们有任何一个地方忤逆或者没有按照美国的意愿行事,这个达摩克里斯之剑随时都会砸到我们的头上。何止DUV光刻机,哪怕美国,日本,荷兰I线光刻机,包括二手光刻机禁运,我们也将十分被动。”<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/998220003584.1417400574149634.22784.png" alt="image" title="image"></p><p>此外,在光刻工艺量测设备领域,ASML与KLA也具有垄断性优势。在KLA业已受限的情况下,ASML量测设备接着断供,影响或将向成熟制程领域进一步扩散。</p><p>破解卡脖子难关,航发带来的启示</p><p>短期来看,在日本、荷兰设备出口新规出台前,抓紧机会超量采购是国内下游厂商的当务之急。放眼长远,光刻机等关键半导体设备的自立自强无疑是必由之路。除了胜利,我们别无选择。</p><p>不过在当下,怎样实现光刻机的自立自强,舆论场上存在着相当明显的分歧。尽管多数有识之士呼吁依靠新型举国体制突围,但也有难以忽视的声音认为,过多的产业政策干预很难起到设想的作用,国产光刻机在前道制程环节的应用现状,是其核心论据。</p><p>客观地说,我国高端光刻机研发与产业化现状,的确与当下的应用急需存在一定落差,例如科技部2017年印发的《“十三五”先进制造技术领域科技创新专项规划》明确提出,光刻机及核心部件领域应实现“研制28纳米浸没式光刻机产品,进入大生产线考核;开展配套光学系统、双工件台等核心部件产品研发,并集成到整机。”</p><p>为什么历经02专项和“大基金”十余年接力,光刻机的进展依然不尽如人意?围绕这一问题,众多所谓“专家”开出了令人眼花缭乱的“诊断”和“药方”,却少有人实际梳理过相关投入情况。</p><p>事实上,回望02专项启动之初的2009年,该重大专项面向全国广泛征集项目,经过严格的筛选及“三评两审”立项程序,拟启动54个项目,其中装备整机15项、成套工艺11项、关键材料9项、关键技术与零部件11项、前瞻性研究等8项。</p><p>以上所有项目,总投资180多亿元人民币,其中光刻机能够分到多大的蛋糕不难想象,而同在2009年,ASML单年的研发投入就达到约45亿元人民币,这还是该公司遭遇产业寒冬,大幅削减研发经费的结果。</p><p>与菲薄的投入相比,我国光刻机乃至更广泛半导体制程设备的自主研发能够达到目前的进展,可以说已经堪称“奇迹”。不可否认,在02专项和“大基金”的具体推进中,也存在一些不足,杜工就谈到,国内在光刻机研发上“有点急功近利,走没有学会就想学跑。结果企业的发展就是基础不牢地动山摇。光刻机慢工出细活,那点投资杯水车薪,指望一个公司能做通光刻机全产业链是不可能的”。</p><p>对高技术复杂度产品研发规律认识不足,并非当时半导体领域所独有,事实上,今天已经彻底摆脱“卡脖子”痛楚的我国军用航空发动机,十多年前同样存在类似痼疾,以至于行业泰斗感言:“墨守单纯‘解决有无’理念,不尊重科学规律,反而阻碍发动机技术发展。事实证明,材料尚未研究成功,抗疲劳技术尚未研究,使关键基础构件成为无源之水。未研究关键基础构件就装配发动机,使发动机成为无本之木。在型号研制中‘材料、工艺攻关’、‘型号带材料’、‘型号带制造’、‘设计牵头材料、制造技术’等不科学理念和急于求成、急功近利的方法不仅研制周期较国外长,各种风险集中在型号上。”</p><p>我国航空工业之所以能够突破军用航发这一同样多学科高度综合的现代制造业结晶,关键在于咬牙吃劲的关头能够克服走捷径的诱惑,果断改变通过试验验证,基于研仿原型逐次修改的传统研制方法,咬牙走通了一个突破单项关键技术-部件验证-核心机-验证机-型号研制的完整过程,打破了0和1之间的反复循环,打开了从10到100的迭代空间。</p><p>以此观之,我国光刻机自立自强,或许也应真正经历一场关键机型完整的正向研发“洗礼”。</p><p>杜工也向集微网表示,光刻机的研发应该先学会走路,再学会跑步,与其被美国制裁指挥棒调动,疲于追赶EUV、先进DUV风口,不妨从基础的KrF乃至I线光刻机扎扎实实吃透,真正建立起技术和系统的迭代基础,而这一过程,正是新型举国体制大有作为的舞台。</p><p>他同样以军工领域两弹一星为例,指出类似中央专委、国防科工委等高层级专责机构在重大科技攻关中必不可少:“国家不仅仅应该规划光刻机研发的结果,更必须亲历亲为管理过程,单靠一家企业‘揭榜挂帅’,坐等到点验收,不适合光刻机这样高度复杂的系统,必须要协调全产业链,集中攻关突破,对于光刻机的重要零部件和系统集成,应该国家有统一的协调调度,大学科研院所,国有民营公司都要参与进来,发挥各自的优势做关键零部件,然后由有实力的公司进行系统协调,先打通上下游供应链,再系统集成。”</p><p>结语</p><p>面对拍向半导体产业链的“惊涛骇浪”,我们已无需再抱有过多侥幸、缅怀和幻想,光刻机为代表的关键核心装备自立自强,是对外部霸凌的最有力回答。</p><p>已然化身科技自立自强进程“试金石”的光刻机,当下无疑承载了太多应有或不应有、合理或不合理的焦虑指点,但从另一个角度看,这样的喧嚣,恰恰也折射出全社会对技术进步的渴望和期待,这样的志气和心气在,终将推动我们不屈不挠地抵达胜利彼岸。</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 15:27:03 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385768</guid>
            <link>https://aijishu.com/a/1060000000385768</link>
        </item>
        <item>
            <title><![CDATA[极海如何做到后视镜“丝滑”调控?]]></title>
            <description><![CDATA[<p>【爱集微点评】极海的后视镜调节专利,通过提供方向盘域控制器、行驶域控制器、后视镜控制器以及后视镜电机等设备,使其能够根据方向盘角度信号和车辆速度信号对后视镜进行连续调控。</p><p>集微网消息,近日极海推出性能高、存储强、连接广的车规级MCU,其实随着汽车电子的多样性发展,极海在汽车电子领域已经为用户展现了众多技术实力,其中就包括车辆相关芯片。</p><p>目前,车辆的后视镜调节技术通常是通过采集车辆的角度信息、全球定位系统(Global Positioning System,GPS)接收器信息和地图信息等进行后视镜的自动控制,需要获取的信息冗余,设计复杂。实际使用中,由于变道的转向角不同,视野存在差异且随着转向过程中盲区也是不断发生变化,因此无法实现对后视镜的连续调控。</p><p>为此,极海于2021年11月24日申请了一项名为“后视镜调节系统、方法和微处理芯片”的发明专利(申请号:202111410716.5),申请人为珠海极海半导体有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1124881063527.1484.png" alt="image" title="image"></p><p>图1 后视镜调节系统的结构示意图</p><p>图1为本专利提出的一种后视镜调节系统的结构示意图,后视镜调节系统10所包含的模块如上图所示。其中,方向盘角度传感器11和车辆速度传感器12分别用于采集车辆的方向盘角度信号、车辆速度信号。方向盘域控制器13可以用来接收方向盘角度传感器11采集的方向盘角度信号,并将方向盘角度信号传递至后视镜控制器15。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1412352318357.311.png" alt="image" title="image"></p><p>图2 后视镜调节系统的具体结构示意图</p><p>图2为图1中从方向盘角度传感器到后视镜电机的示意图,方向盘域控制器13包括:A/D转换器131、中央处理器132、电源135、复位136、存储器137、第一CAN控制器138和第一CAN收发器139。</p><p>A/D转换器131用于将模拟信号的方向盘角度信号转换为数字信号的方向盘角度信号,并将转换为数字信号的方向盘角度信号发送至中央处理器122。中央处理器132用于处理数字信号的方向盘角度信号,并根据上述的方向盘角度信号生成“驱动”后视镜控制器15的处理单元151开始计时的命令信号。此外还将数字信号的方向盘角度信号传递至第一CAN控制器138,其用于将方向盘角度信号打包成CAN数据包,并将CAN数据包发送至第一CAN收发器139。第一CAN收发器139用于将CAN数据包转换为电压信号,并将电压信号发送至总线17,以使电压信号通过总线17传输至后视镜控制器15,在后视镜控制器15中可执行相关CAN数据的解包获得方向盘角度信号。</p><p>后视镜控制器15在接收到方向盘角度信号或车辆速度信号后开始计时并生成计时信息。根据方向盘角度信号、车辆速度信号和计时信息得到目标角度以及生成电机控制信号,同时将电机控制信号发送至后视镜电机16。能够优化后视镜调节的智能响应,避免意外触发后视镜转向,保证行驶安全。</p><p>简而言之,极海的后视镜调节专利,通过提供方向盘域控制器、行驶域控制器、后视镜控制器以及后视镜电机等设备,使其能够根据方向盘角度信号和车辆速度信号对后视镜进行连续调控。</p><p>极海是一家致力于开发工业级/车规级微控制器、高性能模拟芯片及系统级芯片的集成电路设计型企业,其团队拥有多年集成电路设计经验和嵌入式系统开发能力。极海在科技创新中持续投入了大量的精力,不断加速产业升级,为广大用户带来更优质的产品及方案。</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 15:27:03 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385764</guid>
            <link>https://aijishu.com/a/1060000000385764</link>
        </item>
        <item>
            <title><![CDATA[一线机构纷纷出手,国产线控底盘加速突围]]></title>
            <description><![CDATA[<p>集微网报道 (文/王丽英) 如果说电动化是新能源汽车变革的上半场,那么智能化无疑将是下半场变革的核心。作为汽车智能化的终极目标-自动驾驶要想落地实施,线控底盘是其中离不开的一项关键技术。</p><p>最近,一则小米子公司投资线控底盘企业千顾科技的消息引发热议,毕竟,小米造车正在关键推进期,围绕汽车领域的一举一动自然备受关注,事实上,小米产投在去年就曾领投同为线控底盘企业的同驭汽车。</p><p>除小米产投外,其他一些头部投资机构也纷纷出手线控底盘领域,多家创业企业都拿到了不菲的融资,线控底盘技术上车有望迎来加速期。</p><p>自动驾驶的基石,渗透率有望快速提升</p><p>在新的电子电气架构下,汽车执行系统同步发生变革,底盘系统逐步走向智能化、线控化。</p><p>汽车线控底盘主要由线控转向、线控制动、线控驱动(包含线控换挡、线控油门)和线控悬架(例如,线控空气悬架)四部分组成。线控底盘使用电信号取代传统的机械、液压或气动等形式来实现车辆的转向、制动和前进等操控。相比传统底盘,线控底盘可以实现对执行机构高效、精准的主动控制,是实现自动驾驶的基石。</p><p>从目前的装车量来看,这四部分中,线控油门技术已较为成熟,渗透率接近 100%;线控换挡技术难度较小,目前渗透率也比较高;线控制动与线控悬架技术部分已相对成熟,但装配率较低;线控转向技术仍处于发展中,渗透率极低。</p><p>线控制动是线控底盘的核心,技术难度高。它可实现底盘与车身之间的解耦,更好地适配L3级别以上智能驾驶方案。预计随着高级别自动驾驶车型渗透率不断提升,线控制动有望实现新的增长点。</p><p>根据传输介质的不同,线控制动系统可分为电子液压制动系统(EHB)和电子机械制动系统(EMB)。相较于EHB,EMB 完全摒弃了传统制动系统的制动液及液压管路等部件,是真正意义上的线控制动系统,但目前技术成熟度还有待提升。</p><p>线控空气悬架是底盘智能化的重要组成部分,可显著提高汽车操纵性和舒适性,在燃油车时代,是高端车型的豪华选项配置。对于电动汽车,线控空气悬架不仅提升驾乘体验,还有助于底盘轻量化,减少能耗提高续航里程,成为众多品牌追求的配置亮点。目前蔚来、理想、小鹏、东风、吉利、红旗、上汽大众均已推出配备或可选配空气悬架的车型。</p><p>作为自动驾驶的执行机构,线控底盘的性能好坏将直接影响自动驾驶的使用效果和安全性能。随着自动驾驶向更高级别发展,对感知层、决策层、执行层都提出了更高的要求,要进一步满足响应快、延迟低、精度高等要求。线控底盘通过电信号传导可以实现对执行机构高效、精准的主动控制,实现快速响应,有望替代传统底盘加速上车。</p><p>机构预测,2025年我国线控制动渗透率有望达30%以上,市场规模或达200亿元,2022~2025 年年复合增长率43%;2025年我国空气悬架市场有望达331亿元,2022~2025 年年复合增长率69%。</p><p>机构纷纷出手,国产力量加速突围</p><p>全球线控底盘市场多年来主要由国际Tier 1 厂商垄断,例如,博世、大陆集团、采埃孚、日立等,其中,在线控制动领域,博世的市占率更是超过90%。头部企业在技术研发、市场等方面掌握主要话语权,对本土OEM的开放度较低,导致国内线控底盘技术整体发展缓慢。</p><p>随着燃油车向新能源汽车的转型,传统汽车供应链体系正在被打破。尤其是过去两年汽车缺芯事件,推动了国内汽车供应链的自主建设,缺芯使得国内整车企业更重视供应链的安全可控。把握难得的供应链切入窗口期,国内多个线控底盘厂商获得知名整车厂定点,国产线控底盘企业在逐渐崛起。</p><p>例如,线控制动领域有拿森科技 英创汇智、同驭汽车、伯特利、比亚迪 、利氪科技、精工底盘、亚太股份、千顾科技等,线控空气悬架领域有保隆科技、中鼎股份、拓普集团等。</p><p>资本的嗅觉最敏锐,面对中国在新能源汽车市场产销量NO.1的强大市场背景,线控底盘市场呈现出了诱人的增量应用前景,头部机构纷纷出手,同时,线控底盘赛道涌现出了多家本土创业企业,并获得融资。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/702124138724.4385646038517716.1816.png" alt="image" title="image"></p><p>2021年12月,成立于2016年的拿森科技宣布完成5亿元的C轮融资,由中银投资、宁德时代、国投招商、高瓴创投等联合领投,将持续加强线控底盘的新产品开发、产业化以及客户服务能力,实现配套量产规模增长;2022年3月,同样成立于2016年的同驭科技完成由小米产投与东风交银联合领投的近2亿元A+轮融资,将助力其线控底盘新技术与新产品的开发投入、新产能建设。其后,线控底盘领域的初创企业融资接续而来,格陆博、利氪科技、千顾科技、英创汇智、比博斯特、时驾科技、济驭科技等先后拿到产业头部机构的投资。</p><p>尽管有资本护航,又面临应用爆发的黄金时期,但国内的线控底盘企业仍挑战重重。</p><p>业内人士指出,线控底盘整体渗透率不高,作为自动驾驶的关键基础,安全性要求苛刻,特别是线控制动技术门槛颇高,国产化率水平极低,国内厂商基本处于从0 到1的发展阶段,亟待整体性能提升,整车企业提供试用上车机会也非常关键。</p><p>与此同时,线控底盘行业需要发展出一套统一的行业基准。目前,不同品牌、不同车型底盘性能各不相同,各机构和厂家对线控底盘的评价指标和评价方法各不相同,在自动驾驶系统量产过程中,需要针对不同性能车型进行重复适配开发,造成资源浪费。</p><p>在汽车供应链自主可控的大趋势下,以及汽车智能化发展不断向L3等高级别自动驾驶系统升级推进下,国内线控底盘企业唯有以产品技术作为突发点,打破原有线控底盘核心技术壁垒,赢得整车企业及市场认可,才能逐步建立起国产化线控底盘的技术护城河,在这一新兴蓝海市场中获得主导权。</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 15:27:03 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385760</guid>
            <link>https://aijishu.com/a/1060000000385760</link>
        </item>
        <item>
            <title><![CDATA[比克电池最新圆柱电池专利]]></title>
            <description><![CDATA[<p>【爱集微点评】比克电池的圆柱电池专利,通过将正极多极耳、负极多极耳设置在电极组件中同侧,减少了装配工艺流程,降低生产成本。同时便于观察到焊点尺寸及形貌,降低了电池单体制程检测难度,提高异常品检出率。</p><p>集微网消息,比克电池官宣大圆柱电池项目落户常州,该项目计划总投资高达130亿元,如果未来大圆柱电池成为发展主流,那么本土产业链将因此受益。</p><p>现有圆柱锂二次电池结构采用的结构大多为极性相反的极耳从圆柱体电极组件两端引出,导致正极耳、负极耳与二次电池金属外壳进行焊接加工或其他电连接加工时需要采取不同的方案、使用不同的设备,造成装配工序的增加、工艺难度的提高和制造成本的上升。</p><p>为此,比克电池于2022年8月12日申请了一项名为“一种新型圆柱锂电池结构”的发明专利(申请号:202210967642.3),申请人为郑州比克电池有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/609808775485.0284.png" alt="image" title="image"></p><p>图1 集流构件式剖面结构示意图</p><p>图1为本专利提出的一种新型圆柱锂电池结构,壳体1为一端有底封闭,一端开口的空心圆柱型容器,一般采用镀镍钢板或不锈钢板通过冲压拉伸一体成型。</p><p>在壳体1内部设有容置腔,容置腔内放置电极组件2。电极组件2由正极极片、负极极片、隔膜卷绕而成,电极组件2的中心为中心孔14。电极组件2的上部向上引出正极多极耳4与负极多极耳3,正极多极耳4极片箔材一般采用铝箔,负极多极耳3极片箔材一般采用铜箔,通过激光模切或其他模切方式,极片边缘的未涂覆空箔区域形成间隔分布的极耳,并在卷绕后位于电极组件2的同侧且对称于中心孔14分布。使极性相同的极耳收拢、聚合在一起。</p><p>另外,电极组件2的上方设置端盖,端盖包括主体5、极柱6、绝缘构件7、密封构件8。主体5一般选用镀镍钢或不锈钢圆片,其中心开设通孔,主体接近边缘位置设有注液孔13,可以用于封口后注入电解液及开口化成。绝缘构件7包裹极柱6外圆周表面,极柱6位于通孔内,绝缘构件7密封极柱6与端盖间隙,密封构件8采用聚丙烯(PP)、聚对苯二甲酸丁二醇酯(PBT)、可溶性聚四氟乙烯(PFA)、聚苯硫醚(PPS)或其他绝缘且耐电解液腐蚀的材料注塑成型,密封主体5与壳体1上沿。壳体1的上沿向内弯折至少90°,压合密封构件8,主体5与壳体1组成密闭空间。</p><p>此外,负极多极耳3和正极多极耳4分别电连接主体5和极柱6。极柱6的横切面为工字形,极柱6的上下两部分分别将绝缘构件7压合在主体5的上下表面上。而且壳体1上设置有向内凹陷的环形的内凹槽路9,内凹槽路9位于电极组件2与密封构件8之间,其下沿紧密贴合电极组件2上端,端盖与电极组件2之间安装正极集流构件12与负极集流构件11。</p><p>简而言之,比克电池的圆柱电池专利,通过将正极多极耳、负极多极耳设置在电极组件中同侧,减少了装配工艺流程,降低生产成本。同时便于观察到焊点尺寸及形貌,降低了电池单体制程检测难度,提高异常品检出率。</p><p>比克电池早在2005年就在深圳成立了,其核心业务包括消费数码电池、动力电池以及电池回收。其中比克电池在动力电池领域的应用范围遍布全系车型,服务全球十余家一线汽车制造商。而且自从21年发布全极耳大圆柱电池至今,比克电池已经在该领域持续领先。</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 15:27:03 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385788</guid>
            <link>https://aijishu.com/a/1060000000385788</link>
        </item>
        <item>
            <title><![CDATA[本源量子提出量子计算任务异常发现方法]]></title>
            <description><![CDATA[<p>【爱集微点评】本源量子的量子计算机专利,通过提出的量子计算机架构使得在量子计算任务的执行过程中及时发现异常,有效提高了量子计算机执行量子计算任务的效率。</p><p>集微网消息,本源量子作为中国第一家量子计算公司,一直钻研量子相关技术,近日中国最新量子计算机“悟空”即将在这里诞生。</p><p>量子计算机与经典计算机一样,其核心都是为了解决某种问题而进行的数学计算。在量子计算机执行量子计算任务时,在各个阶段均有可能会出现异常情况,现有技术中判断量子计算机运行过程中是否出现异常时需要人工参与,且只能在量子计算任务的执行结果出现错误时才能发现,效率极低。目前在量子芯片中量子比特位数不多的情况下,采用现有的方案尚能勉强支持,但是随着量子技术的不断研究,在可预期的未来,必然会出现大规模甚至超大规模的量子芯片,届时需要解决的量子计算任务肯定会更加复杂。与之对应地,量子计算机需要面临的异常情况也将更加频繁且复杂。如果还是按照现有的技术方案,那么量子计算机在执行量子计算任务时的效率将会极低。</p><p>为此,本源量子于2022年2月28日申请了一项名为“量子计算机”的发明专利(申请号:202210191402.9),申请人为合肥本源量子计算科技有限责任公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1569703232406.8203.png" alt="image" title="image"><br>图1 量子计算机的结构示意图</p><p>图1为本专利提出的一种量子计算机的结构示意图,主要包括量子计算任务接收设备100、编译设备200、量子控制设备300、量子处理器400以及与编译模块和量子控制设备300通信连接的监控设备500。</p><p>其中量子计算任务接收设备100被配置为接受量子计算任务,编译设备200可以对量子计算任务进行编译处理,并输出对应的任务数据包。量子控制设备300和量子处理器400分别用于对当前任务数据包输出相应的调控信号以及执行量子计算任务。而监控设备500可以对编译设备200和量子控制设备300进行状态监控并分析编译设备200和/量子控制设备300是否发生异常情况。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/235340009981.79117.png" alt="image" title="image"></p><p>图2 量子计算机监控设备的结构示意图</p><p>图2为量子计算机监控设备具体的结构示意图,监控设备主要包括信息采集模块501、异常判断模块502、异常类型辨别模块503、异常存储模块504、异常更新模块505以及异常处理模块506。</p><p>其中,信息采集模块501和异常判断模块502分别从编译设备200/量子控制设备300中获取编译处理以及调控信号的第一相关信息,并判断是否发生异常情况。异常类型辨别模块503在得到异常判断模块502的结果后用于分辨具体的异常类型(硬件异常和软件异常)。异常存储模块504会预先存储设置的异常情况以及对应的异常类型,而异常更新模块505则对该存储数据进行更新,以便在后面碰到相同问题时可以及时辨别以及处理。最后,异常处理模块506会对相应的异常进行处理,解决策略包括重新启动编译设备200或对量子控制设备300进行复位等。</p><p>简而言之,本源量子的量子计算机专利,通过提出的量子计算机架构使得在量子计算任务的执行过程中及时发现异常,有效提高了量子计算机执行量子计算任务的效率。</p><p>本源量子是国内量子计算龙头企业,聚焦于量子计算产业生态建设,打造自主可控工程化量子计算机,积极推动量子计算产业落地,并探索量子计算产业应用。随着量子计算成果的逐渐推进,相信在不久将来,本源量子一定可以实现“让量子计算走出实验室,真正为人类服务”这一宗旨。</p>
                                                    ]]></description>
            <pubDate>Sun, 19 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385458</guid>
            <link>https://aijishu.com/a/1060000000385458</link>
        </item>
        <item>
            <title><![CDATA[小鹏汽车减少充电桩终端器件的损耗]]></title>
            <description><![CDATA[<p>【爱集微点评】小鹏汽车的充电桩专利,在充电枪供电或断电的切换过程中,摒弃了纯终端实现的方式,而是采用主机开启或关闭供电,实现了对于充电枪供电和断电的切换过程中减少终端器件损耗的效果。</p><p>集微网消息,据统计超过九成的充电桩生产企业近日已经复工了,今年充电桩在生产淡季产量仍迎来突破,随着新能源汽车销量的不断增长,充电桩的需求水涨船高。</p><p>随着新能源的不断发展,充电桩也正在不断的增设中。现有的充电桩主要由两部分组成,一部分是用于控制充电枪的充电控制结构,通常习惯于称之为终端,另一部分是用于对输入电源进行整流的整流控制结构称为主机。充电桩的使用过程中会存在供电和断电的切换,例如断电切换包括带电拔枪或出现异常断开等情况,此时需要迅速切断提供给充电枪的电能,传统技术中往往是在通流状态下直接关断充电控制结构一侧的接触器,该方式较为简单快速,但是长期使用该方式进行切换容易造成充电控制结构一侧的接触器主触点粘连,此时非但达不到切断电能的目的还具备一定的危险性,而且还加快了充电控制结构一侧的接触器损耗速度,增加运维成本的问题。</p><p>为此,小鹏汽车于2022年6月27日申请了一项名为“充电桩控制系统、充电桩及充电桩系统”的发明专利(申请号:202210744552.8),申请人为广州小鹏汽车科技有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/440317574971.7564.png" alt="image" title="image"></p><p>图1 充电桩控制系统的结构示意图</p><p>图1为本专利提出的一种充电桩控制系统的结构示意图,主要包括主机2和一个或多个终端1,终端1与主机2设于不同柜体内。其中终端1用于检测充电枪的状态信息,基于状态信息生成第一控制指令,并将第一控制指令发送至主机2。主机2包括一个或多个供电模块21,供电模块21用于为充电枪提供电能,而主机2基于第一控制指令控制对应的供电模块21的开启或关闭。</p><p>在实际使用时,上面场景主要应用于分体式的直流充电桩,主机2主要起到与电网连接将电网的交流电转换为直流电的作用,并将转换后的电源输送至终端1;而终端1则主要起到与充电枪连接的作用,例如终端1通过获取充电枪是否与电动汽车进行连接、用户是否对终端1进行充电操作如扫码或刷卡等信息,确定需要为充电枪进行供电或者断电。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1087328373158.4751.png" alt="image" title="image"></p><p>图2 充电桩控制系统的使用场景示意图</p><p>图2为充电桩控制系统的使用场景示意图,当充电枪4从电动汽车5上拔出时,此时终端1检测到充电枪4的状态信息为充电枪4与电动汽车5断开连接的电信号,因此生成需要关闭供电的第一控制指令,并将关闭供电的第一控制指令发送至主机2。主机2接收到关闭供电的第一控制指令时,基于第一控制指令确定为该充电枪4供电的一个供电模块21,并关闭该供电模块21,以此实现通过主机2断开充电枪4电流的效果。最后在终端1检测到无供电模块21的电流输出时,则关闭终端1用于控制充电枪4的开关元件如接触器进行断开,以此起到了开关元件在无电流的情况下进行闭合,大大减低了开关元件的损耗。</p><p>简而言之,小鹏汽车的充电桩专利,在充电枪供电或断电的切换过程中,摒弃了纯终端实现的方式,而是采用主机开启或关闭供电,实现了对于充电枪供电和断电的切换过程中减少终端器件损耗的效果。</p><p>作为一家专注未来出行的科技公司,小鹏汽车自成立的7年多以来,在国内、北美等地均设立研发中心,完成了全球化布局。同时坚持以开放包容的态度,吸纳全球各界人才,现在已经成为国内领先的智能电动汽车公司之一。相信在未来,小鹏可以在智能电车领域中取得更多硕果。</p>
                                                    ]]></description>
            <pubDate>Sun, 19 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385445</guid>
            <link>https://aijishu.com/a/1060000000385445</link>
        </item>
        <item>
            <title><![CDATA[普莱信智能提高芯片封装效率和精度]]></title>
            <description><![CDATA[<p>【爱集微点评】普莱信智能的芯片封装专利,通过对点位轨迹速度曲线进行优化调节,降低总运动时间。同时限制允许激起能量强度值,能够提高芯片封装效率、防止速度规划超调、提高芯片封装控制的精度。</p><p>集微网消息,普莱信智能深耕半导体封装领域多年,近日,普莱信智能从15737家广东省创新型中小企业中脱颖而出,荣获广东省“专精特新”中小企业。</p><p>随着集成电路产业的快速发展和芯片制造工艺的不断提高,小型化、多引脚、细间距的芯片对其封装设备高加速运动系统的响应能力、定位精度、定位时间等伺服性能提出了更高的要求。芯片封装的快速高精度定位要求主要通过加速度、定位精度和运行时间三个方面的参数进行体现。但是,由于芯片封装控制系统具有短行程高加速高速高精度定位的特点,且位移相对固定,现有技术方案难以发挥作用。因此,亟需一种用于芯片封装控制的速度规划方法,以提高芯片封装精度、降低所需时间。</p><p>为此,普莱信智能于2021年4月7日申请了一项名为“芯片封装控制的速度规划方法及芯片封装控制装置”的发明专利(申请号:202110373352.1),申请人为东莞普莱信智能技术有限公司。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1279684058249.9426.png" alt="image" title="image"></p><p>图1 芯片封装控制的速度规划方法示意图</p><p>图1为本专利提出的一种芯片封装控制的速度规划方法示意图,封装控制的点位轨迹速度曲线为非对称S曲线,点位的运动通过轴电机驱动。其中非对称S曲线按加减速特征划分为七个运行阶段:加加速段0T1、匀加速段T1T2、减加速段T2T3、匀速段T3T4、加减速段T4T5、匀减速段T5T6和减减速段T6T7。</p><p>实现的具体规划方法如下,首先设定插补周期、启动端插补周期数量、停止端插补周期数量、允许激起能量强度值、调节变化率上限、速度修改分辨率、加速度修改分辨率。根据如图1所示的各个参数间关系,设定初始速度Vs、结束速度Ve、最大速度Vmax、最大加速度A、最大减速度D、加加速度Ja、减加速度Jd、位移值S。</p><p>之后通过Vs、Vmax、A、D、Ja、Jd、S,计算点位轨迹速度曲线,获取总运动时间Tb;若是首次计算Tb,使Ta=Tb。接着根据插补周期、启动端插补周期数量、点位轨迹速度曲线,计算启动端各单个插补周期设备运行速度频率所激起的能量强度。然后计算得到各个插补周期的能量强度之和,并判断是否大于允许激起能量强度值,最后根据两者大小以及Ta、Tb的值对相关参数进行调节。</p><p>比如当能量强度之和大于允许激起能量强度值时对A、D、Ja、Jd进行优化调节,直至能量强度之和小于允许激起能量强度值,从而抑制芯片封装系统中轴电机的震动造成的残余振动,提高芯片封装控制的精度。此外,还可以调节A、D、Ja、Jd使总运动时间Tb减小,从而提高芯片封装效率。同时通过速度修改分辨率、加速度修改分辨率约束A、D、Ja、Jd的调节幅度,以此控制参数调节结果的变化率,防止速度规划超调。</p><p>简而言之,普莱信智能的芯片封装专利,通过对点位轨迹速度曲线进行优化调节,降低总运动时间。同时限制允许激起能量强度值,能够提高芯片封装效率、防止速度规划超调、提高芯片封装控制的精度。</p><p>普莱信智能在创立之初,就汇聚了运动控制、算法、机器视觉、直线电机、半导体设备和自动化设备领域的资深人士,希望在未来,普莱信智能可以继续通过国际级的先进技术来提高国内制造业水平,最终助力实现中国制造的智能化升级。</p>
                                                    ]]></description>
            <pubDate>Thu, 16 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385153</guid>
            <link>https://aijishu.com/a/1060000000385153</link>
        </item>
        <item>
            <title><![CDATA[PA去库存临近尾声 2023或成模组化元年]]></title>
            <description><![CDATA[<p>集微网报道(文/王小方) 阴云笼聚于上空,一道期待已久的曙光终于浮现眼前。据供应链消息,在经历了近一年半库存去化阶段后,随着智能手机厂商2022年囤积的PA库存不断出清,库存去化已逐渐步入尾声,并有望于今年Q1或Q2正式完结。</p><p>预计2023年伴随着终端厂商库存去化及消费者预期转好,智能手机等消费电子终端需求将逐步复苏。不过,由于需求端尚未产生十分明朗的复苏信号,PA厂商在短期内的压力依旧很大,它们既要应对当下的内卷困局,也需要瞄准未来的市场机会抢先下注。</p><p>5G仍是最强增长动能</p><p>对国内PA厂商而言,深陷长达一年半的库存去化周期,着实是一段备受煎熬的日子。不过,想要真正理解这一漫长的库存去化周期,还得追溯前因。</p><p>据IDC发布的数据显示,2020年全球智能手机市场出货量为12.92亿台,同比下跌5.9%。进入2021年后显露出些许回温势头,智能手机市场似乎已经从“黑暗期”中走出,再加上华为遭受美方制裁,释放出大块市场份额,各大手机厂商自然想要抓住这一难得契机,在2021年下半年间纷纷超额下单、致使库存水位快速上涨。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1284795508459.52441587226810157.241.png" alt="image" title="image"></p><p>图 集微网整理(数据来源 IDC)</p><p>由此可见,后来的库存积压与此前的“囤货潮”有着密切关联,根本原因在于彼时手机厂商对市场预期过于乐观,不曾料想仅数月后便转入库存调整期。而后在俄乌战争、通货膨胀、加息等因素的影响下,用户的消费需求进一步萎缩,库存去化不得不拉长战线。为了缓解库存压力,手机厂商也不得不减缓线下渠道的扩张节奏,追求更稳健的渠道布局。</p><p>在下游吃紧的形势下,寒气早已弥散至产业链各大环节。从代工方面看,受手机厂商库存去化影响,在2022年里稳懋、宏捷科、全新等上游砷化镓代工厂的产能利用率一再下滑,营收都跌至近年来的最低点。据一位业界资深人士透露,目前砷化镓代工产能存在一定程度过剩,几大头部厂商的平均产能利用率估计还不到60%。不过,砷化镓的富余产能可能会逐渐用于高性能滤波器、氮化镓等第三代半半导体的开发和规模化生产。</p><p>据IDC于不久前披露的数据显示,2022年全球智能手机出货量同比下降11.3%至12.1亿台,创下2013年以来的最低年度出货量。就国内市场而言,2022年中国智能手机市场出货量约为2.86亿台,同比下降13.2%。不过,IDC认为2023年销量将会出现反弹,预计2023年全球智能手机出货量达12.7亿部,同比增长2.8%。</p><p>“就国内一月的增长情况看还是不错的,智能手机的销量每周都在攀升,这可能源自疫情放开后报复性的消费反弹,最终全年销量有望超乎先前预期。总体而言,今年国内智能手机市场最终销量小幅上涨的概率是比较大的,但全球市场的情况则没有这么乐观。”爱集微咨询业务部副总赵翼说道。</p><p>即便面临库存积压和需求不振的挑战,但5G带来的巨大市场机会并未消退。同时,5G也给设计带来了不小的挑战,射频前端的采购流程、系统设计的复杂度都大幅提升,射频前端方案也在加快由分立射频元件向整合型模组化方向演变。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1022597149254.901346882222080.9907.png" alt="image" title="image"></p><p>图 集微网整理(数据来源 IDC)</p><p>就长期趋势而言,在5G的牵引下,国产射频前端向高端化、模组化突破的大方向不会动摇。本月初,据中国台湾省媒体报道,联发科和高通均决定不再推出新4G手机芯片,这反映出国际厂商主推5G、退出4G的决心,将导致5G总体市场份额增加,也将推动相关厂商增加对5G PA的布局。</p><p>目前,国内智能手机市场已初步显现回暖迹象,但由于这一观察时间区段较短,如果增长势头能持续到2023年Q1末,整个市场止跌回升的概率将大幅增加,届时产业链对于市场复苏的信心也将明显回升。</p><p>2023年有望成为PA模组化元年</p><p>就长期发展而言,射频前端行业在2022年出现的波动是暂时的,大趋势仍将是产业的长期增势。目前,去库存阶段已经逐渐不再是问题,在通货膨胀的背景下,需求端何时真正复苏才是当下业界真正关心的问题。</p><p>“目前,在国内射频前端产业中,头部PA厂商具有明显的规模效应优势,有了4G上的积累,相信5G也将是国产公司的天下。”赵翼进一步指出,“接下来,对射频前端的资源整合能力将更加凸显,能不能做好PA与滤波器之间的融合,将是PA公司制胜的关键。此外,在库存压力逐步缓解和疫情政策放开的双重刺激下,头部PA公司的产值预计将稳定增长。”</p><p>盛世投资管理合伙人、盛世智达总经理陈立志认为,国内PA厂商正逐步向高端产品市场迈进,呈现出高度集成化的趋势,模组化和射频前端全覆盖成为主力方向。长远来看,国内PA领域具有马太效应,龙头厂商与其他厂商的差距将会越来越大,行业有望迎来并购、合作的潮流。</p><p>从投融资方面看,随着资本市场逐渐趋于理性,对芯片设计公司的投资趋于谨慎,初创公司融资愈加困难,加上PA产能过剩导致的竞争加剧,面临较高的洗牌风险,正在加速市场出清;另一方面,头部PA厂商纷纷冲刺IPO,追求更高层次的发展,整个行业将逐渐淡出价格战,行业竞争将逐渐进入相对合理的阶段。</p><p>一位业界资深人士表示,随着PA厂商在高集成度模组产品上不断取得突破,2023年有望成为中国PA公司的模组化元年。目前,对于当前的内卷局面,PA厂商应该从设计层面下功夫,通过新颖的设计降低成本,为客户提供更具性价比的产品方案,这样才能既保障自身的毛利率,又能给客户带来更好的成本优势,而不是靠融资去补贴客户,从而将行业拉入内卷的泥淖。</p><p>目前,大多数国内PA厂商几乎全部收入都来自于手机业务,而国际巨头厂商非手机业务收入占比较高,如Skyworks的非手机业务收入占比在2022年已达36%。因此,对于国内PA厂商而言,还需在手机之外开拓更多市场,丰富产品线并进一步提升竞争力,寻找新的增长点。</p><p>陈立志认为,虽然不免受到行业内卷与市场需求低迷的直接影响,但对于国内PA厂商而言,机遇与挑战并存,一方面在5G基站、AIoT、可穿戴设备、汽车电子等方面,对于高端化、集成化PA产品的需求持续旺盛;另一方面,受国际局势影响,下游客户对于国产替代的意愿十分强烈。</p><p>“近年来,国际局势愈加扑朔迷离,贸易摩擦和专利冲突增加,这要求国内厂商提高知识产权保护意识,加快建设知识产权体系。”陈立志还特别提及。</p><p>就产业发展趋势而言,随着手机厂商逐渐走出库存去化周期,5G依旧会带来巨大的成长机会,模组化的突破也逐渐显露成效,国产射频前端的成长步伐不会减慢。</p>
                                                    ]]></description>
            <pubDate>Thu, 16 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385145</guid>
            <link>https://aijishu.com/a/1060000000385145</link>
        </item>
        <item>
            <title><![CDATA[代工业亮出“家底”:狂欢之后准备过冬?]]></title>
            <description><![CDATA[<p>集微网报道(文/李映)代工业的“全家桶”在财报陆续出炉之后基本集齐,也都亮出了各自的家底。</p><p>受宏观经济下行影响,全球2022年消费电子市场需求走向疲软,而代工业可谓逆风而行,</p><p>交出了一份“普涨”的成绩单。</p><p>但要看到的是,由于终端需求反映到代工订单的滞后性,代工厂在去年第三和第四季度已在承压前行。当这一份“寒意”传导至2023年之际,眼见冲击更甚,无论是代工降价、产能稼动率降低、资本支出削减等举措频出,为今年代工业走势蒙上了阴霾。</p><p>全年营收“普涨” 但季收已现跌势</p><p>久坐“铁王座”的台积电表现依旧抢眼。2022年营收创下751亿美元的纪录,同比增长42.6%。而利润增长逾70%,同样创历史新高。以第四季度来看,台积电营收约合1386.8亿元,毛利率超过此前预期,达到62.2%,营业利润率为52.0%,毛利率和营业利率双双创新高。</p><p>作为全球代工“榜眼”的三星,尽管受多重因素影响利润暴跌90%以上,但在代工方面,上季和2022年全年营收都创新高,其利润或超过约109.79亿人民币,这一数字反映了其先进制程产能的扩大。据透露,三星全年8nm以下营收占总营收的六成。</p><p>反观英特尔虽然2022年第四季度和全年营收大幅下挫,但代工业务增势明显。2022年其代工服务同比增长14%,第四季度营收为3.19亿美元,同比增长30%。</p><p>可以说,先进工艺三雄能够在下行周期逆势增长,一方面说明凭借多年的积淀,有着较强的抗周期和风险能力,另一方面消费市场疲软对成熟制程代工冲击较大,而对先进工艺影响甚微。</p><p>围绕着成熟制程的争夺,联电、格芯、中芯国际、华虹等代工厂商也冲出了下行“风暴”,交出了飘红的答卷。2022全年度联电营收折合人民币约622.41亿元,年增30.84%;格芯2022年营收同比增长23%,为81.08亿美元。</p><p>同为国内半导体代工双雄,中芯国际2022年全年营收突破72亿美元,同比增长34%,实现2021年、2022连续两年年增幅超过三成;而华虹得益于在成熟工艺上的深耕,以及汽车芯片、功率器件等需求的大幅增长,实现全年营收达24.75亿美元,逆势增长51.8%,创下历史新高。</p><p>但受行业下行周期所致,大多数代工厂商第四季度的产能利用率已开始下探,让行业切身感受到寒潮已至。如联电晶圆出货量比前年同期减少14.8%,整体产能利用率降至90%。</p><p>毛利润“分化” 产能利用率持续下探</p><p>如果说2022年全年营收还在基本水准之上,但从毛利率变化也可看出成熟工艺与先进工艺之前仍存“落差”。</p><p>台积电的毛利率依旧维持“高位”。2022年全年毛利率高达59.6%,比2021财年的51.6%涨了8个百分点,不得不说先进工艺居功至伟。据财报显示,其16nm占比13%,7nm占比27%,5nm占比26%,总计超66%。而且有,随着台积电在3nm工艺量产在加速推进,据预计3nm及升级版3nm制程的产品将贡献台积电2023年营收的4%至6%。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1615500030471.139195447789652.77463.jpg" alt="image" title="image"></p><p>同为成熟制程工艺擂台上的竞技者,联电表现相对出色,平均毛利率增至45.1%,比去年33.8%大增一成以上,而格芯、中芯国际和华虹的毛利率则集中于30%左右,完全竞争市场的激烈度可见一斑。</p><p>而且由于各家Fab厂工艺定位、产品结构、合作客户的不同,一位业内人士表示,下行周期对于经营有年,长期致力于平台建设、制造平台多元化的代工厂的影响相对较小。</p><p>如华虹营收保持长期成长,其有竞争力的特色工艺组合功不可没,且抓住了国内汽车电子和工业电子等高成长产业,进一步提升了营收质量。而格芯第一大收入来源智能设备业绩在第四季度大幅下滑至8.23亿美元,同比、环比下降幅度分别达7%和14%,但家庭与工业物联网、通信和数据中心业务则同比大增64%和27%,汽车业务也在强劲增长,因而对冲之下业绩依旧飘红。</p><p>但代工业看似已行至“龙卷风”中心,避无可避。集微咨询认为,从业绩表现来看,代工业整体处于向上发展态势,但毛利率均有所下降,且由于终端需求变化反馈到代工的时间差,去年第三季度和第四季度已释放出了危险信号,今年第一、二季度行情不太乐观,产能利用率下滑明显,代工厂需多管齐下开源节流。</p><p>有分析称第二梯队的晶圆代工厂,12英寸产能利用率在2023年第一季度平均落在70~80%,有部分到60%;而8英寸平均落在60~70%,也有部分落在50%左右,可谓是断崖式下跌。</p><p>不得不说,产能利用率的大幅下降对营收和毛利率的冲击也是“立竿见影”。台积电率先承认,受半导体产业持续调整库存及季节性淡季的双重影响,2023年第一季度营收为167~175亿美元,将同比下降12.2%~16.2%;毛利率也因产能利用率及3nm初期折旧提升,预计下降到53.5%~55.5%。格芯也预计第一季度营收将处于18.10亿至18.50亿美元之间,毛利率降至27.1%。格芯称,产能利用率的下降同步拉低了毛利率。</p><p>多方救火 2023年上半年准备过冬</p><p>产能还是产能,看来已成为代工业的新“魔咒”。而产业共识是代工产能利用率的回升将从第二季度开始,真正回到接近满载的产能利用率要到下半年甚至是年底。</p><p>上述人士也指出,从产品结构来看,消费类如手机、笔记本电脑等还处于库存消化阶段,加之终端需求的恢复和消费信心的提振还需要时间,反映到产能利用率的提升也就需要更长的周期。</p><p>为此集微咨询建议,代工厂一方面可减少人力成本,一些企业已祭出裁员的举措;另一方面则着力降低资本支出,包括设备支出、扩产调整等。此外,可为客户提供相应的优惠价格,以维持更多的订单量。</p><p>各大代工看似已在准备“过冬”,均在谨慎调整资本支出。</p><p>台积电2023年的资本支出为320亿-360亿美元,而最初估计为400亿美元。联电也称,应对需求低迷,联电已进行严格的成本管控措施,并尽可能推迟部分资本支出。而中芯国际因着力成熟产能扩产及新厂基建,2023年的资本开支将与2022年大致持平。</p><p>此外,最近传出的代工价格降价成为这一“艰难”时期的注解。</p><p>据报道,三星、力积电、格芯等传出直接降价消息;台积电、联电、世界先进等代工价并未变化,但私下与客户协调给予优惠,以维持ASP(平均销售价格)与毛利率。由 “供不应求”到纷纷降价,代工厂商的价格战已然打响。</p><p>值得一提的是,尽管产能利用率均在降低,但3nm等先进制程的进度仍在不断推进。有分析称,台积电4/5nm甚至3nm工艺的产品仍可维持产销平衡。</p><p>无论如何,2023年上半年对于代工业来说或许真的是“凛冬已至”。</p>
                                                    ]]></description>
            <pubDate>Thu, 16 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385139</guid>
            <link>https://aijishu.com/a/1060000000385139</link>
        </item>
    </channel>
</rss>

...

lib/v2/aijishu/index.js Outdated Show resolved Hide resolved
lib/v2/aijishu/index.js Outdated Show resolved Hide resolved
@github-actions
Copy link
Contributor

Successfully generated as following:

http://localhost:1200/aijishu/blog/armsoft - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[Arm服务器 - 极术社区]]></title>
        <link>https://aijishu.com/blog/armsoft</link>
        <atom:link href="http://localhost:1200/aijishu/blog/armsoft" rel="self" type="application/rss+xml" />
        <description><![CDATA[Arm服务器 - 极术社区 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 16:48:44 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[StratoVirt 的 vCPU 拓扑(SMP)]]></title>
            <description><![CDATA[<p>CPU 拓扑用来表示 CPU 在硬件层面的组合方式,本文主要讲解 CPU 拓扑中的 SMP(Symmetric Multi-Processor,对称多处理器系统)架构,CPU 拓扑还包括其他信息,比如:cache 等,这些部分会在后面进行补充。CPU 拓扑除了描述 CPU 的组成关系外,还为内核的调度器提供服务,从而提供更好的性能。在 StratoVirt 中,支持 CPU 拓扑为后续的 CPU 热插拔开发打下一个基础。</p><p>常见的 CPU SMP 结构是:</p><pre><code>Socket --&gt; die --&gt; cluster --&gt; core --&gt; thread
</code></pre><ul><li>socket:对应主板上的 CPU 插槽</li><li>die:处理器在生产过程中,从晶圆上切割下来的一个个小方块,Die 之间的组件是通过片内总线互联的。</li><li>cluster:簇,大核或者小核的一种组合</li><li>core:表示独立的物理 CPU</li><li>thread:逻辑 CPU,英特尔超线程技术引入的新概念</li></ul><h2>CPU 拓扑的获取原理</h2><p>因为 x86 和 ARM 的拓扑获取方式不同,下面将会分开进行介绍。</p><h3>x86</h3><p>在 x86 架构下面,操作系统会通过读取 CPUID 来获取 CPU 拓扑结构。在 x86 体系结构中,CPUID 指令(由 CPUID 操作码标识)是处理器补充指令(其名称源自 CPU 标识),允许软件发现处理器的细节。程序可以使用 CPUID 来确定处理器类型。</p><p>CPUID 隐式使用 EAX 寄存器来确定返回的信息的主要类别,这被称为 CPUID 叶。跟 CPU 拓扑相关的 CPUID 叶分别是:0BH 和 1FH。1FH 是 0BH 的扩展,可以用来表示更多的层级。Intel 建议先检查 1FH 是否存在,如果 1FH 存在会优先使用它。当 EAX 的值被初始化为 0BH 的时候,CPUID 会在 EAX,EBX,ECX 和 EDX 寄存器中返回 core/logical 处理器拓扑信息。这个函数(EAX=0BH)要求 ECX 同时被初始化为一个 index,这个 index 表示的是在 core 层级还是 logical processor 层级。OS 调用这个函数是按 ECX=0,1,2..n 这个顺序调用的。返回处理器拓扑级别的顺序是特定的,因为每个级别报告一些累积数据,因此一些信息依赖于从先前级别检索到的信息。在 0BH 下,ECX 可以表示的层级有:SMT 和 Core,在 1FH 下,可以表示的层级有:SMT,Core,Module,Tile 和 Die。</p><p>下表是一个更详细的一个解释:</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMdP" alt="image.png" title="image.png"></p><p>来源: Intel 64 and IA-32 Architectures Software Developer's Manual</p><h3>ARM</h3><p>在 ARM 架构下,如果操作系统是依靠 Device Tree 启动的,则会通过 Device Tree 去获取 CPU 拓扑。如果是以 ACPI 的方式启动的话,操作系统会通过解析 ACPI 的 PPTT 表去获取 CPU 拓扑结构。</p><h3>ACPI——PPTT</h3><p>ACPI 是 Advanced Configuration and Power Interface (高级配置和电源接口)的缩写,ACPI 是一种与体系结构无关的电源管理和配置框架。这个框架建立了一个硬件寄存器集合来定义电源状态。ACPI 是操作系统和固件之间的一个中间层,是他们两者之间的一个接口。ACPI 定义了两种数据结构:data tables 和 definition blocks。data tables 用于存储给设备驱动使用的 raw data。definition blocks 由一些字节码组成,这些码可以被解释器执行。</p><p>为了使硬件供应商在选择其实施时具有灵活性,ACPI 使用表格来描述系统信息、功能和控制这些功能的方法。这些表列出了系统主板上的设备或无法使用其他硬件标准检测或电源管理的设备,以及 ACPI 概念中所述的功能。它们还列出了系统功能,如支持的睡眠电源状态、系统中可用的电源平面和时钟源的说明、电池、系统指示灯等。这使 OSPM 能够控制系统设备,而不需要知道系统控制是如何实现的。</p><p>PPTT 表就是其中的一个表格,PPTT 表全称是 Processor Properties Topology Table,处理器属性拓扑表用于描述处理器的拓扑结构,该表还可以描述附加信息,例如处理器拓扑中的哪些节点构成物理包。</p><p>下表是 PPTT 表的结构,包含一个表头和主体,表头和其他的 ACPI 表差别不大。其中<code>Signature</code>用于表示这是 PPTT 表,<code>Length</code>是整张表的大小,其他的信息可以查看下面的这张表。表的主体是一系列处理器拓扑结构。<img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/01-pptt-header.bea002f9.png" alt="01-pptt-header" title="01-pptt-header">下面的表表示处理器层级节点结构,表示处理器结构的话<code>Type</code>要设置为 0,<code>Length</code>表示这个节点的字节数。<code>Flags</code>用来描述跟处理器相关的信息,详细的看后面关于<code>Flags</code>的详细信息。<code>Parent</code>用于指向这个节点的上一级节点,存放的是一个偏移量地址<img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/02-pptt-node-structure.88b66c70.png" alt="02-pptt-node-structure" title="02-pptt-node-structure">下表是<code>Flags</code>的结构,<code>Flags</code>占据 4 个字节的长度。<code>Physical package</code>:如果处理器拓扑的此节点表示物理封装的边界,则设置<code>Physical package</code>为 1。如果处理器拓扑的此实例不表示物理软件包的边界,则设置为 0。<code>Processor is a Thread</code>:对于叶条目:如果代表此处理器的处理元素与兄弟节点共享功能单元,则必须将其设置为 1。对于非叶条目:必须设置为 0。<code>Node is a Leaf</code>:如果节点是处理器层次结构中的叶,则必须设置为 1。否则必须设置为 0。<img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/03-pptt-flags.8ccf1dd9.png" alt="03-pptt-flags" title="03-pptt-flags">参考:<a href="https://aijishu.com/link?target=https%3A%2F%2Fuefi.org%2Fspecs%2FACPI%2F6.4%2F05_ACPI_Software_Programming_Model%2FACPI_Software_Programming_Model.html%23processor-properties-topology-table-pptt" target="blank">https://uefi.org/specs/ACPI/6.4/05_ACPI_Software_Programming_Model/ACPI_Software_Programming_Model.html#processor-properties-topology-table-pptt</a></p><h3>Device Tree</h3><p>Device Tree 是一种描述硬件的数据结构。内核的启动程序会将设备树加载入内存中,然后通过解析 Device Tree 来获取硬件细节。Device Tree 是树形结构,由一系列被命名的节点和属性组成,节点可以包含子节点,它们之间的关系构成一棵树。属性就是 name 和 value 的键值对。</p><p>一个典型的设备树如下图:<img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/04-device-tree.1348daa5.png" alt="04-device-tree" title="04-device-tree"></p><p>ARM 的 CPU 拓扑是定义在 cpu-map 节点内,cpu-map 是 cpu 节点的子节点。在 cpu-map 节点里可以包含三种子节点:cluster 节点,core 节点,thread 节点。整个 dts 的例子如下:</p><pre><code>cpus {
    #size-cells = &lt;0&gt;;
    #address-cells = &lt;2&gt;;
    cpu-map {
        cluster0 {
            cluster0 {
                core0 {
                    thread0 {
                        cpu = &lt;&amp;CPU0&gt;;
                    };
                    thread1 {
                        cpu = &lt;&amp;CPU1&gt;;
                    };
                };
                core1 {
                    thread0 {
                        cpu = &lt;&amp;CPU2&gt;;
                    };
                    thread1 {
                        cpu = &lt;&amp;CPU3&gt;;
                    };
                };
            };
            cluster1 {
                core0 {
                    thread0 {
                        cpu = &lt;&amp;CPU4&gt;;
                    };
                    thread1 {
                        cpu = &lt;&amp;CPU5&gt;;
                    };
                };
                core1 {
                    thread0 {
                        cpu = &lt;&amp;CPU6&gt;;
                    };
                    thread1 {
                        cpu = &lt;&amp;CPU7&gt;;
                    };
                };
            };
        };
    };
    //...
};
</code></pre><p>参考:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.kernel.org%2Fdoc%2FDocumentation%2Fdevicetree%2Fbindings%2Farm%2Ftopology.txt" target="blank">https://www.kernel.org/doc/Documentation/devicetree/bindings/arm/topology.txt</a></p><p>图来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.devicetree.org%2Fspecifications%2F" target="blank">https://www.devicetree.org/specifications/</a></p><h2>StratoVirt 具体实现</h2><h3>CPUID</h3><p>首先我们需要计算每个拓扑结构唯一的 topology ID,然后获取或者自己建立相对应的 CPUID entry,当 entry 的 function 的值等于 0xB 和 0X1F 的时候,我们需要根据 CPUID 的规范去设置相对应的 EAX, EBX, ECX 的值。EAX 设置为拓扑 ID,EBX 用来表示那个层级的有几个逻辑处理器,ECX 表示层级号。0xB 需要配置 index 等于 0,1 对应的值,0x1F 需要配置 index 等于 0,1,2 对应的值。下面是相对应的代码:</p><pre><code>// cpu/src/x86_64/mod.rs
const ECX_INVALID: u32 = 0u32 &lt;&lt; 8;
const ECX_THREAD: u32 = 1u32 &lt;&lt; 8;
const ECX_CORE: u32 = 2u32 &lt;&lt; 8;
const ECX_DIE: u32 = 5u32 &lt;&lt; 8;
impl X86CPUState {
    fn setup_cpuid(&amp;self, vcpu_fd: &amp;Arc&lt;VcpuFd&gt;) -&gt; Result&lt;()&gt; {
        // 计算 topology ID
        let core_offset = 32u32 - (self.nr_threads - 1).leading_zeros();
        let die_offset = (32u32 - (self.nr_cores - 1).leading_zeros()) + core_offset;
        let pkg_offset = (32u32 - (self.nr_dies - 1).leading_zeros()) + die_offset;
        // 获取 KVM 的 fd 和 获取它支持的 CPUID entries
        for entry in entries.iter_mut() {
            match entry.function {
                // ...
                0xb =&gt; {
                    // Extended Topology Enumeration Leaf
                    entry.edx = self.apic_id as u32;
                    entry.ecx = entry.index &amp; 0xff;
                    match entry.index {
                        0 =&gt; {
                            entry.eax = core_offset;
                            entry.ebx = self.nr_threads;
                            entry.ecx |= ECX_THREAD;
                        }
                        1 =&gt; {
                            entry.eax = pkg_offset;
                            entry.ebx = self.nr_threads * self.nr_cores;
                            entry.ecx |= ECX_CORE;
                        }
                        _ =&gt; {
                            entry.eax = 0;
                            entry.ebx = 0;
                            entry.ecx |= ECX_INVALID;
                        }
                    }
                }
                // 0x1f 扩展,支持 die 层级
                0x1f =&gt; {
                    if self.nr_dies &lt; 2 {
                        entry.eax = 0;
                        entry.ebx = 0;
                        entry.ecx = 0;
                        entry.edx = 0;
                        continue;
                    }
                    entry.edx = self.apic_id as u32;
                    entry.ecx = entry.index &amp; 0xff;
                    match entry.index {
                        0 =&gt; {
                            entry.eax = core_offset;
                            entry.ebx = self.nr_threads;
                            entry.ecx |= ECX_THREAD;
                        }
                        1 =&gt; {
                            entry.eax = die_offset;
                            entry.ebx = self.nr_cores * self.nr_threads;
                            entry.ecx |= ECX_CORE;
                        }
                        2 =&gt; {
                            entry.eax = pkg_offset;
                            entry.ebx = self.nr_dies * self.nr_cores * self.nr_threads;
                            entry.ecx |= ECX_DIE;
                        }
                        _ =&gt; {
                            entry.eax = 0;
                            entry.ebx = 0;
                            entry.ecx |= ECX_INVALID;
                        }
                    }
                }
                // ...
            }
        }
}
</code></pre><h3>PPTT</h3><p>根据 ACPI PPTT 表的标准来构建,我们需要计算每个节点的偏移值用于其子节点指向它。我们还需要计算每个节点的 uid,uid 初始化为 0,每增加一个节点 uid 的值加一。还需要根据 PPTT 表的标准计算 Flags 的值。最后需要计算整张表的大小然后修改原来的长度的值。</p><pre><code>// machine/src/standard_vm/aarch64/mod.rs
impl AcpiBuilder for StdMachine {
    fn build_pptt_table(
        &amp;self,
        acpi_data: &amp;Arc&lt;Mutex&lt;Vec&lt;u8&gt;&gt;&gt;,
        loader: &amp;mut TableLoader,
    ) -&gt; super::errors::Result&lt;u64&gt; {
        // ...
        // 配置 PPTT 表头
        // 添加 socket 节点
        for socket in 0..self.cpu_topo.sockets {
            // 计算到起始地址的偏移量
            let socket_offset = pptt.table_len() - pptt_start;
            let socket_hierarchy_node = ProcessorHierarchyNode::new(0, 0x2, 0, socket as u32);
            // ...
            for cluster in 0..self.cpu_topo.clusters {
                let cluster_offset = pptt.table_len() - pptt_start;
                let cluster_hierarchy_node =
                    ProcessorHierarchyNode::new(0, 0x0, socket_offset as u32, cluster as u32);
                // ...
                for core in 0..self.cpu_topo.cores {
                    let core_offset = pptt.table_len() - pptt_start;
                    // 判断是否需要添加 thread 节点
                    if self.cpu_topo.threads &gt; 1 {
                        let core_hierarchy_node =
                            ProcessorHierarchyNode::new(0, 0x0, cluster_offset as u32, core as u32);
                        // ...
                        for _thread in 0..self.cpu_topo.threads {
                            let thread_hierarchy_node =
                                ProcessorHierarchyNode::new(0, 0xE, core_offset as u32, uid as u32);
                            // ...
                            uid += 1;
                        }
                    } else {
                        let thread_hierarchy_node =
                            ProcessorHierarchyNode::new(0, 0xA, cluster_offset as u32, uid as u32);
                        // ...
                        uid += 1;
                    }
                }
            }
        }
        // 将 PPTT 表添加到 loader 中
    }
}
</code></pre><h3>Device Tree</h3><p>StratoVirt 的 microvm 使用 device tree 启动,所以我们需要配置 device tree 中的 cpus 节点下的 cpu-map 来使 microvm 支持解析 CPU 拓扑。在 StratoVirt 中,我们支持两层 cluster。我们使用了多层循环来创建这个 tree,第一层是创建第一层 cluster,第二层对应创建第二层的 cluster,第三层创建 core,第四层创建 thread。</p><pre><code>impl CompileFDTHelper for LightMachine {
    fn generate_cpu_nodes(&amp;self, fdt: &amp;mut FdtBuilder) -&gt; util::errors::Result&lt;()&gt; {
        // 创建 cpus 节点
        // ...
        // Generate CPU topology
        // 创建 cpu-map 节点
        let cpu_map_node_dep = fdt.begin_node("cpu-map")?;
        // 创建第一层 cluster 节点
        for socket in 0..self.cpu_topo.sockets {
            let sock_name = format!("cluster{}", socket);
            let sock_node_dep = fdt.begin_node(&amp;sock_name)?;
            // 创建第二层 cluster 节点
            for cluster in 0..self.cpu_topo.clusters {
                let clster = format!("cluster{}", cluster);
                let cluster_node_dep = fdt.begin_node(&amp;clster)?;
                // 创建 core 节点
                for core in 0..self.cpu_topo.cores {
                    let core_name = format!("core{}", core);
                    let core_node_dep = fdt.begin_node(&amp;core_name)?;
                    // 创建 thread 节点
                    for thread in 0..self.cpu_topo.threads {
                        let thread_name = format!("thread{}", thread);
                        let thread_node_dep = fdt.begin_node(&amp;thread_name)?;
                        // 计算 cpu 的 id
                        // let vcpuid = ...
                        // 然后添加到节点中
                    }
                    fdt.end_node(core_node_dep)?;
                }
                fdt.end_node(cluster_node_dep)?;
            }
            fdt.end_node(sock_node_dep)?;
        }
        fdt.end_node(cpu_map_node_dep)?;
        Ok(())
    }
}
</code></pre><p>这个代码构建出来设备树的结构和前面原理中展示的结构基本一致</p><h2>验证方法</h2><p>我们可以通过下面的命令启动一个虚拟机,<code>smp</code>参数用来配置 vCPU 拓扑</p><pre><code>sudo ./target/release/stratovirt \
    -machine virt \
    -kernel /home/hwy/std-vmlinux.bin.1 \
    -append console=ttyAMA0 root=/dev/vda rw reboot=k panic=1 \
    -drive file=/usr/share/edk2/aarch64/QEMU_EFI-pflash.raw,if=pflash,unit=0,readonly=true \
    -drive file=/home/hwy/openEuler-22.03-LTS-stratovirt-aarch64.img,id=rootfs,readonly=false \
    -device virtio-blk-pci,drive=rootfs,bus=pcie.0,addr=0x1c.0x0,id=rootfs \
    -qmp unix:/var/tmp/hwy.socket,server,nowait \
    -serial stdio \
    -m 2048 \
    -smp 4,sockets=2,clusters=1,cores=2,threads=1
</code></pre><p>接着,我们可以通过观察<code>/sys/devices/system/cpu/cpu0/topology</code>下面的文件来查看配置的 topology。</p><pre><code>[root@StratoVirt topology] ll
total 0
-r--r--r-- 1 root root 64K Jul 18 09:04 cluster_cpus
-r--r--r-- 1 root root 64K Jul 18 09:04 cluster_cpus_list
-r--r--r-- 1 root root 64K Jul 18 09:04 cluster_id
-r--r--r-- 1 root root 64K Jul 18 09:04 core_cpus
-r--r--r-- 1 root root 64K Jul 18 09:04 core_cpus_list
-r--r--r-- 1 root root 64K Jul 18 09:01 core_id
-r--r--r-- 1 root root 64K Jul 18 09:01 core_siblings
-r--r--r-- 1 root root 64K Jul 18 09:04 core_siblings_list
-r--r--r-- 1 root root 64K Jul 18 09:04 die_cpus
-r--r--r-- 1 root root 64K Jul 18 09:04 die_cpus_list
-r--r--r-- 1 root root 64K Jul 18 09:04 die_id
-r--r--r-- 1 root root 64K Jul 18 09:04 package_cpus
-r--r--r-- 1 root root 64K Jul 18 09:04 package_cpus_list
-r--r--r-- 1 root root 64K Jul 18 09:01 physical_package_id
-r--r--r-- 1 root root 64K Jul 18 09:01 thread_siblings
-r--r--r-- 1 root root 64K Jul 18 09:04 thread_siblings_list
</code></pre><p>比如:</p><pre><code>cat core_cpus_list
</code></pre><p>结果是</p><pre><code>0
</code></pre><p>表示和 cpu0 同一个 core 的 cpu 只有 cpu0。</p><pre><code>cat package_cpus_list
</code></pre><p>会显示</p><pre><code>0-1
</code></pre><p>表示和 cpu0 同一个 socket 的 cpu 有从 cpu0 到 cpu1。</p><p>下面这些工具也可以辅助进行验证。</p><p>比如:lscpu</p><pre><code>lscpu
</code></pre><p>通过执行<code>lscpu</code>命令会出现下面结果</p><pre><code>Architecture:            aarch64
  CPU op-mode(s):        32-bit, 64-bit
  Byte Order:            Little Endian
CPU(s):                  64
  On-line CPU(s) list:   0-63
Vendor ID:               ARM
  Model name:            Cortex-A72
    Model:               2
    Thread(s) per core:  1
    Core(s) per cluster: 16
    Socket(s):           -
    Cluster(s):          4
    Stepping:            r0p2
    BogoMIPS:            100.00
    Flags:               fp asimd evtstrm aes pmull sha1 sha2 crc32 cpuid
NUMA:
  NUMA node(s):          4
  NUMA node0 CPU(s):     0-15
  NUMA node1 CPU(s):     16-31
  NUMA node2 CPU(s):     32-47
  NUMA node3 CPU(s):     48-63
Vulnerabilities:
  Itlb multihit:         Not affected
  L1tf:                  Not affected
  Mds:                   Not affected
  Meltdown:              Not affected
  Spec store bypass:     Vulnerable
  Spectre v1:            Mitigation; __user pointer sanitization
  Spectre v2:            Vulnerable
  Srbds:                 Not affected
  Tsx async abort:       Not affected
</code></pre><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2F2022-08-27%2FStratoVirt-vCPU.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000384438">Virtio-Net 技术分析</a></li><li><a href="https://aijishu.com/a/1060000000380775">VFIO设备直通原理(二)</a></li><li><a href="https://aijishu.com/a/1060000000380640">VFIO设备直通原理(一)</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000380076">DAOS ARM64调测之旅</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Tue, 14 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000384628</guid>
            <link>https://aijishu.com/a/1060000000384628</link>
        </item>
        <item>
            <title><![CDATA[Virtio-Net 技术分析]]></title>
            <description><![CDATA[<p>简介</p><p>传统的设备模拟中,虚拟机内部设备驱动完全不知道自己处于虚拟化环境中。对于网络,存储,IO 等操作完全由虚拟机内核到 qemu,最后到宿主机内核处理,这样会产生很多的 VM exit 和 VM entry,因此性能很差。virtio 技术提高了虚拟机的性能,在该方案中,虚拟机能够感知到子集处于虚拟机环境中,并且会加载 virtio 总线驱动和 virtio 设备驱动。</p><p>virtio-net 方案,包括前端驱动和后端设备,以及自身定义的 virtio 传输协议。虚拟机作为前端驱动,安装了 virtio-net 的driver,在 qemu 中加载 virtio-net 后端设备,用来接收前端发送的 I/O 请求,然后从接收的数据中按照传输协议进行解析。最后 qemu 通过操作虚拟tap设备,对物理设备进行操作,从而完成请求,并且会通过中断机制通知前端驱动。</p><p>virtio-net网络包的发送过程:</p><p><img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/2020-11-23-virtionet.4b41c976.png" alt="2020-11-23-virtionet" title="2020-11-23-virtionet"></p><h2>Virtio-Net 后端</h2><h3>收包流程</h3><p>当网卡有数据包时,tap 设备首先会收到报文,对应 virtio-net 的 tap 设备 fd 变为可读。qemu 通过 epoll 方式监测到有网络数据包,调用回调函数发起收报流程。virtio_net_receive 函数把数据拷贝到虚拟机的 virtio 网卡接收队列。然后向虚拟机注入一个中断,虚拟机便感知到有网络数据报文。</p><pre><code>qemu/hw/net/virtio-net.c
virtio_net_receive
    virtio_net_do_receive
        virtio_net_receive_rcu
</code></pre><p>上述是 virtio-net 的函数调用关系,virtio-net 最终调用 virtio_net_receive_rcu 函数,对网络数据包添加到 virtio queue。</p><pre><code>virtio_net_receive_rcu {
    virtio_net_can_receive     // 根据vm running状态,queue和设备状态判断virtio-net是否可以收包
    virtio_net_has_buffers     // 检查缓冲区,避免出现竞争状况
    receive_filter             // 对网络包进行过滤
    while (offset &lt; size) {
        elem = virtqueue_pop     // 从vring中取出一个请求,将信息传递给elem域中
        len = iov_from_buf         // 负责将报文拷贝到buffer中,实现向guest物理地址写入数据
        virtqueue_fill             // 当数据写完后,撤销映射,更新VRingAvail.ring[]的相关字段
    }
    virtqueue_flush         // 更新VRingUsed.ring的idx,表明可以回收
    virtio_notify             // 负责注入中断,通知前端虚拟机
}
</code></pre><h3>发包流程</h3><p>虚拟机的 virtio 网卡驱动向网卡缓冲区填好报文,然后写 queue notify 寄存器。这样,触发 VM exit ,虚拟机就会退出到root 模式,在 qemu 的 vcpu 线程 virtio_mmio_write 对其处理。</p><pre><code>qemu/hw/net/virtio-net.c
virtio_net_add_queue
    virtio_net_handle_tx_bh
        qemu_bh_schedule
            virtio_net_tx_bh
                virtio_net_flush_tx
            virtio_queue_set_notification
</code></pre><p>这里将 virtio_net_handle_tx_bh 函数绑定到 tx_vq。内部调用 qemu_bh_schedule 运行指定的函数,这里绑定的是virtio_net_tx_bh。最终调用 virtio_net_flush_tx 函数发送报文。</p><pre><code>virtio_net_flush_tx
    for (;;) {
        elem = virtqueue_pop     // 从vring中取出一个请求
        qemu_sendv_packet_async // qemu发包函数
    }
</code></pre><p>在 virtio_net_flush_tx 函数中,获取报文 elem,写 tap 设备的 fd,最终发给 tap 设备,投递出去。qemu_sendv_packet_async 发送网络包的调用链为: qemu_sendv_packet_async-&gt;qemu_net_queue_send_iov-&gt;qemu_net_queue_flush- &gt;qemu_net_queue_deliver。qemu 后端最终调用 tap_write_packet- &gt;writev 写入 tap 字符设备。</p><p>接着在内核的字符设备驱动中,tun_chr_write_iter 会被调用,在 TCP/IP 协议栈进一步处理网络包。</p><h3>创建设备</h3><pre><code>virtio_net_class_init
    virtio_net_device_realize
    virtio_net_get_config
    virtio_net_get_features
    ...
</code></pre><p>virtio_net_device_realize 完成对 virtio-net 设备的初始化过程。</p><pre><code>virtio_net_device_realize
    virtio_net_set_config_size
    virtio_init
    virtio_net_set_default_queue_size
    virtio_net_add_queue
    n-&gt;ctrl_vq = virtio_add_queue(virtio_net_handle_ctrl)
    qemu_new_nic
</code></pre><p>这个函数创建了一个 VirtIODevice,virtio_init 用来初始化这个设备。接着调用 virtio_net_add_queue 初始化队列。当设置多队列特性,还要额外增加一个 ctrl_vq 队列,用作控制队列。最后,qemu_new_nic 会创建一个虚拟机里面的网卡。这里的网卡对应的是后端 tap 设备。</p><h3>模拟网卡</h3><p>tap 设备的使用:qemu 使用 tap 作为网络后端。首先需要在宿主机上创建 tap 设备,并添加到网桥 br0 上。</p><pre><code># brctl addbr br0
# ip tuntap add dev tap0 mode tap
# brctl addif br0 tap0
# ip link set dev tap0 up
</code></pre><p>在使用 qemu 命令启动虚拟机的过程中,传递参数:net,nic,model,netdev,ifname...</p><p>其中 nic 表示前端虚拟机网卡,model 表示创建网卡类型,netdev 定义后端 tap 设备,ifname 表示 tap 设备的名字。</p><p>qemu 的 main 函数会调用 net\_init\_clients 进行网络设备的初始化 ,在该函数内对 netdev 参数进行解析。</p><pre><code>net_init_clients
    qemu_opts_foreach(qemu_find_opts("netdev"),net_init_netdev, NULL, errp))
        net_init_netdev
            net_client_init-&gt;net_client_init1 // 根据不同的driver类型,调用不同的初始化函数
                net_init_tap
                    net_tap_init
                        tap_open
</code></pre><p>tap_open 函数打开一个文件 "/dev/net/tun" ,然后通过 ioctl 操作这个文件。</p><pre><code>tap_open{
    fd = open(PATH_NET_TUN, O_RDWR)
    ioctl(fd, TUNGETFEATURES, &amp;features)
    ioctl(fd, TUNSETVNETHDRSZ, &amp;len)
    ioctl(fd, TUNSETIFF, (void *) &amp;ifr)
}
</code></pre><p>最终,通过宿主机内核复杂的网络协议栈,形成一个网络包,发送到外部网络中。这样做的原因是:虚拟机将网络包发送给 qemu,qemu 没有自己的网络协议栈,因此,qemu 将网络包转换成文件流,写入 "/dev/net/tun" 字符设备。内核TUN/TAP 字符设备驱动收到这个写入的文件流,然后交给 TUN/TAP 虚拟网卡驱动。驱动将文件流再次转成网络包,交给TCP/IP 协议栈,从 tap 设备发出标准的网络包。</p><h2>Virtio-Net 前端</h2><p>虚拟机里面的进程发送一个网络包,通过文件系统和 Socket 调用网络协议栈,到达网络设备层。 这里将调用 virtio-net 驱动做进一步处理。</p><p>前端 driver 将报文发送出去,注册的 ops 函数定义如下,其中指定的发送函数为 start_xmit。</p><pre><code>kernel/drivers/net/virtio_net.c
static const struct net_device_ops virtnet_netdev = {
    .ndo_open            = virtnet_open,
    .ndo_stop            = virtnet_close,
    .ndo_start_xmit      = start_xmit,
    ...
};
</code></pre><p>调用 start\_xmit 函数,将 skb 发送到 virtqueue 中, 然后调用 virtqueue\_kick 通知 qemu 后端将数据包发送出去。</p><pre><code>start_xmit{
    free_old_xmit_skbs // 释放backend处理过的desc
    xmit_skb           // 发包
        sg_init_table
        sg_set_buf(sq-&gt;sg, hdr, hdr_len);                      // 数据包头部填入scatterlist
        num_sg = skb_to_sgvec(skb, sq-&gt;sg + 1, 0, skb-&gt;len);  // 数据包填入scatterlist
        virtqueue_add_outbuf // sg table 写入desc描述符表,head desc信息写vring.avail
    virtqueue_kick_prepare(sq-&gt;vq) &amp;&amp; virtqueue_notify(sq-&gt;vq) // kick通知qemu后端
}
</code></pre><p>当虚拟机写入一个 I/O 会使得 qemu 触发 VM exit 。接下来进入 qemu 做 virtio-net 相关处理。</p><h2>流程总结</h2><ol><li>在虚拟机里面的用户态,应用程序通过 write 系统调用写入 socket。</li><li>写入的内容经过 VFS 层,内核协议栈,到达虚拟机里面的内核的网络设备驱动,即 virtio_net。</li><li>virtio_net 网络设备有一个操作结构 struct net_device_ops,里面定义了发送一个网络包调用的函数为 start_xmit。</li><li>在 virtio_net 的前端驱动和 qemu 中的后端驱动之间,有两个队列 virtqueue,一个用于发送,一个用于接收。然后,我们需要在 start_xmit 中调用 virtqueue_add,将网络包放入发送队列,然后调用 virtqueue_notify 通知 qemu。</li><li>qemu 本来处于 KVM_RUN 的状态,收到通知后,通过 VM exit 指令退出客户机模式,进入宿主机模式。发送网络包的时候,virtio_net_handle_tx_bh 函数会被调用。</li><li>接下来是一个 for 循环,我们需要在循环中调用 virtqueue_pop,从传输队列中获取要发送的数据,然后调用 qemu_sendv_packet_async 进行发送。</li><li>qemu 会调用 writev 向字符设备文件写入,进入宿主机的内核。</li><li>在宿主机内核中字符设备文件的 file_operations 里面的 write_iter 会被调用,也即会调用 tun_chr_write_iter。</li><li>在 tun_chr_write_iter 函数中,tun_get_user 将要发送的网络包从 qemu 拷贝到宿主机内核里面来,然后调用 netif_rx_ni 开始调用宿主机内核协议栈进行处理。</li><li>宿主机内核协议栈处理完毕之后,会发送给 tap 虚拟网卡,完成从虚拟机里面到宿主机的整个发送过程。</li></ol><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2Fxinleguo%2F2020-11-23-Virtio_Net_Technology.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000380775">VFIO设备直通原理(二)</a></li><li><a href="https://aijishu.com/a/1060000000380640">VFIO设备直通原理(一)</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000380076">DAOS ARM64调测之旅</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000376121">回顾2022年计算机视觉领域最激动人心的进展</a></li><li><a href="https://aijishu.com/a/1060000000375922">量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 13 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000384438</guid>
            <link>https://aijishu.com/a/1060000000384438</link>
        </item>
        <item>
            <title><![CDATA[VFIO设备直通原理(二)]]></title>
            <description><![CDATA[<p>设备直通给虚拟机能够极大提升虚拟机对物理设备访问的性能,本文通过vfio内核模块和qemu用户态实现介绍vfio设备直通时的关键部分,包括:用户态访问设备IO地址空间,DMA重映射,中断重映射等.</p><h2>VFIO访问直通设备IO地址空间</h2><p>1.PIO和MMIO</p><p>设备的IO地址空间的访问有PIO和MMIO两种方式,前者通过独立的IO端口访问设备,而MMIO是在物理内存中映射一段区间,直接访问该内存就可以访问设备的配置空间.在虚拟化的场景下,虚拟机通过PIO访问直通设备时,首先会VM-exit到qemu,由qemu通过转换表完成对该PIO操作的转发.对于PCI设备而言,其bar空间地址是通过PIO的方式设置的,如果将设备的PIO访问完全暴露给虚拟机,虚拟机修改了真实的物理设备的PCI Bar空间基地址配置,与host上不一致,可能会出现严重的问题,所以对于设备的PIO访问需要建立转换表,在VM-exit之后由qemu来完成设置的转发.</p><p>对于设备的MMIO空间访问,则可以通过建立EPT页表将设备的MMIO物理内存映射到虚拟的MMIO地址空间,让虚拟机能够直接通过MMIO访问PCI设备的bar空间,提高IO性能.</p><p>2.获取直通设备信息</p><p>通过VFIO提供的接口可以获取到设备的基本信息,包括设备的描述符、region的数量等。</p><pre><code>vfio_get_device:
    fd = ioctl(group-&gt;fd, VFIO_GROUP_GET_DEVICE_FD, name);
    ret = ioctl(fd, VFIO_DEVICE_GET_INFO, &amp;dev_info);
    vbasedev-&gt;fd = fd;
    vbasedev-&gt;group = group;
    QLIST_INSERT_HEAD(&amp;group-&gt;device_list, vbasedev, next);
    vbasedev-&gt;num_irqs = dev_info.num_irqs;
    vbasedev-&gt;num_regions = dev_info.num_regions;
    vbasedev-&gt;flags = dev_info.flags;
</code></pre><p>2.直通设备PCI配置空间模拟</p><p>Qemu为每个PCI直通设备都建立一个虚拟数据结构 VFIOPCIDevice,保存物理PCI设备的相关信息,由vfio\_get\_device来获取,保存到vbasedev中。</p><pre><code>typedef struct VFIOPCIDevice {
    PCIDevice pdev;
    VFIODevice vbasedev;
</code></pre><p>VFIO设备作为qemu的设备模型的一部分,qemu对直通设备的模拟初始化入口在 vfio\_realize,通过vfio\_get_device获取到直通设备的基本信息之后,会调用pread设备的fd获取到设备的配置空间信息的一份拷贝,qemu会写入一些自定义的config配置。</p><pre><code>vfio_realize:
    /* Get a copy of config space */
    ret = pread(vdev-&gt;vbasedev.fd, vdev-&gt;pdev.config,
                MIN(pci_config_size(&amp;vdev-&gt;pdev), vdev-&gt;config_size),
                vdev-&gt;config_offset);
    if (ret &lt; (int)MIN(pci_config_size(&amp;vdev-&gt;pdev), vdev-&gt;config_size)) {
        ret = ret &lt; 0 ? -errno : -EFAULT;
        error_setg_errno(errp, -ret, "failed to read device config space");
        goto error;
    }
    /* vfio emulates a lot for us, but some bits need extra love */
    vdev-&gt;emulated_config_bits = g_malloc0(vdev-&gt;config_size);
    /* QEMU can choose to expose the ROM or not */
    memset(vdev-&gt;emulated_config_bits + PCI_ROM_ADDRESS, 0xff, 4);
    /* QEMU can change multi-function devices to single function, or reverse */
    vdev-&gt;emulated_config_bits[PCI_HEADER_TYPE] =
                                              PCI_HEADER_TYPE_MULTI_FUNCTION;
    /* Restore or clear multifunction, this is always controlled by QEMU */
    if (vdev-&gt;pdev.cap_present &amp; QEMU_PCI_CAP_MULTIFUNCTION) {
        vdev-&gt;pdev.config[PCI_HEADER_TYPE] |= PCI_HEADER_TYPE_MULTI_FUNCTION;
    } else {
        vdev-&gt;pdev.config[PCI_HEADER_TYPE] &amp;= ~PCI_HEADER_TYPE_MULTI_FUNCTION;
    }
    /*
     * Clear host resource mapping info.  If we choose not to register a
     * BAR, such as might be the case with the option ROM, we can get
     * confusing, unwritable, residual addresses from the host here.
     */
    memset(&amp;vdev-&gt;pdev.config[PCI_BASE_ADDRESS_0], 0, 24);
    memset(&amp;vdev-&gt;pdev.config[PCI_ROM_ADDRESS], 0, 4);
</code></pre><p>3.直通设备MMIO映射</p><p>直通PCI设备的MMIO内存主要是指其Bar空间,qemu使用vfio\_populate\_device函数调用VFIO接口获取到PCI设备的Bar空间信息,然后通过vfio\_region\_setup获取到对应region的信息,并将qemu内存虚拟化的MemoryRegion设置为IO类型的region。重要的是,qemu会为该IO类型的MemoryRegion设置ops为vfio\_region\_ops,这样后续对于该块内存的读写会经过qemu VFIO模块注册的接口来进行。</p><pre><code>vfio_populate_device:
    for (i = VFIO_PCI_BAR0_REGION_INDEX; i &lt; VFIO_PCI_ROM_REGION_INDEX; i++) {
        char *name = g_strdup_printf("%s BAR %d", vbasedev-&gt;name, i);
        ret = vfio_region_setup(OBJECT(vdev), vbasedev, &amp;vdev-&gt;bars[i].region, i, name);
            -&gt; vfio_get_region_info
            -&gt; memory_region_init_io(region-&gt;mem, obj, &amp;vfio_region_ops,
                              region, name, region-&gt;size);
        QLIST_INIT(&amp;vdev-&gt;bars[i].quirks);
    }
    ret = vfio_get_region_info(vbasedev, VFIO_PCI_CONFIG_REGION_INDEX, &amp;reg_info);
            -&gt;    ioctl(vbasedev-&gt;fd, VFIO_DEVICE_GET_REGION_INFO, *info))
    ret = ioctl(vdev-&gt;vbasedev.fd, VFIO_DEVICE_GET_IRQ_INFO, &amp;irq_info);
</code></pre><p>到这里已经获取到了PCI设备的MMIO内存信息,但是还没有真正的将物理内存中的Bar空间映射到qemu,这一动作在vfio\_bars\_setup中完成,vfio\_region\_mmap会对region中每个需要map的内存地址完成映射,然后将映射的物理内存通过qemu注册到虚拟机作为一段虚拟机的物理地址空间。</p><pre><code>vfio_bars_setup:
    for (i = 0; i &lt; PCI_ROM_SLOT; i++)
        vfio_bar_setup(vdev, i);
            vfio_region_mmap(&amp;bar-&gt;region)
                    for (i = 0; i &lt; region-&gt;nr_mmaps; i++) {
                    region-&gt;mmaps[i].mmap = mmap(NULL, region-&gt;mmaps[i].size, prot,
                                                MAP_SHARED, region-&gt;vbasedev-&gt;fd,
                                                region-&gt;fd_offset +
                                                region-&gt;mmaps[i].offset);
                    memory_region_init_ram_device_ptr
                    memory_region_add_subregion
            pci_register_bar(&amp;vdev-&gt;pdev, nr, type, bar-&gt;region.mem);
</code></pre><p>这里的映射mmap接口对应的是VFIO设备在内核中注册的vfio\_pci\_mmap 函数,在内核中,该函数会为vma注册一个mmap的ops,对应着注册了一个缺页处理函数,当用户态程序访问该段虚拟内存缺页时,调用注册的缺页处理函数,完成虚拟地址到实际物理地址的映射。</p><pre><code>vfio_pci_mmap:
    vma-&gt;vm_flags |= VM_IO | VM_PFNMAP | VM_DONTEXPAND | VM_DONTDUMP;
    vma-&gt;vm_ops = &amp;vfio_pci_mmap_ops;
        -&gt; .fault = vfio_pci_mmap_fault,
                -&gt; if (remap_pfn_range(vma, vma-&gt;vm_start, vma-&gt;vm_pgoff,
                    vma-&gt;vm_end - vma-&gt;vm_start, vma-&gt;vm_page_prot))
</code></pre><p>简单来说,对于MMIO内存的的映射,主要是将物理内存中的MMIO空间映射到了qemu的虚拟地址空间,然后再由qemu将该段内存注册进虚拟机作为虚拟机的一段物理内存,在这个过程中会建立从gpa到hpa的EPT页表映射,提升MMIO的性能。</p><h2>DMA重映射</h2><p>首先关于DMA,设备通过DMA可以直接使用iova地址访问物理内存,从iova到实际物理地址的映射是在IOMMU中完成的,一般在dma_allooc分配设备能够访问的内存的时候,会分配iova地址和实际的物理地址空间,并在iommu中建立映射关系。 所以说要让设备进行DMA最关键的几个部分:</p><ul><li>设备能够识别的地址:IOVA</li><li>一段物理内存</li><li>IOVA到物理内存在IOMMU中的映射关系</li></ul><p>基于这几点来看VFIO的DMA重映射就比较清晰,首先从VFIO设备的初始化开始,在获取设备信息之前会先获取到设备所属的group和Container,并调用VFIO\_SET\_IOMMU完成container和IOMMU的绑定,并attach由VFIO管理的所有设备。此外注意到这里的 pci\_device\_iommu\_address\_space 函数,意思是qemu为设备dma注册了一段专门的地址空间,这段内存作为虚拟机的一段物理内存存在,在VFIO\_SET\_IOMMU之后,注册该地址空间,其region\_add函数为 vfio\_listener\_region\_add,意思是当内存空间布局发生变化这里是增加内存的时候都会调用该接口。</p><pre><code>vfio_realize:
    group = vfio_get_group(groupid, pci_device_iommu_address_space(pdev), errp);
        vfio_connect_container(group, as, errp)
            ret = ioctl(fd, VFIO_SET_IOMMU, container-&gt;iommu_type);
            container-&gt;listener = vfio_memory_listener;
            memory_listener_register(&amp;container-&gt;listener, container-&gt;space-&gt;as);
                    -&gt; .region_add = vfio_listener_region_add,
</code></pre><p>那么跟DMA有什么关系呢,当为设备进行DMA分配一块内存时,实际是以MemoryRegion的形式存在的,也就是说虚拟机进行dma alloc 会调用region\_add函数,进而调用注册的memory\_listener\_region\_add函数,MemoryRegion有了意味着分配了一块物理内存,还需要IOVA和映射关系才行。这里,IOVA地址使用的是section-&gt;offset\_within\_address_space,为什么可以这样,因为IOVA地址只是作为设备识别的地址,只要建立了映射关系就有意义。</p><pre><code>vfio_listener_region_add:
    iova = TARGET_PAGE_ALIGN(section-&gt;offset_within_address_space);
    /* Here we assume that memory_region_is_ram(section-&gt;mr)==true */
    vaddr = memory_region_get_ram_ptr(section-&gt;mr) +
            section-&gt;offset_within_region +
            (iova - section-&gt;offset_within_address_space);
    ret = vfio_dma_map(container, iova, int128_get64(llsize),
                       vaddr, section-&gt;readonly);
vfio_dma_map:
    struct vfio_iommu_type1_dma_map map = {
        .argsz = sizeof(map),
        .flags = VFIO_DMA_MAP_FLAG_READ,
        .vaddr = (__u64)(uintptr_t)vaddr,
        .iova = iova,
        .size = size,
    };
    ioctl(container-&gt;fd, VFIO_IOMMU_MAP_DMA, &amp;map)
</code></pre><p>建立映射的关键在于vfio\_dma\_map,通过ioctl调用container-&gt;fd接口VFIO\_IOMMU\_MAP_DMA完成DMA重映射。为什么是container-&gt;fd,因为VFIO Container管理内存资源,与IOMMU直接绑定,而IOMMU是完成IOVA到实际物理内存映射的关键。值得注意的是qemu只知道这一段内存的虚拟地址vaddr,所以将vaddr,iova和size传给内核,由内核获取物理内存信息完成映射。</p><pre><code>vfio_dma_do_map:
    vfio_pin_map_dma
        while (size) {
            /* Pin a contiguous chunk of memory */
            npage = vfio_pin_pages_remote(dma, vaddr + dma-&gt;size,
                                size &gt;&gt; PAGE_SHIFT, &amp;pfn, limit);
            /* Map it! */
            vfio_iommu_map(iommu, iova + dma-&gt;size, pfn, npage,
                            dma-&gt;prot);
                list_for_each_entry(d, &amp;iommu-&gt;domain_list, next)
                    iommu_map(d-&gt;domain, iova, (phys_addr_t)pfn &lt;&lt; PAGE_SHIFT,
                            npage &lt;&lt; PAGE_SHIFT, prot | d-&gt;prot);
                        arm_smmu_map
                            __arm_lpae_map
            size -= npage &lt;&lt; PAGE_SHIFT;
            dma-&gt;size += npage &lt;&lt; PAGE_SHIFT;
        }
</code></pre><p>内核完成建立iova到物理内存的映射之前会将分配的DMA内存给pin住,使用vfio\_pin\_pages\_remote接口可以获取到虚拟地址对应的物理地址和pin住的页数量,然后vfio\_iommu_map进而调用iommu以及smmu的map函数,最终用iova,物理地址信息pfn以及要映射的页数量在设备IO页表中建立映射关系。</p><pre><code>+--------+  iova  +--------+  gpa  +----+
| device |   -&gt;   | memory |   &lt;-  | vm |
+--------+        +--------+       +----+
</code></pre><p>最终完成了DMA重映射,设备使用qemu分配的iova地址通过IOMMU映射访问内存,虚拟机使用gpa通过Stage 2页表映射访问内存</p><h2>中断重映射</h2><p>对于PCI直通设备中断的虚拟化,主要包括三种类型INTx,Msi和Msi-X。</p><p>1.INTx中断初始化及enable</p><p>对于INTx类型的中断,在初始化的时候就进行使能了,qemu通过VFIO device的接口将中断irq set设置到内核中,并且会注册一个eventfd,设置了eventfd的handler,当发生intx类型的中断时,内核会通过eventfd通知qemu进行处理,qemu会通知虚拟机进行处理。</p><pre><code>vfio_realize:
    if (vfio_pci_read_config(&amp;vdev-&gt;pdev, PCI_INTERRUPT_PIN, 1)) {
        pci_device_set_intx_routing_notifier(&amp;vdev-&gt;pdev, vfio_intx_update);
        ret = vfio_intx_enable(vdev, errp);
            *pfd = event_notifier_get_fd(&amp;vdev-&gt;intx.interrupt);
            qemu_set_fd_handler(*pfd, vfio_intx_interrupt, NULL, vdev);
            ret = ioctl(vdev-&gt;vbasedev.fd, VFIO_DEVICE_SET_IRQS, irq_set);
</code></pre><p>2.MSI-X初始化</p><p>MSIX在vfio_realzie初始化时,首先获取到物理设备的中断相关的配置信息,将其设置到注册给对应的MMIO内存中</p><pre><code>vfio_msix_early_setup:
    pos = pci_find_capability(&amp;vdev-&gt;pdev, PCI_CAP_ID_MSIX);
    if (pread(fd, &amp;ctrl, sizeof(ctrl),
            vdev-&gt;config_offset + pos + PCI_MSIX_FLAGS) != sizeof(ctrl)) {
    if (pread(fd, &amp;table, sizeof(table),
            vdev-&gt;config_offset + pos + PCI_MSIX_TABLE) != sizeof(table)) {
    if (pread(fd, &amp;pba, sizeof(pba),
            vdev-&gt;config_offset + pos + PCI_MSIX_PBA) != sizeof(pba)) {
    ctrl = le16_to_cpu(ctrl);
    table = le32_to_cpu(table);
    pba = le32_to_cpu(pba);
    msix = g_malloc0(sizeof(*msix));
    msix-&gt;table_bar = table &amp; PCI_MSIX_FLAGS_BIRMASK;
    msix-&gt;table_offset = table &amp; ~PCI_MSIX_FLAGS_BIRMASK;
    msix-&gt;pba_bar = pba &amp; PCI_MSIX_FLAGS_BIRMASK;
    msix-&gt;pba_offset = pba &amp; ~PCI_MSIX_FLAGS_BIRMASK;
    msix-&gt;entries = (ctrl &amp; PCI_MSIX_FLAGS_QSIZE) + 1;
vfio_msix_setup:
    msix_init(&amp;vdev-&gt;pdev, vdev-&gt;msix-&gt;entries,
                    vdev-&gt;bars[vdev-&gt;msix-&gt;table_bar].region.mem,
                    vdev-&gt;msix-&gt;table_bar, vdev-&gt;msix-&gt;table_offset,
                    vdev-&gt;bars[vdev-&gt;msix-&gt;pba_bar].region.mem,
                    vdev-&gt;msix-&gt;pba_bar, vdev-&gt;msix-&gt;pba_offset, pos);
        memory_region_init_io(&amp;dev-&gt;msix_table_mmio, OBJECT(dev), &amp;msix_table_mmio_ops, dev,
                          "msix-table", table_size);
        memory_region_add_subregion(table_bar, table_offset, &amp;dev-&gt;msix_table_mmio);
        memory_region_init_io(&amp;dev-&gt;msix_pba_mmio, OBJECT(dev), &amp;msix_pba_mmio_ops, dev,
                            "msix-pba", pba_size);
        memory_region_add_subregion(pba_bar, pba_offset, &amp;dev-&gt;msix_pba_mmio);
vfio_realize:
    /* QEMU emulates all of MSI &amp; MSIX */
    if (pdev-&gt;cap_present &amp; QEMU_PCI_CAP_MSIX) {
        memset(vdev-&gt;emulated_config_bits + pdev-&gt;msix_cap, 0xff,
               MSIX_CAP_LENGTH);
    if (pdev-&gt;cap_present &amp; QEMU_PCI_CAP_MSI) {
        memset(vdev-&gt;emulated_config_bits + pdev-&gt;msi_cap, 0xff,
               vdev-&gt;msi_cap_size);
</code></pre><ol start="3"><li>MSI/MSI-X enable 与 irqfd的注册</li></ol><p>当虚拟机因为写PCI配置空间而发生VM-exit时,最终会完成msi和msix的使能,以MSIX的使能为例,在qemu侧会设置eventfd的处理函数,并通过kvm将irqfd注册到内核中,进而注册虚拟中断给虚拟机。</p><pre><code>kvm_cpu_exec:
    vfio_pci_write_config:
        vfio_msi_enable(vdev);
        vfio_msix_enable(vdev);
            for (i = 0; i &lt; vdev-&gt;nr_vectors; i++) {
                if (event_notifier_init(&amp;vector-&gt;interrupt, 0)) {
                qemu_set_fd_handler(event_notifier_get_fd(&amp;vector-&gt;interrupt),
                                    vfio_msi_interrupt, NULL, vector);
                vfio_add_kvm_msi_virq(vdev, vector, i, false);
                    kvm_irqchip_add_msi_route(kvm_state, vector_n, &amp;vdev-&gt;pdev);
                    vfio_add_kvm_msi_virq
                        kvm_irqchip_add_irqfd_notifier_gsi
                            kvm_vm_ioctl(s, KVM_IRQFD, &amp;irqfd);
            /* Set interrupt type prior to possible interrupts */
            vdev-&gt;interrupt = VFIO_INT_MSI;
            ret = vfio_enable_vectors(vdev, false);
                ret = ioctl(vdev-&gt;vbasedev.fd, VFIO_DEVICE_SET_IRQS, irq_set);
</code></pre><h2>小结</h2><p>要让设备直通给虚拟机,需要将设备的DMA能力、中断响应和IO地址空间访问安全地暴露给用户态,本文主要介绍了VFIO设备直通关键的几个环节,包括如何在用户态访问物理设备的IO地址空间、如何进行DMA重映射和中断重映射。</p><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2Fwxggg%2F2020-11-29-vfio-passthrough-2.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000380640">VFIO设备直通原理(一)</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000380076">DAOS ARM64调测之旅</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000376121">回顾2022年计算机视觉领域最激动人心的进展</a></li><li><a href="https://aijishu.com/a/1060000000375922">量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!</a></li><li><a href="https://aijishu.com/a/1060000000375779">自制深度学习推理框架-前言-第一课</a></li><li><a href="https://aijishu.com/a/1060000000375145">YOLOv6精度提升的又一根稻草,感知量化的重参再设计,QARep值得内卷</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Wed, 18 Jan 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000380775</guid>
            <link>https://aijishu.com/a/1060000000380775</link>
        </item>
        <item>
            <title><![CDATA[VFIO设备直通原理(一)]]></title>
            <description><![CDATA[<p>现代系统大多提供DMA和中断重映射功能来确保I/O设备在有限的范围内运行,比如x86平台的AMD-Vi和Intel VT-d。VFIO(Virtual Function I/O)是一个可以将设备I/O、中断和DMA等能力安全的暴露到用户态空间,从而使用用户态驱动实现设备驱动的框架。通过VFIO进行设备直通到虚拟机,可以获得更高的设备I/O性能。</p><p>实现用户态驱动最关键的问题在于如何安全可控的将设备的DMA能力暴露到用户空间,IOMMU的出现可以限制设备对内存的访问,恶意的设备不能直接读写物理内存,经过IOMMU映射之后才能使用IOVA或者虚拟地址进行访存,由IOMMU来保证访存的安全性。</p><h2>VFIO内核组件</h2><p>VFIO内核组件主要包括如下图所示,通过设备文件向用户态提供统一访问接口vfio interface层,包括:</p><ul><li>VFIO container</li><li>VFIO group</li><li>VFIO device</li></ul><pre><code>+-----------------------------------------+
|            vfio interface               |
+-----------------------------------------+
|  vfio_iommu_driver |       vfio_pci     |
+--------------------+--------------------+
|        iommu       |       pci_bus      |
+--------------------+--------------------+
</code></pre><p>vfio interface 封装了vfio\_iommu\_driver和vfio\_pci分别和底层的IOMMU、PCI驱动进行交互,vfio\_iommu\_driver为VFIO提供了IOMMU重映射驱动,向用户态暴露DMA操作,主要是vfio\_iommu\_type1驱动,利用IOMMU管理IO页表的能力来进行IO重映射。vfio\_pci模块封装pci设备驱动并和用户态程序进行配合完成用户态的设备配置模拟、Bar空间重定向及中断重映射等功能。</p><p>VFIO框架中比较重要的几个概念包括:Container、Group和Device,其相互之间的关系如图所示,一个container可以理解为实际的物理资源集合,每个container中可以有多个group,group描述了设备在物理上的划分,一个group可以有多个device,划分的逻辑取决于硬件上的IOMMU拓扑结构。</p><pre><code>container
+------------------------+
|    group0    group1    |
|  +-------+  +------+   |
|  | dev0  |  | dev2 |   |
|  | dev1  |  +------+   |
|  +-------+             |
+------------------------+
</code></pre><p>可以结合内核中vfio.txt文件来理解Container、Group、Device和IOMMU之间的关系。</p><h2>VFIO Container</h2><pre><code>// container: /dev/vfio/vfio
struct vfio_container {
    struct kref            kref;
    struct list_head        group_list;
    struct rw_semaphore        group_lock;
    struct vfio_iommu_driver    *iommu_driver;
    void                *iommu_data;
    bool                noiommu;
};
</code></pre><p>Container是管理内存资源,和IOMMU、DMA及地址空间相关,可以通过打开设备文件/dev/vfio/vfio来获取container对应的文件描述符,在内核vfio/vfio.c中有对应该vfio设备文件的具体操作实现,ioctl主要是可以获取IOMMU相关的信息,vfio会将用户态对IOMMU相关操作发给底层的vfio_iommu驱动进行操作,通过vfio ioctl提供的接口如下:</p><ul><li>获取API versio</li><li>设置IOMMU的类型,如设置为常用的VFIO\_TYPE1\_IOMMU</li><li>获取IOMMU的信息</li><li>分配空间并进行DMA映射</li></ul><pre><code>int container, group, device, i;
struct vfio_iommu_type1_info iommu_info = { .argsz = sizeof(iommu_info) };
struct vfio_iommu_type1_dma_map dma_map = { .argsz = sizeof(dma_map) };
/* Create a new container */
container = open("/dev/vfio/vfio", O_RDWR);
if (ioctl(container, VFIO_GET_API_VERSION) != VFIO_API_VERSION)
    /* Unknown API version */
if (!ioctl(container, VFIO_CHECK_EXTENSION, VFIO_TYPE1_IOMMU))
    /* Doesn't support the IOMMU driver we want. */
/* Enable the IOMMU model we want */
ioctl(container, VFIO_SET_IOMMU, VFIO_TYPE1_IOMMU);
/* Get addition IOMMU info */
ioctl(container, VFIO_IOMMU_GET_INFO, &amp;iommu_info);
/* Allocate some space and setup a DMA mapping */
dma_map.vaddr = mmap(0, 1024 * 1024, PROT_READ | PROT_WRITE,
                MAP_PRIVATE | MAP_ANONYMOUS, 0, 0);
dma_map.size = 1024 * 1024;
dma_map.iova = 0; /* 1MB starting at 0x0 from device view */
dma_map.flags = VFIO_DMA_MAP_FLAG_READ | VFIO_DMA_MAP_FLAG_WRITE;
ioctl(container, VFIO_IOMMU_MAP_DMA, &amp;dma_map);
</code></pre><h2>VFIO Group</h2><pre><code>// group: /dev/vfio/%group_id
struct vfio_group {
    struct kref            kref;
    int                minor;
    atomic_t            container_users;
    struct iommu_group        *iommu_group;
    struct vfio_container        *container;
    struct list_head        device_list;
    struct mutex            device_lock;
    struct device            *dev;
    struct notifier_block        nb;
    struct list_head        vfio_next;
    struct list_head        container_next;
    struct list_head        unbound_list;
    struct mutex            unbound_lock;
    atomic_t            opened;
    wait_queue_head_t        container_q;
    bool                noiommu;
    struct kvm            *kvm;
    struct blocking_notifier_head    notifier;
};
</code></pre><p>Group是IOMMU进行DMA隔离的最小硬件单元,设备属于哪个group取决于IOMMU和设备的物理结构,在设备直通时需要将一个group里的所有设备都分配给一个虚拟机,其实就是多个group可以从属于一个container,而group下的所有设备也随着该group从属于该container。这样能够做到DMA隔离,避免一个container里的device通过DMA来攻击获取另一个container里的数据。</p><p>对于一个PCI设备0000:06:0d.0::,通过readlink可以在sys文件目录下获取其iommu_group,比如该PCI设备在ID为26的IOMMU group中。</p><pre><code>$ readlink /sys/bus/pci/devices/0000:06:0d.0/iommu_group
../../../../kernel/iommu_groups/26
</code></pre><p>设备挂载在pci bus下,可以使用 vfio-pci 来管理这个group。使用vfio-pci来管理设备时,首先从原来的驱动里unbind该PCI设备,然后将id写入新的vfio-pci路径下,会为这个group创建一个字符设备。</p><pre><code>$ lspci -n -s 0000:06:0d.0
06:0d.0 0401: 1102:0002 (rev 08)
$ echo 0000:06:0d.0 &gt; /sys/bus/pci/devices/0000:06:0d.0/driver/unbind
$ echo 1102 0002 &gt; /sys/bus/pci/drivers/vfio-pci/new_id
</code></pre><p>当设备绑定到vfio之后,在/dev/vfio/路径下面会产生一个新的group id,通过该id可以获取到group,完成以下操作:</p><ul><li>查询group状态,是否所有设备都绑定到vfio驱动</li><li>设置group的container</li><li>根据设备的BDF号为设备分配一个文件描述符</li></ul><pre><code>struct vfio_group_status group_status =
                { .argsz = sizeof(group_status) };
/* Open the group */
group = open("/dev/vfio/26", O_RDWR);
/* Test the group is viable and available */
ioctl(group, VFIO_GROUP_GET_STATUS, &amp;group_status);
if (!(group_status.flags &amp; VFIO_GROUP_FLAGS_VIABLE))
    /* Group is not viable (ie, not all devices bound for vfio) */
/* Add the group to the container */
ioctl(group, VFIO_GROUP_SET_CONTAINER, &amp;container);
/* Get a file descriptor for the device */
device = ioctl(group, VFIO_GROUP_GET_DEVICE_FD, "0000:06:0d.0");
</code></pre><h2>VFIO Device</h2><pre><code>struct vfio_device {
    struct kref            kref;
    struct device            *dev;
    const struct vfio_device_ops    *ops;
    struct vfio_group        *group;
    struct list_head        group_next;
    void                *device_data;
};
</code></pre><p>为了兼顾platform和pci设备,vfio统一对外提供<code>struct vfio_device</code>来描述vfio设备,并用device_data来指向如<code>struct vfio_pci_device</code>。Device即设备,但与真正的物理设备有区别的是,对于一个在硬件上独立的设备,单独构成一个iommu group,而如果是multi-function的设备,多个function之间是互联的,相互可以访问对方的数据,所以必须放到一个group里面。</p><p>通过group的ioctl操作和设备的的BDF号获取到设备描述符之后,在vfio_pci中有对应描述符的内核操作vfio_pci_ops,这个ops是在vfio_pci设备驱动vfio_pci_probe调用的时候注册到PCI设备的,probe的时候还会将设备加入到对应的group中。vfio_pci设备的ops中比较重要的是 vfio_pci_ioctl函数,提供了如下功能:</p><ul><li>VFIO_DEVICE_GET_INFO:获取设备信息,region数量、irq数量等</li><li>VFIO_DEVICE_GET_REGION_INFO:获取vfio_region的信息,包括配置空间的region和bar空间的region等</li><li>VFIO_DEVICE_GET_IRQ_INFO:获取设备中断相关的信息</li><li>VFIO_DEVICE_SET_IRQS:完成中断相关的设置</li><li>VFIO_DEVICE_RESET:设备复位</li><li>VFIO_DEVICE_GET_PCI_HOT_RESET_INFO:获取PCI设备hot reset信息</li><li>VFIO_DEVICE_PCI_HOT_RESET:设置PCI设备 hot reset</li><li>VFIO_DEVICE_IOEVENTFD:设置ioeventfd</li></ul><p>要暴露设备的能力到用户态空间,要让用户态能够直接访问设备配置空间并处理设备中断,对于PCI设备而言,其配置其配置空间是一个VFIO region,对应着一块MMIO内存,通过建立dma重映射让用户态能够直接访问设备配置空间,另外还需要建立中断重映射以让用户态驱动处理设备中断事件。</p><pre><code>struct vfio_device_info device_info = { .argsz = sizeof(device_info) };
/* Get a file descriptor for the device */
device = ioctl(group, VFIO_GROUP_GET_DEVICE_FD, "0000:06:0d.0");
/* Test and setup the device */
ioctl(device, VFIO_DEVICE_GET_INFO, &amp;device_info);
for (i = 0; i &lt; device_info.num_regions; i++) {
    struct vfio_region_info reg = { .argsz = sizeof(reg) };
    reg.index = i;
    ioctl(device, VFIO_DEVICE_GET_REGION_INFO, &amp;reg);
    /* Setup mappings... read/write offsets, mmaps
        * For PCI devices, config space is a region */
}
for (i = 0; i &lt; device_info.num_irqs; i++) {
    struct vfio_irq_info irq = { .argsz = sizeof(irq) };
    irq.index = i;
    ioctl(device, VFIO_DEVICE_GET_IRQ_INFO, &amp;irq);
    /* Setup IRQs... eventfds, VFIO_DEVICE_SET_IRQS */
}
/* Gratuitous device reset and go... */
ioctl(device, VFIO_DEVICE_RESET);
</code></pre><h2>Container,group和device绑定</h2><p>1.VFIO_SET_IOMMU: Container 绑定 IOMMU:</p><p>首先,VFIO的Container和IOMMU之间的绑定,通过在用户态通过ioctl调用VFIO_SET_IOMMU完成,绑定意味着将container管理的所有group都attach到IOMMU中,最终会将每个group中的每个设备都attach到IOMMU中,这意味着为设备建立IO页表完成初始化</p><pre><code>ioctl(container, VFIO_SET_IOMMU, VFIO_TYPE1_IOMMU)
    vfio_ioctl_set_iommu
        list_for_each_entry(group, &amp;container-&gt;group_list, container_next) {
        ret = driver-&gt;ops-&gt;attach_group(data, group-&gt;iommu_group);
            __iommu_attach_group
                ret = __iommu_group_for_each_dev(group, domain,
                     iommu_group_do_attach_device);
                        __iommu_attach_device
                            arm_smmu_attach_dev
                                建立设备的IO页表
</code></pre><p>2.VFIO\_GROUP\_SET_CONTAINER: 将Group设置到对应的Container:</p><p>VFIO提供接口由用户态指定Group绑定到哪个Container中,这个绑定操作会将group记录到container的链表中进行管理,并且如果已经设置好了vfio\_iommu\_driver,会进行group的attach操作,并进而完成该group中的设备的IO页表初始化</p><pre><code>VFIO_GROUP_SET_CONTAINER:
    vfio_group_set_container
        driver = container-&gt;iommu_driver;
        if (driver) {
            ret = driver-&gt;ops-&gt;attach_group(container-&gt;iommu_data,
                            group-&gt;iommu_group);
            if (ret)
                goto unlock_out;
        }
        group-&gt;container = container;
        container-&gt;noiommu = group-&gt;noiommu;
        list_add(&amp;group-&gt;container_next, &amp;container-&gt;group_list);
</code></pre><p>3.Device和Group之间的绑定关系源自设备和IOMMU的物理拓扑结构</p><h2>小结</h2><p>VFIO内核组件的实现与Linux内核的IOMMU、设备模型等紧密相连,通过抽象出VFIO的概念来完成对Linux内核组件的封装。本文主要通过VFIO的用户态接口的使用来介绍了VFIO的几个基本概念,包括VFIO Container、Group和Device。要让物理设备通过VFIO驱动暴露给用户态,需要完成以下步骤:</p><ul><li>首先将设备与原有驱动进行解绑,并重新绑定到VFIO驱动,VFIO驱动会为设备指定对应的group,设备属于哪个IOMMU group与设备和IOMMU的物理拓扑结构有关。</li><li>完成上述绑定之后,用户态驱动就可以通过<code>/dev/vfio/vfio</code>获取到VFIO 的container,设置vfio_iommu_driver的类型,通过container可以间接访问IOMMU完成dma映射。</li><li>然后可以通过<code>/dev/vfio/%group_id</code>获取到设备所属的group,通过ioctl将该group上的所有设备加入到container中。</li><li>然后通过group和设备BDF号可以获取到VFIO device的fd,并通过vfio提供的接口访问设备的配置空间和irq信息等,完成在用户态访问物理设备。</li></ul><p>VFIO设备直通有几个关键问题需要关注,如何访问直通设备的IO地址空间,如何完成中断重映射和DMA重映射让用户态驱动访问物理设备能力.</p><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2Fwxggg%2F2020-11-29-vfio-passthrough-1.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000380076">DAOS ARM64调测之旅</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000376121">回顾2022年计算机视觉领域最激动人心的进展</a></li><li><a href="https://aijishu.com/a/1060000000375922">量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!</a></li><li><a href="https://aijishu.com/a/1060000000375779">自制深度学习推理框架-前言-第一课</a></li><li><a href="https://aijishu.com/a/1060000000375145">YOLOv6精度提升的又一根稻草,感知量化的重参再设计,QARep值得内卷</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Tue, 17 Jan 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000380640</guid>
            <link>https://aijishu.com/a/1060000000380640</link>
        </item>
        <item>
            <title><![CDATA[DAOS ARM64调测之旅]]></title>
            <description><![CDATA[<p>背景概述</p><p>从IO500榜单上了解到,前10名有一半是DAOS,这是什么样一款存储软件,能如此优秀?从HDD到SSD,仅仅是性能提升、延迟降低,从SSD到SCM,不仅仅是性能提升,还支持按字节事务性访问,异常后回滚。SCM不带DMA,访问过程消耗大量的CPU资源,从软件架构上优化,就是想办法减少拷贝过程,诞生了RDMA零拷贝;从硬件上优化,intel推出了DSA加速器。DAOS+SCM新架构值得在ARM64上尝试。</p><h2>编译问题</h2><p>DAOS官网上明确说仅支持x86+Optane内存+NVMe SSD商用化,同时提供了用内存模拟Optane内存的实验特性。ARM64跑DAOS就有了可能。我们首先进行了版本编译,碰到了静态检查结构体大小报错。通过分析发现根因是pthread\_mutex在不同平台上,长度是不一样的,x86 64是40字节,ARM64是48字节,多了8字节,触发了结构体大小断言报错。提问题单,社区帮忙调整数据结构解决了断言错误。接下来就是依赖的SPDK组件编译报错,DAOS设置spdk\_arch是x86,修改为读编译主机arch,是ARM64就使用native方式编译,解决了SPDK编译报错问题。再下来是缺少libipmctl.so,ipmctl是intel Optane的管理工具,只有x86版本,ARM64需要去掉libipmctl依赖,增加ipmctl空接口后,解决了依赖报错问题。telemetry的go代码限制只有amd64编译,修改为amd64、arm64都编译。最后一个问题是Dup2在ARM64上不支持,使用Dup3来支持Dup2。</p><h2>IO500调测</h2><p>版本编译出来后,在ARM64上部署测试,一跑就挂死,调用栈是问号,打开所有调试信息,每次挂死前都是在mercury网络模块,无法进一步定位。直觉判定可能是内核页大小问题导致的,x86只支持4K页,ARM64支持4K、16K、64K页,改成4K页后,就能正常跑起来不挂死了。又出现了新问题,找不到网络接口,异常退出了。看日志,不支持bond、vlan等虚拟网络设备,改成使用物理网卡后,网络正常识别,集群正常起来。不一会就出现网络超时故障,查看日志有的是4秒超时,有的是请求发出去立即就超时了,看起来是集群间时间没有同步,对端收到后时间差超过超时门限,触发超时流程,时间同步后,几秒超时问题消失。跑一段时间后还是出现超时,且系统明显卡顿,查看CPU并不忙,查看内存free情况,发现内存很少,perf抓火焰图,发现内存申请走了慢路径申请,减少模拟Optane的内存大小后,网络超时问题消失。IO500测试60~70秒左右,就出现集群空间满,测试终止。查看SCM空间已用完,NVMe空间剩余还很大。上社区论坛查到,元数据只保留在SCM上,SCM空间不足也不会转存到NVMe中,直接上报空间不足错误。只能加大物理内存,从256GB加到512GB后,保留了更多的内存,IO500能测试到200秒左右还是耗光了SCM,IO500需要测试300秒,成绩才是有效的,因此需要想办法减少SCM空间使用。从DAOS架构图上看到SCM内存用来存放元数据、非对齐的数据、小块数据,查看代码,小块数据默认是4K以下就存SCM。修改容器属性,io门限值降低到2K,这样IO500终于能测试完。增加target个数,增加并发度,又出现了SCM耗尽,仔细读DAOS文档,提到每个target会预留SCM、NVMe内存做聚合使用,查看代码找到了SCM会保留2GB、NVMe保留10GB,没有设置接口,直接修改代码SCM保留512MB,每个target节省了1.5GB,一个rank 16个target共节省了24GB内存,每个rank总共分配了90GB,节省了26%的内存。IO500跑完再没出现过SCM耗尽,性能也得到了大幅提升。逐步增加客户端个数,发现mdtest部分测试项随着并发度增加能一直增加,说明客户端有瓶颈,10台客户端里有4台性能较差,更换性能更好的客户端后,性能进一步提升。开启端到端校验后测试,发现sha512新建容器大概率失败,X86每次都是成功的。执行isal_crypto下的sha512测试用例,都是通过的。看github问题列表,发现2021年就有人上报了在ARM64上sha512值错误并提供了测试程序。分析sha512代码,发现缺少了多次更新不足一块数据的追加处理,修复后,测试程序通过,DAOS端到端sha512校验也通过了。</p><h2>功能验证</h2><p>由于IO500只跑性能,没有校验数据是否正确,我们通过复制大量不同大小的文件到DAOS文件系统,重启DAOS集群后,再复制回来,检查前后的md5值是否一致,来校验数据是否正确。前后md5值是一致的,确认数据一致性没有问题。压力测试大概率出现复制回来过程中,服务端coredump,看log是池版本号为NULL触发断言,待分析。扩展测试了2/3副本、EC 2+1 2+2 4+2,数据校验均正确。</p><p>在社区上看到DAOS计划用容器来支持块设备,目前容器不支持预先指定容量。DAOS提供dfs插件支持fio测试,实际还是文件系统,并不是块设备。fio测试了单IO时延,写4K随机写110us、读160us、混合读写150us,接近100us。单台服务器4K多并发随机写测试420K IOPS。fusionstorage、阿里云已经能做到50us,100万IOPS,看来还有优化空间。</p><p>ARM64运行DAOS还有哪些问题?我们执行了daos_test、run_test.sh,跟x86对比测试,发现ARM64上出现vos小io测试错误、epoch错误、对象检查错误,分析测试代码,发现是测试代码本身的问题,x86能通过是因为局部变量初始值是0,ARM64初始值是随机的,修改测试代码后,这三个用例能通过。还发现EC一个用例失败,正在分析中,其他测试都跟x86一致。</p><h2>总结展望</h2><p>DAOS ARM64调测过程总体来说,比较顺利,主要是断言比较多,能快速定位问题。大量使用spdk、isal、isal_ctypto,pmdk模块,ARM64已经很好的适配过这些模块,因此很少补丁改动,即可在arm64上编译通过,运行稳定。dashboard使用promethues+grafana,性能测试过程可视化,方便诊断性能。每个target单线程,没有多线程并发冲突问题,也就没有ARM64弱序问题。问题分析过程中,大量参考了DAOS社区问题单,分析步骤详细,提供了分析思路。</p><p>后续重点在社区添加ARM64 CI,覆盖多种OS编译、单元测试,定期取主线版本进行性能测试。使用内存备电验证pmdk刷cache、数据校验正确性验证。社区版本支持UCX、NVMe of RDMA模块后,进行ARM64UCX、NoF功能测试。</p><h2>ARM64补丁列表</h2><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F8998" target="blank">DAOS-10569 client: fix build on aarch64</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F8984" target="blank">DAOS-10148 tse: fix TSE task buffer to account for aarch64</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9398" target="blank">DAOS-10871 build: Fix aarch64 build SPDK error</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9401" target="blank">DAOS-10872 control: Fix aarch64 build control errors</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9505" target="blank">DAOS-10922 control: Implement ipmctl for aarch64</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9487" target="blank">DAOS-10899 test: use expected variable to do assert checking</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9486" target="blank">DAOS-10898 obj: fix the assert in small_io test</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9456" target="blank">DAOS-10891 tests: fix incorrect assert in check_oclass</a></p><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2Ffengchunsong%2FDAOS%2520ARM64%E8%B0%83%E6%B5%8B%E4%B9%8B%E6%97%85.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000376121">回顾2022年计算机视觉领域最激动人心的进展</a></li><li><a href="https://aijishu.com/a/1060000000375922">量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!</a></li><li><a href="https://aijishu.com/a/1060000000375779">自制深度学习推理框架-前言-第一课</a></li><li><a href="https://aijishu.com/a/1060000000375145">YOLOv6精度提升的又一根稻草,感知量化的重参再设计,QARep值得内卷</a></li><li><a href="https://aijishu.com/a/1060000000374982">xNN:支付宝端侧深度学习框架</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Thu, 12 Jan 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000380076</guid>
            <link>https://aijishu.com/a/1060000000380076</link>
        </item>
        <item>
            <title><![CDATA[Virtio协议概述]]></title>
            <description><![CDATA[<p>摘要</p><p>半虚拟化设备(Virtio Device)在当前云计算虚拟化场景下已经得到了非常广泛的应用, 并且现在也有越来越多的物理设备也开始支持Virtio协议,即所谓的<code>Virtio Offload</code>, 通过将virtio协议卸载到硬件上(例如virtio-net网卡卸载,virtio-scsi卸载)让物理机和虚拟机都能够获得加速体验。 本文中我们来重点了解一下virtio技术中的一些关键点,方便我们加深对半虚拟化的理解。 本文适合对IO虚拟化有一定了解的人群阅读,本文的目的是对想要了解virtio内部机制的读者提供帮助。</p><p>在开始了解virtio之前,我们先思考一下几个相关问题:</p><ul><li>virtio设备有哪几种呈现方式?</li><li>virtio-pci设备的配置空间都有哪些内容?</li><li>virtio前端和后端基于共享内存机制进行通信,它是凭什么可以做到无锁的?</li><li>virtio机制中有那几个关键的数据结构?virtio配置接口存放在哪里?virtio是如何工作的?</li><li>virtio前后端是如何进行通信的?irqfd和ioeventfd是什么回事儿?在virtio前后端通信中是怎么用到的?</li><li>virtio设备支持MSIx,在qemu/kvm中具体是怎么实现对MSIx的模拟呢?</li><li>virtio modern相对于virtio legay多了哪些新特性?</li></ul><h2>0. 简单了解一下Virtio Spec协议</h2><p>virtio协议标准最早由IBM提出,virtio作为一套标准协议现在有专门的技术委员会进行管理, 具体的标准可以访问<a href="https://aijishu.com/link?target=http%3A%2F%2Fdocs.oasis-open.org%2Fvirtio%2Fvirtio%2Fv1.0%2Fvirtio-v1.0.html" target="blank"><code>virtio</code>官网</a>, 开发者可以向技术委员会提供新的virtio设备提案(<code>RFC</code>),经过委员会通过后可以增加新的virtio设备类型。</p><p>组成一个virtio设备的四要素包括:<strong>设备状态域,<code>feature bits</code>,设备配置空间,一个或者多个<code>virtqueue</code></strong>。 其中设备状态域包含6种状态:</p><ul><li>ACKNOWLEDGE(1):GuestOS发现了这个设备,并且认为这是一个有效的virtio设备;</li><li>DRIVER (2) : GuestOS知道该如何驱动这个设备;</li><li>FAILED (128) : GuestOS无法正常驱动这个设备,Something is wriong;</li><li>FEATURES_OK (8) : GuestOS认识所有的feature,并且feature协商一完成;</li><li>DRIVER_OK (4) : 驱动加载完成,设备可以投入使用了;</li><li>DEVICE_NEEDS_RESET (64) :设备触发了错误,需要重置才能继续工作。</li></ul><p><code>feature bits</code>用来标志设备支持那个特性,其中bit0-bit23是特定设备可以使用的<code>feature bits</code>, bit24-bit37预给队列和feature协商机制,bit38以上保留给未来其他用途。 例如:对于virtio-net设备而言,feature bit0表示网卡设备支持checksum校验。<code>VIRTIO_F_VERSION_1</code>这个feature bit用来表示设备是否支持virtio 1.0 spec标准。</p><p>在virtio协议中,所有的设备都使用virtqueue来进行数据的传输。<strong>每个设备可以有0个或者多个virtqueue,每个virtqueue占用2个或者更多个4K的物理页</strong>。 virtqueue有<code>Split Virtqueues</code>和<code>Packed Virtqueues</code>两种模式, 在<code>Split virtqueues</code>模式下virtqueue被分成若干个部分, 每个部分都是前端驱动或者后端单向可写的(不能两端同时写)。 每个virtqueue都有一个16bit的queue size参数,表示队列的总长度。 每个virtqueue由3个部分组成:</p><pre><code>    +-------------------+--------------------------------+-----------------------+
    | Descriptor Table  |   Available Ring  (padding)    |       Used Ring       |
    +-------------------+--------------------------------+-----------------------+
</code></pre><ul><li>Descriptor Table:存放IO传输请求信息;</li><li>Available Ring:记录了Descriptor Table表中的哪些项被更新了,前端Driver可写但后端只读;</li><li>Used Ring:记录Descriptor Table表中哪些请求已经被提交到硬件,前端Driver只读但后端可写。</li></ul><p>整个virtio协议中设备IO请求的工作机制可以简单地概括为:</p><ol><li>前端驱动将IO请求放到<code>Descriptor Table</code>中,然后将索引更新到<code>Available Ring</code>中,然后kick后端去取数据;</li><li>后端取出IO请求进行处理,然后结果刷新到<code>Descriptor Table</code>中再更新<code>Using Ring</code>,然后发送中断notify前端。</li></ol><p>从virtio协议可以了解到<strong>virtio设备支持3种设备呈现模式</strong>:</p><ul><li>Virtio Over PCI BUS,依旧遵循PCI规范,挂在到PCI总线上,作为virtio-pci设备呈现;</li><li>Virtio Over MMIO,部分不支持PCI协议的虚拟化平台可以使用这种工作模式,直接挂载到系统总线上;</li><li>Virtio Over Channel I/O:主要用在s390平台上,virtio-ccw使用这种基于channel I/O的机制。</li></ul><p>其中,Virtio Over PCI BUS的使用比较广泛,作为PCI设备需按照规范要通过PCI配置空间来向操作系统报告设备支持的特性集合, 这样操作系统才知道这是一个什么类型的virtio设备,并调用对应的前端驱动和这个设备进行握手,进而将设备驱动起来。 QEMU会给virtio设备模拟PCI配置空间,对于virtio设备来说PCI Vendor ID固定为0x1AF4, PCI Device ID 为 0x1000到0x107F之间的是virtio设备。 同时,在不支持PCI协议的虚拟化平台上,virtio设备也可以直接通过MMIO进行呈现, virtio-spec 4.2<a href="https://aijishu.com/link?target=https%3A%2F%2Fdocs.oasis-open.org%2Fvirtio%2Fvirtio%2Fv1.1%2Fcsprd01%2Fvirtio-v1.1-csprd01.html%23x1-1440002" target="blank">Virtio Over MMIO</a>有针对virtio-mmio设备呈现方式的详细描述,mmio相关信息可以直接通过内核参数报告给Linux操作系统。 本文主要基于virtio-pci展开讨论。</p><p>前面提到virtio设备有<code>feature bits</code>,<code>virtqueue</code>等四要素,那么在virtio-pci模式下是如何呈现的呢? 从virtio spec来看,老的virtio协议和新的virtio协议在这一块有很大改动。 virtio legacy(virtio 0.95)协议规定,对应的配置数据结构(virtio common configuration structure) 应该存放在设备的BAR0里面,我们称之为<code>virtio legay interface</code>,其结构如下:</p><pre><code>                       virtio legacy ==&gt; Mapped into PCI BAR0
    +------------------------------------------------------------------+
    |                    Host Feature Bits[0:31]                       |
    +------------------------------------------------------------------+
    |                    Guest Feature Bits[0:31]                      |
    +------------------------------------------------------------------+
    |                    Virtqueue Address PFN                         |
    +---------------------------------+--------------------------------+
    |           Queue Select          |           Queue Size           |
    +----------------+----------------+--------------------------------+
    |   ISR Status   | Device Stat    |           Queue Notify         |
    +----------------+----------------+--------------------------------+
    |       MSI Config Vector         |         MSI Queue Vector       |
    +---------------------------------+--------------------------------+
</code></pre><p>对于新的<code>virtio modern</code>,协议将配置结构划分为5种类型:</p><pre><code>/* Common configuration */
#define VIRTIO_PCI_CAP_COMMON_CFG        1
/* Notifications */
#define VIRTIO_PCI_CAP_NOTIFY_CFG        2
/* ISR Status */
#define VIRTIO_PCI_CAP_ISR_CFG           3
/* Device specific configuration */
#define VIRTIO_PCI_CAP_DEVICE_CFG        4
/* PCI configuration access */
#define VIRTIO_PCI_CAP_PCI_CFG           5
</code></pre><p>以上的每种配置结构是直接映射到virtio设备的BAR空间内,那么如何指定每种配置结构的位置呢? 答案是通过<code>PCI Capability list</code>方式去指定,这和物理PCI设备是一样的,体现了virtio-pci的协议兼容性。</p><pre><code>struct virtio_pci_cap {
        u8 cap_vndr;    /* Generic PCI field: PCI_CAP_ID_VNDR */
        u8 cap_next;    /* Generic PCI field: next ptr. */
        u8 cap_len;     /* Generic PCI field: capability length */
        u8 cfg_type;    /* Identifies the structure. */
        u8 bar;         /* Where to find it. */
        u8 padding[3];  /* Pad to full dword. */
        le32 offset;    /* Offset within bar. */
        le32 length;    /* Length of the structure, in bytes. */
};
</code></pre><p>只是略微不同的是,virtio-pci的Capability有一个统一的结构, 其中<code>cfg_type</code>表示Cap的类型,bar表示这个配置结构被映射到的BAR空间号。 这样每个配置结构都可以通过BAR空间直接访问,或者通过PCI配置空间的<code>VIRTIO_PCI_CAP_PCI_CFG</code>域进行访问。 每个Cap的具体结构定义可以参考virtio spec 4.1.4.3小节。</p><h1>1. 前后端数据共享</h1><p>传统的纯模拟设备在工作的时候,会触发频繁的陷入陷出, 而且IO请求的内容要进行多次拷贝传递,严重影响了设备的IO性能。 virtio为了提升设备的IO性能,采用了共享内存机制,<strong>前端驱动会提前申请好一段物理地址空间用来存放IO请求,然后将这段地址的GPA告诉QEMU</strong>。 前端驱动在下发IO请求后,QEMU可以直接从共享内存中取出请求,然后将完成后的结果又直接写到虚拟机对应地址上去。<strong>整个过程中可以做到直投直取,省去了不必要的数据拷贝开销</strong>。</p><p><strong><code>Virtqueue</code>是整个virtio方案的灵魂所在</strong>。每个virtqueue都包含3张表,<code>Descriptor Table</code>存放了IO请求描述符,<code>Available Ring</code>记录了当前哪些描述符是可用的,<code>Used Ring</code>记录了哪些描述符已经被后端使用了。</p><pre><code>                          +------------------------------------+
                          |       virtio  guest driver         |
                          +-----------------+------------------+
                            /               |              ^
                           /                |               \
                          put            update             get
                         /                  |                 \
                        V                   V                  \
                   +----------+      +------------+        +----------+
                   |          |      |            |        |          |
                   +----------+      +------------+        +----------+
                   | available|      | descriptor |        |   used   |
                   |   ring   |      |   table    |        |   ring   |

...

@github-actions
Copy link
Contributor

http://localhost:1200/aijishu/blog/readings - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[极术读书 - 极术社区]]></title>
        <link>https://aijishu.com/blog/readings</link>
        <atom:link href="http://localhost:1200/aijishu/blog/readings" rel="self" type="application/rss+xml" />
        <description><![CDATA[极术读书 - 极术社区 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 16:48:48 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[免费国家精品课程:《嵌入式系统及应用》MOOC在线课程,第13次开课!]]></title>
            <description><![CDATA[<blockquote>极术读书是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>。</blockquote><p>和安谋科技技术人才生态有非常深入合作的苏州大学王宜怀教授,正在授课的基于Arm® Cortex®-M处理器的<strong>《嵌入式系统及应用》在线开放课程</strong>一直是我们极力推荐的。该课程连续几年被评为<strong>国家精品课程</strong>。</p><p>嵌入式系统是嵌入式人工智能与物联网的重要基础,该课程以Arm Cortex-M微处理器为蓝本,以软硬件构件为主线,基于嵌入式软件工程基本原理,按照"<strong>通用知识—驱动构件使用方法—测试实例—芯片编程结构—构件设计方法</strong>”的线条,逐步阐述嵌入式系统基本知识要素及较为规范的底层软硬件相结合的设计方法。</p><p><strong>目前是本课程的第13次开课,开课时间是2023年02月20日 ~ 2023年06月16日。</strong>如果你想掌握构成计算机的基本部件原理,掌握计算机高级程序设计方法,为从寄存器级理解软件干预硬件提供基础,那就赶快查看下方信息,报名学习吧!现在加入还来得及喔~</p><h2>《嵌入式系统及应用》在线开放课程</h2><p><a href="https://v.qq.com/x/page/j3325qf1xro.html">https://v.qq.com/x/page/j3325qf1xro.html</a></p><p>本视频由授课教师提供</p><h3><strong>01 基本介绍</strong></h3><ul><li><strong>课程名称:</strong>《嵌入式系统及应用》</li><li><strong>授课单位:</strong>苏州大学</li><li><strong>授课教师:</strong>王宜怀、张建、刘长勇</li><li><strong>在线学习网址:</strong>  <a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.icourse163.org%2Fcourse%2FSUDA-1001754273" target="blank">[<strong>爱课程-中国大学MOOC</strong>]</a></li><li><strong>本次开课时间:</strong>2023年02月20日 ~ 2023年06月16日</li></ul><h3>02 课程概述</h3><p>《嵌入式系统及应用》课程作为嵌入式人工智能与物联网相关专业的基础课程,以Arm Cortex-M微处理器为蓝本,采用构件化开发,针对每个知识点,提供样本程序(葫芦),学生通过模仿该程序稍加修改后可完成符合自我要求的程序(照葫芦画瓢)。课程按照<strong>“通用知识—驱动构件使用方法—测试实例—芯片编程结构—构件设计方法”</strong>的线条,逐步阐述嵌入式系统基本知识要素及较为规范的底层软硬件相结合的设计方法。</p><h3>03 课程用书</h3><p>本课程教学用书《嵌入式技术基础与实践(第6版)—基于STM32L431微控制器》,该教材历经十多年凝练,仔细梳理了嵌入式系统的通用基础知识要素,注重把握通用知识与芯片相关知识之间的平衡、把握硬件与软件的关系、对底层驱动进行构件化封装、设计合理的测试用例,教材内含简明实验套件,结合网上电子资源,方便读者进行实践与应用。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbqNk" alt="51546da303679fd168b5fe7d75d10e65.jpg" title="51546da303679fd168b5fe7d75d10e65.jpg"></p><p><strong>《嵌入式技术基础与实践(第6版)》(王宜怀主编)</strong></p><blockquote>【书内含通用嵌入式计算机GEC,型号:AHL-STM32L431,可完成书中基本实验】</blockquote><p><strong>电子资源下载地址及路径:</strong></p><p>“<a href="https://aijishu.com/link?target=https%3A%2F%2Fsumcu.suda.edu.cn%2F" target="blank">https://sumcu.suda.edu.cn/</a>”→“金葫芦专区”→“嵌入式书6版”,右边为下载索引</p><p><strong>点击<a href="https://aijishu.com/link?target=https%3A%2F%2Ftuicashier.youzan.com%2Fpay%2Fwscgoods_order%3Fbanner_id%3Dseach.16152946%7Esearch%7E7%7E7LEMSxlm%26words%3D%E5%B5%8C%E5%85%A5%E5%BC%8F%26alg%3D0%26slg%3Dconsumer-search%2CstandardModify%2C30be7fd3-df55-4535-c709-11c1b3a78e09%2C711.545_c9498a9569324a1ab4d18b403e0cc497%26reft%3D1630934839602%26spm%3Dseach.16152946%26is_share%3D1%26shopAutoEnter%3D1%26sl%3D3NTPzP%26from_params%3Dsl%7E3NTPzP%21online_kdt_id%7E16152946%26sub_kdt_id%3D16152946%26st%3D3%26alias%3D3f579wrkbwq9es4%26is_silence_auth%3D1" target="blank">链接</a>即可购买教材:</strong></p><h3><strong>04 课程大纲</strong></h3><p><strong>01 概述</strong></p><p>1.1 初识嵌入式系统<br>1.2 嵌入式系统的定义、发展简史、分类及特点<br>1.3 嵌入式系统的学习困惑、知识体系及学习建议<br>1.4 微控制器与应用处理器简介<br>1.5 嵌入式系统常用术语</p><p><strong>02 Arm Cortex-M4微处理器</strong></p><p>2.1 Arm Cortex-M4微处理器简介<br>2.2 寻址方式与机器码的获取方法<br>2.3 基本指令分类解析<br>2.4 汇编语言的基本语法</p><p><strong>03 存储器映像、中断源与硬件最小系统</strong></p><p>3.1 STM32L系列MCU概述<br>3.2 STM32L4的引脚图与硬件最小系统<br>3.3 由MCU构建通用嵌入式计算机</p><p><strong>04 GPIO及程序框架</strong></p><p>4.1 GPIO通用基础知识<br>4.2 软件干预硬件的方法<br>4.3 认识工程框架<br>4.4 GPIO构件的制作过程<br>4.5 第一个汇编语言工程:控制小灯闪烁<br>4.6 实验一 熟悉实验开发环境及GPIO编程</p><p><strong>05 嵌入式硬件构件与底层驱动构件基本规范</strong></p><p>5.1 嵌入式硬件构件<br>5.2 嵌入式底层驱动构件的概念与层次模型<br>5.3 底层驱动构件的封装规范<br>5.4 硬件构件及其驱动构件的复用与移植方法</p><p><strong>06 串行通信模块及第一个中断程序结构</strong></p><p>6.1 异步串行通信的通用基础知识<br>6.2 基于构件的串行通信编程方法<br>6.3 UART构件的制作过程<br>6.4 中断机制及中断编程步骤<br>6.5 实验二 串口通信及中断实验</p><p><strong>07 定时器相关模块</strong></p><p>7.1 定时器通用基础知识<br>7.2 STM32L431中的定时器<br>7.3 脉宽调制<br>7.4 输入捕捉与输出比较<br>7.5 实验三 定时器及PWM实验</p><p><strong>08 Flash在线编程、ADC与DAC  </strong></p><p>8.1 Flash在线编程  <br>8.2 ADC<br>8.3 DAC<br>8.4 实验四 ADC实验</p><p><strong>09&nbsp;SPI、I2C与TSC模块  </strong></p><p>9.1 串行外设接口SPI模块  <br>9.2 集成电路互联总线I2C模块<br>9.3 触摸感应控制器TSC模块<br>9.4 实验五 SPI通信实验</p><p><strong>10 CAN总线、DMA与位带操作</strong>  </p><p>10.1 CAN总线<br>10.2 DMA<br>10.3 位带操作</p><p><strong>11 系统时钟与其他功能模块</strong>  </p><p>11.1 时钟系统<br>11.2 复位模块与看门狗模块<br>11.3 电源控制模块与CRC校验模块<br>11.4 实验六 综合实验</p><p><strong>12 应用案例  </strong></p><p>12.1 嵌入式系统稳定性问题<br>12.2 外接传感器及执行部件的编程方法<br>12.3 实时操作系统的简明实例<br>12.4 嵌入式人工智能的简明实例<br>12.5 NB-IoT的应用简介<br>12.6 4G、Cat1、Wi-Fi及WSN的应用</p><h3><strong>05 预备知识</strong></h3><p>必须具备以下知识:</p><ul><li>计算机硬件基础(或模拟电路与数字电路、计算机组成、汇编语言、微机原理)</li><li>高级程序语言设计等(如C语言)</li></ul><p>学生通过学习上述课程,基本掌握构成计算机的基本部件原理,掌握计算机高级程序设计方法,为从寄存器级理解软件干预硬件提供基础。</p>
                                                    ]]></description>
            <pubDate>Wed, 22 Feb 2023 16:48:47 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385950</guid>
            <link>https://aijishu.com/a/1060000000385950</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】2023年元宵50本《嵌入式系统设计》赠书名单公布]]></title>
            <description><![CDATA[<p>2023年元宵节,极术社区联合安谋科技组织了<a href="https://aijishu.com/e/1120000000381671">【元宵赠书】50本《嵌入式系统设计—基于Cortex-M处理器与RTOS构建》新书免费领</a>,获得了很多工程师的支持。下面将中奖名单公布如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLPU" alt="1675672651957.jpg" title="1675672651957.jpg"></p><p>恭喜上面的中奖者,极术读书工作人员稍后将会发送邮件给中奖人员,请注意查收邮件。没有中奖的用户也不用灰心,极术读书会定期组织精选好书的活动,欢迎关注。</p>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000383140</guid>
            <link>https://aijishu.com/a/1060000000383140</link>
        </item>
        <item>
            <title><![CDATA[9位院士12位专家联合撰文:智能计算的新进展、挑战与未来 | Science合作期刊]]></title>
            <description><![CDATA[<blockquote>文章作者:允中  <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2Fd7PpTEHjfH33fVRTsOaucg" target="blank">量子位</a></blockquote><p>2023年1月3日,海内外9位院士及12位专家在Science《科学》合作期刊Intelligent Computing发表长篇综述论文《智能计算的最新进展、挑战和未来》。文章全面阐述了智能计算的理论基础、智能与计算的技术融合、重要应用、重大挑战和未来前景,将为学术界和工业界的相关研究人员提供全方位的参考和对智能计算领域的指引性见解。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKa" alt="image.png" title="image.png"></p><p>论文地址:<a href="https://aijishu.com/link?target=https%3A%2F%2Fspj.science.org%2Fdoi%2F10.34133%2Ficomputing.0006" target="blank">https://spj.science.org/doi/10.34133/icomputing.0006</a></p><h2>简介</h2><p>人类社会正从信息社会进入智能社会,计算已成为推动社会发展的关键要素。在万物互联的数字文明新时代,传统的基于数据的计算已经远远不能满足人类对更高智能水平的追求。</p><p>近年来,计算和信息技术飞速发展,深度学习的空前普及和成功将人工智能(AI)确立为人类探索机器智能的前沿领域。自此产生了一系列突破性的研究成果,包括Yann LeCun提出的卷积神经网络和Yoshua Bengio在深度学习因果推理领域的成果。</p><p>2016年3月,DeepMind推出的AI围棋程序<strong>AlphaGo</strong>与世界顶尖围棋高手李世石对战,在世界范围内引起了前所未有的关注。这场划时代的人机大战以AI的压倒性胜利而告终,成为将AI浪潮推向全新高度的催化剂。</p><p>AI的另一个重要推动者是<strong>大型预训练模型的出现</strong>,这些模型已经开始广泛应用于自然语言和图像处理,以在迁移学习的帮助下处理各种各样的应用。其中最具代表性的是自然语言处理模型GPT-3,已经证明具有高度结构复杂性和大量参数的大模型可以提高深度学习的性能。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKb" alt="image.png" title="image.png"></p><p>计算能力是支撑智能计算的重要因素之一。面对信息社会中庞大的数据源、异构的硬件配置和不断变化的计算需求,智能计算主要通过<strong>垂直和水平</strong>架构来满足智能任务的计算能力要求。</p><p><strong>垂直架构</strong>的特点是同质化的计算基础设施,主要通过应用智能方法提高资源利用效率来提升计算能力。</p><p>相比之下,<strong>水平架构</strong>对异构和广域计算资源进行协调和调度,使协作计算的效果最大化。例如,2020年4月,针对全球COVID-19研究的计算需求,Folding@home在三周内联合40万名计算志愿者,实现了2.5Exaflops的计算量,超过了世界上任何一台超级计算机。</p><p>尽管在智能和计算方面取得了巨大成功,但我们在这两个领域仍然面临着一些重大挑战:</p><p><strong>智能方面的挑战。</strong></p><p>使用深度学习的AI目前在可解释性、通用性、可进化性和自主性方面面临着重大挑战。与人类智能相比,当前大多数AI技术的作用都很弱,而且只能在特定领域或任务中发挥良好作用。从基于数据的智能升级到更多样化的智能,包括感知智能、认知智能、自主智能和人机融合智能等,也面临着重大的理论和技术挑战。</p><p><strong>计算方面的挑战。</strong></p><p>数字化浪潮带来了应用、连接、终端、用户以及数据量前所未有的增长,所有这些都需要巨大的计算能力。满足如此快速增长的计算能力需求变得越来越具有挑战性。智能社会中的巨型任务依赖于各种特定计算资源的高效组合。此外,传统的硬件模式不能很好地适应智能算法,制约了软件的发展。</p><p>迄今为止,智能计算还没有一个被普遍接受的定义。考虑到世界的三个基本空间,即人类社会空间、物理空间和信息空间日益紧密融合,我们从解决复杂的科学和社会问题的角度提出了智能计算的新定义:</p><blockquote><strong>智能计算是支撑万物互联的数字文明时代新的计算理论方法、架构体系和技术能力的总称。智能计算根据具体的实际需求,以最小的代价完成计算任务,匹配足够的计算能力,调用最好的算法,获得最优的结果。</strong></blockquote><p>智能计算的新定义是为响应人类社会、物理世界和信息空间三元融合快速增长的计算需求而提出的。智能计算以人为本,追求高计算能力、高能效、智能和安全。其目标是提供通用、高效、安全、自主、可靠、透明的计算服务,以支持大规模、复杂的计算任务。图1为智能计算的整体理论框架,它体现了支持人类社会—物理世界—信息空间集成的多种计算范式。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKc" alt="image.png" title="image.png"></p><h2>智能计算基础</h2><p>智能计算是数字文明时代支撑万物互联的新型计算理论方法、架构体系和技术能力的总称。利用智能计算可以实现许多经典和前沿研究领域的创新,以解决复杂的科学和社会问题。智能计算的基本要素包括人的智能、机器的能力以及由万物组成的物理世界。</p><p>在理论框架中,人是智能计算的核心和智慧的源泉,代表着原始的、与生俱来的智能,称为<strong>元智能</strong>。</p><p>元智能包括理解、表达、抽象、推理、创造和反思等人类高级能力,其中包含人类积累的知识。元智能以碳基生命为载体,是由个体和生物群体经过百万年的进化产生的,它包括生物具身智能、脑智能(尤其是人脑)和群体智能。所有的智能系统都是由人类设计和建造的。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKd" alt="image.png" title="image.png"></p><p>因此,在智能计算的理论体系中,人类的智慧是智能的源泉,计算机是人类智能的赋能。我们称计算机的智能为<strong>通用智能</strong>。</p><p>通用智能代表计算机解决具有广泛外延的复杂问题的能力,以硅基设施为载体,由个体和群体计算设备产生。生物智能可以在以下四个层次上移植到计算机上:数据智能、感知智能、认知智能和自主智能。元智能和通用智能如图2所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKe" alt="image.png" title="image.png"></p><p>智能计算面临大场景、大数据、大问题、泛在需求的挑战。算法模型变得越来越复杂,需要超级计算能力来支持越来越大的模型训练。目前,计算资源已经成为提高计算机智能研究水平的障碍。随着智能算法的发展,拥有丰富计算资源的机构可能形成系统的技术垄断。经典的超级计算机已经难以满足AI对计算能力的需求。</p><p>虽然通过算法优化可以在一定程度上降低算力需求,但并不能从根本上解决这个问题。需要从架构、加速模块、集成模式、软件栈等多个维度进行全面优化,如图3所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKf" alt="image.png" title="image.png"></p><p>智能计算在理论技术上具有以下特点(图4):理论技术上的自学习和可进化性,架构上的高计算能力和高能效,系统方法上的安全性和可靠性,运行机制上的自动化和精确性,以及服务性上的协作和泛在性。智能计算包括两个本质方面:<strong>智能和计算,两者相辅相成</strong>。</p><p>智能促进了计算技术的发展,计算是智能的基础。提高计算系统性能和效率的高级智能技术范式是<strong>“智能驱动的计算”</strong>。支持计算机智能发展的高效、强大的计算技术范式是<strong>“面向智能的计算”</strong>。</p><p>两种基本范式从五个方面进行创新,提升计算能力、能源效率、数据使用、知识表达和算法能力,实现泛在、透明、可靠、实时、自动化的服务。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKg" alt="image.png" title="image.png"></p><h2>智能驱动的计算</h2><p>提高计算的普适性对智能计算至关重要。现实场景中的问题,例如模拟、图(gragh)(图5)等,需要进行各种计算。智能计算的另一个关键点是如何提高计算的智能化水平。从经验上来说,我们常常需要向自然界的智能生物学习,计算也不例外,例如三大经典智能方法:人工神经网络(图6)、模糊系统和进化计算,都是受生物智能启发提出的算法。智能计算理论包括但不限于以上几种计算,以实现高度的泛在化和智能化。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKh" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKi" alt="image.png" title="image.png"></p><p>智能系统在开始工作之前,首先要进行<strong>智能感知</strong>。因此,感知智能在所有智能系统中都起着至关重要的作用。感知智能的重点是多模态感知、数据融合、智能信号提取和处理。</p><p>典型的例子包括智慧城市管理、自动潜水系统、智能防御系统和自主机器人。感知智能研究中最热门的领域是模拟人类的五种感觉能力,视觉、听觉、嗅觉、味觉和触觉。</p><p>此外,智能传感还包括温度、压力、湿度、高度、速度、重力等,需要大量的计算或数据训练来提高其性能。</p><p>近年来,随着模式识别和深度学习技术的全面应用,机器的感知智能已经超过人类,在语音、视觉和触觉识别方面取得了重大进展。由于其日益增长的重要性和日益拓宽的应用领域,智能传感器受到了广泛关注。如图7所示,智能传感器具有各种形式以满足不同应用的需求,并且更新更好的型号正在被不断的开发出来。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKj" alt="image.png" title="image.png"></p><p><strong>认知智能</strong>是指机器具有像人一样的逻辑理解和认知能力,特别是思考、理解、总结和主动应用知识的能力。它描述了智能体在真实环境中处理复杂事实和情况的能力。</p><p>数据识别是感知智能的核心功能,需要对图像、视频、声音等各类数据进行大规模的数据采集和特征提取,完成结构化处理。相比之下,认知智能需要理解数据元素之间的关系,分析结构化数据中的逻辑,并根据提炼出的知识做出响应。</p><p>认知智能计算主要研究机器的自然语言处理、因果推理和知识推理(图8)等领域。通过对人脑的神经生物学过程和认知机制的启发式研究,可以提高机器的认知水平,以使其获得帮助、理解、决策、洞察和发现的能力。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKk" alt="image.png" title="image.png"></p><p>驱动机器从被动输出到主动创造有两个关键要素:强泛化模型和与外部环境的持续交互。<strong>自主智能</strong>的发展路径从学习单一任务开始,举一反三,逐步达到与环境动态交互的主动学习,最终实现自我进化的高级智能。当前可以通过迁移学习、元学习和自主学习等技术寻找生成自主智能的可行路径。</p><p>尽管在智能的四个层面上(数据智能,感知智能,认知智能,自主智能)取得了重大进展,但目前仅通过计算/统计模型还难以从极其复杂的场景中实现完全的智能。</p><p>在这些场景中,人类应该继续在解决问题和决策中发挥不可或缺的作用,来探索人类认知过程中涉及的要素,并将其与机器智能相结合。下一步,将聚焦于人机交互、人机融合和脑机接口等技术。</p><h2>面向智能的计算</h2><p>AI的发现不断涌现,这在很大程度上归功于不断增长的计算能力。AI的快速变化是由新思想或革命性理论推动的。通常,最新的先进模型仅依赖于更大的神经网络和更强大的处理系统。</p><p>Open AI研究人员在2018年进行了一项研究,追踪基于计算能力的最大模型的增长情况。利用AI研究史上训练的一些最著名的AI模型所需的计算量,他们发现了计算资源快速增长的两个趋势。</p><p><strong>开发突破性模型所需的计算能力的增长速度与摩尔定律大致相同</strong>,即在2012年之前,单个微芯片的计算能力往往每两年翻一番。但图像识别系统AlexNet在2012年发布时引起了人们的新兴趣。AlexNet的引入刺激了顶级模型的计算需求急剧增加,从2012年到2018年,这种需求每3到4个月翻一番,如图9所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKl" alt="image.png" title="image.png"></p><p>当摩尔定律失效时,超大算力主要依赖于海量计算、内存和存储资源的并行叠加。</p><p>例如,“高性能计算”是指将大量计算机快速联网成一个“集群”以进行密集计算的做法,使用户能够比传统计算机更快地处理大量数据,从而获得更深入的洞察力和竞争优势。</p><p>此外,得益于云计算(图10),用户现在可以选择增加其高性能计算程序的容量,从而继续提高算力。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKn" alt="image.png" title="image.png"></p><p>推进智能计算架构创新的目标包括更高效的能源管理、更低的功耗、更便宜的总芯片成本以及更快速的错误检测和纠正。当涉及某些无法在CPU上执行的AI操作时,AI加速器可能会大大减少训练和执行时间。</p><p>在短期内,所使用加速器的架构专业化将是保持计算能力增长的最佳方式,如图11所示为已公开发布的AI加速器和处理器的峰值性能与功耗。</p><p>另外,<strong>内存计算</strong>(图12)是一个非常有效的方案,它能够使内存单元执行原始逻辑操作,因此它们可以在不需要与处理器交互的情况下进行计算,这是内存和处理器之间不断扩大速度差距的主要原因。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKo" alt="image.png" title="image.png"></p><p><strong>复杂性</strong>是传统计算机进一步突破的瓶颈。当今高度复杂的AI模型(例如深度神经网络)在边缘设备中仍然难以实现普遍使用。这是由于运行这些模型的高级GPU和加速器存在功率和带宽紧缩的缺陷,导致处理时间长并且架构设计繁琐。</p><p>由于这些问题,研究人员开始创造新的计算模式,主要包括:</p><p><strong>量子计算</strong>(图13),因为其具有纠缠或其他非经典相关性带来的量子优势,可以在许多复杂的计算问题中实现指数速度;</p><p><strong>神经形态计算</strong>(图14)的构造和操作受到大脑中神经元和突触的启发,因其能源效率高而非常适合计算,神经形态计算是事件驱动和高度并行化的,这意味着只有小部分系统同时工作,所以消耗的功率非常小;</p><p><strong>光子计算</strong>(图15)与电神经网络相比具有许多优势,包括超高带宽、快速计算速度和高并行性,所有这些都是通过使用光子硬件加速来计算复杂的矩阵向量乘法来实现的;</p><p><strong>生物计算</strong>(图16)是利用生物系统固有的信息处理机制发展起来的一种新的计算模型,主要包括蛋白质计算机、RNA计算机和DNA计算机,具有并行和分布式计算能力强、功耗低的优势。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKp" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKr" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKs" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKt" alt="image.png" title="image.png"></p><h2>智能计算的应用</h2><p>如果要跟上当前科学的快速发展,就必须不断的进行革新。现在正在进行的计算机革命的融合将以前所未有的方式极大地推动科学发现的进步。</p><p>几十年来,<strong>计算材料</strong>(图17)已成为研究材料特性和设计新材料的有力手段。然而,由于材料和材料行为的复杂性,它们的应用面临许多挑战,包括缺乏许多原子、离子以及原子和离子相互作用的力场和电位,分子动力学模拟中的不同热力学相,以及优化材料成分和工艺参数的巨大搜索空间。作为一种新的研究范式,AI集成到计算材料中是对传统计算材料的革命,并且已经在多长度、多时间尺度、多物理场耦合计算方面取得了巨大成功。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKu" alt="image.png" title="image.png"></p><p>作为最古老的观测科学之一,<strong>天文学</strong>在历史上收集了大量数据。由于望远镜技术的突破,收集到的数据爆炸性增长。天文学和天体物理学领域的特点是拥有丰富的数据和各种大口径的地面望远镜,例如即将推出的大型巡天望远镜和天基望远镜。使用高分辨率相机和相关工具,数据收集现在更加高效,并且在很大程度上实现了自动化,必须进行更高效的数据分析。因此,需要智能计算技术来解释和评估数据集。</p><p><strong>药物设计</strong>同样受益于AI(图18),AI可以帮助科学家建立蛋白质的3D结构、模拟药物和蛋白质之间的化学反应以及预测药物的功效。在药理学中,AI可以用于创建靶向化合物和多靶点药物。利用AI还可以设计合成路线、预测反应产率并了解化学合成背后的机制。AI让重新利用现有药物来治疗新的治疗目标变得更加容易。此外,AI对于识别不良反应、测定生物活性和获得药物筛选结果至关重要。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKv" alt="image.png" title="image.png"></p><p>随着大数据和AI技术使用的增长,<strong>作物育种</strong>开始进行融合与突破(图19)。AI技术可以支持服务的创建、模型的识别以及农业食品应用和供应链阶段的决策过程。AI在农业中的主要目标是准确预测结果并提高产量,同时最大限度地减少资源使用。因此,AI工具提供的算法可以评估产量,预测难以预见的问题或事件以及发生趋势。从种植到收获再到销售,AI促进了整个农业价值链。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKw" alt="image.png" title="image.png"></p><p>智能计算加速转型变革,导致经济和社会秩序的转变。由于技术进步,商品和劳动力市场正在发生巨大变化,<strong>数字社会</strong>正在逐渐形成(图20)。AI应该成为数字经济中每一个数据驱动战略的核心,包括工业4.0。例如,人工智能可以应用于预测性维护。预测性维护包括涉及通用设备或生产机械的维护,并使用来自生产线或运营线的传感器数据帮助降低运营费用或停机时间。</p><p>另外。AI可以应用于城市治理,通过开发新的策略和方法,使城市更智能。智慧城市治理旨在利用最先进的信息技术同步数据、程序、权限等,造福城市居民,主要包含四个方面:</p><blockquote>智慧决策、智慧城市治理、智慧行政和智慧城市合作。</blockquote><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKx" alt="image.png" title="image.png"></p><h2>展望</h2><p>从新兴产业生态的角度来看,智能计算产业仍面临着一系列挑战,决定着其未来发展。</p><p><strong>第一,与传统计算理论相比,智能计算是语言和生物学驱动的计算范式的应用和发展。</strong></p><p>这意味着机器可以根据不同的场景模仿人脑解决问题和决策的能力。然而,硅基和碳基运算的底层逻辑存在根本差异,大脑智能的机制仍有待进一步探索。智能计算的下一步是通过深入探索类人智能的基本要素,其在宏观层面的相互作用机制以及在微观层面上支持不确定性生成的计算理论,进行彻底的改革。</p><p><strong>第二,探索人类如何学习并将其应用到AI的研究中具有重要意义。</strong></p><p>知识驱动的机器智能可以从人类活动中学习,模仿人脑的决策能力,使机器能够像人一样感知、识别、思考、学习和协作。需要探索多知识驱动的知识推理和持续学习的理论和关键技术,使智能系统具有类人的学习、感知、表示和决策能力,促进智能计算从数据驱动向知识驱动演进。</p><p><strong>第三,软硬件适配面临着巨大的挑战,如精度损失、调用困难、协作效率低下等。</strong></p><p>未来,计算机必须突破冯·诺依曼体系结构下固定的输入和处理范式,大力发展交叉学科的智能计算和仿生学。在算法层面进行设计,突破现有架构的局限,以更低的计算和硬件设计成本尝试更灵活、更人性化的数据处理方式。此外,开发高性能、低能耗的新型组件设计方案,提高软件和硬件的计算能力和效率,以满足快速增长的需求和智能计算应用也很重要。</p><p><strong>第四,智能计算的理论技术架构是一个复杂的系统,具有多个与其他学科相互作用的子系统。</strong></p><p>系统中的各种硬件需要更复杂的系统设计,更好的优化技术,以及系统调优的更大成本。高维计算理论复杂性的缺乏是大规模计算系统面临的主要挑战。</p><h2>结论</h2><p>当前,我们正迎来<strong>人类发展的第四次浪潮</strong>,正处于从信息社会向<strong>人类社会-物理世界-信息空间</strong>融合的智能社会的关键转型期。在这种转变中,计算技术正在经历变革,甚至是颠覆性的变化。</p><p>智能计算被认为是未来计算的发展方向,不仅是面向智能的计算,而且是智能赋能的计算。它将提供通用、高效、安全、自主、可靠和透明的计算服务,以支持当今智能社会中大规模和复杂的计算任务。</p><p>本文全面回顾了智能计算的理论基础、智能与计算的技术融合、重要应用、挑战和未来方向。</p><p>我们希望这篇综述能为研究人员和从业者提供一个很好的参考,并促进未来智能计算领域的理论和技术创新。</p><blockquote>文章作者:允中  <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2Fd7PpTEHjfH33fVRTsOaucg" target="blank">量子位</a></blockquote><blockquote>更多FPGA干货请关注<a href="https://aijishu.com/blog/readings">极术读书</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000382786</guid>
            <link>https://aijishu.com/a/1060000000382786</link>
        </item>
        <item>
            <title><![CDATA[招募 | 基于Arm MCU数字控制系统的低代码开发方面的技术专著翻译合作]]></title>
            <description><![CDATA[<p>兔年伊始,机械工业出版社又来邀请各位技术专家合作翻译Arm相关国外技术专著啦,欢迎大家关注联系~</p><h2>关于书籍《Embedded Digital Control with Microcontrollers: Implementation with C and Python (IEEE Press) 》</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLto" alt="image.png" title="image.png"></p><p>《Embedded Digital Control with Microcontrollers: Implementation with C and Python (IEEE Press)》是关于Arm MCU数控系统低代码开发的参考书,图书介绍了简洁实用的微控制器数字控制系统实现方法和理论。</p><p>图书作者通过三个阶段的介绍,让读者更好得来进行学习。</p><ul><li>首先,图书描述了如何通过 Python 编程语言实现原型数字控制系统,以帮助读者更好地理解理论数字控制概念。</li><li>其次,本书为读者提供了使用 C 编程语言在实际微控制器上实现数字控制系统的指导。这将使读者能够解决涉及数字控制、机器人和机电一体化的现实问题。</li><li>最后,读者将学习如何通过在实际应用中实施数字控制系统,将书中讨论的理论问题与实践问题结合起来。在整本书中,使用 Python 编程语言的数字控制系统的应用确保读者可以应用其中包含的理论。</li></ul><p>书籍链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.amazon.com%2FEmbedded-Digital-Control-Microcontrollers-Implementation%2Fdp%2F1119576520%2Fref%3Dsr_1_1%3Fkeywords%3D9781119576525%26qid%3D1675070337%26s%3Dbooks%26sr%3D1-1" target="blank">https://www.amazon.com/Embedded-Digital-Control-Microcontrollers-Implementation/dp/1119576520/ref=sr_1_1?keywords=9781119576525&amp;qid=1675070337&amp;s=books&amp;sr=1-1</a></p><h2>翻译合作招募</h2><p>如果有对Arm嵌入式技术感兴趣的,并且有嵌入式编程经验的,专业和英语都不错的工程师们,欢迎联系翻译合作,具体合作细节可和负责人详细沟通。</p><p>联系人:<strong>机工社朱经理</strong><br>微信号:<strong>jack1967_zhu</strong>,添加微信请备注“Arm”<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbupq" alt="image.png" title="image.png"><br>扫一扫添加微信沟通翻译合作</p>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000381770</guid>
            <link>https://aijishu.com/a/1060000000381770</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】2023年元旦50本《Arm64体系架构编程与实践》赠书名单公布]]></title>
            <description><![CDATA[<p>为了感谢大家对极术社区的支持,2023年元旦极术社区微信服务号联合安谋科技学堂微信号组织了<a href="https://aijishu.com/e/1120000000376650">50本《Arm64体系架构编程与实践》的赠书活动</a>,近一千人参与了抽奖活动,抽奖名单已有微信抽奖助手自动公布,截图如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbKzy" alt="image.png" title="image.png"></p><p>恭喜以上中奖者,请私信兑奖码,极术社区微信号截图以及安谋科技微信号截图给极术小姐姐,如活动中未关注或者已取关的中奖用户不予兑换。</p><p>感谢大家的支持,更多读书活动请关注极术读书栏目:<a href="https://aijishu.com/books">https://aijishu.com/books</a></p>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000378287</guid>
            <link>https://aijishu.com/a/1060000000378287</link>
        </item>
        <item>
            <title><![CDATA[学习STM32/GD32开发设计,推荐《嵌入式系统设计—基于Cortex-M处理器与RTOS构建》]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>。</blockquote><p>本期极术社区推荐的是由杭州电子科技大学曾毓和黄继业老师编写,清华大学出版社出版的新书《嵌入式系统设计——基于Cortex-M处理器与RTOS构建》。该书系统介绍了基于ARM Cortex-M体系的嵌入式系统设计,同时配套有STM32芯片和GD32芯片的开发板,让工程师可以同时掌握两种芯片的开发及设计。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbKyC" alt="image.png" title="image.png"></p><h2>内容简介</h2><p>全书系统介绍了基于ARM Cortex-M体系的嵌入式系统设计,将微控制器技术、RTOS概念、传感器应用、编程技巧和实用方法与实际工程开发技术在STM32F407/GD32F407硬件平台上很好地结合起来,使读者通过本书的学习能迅速了解并掌握基于STM32/GD32的嵌入式系统设计方法和工程开发实用技术,为后续的深入学习和发展打下坚实的理论与实践基础。</p><h2>书籍特色</h2><ul><li><strong>紧跟嵌入式技术发展</strong>,基于图形化配置工具的和多任务系统设计视角介绍嵌入式系统应用设计流程。</li><li><strong>主要内容基于业内流行的FreeRTOS嵌入式实时系统</strong>,多实例演示RTOS的任务管理、优先级、信号、消息和任务通知等基础概念应用方法。</li><li><strong>应用示例丰富实用</strong>,操作讲解详实易懂,所有示例都通过了配套嵌入式平台的硬件验证,有较高的工程实践参考性。</li><li><strong>详实的嵌入式鸿蒙系统移植教程</strong>,涵盖环境搭建和工程创建、移植、编译下载过程完整步骤,帮你从零开始鸿蒙嵌入式应用开发。</li><li><strong>全书使用工具软件皆为免费、开源或作者自制软件</strong>,配套实验板资料全部开放,板载MCU器件也都可用国产MCU替代,可极大降低教学和学习成本。</li></ul><h2>配套开发板介绍</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbKyE" alt="image.png" title="image.png"><br>配套HX32F4学习板主要特点:</p><ul><li>核心芯片选用基于Cortex-M4内核的主流高性能MCU,型号STM32F407VET6/VGT6。(HX32F4的国产版本选用引脚兼容的GD32F407VET6或GD32F470VET6)</li><li>板载DAP下载调试器,仅需一根TYPE-C接口就能完成供电,下载,调试,串口调试。</li><li>板载嵌入式学习基础资源包括:8个LED、6个独立按键、4位数码管、无源蜂鸣器、麦克风、电容触摸按键,外接16MB SPI FLASH。</li><li>板载外设接口包括:3.5mm音频输出、ADC、DAC、CAN接口、ESP8266模块接口、HC05蓝牙接口、IIC接口、单总线模块接口、SD卡接口、以太网接口、USB Host和USB Device接口。</li><li>板上还提供15x2扩展接口,可直插2.4寸LCD触摸液晶屏或作为外设扩展接口,涵盖USART、SPI、IIC、ADC、DAC、定时器等外设引脚,方便进行其他的扩展实验。</li><li>原理图和PCB资料全部开放,开源地址:<a href="https://aijishu.com/link?target=https%3A%2F%2Fgitee.com%2Fzalileo%2FHX32F4-Board" target="blank">https://gitee.com/zalileo/HX32F4-Board</a></li></ul><h2>书籍目录</h2><ul><li><p>第1章 基于Cortex-M的嵌入式系统概述</p><ul><li>1.1 嵌入式系统基本概念</li><li>1.2 ARM Cortex体系结构</li><li>1.3 ARM Cortex-M各系列特点</li><li>1.4 STM32F407结构简介</li><li>1.5 实时操作系统RTOS简介</li><li>1.6 嵌入式系统在物联网中的发展</li></ul></li><li><p>第2章 Cortex-M嵌入式硬件平台</p><ul><li>2.1 硬件平台简介</li><li>2.2 主要器件</li><li>2.3 主要功能模块</li></ul></li><li><p>第3章 嵌入式开发工具与设计流程</p><ul><li>3.1 STM32开发工具</li><li><p>3.2 ARM Keil MDK工具</p><ul><li>3.3 STM32CubeMX使用方法</li><li>3.3.1 STM32Cube简介</li><li>3.3.2 STM32CubeMX软件安装</li></ul></li><li><p>3.4    基于HAL库的程序设计流程</p><ul><li>3.4.1 STM32 HAL介绍</li><li>3.4.2 CubeMX工程创建流程</li></ul></li><li>3.5 第一个LED点灯程序</li><li>实验1 按键扫描与流水灯设计</li></ul></li><li><p>第4章 FreeRTOS操作系统</p><ul><li>4.1 FreeRTOS系统简介</li><li>4.2 FreeRTOS系统移植</li><li><p>4.3 多任务系统基本概念</p><ul><li>4.3.1 任务及任务管理</li><li>4.3.2 优先级</li><li>4.3.3 消息队列</li><li>4.3.4 信号量</li><li>4.3.5 互斥量</li><li>4.3.6 事件</li><li>4.3.7 任务通知</li><li>4.3.8 内存管理</li></ul></li><li><p>4.4 创建第一个RTOS工程</p><ul><li>4.4.1 CubeMX工程配置</li><li>4.4.2 导出MDK工程</li><li>4.4.3 编写功能代码</li></ul></li><li>实验2 多任务键盘与流水灯实验</li></ul></li><li><p>第5章 简单外设应用</p><ul><li>5.1 数码管应用</li><li>5.2 按键与外部中断</li><li><p>5.3 麦克风与ADC应用</p><ul><li>5.3.1 添加串口打印输出</li><li>5.3.2 ADC模块介绍</li><li>5.3.3 麦克风AD采样示例</li></ul></li><li>5.4 单总线温湿度传感器应用</li><li>5.5 IIC接口陀螺仪传感器应用</li><li>实验3 声控延时亮灯实验</li><li>实验4 温度报警与倾角检测实验</li></ul></li><li><p>第6章 串口通信应用</p><ul><li>6.1 学习板虚拟串口概述</li><li>6.2 轮询接收方式串口通信</li><li><p>6.3 中断接收方式串口通信</p><ul><li>6.3.1 串口接收中断示例</li><li>6.3.2 DMA空闲中断示例</li><li>6.3.3 流水灯串口通信应用</li></ul></li><li>6.4    使用SWO调试</li></ul></li><li>实验5 简单串口通信实验</li><li>实验6 数据采集与串口通信实验</li><li><p>第7章 无线通信应用</p><ul><li><p>7.1 蓝牙HC05通信模块介绍</p><ul><li>7.1.1 HC05蓝牙模块用法介绍</li><li>7.1.2 HC05蓝牙模块AT指令介绍</li></ul></li><li>7.2 蓝牙通信实践</li><li><p>7.3 ESP8266WiFi通信模块介绍</p><ul><li>7.3.1 ESP01模块用法介绍</li><li>7.3.2 ESP01模块AT指令介绍</li></ul></li><li>7.4 WIFI通信实践</li><li><p>7.5    物联网连接应用实践</p><ul><li>7.5.1 创建OneNET平台设备</li><li>7.5.2 连接OneNET平台</li></ul></li><li>实验7 蓝牙手机遥控实验</li><li>实验8 数据采集及Wifi通信实验</li></ul></li><li><p>第8章     GUI显示应用</p><ul><li><p>8.1 OLED应用介绍</p><ul><li>8.1.1 单色IIC接口OLED介绍</li><li>8.1.2 OLED显示屏驱动程序介绍</li><li>8.1.3 GUISlim图形库介绍</li><li>8.1.4 汉字点阵文件介绍</li></ul></li><li>8.2 OLED应用实践</li><li>8.3 MCU接口LCD介绍</li><li><p>8.4 LCD应用实践</p><ul><li>8.4.1 emWin图形库介绍</li><li>8.4.2 FSMC总线配置</li><li>8.4.3 LCD屏驱动移植接口</li><li><p>8.4.4 GUI应用设计</p><ul><li>实验9 OLED显示屏数据曲线绘制实验</li></ul></li></ul></li><li>实验10 LCD液晶屏GUI设计实验</li></ul></li><li><p>第9章 定时器应用</p><ul><li><p>9.1 STM32F4定时器介绍</p><ul><li>9.1.1 常规定时器</li><li>9.1.2 HAL库定时器模块设计方法</li><li>9.1.3 定时器基本概念介绍</li></ul></li><li>9.2 定时器基本功能应用</li><li>9.3 PWM输出应用</li><li>9.4 信号捕捉应用</li><li>9.5 外部脉冲计数应用</li><li>实验11 简易闹铃设计实验</li><li>实验12 呼吸灯设计实验</li><li>实验13 简易频率计设计实验</li><li>实验14 简单录音机设计实验</li></ul></li><li><p>第10章 RTC与低功耗应用</p><ul><li>10.1 RTC实时时钟应用</li><li>10.2 STM32低功耗模式介绍</li><li>10.3 STM32低功耗应用</li><li>实验15 基于RTC的电子钟设计</li><li>实验16 低功耗待机与唤醒实验</li></ul></li><li><p>第11章 FatFs文件系统应用</p><ul><li>11.1 FatFs介绍</li><li><p>11.2 SPI FLASH应用实践</p><ul><li>11.2.1 添加配置SPI外设</li><li>11.2.2 添加SPI FLASH驱动</li><li>11.2.3 SPI FLASH直接读写操作实践</li><li>11.2.4 SPI FLASH文件读写操作实践</li></ul></li><li><p>11.3 SD卡应用实践</p><ul><li>11.3.1 添加配置SDIO外设</li><li>11.3.2 SD卡文件读写操作实践</li></ul></li><li><p>11.4 U盘挂载应用实践</p><ul><li>11.4.1 添加配置USB HOST组件</li><li>11.4.2 U盘文件读写操作实践</li></ul></li><li>实验17 数据存储实验</li><li>实验18 文件传输实验</li></ul></li><li><p>第12章 STM32 IAP程序设计</p><ul><li>12.1 STM32 IAP概念介绍</li><li>12.2 STM32内部FLASH介绍</li><li>12.3 STM32内部FLASH读写实践</li><li>12.4 程序跳转应用实践</li><li>12.5 IAP程序设计实践</li><li>实验19 串口IAP设计实验</li><li>实验20 U盘IAP设计实验</li></ul></li><li><p>第13章 鸿蒙嵌入式系统移植</p><ul><li><p>13.1 OpenHarmony介绍</p><ul><li>13.1.1 LiteOS-M内核简介</li><li>13.1.2 开发环境配置</li></ul></li><li><p>13.2 OpenHarmony系统移植</p><ul><li>13.2.1 创建裸机工程</li><li>13.2.2 系统编译构建移植</li><li>13.2.3 系统启动过程适配</li><li>13.2.4 编译及烧录</li></ul></li><li><p>13.3 OpenHarmony应用开发示例</p><ul><li>13.3.1 hello world示例</li><li>13.3.2 流水灯示例</li></ul></li><li>实验21 OpenHarmony系统移植实验</li></ul></li></ul><h2>作者介绍</h2><p>本书适用对象:电子、计算机类相关专业的高等院校本专科学生。<br>本书适用课程:单片机、嵌入式实践和电子系统综合设计等相关实践课程。</p><h2>书籍购买</h2><p>书籍购买链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13603919.html" target="blank">https://item.jd.com/13603919.html</a></p><p>相关课件及教学资料下载:<a href="https://aijishu.com/link?target=https%3A%2F%2Fgitee.com%2Fzalileo%2FHX32F4-Board" target="blank">https://gitee.com/zalileo/HX32F4-Board</a>,书籍课件在其下的“07 相关资料”目录中,书籍实验示例工程在其下的“05 学习板配套教材示例代码”目录中,如有下载问题,可联系邮箱:<a href="https://aijishu.com/link?target=mailto%3Azyu20%40hdu.edu.cn" target="blank">zyu20@hdu.edu.cn</a></p><p>老师可以免费申请该书籍,申请链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fdocs.qq.com%2Fform%2Fpage%2FDYkNBY2hVWGVvdG1v%23%2Ffill" target="blank">https://docs.qq.com/form/page/DYkNBY2hVWGVvdG1v#/fill</a><br>配套开发板购买:<br><a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.taobao.com%2Fitem.htm%3Fspm%3Da1z10.5-c-s.w4002-23113581213.10.1f823de1YJY0ga%26id%3D696813161080" target="blank">https://item.taobao.com/item.htm?spm=a1z10.5-c-s.w4002-23113581213.10.1f823de1YJY0ga&amp;id=696813161080</a></p><blockquote>更多书籍推荐及赠书活动请关注<a href="https://aijishu.com/books">极术读书</a>页面。</blockquote>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000378231</guid>
            <link>https://aijishu.com/a/1060000000378231</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】50本《智能网联汽车计算平台测试装调》赠书名单公布]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>栏目。</blockquote><p>2022年11月30日至12月5日,极术社区联合安谋科技学堂,机械工业出版社赠送50本《<a href="https://aijishu.com/e/1120000000368246"><strong>智能网联汽车计算平台测试装调</strong></a>》,非常感谢大家的积极参与,赠书名单如下,恭喜下方的小伙伴,下面每人将收到极术读书赠送的一本《智能网联汽车计算平台测试装调》。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbI8e" alt="df93aa6972e82e1338bfd90b7f03c6a.png" title="df93aa6972e82e1338bfd90b7f03c6a.png"></p><blockquote><p>祝贺以上获奖的小伙伴!</p><p>极术读书工作人员将给中奖用户发送邮件通知确认后尽快安排寄出。</p><p>暂时没有获奖的的小伙伴也不要着急,接下来极术读书及安谋科技学堂会多多组织类似的活动,努力为大家谋福利!<br>本次赠书活动感谢机械工业出版社和书籍作者上海交大刘彦博老师的大力支持!</p></blockquote><p><strong>活动原文</strong>:<a href="https://aijishu.com/e/1120000000368246">【极术读书】冬季送50本《智能网联汽车计算平台测试装调》,带你全面掌握智能汽车计算平台软硬件!</a></p><blockquote>关注<a href="https://aijishu.com/books">极术读书栏目</a>,即时获取最新推荐好书以及读书活动。</blockquote><p><strong>学习公号推荐</strong>:关注<strong>安谋科技学堂</strong>公众号,学习更多技术知识!<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbiNv" alt="安谋科技学堂.png" title="安谋科技学堂.png"></p><p><strong>如何购买?</strong><br>京东旗舰店:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13457369.html" target="blank">https://item.jd.com/13457369.html</a></p><blockquote>本活动最终解释权归极术社区所有。</blockquote>
                                                    ]]></description>
            <pubDate>Sun, 04 Dec 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000372749</guid>
            <link>https://aijishu.com/a/1060000000372749</link>
        </item>
        <item>
            <title><![CDATA[新书推荐| 《智能网联汽车计算平台测试装调》带你全面学习智能汽车计算平台]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>。</blockquote><p>在政策、技术与市场等多重因素的影响下,汽车这一传统产业与能源、交通、信息通信等领域有关技术加速融合,正在形成电动化、智能化、网联化的发展格局。智能网联汽车的发展已经进入快车道。而随着无人驾驶技术的发展,智能网联汽车计算平台在智能驾驶中的作用也愈发重要。为了让大家更快掌握智能网联汽车计算平台,极术读书给大家推荐由北京电子科技职业学院汽车工程学院院长冯志新和上海交大刘彦博编写,机械工业出版社最新出版的《智能网联汽车计算平台测试装调》。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbHXm" alt="image.png" title="image.png"></p><h2>内容简介</h2><p>本书是智能网联计算平台测试应用与调试开发的初级教材,主要是为了满足行业对智能网联汽车技术专业人才的需求,促进高职院校汽车专业的建设。</p><p>全书共8章,以学习任务为出发点贯穿教学,通过任务导入、任务分析、任务资讯、任务准备、任务实施、任务检查与评价逐层深入实践。</p><p>本书内容包括智能网联车载计算平台的基础知识、框架结构和硬件认知,Python 语言和Linux 系统的相关操作和基础知识,华为MDC 平台和智行者计算平台的拆装与调试,以及相关软件的环境部署和操作技巧。</p><h2>书籍特色</h2><p>本书具有以下特点:</p><p>1)紧跟汽车新技术的发展步伐,结合智能网联汽车技术专业的职业取向、培养目标进行内容设置,及时反映产业升级和行业发展需求,体现新知识、新技术、新工艺、新方法、新材料。</p><p>2)采用学习任务式编写体例。每一个学习任务都对应有相关的任务驱动,且配备有对应的技能操作步骤,可操作性强。</p><p>3)注重实践应用能力的培养和技能的提升,实现“理实一体”,旨在为行业培养高素质的汽车智能技术技能人才。</p><p>本书在编写过程中大量参考了<strong>华为、百度、英伟达、安谋科技、亚马逊、迈斯沃克、恩智浦、盛心杰缘智能科技、九州华海科技、盛子智能科技</strong>等知名公司的工程技术专家提供的资料,具备一定的先进性和工程性。</p><h2>书籍目录</h2><ul><li>1 计算平台认知</li><li>2 计算平台架构认知</li><li>3 计算平台硬件认知</li><li>4 Python 基础知识</li><li>5 Linux 基础知识</li><li>6 华为MDC 300F 平台的拆装与调试</li><li>7 智行者计算平台的拆装与调试</li><li>8 软件部署</li></ul><h2>作者介绍</h2><ul><li><strong>冯志新</strong>,工学博士,教授,北京电子科技职业学院 汽车工程学院院长,北京市级专业带头人,教育部课程思政教学名师,教育部汽车职业教育教学指导委员会委员。全国“双高”汽车制造与装配技术专业群建设负责人,北京市市级教师教学创新团队和高校继续教育高水平教学团队负责人。曽获教育教学成果一等奖1项,获北京市级教育教学成果一等奖2项,主持和参与厅局级以上课题8项,主编教材4部。兼任中国机械工业教育协会第五届理事,国家职业技能鉴定高级考评员和质量督导员,机械工业人才评价工作专家委员会委员。</li><li><strong>刘彦博</strong> ,中国汽车产品高级工程师,上海交通大学教辅系列青年教师<br>,华为云MVP专家/华为鲲鹏计算先锋教师,百度自动驾驶培训讲师,英伟达自动驾驶培训讲师,IEEE上海会员。主要研究方向为汽车电子、智能网联感知融合技术、智能网联网络拓扑优化等。精通嵌入式系统、硬件电路设计,熟悉多种智能网联车载平台系统。主要参与的项目有信息产业部中国电子科技集团公司2U/3U车载计算平台设计、车载采集监控系统、北斗车载控制系统、车载电子控制系统,教育部产学研华为云智能驾驶开发设计、教育部产学研无人驾驶课程开发、教育部产学研5G车路协同开发等项目。发表EI核心论文30余篇、发明专利5篇、软件著作5篇,著有《 智能网联汽车计算平台测试装调》《新能源汽车技术研究进展微探》,《电子控制技术》等教材。</li></ul><h2>书籍购买</h2><p>京东链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13457369.html" target="blank">https://item.jd.com/13457369.html</a></p><blockquote>更多书籍推荐及赠书活动请关注<a href="https://aijishu.com/books">极术读书</a>页面。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 21 Nov 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000368242</guid>
            <link>https://aijishu.com/a/1060000000368242</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】赠卡活动第二期名单公布]]></title>
            <description><![CDATA[<p>11月第一周,极术读书栏目又组织了<a href="https://aijishu.com/e/1120000000361727">第二次极客时间月卡赠送活动</a>。活动获得了很多社区用户的支持,恭喜以下的用户获得极客时间超级会员月卡。<br>姓名    手机<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbG7u" alt="jikeshijian.png" title="jikeshijian.png"></p><blockquote>工作人员会在1~2个工作日发邮件到大家登记邮箱说明如何免费兑换卡券,敬请关注邮件。请在<strong>2022年12月2日</strong>前兑换,超过时间则不予兑换。如有任何问题欢迎微信联系极术小姐姐(微信:aijishu20)</blockquote><p><strong>推荐目前极术社区正在组织的活动</strong></p><ul><li><a href="https://aijishu.com/e/1120000000359788">「免费申请」基于Arm Cortex-M4的兆易创新GD32F427高性能开发板试用活动</a></li></ul><p>更多赠书赠卡活动敬请关注<a href="https://aijishu.com/books"><strong>极术读书</strong></a>。</p>
                                                    ]]></description>
            <pubDate>Sun, 06 Nov 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000365015</guid>
            <link>https://aijishu.com/a/1060000000365015</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】国庆《嵌入式实时操作系统 ―基于ARM Mbed OS的应用实践》赠书名单公布]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>栏目。</blockquote><p>2022年9月28日至10月8日,极术社区联合安谋科技学堂赠送50本《<a href="https://aijishu.com/e/1120000000355587"><strong>嵌入式实时操作系统 ―基于ARM Mbed OS的应用实践</strong></a>》,非常感谢大家的积极参与,赠书名单如下,恭喜下方的小伙伴,下面每人将收到极术读书赠送的一本《嵌入式实时操作系统 ―基于ARM Mbed OS的应用实践》。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbFwu" alt="2022年国庆赠书.png" title="2022年国庆赠书.png"></p><blockquote><p>祝贺以上获奖的小伙伴!</p><p>极术读书工作人员将给中奖用户发送邮件通知确认后尽快安排寄出。</p><p>暂时没有获奖的的小伙伴也不要着急,接下来极术读书及安谋科技学堂会多多组织类似的活动,努力为大家谋福利!<br>本次赠书活动感谢电子工业出版社和书籍作者王宜怀教授的大力支持!</p></blockquote><p><strong>活动原文</strong>:<a href="https://aijishu.com/e/1120000000355587">【极术读书】国庆赠书50本《嵌入式实时操作系统 ―基于ARM Mbed OS的应用实践》,掌握实时操作系统应用及原理!</a></p><blockquote>关注<a href="https://aijishu.com/books">极术读书栏目</a>,即时获取最新推荐好书以及读书活动。</blockquote><p><strong>学习公号推荐</strong>:关注<strong>安谋科技学堂</strong>公众号,学习更多技术知识!<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbiNv" alt="安谋科技学堂.png" title="安谋科技学堂.png"></p><p><strong>如何购买?</strong><br>京东旗舰店:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13237887.html" target="blank">https://item.jd.com/13237887.html</a></p><blockquote>本活动最终解释权归极术社区所有。</blockquote>
                                                    ]]></description>
            <pubDate>Fri, 07 Oct 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000358877</guid>
            <link>https://aijishu.com/a/1060000000358877</link>
        </item>
        <item>
            <title><![CDATA[极术读书 | 新书推荐《嵌入式实时操作系统 ――基于ARM Mbed OS的应用实践》]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>。</blockquote><p>嵌入式实时操作系统是嵌入式人工智能与物联网终端的重要工具和运行载体,也是嵌入式工程师必备知识。本篇极术读书将推荐安谋科技合作图书,苏州大学王宜怀教授所著《<strong>嵌入式实时操作系统 ――基于ARM Mbed OS的应用实践</strong>》。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbEw2" alt="image.png" title="image.png"></p><h2>内容介绍</h2><p>虽然实时操作系统种类繁多,有国外的,也有国产的;有收费的,也有免费的;有开发者持续维护升级的,也有依赖爱好者更新升级的。但是无论哪一种, 学习实时操作系统时都必须以一个具体的实时操作系统为蓝本。实际上,不同的实时操作系统,其应用方法及原理大同小异,掌握其共性是学习的关键,这样才能达到举一反三的效果。</p><p>本书推荐的Mbed OS是ARM公司于2014年开始推出并逐步完善的一款免费的 开源嵌入式实时操作系统,Mbed OS专为基于ARM Cortex-M内核的MCU设计, 主要面向物联网终端。该书以ARM Mbed OS实时操作系统为背景,阐述实时操作系统的线程、调度、延时函数、事件、消息队列、线程信号、信号量、互斥量等基本要素,给出实时操作系统下的程序设计方法。</p><p>本书分为基础应用篇(第1~7章)、原理剖析篇(第8~12章)及综合实践篇(第13、14章)三大部分,如果读者只做实时操作系统下的应用开发,可只阅读基础应用篇与综合实践篇;如果希望理解实时操作系统原理,那么建议通读全书。</p><p>本书适合软件开发工程师,可作为实时操作系统的技术培训书籍,书籍配套有实践的开发板。</p><h2>书籍目录</h2><p><strong>第1篇 基础应用篇</strong></p><ul><li><p>第1章 实时操作系统的基本概念与线程基础知识 3</p><ul><li><p>1.1 实时操作系统的基本含义 3</p><ul><li>1.1.1 嵌入式系统的基本分类 3</li><li>1.1.2 无操作系统与实时操作系统 4</li><li>1.1.3 实时操作系统与非实时操作系统 5</li></ul></li><li><p>1.2 实时操作系统中的基本概念 6</p><ul><li>1.2.1 线程与调度的基本含义 6</li><li>1.2.2 内核的基本概念 7</li><li>1.2.3 线程的基本概念 9</li></ul></li><li><p>1.3 线程的三要素、四种状态及三种基本形式 10</p><ul><li>1.3.1 线程的三要素 10</li><li>1.3.2 线程的四种状态 11</li><li>1.3.3 线程的三种基本形式 13</li></ul></li><li>1.4 本章小结 14</li></ul></li><li><p>第2章 相关基础知识 17</p><ul><li><p>2.1 CPU内部寄存器的分类及ARM Cortex-M处理器的主要寄存器 17</p><ul><li>2.1.1 CPU内部寄存器的分类 17</li><li>2.1.2 ARM Cortex-M处理器的主要寄存器 18</li></ul></li><li><p>2.2 C语言中的构造类型及编译相关问题 21</p><ul><li>2.2.1 C语言中的构造类型 21</li><li>2.2.2 编译相关问题 25</li></ul></li><li><p>2.3 实时操作系统内核使用的数据结构 26</p><ul><li>2.3.1 栈与堆 26</li><li>2.3.2 队列 28</li><li>2.3.3 链表 29</li></ul></li><li><p>2.4 汇编语言概述 36</p><ul><li>2.4.1 汇编语言格式 36</li><li>2.4.2 常用伪指令简介 38</li></ul></li><li>2.5 本章小结 40</li></ul></li><li><p>第3章 Mbed OS第一个样例工程 41</p><ul><li>3.1 Mbed OS简介 41</li><li><p>3.2 软件和硬件开发平台 42</p><ul><li>3.2.1 GEC架构简介 42</li><li>3.2.2 硬件平台 43</li><li>3.2.3 软件平台 44</li><li>3.2.4 网上电子资源 45</li></ul></li><li><p>3.3 第一个样例工程 46</p><ul><li>3.3.1 样例程序功能 46</li><li>3.3.2 工程框架设计原则 46</li><li>3.3.3 无操作系统的工程框架 47</li><li>3.3.4 Mbed OS的工程框架 51</li></ul></li><li>3.4 本章小结 56</li></ul></li><li><p>第4章 实时操作系统下应用程序的基本要素 57</p><ul><li><p>4.1 中断的基本概念及处理过程 57</p><ul><li>4.1.1 中断的基本概念 57</li><li>4.1.2 中断处理的基本过程 58</li></ul></li><li><p>4.2 时间嘀嗒与延时函数 60</p><ul><li>4.2.1 时间嘀嗒 60</li><li>4.2.2 延时函数 60</li></ul></li><li><p>4.3 调度策略 61</p><ul><li>4.3.1 调度基础知识 61</li><li>4.3.2 Mbed OS中使用的调度策略 62</li><li>4.3.3 Mbed OS中的固有线程 63</li></ul></li><li><p>4.4 实时操作系统中的功能列表 64</p><ul><li>4.4.1 就绪列表 64</li><li>4.4.2 延时列表 64</li><li>4.4.3 等待列表 64</li><li>4.4.4 条件阻塞列表 64</li></ul></li><li>4.5 本章小结 65</li></ul></li><li><p>第5章 同步与通信的应用方法 67</p><ul><li><p>5.1 实时操作系统中同步与通信的基本概念 67</p><ul><li>5.1.1 同步的含义与通信手段 67</li><li>5.1.2 同步类型 68</li></ul></li><li><p>5.2 事件 69</p><ul><li>5.2.1 事件的含义及应用场合 69</li><li>5.2.2 事件的常用函数 69</li><li>5.2.3 事件的编程举例:通过事件实现中断与线程的通信 71</li><li>5.2.4 事件的编程举例:通过事件实现线程之间的通信 74</li></ul></li><li><p>5.3 消息队列 76</p><ul><li>5.3.1 消息队列的含义及应用场合 76</li><li>5.3.2 消息队列的常用函数 76</li><li>5.3.3 消息队列的编程举例 78</li></ul></li><li><p>5.4 线程信号 82</p><ul><li>5.4.1 线程信号的含义及应用场合 82</li><li>5.4.2 线程信号的常用函数 83</li><li>5.4.3 线程信号的编程举例 84</li></ul></li><li><p>5.5 信号量 87</p><ul><li>5.5.1 信号量的含义及应用场合 87</li><li>5.5.2 信号量的常用函数 88</li><li>5.5.3 信号量的编程举例 89</li></ul></li><li><p>5.6 互斥量 92</p><ul><li>5.6.1 互斥量的含义及应用场合 92</li><li>5.6.2 互斥量的常用函数 94</li><li>5.6.3 互斥量的编程举例 95</li></ul></li><li>5.7 本章小结 98</li></ul></li><li><p>第6章 底层硬件驱动构件 99</p><ul><li><p>6.1 嵌入式构件概述 99</p><ul><li>6.1.1 制作构件的必要性 99</li><li>6.1.2 构件的基本概念 99</li><li>6.1.3 嵌入式开发中构件的分类 100</li><li>6.1.4 构件的基本特征与表达形式 101</li></ul></li><li><p>6.2 底层硬件驱动构件设计原则与方法 102</p><ul><li>6.2.1 底层硬件驱动构件设计的基本原则 102</li><li>6.2.2 底层硬件驱动构件设计要点分析 103</li><li>6.2.3 底层硬件驱动构件封装规范概要 104</li><li>6.2.4 封装的前期准备 105</li></ul></li><li><p>6.3 底层硬件驱动构件设计举例 106</p><ul><li>6.3.1 GPIO构件 106</li><li>6.3.2 UART构件 114</li><li>6.3.3 Flash构件 119</li><li>6.3.4 ADC构件 123</li><li>6.3.5 PWM构件 127</li></ul></li><li><p>6.4 应用构件及软件构件设计实例 131</p><ul><li>6.4.1 应用构件设计实例 131</li><li>6.4.2 软件构件设计实例 133</li></ul></li><li>6.5 本章小结 142</li></ul></li><li><p>第7章 实时操作系统下的程序设计方法 143</p><ul><li><p>7.1 程序稳定性问题 143</p><ul><li>7.1.1 稳定性的基本要求 143</li><li>7.1.2 看门狗复位与定期复位的应用 144</li><li>7.1.3 临界区的处理 147</li></ul></li><li><p>7.2 中断服务程序设计、线程划分及优先级安排问题 148</p><ul><li>7.2.1 中断服务程序设计的基本问题 148</li><li>7.2.2 线程划分的简明方法 149</li><li>7.2.3 线程优先级安排问题 149</li></ul></li><li><p>7.3 利用信号量解决并发与资源共享的问题 150</p><ul><li>7.3.1 并发与资源共享的问题 150</li><li>7.3.2 应用实例 151</li></ul></li><li><p>7.4 优先级反转问题 155</p><ul><li>7.4.1 优先级反转问题的出现 155</li><li>7.4.2 Mbed OS中避免优先级反转问题的方法 157</li></ul></li><li>7.5 本章小结 162<br> <strong>第2篇 原理剖析篇</strong></li></ul></li><li><p>第8章 理解Mbed OS的启动过程 165</p><ul><li><p>8.1 芯片启动到main函数之前的运行过程 165</p><ul><li>8.1.1 寻找第一条被执行指令的存放处 165</li><li>8.1.2 通过启动文件理解芯片启动过程 167</li></ul></li><li><p>8.2 Mbed OS启动流程概要 169</p><ul><li>8.2.1 相关宏定义及结构体 169</li><li>8.2.2 栈和堆的配置 176</li><li>8.2.3 启动过程概述 179</li><li>8.2.4 如何运行到主线程 181</li><li>8.2.5 启动过程总流程源代码 182</li></ul></li><li><p>8.3 深入理解启动过程(一):内核初始化解析 183</p><ul><li>8.3.1 内核初始化准备工作 183</li><li>8.3.2 进入SVC中断服务程序SVC_Handler 186</li><li>8.3.3 实际内核初始化函数 187</li><li>8.3.4 返回流程 199</li></ul></li><li><p>8.4 深入理解启动过程(二):创建主线程、启动内核 200</p><ul><li>8.4.1 创建主线程 201</li><li>8.4.2 启动内核 215</li><li>8.4.3 定时器线程函数 226</li><li>8.4.4 消息获取与处理函数 228</li><li>8.4.5 线程延时等待函数 238</li></ul></li><li><p>8.5 中断服务程序SVC_Handler详解 240</p><ul><li>8.5.1 SVC_Handler功能概要 241</li><li>8.5.2 SVC_Handler完整流程 241</li><li>8.5.3 SVC_Handler功能分段解析 243</li><li>8.5.4 SVC_Handler完整代码注释 246</li><li>8.6 函数调用关系总结及存储空间分析 249</li><li>8.6.1 启动过程中函数的调用关系总结 250</li><li>8.6.2 启动过程存储空间分析 253</li></ul></li><li>8.7 本章小结 257</li></ul></li><li><p>第9章 理解时间嘀嗒 259</p><ul><li><p>9.1 时间嘀嗒的建立与使用 259</p><ul><li>9.1.1 SysTick定时器的寄存器 259</li><li>9.1.2 SysTick定时器的初始化 260</li><li>9.1.3 SysTick中断服务程序 263</li></ul></li><li><p>9.2 延时函数 266</p><ul><li>9.2.1 线程延时等待函数 266</li><li>9.2.2 线程延时嘀嗒函数 267</li><li>9.2.3 其他时间嘀嗒函数 269</li></ul></li><li><p>9.3 延时等待列表工作机制 271</p><ul><li>9.3.1 线程插入延时等待列表函数 271</li><li>9.3.2 从延时等待列表中移除线程的函数 274</li><li>9.3.3 延时函数调度过程实例剖析 275</li></ul></li><li><p>9.4 与时间相关的函数 279</p><ul><li>9.4.1 获取系统运行时间函数 280</li><li>9.4.2 日期转时间戳函数 281</li><li>9.4.3 时间戳转日期函数 283</li></ul></li><li>9.5 本章小结 286</li></ul></li><li><p>第10章 理解调度机制 287</p><ul><li><p>10.1 ARM Cortex-M4的SVC和PendSV中断的调度作用 287</p><ul><li>10.1.1 SVC中断的调度作用 287</li><li>10.1.2 PendSV中断的调度作用 288</li><li>10.1.3 列表分析 288</li></ul></li><li><p>10.2 中断服务程序PendSV_Handler剖析 289</p><ul><li>10.2.1 osRtxPendSV _Handler的功能概要 289</li><li>10.2.2 osRtxPendSV_Handler函数源代码解析 290</li><li>10.2.3 跳转到SVC_Context进行上下文切换 291</li><li>10.2.4 PendSV_Handler函数完整代码注释 291</li></ul></li><li><p>10.3 PendSV应用举例 292</p><ul><li>10.3.1 PendSV在事件中的应用 292</li><li>10.3.2 PendSV在线程信号中的应用 296</li></ul></li><li>10.4 本章小结 300</li></ul></li><li><p>第11章 理解事件与消息队列 301</p><ul><li><p>11.1 事件 301</p><ul><li>11.1.1 事件的相关结构体 301</li><li>11.1.2 事件函数深入剖析 302</li><li>11.1.3 事件调度剖析 307</li></ul></li><li><p>11.2 消息队列 311</p><ul><li>11.2.1 消息或消息队列结构体 311</li><li>11.2.2 消息队列函数深入剖析 313</li><li>11.2.3 消息队列调度剖析 318</li></ul></li><li>11.3 本章小结 322</li></ul></li><li><p>第12章 理解线程信号、信号量与互斥量 323</p><ul><li><p>12.1 线程信号 323</p><ul><li>12.1.1 线程操作函数 323</li><li>12.1.2 线程信号函数深入剖析 329</li><li>12.1.3 线程信号调度剖析 333</li></ul></li><li><p>12.2 信号量 337</p><ul><li>12.2.1 信号量控制块结构体 337</li><li>12.2.2 信号量函数深入剖析 337</li><li>12.2.3 信号量调度剖析 341</li></ul></li><li><p>12.3 互斥量 345</p><ul><li>12.3.1 互斥量结构体 345</li><li>12.3.2 互斥量函数深入剖析 346</li><li>12.3.3 互斥量调度剖析 352</li><li>12.3.4 互斥量避免优先级反转问题调度剖析 356</li></ul></li><li>12.4 本章小结 359<br><strong>第3篇 综合实践篇</strong></li></ul></li><li><p>第13章 基于Mbed OS的AHL-EORS应用 363</p><ul><li><p>13.1 AHL-EORS简介 363</p><ul><li>13.1.1 硬件清单 363</li><li>13.1.2 硬件测试导引 364</li></ul></li><li><p>13.2 卷积神经网络概述 364</p><ul><li>13.2.1 卷积神经网络的技术特点 364</li><li>13.2.2 卷积神经网络原理 365</li></ul></li><li><p>13.3 AHL-EORS选用模型分析 368</p><ul><li>13.3.1 MobileNetV2模型 369</li><li>13.3.2 NCP模型 370</li></ul></li><li><p>13.4 AHL-EORS的数据采集与训练过程 373</p><ul><li>13.4.1 数据采集程序 373</li><li>13.4.2 模型训练与部署 376</li></ul></li><li>13.5 在通用嵌入式计算机GEC上进行的推理过程 377</li><li>13.6 本章小结 380</li></ul></li><li><p>第14章 基于Mbed OS的NB-IoT应用开发 381</p><ul><li><p>14.1 窄带物联网应用开发概述 381</p><ul><li>14.1.1 窄带物联网简介 381</li><li>14.1.2 NB-IoT应用开发所面临的难题及解决思路 382</li><li>14.1.3 直观体验NB-IoT数据传输 383</li><li>14.1.4 金葫芦NB-IoT开发套件简介 384</li></ul></li><li><p>14.2 NB-IoT应用架构及通信基本过程 386</p><ul><li>14.2.1 建立NB-IoT应用架构的基本原则 386</li><li>14.2.2 终端UE、信息邮局MPO与人机交互系统HCI的基本定义 386</li><li>14.2.3 基于信息邮局粗略了解基本通信过程 387</li></ul></li><li><p>14.3 终端UE与云侦听程序的通信过程 388</p><ul><li>14.3.1 基于mbed的终端UE模板工程设计 389</li><li>14.3.2 云侦听模板工程功能简介 391</li><li>14.3.3 建立云侦听程序的运行场景 392</li><li>14.3.4 运行云侦听与终端UE模板工程 394</li><li>14.3.5 通信过程中的常见错误说明 396</li></ul></li><li><p>14.4 通过Web网页的数据访问 397</p><ul><li>14.4.1 运行Web模板观察自己终端UE的数据 397</li><li>14.4.2 NB-IoT的Web网页模板工程结构 398</li></ul></li><li><p>14.5 通过微信小程序的数据访问 399</p><ul><li>14.5.1 运行小程序模板观察自己终端UE的数据 399</li><li>14.5.2 NB-IoT的微信小程序模板工程结构 401</li></ul></li></ul></li><li>参考文献 403</li></ul><h2>作者简介</h2><p>王宜怀,博士,教授、博士生导师、网络工程系主任;苏州大学嵌入式系统与物联网研究所所长;苏州市政协常委、中国农工民主党苏州市委常委;江苏省计算机学会嵌入式系统与物联网专业委员会主任、中国软件行业协会嵌入式系统分会理事。主要研究方向:嵌入式系统、物联网与智能控制技术。</p><h2>书籍购买</h2><p>书籍购买:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13237887.html" target="blank">https://item.jd.com/13237887.html</a><br>试读链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fcread.jd.com%2Fread%2FstartRead.action%3FbookId%3D30817514%26readType%3D1" target="blank">https://cread.jd.com/read/startRead.action?bookId=30817514&amp;readType=1</a></p><p>配套电子资源获取(包含文档和源代码):点击<a href="https://aijishu.com/link?target=http%3A%2F%2Fsumcu.suda.edu.cn%2FmbedOS%2Flist.htm" target="blank">苏州大学嵌入式学习社区官网</a>,在【<strong>著作</strong>】-【<strong>mebdOS</strong>】下栏目下获得电子资源。</p><blockquote>更多书籍推荐请关注<a href="https://aijishu.com/blog/armjiaoyushengta"><strong>极术读书专栏</strong></a>,用知识武装头脑,增强个人竞争力。</blockquote>
                                                    ]]></description>
            <pubDate>Tue, 20 Sep 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000355068</guid>
            <link>https://aijishu.com/a/1060000000355068</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】极客时间月卡赠卡第一期获奖名单]]></title>
            <description><![CDATA[<p>上周<a href="https://aijishu.com/books">极术读书栏目</a>组织了极客时间月卡赠卡第一期活动,收到了很多社区用户的支持。下方为社区中奖用户名单,非常感谢大家的支持。欢迎大家继续关注<a href="https://aijishu.com/books">极术读书栏目</a>,我们会推荐更多嵌入式,AI,芯片设计,安全等领域的好书以及组织webinar和赠书活动。</p><p>中奖名单如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbDzn" alt="a5d1f6022a5601cc6cc20a95a6630b2.png" title="a5d1f6022a5601cc6cc20a95a6630b2.png"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbDzo" alt="bfb41fd344bc64dd5fd8c4922c2cd6e.jpg" title="bfb41fd344bc64dd5fd8c4922c2cd6e.jpg"></p><blockquote><p>恭喜以上用户,我们将尽快将月卡兑换码发到您的申请邮箱。没有获奖的小伙伴也不要灰心,请关注我们更多活动。</p><p>暂时没有获奖的的小伙伴也不要着急,接下来极术读书及安谋科技学堂会多多组织类似的活动,努力为大家谋福利!</p></blockquote><p><strong>活动原文</strong>:<a href="https://aijishu.com/e/1120000000346486">【极术读书】赠卡活动第一期,200张极客时间月卡免费领,从零开始学芯片</a></p><p><strong>学习推荐</strong>:关注<strong>安谋科技学堂</strong>公众号<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbiNv" alt="安谋科技学堂.png" title="安谋科技学堂.png"></p><blockquote>本活动最终解释权归极术社区所有。</blockquote>
                                                    ]]></description>
            <pubDate>Sun, 04 Sep 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000351369</guid>
            <link>https://aijishu.com/a/1060000000351369</link>
        </item>
        <item>
            <title><![CDATA[免费学习国家精品课程:《嵌入式系统及应用》在线课程,第12次开课!]]></title>
            <description><![CDATA[<p>和安谋科技教育计划有非常深入合作的苏州大学王宜怀教授,正在授课的基于Arm® Cortex®-M处理器的<strong>《嵌入式系统及应用》在线开放课程</strong>一直是我们极力推荐的。目前该课程已经被评为<strong>国家精品课程</strong>。</p><p>嵌入式系统是嵌入式人工智能与物联网的重要基础,该课程以Arm Cortex-M微处理器为蓝本,以软硬件构件为主线,基于嵌入式软件工程基本原理,按照"通用知识—驱动构件使用方法—测试实例—芯片编程结构—构件设计方法”的线条,逐步阐述嵌入式系统基本知识要素及较为规范的底层软硬件相结合的设计方法。</p><p><strong>目前是本课程的第12次开课,开课时间是2022年09月05日 ~ 2023年01月06日。</strong>如果你想掌握构成计算机的基本部件原理,掌握计算机高级程序设计方法,为从寄存器级理解软件干预硬件提供基础,那就赶快查看下方信息,报名学习吧!现在加入还来得及喔~</p><h2>《嵌入式系统及应用》在线开放课程</h2><p><a href="https://v.qq.com/x/page/j3325qf1xro.html">https://v.qq.com/x/page/j3325qf1xro.html</a></p><p>本视频由授课教师提供</p><h4><strong>01 基本介绍</strong></h4><ul><li><strong>课程名称:</strong>《嵌入式系统及应用》</li><li><strong>授课单位:</strong>苏州大学</li><li><strong>授课教师:</strong>王宜怀、张建、刘长勇</li><li><strong>在线学习网址:</strong>  <a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.icourse163.org%2Fcourse%2FSUDA-1001754273" target="blank">[爱课程-中国大学MOOC]</a></li></ul><h4><strong>02 课程概述</strong></h4><p>《嵌入式系统及应用》课程作为嵌入式人工智能与物联网相关专业的基础课程,以Arm Cortex-M微处理器为蓝本,采用构件化开发,针对每个知识点,提供样本程序(葫芦),学生通过模仿该程序稍加修改后可完成符合自我要求的程序(照葫芦画瓢)。课程按照<strong>“通用知识—驱动构件使用方法—测试实例—芯片编程结构—构件设计方法”</strong>的线条,逐步阐述嵌入式系统基本知识要素及较为规范的底层软硬件相结合的设计方法。</p><h4><strong>03 课程用书</strong></h4><p>本课程教学用书《嵌入式技术基础与实践(第6版)—基于STM32L431微控制器》,该教材历经十多年凝练,仔细梳理了嵌入式系统的通用基础知识要素,注重把握通用知识与芯片相关知识之间的平衡、把握硬件与软件的关系、对底层驱动进行构件化封装、设计合理的测试用例,教材内含简明实验套件,结合网上电子资源,方便读者进行实践与应用。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbqNk" alt="51546da303679fd168b5fe7d75d10e65.jpg" title="51546da303679fd168b5fe7d75d10e65.jpg"></p><p><strong>《嵌入式技术基础与实践(第6版)》(王宜怀主编)</strong></p><blockquote>【书内含通用嵌入式计算机GEC,型号:AHL-STM32L431,可完成书中基本实验】</blockquote><p><strong>电子资源下载地址及路径:</strong></p><p>“<a href="https://aijishu.com/link?target=https%3A%2F%2Fsumcu.suda.edu.cn%2F" target="blank">https://sumcu.suda.edu.cn/</a>”→“金葫芦专区”→“嵌入式书6版”,右边为下载索引</p><p><strong>点击<a href="https://aijishu.com/link?target=https%3A%2F%2Ftuicashier.youzan.com%2Fpay%2Fwscgoods_order%3Fbanner_id%3Dseach.16152946%7Esearch%7E7%7E7LEMSxlm%26words%3D%E5%B5%8C%E5%85%A5%E5%BC%8F%26alg%3D0%26slg%3Dconsumer-search%2CstandardModify%2C30be7fd3-df55-4535-c709-11c1b3a78e09%2C711.545_c9498a9569324a1ab4d18b403e0cc497%26reft%3D1630934839602%26spm%3Dseach.16152946%26is_share%3D1%26shopAutoEnter%3D1%26sl%3D3NTPzP%26from_params%3Dsl%7E3NTPzP%21online_kdt_id%7E16152946%26sub_kdt_id%3D16152946%26st%3D3%26alias%3D3f579wrkbwq9es4%26is_silence_auth%3D1" target="blank">链接</a>即可购买教材:</strong></p><h4><strong>04 课程大纲</strong></h4><p><strong>01 概述</strong></p><p>1.1 初识嵌入式系统<br>1.2 嵌入式系统的定义、发展简史、分类及特点<br>1.3 嵌入式系统的学习困惑、知识体系及学习建议<br>1.4 微控制器与应用处理器简介<br>1.5 嵌入式系统常用术语</p><p><strong>02 Arm Cortex-M4微处理器</strong></p><p>2.1 Arm Cortex-M4微处理器简介<br>2.2 寻址方式与机器码的获取方法<br>2.3 基本指令分类解析<br>2.4 汇编语言的基本语法</p><p><strong>03 存储器映像、中断源与硬件最小系统</strong></p><p>3.1 STM32L系列MCU概述<br>3.2 STM32L4的引脚图与硬件最小系统<br>3.3 由MCU构建通用嵌入式计算机</p><p><strong>04 GPIO及程序框架</strong></p><p>4.1 GPIO通用基础知识<br>4.2 软件干预硬件的方法<br>4.3 认识工程框架<br>4.4 GPIO构件的制作过程<br>4.5 第一个汇编语言工程:控制小灯闪烁<br>4.6 实验一 熟悉实验开发环境及GPIO编程</p><p><strong>05 嵌入式硬件构件与底层驱动构件基本规范</strong></p><p>5.1 嵌入式硬件构件<br>5.2 嵌入式底层驱动构件的概念与层次模型<br>5.3 底层驱动构件的封装规范<br>5.4 硬件构件及其驱动构件的复用与移植方法</p><p><strong>06 串行通信模块及第一个中断程序结构</strong></p><p>6.1 异步串行通信的通用基础知识<br>6.2 基于构件的串行通信编程方法<br>6.3 UART构件的制作过程<br>6.4 中断机制及中断编程步骤<br>6.5 实验二 串口通信及中断实验</p><p><strong>07 定时器相关模块</strong></p><p>7.1 定时器通用基础知识<br>7.2 STM32L431中的定时器<br>7.3 脉宽调制<br>7.4 输入捕捉与输出比较<br>7.5 实验三 定时器及PWM实验</p><p><strong>08 Flash在线编程、ADC与DAC  </strong></p><p>8.1 Flash在线编程  <br>8.2 ADC<br>8.3 DAC<br>8.4 实验四 ADC实验</p><p><strong>09&nbsp;SPI、I2C与TSC模块  </strong></p><p>9.1 串行外设接口SPI模块  <br>9.2 集成电路互联总线I2C模块<br>9.3 触摸感应控制器TSC模块<br>9.4 实验五 SPI通信实验</p><p><strong>10 CAN总线、DMA与位带操作</strong>  </p><p>10.1 CAN总线<br>10.2 DMA<br>10.3 位带操作</p><p><strong>11 系统时钟与其他功能模块</strong>  </p><p>11.1 时钟系统<br>11.2 复位模块与看门狗模块<br>11.3 电源控制模块与CRC校验模块<br>11.4 实验六 综合实验</p><p><strong>12 应用案例  </strong></p><p>12.1 嵌入式系统稳定性问题<br>12.2 外接传感器及执行部件的编程方法<br>12.3 实时操作系统的简明实例<br>12.4 嵌入式人工智能的简明实例<br>12.5 NB-IoT的应用简介<br>12.6 4G、Cat1、Wi-Fi及WSN的应用</p><h4><strong>05 预备知识</strong></h4><p>必须具备以下知识:</p><ul><li>计算机硬件基础(或模拟电路与数字电路、计算机组成、汇编语言、微机原理)</li><li>高级程序语言设计等(如C语言)</li></ul><p>学生通过学习上述课程,基本掌握构成计算机的基本部件原理,掌握计算机高级程序设计方法,为从寄存器级理解软件干预硬件提供基础。</p>
                                                    ]]></description>
            <pubDate>Wed, 31 Aug 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000350157</guid>
            <link>https://aijishu.com/a/1060000000350157</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】《软硬件融合--超大规模云计算架构创新之路》赠书名单公布]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/blog/armjiaoyushengta">极术读书</a>专栏。</blockquote><p>2022年7月27日至8月1日,极术社区联合安谋科技学堂赠送50本《<a href="https://aijishu.com/e/1120000000340363"><strong>软硬件融合-超大规模云计算创新之路</strong></a>》,非常感谢大家的积极参与,赠书名单如下,恭喜下方的小伙伴,下面每人将收到极术读书赠送的一本《软硬件融合--超大规模云计算架构创新之路》。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbBDd" alt="1659338014008.jpg" title="1659338014008.jpg"></p><blockquote><p>祝贺以上获奖的小伙伴!</p><p>极术读书工作人员将给中奖用户发送邮件通知并尽快安排寄出。</p><p>暂时没有获奖的的小伙伴也不要着急,接下来极术读书及安谋科技学堂会多多组织类似的活动,努力为大家谋福利!</p></blockquote><p><strong>活动原文</strong>:<a href="https://aijishu.com/e/1120000000340363">【极术读书赠书活动】50本《软硬件融合》免费领,学习从DPU到异构计算的超大规模计算创新之路</a></p><p><strong>资源推荐</strong>:关注<strong>安谋科技学堂</strong>公众号,回复 “<strong>软硬件融合</strong>” 获取软硬件融合相关资源!<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbiNv" alt="安谋科技学堂.png" title="安谋科技学堂.png"></p><p><strong>如何购买?</strong><br>京东旗舰店:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F12836605.html" target="blank">https://item.jd.com/12836605.html</a></p><blockquote>本活动最终解释权归极术社区所有。</blockquote>
                                                    ]]></description>
            <pubDate>Sun, 31 Jul 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000343915</guid>
            <link>https://aijishu.com/a/1060000000343915</link>
        </item>
    </channel>
</rss>

...

@github-actions
Copy link
Contributor

http://localhost:1200/aijishu/channel - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[极术社区 - 连接开发者与智能计算生态]]></title>
        <link>https://aijishu.com/</link>
        <atom:link href="http://localhost:1200/aijishu/channel" rel="self" type="application/rss+xml" />
        <description><![CDATA[极术社区 - 连接开发者与智能计算生态 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 16:48:51 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[抢先入局AIGC,新华三底层能力何在?]]></title>
            <description><![CDATA[<p>2022年11月,智能对话机器人模型ChatGPT上线,其连续对话能力、强大的理解力、回答的准确度和创造性使其迅速走红。数据显示,ChatGPT发布短短两个月时间,全球用户数便突破1亿。  </p><p>可以说,这项火遍全球的突破性人工智能对话技术,为整个科技行业带来了全新的想象力。而在国内,由百度打造的首个“类ChatGPT”——百度文心一言(ERNIE Bot)也即将在今年3月呈现,这是先进的人工智能对话技术在国内数字化领域中的首次大规模落地尝试,其价值无疑深远而重大。  </p><p><img referrerpolicy="no-referrer" src="https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/6ded7ccf62ea480d89d72aa5f4f8be39~tplv-tt-shrink:640:0.image?traceid=20230227174332DA60910EFE6C344C7866&amp;x-expires=2147483647&amp;x-signature=PzGM3fUwuBa9BuJ%2F70g%2Fv1HfU3k%3D" alt="" title="">  </p><p>值得一提的是,紫光股份旗下新华三集团日前也宣布正式成为百度文心一言的首批生态合作伙伴。接下来,双方将会把领先的智能对话技术成果应用在数字化领域,深度赋能百行百业的数字化转型和智能化升级。  </p><p>回头来看,新华三之所以能够成为百度文心一言的首批生态合作伙伴,无疑是其长期在ICT基础设施领域深厚技术沉淀和释放的一种体现,而这背后也让整个产业看到了新的可能——那就是站在企业数字化转型和智能化升级的重要关口,新华三以其智算基础架构构筑的超大模型底座,无疑可以为百行百业创造出更多具有想象空间的新业态、新服务和新模式,让智能化的大潮 “普惠”每一家企业和每一个个人,释放智能化生产力的“乘数效应”。  </p><p><strong>新华三牵手百度文心一言背后</strong>  </p><p>目前,以ChatGPT为代表的AIGC内容生成方式通过学习人类的思考方式,查阅、挖掘大量素材,以低边际成本、少人力限制等高效率的方式生成大量满足人们差异化需求的内容。  </p><p><img referrerpolicy="no-referrer" src="https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/2f718b62e00544a7981e09717999fe9c~tplv-tt-shrink:640:0.image?traceid=20230227174332DA60910EFE6C344C7866&amp;x-expires=2147483647&amp;x-signature=efX7OTdHEhxAdShYjUSRZJikEnU%3D" alt="" title="">  </p><p>文心一言,正是百度基于文心大模型技术推出的生成式AI产品。作为国内少有的拥有大模型技术的企业,百度在人工智能领域深耕十余年,拥有产业级知识增强文心大模型ERNIE,具备跨模态、跨语言的深度语义理解与生成能力,而这种能力,也在搜索问答、云计算、内容创作生成、智能办公等众多领域具有较大的“用武之地”。  </p><p>而本次新华三之所以率先成为百度文心一言的首批生态合作伙伴,其实也在“情理之中”。据了解,新华三与百度的合作有着长久的历史积淀,双方在ICT基础设施优化升级、百度智能云建设、信息检索、自动驾驶、生态建设等众多领域均有研发级别的合作,目前相关成果已广泛落地,对双方的产品技术发展产生了积极而深远的影响。  </p><p>而展望未来,新华三也将继续携手百度,为智能交通、自动驾驶、智慧城市、智慧医疗、智慧教育、智慧金融、多域互联等领域推出更多场景化解决方案,开拓内容生态和智能服务领域的全新可能性,全面引领数字化时代的产业变革与升级。  </p><p><strong>以智算架构构筑超大模型底座</strong>  </p><p>接下来要追问的是,为什么是新华三能够率先成为百度文心一言的首批生态合作伙伴呢?其实,要回答这一问题,就不得不提到类似ChatGPT和百度文心一言这样的AI基础模型(基于大规模数据集和大规模算力训练的大型预训练模型),要训练出这样的超大基础模型,往往是需要多方面的关键技术作为支撑的——除了大模型算法、分布式训练系统、高质量数据集的相关工具等,对计算、网络、存储等基础设施做出了巨大挑战。  </p><p>例如,训练大模型首先就需要大规模算力资源做支撑;同时大型训练对显存以及数据集缓存要求同样很高,训练过程中还会面临显存墙问题(模型是否能跑起来)以及计算/通信墙问题(能否在合理时间内完成训练);此外,大模型的训练同样对网络也提出了更高的要求,即需高性能网络满足节点间参数同步,且GPU服务器节点间需要高速网络来实现模型训练参数交换和存取等等。  </p><p>正是由于大模型的训练对存储、计算、网络等各个层面都提出了比较严苛的要求,长期深耕ICT领域的新华三,也基于自身在存储、计算、网络等领域深厚的技术积淀,打造出了一套全新的智算基础架构,该架构分为两大区域,即智算训练区和智算推理区,由此能够为大模型的训练提供强大的技术底座能力,具体来看:  </p><p><img referrerpolicy="no-referrer" src="https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/5bd8f2b9a2d94617be87edd9202d9527~tplv-tt-shrink:640:0.image?traceid=20230227174332DA60910EFE6C344C7866&amp;x-expires=2147483647&amp;x-signature=okFNlp6zeraUxFTj8uGC3VkVV30%3D" alt="" title="">  </p><p><strong>一是,在训练集群方面,</strong>目前大模型的训练使用的服务器通常都是搭载NVIDIA NVLink GPU模块作为标准机,而新华三能够提供H3C UniServer R5500 G5这样机型,其搭载了NVIDIA HGX A800 8-GPU 80G模块,能够支持英特尔Whitley平台和AMD Milan平台,最大支持2颗Icelake(40C、270W)或2颗Milan(64C、280W)的CPU,存储方面能够最大支持12个U.2 NVMe SSD,其中8个支持GDS(GDS, GPU Direct Storage),可以最大化地满足训练集群的算力需求。  </p><p>不仅如此,在2023年初,新华三还发布了搭载NVIDIA H800 NVLink模块的新一代机型R5500 G6,支持英特尔EGS和AMD Genoa平台,PCIe 5.0及400GE网络的加持,也能够给大模型的训练带来更高的算力提升。  </p><p>另外,一些大型互联网公司还会使用自研GPU Box搭配计算节点的方式组建训练集群,GPU Box里面会搭载NVIDIA NVLink GPU模块或其他厂商的OAM模组,而OAM是开源的GPU模块,由OCP社区服务器项目组下的OAI小组开发并制定标准。在这方面,新华三也是OAI2.0规范制定的重要参与者,后续在R5500 G6上,新华三也可支持不同厂家GPU的OAM模组。  </p><p><strong>二是,在推理集群方面,</strong>GPU推理集群的规模主要取决于业务预期的QPS并发需求,一般会多机多卡多实例部署。同样,新华三也提供了相关的产品以满足实际的业务需求,以H3C UniServer R5300 G5为例,其最大支持2颗英特尔Icelake(40C、270W)CPU,并可搭配多厂家多种类型的GPU产品,包括GPU、XPU、NPU等。  </p><p>而在大规模推理场景下,新华三 UniServer R5300 G5也支持多种类型的GPU方案,包括4 PCIe GPU方案、8 PCIe GPU方案和16 PCIe GPU方案,以应对不同客户不同算力的推理集群搭建需求。此外,在去年11月份,新华三还发布了基于AMD Genoa平台的GPU服务器R5350 G6,可实现90%的CPU性能提升和50%的内核数量提升,应该说多种类型人工智能加速卡的支持,可以帮助客户应对人工智能不同场景下对异构算力的需求。  </p><p><strong>三是,高性能存储和网络也是大模型训练的重要组成部分。</strong>其中,高性能存储一般采用分布式并行文件存储,而新华三CX系列存储,就采用了全对称分布式架构,可结合IBM Spectrum Scale,为客户提供高带宽、低延时的存储服务。  </p><p>以新华三CX5036为例,配置2颗5218 CPU、4块1T NVMe和32块6T SATA HDD,4节点集群部署,测试大文件小IO(4KB)平均单节点IOPS可达2.55W(随机读)、2.36W(随机写),多客户端并发(16MB)平均单节点带宽可达3.57GB/s(顺序读)、2.08GB/s(顺序写),单客户端单流16MB IO聚合带宽可达5.45GB/s、1MB IO聚合带宽3.7GB/s。  </p><p>高性能网络方面,通常有两种网络搭建方式:第一种是RoCE网络,作为互联网400G领域的市场领头羊,基于新华三提供的S9825/S9855交换机配合AI ECN方案,也可以迅速搭建大模型训练所需的高性能网络。与此同时,随着大模型训练所需网络带宽的不断提升,网络主芯片性能也会迅速增加,当800G/1.6T时代来临时,CPO/NPO交换机将会登上互联网舞台,在这方面新华三也提前做了布局,其S9825-32D32DO交换机,同时支持32个400G光模块接口和32个400G光引擎接口,后续可以平滑升级至51.2T平台;第二种方式是DDC方案,DDC网络架构(分布式分解结构)可以很轻易解决负载均衡和阻塞问题,同时也能实现更优的网络性能和更快的网络收敛。在这方面,新华三的DDC方案也在进行相关验证中。  </p><p>由此可见,从新华三智算基础架构的技术细节中,可以看到新华三以智算基础架构为超大模型训练构筑了坚实的底座,不仅能够为包括AIGC为代表的超大模型提供关键技术支撑,同时也是新华三率先成为百度文心一言的首批生态合作伙伴的关键所在。  </p><p><strong>释放智能化生产力“乘数效应”</strong>  </p><p>客观地说,智能化已经成为了当下中国产业升级和企业数字化转型中的新动能和驱动力。特别是由于线上线下生态及场景远比其他国家丰富、多元,中国经济中结构性的差异,以及细分行业中不同的应用场景需求,都给了基于AIGC为代表的新技术的创新以巨大的想象力,而新华三以智算架构构筑的超大模型底座,不仅可以帮助企业借助AIGC提升效率,创造新价值,持续推动产业智能化的升级,同时也让AI真正“扎根”百行百业奠定了关键基础,背后更体现出了全新的价值,可以从两个方面来做观察:  </p><p><img referrerpolicy="no-referrer" src="https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/f3a59c74357546fe8fdb0c988f5ce441~tplv-tt-shrink:640:0.image?traceid=20230227174332DA60910EFE6C344C7866&amp;x-expires=2147483647&amp;x-signature=dEI4BKWYukYdL445%2Bjv%2B7jemLOk%3D" alt="" title="">  </p><p><strong>一方面,是为AI超大模型的训练提供了坚实的技术支撑。</strong>随着关键技术与基础理论不断突破,大算力、大数据、大模型将成为未来AI发展的重点发展方向,由此带动自然语言处理、翻译模型、生成算法和数据集等细分要素持续提升,推动产出的内容细节、类型更丰富、质量更高。  </p><p>这背后显然离不开强大的算力和网络的支撑。而新华三打造的智算基础架构,基于新华三长期在ICT基础设施领域的沉淀,充分融合了其在计算、存储和网络等领域的优势,就切实地为超大模型训练提供了技术支撑。  </p><p>在此基础上,新华三还积极坚持前沿技术创新,其中全面支持在网计算的H3C P4可编程交换机,就能够支持Pytorch框架和DPDK UDP、RoCE通信方式,将数据需求聚合统一操作,优化通信网络拥堵,减少主机的数据处理量。据新华三内部实验室测算,使用H3C P4可编程交换机加速数据并行训练,模型训练精度不受影响,计算节点间通信数据量平均减少30%,最多可以减少48%的训练时间,可大幅提升分布式集群的整体训练效率,创造更加出色的应用价值。可以说在产品、技术和方案上的领先性,是新华三差异化的优势所在,更是其能够助力各类企业AIGC展开研发和推进的价值所在。  </p><p><strong>另一方面,新华三还正与产业各方积极合作,探索新范式和新路径,推动普惠算力更为广泛地落地,使能百行百业的智能化升级,共同推进中国人工智能产业的发展。</strong>  </p><p>这方面,新华三率先成为百度文心一言首批生态合作伙伴就是具体的印证。众所周知,今天AI正在极大改变人们的生活方式,目前也正在开始加速渗透到企业的研发设计、生产制造、供应链管理、客户服务等各个环节,深刻改变着人们的生产方式。  </p><p>因此,以提升效率和优化配置为核心主题的AI应用和创新,是数字经济深化发展的全新阶段,更是传统产业转型升级的必然要求。在这种大背景下,新华三和包括百度在内的产业合作伙伴通力合作,并通过旗下丰富的产品和解决方案为百行百业的用户注入云原生及人工智能技术,也能加速整个行业的智能化升级,释放智能化生产力“乘数效应”。  </p><p>总的来说,中国产业智能化的转型升级,中国数字经济的落地和发展,任重而道远。在此过程中,新华三以全新的智算架构支撑超大模型训练,并与产业合作伙伴深度合作,让AIGC这样的新技术能够加速行业落地的步伐,而这种创新力、前瞻力和爆发力,相信也将能够推动中国的人工智能产业呈现出“百花齐放”的状态,更能够提速整个行业智能化时代的到来,这不仅是未来的趋势所在,也是新华三不断创新与突破的重要体现。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 09:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387147</guid>
            <link>https://aijishu.com/a/1060000000387147</link>
        </item>
        <item>
            <title><![CDATA[神奇的MTE Tag在哪里?]]></title>
            <description><![CDATA[<p>常有人问MTE Tag在哪里?</p><h4>MTE Tag存在于两个地方:</h4><ol><li>MTE tag放在访问地址的bit 56:59,比如通过LDR Xm, [Xn]访问内存,Xn里面存放的是访问地址,当MTE使能的时候,真正用于访问内存的地址是bit 0:47(不考虑arm的52bit地址扩展)和bit 55 (bit55用于决定是高虚拟地址空间还是低虚拟地址空间),bit 56:59 这4个bit用于存放该地址的tag<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSb" alt="1.jpg" title="1.jpg"></li></ol><p>Xn的Tag生成和插入可以IRG,ADDG,SUBG等这些指令来实现:</p><ul><li>IRG Xn, Xn:为Xn中的地址生成一个随机的Tag,并插入到Xn的bit 56:59</li><li>ADDG Xm,Xn,#offset,#Tag  or</li><li>ADDG Xm,Xn,#offset,#Tag: 对Xn中的地址进行加减操作,并将指令中的Tag值插入到目的寄存器中</li></ul><p>当然软件也可以直接通过一般的指令直接改Xn寄存器的bit 56:59,比如<br>AND Xn, Xn, #~(0xf&lt;&lt;56)</p><ol start="2"><li>MTE tag放在内存中(内存可以是cache或是外部内存):<br>  每16-bye的物理地址空间有与之对应的4-bit的Tag存储空间<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSc" alt="7.jpg" title="7.jpg"></li></ol><p>在cache中,可以如下类似方式存储一个cache line(较新处理器Data cache都是PIPT的)对应的Tag:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSd" alt="12.jpg" title="12.jpg"></p><p>对于外部内存,实际系统中设计上,可以设计为在同一系统内存中大部分内存作为正常的数据存储使用,一部分内存用于存储数据对应的Tag(其关系是4-bit/16-byte, 既Tag的存储空间大小是正常数据存储大小的1/32)。每16-byte的物理内存对可以找到与之对应的4-bit Tag存储物理内存。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSe" alt="8.jpg" title="8.jpg"></p><p>下面通过一实例来演示。<br>假设访问的地址放在X0中<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSb" alt="1.jpg" title="1.jpg"></p><ol><li>为这个地址产生设置一个Tag,可以通过IRG指令来实现<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSf" alt="2.jpg" title="2.jpg"></li><li>将这个Tag保存到Tag存储内存,可以通过,STG,STGZ, ST2G / STZ2G这些指令来实现<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSg" alt="3.jpg" title="3.jpg"></li><li>对Tagged内存进行load/store访问,这会触发硬件的tag check操作<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSh" alt="4.jpg" title="4.jpg"></li></ol><p>在这个例子里面X0里面的tag和内存中保存的tag是match的,因此Tag Check成功。</p><ol start="4"><li>通过ADDG指令修改Xn中地址的Tag<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSi" alt="5.jpg" title="5.jpg"></li><li>对Tagged内存进行load/store访问,这会触发硬件的tag check操作<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSj" alt="6.jpg" title="6.jpg"></li></ol><p>X0里面的tag和内存中保存的tag不match,因此Tag Check失败。</p><h4>Tag存储和check的示例</h4><p>以上内容阐述了tag存储和check的基本知识,下面以一个实际的例子来帮助更深入理解。<br>我们从上面的IRG,STG,LDR/STR等指令可以看出,Tag的存储在软件上看并没有独立的访问地址,对Tag的访问是使用其对应的数据访问地址:</p><ol><li>如果数据在处理器的cache中,那么其该数据所在的cache line也可以包含数据对应的Tag, MTE Tag check可以在CPU中进行。</li><li>但如果数据不在cache中(cache的大小有限),那么就需要将数据和Tag存放在系统内存(DRAM)中。那系统如何在系统内存中存放和访问数据和Tag呢?Tag check发生在哪里?<br>我们以一个使用CI-700的系统为例。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSk" alt="9.jpg" title="9.jpg"></li></ol><p>CI-700可以包含支持MTE Tag的system cache, 除此之外,它还可以包含MTSX,而MTSX包含:</p><ol><li>支持计算一个访问地址在DRAM中对应的Tag访问地址的split logic, 通过软件设置的Tag_base_address, split logic可以换算出一个地址对对应的Tag在DRAM存放的位置。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSe" alt="8.jpg" title="8.jpg"></li><li>支持Tag check (Tag 比较)</li><li>支持对专门只缓存Tag值的MTE Tag cache,这是一个可选的功能。</li></ol><p>MTSX split logic可以将CPU发送的Tagged address访问拆分成正常的数据访问和对Tag的访问,从而使DMC不需要区别正常数据访问和Tag访问(DMC对数据还是Tag访问无感,DMC不需要对MTE做特殊的支持)。</p><p>以STG X0,[X0]为例,这个指令如果在cache中miss,那么将产生一个TagOps为Update的CHI transaction,传输到MTSX,这个transaction包含放在X0中的数据访问地址和Tag Value。MTSX的split logic负责换算出这个数据访问地址对应的Tag在DRAM中的地址,然后使用这个地址将Tag value更新到DRAM中。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSl" alt="10.jpg" title="10.jpg"></p><p>如果一个Tagged address的数据从cache中write back到DRAM中,将产生一个TagOps为Match的CHI transaction, 传输到MTSX, 这个transaction包含数据访问地址,数据值和Tag Value,MTSX的split logic负责其拆分为:</p><ol><li>Tag访问:换算出这个数据访问地址对应的Tag在DRAM中的地址,从这个地址中取出Tag值,然后由MTSX的Tag Compare logic比较取出Tag值和transaction带有的Tag Value。</li><li>正常数据写操作<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSm" alt="11.jpg" title="11.jpg"></li></ol>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 08:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387141</guid>
            <link>https://aijishu.com/a/1060000000387141</link>
        </item>
        <item>
            <title><![CDATA[河南农信社数字化转型实践方案]]></title>
            <description><![CDATA[<p>农信机构立足地方“三农”,普遍规模较小,高地域集中度在县域和农村地区,容易受到地方农村经济脆弱性的影响。</p><p>农信机构由于信贷项目要求多,单笔贷款业务批复的额度相对较小,在信用档案登记环节,造成业务量和工作量相对较多。同时,信用信息采集不够精确,不能全面且合理地评定农民信用等级,最终结果就是贷款主题的信用评级被高估,部分贷款主题获得超出实际所需额度的贷款,不能予以偿还,提高了农信系统的不良率。</p><p><strong>农信社信贷普遍面临担保条件难以落实、营销运营成本高、人员操作道德风险大、客户授信主观化、办理速度慢等问题。</strong></p><p>数字化转型是一场科技革命,能够精准解决农村普惠金融推进过程中的痛点。农信社以数字综合治理为契机,加强数据全周期管理,建立数据治理长效机制,提升农信社核心竞争力,为数字化转型奠定基础。多举措提升创新研发和数字应用能力。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMrZ" alt="2.png" title="2.png"></p><h2>河南农信的数字化实践</h2><p>农信系统改革,是2023年银行业的“重头戏”。11月23日,《河南日报》报道了河南省农信社改革进展。据报道,河南省农信社改革方案已获得银保监会批复,将通过组建河南农商联合银行,自上而下理顺股权结构,完善公司治理,推进系统重塑,提升全省农信社体系健康度,充分发挥其地方金融“压舱石”的作用。基于对自身的调研、思考和探索,河南农信给出了数字化转型的应对之策。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRS" alt="图片1.png" title="图片1.png"></p><p><strong>建立高效的数字化架构。</strong>通过构建数字化的IT支撑平台,形成数据开发、共享、使用和管理流程机制,完成向现代银行、智慧银行的数字化转型,将存贷汇、融资理财、在线信贷、金融咨询等标准化产品嵌入各种场景,把金融服务融入客户工作和生活,从而吸引客户、留住客户,增强客户的黏性和忠诚度。</p><p><strong>建设数字化授信体系。</strong>全面推进农户、个体商户、社区居民的信息采集、加工、评价和维护、加快客户信息系统建设和大数据技术应用,对小微经营户、农户信用风险进行数量化精确计量,通过采集高度简化的现场客观信息和互联网大数据信息,实现低成本、高效率、客观准确的授信决策。</p><p><strong>增强业务风险管理水平。</strong>运用大数据、人工智能、建模等技术,引入顶象无感验证,发挥智能风控的决策支持作用,构建和不断优化风控分析模型,建立营销、评级、授信、用信、审批、预警、清收等端到端的反馈机制,强化贷前、贷中、贷后全流程风险管理,从根本上提升风险防控效率和水平。</p><p><strong>优化线上营销服务。</strong>开展范围广泛、影响力大的线上营销活动,统筹安排和有效支持精准营销活动,开展线上营销培训,提高全员线上营销服务意识和能力;要通过数据整合、数据分析和数据运算,形成数据洞察能力,对客户进行精准画像,采取交叉销售,定向推荐等差异化营销策略,实现精准营销、智能营销。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRU" alt="640.jfif" title="640.jfif"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMrZ" alt="2.png" title="2.png"></p><h2>验证码助力数字化转型</h2><p>验证码是智能风控的重要组成部分,作为人机交互界面经常出现的关键要素,是身份核验、防范风险的重要组成,也是用户交互体验的第一关口,广泛应用金融服务上。</p><p>2020年2月,中国人民银行发布新版《网上银行系统信息安全通用规范》提出,从系统构成、客户端运行环境、短信/图形验证码、生物特征、通信链路等环节要求。特别提到,金融机构应通过行为分析、机器学习等技术不断优化风险评估模型,结合生物探针、客户行为分析等手段,切实提升安全防护能力。</p><p>2020年7月,中国银保监发布《商业银行互联网贷款管理暂行办法》,要求商业银行应当对互联网贷款业务建立全面等下管理体系,在贷前、贷中、贷后全流程进行风险控制。</p><p>顶象无感验证以防御云为核心,集13种验证方式,多种防控策略,以智能验证码服务、验证决策引擎服务、设备指纹服务、人机模型服务为一体的云端交互安全验证系统。其汇集了4380条风险策略、112类风险情报、覆盖24个行业、118种风险类型,防控精准度&gt;99.9%,1天内便可实现从风险到情报的转化,行业风险感知能力实力加强,同时支持安全用户无感通过,实时对抗处置能力更是缩减至60s内。</p><p>截至目前,顶象无感验证已为100多家金融机构提供专业服务。</p><hr><p>业务安全大讲堂:<a href="https://aijishu.com/link?target=https%3A%2F%2Fjinshuju.net%2Ff%2FtYyi3u" target="blank">立即报名</a></p><p>业务安全产品:<a href="https://aijishu.com/link?target=https%3A%2F%2Fuser.dingxiang-inc.com%2Fuser%2Fregister%23%2F" target="blank">免费试用</a></p><p>业务安全交流群:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.dingxiang-inc.com%2Fblog%2Fpost%2F599" target="blank">加入畅聊</a></p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387115</guid>
            <link>https://aijishu.com/a/1060000000387115</link>
        </item>
        <item>
            <title><![CDATA[南芯科技公开带预唤醒功能的Type-C接口插入检测电路方案]]></title>
            <description><![CDATA[<p>【爱集微点评】南芯科技公开的带预唤醒功能的Type-C接口插入检测电路方案,该方案通过增加Type‑C接口预唤醒电路,在接口电路休眠时,可以将Type‑C接口检测电路关闭。从而实现减低系统待机功耗的同时实现接口插入检测功能,通过简单的电路结构解决了Type‑C接口插入检测和低功耗之间的矛盾。</p><p>集微网消息,在集成电路应用当中,特别是手机或者充电设备的Type‑C接口电路应用中,通常为了降低系统待机功耗,在未检测到手机或者充电设备插入时,整个系统会进入休眠模式。</p><p>但是为了快速响应手机或者充电设备的插入,在休眠时Type‑C接口检测电路需要一直工作,这就大大增加了系统休眠时的待机电流,从而大大缩短电池的续航时间。</p><p>为此,南芯科技在2022年3月11日申请了一项名为“一种带预唤醒功能的Type-C接口插入检测电路”的发明专利(申请号:202210236444.X),申请人为上海南芯半导体科技股份有限公司。</p><p>根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/522483438041.0886.png" alt="image" title="image"></p><p>如上图,为该专利中公开的充电设备端和手机端上设置的Type‑C接口检测电路通过Type‑C数据线连接的结构示意图。可以看到,在手机或者充电设备(如适配器、充电宝等)的Type‑C接口电路应用中,为了快速响应手机或者充电设备的插入,在休眠时Type‑C接口检测电路需要一直工作。这就大大增加了系统休眠时的待机电流,从而大大缩短了手机或者充电设备的电池的续航时间。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1435664442736.5054.png" alt="image" title="image"></p><p>如上图,为现有方案中Type‑C接口检测电路的电路连接示意图。在充电设备端,P型开关管M2的源端连接电源VDD,栅端连接控制信号EN_Rp,漏端连接上拉电流源Irp的源端。Irp的输出端连接到引脚CC,引脚CC同时连接到检测比较器P的反向端,比较器P的正向端连接参考电压VREF,比较器P输出信号为CC_DET_P。</p><p>在手机端,N型开关管M1的源端连接GND(即接地),栅端连接控制信号EN_Rd,漏端连接下拉电阻Rd的一端,下拉电阻Rd另一端连接到引脚CC。引脚CC同时连接到检测比较器D的同向端,比较器D的反向端连接参考电压VREF,比较器D的输出电压为CC_DET_D。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/168830725881.94025.png" alt="image" title="image"><br>在该专利中,主要通过在Type‑C接口检测电路的基础上增加预唤醒电路,在休眠时关闭Type‑C接口检测电路,来降低系统待机功耗。在设备插入时,通过触发预唤醒电路,再将Type‑C接口检测电路使能,实现快速响应设备的插入。</p><p>如上图所示,该检测电路包括:Type‑C接口检测电路以及Type‑C接口预唤醒电路。该充电设备端接口检测电路包括P型开关管M2、上拉电流源Irp和比较器P。手机端接口检测电路包括N型开关管M1、下拉电阻Rd和比较器D。</p><p>充电设备端接口预唤醒电路包括P型开关管M3、上拉电阻Rp_Pre、P型开关管M4、电阻R1、电阻R2以及反相器PI1。手机端接口预唤醒电路复用手机端接口检测电路的N型开关管M1和下拉电阻Rd。此外,手机端接口预唤醒电路还包括N型开关管M5、电阻R3、电阻R4和反相器PI2。</p><p>该装置的工作原理如下:在充电设备端,通过开关管M3和上拉电阻Rp_Pre实现上拉功能,开关管M4、电阻R1以及R2实现Rd插入预唤醒功能。在充电设备接口休眠时,开关管M3栅极控制电压为0,开关管M2栅极控制电压为1,关闭Irp上拉电流源,同时比较器P处于关闭状态。在手机端,下拉电阻部分将复用接口检测电路部分,开关管M5、电阻R3以及R4实现上拉插入预唤醒功能。在手机端接口休眠时,开关管M1栅极控制电压为1,打开M1,通过电阻Rd实现下拉,同时比较器D处于关闭状态。</p><p>引脚CC没有插入上拉时,CC引脚被Rd和M1下拉至GND,CC引脚通过ESD保护电阻R4接到开关管M5栅极,M5处于关断状态,输出被电阻R3上拉至VDD。然后经过反相器,输出为低,整个Type‑C接口电路没有工作电流,系统功耗很低。</p><p>当引脚CC插入上拉时,CC引脚电压即为开关管M5栅极电压,M5被打开,将信号拉低,输出CC_DET_D_PRE即为高电平。从而实现上拉插入预唤醒,然后打开比较器D,Type‑C接口检测电路将开始工作。</p><p>以上就是南芯科技公开的带预唤醒功能的Type-C接口插入检测电路方案,该方案通过增加Type‑C接口预唤醒电路,在接口电路休眠时,可以将Type‑C接口检测电路关闭。从而实现减低系统待机功耗的同时实现接口插入检测功能,通过简单的电路结构解决了Type‑C接口插入检测和低功耗之间的矛盾。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387106</guid>
            <link>https://aijishu.com/a/1060000000387106</link>
        </item>
        <item>
            <title><![CDATA[解密禾赛科技最新激光雷达专利]]></title>
            <description><![CDATA[<p>【爱集微点评】禾赛科技的激光雷达专利,通过色散偏折件实现多波长光源所产生光线的分光和出射,同时色散偏折件还能起到扩束的作用,能够有效增大激光雷达的口径,提升测远能力。而且不会过多增加激光雷达的光路高度,有效的压缩了激光雷达的高度和体积。</p><p>集微网消息,近日,禾赛科技在纳斯达克成功上市,意味着中国“激光雷达”向全球又迈进了一步,同时禾赛科技也成为中国“激光雷达第一股”。</p><p>激光雷达是一种常用的测距传感器,其工作原理是利用激光往返于雷达和目标之间所用的时间,或者调频连续光在雷达和目标之间往返所产生的频移来评估目标的距离或速度等信息。为了获得较大的视场范围,激光雷达通常采用扫描装置进行扫描。激光雷达常用的扫描方式有机械旋转式、反射镜扫描式、光学相控阵(OPA)扫描、Flash扫描等。另外,还有一种扫描方式是波长扫描。波长扫描的扫描装置是利用光栅、棱镜等色散元件基于波长将多波长光源产生的光线分开以达到扫描的效果。但是现有波长扫描的扫描装置往往存在装配不方便的问题。</p><p>为此,禾赛科技于2022年8月29日申请了一项名为“激光雷达的发射模块及激光雷达”的发明专利(申请号:202222291141.6),申请人为上海禾赛科技有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1126334138789.4883.png" alt="image" title="image"></p><p>图1 波长扫描装置的光路示意图</p><p>图1为传统波长扫描装置的光路示意图,在激光雷达的应用中,通过不同波长的光线向不同角度衍射来实现激光雷达对不同垂直角度的扫描。因此,为了使多束衍射光的出射方向靠近水平面,实现对垂直0°角和垂直方向正角度和负角度一定范围的扫描,如图1所示,通常在色散元件12下游的光路中会设置反射镜13。但是反射镜13的反射面与水平方向之间的夹角较大,所以会增大光路沿垂直方向的尺寸,使得激光雷达光路垂直方向的高度增大,从而不利于激光雷达体积的缩小。此外,也会使激光雷达光路的不同光学元件在不同高度的水平面上,从而造成了激光雷达的安装不便。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1342321041364.585.png" alt="image" title="image"></p><p>图2 新型激光雷达发射模块结构示意图</p><p>图2为本专利提出的一种新型激光雷达发射模块结构示意图,在此主要引入色散偏折件129,其主要包括光栅层127和导光体128。光栅层127朝向导光体128的表面并与导光体128的表面直接接触。导光体128的两个表面分别为第一面121和第二面122,第一光线131从第一面121入射至导光体128,第三光线133自第二面122从导光体128出射。色散面和偏折面集成于一体化结构的导光体128上,能够使光学元件体积大幅缩小,并且一体化的光学元件结构更加稳定,能够有效提高光路的鲁棒性。此外,一般而言,导光体128材料的折射率大于1。将导光体128的材料设置为比较常见的大于1的材料以控制折射角度,可以实现扩束效果。</p><p>简而言之,禾赛科技的激光雷达专利,通过色散偏折件实现多波长光源所产生光线的分光和出射,同时色散偏折件还能起到扩束的作用,能够有效增大激光雷达的口径,提升测远能力。而且不会过多增加激光雷达的光路高度,有效的压缩了激光雷达的高度和体积。</p><p>禾赛科技是一家致力于激光雷达研发与制造的全球化公司,其客户遍布全球主流汽车厂商、自动驾驶和机器人公司,覆盖40个国家和90多个城市。作为以技术为核心竞争力的公司,禾赛科技的成功并非偶然,而是在多年的产品打磨和技术投入中诞生的。中国需要有世界级自主研发能力的公司,相信禾赛科技也有实力成为全球领先企业。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387119</guid>
            <link>https://aijishu.com/a/1060000000387119</link>
        </item>
        <item>
            <title><![CDATA[优秀的IC/FPGA开源项目(六)-手语字母翻译器]]></title>
            <description><![CDATA[<p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQU" alt="image.png" title="image.png"></p><p>《优秀的IC/FPGA开源项目》是新开的系列,旨在介绍单一项目,会比《优秀的 Verilog/FPGA开源项目》内容介绍更加详细,包括但不限于综合、上板测试等。两者相辅相成,互补互充~</p><hr><p>一种智能手套,可将手语字母翻译成带显示器的书面字母。</p><h1>绪论</h1><p>在这个项目中,我们的主要目的是开发一款智能手套,帮助使用手语的人在日常生活中轻松交流。</p><p>学习手语是一个要求很高的过程。因此,许多健康人并不了解这个过程。在这款智能手套的帮助下,那些健康的人将能够理解那些使用手语的人。智能手套还可以用作想要学习手语的健康人的模拟器。</p><p>这个项目主要涉及到模拟字母,字母是语言的基石。在这个项目中,我们使用 FPGA 来实现将手势模拟为视觉字母的算法。检测手势是通过手指上的柔性传感器测量出手的形状。vga监视器用于直观显示FPGA中转换为字母的手势。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQW" alt="image.png" title="image.png"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQX" alt="image.png" title="image.png"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQY" alt="image.png" title="image.png"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQZ" alt="image.png" title="image.png"></p><p>上三图说明了 VGA 控制器产生的时序信号。控制器包含两个计数器。一个计数器在像素时钟上递增并控制 h\_sync(水平同步)信号的时序。通过将其设置为显示时间从计数器值 0 开始,计数器值在显示时间内等于像素的列坐标。水平显示时间之后是消隐时间,消隐时间包括水平前沿、水平同步脉冲本身和水平后沿,每个都有指定的持续时间。在行的末尾,计数器重置以开始下一行。v\_sync 计数器在垂直轴内应用相同的操作。</p><p>使用这些计数器,VGA 控制器输出水平同步、垂直同步、显示启用和像素坐标信号。每个 VGA 模式的同步脉冲被指定为正极性或负极性。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ0" alt="image.png" title="image.png"></p><p>我们首先创建随机图像并使用 RGB 信号改变它们的颜色,如上图所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ1" alt="image.png" title="image.png"></p><p>要在屏幕上显示文本或字符串,有一个众所周知的 Font Rom Map -上图 - 包括所有 ASCII 字符(每个字符为 8x16 位)。通过使用 Font Rom,我们的代码现在能够在显示器上书写文本或字母,如下图所示 。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ2" alt="image.png" title="image.png"></p><p>为了转换来自柔性传感器的模拟数据,我们使用了ADC-每通道具有 12 位分辨率。由于 4 个手指足以执行大多数手语字母,因此一个 4 通道ADC就足够了。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ3" alt="image.png" title="image.png"></p><p>ADC的通信的逻辑如下图所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ4" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ5" alt="image.png" title="image.png"></p><p>作为总结,项目的架构如下图所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ6" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ7" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ8" alt="image.png" title="image.png"></p><p>作为参考手语,我们使用了ASL,它具有下图中的手势。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ9" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRa" alt="image.png" title="image.png"></p><p>现在执行工程就可以识别到上图中标记的字母。</p><p>工程链接:</p><blockquote><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fumuttoksoy%2F10ISTK---Sign-Language-Translator" target="blank">https://github.com/umuttoksoy/10ISTK---Sign-Language-Translator</a></blockquote><blockquote>原文:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FcvBboi8DlRSWQzCUUpyTsw" target="blank">OpenFPGA</a>  <br>作者:碎碎思</blockquote><p><strong>相关文章推荐</strong></p><ul><li><a href="https://aijishu.com/a/1060000000384570"><strong>从FPGA说起的深度学习(三)</strong></a></li><li><a href="https://aijishu.com/a/1060000000383485"><strong>从FPGA说起的深度学习(二)</strong></a></li><li><a href="https://aijishu.com/a/1060000000383015"><strong>使用 AXI CDMA 制作 FPGA AI 加速器通道</strong></a></li><li><a href="https://aijishu.com/a/1060000000381372"><strong>从FPGA说起的深度学习(一)</strong></a></li></ul><blockquote>更多FPGA干货请关注<a href="https://aijishu.com/blog/fpgadeluoji"><strong>FPGA的逻辑</strong></a>技术专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387048</guid>
            <link>https://aijishu.com/a/1060000000387048</link>
        </item>
        <item>
            <title><![CDATA[灵动微课堂 |FlexCAN OTA]]></title>
            <description><![CDATA[<h1><strong>1 简介</strong></h1><p>FlexCAN OTA 是由灵动提供的一种基于 UDS 协议使用 CAN 总线实现对 MCU 的 App 固件更新的解决方案。该解决方案的软件部分主要由:Bootloader、App和PC Tool三部分构成,硬件部分如图 1 所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRw" alt="image.png" title="image.png"></p><p><strong>1.1&nbsp; 关键特性&nbsp;&nbsp;</strong></p><p>基于 UDS(ISO14229) 标准</p><p>基于 CAN(ISO11891-1) 标准</p><p>具备对 App 固件 CRC 完整性校验功能</p><p>使用主机上传 Flash driver 到 MCU</p><p>在 Bootloader 中进行 App 有效性检查</p><p>提供用于验证 App 固件更新的 PC 端上位机工具</p><p><strong>1.2 &nbsp;什么是 FlexCAN ?&nbsp;</strong></p><p>CAN 是控制器域网 (Controller Area Network, CAN) 的简称,是一种功能丰富的车用总线标准,被设计用于在不需要主机(Host)的情况下,允许网络上的单芯片和仪器相互通信。是由研发和生产汽车电子产品著称的德国 BOSCH 公司开发,并最终成为国际标准(ISO11898),是国际上应用最广泛的现场总线之一。</p><p>FlexCAN 是 CAN 协议的一个高完成度版本。以灵动 MM32F0140 系列 MCU 内嵌的 FlexCAN 为例,其符合 ISO 11898-1 标准,支持 CAN 2.0B 版本协议,位速率高达 1 Mbps,具有非常灵活的用于传输和接收的邮箱系统,可以接收和发送 11 位标识符的标准帧,也可以接收和发送 29 位标识符的扩展帧,主要被设计用作车载串行总线,可满足实时处理、车辆在电磁干扰环境下的可靠操作、成本效益、带宽等要求。</p><p><strong>1.3 &nbsp;什么是 UDS ?&nbsp;</strong></p><p>UDS(Unified Diagnostic Services,统一诊断服务)是一种用于汽车电子控制器 ECU (Electronic Control Units) 环境下的一种诊断通信协议,可实现诊断、固件更新、日常测试等功能,在 ISO 14229 中规定了其实现标准。</p><p>在本实例中,UDS 通信是在客户端-服务端关系中执行的。客户端是上位机下载软件运行于 PC 机,服务端是带有FlexCAN IP模块的 MM32 MCU。例如,将 CAN 总线接口连接到 MCU,并将 UDS 请求发送到 MCU。当 MCU 支持 UDS 服务时,它将根据客户端发出的请求做出相应的响应。</p><p><strong>1.4 &nbsp;为什么用 Bootloader ?&nbsp;</strong></p><p>对于 MCU 而言,如果程序内置有基于FlexCAN 的 Bootloader,则每次更新 MCU 的固件则不需要拆开外壳也不必再使用烧录器进行烧录,而可直接通过 CAN 总线来更新程序,这样更方便也更安全,而且随着智能化的普及,甚至可以对 MCU 进行远程升级。Bootloader 程序结构对比如图 2 所示:</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRx" alt="image.png" title="image.png"></p><p><strong>1.5 &nbsp;为什么基于 UDS ?&nbsp;</strong></p><p>为了规范 Bootloader 的全过程,通过使用成熟的平台进而提供高质量 Bootloader。因 UDS 在设计时考虑了 Bootloader 的需求,并为 Bootloader 提供了相关服务以供使用,比如诊断会话控制、ECU 重置、读取数据、请求下载、传输数据、请求传输退出等,可以实现更高效和可靠的刷写功能。故主机厂普遍会要求在 UDS 规范的基础上完成 Bootloader 功能。</p><p><strong>1.6 &nbsp;用到了哪些 UDS 服务?&nbsp;</strong></p><p>在 Bootloader 中,使用到 UDS 的 $10、$11、$27 和 $3E 基础诊断服务,$22、$2E 读写 DID 服务,$31、$34、$36 和 $37 固件数据传输相关服务。UDS 服务概览如表 1-1 所示:</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRy" alt="image.png" title="image.png"></p><h1><strong>2 Bootloader</strong></h1><p>Bootloader 是一段允许在不使用烧录器的情况下更新App固件的代码,基于灵动 MindSDK 实现的 Bootloader 样例工程支持 MDK、IAR 和 ARMGCC 三种工具链进行开发。在实际的使用过程中只需要在第一次使用时通过烧录器将 Bootloader 烧录进 MCU,后续的 App 都可以通过使用基于 CAN 总线的 UDS协议完成固件更新。</p><p><strong>2.1&nbsp; Bootloader 功能特性&nbsp;&nbsp;</strong></p><p>支持 Service 27,用户可根据自身需求添加安全访问算法。</p><p>支持 Service 22 和 Service 2E,用户可以根据自身需求添加策略,进行信息读出与存储。</p><p>外置 Flash driver,使用时通过外部 PC 或后台将 Flash driver 加载到 MCU 的 RAM 中进行安全的 Flash 擦写操作。</p><p>提供看门狗监控功能,用户可根据自身需求选择性开启看门狗监控程序。</p><p><strong>2.2&nbsp; 客制化修改说明&nbsp;&nbsp;</strong></p><p><strong>修改诊断 ID</strong></p><p>可在样例工程的 board/FblHalCan.h 中修改诊断 ID 的值。</p><p><strong>指定数据填充值</strong></p><p>当需要发送的数据长度不满足 8 字节长度时,通过宏定义可以更改填充,用户可以在样例工程的 board/FblHalCan.h 中指定填充值。</p><p><strong>使能看门狗</strong></p><p>用户可以在样例工程的 board/FblMacros.h 中打开宏开关 WDG\_ENABLE 使能看门狗服务,并且实现 ResetWdg 操作。</p><p><strong>安全访问算法接口</strong></p><p>Bootloader中支持 27 Service,用户可在样例工程的 board/FblMacros.h 中使能宏开关 ENABLE_SECURITY_ALGORITHM_VERIFICATION 根据自身需求添加安全访问算法。</p><p><strong>2.3&nbsp; Flash driver 介绍&nbsp;&nbsp;</strong></p><p><strong>什么是Flash driver?</strong></p><p>在OTA程序升级过程中,发送App可执行文件之前,向底层先发送一段二进制文件,这段代码实现了对MCU片内 Flash 的擦写功能,称为 Flash driver。</p><p><strong>Flash driver存在的意义</strong></p><p>在车载ECU控制器中,为了安全考虑,会尽可能的避免在代码中固化有对flash进行擦写操作,主要为了避免在程序跑飞时误调用该部分代码,使软件代码部分受到破坏。</p><p><strong>Flash driver的实现方式</strong></p><p><strong>a.</strong> 将flash driver固化在底层flash中,在运行的时候将flash中的flash driver拷贝到ram中来运行,这是比较传统的方式,但是避免不了提到的安全性问题。</p><p><strong>b.</strong> 将flash driver这段代码保存在PC端或后台,在每次执行OTA升级前,将这段代码先发送给MCU,这样可以避免方式 a 中提到的安全性问题。</p><h1><strong>3 App</strong></h1><p>基于灵动 MindSDK 提供的 flexcan\_ota\_app 样例工程进行开发和生成用于更新的 HEX 格式 App 固件生成,无需任何适配操作即可生成用于 OTA 升级的 App 固件。</p><p><strong>3.1&nbsp; 使用说明&nbsp;&nbsp;</strong></p><p>将 Bootloader 通过下载器下载到 MCU 中后,可通过提供的 PC Tool 来刷写生成的固件,通过 PC Tool 下载成功后,一方面 PC 终端会有下载成功提示,另一方面也可以查看开发板上对应固件实现的功能是否开始执行。</p><p>关于 App 固件可从提供的 flexcan\_ota\_app 样例工程编译源码并将生成“.hex”格式的 App 固件进行加载。</p><p><strong>3.2&nbsp; App 设计规范&nbsp;&nbsp;</strong></p><p>App 与 Bootloader 存放在 MCU 的同一块 Flash 的两个不同区域中,为保证两个软件的正常使用,App 设计遵循表 2-1 和表 2-2 所述规范。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRz" alt="image.png" title="image.png"></p><h1><strong>4 PC Tool</strong></h1><p>Flexcan OTA PC Tool 是用于验证灵动 MindSDK 中提供的 FlexCAN OTA 解决方案的简易 PC 端上位机工具。</p><p><strong>4.1&nbsp; 功能特性&nbsp;&nbsp;</strong></p><p>支持 CAN 通信速率自定义</p><p>支持 Win10 操作系统下运行</p><p>支持默认参数直接运行和命令行下带参数运行</p><p>支持直接加载 MDK 和 IAR 工具链下生成的 HEX 格式文件</p><p>基于 Python 使用 python-udsoncan 开发,可根据不同需求灵活进行二次开发</p><p><strong>4.2&nbsp; 开发环境&nbsp;&nbsp;</strong></p><p>本工具在 Win10 平台使用 Python 进行开发,基于 UDS 使用 CAN 协议,支持 PEAK CAN卡与 MCU 进行通讯。</p><p><strong>4.3&nbsp; 使用说明&nbsp;&nbsp;</strong></p><p>请按照如下步骤进行操作:</p><p><strong>a 下载 Bootloader 到 MCU</strong></p><p>将提供的 flexcan_ota_bootloader 样例工程编译并下载到开发板中。</p><p><strong>b 安装 CAN 卡驱动并连接 MCU</strong></p><p>在这里我们用到的是PCAN-USB,下载并安装驱动(<a href="https://aijishu.com/link?target=https%3A%2F%2Fpeak-system.com.cn%2Fdriver%2F" target="blank">https://peak-system.com.cn/dr...</a>) ,并将 PCAN-USB 和开发板上的 CAN 收发器通过双绞线连接以及通过 USB 和 PC 机连接。</p><p><strong>c 运行 FlexCAN OTA PC Tool</strong></p><p>方式一:按照默认参数直接运行</p><p>直接双击 flexcan_ota_pc_tool_v1.0.exe,如图 3 所示,默认将按照 500Kbps 的比特率进行 CAN 通信,Flash_driver 文件的加载地址为当前路径下的文件(./flash_driver.hex), App 文件的加载路径为当前路径下文件(./app.hex)。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRA" alt="image.png" title="image.png"></p><p>方式二:按照指定参数运行</p><p>在 Win10 平台下启动命令行窗口并切换到当前路径下,获取帮助如图4所示,输入如下指令并按回车键:</p><pre><code>flexcan_ota_pc_tool_v1.0.exe&nbsp;-h&nbsp;</code></pre><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRB" alt="image.png" title="image.png"><br>按照指定参数运行如图 5 所示,输入如下指令并按回车键:</p><pre><code>flexcan_ota_pc_tool_v1.0.exe&nbsp;-b&nbsp;500000&nbsp;-f&nbsp;"./flash_driver.hex"&nbsp;-a&nbsp;"./app.hex"</code></pre><p>其中 flash_driver.hex 文件为用于安全地擦写片内 flash 的代码,在每次 OTA 更新中复用即可。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRC" alt="image.png" title="image.png"></p><p><strong>d 结束</strong></p><p>等待 FlexCAN OTA 固件更新流程结束,并按任意按键退出。</p><h1><strong>5 注意事项</strong></h1><p>FlexCAN OTA Tool 为用于验证基于 UDS 使用 CAN 协议进行 App 固件更新的上位机工具,PC 端使用 PEAK-CAN 与 MCU 通讯,仅支持在 Win 10 操作系统下运行,&nbsp;&nbsp; 且用于功能性验证,若遇到软件闪退等问题请重启该软件并复位 MCU。该工具可根据开发者项目需求进行二次开发。</p><p>以上介绍是基于MM32F0140 系列 MCU 进行介绍和示例演示,相关源码请访问灵动官网进行获取:</p><p><strong>01</strong></p><p>进入灵动官网(www.mm32mcu.com)</p><p><strong>02</strong></p><p>打开“产品”菜单下 MM32F0140 页面,浏览“文档”列表。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRD" alt="image.png" title="image.png"></p><p><strong>03</strong></p><p>在“应用笔记”中下载“AN0035_FlexCAN_OTA”文档,获取源码。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRE" alt="image.png" title="image.png"></p><p><strong>6 参考文献</strong></p><p>《ISO11898-1》</p><p>《ISO14229》</p><blockquote>作者:灵动MM32  <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2F87OMwn8rlluytkhuKJ-xXQ" target="blank">灵动MM32MCU</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000385095">灵动微课堂 |单独下载可执行文件到MM32F5微控制器</a></li><li><a href="https://aijishu.com/a/1060000000379844">基于灵动MM32 MCU的便携式血氧仪应用</a></li><li><a href="https://aijishu.com/a/1060000000378709">灵动微课堂 |使用MM32F3270基于Azure RTOS定时器组的应用</a></li><li><a href="https://aijishu.com/a/1060000000376861">灵动微课堂 | MM32L013x——LPTIM的应用介绍</a></li></ul><blockquote>更多MM32F5系列资料请关注<a href="https://aijishu.com/blog/lingdongmm32mcu">灵动MM32 MCU</a>专栏。如想进行MM32相关芯片技术交流,请添加极术小姐姐微信(id:aijishu20)加入微信群。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387086</guid>
            <link>https://aijishu.com/a/1060000000387086</link>
        </item>
        <item>
            <title><![CDATA[聊聊身边的嵌入式:价格不菲的护眼灯,是眼睛保护神还是智商税?]]></title>
            <description><![CDATA[<p>神兽归笼这个词,不知道哪位大师发明的,充分表达了广大家长望子成龙,却又忧心忡忡,寝食难安的心情。让家长们焦虑的,不只是孩子的学习,还有健康。就拿视力来说,一份官方的报告,看了也是让人心中一惊。近视率从小学的35.6%,到初中的71.1%,再到到高中的80.5%,一路攀高,估计到大学生,就更没法看了。</p><p>众多的商家,从中嗅出了机会,护眼台灯就是其中一种。市场上的台灯,也是鱼龙混杂。对于但求最贵,不求最好的主,价格成千乃至上万。若是囊中羞涩,或者说但求最好,不求最贵的买家,在拼XX上,十块八块也能买一个,据称也是专为读书设计,国AA级照度的护眼灯。</p><p>这水挺深!</p><p>对于一种产品,即使你用一大堆指标去测试,区别好像也不大,似乎都挺好。只有我们深入了解了它的工作原理,才能清楚其中奥秘。我们今天拆个某东上卖的挺火的台灯,看一下究竟有什么高科技。</p><ol><li><strong>护眼台灯拆解</strong></li></ol><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRk" alt="image.png" title="image.png"></p><p>这灯外观看着还是挺漂亮的。面板采用了触控设计,打开电源开关后,手指在滑条滑动,可以调整光的亮度。这灯拿在手里,沉甸甸的,满满的科技感。我们接下来拆开看一下。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRm" alt="image.png" title="image.png"></p><p>这一拆开,首先被这一坨铁惊住了!据说某个乐善好施的活雷锋,早年卖医疗设备,为增加科技感,用的就是这一招。不过跟这个还真不一回事儿,这个台灯没有这坨铁,估计就头重脚轻站不住了。电路分为两个大部分,上面大板子是触摸控制板,下面小板子是电源变换和调光模块。</p><p>台灯外配220V转24V的电源,电源变换和调光模块把24V转换成5V供给控制板。反过来,控制板输出的PWM,控制此模块输出电流的大小,来调光亮度。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRn" alt="image.png" title="image.png"></p><p>翻过来看一下,两个带线圈的电感,用来滤除输入电源干扰。电路板的核心是一个LED调光芯片,上面的丝印比较模糊,最后我们会推测一下它的型号。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRo" alt="image.png" title="image.png"></p><p>灯的中间是圆形的白色导光板,然后四周围有91颗侧面发光的LED灯珠。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRp" alt="image.png" title="image.png"></p><p>再来看一下触摸控制板部分,有两颗芯片,一颗负责触摸按键和滑条的检测,一颗负责LED指示灯的控制,以及根据手指在滑条的位置,输出占空比不同的PWM波给电源控制和调光模块。这两颗芯片没有丝印,我们只好推测一下了。如果雷同,纯属巧合。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRq" alt="image.png" title="image.png"></p><p>触摸控制板用塑料柱锁死在面板上了,拆下来就废了。所以我们来透视一下,大概能看出四个按键,以及触摸滑条的样子。根据实测,台灯的亮度并不是连续可调的,而是有7级亮度,所以触摸滑条的分辨率也不用做的很高。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRr" alt="image.png" title="image.png"></p><ol start="2"><li><strong>原理框图</strong></li></ol><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRs" alt="image.png" title="image.png"></p><p>根据电路推测,这个方案应该是用到了台系的芯片,通泰的调光芯片TTP933和触控单片机TTP258。从手册来看,TTP933的性能还是不错的。而TTP258居然是一个4位机,厂家为压缩成本这也是拼了。作为对比,我们从拼XX上买了一款12块钱的护眼灯,还在运输途中,等货到了后再拆开和大家一起研究一下。</p><p>如果我们留意身边的家电,就会发现触摸控制,用的越来越多起来。我们后续也会持续关注这一技术,并和大家一起探讨它的神奇之处。</p><hr><blockquote>作者:Norman<br>来源: <a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FYTjf85HBOVs1dTPGU02t2Q" target="blank">TopSemic嵌入式</a><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bV7v5" alt="aijishu_TopSemic_1.jpg" title="aijishu_TopSemic_1.jpg"></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000379643">MCU如何实现对外部脉冲信号的计数功能?</a></li><li><a href="https://aijishu.com/a/1060000000375025">老前辈教你选 TVS</a></li><li><a href="https://aijishu.com/a/1060000000368824">初始化串口后,低功耗模式下电流高是怎么回事?</a></li><li><a href="https://aijishu.com/a/1060000000368608">一网打尽,国产MCU厂商</a></li><li><a href="https://aijishu.com/a/1060000000354916">到底什么是I/O的驱动能力?</a></li></ul><blockquote>更多芯片嵌入式电子技术分享请关注<a href="https://aijishu.com/blog/topsemicqianrush"><strong>Topsemic嵌入式</strong></a>极术专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387075</guid>
            <link>https://aijishu.com/a/1060000000387075</link>
        </item>
        <item>
            <title><![CDATA[用人工智能设计芯片及对IC设计就业市场的影响]]></title>
            <description><![CDATA[<p>集成电路 (IC) 设计是一项复杂的工作,不断突破密度和性能的界限。现在,人工智能 (AI)在 IC 设计中的作用越来越大。</p><p>虽然 AI 最近因其在 ChatGPT 等自然语言处理器方面的惊人能力而受到更多关注,但该工具也被用于 IC 设计的各个阶段,包括设计优化、布局、仿真和验证。人工智能算法还可以帮助更有效地探索设计空间,比传统方法更快地发现最佳设计配置。</p><h5>随着设计变得比以往任何时候都更加复杂,人工智能可以成为 IC 设计师的强大资产。</h5><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRe" alt="image.png" title="image.png"></p><p>本文重点介绍了AI如何被用作IC设计的工具,以及这项技术如何影响IC设计工程师的专业价值。</p><p><strong>利用 AI 来实现严格的设计约束</strong></p><h3>由于数十亿个晶体管被限制在一个很小的芯片区域,IC 设计师的任务是在严格约束的情况下优化设计。&nbsp;</h3><p>首先,芯片面积必须最小,以适应当今设备的小尺寸,并降低制造成本。布局的功耗也是值得关注的;功耗同样会影响部署成本以及芯片对环境的影响。某些密集区域和配置容易过热,需要冷却机制或更巧妙的布局。考虑到这些因素和许多其他因素,IC设计人员大约需要八到九个月的时间来生成一个满足每个严格要求的芯片布局。</p><p>为了加快和优化 IC 设计流程,许多公司(包括科技行业的一些最大公司)现在都在投资 AI 工具来完成一些繁重的工作。</p><p><strong>谷歌人工智能在几个小时内设计出芯片</strong></p><p>据谷歌称,谷歌的深度学习强化学习 (RL) 方法可以在比人类工程师少得多的时间内生成有效的布局,而且结果在质量上也不相上下。</p><p>谷歌表示,谷歌的深度学习强化学习(RL)方法可以在比人类少得多的时间内产生有效的布局,而且结果在质量上也不相上下。2022年3月,谷歌研究院推出了PRIME,这是一种深度学习方法,利用现有的数据,如功率和延迟来创建加速器设计,比用传统方法设计的芯片更快、更小。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRf" alt="image.png" title="image.png"></p><p>谷歌研究人员使用 10,000 个芯片平面图来训练他们的模型。人工智能生成的芯片设计时间不到六个小时。谷歌表示,这种方法已经被利用来实现谷歌的张量处理单元(TPU),这是谷歌基于云的机器学习应用的一部分。</p><p><strong>EDA公司在AI设计系统上加倍投入</strong></p><p>不仅仅是谷歌转向机器学习模型。像Synopsys和Cadence这样的EDA公司也在其最新工具中使用到AI技术。比如最近,Synopsys凭借其 Synopsys DSO.ai 自主芯片设计系统注册了 100 个商业流片。该系统最近的客户包括 意法半导体(ST)和 SK Hynix。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRg" alt="image.png" title="image.png"></p><p>ST 和 Synopsys 于 2022 年 2 月初首次在微软的云端使用 DSO.ai 来设计工作芯片。使用 Synopsys 的 DSO.ai 设计系统,结合 Microsoft Azure 上的 Synopsys Fusion Compiler 和 IC Compiler,该工具将功耗、性能和面积 (PPA) 指标提高了 3 倍以上,总功耗降低了 25%,并且显著缩小了芯片尺寸。</p><p>除了芯片设计,人工智能还在芯片测试和验证中找到了应用——芯片制造商在这两个领域花费了大量时间。为了解决这一设计阶段的问题,西门子发布了Questa Verification IQ,这是一个帮助IC设计工程师加快验证过程的软件平台。</p><p><strong>英伟达用GPU设计GPU</strong></p><p>NVIDIA(英伟达)为芯片设计设计了另一种深度学习方法。该公司制作了一个名为PrefixRL的 RL 模型,证明 AI 可以从头开始学习电路设计,并使用最新的 EDA 工具制造更小、更快的电路。NVIDIA 的架构由 13,000 个使用 AI 技术设计的电路组成。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRh" alt="image.png" title="image.png"></p><p>针对自动化单元迁移,该公司开发了NVCell,可以无错迁移92%的单元库。人类工程师可以对剩下的 8% 没有自动迁移的单元进行处理。NVIDIA 首席科学家 Bill Dally 表示:</p><p><em>“所以这就像一个 Atari 视频游戏,但它是一个用于修复标准单元中的设计规则错误的视频游戏。通过强化学习来研究和修复这些设计规则错误,我们能够基本完成我们标准的设计单元。”</em></p><p><strong>人工智能对 IC 设计就业市场的影响</strong></p><p>虽然人工智能可以自动执行传统上由IC设计人员执行的某些任务,例如布局设计和优化,但它也减少了设计过程中对手动方面的需求。虽然这提高了整体效率,但也可能导致IC设计的某些领域的最终工作被取代。</p><p>另一方面,人工智能还可以帮助 IC 设计人员更高效、更有效地开展工作。例如,AI 可以分析大量数据并提供见解,建议工程师以前可能没有考虑过的设计替代方案。这种趋势可以提高 IC 设计人员在行业中的价值,使他们能够专注于更复杂和更具创造性的设计方面,并最终生产出更好的产品。</p><p>不过人工智能不太可能完全取代对熟练IC设计师的需求。随着人工智能在行业中越来越普遍,对这类工程师的需求甚至可能会增加,因为在设计过程中,将需要能够准确验证和利用人工智能工具和算法的个人。</p><hr><blockquote>作者:  Darshil Patel <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FN_pgzMV26mvgCMAxWMgieQ" target="blank">EETOP</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000386323">行业前瞻,神奇的忆阻器</a></li><li><a href="https://aijishu.com/a/1060000000386135">芯片验证调研报告:首次流片成功率越来越低、Verilog 使用逐渐减少、UVM地位无法动摇</a></li><li><a href="https://aijishu.com/a/1060000000385729">PCIe 6.0:在有损HVM通道中使用PAM4实现64GT/s的挑战</a></li><li><a href="https://aijishu.com/a/1060000000385482">Wi-R 一种全新的通信方式,让你的身体充当媒介!芯片已推出!</a></li><li><a href="https://aijishu.com/a/1060000000383891">科普:DDR</a></li></ul><blockquote>更多IC设计技术干货请关注IC设计技术专栏。<br>迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387068</guid>
            <link>https://aijishu.com/a/1060000000387068</link>
        </item>
        <item>
            <title><![CDATA[兆芯如何保证处理器模拟/真实请求传输路径一致?]]></title>
            <description><![CDATA[<p>【爱集微点评】兆芯的处理器建模专利,采用两套信息来记录一个请求路径的关键信息,解决多个请求在汇聚点装置中路径不明确的问题。同时依据第二路径信息可以纠正第一路径信息在汇聚点装置导致的路径错误,使模拟请求传输路径的建模跟真实硬件传输路径更为一致。</p><p>集微网消息,近日,兆芯独家入选《上海金融科技发展白皮书》基础设施支持类科技企业,同时兆芯的新一代嵌入式处理器也一并入选白皮书。</p><p>在处理器建模领域中,当处理器传输数据的整个路径上只有一个源端发送请求时,功能加时序模型可以很好地模拟真实处理器的性能。但是,如果整个路径上有多个源端可以发送请求,由于功能模型是在请求生成的时候就进行调用,而多个源端到达请求汇聚点的路径延时是不确定的,汇聚点是指多个请求都会通过的路径节点或装置,这样会导致多个源端的请求在汇聚点看到的时序状态跟在请求生成时的差距较大。当大量的请求的处理路径跟功能模型不一致的情况下,最终建模呈现的性能指标就不能反映真实处理器的性能。因此,如何真实的模拟出处理器的性能,已成为本领域需解决的问题之一。</p><p>为此,兆芯于2020年9月29日申请了一项名为“处理器建模系统及处理器建模方法”的发明专利(申请号:202011054563.0),申请人为上海兆芯集成电路有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1141850468081.4688.png" alt="image" title="image"></p><p>图1 处理器建模系统的示意图</p><p>图1为本专利提出的一种处理器建模系统的示意图,处理器建模系统100包含多个源端装置A1~Am及一汇聚点装置PL。其中,源端装置A1~Am是向处理器发出请求的装置,例如输入输出装置、储存装置、图形处理器、预取装置等。</p><p>源端装置A1和An+1分别产生第一/二请求,并于第一/二传送时点传送两个请求。而汇聚点装置PL分别在第一接收时点和第二接收时点接收两个请求,并依据第一请求/第二请求选择传送路径(例如PT1)。其中,第一传送时点早于第二传送时点,第一接收时点接收晚于第二接收时点,且第一请求与第二请求欲存取的目标数据地址相同。如此一来,在多源端的处理器的仿真建模过程会发生多请求在到达汇聚点装置时出现路径不明的情况,最终导致建模结果呈现的性能指标与真实处理器不一致。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/538297132002.6487.png" alt="image" title="image"></p><p>图2 处理器建模方法的流程图</p><p>图2是本专利提出的一种处理器建模方法流程图,首先源端装置A1产生第一请求,第一请求为主路径请求。对于每一个请求,用第一路径信息来表示传统的功能模型的关键信息,用第二路径信息来表示真实时序的关键信息(可以真实反映时序的关键信息)(步骤210)。然后第一请求分别调用功能模型和时许模型,得到第一、二路径信息(步骤220、230)。然后第一请求被传送到汇聚点装置PL(步骤240),而汇聚点装置PL判断是否存在第二请求(步骤250)。汇聚点装置PL依据第二请求的第二路径信息选择传送路径PT1。因为目标数据地址中的信息已经先被先到汇聚点装置PL的第二请求取走了,所以依据第二请求的第二路径信息选择传送路径PT1(步骤260)。最后,汇聚点装置PL更新第二请求状态为合法的(步骤270)。</p><p>简而言之,兆芯的处理器建模专利,采用两套信息来记录一个请求路径的关键信息,解决多个请求在汇聚点装置中路径不明确的问题。同时依据第二路径信息可以纠正第一路径信息在汇聚点装置导致的路径错误,使模拟请求传输路径的建模跟真实硬件传输路径更为一致。</p><p>兆芯成立于2013年,掌握中央处理器、图形处理器、芯片组等三大核心技术。自从成立以来,兆芯已经成功研发、量产了多款通用处理产品,在业内得到了高度评价,并多次入围Silicon 100榜单、荣获各种“创新奖”、“成就奖”、“金奖”。希望在2023年成立十年之际,兆芯可以再创辉煌、更上一层楼!</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387102</guid>
            <link>https://aijishu.com/a/1060000000387102</link>
        </item>
        <item>
            <title><![CDATA[南京大学&港中文提出首个支持超高分辨率(10000x10000)图像风格迁移方案]]></title>
            <description><![CDATA[<p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP4" alt="image.png" title="image.png"></p><p>paper:<a href="https://aijishu.com/link?target=https%3A%2F%2Farxiv.org%2Fabs%2F2103.11784" target="blank">https://arxiv.org/abs/2103.11784</a></p><p>code:<a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fczczup%2FURST" target="blank">https://github.com/czczup/URST</a></p><blockquote>本文是南京大学&amp;香港大学的路通&amp;罗平等人在风格迁移领域的一次突破性探索,提出了<strong>首个支持超高分辨率(比如10000x10000大小)图像风格迁移的方案URST</strong>。针对现有风格迁移模型在图像块处理时存在的块间不一致问题,<strong>提出了一种新颖的“Thumbnail Instance Normalization”</strong>;与此同时,针对高分辨率图像风格迁移存在的“small stroke size”问题,<strong>提出了一种新颖的辅助损失</strong>。所提方案可以轻易与现有风格迁移网络组合并取得性能提升。</blockquote><h2>Abstract</h2><p>本文提出一种非常简单的极限分辨率的风格迁移框架URST,首个可以处理任意高分辨率(比如)图像的进行风格迁移的方案。当处理超高分辨率图像时,受限于较大的内存占用与<code>small stroke size</code>问题,现有风格迁移方法往往难以真正应用。</p><p>URST通过以下两种策略避免了超高分辨率图像导致的内存问题:(1) 将图像划分成小的图像块进行处理;(2)提出一种新颖的<code>Thumbnail Instance Normalization (TIN)</code>进行块级风格迁移。具体来说,TIN可以提取缩略图的规范化统计信息并应用到小图像块上,确保了不同块之间的风格一致性。</p><p>总而言之,相比已有方案,本文所提URST具有这样几个优点:</p><ul><li>通过将图像拆分为小块并采用TIN成功的对任意高分辨图像进行风格迁移;</li><li>受益于所提感知损失,所提方法在超高分辨率图像上取得了超过其他SOTA方案的效果;</li><li>所提URST可以轻易的嵌入到现有风格迁移方案中,无需进行训练即可提升其性能。</li></ul><h2>Introduction</h2><p>超高分辨率图像风格迁移存在两个关键性挑战:</p><ul><li>超高分辨图像需要非常大的内存占用,甚至超出现有GPU的最大显存;</li><li>过小的笔画描边会导致不自然的纹理。</li></ul><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQd" alt="image.png" title="image.png"></p><p>针对第一个问题,现有方法往往采用轻量型网络、模型剪枝、知识蒸馏等方法降低显存占用。然而这些方法仅仅能起到缓和的作用,以上图为例,随着分辨率的提升,显存的占用呈指数增长,很快超出了现有GPU的峰值。这就驱动我们<strong>设计一种更有效的策略用于超高分辨率图像的风格迁移</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQe" alt="image.png" title="image.png"></p><p>超高分辨率图像的笔画边缘过小会呈现出不自然的现象,可参考上图(b)。增大笔画边缘是一种广泛采用的解决上述问题的方法;此外扩大风格迁移网络的感受野是另一种解决方案。然而这些方法并不适用于超高分辨率风格迁移。</p><p>为解决上述问题,本文提出了URST用于对任意高分辨率图像在有限内存约束下进行风格迁移,效果可参考上图(d)。</p><h2>Method</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQh" alt="image.png" title="image.png"></p><p>上图给出了本文所提URST的整体框架示意图。所提方案包含三个关键设计思想:</p><ul><li><strong>一种灵活的块级风格迁移</strong>,它可以将高计算量的风格迁移任务拆分为多个地计算量的块级风格迁移;</li><li>提出<strong>一种新颖的缩略图实例规范化TIN</strong>,它可以提取缩略图规范化统计信息并将其应用到小图像块上以确保不同块间的风格一致性;</li><li>精心设计了<strong>一种笔画感知损失</strong>以聚焦于笔画边缘的感知差异,促使风格迁移网络生成大的笔画边缘。</li></ul><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQi" alt="image.png" title="image.png"></p><p>由于该方案中的风格迁移网络可以是任意方法(比如AdaIN、LinearWCT),为方便起见,我们定义所选择方法原始损失为,在训练过程中,我们首先采用原始损失基于缩略图优化风格迁移网络。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQj" alt="image.png" title="image.png"></p><h3>Patch-wise Style Transfer</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQk" alt="image.png" title="image.png"></p><p>相比已有方法采用完整图像作为输入,所提框架可以灵活的处理任意高分辨率图像,同时也可以轻易嵌入到现有风格迁移方法(比如AdaIN、WCT、LinearWCT)中。正如前面所提到的,由于不同块的统计特性独立性,不同图像块的风格化可能存在不一致性问题。</p><h3>Thumbnail Instance Normalization</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQl" alt="image.png" title="image.png"></p><p>然而,我们发现IN并不适用于块级风格迁移,会导致块间风格不一致问题,可参考下图。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQm" alt="image.png" title="image.png"></p><p>在上图(a)中,我们对输入作为整体进行规范化;在上图(b)中我们将输入拆分为四块分贝进行规范化。这就导致最终的结果存在风格不一致问题。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQn" alt="image.png" title="image.png"></p><p>通过这种方式,TIN可以确保不同块间的风格一致性间,上图(c)。</p><h3>Stroke Perceptual Loss</h3><p>所提方法驱动我们提出一种辅助损失增大笔画边缘,该损失定义如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQo" alt="image.png" title="image.png"></p><h2>Experiments</h2><p>为验证所提方法的有效性,我们将其与AdaIN、WCT等方法进行了对比,见下图。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQp" alt="image.png" title="image.png"><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQp" alt="image.png" title="image.png"></p><p>从上图可以看到:(1) IN导致了明显的块间风格不一致问题;(2) <strong>所提方法取得了与全图相似的效果且显存占用更低</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQO" alt="image.png" title="image.png"></p><p>与此同时,我们还对比了所提损失函数的影响分析,见上图。可以看到:<strong>基于所提损失引导,这些模型可以生成更粗的线条与更稀疏的纹理,这有助于改善超高分辨率风格迁移</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQP" alt="image.png" title="image.png"><br>此外,我们还提供了不同风格迁移方案在不同输入分辨率输入时的显存占用对比。可以看到:大多方法甚至不能处理的高分辨率图像;而<strong>本文所提方法甚至可以处理分辨率图像且显存占用不超过5GB</strong>。理论上,本文所提方法可以处理任意高分辨率图像。</p><p>最后,我们提供一个超高分辨率图像风格迁移效果图作为结尾。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQQ" alt="image.png" title="image.png"></p><blockquote>来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FJqRUmFZLGtXDt814wH7ppA" target="blank">AIWalker</a><br>作者:   Happy</blockquote><p>推荐阅读</p><ul><li><a href="https://aijishu.com/a/1060000000386282"><strong>深入分析MobileAI图像超分最佳方案:ABPN</strong></a></li><li><a href="https://aijishu.com/a/1060000000385959"><strong>HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法</strong></a></li><li><a href="https://aijishu.com/a/1060000000385643"><strong>一层卷积能做啥?BOE告诉你:一层卷积可以做超分!</strong></a></li><li><a href="https://aijishu.com/a/1060000000385377"><strong>一层卷积能做啥?BOE告诉你:一层卷积可以做超分!</strong></a></li><li><a href="https://aijishu.com/a/1060000000380384"><strong>YOLOv6 v3.0 | 重磅升级!性能超越V8!</strong></a></li></ul><blockquote>本文章著作权归作者所有,任何形式的转载都请注明出处。更多动态滤波,图像质量,超分辨相关请关注我的专栏<a href="https://aijishu.com/blog/aiwalker">AIWalker</a>。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 04:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386996</guid>
            <link>https://aijishu.com/a/1060000000386996</link>
        </item>
        <item>
            <title><![CDATA[「微侃」特斯拉对智能汽车设计的考虑]]></title>
            <description><![CDATA[<p>聚焦汽车科技,剖析产业趋势和变革浪潮  <br>————————  </p><p>早在2016年,马斯克就在《特斯拉宏图计划第二篇章》提到要发展自动驾驶,但特斯拉与当时最热的自动驾驶技术路线有所不同——Google的Waymo为代表的众多自动驾驶企业,以L4级别和量产自动驾驶出租车Robetaxi为目标。  </p><p>特斯拉走的垂直整合路线:不仅自己开发自动驾驶相关的软件和硬件,还自己造车:开创了将自动驾驶与汽车量产结合的技术路线——简单来说,就是在量产车上安装低级别自动驾驶系统收集数据,凭借数据不断完善自动驾驶算法,最终实现由较低级别的自动驾驶向高级别自动驾驶间融合过渡。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQz" alt=" title=" 微信图片_20230227121317.png""="" title=" title=">  </p><p>目前来看,后者的自动驾驶技术方案是比较成功的。他的路线甚至从车成功复制到机器人。  </p><p>那么特斯拉是怎么考虑智能汽车的设计的呢?  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbtWN" alt=" title=" 微信图片_20230227121320.png""="" title=" title=">  </p><p>Part 1  </p><p>特斯拉的整车设计  </p><p>特斯拉与传统主机厂把设计开发交给供应商的方式不同,而是反过来,不断从供应商手中拿回主导开发权。我们看到,在整个EE架构里面,特斯拉不断在把大量的部件做成In-house Design然后再由非传统的一级供应商来代工的模式进行,不断把系统内化。  </p><p>●芯片层面的全面考虑  </p><p>特斯拉会和芯片企业直接交流设计开发,这样一方面在过去几年缺芯的状态下,可以优先获取支持。另一方面,这样的直接接触,可以把自己的设计思路传递到芯片企业,同时获取最新的设计方案。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQA" alt=" title=" 微信图片_20230227121326.png""="" title=" title=">  </p><p>◎最重要的计算类SOC芯片:座舱层面依靠Intel和AMD计算芯片、特斯拉自研FSD的芯片  </p><p>◎通信芯片:从以太网的Marvell扩展到下一代  </p><p>◎存储芯片:SK海力士和Sumsung  </p><p>◎功率芯片:由SiC的英飞凌和ST供应,低压小功率的主要包括安森美  </p><p>◎MCU:全方面的拥抱TI和ST  </p><p>◎其他芯片:也是和ADI、Microchip等战略芯片供应商合作  </p><p>●电子电气架构的设计  <br>特斯拉在设计电子电气架构时,不仅从Model 3 开始就采用了集中式的架构,还很早就导入了Zonal控制器的概念,这样的架构可以尽可能的简化线束,提高整车安装效率。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQB" alt=" title=" 微信图片_20230227121334.png""="" title=" title=">  </p><p>特斯拉设计了三个区域控制器,分布在车身的左、右和前部中间,这三个控制器大量合并了原有分布式系统的功能,比如:车身控制、热管理、驻车还有座椅控制等。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQC" alt=" title=" 微信图片_20230227121342.png""="" title=" title=">  </p><p>如果按其他车企的设计,至少会分为七八个模块(门模块、集成式车身控制器、座椅控制器、热管理控制器HVAC和前端冷却控制器Theraml Unit和泊车控制器、灯光控制)。  </p><p>但特斯拉通过这三个区域控制器既能实现基本功能,又可以做一些顶层的应用,实现系统的整体控制。整个控制逻辑复杂的部分都在上层,底层的可以实现冗余和执行功能。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQD" alt=" title=" 微信图片_20230227121349.png""="" title=" title=">  </p><p>比如热管理的控制中,复杂的热泵模式功能是在顶层的软件系统里面来定义的,再由区域控制器负责执行。这个创新性的设计,就让特斯拉把握了整体软件和系统方面的设计,供应商只负责做结构设计集成,特斯拉在热管理功能上实现了自主开发控制。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbuK9" alt=" title=" 微信图片_20230227121353.png""="" title=" title=">  </p><p>Part 2  </p><p>特斯拉的自动驾驶设计  </p><p>●自动驾驶软件部分  <br>2019 年前后,自动驾驶技术堆栈出现了颠覆性变化,特斯拉引领了这次变革。这次变革是从规则驱动,转向为数据驱动。这几乎改变了整个技术堆栈,甚至是工程师的思考方式。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQE" alt=" title=" 微信图片_20230227121400.png""="" title=" title=">  </p><p>所谓规则驱动,简单来说,以前的自动驾驶,是依靠提前设计好一定的规则;数据驱动,则是围绕AI的算法模型,通过感知AI、规控AI,以及数据改进自动驾驶的效果,跟现在很火热的ChatGPT类似。  </p><p>●自动驾驶硬件部分  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQF" alt=" title=" 微信图片_20230227121407.png""="" title=" title=">  </p><p>特斯拉的驾驶辅助硬件经过了HW1.0到3.0的迭代:  </p><p>◎ 1.0的版本硬件选型为成熟商品。特斯拉做了多传感器融合+应用层软件开发。  <br>◎ 2.0的版本,采用了英伟达的芯片,提升传感器数量提升,特斯拉在原有的技术基础上,增加了图像识别算法的开发。  <br>◎ 3.0 是特斯拉的驾驶辅助硬件的重大革新,首次采用自研的高度集成自动驾驶SoC+MCU芯片。此时的特斯拉已经具备:全套芯片设计能力。  <br>◎ 正在开发的基于自研的自动驾驶芯片的第二代控制器,也就是4.0版本,马上要发布,我们会持续地跟踪。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQG" alt=" title=" 微信图片_20230227121415.png""="" title=" title=">  </p><p>我们看到特斯拉在Model S、Model X、Model 3到Model Y上,一步步深化了自己的设计范围,而全球车企包括大量的中国汽车企业也开始了这个过程。  </p><p>总结  <br>虽说特斯拉的自动驾驶技术路线很成功,但并不是没有问题。首先就表现在有各种召回。这是因为自主设计的开发难度的确很大,随着车主增多,会遇到很多激进的工况。但换个角度来看,特斯拉就是通过量产车上收集到的数据不断完善自己的产品,最终要实现不仅是智能汽车,还有马斯克本人的Master plan。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 04:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387037</guid>
            <link>https://aijishu.com/a/1060000000387037</link>
        </item>
        <item>
            <title><![CDATA[「微侃」插电混动的技术路线分析(下篇)]]></title>
            <description><![CDATA[<p>聚焦汽车科技,剖析产业趋势和变革浪潮  <br>————————  </p><p>前段时间在梳理完中国汽车自主品牌产业格局以后,我们觉得2023年汽车市场最重要的竞争会来自插电混动领域。在上一期《插电混动的技术路线分析》中,我们盘点完比亚迪、长城和吉利的路线,今天我们接着来讲长安、奇瑞、上汽这三家企业的混动技术,为国内的插电混动技术做一个完整的画像(文末有汇总图)。  </p><p>● 上汽  <br>上汽混动开发主要有两个主体,一个是专门开发电动汽车的捷能,一个是传统动力总成部门,前两代的系统是由捷能主导开发的。  </p><p>上汽是国内很早开始自研混动系统的主机厂,2013年上汽第一代EDU是发动机+P1发电机+P2驱动电机+2档AMT结构 ,非常典型的串并联结构。这是典型的双电机方案,主要用于发电和调整发动机转速的ISG电机和另一个则是主要用于驱动的TM电机。 第一代上汽EDU混动系统加入了2挡变速机构(2AMT),设计的初衷是让「发动机」和「电机」都能维持在相对高效率的运转区间。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP6" alt=" title=" 微信图片_20230227120635.png""="" title=" title=">  </p><p>第一代系统的加入了2挡的变速机构,可以更好地实现电机和发动机的工作点的调节。  </p><p>这套系统的优点是:  </p><p>◎系统效率高,发动机可完全解耦工作在高效区间,油耗比较低  </p><p>◎控制策略灵活,串并联结构,可串联可并联,甚至可以发动机双电机并联,能2档调速  </p><p>◎在电池SOC高的时候,发动机双电机同时出力  </p><p>当然这套系统也是有缺点的,比如:  </p><p>◎平顺性和动力中断:2档AMT的换档速度慢,换档动力短暂中断以及换档顿挫这些问题始终是影响了性能。  </p><p>◎故障率和成本:由于整套系统设计初期参数方面需要优化,而切降低成本也比较困难。  </p><p>上汽在第一代的技术上最终选择了推翻重来,研发了第二代「上汽EDU混动系统」。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP7" alt=" title=" 微信图片_20230227120647.png""="" title=" title=">  </p><p>第二代上汽EDU混动系统,可以认为是单电机P2.5并联结构,发动机+6AMT+P2电机+4AMT并联,由发动机、驱动电机、齿轮轴系、离合器以及整车控制器等控制模块组成,属于三平行轴式的单电机电驱 方案。这套系统有18组齿轮,4个同步器,3组同步器与离合器主要用于调节整套系统的换挡逻辑,将发动机与电机相结合。  </p><p>◎油耗层面某些地方还是不错的,发动机和变速箱分别能在各自不同的最佳档位上并联输出  </p><p>◎动力特性比较好,单电机在电控和电机方面成本下降  </p><p>缺点是:  </p><p>◎这套基础结构是P2.5单电机,发动机无法解耦,因此在馈电情况下油耗也降不下去。  </p><p>由于整个系统比较复杂,通过多种机械耦合以后整体的效率并没有设想的更高  </p><p>在上汽乘用车的传统动力总成部门,也在开发P1P3的新混动架构,等正式发布以后我们可以再展开来说。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP8" alt=" title=" 微信图片_20230227120659.png""="" title=" title=">  </p><p>● 长安 iDD  <br>长安汽车的混动车型是从2008年开始筹划建立,2017年和2018年分别推出了搭载P2-7DCT的逸动PHEV和搭载P134串并联电四驱的CS75PHEV量产车型,2021年最新推出的蓝鲸iDD混动系统,采用P2-6DCT并联混动变速器。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP9" alt=" title=" 微信图片_20230227120705.png""="" title=" title=">  </p><p>长安iDD是一套P2架构的单电机混动类型,1.5T四缸发动机最大功率122千瓦、最大扭矩255牛米,与之搭档的电机最大功率85千瓦、最大扭矩330牛米。这两个动力源通过一台六挡三离合变速器传输,是典型的P2混动系统。2021年,长安UNI-K iDD改进了这套混合动力系统,最大功率可达122kW,最大峰值扭矩为255 N·m。通过安装了一块容量为30.74kWh的电池。  </p><p>长安这套系统目前来看并不是主流的方向,单电机并联式方案在欧洲采用比较多,目前最大的缺点是馈电油耗高。由于P2的结构特性,不能实现一边发电一边驱动,这就会导致车辆的主要动力输出是依靠发动机来实现的,那么在馈电状态下,油耗就会非常高。  </p><p>● 奇瑞  </p><p>奇瑞2021年发布了3挡串并联混动变速器鲲鹏混动系统。奇瑞鲲鹏混动系统是一套混联式混合动力,驱动核心是一台115kW的1.5T发动机加上两台(P2 55kW、P2.5 70kW)永磁同步电机。 动力系统的核心在于三档双离合的混动变速箱上,两台电机中的P2.5电机与双离合变速箱中的奇数轴相连,在驱动状态下有两个挡位可以切换。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQa" alt=" title=" 微信图片_20230227120713.png""="" title=" title=">  </p><p>P2电机则直接挂在发动机输出轴的离合器C1的另一端,可通过变速箱输出动力,也可在发动机带动下发电。发动机则是处在三档变速箱的最顶端,可直驱,也可增程。  </p><p>这套系统最大的特点是9种工作模式和11个组合挡位,包括单电机纯电模式、双电机纯电模式、串联增程模式、发动机直驱模式、并联驱动模式、驻车充电模式、行车充电模式、单电机制动能量回收,以及双电机制动回收模式。  </p><p>优点:理论上这套系统可以做得很牛,理论上可以覆盖更多的使用场景,而且将电机和发动机的效率最大化;  </p><p>缺点:缺点也很明显,整个动力系统的结构会非常复杂,电机、电池和发动机等不同配置调整以后,整个系统需要一遍遍调教,需要大量的车型推出来不断优化,这使得整车重量和调校会有难度。而且这套系统的BOM成本和制造成本来看,很短在初期降下来。  </p><p>小结:混动系统并不容易做,插电混动也是在新能源汽车鼓励政策下不断支持以后,才有今天的成绩。我们希望中国的混动系统越来越好,每家都有机会完善自己的方案。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQb" alt=" title=" 微信图片_20230227120720.png""="" title=" title="></p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 04:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387009</guid>
            <link>https://aijishu.com/a/1060000000387009</link>
        </item>
        <item>
            <title><![CDATA[【TVM 学习资料】TensorIR 快速入门]]></title>
            <description><![CDATA[<p>本篇文章译自英文文档  [Blitz Course to TensorIR<br>](<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2Ftutorial%2Ftensor_ir_blitz_course.html" target="blank">https://tvm.apache.org/docs/t...</a>) 作者是 Siyuan Feng。更多 TVM 中文文档可访问→<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.hyper.ai%2F" target="blank">TVM 中文站</a> </p><p>TensorIR 是深度学习领域的特定语言,主要有两个作用:</p><ul><li>在各种硬件后端转换和优化程序。</li><li>自动 <em>tensorized</em> 程序优化的抽象。</li></ul><pre><code class="bash">import tvm
from tvm.ir.module import IRModule
from tvm.script import tir as T
import numpy as np</code></pre><h1>IRModule</h1><p>IRModule 是 TVM 的核心数据结构,它包含深度学习程序,并且是 IR 转换和模型构建的基础。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/eab85e2bd22d4c2199a5245e93ab04a5.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>上图展示的是 IRModule 的生命周期,它可由 TVMScript 创建。转换 IRModule 的两种主要方法是 TensorIR 的 schedule 原语转换和 pass 转换。此外,也可直接对 IRModule 进行一系列转换。注意,可以在任何阶段将 IRModule 打印到 TVMScript。完成所有转换和优化后,可将 IRModule 构建为可运行模块,从而部署在目标设备上。</p><p>基于 TensorIR 和 IRModule 的设计,可创建一种新的编程方法:</p><ol><li>基于 Python-AST 语法,用 TVMScript 编写程序。</li><li>使用 Python API 转换和优化程序。</li><li>使用命令式转换 API 交互检查和提高性能。</li></ol><h1>创建 IRModule</h1><p>IRModule 是 TVM IR 的一种可往返语法,可通过编写 TVMScript 来创建。</p><p>与通过张量表达式创建计算表达式(使用张量表达式操作算子)不同,TensorIR 允许用户通过 TVMScript(一种嵌在 Python AST 中的语言)进行编程。新方法可以编写复杂的程序并进一步调度和优化。</p><p>下面是向量加法的示例:</p><pre><code class="bash">@tvm.script.ir_module
class MyModule:
    @T.prim_func
    def main(a: T.handle, b: T.handle):
        # 我们通过 T.handle 进行数据交换,类似于内存指针
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # 通过 handle 创建 Buffer
        A = T.match_buffer(a, (8,), dtype="float32")
        B = T.match_buffer(b, (8,), dtype="float32")
        for i in range(8):
            # block 是针对计算的抽象
            with T.block("B"):
                # 定义一个空间(可并行)block 迭代器,并且将它的值绑定成 i
                vi = T.axis.spatial(8, i)
                B[vi] = A[vi] + 1.0
ir_module = MyModule
print(type(ir_module))
print(ir_module.script())</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.ir.module.IRModule'&gt;
# from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i in T.serial(8):
            with T.block("B"):
                vi = T.axis.spatial(8, i)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><p>此外,我们还可以使用张量表达式 DSL 编写简单的运算符,并将它们转换为 IRModule。</p><pre><code class="bash">from tvm import te
A = te.placeholder((8,), dtype="float32", name="A")
B = te.compute((8,), lambda *i: A(*i) + 1.0, name="B")
func = te.create_prim_func([A, B])
ir_module_from_te = IRModule({"main": func})
print(ir_module_from_te.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i0 in T.serial(8):
            with T.block("B"):
                i0_1 = T.axis.spatial(8, i0)
                T.reads(A[i0_1])
                T.writes(B[i0_1])
                B[i0_1] = A[i0_1] + T.float32(1)</code></pre><h1>构建并运行 IRModule</h1><p>可将 IRModule 构建为特定 target 后端的可运行模块。</p><pre><code class="bash">mod = tvm.build(ir_module, target="llvm")  # CPU 后端的模块
print(type(mod))</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.driver.build_module.OperatorModule'&gt;</code></pre><p>准备输入数组和输出数组,然后运行模块:</p><pre><code class="bash">a = tvm.nd.array(np.arange(8).astype("float32"))
b = tvm.nd.array(np.zeros((8,)).astype("float32"))
mod(a, b)
print(a)
print(b)</code></pre><p>输出结果:</p><pre><code class="bash">[0. 1. 2. 3. 4. 5. 6. 7.]
[1. 2. 3. 4. 5. 6. 7. 8.]</code></pre><h1>转换 IRModule</h1><p>IRModule 是程序优化的核心数据结构,可通过 Schedule 进行转换。schedule 包含多个 primitive 方法来交互地转换程序。每个 primitive 都以特定方式对程序进行转换,从而优化性能。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f1d1c2925359488883e2cb5e0a43802f.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>上图是优化张量程序的典型工作流程。首先,用 TVMScript 或张量表达式创建一个初始 IRModule,然后在这个初始 IRModule 上创建 schedule。接下来,使用一系列调度原语来提高性能。最后,我们可以将其降低并构建成一个可运行模块。</p><p>上面只演示了一个简单的转换。首先,在输入 ir_module 上创建 schedule:</p><pre><code class="bash">sch = tvm.tir.Schedule(ir_module)
print(type(sch))</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.tir.schedule.schedule.Schedule'&gt;</code></pre><p>将嵌套循环展开成 3 个循环,并打印结果:</p><pre><code class="bash"># 通过名字获取 block
block_b = sch.get_block("B")
# 获取包围 block 的循环
(i,) = sch.get_loops(block_b)
# 展开嵌套循环
i_0, i_1, i_2 = sch.split(i, factors=[2, 2, 2])
print(sch.mod.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0, i_1, i_2 in T.grid(2, 2, 2):
            with T.block("B"):
                vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><p>还可对循环重新排序。例如,将循环 i_2 移到 i_1 之外:</p><pre><code class="bash">sch.reorder(i_0, i_2, i_1)
print(sch.mod.script())</code></pre><p>输出结果</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0, i_2, i_1 in T.grid(2, 2, 2):
            with T.block("B"):
                vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><h1>转换为 GPU 程序</h1><p>要在 GPU 上部署模型必须进行线程绑定。幸运的是,也可以用原语来增量转换。</p><pre><code class="bash">sch.bind(i_0, "blockIdx.x")
sch.bind(i_2, "threadIdx.x")
print(sch.mod.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0 in T.thread_binding(2, thread="blockIdx.x"):
            for i_2 in T.thread_binding(2, thread="threadIdx.x"):
                for i_1 in T.serial(2):
                    with T.block("B"):
                        vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                        T.reads(A[vi])
                        T.writes(B[vi])
                        B[vi] = A[vi] + T.float32(1)</code></pre><p>绑定线程后,用 cuda 后端来构建 IRModule:</p><pre><code class="bash">ctx = tvm.cuda(0)
cuda_mod = tvm.build(sch.mod, target="cuda")
cuda_a = tvm.nd.array(np.arange(8).astype("float32"), ctx)
cuda_b = tvm.nd.array(np.zeros((8,)).astype("float32"), ctx)
cuda_mod(cuda_a, cuda_b)
print(cuda_a)
print(cuda_b)</code></pre><p>输出结果:</p><pre><code class="bash">[0. 1. 2. 3. 4. 5. 6. 7.]
[1. 2. 3. 4. 5. 6. 7. 8.]</code></pre><p><a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2F_downloads%2Feac4389b114db015e95cb3cdf8b86b83%2Fauto_scheduler_matmul_x86.py" target="blank">下载 Python 源代码</a><br><a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2F_downloads%2F246d4b8509474fd9046e69f6cc9b7f87%2Fauto_scheduler_matmul_x86.ipynb" target="blank">下载 Jupyter Notebook</a></p><p>以上就是该文档的全部内容,查看更多 TVM 中文文档,请访问→<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.hyper.ai%2F" target="blank">TVM 中文站</a></p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 03:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386987</guid>
            <link>https://aijishu.com/a/1060000000386987</link>
        </item>
        <item>
            <title><![CDATA[反其道而行,大学教授鼓励学生用 ChatGPT 写论文]]></title>
            <description><![CDATA[<p>新 AI 工具 ChatGPT 的到来,正在教育圈呈现出冰火两重天的态势,教授们几家欢喜几家愁。</p><p>这不近日,来自宾夕法尼亚大学沃顿商学院的一位专门研究创业与创新的资深教授 Ethan Mollick 发表了一篇长文呼吁,让学生拥抱 ChatGPT,也可以使用 ChatGPT 写论文,因为只有这样,才能让学生们经过事实核查从而能够很快理解 AI 的准确性和偏见问题。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPr" alt="1.png" title="1.png"></p><h2>反其道而行:使用 ChatGPT,大学生快上车!</h2><p>作为大学教授,这一不走寻常路的举措,引发了不少人的关注。</p><p>毕竟此前据调查显示,美国 89% 的大学生在用 ChatGPT 做作业。当时的这个结果让很多教育界的高校老师都感到头疼,来自弗曼大学哲学助理教授 Darren Hick 也曾发文斥责,「ChatGPT 都成学生的作弊神器了,这让我感到极度恐惧。」</p><p>为了让学生能够潜下心踏踏实实地学习,国内外多所学校发布相应应对措施,如美国纽约市教育部宣布,纽约市的学生和教师,无法再在教育部设备或互联网上访问 ChatGPT;斯坦福研究人员推出了 DetectGPT,便于检测出 AI 生成文本;香港大学向师生发出内部邮件,明确禁止在港大所有课堂、作业和评估中使用 ChatGPT 或其他 AI 工具......</p><p>可以说,ChatGPT 诞生的近三个月间,尤其是老师群体反对的声音颇为强烈。Ethan Mollick 如今的做法,似乎在反其道而行。</p><p>不过,在 Ethan Mollick 教授看来,倘若一味地禁止,只会适得其反。当然,也不能完全地放任学生使用 AI 工具而不顾,得有教学策略。</p><p>他表示,过去一学期已经在课堂上完全接受 AI 的存在,也会要求学生以多种方式使用 AI 工具。通过实践,Ethan Mollick 给出直观的总结:太好用了!而且我还已经学到了一些我认为值得传承的早期课程。效果非常成功,但也有一些教训要吸取。</p><h2>学术中使用 ChatGPT 的前提条件</h2><p>首先,在大的背景上,Ethan Mollick 教授要求在三个独立的面向本科和硕士级别的创业和创新课程中以稍微不同的方式使用 AI。具体模式如下:</p><ol><li>第一门课程整体建立在广泛使用人工智能的基础上。其要求学生使用人工智能来帮助他们产生想法、制作书面材料、帮助创建应用程序、生成图像等等。</li><li>第二门课程中的作业要求学生使用 AI。</li><li>第三门课程中,Ethan Mollick 向学生介绍了 AI 工具并提出了使用建议,但没有具体的 AI 作业。<br>在三种不同的课程中,Ethan Mollick 使用了相同的 AI 政策:</li></ol><p>我希望你在这门课上使用 AI(至少是 ChatGPT 和图像生成工具)。学习使用人工智能是一项新兴的技能,我在 Canvas 中提供关于如何使用它们的教程。我很乐意在办公时间或课后与学生见面并帮助他们使用这些工具。</p><p>请注意使用 ChatGPT 的限制:</p><ul><li>如果你提供最少的描述提示,你会得到低质量的结果。你需要改进你的提示,以获得良好的结果。这一点非常有用。</li><li>不要相信它说的任何东西。如果它给你一个数字或事实,除非你知道答案或可以通过其他来源查询验证,否则就一定要认为它是错误的。你将对该工具提供的任何错误或遗漏负责。它对你理解的主题效果最好。</li><li>Al 是一个工具,但你需要承认它的使用。请在任何使用

...

@github-actions
Copy link
Contributor

http://localhost:1200/aijishu/channel/ai - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[AI 应用 - 极术社区]]></title>
        <link>https://aijishu.com/channel/ai</link>
        <atom:link href="http://localhost:1200/aijishu/channel/ai" rel="self" type="application/rss+xml" />
        <description><![CDATA[AI 应用 - 极术社区 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 16:48:55 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[用人工智能设计芯片及对IC设计就业市场的影响]]></title>
            <description><![CDATA[<p>集成电路 (IC) 设计是一项复杂的工作,不断突破密度和性能的界限。现在,人工智能 (AI)在 IC 设计中的作用越来越大。</p><p>虽然 AI 最近因其在 ChatGPT 等自然语言处理器方面的惊人能力而受到更多关注,但该工具也被用于 IC 设计的各个阶段,包括设计优化、布局、仿真和验证。人工智能算法还可以帮助更有效地探索设计空间,比传统方法更快地发现最佳设计配置。</p><h5>随着设计变得比以往任何时候都更加复杂,人工智能可以成为 IC 设计师的强大资产。</h5><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRe" alt="image.png" title="image.png"></p><p>本文重点介绍了AI如何被用作IC设计的工具,以及这项技术如何影响IC设计工程师的专业价值。</p><p><strong>利用 AI 来实现严格的设计约束</strong></p><h3>由于数十亿个晶体管被限制在一个很小的芯片区域,IC 设计师的任务是在严格约束的情况下优化设计。&nbsp;</h3><p>首先,芯片面积必须最小,以适应当今设备的小尺寸,并降低制造成本。布局的功耗也是值得关注的;功耗同样会影响部署成本以及芯片对环境的影响。某些密集区域和配置容易过热,需要冷却机制或更巧妙的布局。考虑到这些因素和许多其他因素,IC设计人员大约需要八到九个月的时间来生成一个满足每个严格要求的芯片布局。</p><p>为了加快和优化 IC 设计流程,许多公司(包括科技行业的一些最大公司)现在都在投资 AI 工具来完成一些繁重的工作。</p><p><strong>谷歌人工智能在几个小时内设计出芯片</strong></p><p>据谷歌称,谷歌的深度学习强化学习 (RL) 方法可以在比人类工程师少得多的时间内生成有效的布局,而且结果在质量上也不相上下。</p><p>谷歌表示,谷歌的深度学习强化学习(RL)方法可以在比人类少得多的时间内产生有效的布局,而且结果在质量上也不相上下。2022年3月,谷歌研究院推出了PRIME,这是一种深度学习方法,利用现有的数据,如功率和延迟来创建加速器设计,比用传统方法设计的芯片更快、更小。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRf" alt="image.png" title="image.png"></p><p>谷歌研究人员使用 10,000 个芯片平面图来训练他们的模型。人工智能生成的芯片设计时间不到六个小时。谷歌表示,这种方法已经被利用来实现谷歌的张量处理单元(TPU),这是谷歌基于云的机器学习应用的一部分。</p><p><strong>EDA公司在AI设计系统上加倍投入</strong></p><p>不仅仅是谷歌转向机器学习模型。像Synopsys和Cadence这样的EDA公司也在其最新工具中使用到AI技术。比如最近,Synopsys凭借其 Synopsys DSO.ai 自主芯片设计系统注册了 100 个商业流片。该系统最近的客户包括 意法半导体(ST)和 SK Hynix。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRg" alt="image.png" title="image.png"></p><p>ST 和 Synopsys 于 2022 年 2 月初首次在微软的云端使用 DSO.ai 来设计工作芯片。使用 Synopsys 的 DSO.ai 设计系统,结合 Microsoft Azure 上的 Synopsys Fusion Compiler 和 IC Compiler,该工具将功耗、性能和面积 (PPA) 指标提高了 3 倍以上,总功耗降低了 25%,并且显著缩小了芯片尺寸。</p><p>除了芯片设计,人工智能还在芯片测试和验证中找到了应用——芯片制造商在这两个领域花费了大量时间。为了解决这一设计阶段的问题,西门子发布了Questa Verification IQ,这是一个帮助IC设计工程师加快验证过程的软件平台。</p><p><strong>英伟达用GPU设计GPU</strong></p><p>NVIDIA(英伟达)为芯片设计设计了另一种深度学习方法。该公司制作了一个名为PrefixRL的 RL 模型,证明 AI 可以从头开始学习电路设计,并使用最新的 EDA 工具制造更小、更快的电路。NVIDIA 的架构由 13,000 个使用 AI 技术设计的电路组成。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRh" alt="image.png" title="image.png"></p><p>针对自动化单元迁移,该公司开发了NVCell,可以无错迁移92%的单元库。人类工程师可以对剩下的 8% 没有自动迁移的单元进行处理。NVIDIA 首席科学家 Bill Dally 表示:</p><p><em>“所以这就像一个 Atari 视频游戏,但它是一个用于修复标准单元中的设计规则错误的视频游戏。通过强化学习来研究和修复这些设计规则错误,我们能够基本完成我们标准的设计单元。”</em></p><p><strong>人工智能对 IC 设计就业市场的影响</strong></p><p>虽然人工智能可以自动执行传统上由IC设计人员执行的某些任务,例如布局设计和优化,但它也减少了设计过程中对手动方面的需求。虽然这提高了整体效率,但也可能导致IC设计的某些领域的最终工作被取代。</p><p>另一方面,人工智能还可以帮助 IC 设计人员更高效、更有效地开展工作。例如,AI 可以分析大量数据并提供见解,建议工程师以前可能没有考虑过的设计替代方案。这种趋势可以提高 IC 设计人员在行业中的价值,使他们能够专注于更复杂和更具创造性的设计方面,并最终生产出更好的产品。</p><p>不过人工智能不太可能完全取代对熟练IC设计师的需求。随着人工智能在行业中越来越普遍,对这类工程师的需求甚至可能会增加,因为在设计过程中,将需要能够准确验证和利用人工智能工具和算法的个人。</p><hr><blockquote>作者:  Darshil Patel <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FN_pgzMV26mvgCMAxWMgieQ" target="blank">EETOP</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000386323">行业前瞻,神奇的忆阻器</a></li><li><a href="https://aijishu.com/a/1060000000386135">芯片验证调研报告:首次流片成功率越来越低、Verilog 使用逐渐减少、UVM地位无法动摇</a></li><li><a href="https://aijishu.com/a/1060000000385729">PCIe 6.0:在有损HVM通道中使用PAM4实现64GT/s的挑战</a></li><li><a href="https://aijishu.com/a/1060000000385482">Wi-R 一种全新的通信方式,让你的身体充当媒介!芯片已推出!</a></li><li><a href="https://aijishu.com/a/1060000000383891">科普:DDR</a></li></ul><blockquote>更多IC设计技术干货请关注IC设计技术专栏。<br>迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387068</guid>
            <link>https://aijishu.com/a/1060000000387068</link>
        </item>
        <item>
            <title><![CDATA[南京大学&港中文提出首个支持超高分辨率(10000x10000)图像风格迁移方案]]></title>
            <description><![CDATA[<p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP4" alt="image.png" title="image.png"></p><p>paper:<a href="https://aijishu.com/link?target=https%3A%2F%2Farxiv.org%2Fabs%2F2103.11784" target="blank">https://arxiv.org/abs/2103.11784</a></p><p>code:<a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fczczup%2FURST" target="blank">https://github.com/czczup/URST</a></p><blockquote>本文是南京大学&amp;香港大学的路通&amp;罗平等人在风格迁移领域的一次突破性探索,提出了<strong>首个支持超高分辨率(比如10000x10000大小)图像风格迁移的方案URST</strong>。针对现有风格迁移模型在图像块处理时存在的块间不一致问题,<strong>提出了一种新颖的“Thumbnail Instance Normalization”</strong>;与此同时,针对高分辨率图像风格迁移存在的“small stroke size”问题,<strong>提出了一种新颖的辅助损失</strong>。所提方案可以轻易与现有风格迁移网络组合并取得性能提升。</blockquote><h2>Abstract</h2><p>本文提出一种非常简单的极限分辨率的风格迁移框架URST,首个可以处理任意高分辨率(比如)图像的进行风格迁移的方案。当处理超高分辨率图像时,受限于较大的内存占用与<code>small stroke size</code>问题,现有风格迁移方法往往难以真正应用。</p><p>URST通过以下两种策略避免了超高分辨率图像导致的内存问题:(1) 将图像划分成小的图像块进行处理;(2)提出一种新颖的<code>Thumbnail Instance Normalization (TIN)</code>进行块级风格迁移。具体来说,TIN可以提取缩略图的规范化统计信息并应用到小图像块上,确保了不同块之间的风格一致性。</p><p>总而言之,相比已有方案,本文所提URST具有这样几个优点:</p><ul><li>通过将图像拆分为小块并采用TIN成功的对任意高分辨图像进行风格迁移;</li><li>受益于所提感知损失,所提方法在超高分辨率图像上取得了超过其他SOTA方案的效果;</li><li>所提URST可以轻易的嵌入到现有风格迁移方案中,无需进行训练即可提升其性能。</li></ul><h2>Introduction</h2><p>超高分辨率图像风格迁移存在两个关键性挑战:</p><ul><li>超高分辨图像需要非常大的内存占用,甚至超出现有GPU的最大显存;</li><li>过小的笔画描边会导致不自然的纹理。</li></ul><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQd" alt="image.png" title="image.png"></p><p>针对第一个问题,现有方法往往采用轻量型网络、模型剪枝、知识蒸馏等方法降低显存占用。然而这些方法仅仅能起到缓和的作用,以上图为例,随着分辨率的提升,显存的占用呈指数增长,很快超出了现有GPU的峰值。这就驱动我们<strong>设计一种更有效的策略用于超高分辨率图像的风格迁移</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQe" alt="image.png" title="image.png"></p><p>超高分辨率图像的笔画边缘过小会呈现出不自然的现象,可参考上图(b)。增大笔画边缘是一种广泛采用的解决上述问题的方法;此外扩大风格迁移网络的感受野是另一种解决方案。然而这些方法并不适用于超高分辨率风格迁移。</p><p>为解决上述问题,本文提出了URST用于对任意高分辨率图像在有限内存约束下进行风格迁移,效果可参考上图(d)。</p><h2>Method</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQh" alt="image.png" title="image.png"></p><p>上图给出了本文所提URST的整体框架示意图。所提方案包含三个关键设计思想:</p><ul><li><strong>一种灵活的块级风格迁移</strong>,它可以将高计算量的风格迁移任务拆分为多个地计算量的块级风格迁移;</li><li>提出<strong>一种新颖的缩略图实例规范化TIN</strong>,它可以提取缩略图规范化统计信息并将其应用到小图像块上以确保不同块间的风格一致性;</li><li>精心设计了<strong>一种笔画感知损失</strong>以聚焦于笔画边缘的感知差异,促使风格迁移网络生成大的笔画边缘。</li></ul><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQi" alt="image.png" title="image.png"></p><p>由于该方案中的风格迁移网络可以是任意方法(比如AdaIN、LinearWCT),为方便起见,我们定义所选择方法原始损失为,在训练过程中,我们首先采用原始损失基于缩略图优化风格迁移网络。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQj" alt="image.png" title="image.png"></p><h3>Patch-wise Style Transfer</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQk" alt="image.png" title="image.png"></p><p>相比已有方法采用完整图像作为输入,所提框架可以灵活的处理任意高分辨率图像,同时也可以轻易嵌入到现有风格迁移方法(比如AdaIN、WCT、LinearWCT)中。正如前面所提到的,由于不同块的统计特性独立性,不同图像块的风格化可能存在不一致性问题。</p><h3>Thumbnail Instance Normalization</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQl" alt="image.png" title="image.png"></p><p>然而,我们发现IN并不适用于块级风格迁移,会导致块间风格不一致问题,可参考下图。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQm" alt="image.png" title="image.png"></p><p>在上图(a)中,我们对输入作为整体进行规范化;在上图(b)中我们将输入拆分为四块分贝进行规范化。这就导致最终的结果存在风格不一致问题。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQn" alt="image.png" title="image.png"></p><p>通过这种方式,TIN可以确保不同块间的风格一致性间,上图(c)。</p><h3>Stroke Perceptual Loss</h3><p>所提方法驱动我们提出一种辅助损失增大笔画边缘,该损失定义如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQo" alt="image.png" title="image.png"></p><h2>Experiments</h2><p>为验证所提方法的有效性,我们将其与AdaIN、WCT等方法进行了对比,见下图。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQp" alt="image.png" title="image.png"><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQp" alt="image.png" title="image.png"></p><p>从上图可以看到:(1) IN导致了明显的块间风格不一致问题;(2) <strong>所提方法取得了与全图相似的效果且显存占用更低</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQO" alt="image.png" title="image.png"></p><p>与此同时,我们还对比了所提损失函数的影响分析,见上图。可以看到:<strong>基于所提损失引导,这些模型可以生成更粗的线条与更稀疏的纹理,这有助于改善超高分辨率风格迁移</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQP" alt="image.png" title="image.png"><br>此外,我们还提供了不同风格迁移方案在不同输入分辨率输入时的显存占用对比。可以看到:大多方法甚至不能处理的高分辨率图像;而<strong>本文所提方法甚至可以处理分辨率图像且显存占用不超过5GB</strong>。理论上,本文所提方法可以处理任意高分辨率图像。</p><p>最后,我们提供一个超高分辨率图像风格迁移效果图作为结尾。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQQ" alt="image.png" title="image.png"></p><blockquote>来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FJqRUmFZLGtXDt814wH7ppA" target="blank">AIWalker</a><br>作者:   Happy</blockquote><p>推荐阅读</p><ul><li><a href="https://aijishu.com/a/1060000000386282"><strong>深入分析MobileAI图像超分最佳方案:ABPN</strong></a></li><li><a href="https://aijishu.com/a/1060000000385959"><strong>HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法</strong></a></li><li><a href="https://aijishu.com/a/1060000000385643"><strong>一层卷积能做啥?BOE告诉你:一层卷积可以做超分!</strong></a></li><li><a href="https://aijishu.com/a/1060000000385377"><strong>一层卷积能做啥?BOE告诉你:一层卷积可以做超分!</strong></a></li><li><a href="https://aijishu.com/a/1060000000380384"><strong>YOLOv6 v3.0 | 重磅升级!性能超越V8!</strong></a></li></ul><blockquote>本文章著作权归作者所有,任何形式的转载都请注明出处。更多动态滤波,图像质量,超分辨相关请关注我的专栏<a href="https://aijishu.com/blog/aiwalker">AIWalker</a>。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 04:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386996</guid>
            <link>https://aijishu.com/a/1060000000386996</link>
        </item>
        <item>
            <title><![CDATA[【TVM 学习资料】TensorIR 快速入门]]></title>
            <description><![CDATA[<p>本篇文章译自英文文档  [Blitz Course to TensorIR<br>](<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2Ftutorial%2Ftensor_ir_blitz_course.html" target="blank">https://tvm.apache.org/docs/t...</a>) 作者是 Siyuan Feng。更多 TVM 中文文档可访问→<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.hyper.ai%2F" target="blank">TVM 中文站</a> </p><p>TensorIR 是深度学习领域的特定语言,主要有两个作用:</p><ul><li>在各种硬件后端转换和优化程序。</li><li>自动 <em>tensorized</em> 程序优化的抽象。</li></ul><pre><code class="bash">import tvm
from tvm.ir.module import IRModule
from tvm.script import tir as T
import numpy as np</code></pre><h1>IRModule</h1><p>IRModule 是 TVM 的核心数据结构,它包含深度学习程序,并且是 IR 转换和模型构建的基础。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/eab85e2bd22d4c2199a5245e93ab04a5.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>上图展示的是 IRModule 的生命周期,它可由 TVMScript 创建。转换 IRModule 的两种主要方法是 TensorIR 的 schedule 原语转换和 pass 转换。此外,也可直接对 IRModule 进行一系列转换。注意,可以在任何阶段将 IRModule 打印到 TVMScript。完成所有转换和优化后,可将 IRModule 构建为可运行模块,从而部署在目标设备上。</p><p>基于 TensorIR 和 IRModule 的设计,可创建一种新的编程方法:</p><ol><li>基于 Python-AST 语法,用 TVMScript 编写程序。</li><li>使用 Python API 转换和优化程序。</li><li>使用命令式转换 API 交互检查和提高性能。</li></ol><h1>创建 IRModule</h1><p>IRModule 是 TVM IR 的一种可往返语法,可通过编写 TVMScript 来创建。</p><p>与通过张量表达式创建计算表达式(使用张量表达式操作算子)不同,TensorIR 允许用户通过 TVMScript(一种嵌在 Python AST 中的语言)进行编程。新方法可以编写复杂的程序并进一步调度和优化。</p><p>下面是向量加法的示例:</p><pre><code class="bash">@tvm.script.ir_module
class MyModule:
    @T.prim_func
    def main(a: T.handle, b: T.handle):
        # 我们通过 T.handle 进行数据交换,类似于内存指针
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # 通过 handle 创建 Buffer
        A = T.match_buffer(a, (8,), dtype="float32")
        B = T.match_buffer(b, (8,), dtype="float32")
        for i in range(8):
            # block 是针对计算的抽象
            with T.block("B"):
                # 定义一个空间(可并行)block 迭代器,并且将它的值绑定成 i
                vi = T.axis.spatial(8, i)
                B[vi] = A[vi] + 1.0
ir_module = MyModule
print(type(ir_module))
print(ir_module.script())</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.ir.module.IRModule'&gt;
# from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i in T.serial(8):
            with T.block("B"):
                vi = T.axis.spatial(8, i)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><p>此外,我们还可以使用张量表达式 DSL 编写简单的运算符,并将它们转换为 IRModule。</p><pre><code class="bash">from tvm import te
A = te.placeholder((8,), dtype="float32", name="A")
B = te.compute((8,), lambda *i: A(*i) + 1.0, name="B")
func = te.create_prim_func([A, B])
ir_module_from_te = IRModule({"main": func})
print(ir_module_from_te.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i0 in T.serial(8):
            with T.block("B"):
                i0_1 = T.axis.spatial(8, i0)
                T.reads(A[i0_1])
                T.writes(B[i0_1])
                B[i0_1] = A[i0_1] + T.float32(1)</code></pre><h1>构建并运行 IRModule</h1><p>可将 IRModule 构建为特定 target 后端的可运行模块。</p><pre><code class="bash">mod = tvm.build(ir_module, target="llvm")  # CPU 后端的模块
print(type(mod))</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.driver.build_module.OperatorModule'&gt;</code></pre><p>准备输入数组和输出数组,然后运行模块:</p><pre><code class="bash">a = tvm.nd.array(np.arange(8).astype("float32"))
b = tvm.nd.array(np.zeros((8,)).astype("float32"))
mod(a, b)
print(a)
print(b)</code></pre><p>输出结果:</p><pre><code class="bash">[0. 1. 2. 3. 4. 5. 6. 7.]
[1. 2. 3. 4. 5. 6. 7. 8.]</code></pre><h1>转换 IRModule</h1><p>IRModule 是程序优化的核心数据结构,可通过 Schedule 进行转换。schedule 包含多个 primitive 方法来交互地转换程序。每个 primitive 都以特定方式对程序进行转换,从而优化性能。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f1d1c2925359488883e2cb5e0a43802f.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>上图是优化张量程序的典型工作流程。首先,用 TVMScript 或张量表达式创建一个初始 IRModule,然后在这个初始 IRModule 上创建 schedule。接下来,使用一系列调度原语来提高性能。最后,我们可以将其降低并构建成一个可运行模块。</p><p>上面只演示了一个简单的转换。首先,在输入 ir_module 上创建 schedule:</p><pre><code class="bash">sch = tvm.tir.Schedule(ir_module)
print(type(sch))</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.tir.schedule.schedule.Schedule'&gt;</code></pre><p>将嵌套循环展开成 3 个循环,并打印结果:</p><pre><code class="bash"># 通过名字获取 block
block_b = sch.get_block("B")
# 获取包围 block 的循环
(i,) = sch.get_loops(block_b)
# 展开嵌套循环
i_0, i_1, i_2 = sch.split(i, factors=[2, 2, 2])
print(sch.mod.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0, i_1, i_2 in T.grid(2, 2, 2):
            with T.block("B"):
                vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><p>还可对循环重新排序。例如,将循环 i_2 移到 i_1 之外:</p><pre><code class="bash">sch.reorder(i_0, i_2, i_1)
print(sch.mod.script())</code></pre><p>输出结果</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0, i_2, i_1 in T.grid(2, 2, 2):
            with T.block("B"):
                vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><h1>转换为 GPU 程序</h1><p>要在 GPU 上部署模型必须进行线程绑定。幸运的是,也可以用原语来增量转换。</p><pre><code class="bash">sch.bind(i_0, "blockIdx.x")
sch.bind(i_2, "threadIdx.x")
print(sch.mod.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0 in T.thread_binding(2, thread="blockIdx.x"):
            for i_2 in T.thread_binding(2, thread="threadIdx.x"):
                for i_1 in T.serial(2):
                    with T.block("B"):
                        vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                        T.reads(A[vi])
                        T.writes(B[vi])
                        B[vi] = A[vi] + T.float32(1)</code></pre><p>绑定线程后,用 cuda 后端来构建 IRModule:</p><pre><code class="bash">ctx = tvm.cuda(0)
cuda_mod = tvm.build(sch.mod, target="cuda")
cuda_a = tvm.nd.array(np.arange(8).astype("float32"), ctx)
cuda_b = tvm.nd.array(np.zeros((8,)).astype("float32"), ctx)
cuda_mod(cuda_a, cuda_b)
print(cuda_a)
print(cuda_b)</code></pre><p>输出结果:</p><pre><code class="bash">[0. 1. 2. 3. 4. 5. 6. 7.]
[1. 2. 3. 4. 5. 6. 7. 8.]</code></pre><p><a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2F_downloads%2Feac4389b114db015e95cb3cdf8b86b83%2Fauto_scheduler_matmul_x86.py" target="blank">下载 Python 源代码</a><br><a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2F_downloads%2F246d4b8509474fd9046e69f6cc9b7f87%2Fauto_scheduler_matmul_x86.ipynb" target="blank">下载 Jupyter Notebook</a></p><p>以上就是该文档的全部内容,查看更多 TVM 中文文档,请访问→<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.hyper.ai%2F" target="blank">TVM 中文站</a></p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 03:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386987</guid>
            <link>https://aijishu.com/a/1060000000386987</link>
        </item>
        <item>
            <title><![CDATA[反其道而行,大学教授鼓励学生用 ChatGPT 写论文]]></title>
            <description><![CDATA[<p>新 AI 工具 ChatGPT 的到来,正在教育圈呈现出冰火两重天的态势,教授们几家欢喜几家愁。</p><p>这不近日,来自宾夕法尼亚大学沃顿商学院的一位专门研究创业与创新的资深教授 Ethan Mollick 发表了一篇长文呼吁,让学生拥抱 ChatGPT,也可以使用 ChatGPT 写论文,因为只有这样,才能让学生们经过事实核查从而能够很快理解 AI 的准确性和偏见问题。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPr" alt="1.png" title="1.png"></p><h2>反其道而行:使用 ChatGPT,大学生快上车!</h2><p>作为大学教授,这一不走寻常路的举措,引发了不少人的关注。</p><p>毕竟此前据调查显示,美国 89% 的大学生在用 ChatGPT 做作业。当时的这个结果让很多教育界的高校老师都感到头疼,来自弗曼大学哲学助理教授 Darren Hick 也曾发文斥责,「ChatGPT 都成学生的作弊神器了,这让我感到极度恐惧。」</p><p>为了让学生能够潜下心踏踏实实地学习,国内外多所学校发布相应应对措施,如美国纽约市教育部宣布,纽约市的学生和教师,无法再在教育部设备或互联网上访问 ChatGPT;斯坦福研究人员推出了 DetectGPT,便于检测出 AI 生成文本;香港大学向师生发出内部邮件,明确禁止在港大所有课堂、作业和评估中使用 ChatGPT 或其他 AI 工具......</p><p>可以说,ChatGPT 诞生的近三个月间,尤其是老师群体反对的声音颇为强烈。Ethan Mollick 如今的做法,似乎在反其道而行。</p><p>不过,在 Ethan Mollick 教授看来,倘若一味地禁止,只会适得其反。当然,也不能完全地放任学生使用 AI 工具而不顾,得有教学策略。</p><p>他表示,过去一学期已经在课堂上完全接受 AI 的存在,也会要求学生以多种方式使用 AI 工具。通过实践,Ethan Mollick 给出直观的总结:太好用了!而且我还已经学到了一些我认为值得传承的早期课程。效果非常成功,但也有一些教训要吸取。</p><h2>学术中使用 ChatGPT 的前提条件</h2><p>首先,在大的背景上,Ethan Mollick 教授要求在三个独立的面向本科和硕士级别的创业和创新课程中以稍微不同的方式使用 AI。具体模式如下:</p><ol><li>第一门课程整体建立在广泛使用人工智能的基础上。其要求学生使用人工智能来帮助他们产生想法、制作书面材料、帮助创建应用程序、生成图像等等。</li><li>第二门课程中的作业要求学生使用 AI。</li><li>第三门课程中,Ethan Mollick 向学生介绍了 AI 工具并提出了使用建议,但没有具体的 AI 作业。<br>在三种不同的课程中,Ethan Mollick 使用了相同的 AI 政策:</li></ol><p>我希望你在这门课上使用 AI(至少是 ChatGPT 和图像生成工具)。学习使用人工智能是一项新兴的技能,我在 Canvas 中提供关于如何使用它们的教程。我很乐意在办公时间或课后与学生见面并帮助他们使用这些工具。</p><p>请注意使用 ChatGPT 的限制:</p><ul><li>如果你提供最少的描述提示,你会得到低质量的结果。你需要改进你的提示,以获得良好的结果。这一点非常有用。</li><li>不要相信它说的任何东西。如果它给你一个数字或事实,除非你知道答案或可以通过其他来源查询验证,否则就一定要认为它是错误的。你将对该工具提供的任何错误或遗漏负责。它对你理解的主题效果最好。</li><li>Al 是一个工具,但你需要承认它的使用。请在任何使用人工智能工具的作业的结尾处附上一段话,解释你使用人工智能的目的以及你使用什么提示来获得结果。如果不这样做,就违反了学术诚信政策。</li><li>这个工具在用的时候要深思熟虑。如果它不适合相关的案例或情况,就不要使用它。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPs" alt="2.png" title="2.png"></li></ul><h2>没有培训,每个人都用错了 AI</h2><p>Ethan Mollick 表示,“我一直听到老师抱怨,说他们看到很多写得不好的人工智能文章,尽管 ChatGPT 其实能够写得相当好。我想我知道为什么,几乎每个人在使用人工智能方面的最初尝试都很糟糕。”</p><p>因此,他为了找到原因,在布置的一次作业中,要求学生用 ChatGPT "作弊"。学生们需要写一篇 5 段话的文章,题目与大家在课堂上学到的课程有关(如团队动力、选择领导者、行动后的回顾反思、沟通愿景,随大家自由选择)。前提条件是要让 AI 来写,同时这篇文章里面至少要插入 1 张应景的图片,且学生必须至少提供 5 个描述,而且他们必须在最后写一份关于人工智能如何做的反思稿件。</p><p>经过测试,Ethan Mollick 发现几乎每个学生提供的第一个描述提示都是非常直接了当的,他们往往会直接复制作业的要求,往 ChatGPT 的对话窗口粘贴,等待结果的自动生成,然后再将结果复制粘贴到新文本中,提交给老师审阅,由此出现了大多数老师疯狂吐槽各种论文的场景。</p><p>不过,在 Ethan Mollick 布置的作业中,其要求学生使用多个提示,这迫使学生不断思考如何提高 AI 产出内容的质量。在这一点上,学生们经过多轮的描述,往往会朝着下面三个方向走去:</p><p><strong>方法 1 :细微地变化,让 AI 完成作业</strong></p><ol><li>生成一篇关于选择领导者的 5 段话文章</li><li>生成一篇关于团队如何选择领导者的 5 段话文章</li><li>生成一篇关于团队如何选择领导者以及团队流程如何运作的 5 段话文章</li><li>生成一篇关于如何通过团队、团队流程和领导能力选择领导者的 5 段话文章</li><li>生成一篇关于如何通过团队、团队流程和领导能力选择领导者的 5 段话文章,250 字。</li></ol><p><strong>方法 2:增加一些限制和专业知识</strong></p><ol><li>生成一篇关于选择领导者的 5 段话文章</li><li>生成一篇关于选择领导者的 5 段话文章,内容包括:能说会道的能力、领导者地位影响和资历</li><li>生成一篇关于选择领导者的 5 段话文章,内容包括:能说会道的能力、领导者地位影响和资历。解释谁能说会道,谁就能成为领导者。</li><li>生成一篇关于选择领导者的 5 段话文章,内容包括:能说会道的能力、领导者地位影响和资历。解释谁能说会道,谁就能成为领导者。并举例说明。使用生动的语言,并从一个回国攻读 MBA 的管理顾问的角度出发。为 MBA 课程的教授写一篇关于团队战略和企业家精神的文章。</li><li>生成一篇关于选择领导者的 5 段话文章,内容包括:能说会道的能力、领导者地位影响和资历。解释谁能说会道,谁就能成为领导者。考虑每种能力的挑战和优势。举例说明。使用主动时态和讲故事的方式。使用生动的语言,并从一个回国攻读 MBA 的管理顾问的角度出发。为 MBA 课程的教授写一篇关于团队战略和企业家精神的文章。</li></ol><p><strong>方法 3:共同编辑</strong></p><ol><li>生成一篇关于选择领导者的 5 段话文章</li><li>那很好,但第三段不对。能说会道是指谁说得最多,谁就能成为领导者。纠正这一点,并增加更多关于如何使用这种能力的细节。在第 2 段中增加一个示例</li><li>第 2 段的示例不对,总统选举是每 4 年举行一次。让最后一段的语气更有趣。不要用 "总而言之 "这个短语</li><li>给我三个可以用在第 4 段中的示例,并确保它们具有更多的故事性和更生动的语言。不要使用仅以男性为特征的例子。</li><li>把这一段加回到故事中去,把第二段换成关于个人领导风格的一段。修正最后一段,使文字在以充满希望的感情上结束。</li></ol><p>毋庸置疑,第一种只有细微的修改,让 ChatGPT 生成的内容显得非常平庸,还很空洞。</p><p>第二种方法明显要好得多,但结果却不可控,因为学生要根据整个提示进行反复试验。这使得对一篇好文章进行微调变得很困难,使用这种方法的学生经常反馈称,他们觉得自己对 AI 的输出没有太多的控制权。</p><p>到目前为止,最好的方法便是第三种——采取“AI+人工”共同编辑的方法,这往往会带来一篇令人影响深刻的论文。不过,这种方法需要学生非常仔细地关注 AI 的输出,这也使得它对学生的学习非常有用。</p><p>因此,Ethan Mollick 建议,如果高校的老师们打算将 AI 引入进自己的课堂,那么第三种方式最为推荐。</p><h2>上至 CEO,下至程序员,ChatGPT 无处不在</h2><p>现如今,无论是否接受,AI 已经渗透到学术、产业、研究等领域。据《华尔街日报》最新报道,上至 CEO,下至程序员,从传统互联网公司 Google、微软、Netflix 再到石油和天然气生产商 Devon Energy,很多公司已经开始尝试使用生成式人工智能技术。</p><p>“它所服务的目的不是让你知道你不知道的事情。这真的是一个工具,让你能够更好地做你的工作”,人工智能研究初创公司 Hugging Face 的首席伦理科学家 Margaret Mitchell 说道。</p><p>对于学术界而言,学生本是一张空白纸,如果在新技术到来之际,与其想着如何避免学生去接触,Ethan Mollick 认为可以花更多的时间引导学生如何正确使用 AI 工具,譬如 ChatGPT 生成的内容质量与提示语有很大的相关性,很多学生在没有引导下使用,只会提供一个非常简单的描述,如上述方法 1 所示。因此,对 AI 工具的培训真的很重要,需要向学生展示提示语制作的基本知识。</p><p>最后,Ethan Mollick 对所有的老师呼吁,不要总是担心学生会被 ChatGPT 生成的虚假内容所吸引。事实上,如果遵循自己对自己论文中的事实负责原则,很多学生会进一步去进行查证,也有能力理解工具的局限性,对事实的查找学习会迫使学生进一步关注 AI 论文的细节,创造一些真正的可教时刻。</p><blockquote>参考链接:<br><a href="https://aijishu.com/link?target=https%3A%2F%2Foneusefulthing.substack.com%2Fp%2Fmy-class-required-ai-heres-what-ive" target="blank">https://oneusefulthing.substa...</a></blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 02:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386961</guid>
            <link>https://aijishu.com/a/1060000000386961</link>
        </item>
        <item>
            <title><![CDATA[ECCV'22 Oral|VQFR|基于矢量量化字典与双解码器的人脸盲修复网络]]></title>
            <description><![CDATA[<h2>ECCV'22 Oral|VQFR|基于矢量量化字典与双解码器的人脸盲修复网络</h2><p>ECCV'22 Oral - VQFR: Blind Face Restoration with Vector-Quantized Dictionary and Parallel Decoder</p><p>解读:Owen718 论文链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Farxiv.org%2Fpdf%2F2205.06803.pdf" target="blank">https://arxiv.org/pdf/2205.06803.pdf</a></p><h2>Background&amp;Motivation</h2><p>尽管生成式面部先验和结构化面部先验最近已经证明了可以生成高质量的人脸盲修复结果,稳定、可靠生成更细粒度的脸部细节仍然是一个具有挑战性的问题。这篇文章受最近基于字典的方法和基于矢量量化的方法启发,提出了一种 基于矢量量化(VQ-based)的人脸盲修复方法VQFR。VQFR从高质量的图像中抽取特征,构建low-level特征库从而恢复逼真的面部细节。</p><p>这篇工作重点关注如下两个问题:</p><ul><li>1.<strong>codebook中每个code对应的原图patch大小会极大影响人脸网络修复结果的质量与保真度权衡,而实际落地应用中,质量与保真度需要做到良好的平衡以获得最佳视觉效果。</strong></li><li>2.<strong>原图退化特征需要与来自codebook的高质量特征做融合,融合过程中,如何做到高质量特征不被退化特征所干扰而导致性能降低?</strong></li></ul><h2>详细介绍引入</h2><p>人脸恢复的目标是恢复低质量(LQ)面孔并纠正未知退化,例如噪声、模糊、下采样引起的退化等。在实际情况下,此任务变得更具挑战性,因为存在更复杂的退化、多样的面部姿势和表情。以前的作品通常利用特定于人脸的先验,包括几何先验、生成先验和参考先验。具体来说,几何先验通常包括面部标志、面部解析图和面部组件热图。它们可以为恢复准确的面部形状提供全局指导,但不能帮助生成逼真的细节。此外,几何先验是从退化图像中估计出来的,因此对于具有严重退化的输入变得不准确。这些特性促使研究人员寻找更好的先验。最近的人脸修复工作开始研究生成先验(GAN-Prior),并取了优异的性能。这些方法通常利用预先训练的人脸生成对抗网络(例如StyleGAN)的强大生成能力来生成逼真的纹理。这些方法通常将退化的图像投影回GAN潜在空间,然后使用预先训练的生成器解码高质量(HQ)人脸结果。尽管基于GAN先验的方法最初从整体上讲具有良好的恢复质量,但仍然无法生成细粒度的面部细节,特别是精细的头发和精致的面部组件。这是因为训练有素的GAN模型,其潜在空间仍然是不够完善的。基于参考的方法(Reference-based methods)—探索了高质量的指导面孔或面部组件字典来解决面部恢复问题。DFDNet是该类别中的代表方法,它不需要访问相同身份的面孔,就可以产生高质量的结果。它明确建立高质量的“纹理库”,用于几个面部组件,然后用字典中最近的高质量面部组件替换退化的面部组件。这种离散的替换操作可以直接弥合低质量面部部件与高质量部件之间的差距,因此具有提供良好面部细节的潜力。然而,DFDNet中的面部组件字典仍然有两个缺点。<strong>1)它使用预先训练的VGGFace网络进行离线生成,该网络是为识别任务优化的,明显并不适合恢复任务。2)它只关注几个面部组件(即眼睛、鼻子和嘴巴),但不包括其他重要区域,例如头发和皮肤。</strong></p><p>面部组件字典的局限性促使VQFR探索<strong>矢量量化(VQ)码本</strong>,这是一个为所有面部区域构建的字典。VQFR提出的人脸恢复方法VQFR既利用字典方法又利用GAN训练,但不需要任何几何或GAN先验。与面部组件字典相比,VQ码本可以提供更全面的低层特征库,而不局限于有限的面部组件。它也是通过面部重建任务以端到端的方式来学习的。此外,矢量量化的机制使其在不同的退化情况下更加稳健。尽管简单地应用VQ码本可以取得不错的效果,但要实现良好的结果也不容易。后续进一步介绍了两个特殊的网络设计以应对前文提到的两个problems,这将帮助VQFR在细节生成和身份保留方面都超越先前的方法。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPM" alt="image.png" title="image.png"></p><p>具体来说,为了生成逼真的细节,作者发现选择适当的压缩补丁大小至关重要,它表示codebook的一个code“由多大的补丁表示”。如图2所示,较大的patch可以带来更好的视觉质量,但是真实度却会下降。经过全面的调查,我们建议输入图像大小512x512时,32大小的patch size最合适。然而,这种选择只是在质量和真实度之间进行权衡。表情和身份也可能会因适当的压缩补丁大小而有很大的变化。一个直接的解决方案是将输入特征与不同的解码器层融合,这与GFP-GAN中的操作类似。尽管输入特征可以带来更多的真实度信息,但它们也会干扰从VQ代码本生成的逼真细节特征。这个问题引出了作者的第二个网络设计:并行解码器。具体而言,并行解码器结构包括纹理解码器和主解码器。VQFR的纹理解码器仅接收来自VQ代码本的潜在表示的信息,而主解码器将纹理解码器中的特征做变换以匹配退化输入的需保留的特征。<strong>为了避免高质量细节的损失并更好地匹配退化的面部,VQFR在主解码器中进一步采用了具有可变卷积的纹理变换模块。通过VQ codebook作为面部字典和并行解码器设计,VQFR可以实现更高质量的面部细节修复,同时尽可能得保留面部恢复的真实度。</strong></p><h2>VQFR方法概述</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPN" alt="image.png" title="image.png"></p><p>VQFR模型架构图。VQFR由一个编码器组成,用于映射退化的人脸 进入潜在和并行解码器以利用 HQ 代码和输入功能。编码器 和解码器由矢量量化模型和预训练的 HQ 码本,将编码的latent feature替换为 HQ 代码</p><p>Vector-Quantized Codebook最早在VQVAE中被引入,旨在学习离散的先验来编码图像。VQFR中的codebook部分与VQGAN中的基本一致。VQGAN 主要是采用了感知损失和对抗性损失以鼓励具有更好感知质量的重建。VQFR方法主要基于以下两个观察来提高修复性能:</p><ol><li><strong>通过采用合适的压缩补丁大小,可以用仅由高品质人脸训练的VQ码本来去除LQ人脸的退化。</strong></li><li><strong>在训练恢复任务时,在改进的细节纹理和保真度变化之间需要保持一个平衡。</strong></li></ol><p>针对观察现象一,VQFR采用合适的f大小来控制codebook效果,f取32最佳。针对观察现象二,VQFR提出利用双分支架构的decoder来逐渐将高质量纹理特征补充进待修复特征中,texture warp module利用可变形卷积很好的实现了这一目的。反观之前的相似工作,之前工作中单一分支decoder架构很难较好的融合低质特征和高质量特征,这导致了恢复性能不佳。</p><h2>实验</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPO" alt="image.png" title="image.png"></p><p>VQFR在CelebA-Test数据集和LFW数据集上均取得了领先的性能结果,值得关注的是其PSNR/SSIM指标并不十分出色,但是FID、NIQE、LMD指标非常不错,视觉效果也体现了该方法的优越性。</p><h3>真实度与保真度的平衡</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPP" alt="image.png" title="image.png"></p><p>可以看出VQFR取得了非常不错的真实度与保真度的平衡,实验效果很出色。</p><h2>总结</h2><p>本文提出的VQFR是一种性能非常不错的人脸盲修复方法,文章思路非常清晰,明确点出核心motivation和为解决的相关问题,最后的实验结果也非常精彩,很好的证明了方法的基本理论与出发点,更多细节建议大家参考原文。</p><blockquote>作者: owen      <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FxGhgltsOTeO6-2VILnJsLQ" target="blank">GiantPandaCV</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000386641">编译器优化那些事儿(4):归纳变量</a></li><li><a href="https://aijishu.com/a/1060000000386334">编译器优化那些事儿(3):Lazy Code Motion</a></li><li><a href="https://aijishu.com/a/1060000000386007">编译器优化那些事儿(2):常量传播</a></li></ul><blockquote>欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区<a href="https://aijishu.com/blog/qianrushikezhan">嵌入式客栈</a>专栏欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 02:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386978</guid>
            <link>https://aijishu.com/a/1060000000386978</link>
        </item>
        <item>
            <title><![CDATA[推荐系统[八]算法实践总结V0:腾讯音乐全民K歌推荐系统架构及粗排设计]]></title>
            <description><![CDATA[<h1>1.前言:召回排序流程策略算法简介</h1><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/44083e4c130841f894e36366a71f8d96.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>推荐可分为以下四个流程,分别是召回、粗排、精排以及重排:</p><ol><li>召回是源头,在某种意义上决定着整个推荐的天花板;</li><li>粗排是初筛,一般不会上复杂模型;</li><li>精排是整个推荐环节的重中之重,在特征和模型上都会做的比较复杂;</li><li>重排,一般是做打散或满足业务运营的特定强插需求,同样不会使用复杂模型;</li></ol><ul><li><p><strong>召回层</strong>:召回解决的是从海量候选item中召回千级别的item问题</p><ul><li>统计类,热度,LBS;</li><li>协同过滤类,UserCF、ItemCF;</li><li>U2T2I,如基于user tag召回;</li><li>I2I类,如Embedding(Word2Vec、FastText),GraphEmbedding(Node2Vec、DeepWalk、EGES);</li><li>U2I类,如DSSM、YouTube DNN、Sentence Bert;</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/b935ff75e3e84d7f88de39613bb02bad.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p></li><li><strong>模型类</strong>:模型类的模式是将用户和item分别映射到一个向量空间,然后用向量召回,这类有itemcf,usercf,embedding(word2vec),Graph embedding(node2vec等),DNN(如DSSM双塔召回,YouTubeDNN等),RNN(预测下一个点击的item得到用户emb和item emb);向量检索可以用Annoy(基于LSH),Faiss(基于矢量量化)。此外还见过用逻辑回归搞个预估模型,把权重大的交叉特征拿出来构建索引做召回</li><li><p><strong>排序策略</strong>,learning to rank 流程三大模式(pointwise、pairwise、listwise),主要是特征工程和CTR模型预估;</p><ul><li><p><strong>粗排层</strong>:本质上跟精排类似,只是特征和模型复杂度上会精简,此外也有将精排模型通过蒸馏得到简化版模型来做粗排</p><ul><li>常见的特征挖掘(user、item、context,以及相互交叉);</li></ul></li><li><p><strong>精排层</strong>:精排解决的是从千级别item到几十这个级别的问题</p><ul><li><strong>CTR预估</strong>:lr,gbdt,fm及其变种(fm是一个工程团队不太强又对算法精度有一定要求时比较好的选择),widedeep,deepfm,NCF各种交叉,DIN,BERT,RNN</li><li><strong>多目标</strong>:MOE,MMOE,MTL(多任务学习)</li><li><strong>打分公式融合</strong>: 随机搜索,CEM(性价比比较高的方法),在线贝叶斯优化(高斯过程),带模型CEM,强化学习等</li></ul></li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c764dfd7b65048f3a2ab2b97214135a3.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p></li><li><strong>重排层</strong>:重排层解决的是展示列表总体最优,模型有 MMR,DPP,RNN系列(参考阿里的globalrerank系列)</li><li><p><strong>展示层</strong>:</p><ul><li><strong>推荐理由</strong>:统计规则、行为规则、抽取式(一般从评论和内容中抽取)、生成式;排序可以用汤普森采样(简单有效),融合到精排模型排等等</li><li><strong>首图优选</strong>:CNN抽特征,汤普森采样</li></ul></li><li><strong>探索与利用</strong>:随机策略(简单有效),汤普森采样,bandit,强化学习(Q-Learning、DQN)等</li><li><strong>产品层</strong>:交互式推荐、分tab、多种类型物料融合</li></ul><h1>2.业务背景</h1><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/979ec768bf184537b6cdf2a4696229c5.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>全民K歌涉及多样化的推荐场景,涵盖内容、直播、歌房、用户等多种形态。</p><p>具体的推荐功能如上图所示,主要包括以下几类:</p><p>① 基于内容的推荐,包括优质UGC推荐、关注流推荐、同城社交推荐等功能模块。</p><ul><li>优质UGC推荐,将平台原生原创的优质音视频内容进行推荐</li><li>关注流推荐,对关注的内容进行混排</li><li>同城社交推荐,基于同城的社交进行推荐</li></ul><p>② 除了内容推荐外,我们也会负责一些其他类型的推荐,包括直播推荐、点歌推荐、歌房推荐和点评推荐,都是在K歌生态下独有的推荐。</p><h1>3.推荐系统架构及挑战</h1><p>推荐系统主要分为四个部分,包括召回层、粗排层、精排层及重排层。</p><h2>3.1召回层</h2><p>召回层的作用主要是从海量的item中筛选小量级的用户可能感兴趣的内容。在这个模块中最重要、大家了解最多的肯定就是召回模块本身。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/28d6ce28d0ad475ca1526f0714be96e9.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>一般来说,我们线上的召回方法会分为索引类的召回、泛社交的召回以及模型的召回。</p><ul><li>索引类的召回:主要根据画像的结果做精准的ID类召回,比如对用户感兴趣的歌曲进行召回,以及用户感兴趣的创作者进行召回。</li><li>泛社交的召回:主要基于用户在站内丰富的社交关系,比如用户可能会关注一些其他的用户,也可能加入一些家族,我们会根据这些社团的发现结果做泛化召回。</li><li>模型的召回:基于模型的召回的方法比较多,在后面会展开介绍。</li></ul><p>除了召回模块之外,我们在召回层认为另外一个比较重要的是内容的比例筛选,因为我们整体的内容发表量比较大,每天可能有500万的作品在平台内发表,如何从中筛选出合适的内容,需要基于音视频的理解,以及基于我们自己的流量策略来综合发现。</p><h2>3.2 粗排层</h2><p>粗排层到精排层相当于是一个承上启下的作用,它会把我们召回到的一些万量级的作品进一步筛选到千量级,既要考虑打分的性能问题,又要考虑排序粗排精准度的问题。一般来说,粗排模型会用一些模型蒸馏的方法,包括<strong>特征蒸馏或者基于模型本身的结构蒸馏</strong>,以及把这些不同的蒸馏方法组合起来等等。在粗排层,除了做粗排的打分外,我们还会重点做生态的控制,特别在一些内容推荐场景或者直播推荐场景中,我们会注重这里面的内容生态,包括时效性,内容的调性,多样性等等。</p><h2>3.3 精排层</h2><p>粗排层之后就来到了精排层,精排层主要根据千量级的作品进一步的进行精排打分来筛选到百量级的作品。在精排层,我们主要注意以下几方面:</p><ul><li>一个就是精排模型本身,我们早期也采用了类似LR的线性模型和LightGBM这样的树模型,之后随着深度模型的技术发展,我们所有的场景都切换到了深度模型,并且随着深度网络的设计复杂度,以及样本规模的逐步增加,让早期基于TF训练的一些深度模型引擎,在训练的速度以及对模型大小规模的限制,已经对我们产生了影响。所以我们现在已经过渡到基于参数服务器框架下,训练深度模型。</li><li>在精排前,除了模型怎么训练构造外,另外两个比较重要的是特征和样本的构造,以及在这个场景下的多目标设计。特别是多目标的问题,可能还涉及到具体的网络结构如何做,以及最后的结果如何融合。</li></ul><ol start="4"><li>重排层</li></ol><p>从精排层排序出百量级的作品后,就会进入到重排层。重排层会基于业务规则进行进一步的干预,比如同一首歌曲的视频不能连续出现,同一个创作者的视频不能连续出现等等。除了基于规则性的限制外,我们也会考虑使用模型化的方法做多样性的打散,并且在第4部分,我们也会具体介绍DPP算法的原理和思想。除了模型方法之外,我们也在考虑通过list wise的方法做内容的重排。</p><h1>4.粗排模块算法设计</h1><h2>4.1 粗排模块定位和方案路线</h2><p>粗排模型和精排模型不同,<strong>它可能既需要解决模型预测的准确性,又需要解决模型预测的效率</strong>。接下来,为大家介绍我们整个推荐系统如何在线上真实运转。</p><p>粗排模块主要包含两部分:</p><ul><li>第一部分是粗排的排序部分,这一部分主要就是为了解决一个大规模item的预排序问题。</li><li>第二个部分是多样性控制部分,作为一个UGC平台,我们需要考量内容在整个内容生态中的分发状况,以及均衡的考量生产者跟消费者之间的关系。我们是通过多样性调节算法来间接实现这个目的的。</li></ul><p>让我们再回顾下前面所提到的整个召回系统架构,我们可以看到它其实是一个典型的节点架构,从内容发现到召回,到粗排到精排,然后重排,最后把合适的内容推荐给用户。由于我们是一个比较大的UGC生产平台,从一个UGC平台的角度来考虑,我们倾向于分发较为新的作品,因为新的作品的分发会为那些活跃的创作者带来一定的流量激励,使得生产端跟消费端产生联动,促进了一种正向的循环。<br><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/a482dc35c51b4eb888e3ee59e8754550.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>我们以三个月内的站内发布作品为例,三个月内的站内发布作品大概会到十的九次方量级,然后我们通过一些内容挖掘跟优质内容发现的方式,从中找到更为优质的一部分内容,这部分内容仍然有十的七次方量级,相当于从百万量级的作品库做兴趣的召回。这是一个非常大的候选集场景,从优质内容的发现到召回,是整个UGC平台和推荐系统的连接,背后承载着我们对整个UGC的分发、内容生态的理解。这一部分我们会在第三个环节去做进一步详细的介绍。召回可以看到有十的七次方的候选集召回,通常完成召回过程之后仍然有十的五次方候选集,而精排通常只能去处理一个千级别的规模,所以我们看到这中间存在一个比较大的漏斗,很多时候会成为我们在效果或者一些收益上的瓶颈。这时,粗排模块的重要性就体现出来了。粗排模块的一个重要的作用就是防止召回到精排之间的漏斗过大,导致过多的信息损失。</p><p>大家可能比较了解的是,召回跟精排召回更像是一个集合,选择的过程更侧重于选择效率最高的方法,至于topk中item之间的先后顺序,其实不是最关心的因素;而精排环节相对来说它更强调次序,也就是说item A跟item B的先后顺序是非常敏感和关键的。</p><p>粗排夹在召回跟精排之间,它的定位是什么?相比于召回,粗排更强调排序性,也就是更强调topk内部的排序关系;相对于精排,粗排更强调性能,因为精排通常有非常复杂的网络结构,非常大的参数量,这也意味着它在实际应用的过程中比较难去处理一个较大规模量级的候选集的打分,这时粗排就必须要解决这个问题,所以它在性能上会相较于精排有更多的要求。现在主流的粗排方案有两条路线,这两条路线是基于两个出发点来思考的:</p><ul><li>第一条路线是把粗排当成是召回的一种延伸,它的技术选型会像是一种集合,<strong>选择的方案和目标是选出效率最高的子集</strong>。常用的方式,简单的可以通过实时的serving或者一些实时的指标对召回排序的结果做一个选择。总体来说,这条技术路线最大的优点是算力消耗非常小、性能非常好,但是它的缺点是本身的表达能力是有限的,可以明显预估到它的天花板。</li><li>第二条路线是从精排的角度,把粗排当成是精排的迁移或压缩,也就是说这是一条排序的路线,<strong>它的建模目标是预估值</strong>。这种方法的好处是它的表达能力很强,因为通常会用到一些比较复杂的网络结构,而且它跟精排的联动性是更好的,可以让粗排跟精排的目标保持某种程度上的一致性。同时,它的缺点也凸显出来了,就是我们用到了复杂的方法,算力的消耗一定也会相应的提升。因此,<strong>需要着重解决的是如何在有限的算力下尽可能地突破表达能力上限</strong>。在这种路线下,我们通常会在架构选择上选择双塔结构模型。</li></ul><h2>4.2 粗排双塔模型实践</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f5af219903eb4f7ba4be13edd86ecbaa.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><blockquote>我们通过把user和item的feature进行结构解耦与分开建模,然后完成整个架构的设计,在模型训练完毕之后,我们会通过user serving实时的产出user embedding,再通过索引服务把该用户所有的候选集合的ID给取出来,最后在userembedding跟item embedding之间做內积的运算,得到一个粗排的预估值,作为整个粗排阶段的排序依据。</blockquote><p><strong>这么做的优势是user/item 结构是解耦的,内积计算的算力消耗小。</strong></p><p>同时,它的缺点也非常的明显:</p><ul><li>第一个是它在特征表达上是缺失的,因为user跟item解耦之后,很难使用一些交叉特征,一旦用了交叉特征,有多少item就得进行多少次预估,这违背了我们使用双塔模型的初衷。</li><li>第二个是它在结构上也是有缺陷的,我们回忆一下上面这幅框架图,可以看到user跟item的交互非常少,这会限制它的表达能力的上限。</li></ul><p>如果我们选择了这种技术方案,我们可以保障它的性能,但是我们需要进一步的考虑如何避免这种简易的结构所带来的效果上的损失。在这种情况下,我们通常会使用一些模型蒸馏的方式。</p><p>模型蒸馏有两个关键词,第一个是它本质上是一种迁移学习,也就是transfer learning,第二个是transfer的方式是通过所谓的label,区别于我们平时理解的样本label离散值,变为了0到1之间的一个连续值。常见的蒸馏模型架构,会有涉及到两个模型,第一个模型叫做教师模型,叫做teacher,第二个模型是学生模型,叫做student。这两个模型的总体思路是teacher模型是一个非常大、非常复杂、学习到的东西非常多的模型,teacher模型会把学习到的知识传导给student模型,受限于某些原因,该模型没有办法做得很复杂,或者它的规模必须限制在一定范围内的子模型。</p><p>具体流程如下:</p><ol><li>准备训练样本,对teacher模型预训练,即得到了teacher模型;</li><li>把teacher模型最后一层或倒数第二层的输出结果,作为传递给student模型的信息,这部分通常是logits或softmax的形式,也叫做soft labels;</li><li>把soft labels传导到student模型,作为模型loss的一部分,因为student模型除了要拟合teacher模型传递的信息,也要去拟合样本真实的分布。</li></ol><p><strong>针对上述流程里涉及到了几个概念,有如下的进一步解释:</strong></p><ul><li><strong>关于logits</strong>:<strong>它是teacher模型层层映射后的一个抽象度很高且信息浓度很大的结果,是整个知识传递的媒介</strong>。在logits后,<strong>通常会接一个softmax,但是softmax会放大logits的两极差异,造成细节损失,而这些细节恰恰是帮助student模型更好学习的关键</strong>。为了克服以上问题,我们选用了改进的softmax,即softmax with temperature</li></ul><p>$q_i=\frac{\exp \left(z_i / T\right)}{\sum_j \exp \left(z_j / T\right)}$</p><p>这里,引入一个超参数T控制整个softmax分布的陡峭或平滑程度,间接控制蒸馏的强度。通常,T要设置成多少没有一个定论,与实际场景相关,依赖相应场景下的一些实验设计。</p><ul><li>关<strong>于loss</strong>:预训练好teacher模型后,转而关注student模型,它的最小化loss由两部分构成,<strong>一部分是尽可能拟合teacher模型的输出结果,另一部分是尽可能拟合真实样本</strong>。<strong>由于student模型的表达能力有限</strong>,直接用student模型拟合真实样本可能学不好或者学偏;<strong>teacher模型传递过来的信息对student模型做了约束和纠正,指导student模型的优化方向,进而加强了student模型的学习能力。</strong></li></ul><p><strong>整个模型蒸馏的收益表现如下:</strong></p><p>引入<strong>soft labels</strong>的概念,不再是原本的非零即一状况,<strong>需要考虑正样本有多正和负样本有多负</strong>。这看起来<em>类似把分类问题转换成回归问题,但实质并不是。如果构建样本时,用回归的方式构建,通常会基于作品的完播率或规则组合等,人工敲定样本的回归值,这种方式过于主观,没有一个非常合理或可矫正的指标进行后续比对</em>;<strong>而模型蒸馏的soft labels是基于teacher 模型,即由teacher 模型对真实样本进行充分训练后给出,包含更多的隐含信息且不受人为主观因素影响。</strong></p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/795f0ad3a0eb44a2b570e9dfa4910fd0.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>具体的,来看看我们如何做粗排模块的蒸馏,主要是分为两个大的方向:</p><ul><li><strong>模型蒸馏</strong>,主要适用于模型不同但特征相同的情况,比如,包含多个场景的框架里,某些场景对性能有要求;由于有一些额外的外部限制,使某场景无法用很复杂参数量非常大的模型,可以用一个子模型使用全部特征。此时,模型蒸馏主要是弥补子模型缺少复杂结构或交互结构导致的部分收益损失,本质上是一种模型压缩方案。</li><li><strong>特征蒸馏</strong>,主要适用于模型相同但特征不同的情况,比如,在某些场景,无法使用全量特征 ( 如交叉特征 ) 或部分特征必须是剪裁过的,即特征没被完全利用,存在一部分损失。这时,通过一个更大的teacher模型学习全量特征,再把学到的知识迁移到子模型,即弥补了上述的部分特征损失。</li></ul><p>基于以上描述可知,粗排模块可以通过蒸馏的方式,补足双塔模型在结构和特征上的缺陷。接下来的问题就是如何找到一个合适的teacher模型?精排模型通常是一个被充分训练的、参数量很大、表达能力很强的模型,如果通过蒸馏精排模型获取粗排模型,那么目标的一致性和学习能力的上限都符合我们预期的。</p><ul><li>teacher模型是精排模型,该模型使用全量的特征,包括三大类,即user侧特征、item侧特征及它们的交叉特征;曲线框里是一些复杂的拓扑结构;最后的softmax with temperature就是整个精排模型的输出内容,后续会给到粗排模型进行蒸馏。</li><li>中间的粗排模型,user tower只用user features,item tower只用item features,即整体上看,模型未使用交叉特征。在user tower和item tower交互后,加上精排模型传递过来的logits信息,共同的构成了粗排模型的优化目标。整个粗排模型的优化目标,同时对真实样本和teacher信息进行了拟合。</li><li><p>右侧展示的是训练完粗排模型后,在线上产出user serving,通过user serving产出user embedding,再与item embedding做内积运算,完成整个排序的过程。上述流程即实现了粗排和精排的联动过程,并且训练完粗排模型就可以进行一个非常高效的serving,进行粗排排序。</p><h2>4.3. 线上的粗排双塔模型</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/650b567c1a6e4efc95b4a7179cc99d40.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>实践中,粗排模型训练时,依赖的精排输出结果来自上报精排日志。如果在离线重新对样本进行预估再输出,其实是对线下资源的浪费,所以通常在线上精排预估时,就把一些结果作为日志进行上报。粗排模型异步训练,产出模型提供给Serving。</p></li></ul><p>Serving环节主要包括异步Serving和User Serving两部分,具体功能如下:</p><ul><li><strong>异步Serving</strong>,主要通过刷库Item Serving捕获所有的item embedding,以异步的方式反复刷库。大家经常会问的一个问题:如果模型更新了,item embedding有的是新的,有的是旧的,版本不一致怎么办?如果更新周期比较短,item embedding的分布不会发生较明显的偏移,即相邻版本比较接近,这间接保障了一致性,不需要版本是强一致性的,只要更新周期比较短就可以。</li><li><strong>User Serving</strong>,当用户请求推荐引擎后,获取该用户的user features,然后请求User Serving产出user embedding;同时,会拿到该用户的所有召回item集合,基于刷库结果产出的索引服务,取到所有的item embedding。由此可见,User Serving的最大优势是可以做实时计算且只需计算一次,效率非常高。并且,双塔粗排Serving阶段是做内积运算,这种高效的计算方式也使它更适合大规模的预排序场景。</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/74ad5786e33b4e38986c4697b77a5503.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>整个粗排模块上线后,我们关注的两类指标:互动类指标和播放类指标,都有非常明显的正向提升,具体的指标提升幅度可以参考上图的在线实验结果。</p><p>一般,粗排模块的表现和实际场景有较大的相关性:在候选集非常大的推荐场景下,粗排到精排间的漏斗有好几个量级,这时粗排模块会带来非常显著的收益;在候选集比较小的推荐场景下,从召回到精排间的漏斗不是很大,这时粗排的收益可能就比较有限。</p><h2>4.4 进一步优化</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/757af659b60344ea83de0fce27ee6a9a.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><ol><li>首先,上述粗排蒸馏过程本质上是pointwise,但通过上报精排日志可以拿到精排模型给出的完整再推荐列表,用pairwise学习精排排出来的序,可以进一步逼近精排结果,能更多的提取精排传递出的信息。</li><li>其次,前面虽然不断地用teacher模型和student模型描述整个过程,但实际效果上student模型不一定低于teacher模型。换一个角度,student模型其实是基于teacher模型做进一步训练,所以student模型的表征能力有可能超过teacher模型。事实上,如何让student模型通过反复的蒸馏,效果超过teacher模型,在模型蒸馏领域也有许多相关方法。</li><li>最后,粗排到底是召回的延伸,还是精排的压缩跟前置?虽然召回和精排都是一个检索的过程,但二者实际侧重点还有一些不同,比如,召回在多样性上有更多的考量,精排更强调排序次序的精准性,而粗排处于这两个环节之间,如何利用粗排模块更好地平衡召回和精排?通常而言,会考虑设计多样性调节算法解决这一问题。</li></ol><h1>5.多样性调节算法设计</h1><h2>5.1 推荐多样性的意义</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/1aa9fd0dfc36482e80aae6c92ab2e5a8.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>样性的概念在推荐系统里常被提到,在不同视角下,推荐多样性对应着不同的问题。</p><ul><li>在系统角度下,<strong>多样性是一种popularity bias,即流行度的偏置</strong>。流量在UGC作品上的分布,体现了系统层面的多样性:一个多样性弱的系统,更像是中心化分发的,只分发非常头部、非常类似的一部分作品;而一个多样性强的系统,则是一个去中心化分发的,<strong>会更多地兼顾中长尾内容流量的供给</strong>。实际上,在推荐系统中普遍会遇到如下问题:如果没有对推荐系统做额外的干预和纠偏,不可避免地会使推荐系统往多样性弱的方向发展。从数据层面解释,有丰富数据的那部分内容会在推荐过程被反复加强,使整个推荐循环链路越缩越小,<strong>马太效应越来越严重</strong>。对于一个ugc平台,需要考量生产者或创作者的利益,而这种聚集在部分创作者身上的马太效应是我们不愿意看到的。</li><li>在用户角度下,<strong>多样性就是Explore&amp;Exploit问题</strong>,对用户做兴趣的探索与聚焦。如果多样性弱,推荐的item同质化严重,都很像,那么推荐系统可能没办法发现用户的真实兴趣,因为系统可能都没给用户推荐过这类item;如果多样性强,那么用户的推荐流里的内容会很不一样,坏处可能是用户在持续消费过程的兴趣聚焦程度不同,比如用户看了五个item,明明对其中某一两个item更感兴趣,但和这一两个item相似的item的后续推送密度却跟不上,这对用户体验是有损的。如果不做额外的优化,用户角度的多样性会越来越小,因为通常选用的pointwise模型会导致同质化的现象,比如说用户喜欢的item是乐器类的,则pointwise在每一个单点上的预估都觉得乐器是最好的,最后可能连续给用户推了5个乐器,在单点上收益最高不代表用户对整个推荐结果 ( 5~10个item ) 的满意度是最高的,所以这里也需要做多样性控制,提升用户的满意度。</li></ul><h2>5.2 多样性控制的方案路线</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/6dca1c96e53d4bc384d56d050af2681d.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在具体实现上,多样性有三个主流的技术方案:<strong>规则打散、embedding打散和DPP</strong>,下面会详细介绍:</p><ul><li>基于规则打散,比如从item里抽象出发布作者、标签、伴奏等特征,基于这些特征去做一个session内的频控。这种方法的好处是易实现,缺点也非常明显,该方案本质上是进行枚举加排列组合,扩展性非常差,永远没办法枚举所有可能的情况,枚举出来的情况不一定能真实表征两个item间的相似或差异程度有多大。</li><li>基于embedding打散,一个连续值的方案。好处是它可以基于embedding对候选集做离散性的评估,相当于此时可以用向量化的方式表达item。缺点在于它虽然可以衡量离散性或多样性,但难以衡量相关性,从而无法实现联合的收益评估。事实上,多样性只是我们的一个目标,相关性也很重要,如果推了很多不同的东西,但和用户不怎么相关,可能会适得其反。</li><li>DPP概率模型,本质上是一种集合选择技术,选择出一个子集使得多样性和相关性联合建模的收益最大。直观理解,先基于多样性和相关性构建一个矩阵,该矩阵行列式的物理含义是矩阵中各向量张成的平行多面体体积的平方,这样就把问题转换成了一种可度量的方式:要想同时最大化多样性和相关性,只需要最大化平行多面体的体积。</li></ul><h2>5.3 DPP 技术细节</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/ca152d8173ad469fb201400664ab3ab3.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>DPP算法的具体实现比较复杂,这里主要介绍两个关键点:</p><p>①基于多样性和相关性构建矩阵L,该矩阵的行列式等价于最终要度量的目标。如何去定义相关性和多样性?</p><ul><li>多样性(diversity)是指两个item相似不相似,如果很相似就不多样。利用两个item各自的item embedding计算内积,即表示两个item的相似度。</li><li>相关性(relativity)是一个候选item与当前用户的匹配程度。在不同环节的实现有差异:在粗排层的DPP,一般是基于user embedding和item embedding计算内积。在精排层的DPP,需要精排的CTR或CVR预估结果,因为这些预估结果反映了当前用户对候选item的喜爱程度。</li></ul><p>基于上述定义的相关性和多样性就可以构建矩阵L:用户与itemi的相关性 ( 偏好程度 )、用户与itemj的相关性 ( 偏好程度 )、itemi与itemj的多样性三者乘积。通过最大化矩阵L,就可以实现相关性和多样性的联合度量。</p><p>②如何优化求矩阵L行列式的复杂度,该行列式的原始计算复杂度是三阶,线上难以支撑这样的运算性能消耗,可以通过贪婪算法把计算复杂度进一步降低至一阶。</p><ul><li>先进行矩阵分解,基于分解的结果将计算复杂度降低到二阶。</li><li>用增量的方式更新参数,绕过求解线性方程组的部分,将复杂度进一步降低到一阶。</li></ul><p>由此,行列式的求解过程由三阶降低到一阶,满足了线上的性能,上图最下方给出的paper就是相关方向的论述。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/343326d38df34378ae0a9b33fd5f3034.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在线上做多样性的相关实验,我们较关注的系统和数据两部分,都有明显收益:</p><ul><li>系统收益,作为一个ugc平台,会考量推荐系统分发覆盖了多少创作者、覆盖了多少作品以及内容的时效性,从上图右侧三条曲线可见,在加入多样性的控制后,三个指标都有稳步的提升。</li><li>数据收益,有关播放时长、关注渗透、点赞渗透相关的指标都有1~2个点的提升,这也体现了多样性是有必要的,因为它相当于对pointwise进行了简单的listwise化,形象化阐述就是,用户浏览多个session时,多样性调节避免了同质化内容扎堆。</li></ul><h2>5.4  DPP优化</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/6fbb98a7f2a2477d84c1dade671e47f9.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>针对上述基于多样性和相关性构建矩阵L的过程,有两方面可以做进一步优化:</p><ul><li>多样性本质上是定义什么样的item是相似的,用相似矩阵刻画这种相似关系。在我们K歌平台,会做一些内容的混排,比如音频跟视频的混排,如果在原始的item embedding构建出来的item similarity matrix基础上,加入一些预设的先验信息,判断什么样的item是更相似的,比如音频跟音频间更相似,视频跟视频间更相似,那么它最后的度量目标就加入了对作品类型的考量,这就间接实现了内容的混排。</li><li>相关性本质上是定义什么样的item更匹配当前用户,之前都是从消费者的角度去考量用户更喜欢什么样的item,而我们作为一个ugc平台,很多时候也要考量什么样的item更适合被分发,比如某item是不是更有平台的画风,更符合我们对内容分发的理解,这时,就是从平台系统或者生产者的角度去理解什么样的item更应该被优先推荐。如果已知一部分item更需要被优先推荐,在构建用户跟item间的相关性分时,可以对relativity score加调节权重进行干预,实现流量分配。比如,如果要使乐器类item比其他item有更高的权重,这时,可以调高乐器类item和用户的匹配权重。</li></ul><p>综上可知,DPP不只是一个多样性或相关性的度量,它本身是一种调控方式,具体调控的量和业务场景相关,具有非常大的挖掘空间。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 02:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386964</guid>
            <link>https://aijishu.com/a/1060000000386964</link>
        </item>
        <item>
            <title><![CDATA[特斯拉重新捡回来的毫米波雷达,下一步脚落何处?-IOTE物联网展]]></title>
            <description><![CDATA[<p>一石激起千层浪。</p><p>最近,特斯拉又有大动作——搭载4D毫米波雷达的特斯拉要来了。</p><p>日前,Twitter博主Greetheonly曝光了特斯拉全新HW4.0硬件,指出该产品具备至少两个以太网接口。与此同时,近日特斯拉也向欧洲监管机构提交的车辆变更申请,证实最新自动驾驶硬件HW4.0即将量产上车。据悉,在即将到来的HW 4.0硬件系统中,特斯拉配置了一枚高精度4D毫米波雷达,且该车型可能率先在中国工厂生产。</p><p>曾经因“幽灵刹车”现象一直被人诟病,特斯拉一度抛弃了毫米波雷达,而且还提出“纯视觉方案”。如今,特斯拉又重新捡回毫米波雷达,引得“毫米波雷达”相关概念股在“狂飙”。</p><p>为何特斯拉重新拾回毫米波雷达?</p><p>毫米波雷达,是一种工作在毫米波频段(millimeter wave)的雷达传感器,可以精准探测目标的距离、速度、方位角和微动等信息。</p><p>毫米波雷达最早于1940年代开始研制,70年代中后期取得技术突破,90年代后期开始批量应用于车载领域,2000年后锗硅技术提高芯片集成度、降低成本,毫米波雷达迎来爆发式增长,2021年后技术较为成熟,成为主力传感器之一,未来将会向4D毫米波雷达路线发展。</p><p>4D毫米波雷达,又称4D成像毫米波雷达。所谓的4D,就是指在原有“距离、方位、速度”的基础上增加了对目标“高度”数据的解析,能够实现“3D+高度”四个维度的信息感知。</p><p>相比于普通毫米波雷达,4D毫米波雷达具有广视角、高精度、高分辨、能探测静物等优势;而且相较于激光雷达,它的成本也比较低。</p><p>了解特斯拉的都知道,特斯拉经常出现“幽灵刹车”等安全问题,而造成这种现象的重要原因是特斯拉曾配置的性能较差的ARS-4B毫米波雷达而促成的。对此,2021年特斯拉抛弃了毫米波雷达,并提出了“摄像头+算法”的纯视觉方案。</p><p>不过,现在的4D毫米波雷达比普通毫米波雷达的性能有了大大的提升,除了在原来距离、速度、方位等数据信息的基础上,4D毫米波雷达还增加了被测目标俯仰角的高度信息,并在速度分辨率等多方面均有提升,可通过高分辨率点云来感知汽车周围环境,增强了环境测绘和场景感知的能力,有效地弥补了传统毫米波雷达的性能短板。</p><p>德邦证券发布研究报告称,在L2+层级上,通过前置1颗4D毫米波雷达能够基本涵盖毫米波&amp;激光雷达的功能需求。因此,笔者认为,这极有可能也是特斯拉重新拾回毫米波雷达的重要原因。</p><p>“赛车手”过招</p><p>4D毫米波雷达或成主战场</p><p>得益于汽车产业的快速发展,尤其是汽车智能化、网联化的趋势越发显著,毫米波雷达市场需求十分旺盛。</p><p>作为ADAS的重要感知元器件,毫米波雷达并不仅仅只是一个硬件设备,它需要与车辆适配,才能较好地实现相应的功能。</p><p>在智能汽车L0~L2阶段,毫米波雷达主要应用于自动紧急制动、自适应巡航、前向碰撞预警、盲区监测、后向碰撞预警、倒车车侧预警、开门预警、自动泊车、变道辅助、乘客成员监测、驾驶员生命体征监测、手势识别等等。</p><p>根据GGAI、AIOT星图研究院整理统计,2022年1-6月中国市场(不含进出口)乘用车新车前装标配搭载前向毫米波雷达361.12万颗,同比增长12.55%;标配搭载角雷达(含后向)384.15万颗,同比增长37.89%。按照目前的新车搭载增速,预计2022年中国市场乘用车毫米波雷达搭载量将升至1800万颗左右。</p><p>现阶段,ADAS的市场渗透率还在不断攀升,尤其是伴随着自动驾驶等级的提升以及市场对自动驾驶能力需求的不断升级,市场对毫米波雷达的性能提出了更高的要求,而有着比普通毫米波雷达更高性能的4D毫米波雷达,成为了各车企的“眼中钉”,且4D毫米波雷达的渗透率也在逐渐增加。根据市场调研机构Yelo预测,2027年全球4D毫米波雷达市场将达到35亿美元。</p><p>当前,4D毫米波雷达这个赛道已经涌入诸多玩家,包括国外的Arbe、Waymo、大陆集团、采埃孚、安波福、博世、RADSee、Smart Radar等,以及国内的华为、华域汽车、森思泰克、安智杰、木牛科技、承泰科技、纳瓦电子、复睿智行、苏州毫米波、华域、楚航科技、威孚科技、几何伙伴等等。</p><p>此次特斯拉采用4D毫米波雷达的消息曝光后,更是带动了“4D毫米波雷达”概念股的涨停,预计将利好射频前端、信息处理系统以及后端算法。据盖世汽车研究院,射频部分占比约40%,其中MMIC(25%)、PCB(10%)、其他(5%),信息处理系统DSP占比10%,后端算法占比最高达50%。</p><p>综上所述,不难得出,在汽车智能化、网联化的催生下,毫米波雷达的成长速度会越来越快,其市场也会得到快速增长。</p><p>活力无限</p><p>毫米波雷达市场广阔</p><p>当然,不止于车端应用市场,毫米波雷达也常常被应用于交通、安防、工业、家居、康养等领域上。</p><p>在全球智能化变革浪潮之下,汽车、交通、安防、工业、家居、健康监护等诸多产业的蓬勃发展,创造了巨大的感知产品增量需求。</p><p>在交通领域,交通堵塞是许多城市发展都需要面临的难题,将毫米波雷达应用在车路协同系统,可以同时监控多个车道的平均速度、车流量、车道占有率等交通流基本信息,并根据交通流信息有效地调整交通信号灯,提高道路通行效率(可提高 10%),促进节能减排(可降低 10%-15% 的油耗),有效减轻交通堵塞等问题。当下,随着中国车路协同市场的发展,毫米波雷达的需求量也将随之上涨。</p><p>在智能家居、健康监护领域,毫米波雷达的应用案例也在不断增加。由于毫米波雷达可以监测到人体呼吸、心跳等健康信息,在全屋智能中也可实现精准的人体存在感知,从而与室内照明、窗帘、空调等产生联动;同时,随着老龄化进程的加速,毫米波雷达与智慧养老相结合已演化出跌倒报警、睡眠监控等很多新用例。</p><p>当然,还有安防、工业、民航、船舶等其他领域也应用了毫米波雷达,更多详细内容可见《中国毫米波雷达市场调研报告(2022年)》。</p><p>可以预见的是,智慧交通、智能家居、健康监护、安防、工业等领域,均是毫米波雷达的重要潜在市场。</p><p>未来,随着我国汽车、交通、安防、工业、家居、康养等产业的智能化升级不断推进,毫米波雷达的应用将进一步扩大。预计到2026年中国毫米波雷达市场规模将达到197亿元,年复合增长率为23.3%。</p><p>写在最后</p><p>不论是特斯拉采用4D毫米波雷达,还是眼下“毫米波雷达”相关概念股的涨停,可以肯定的是,随着中国各产业领域智能化、数字化的转型升级,必将给毫米波雷达创造更多的应用市场。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 01:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386952</guid>
            <link>https://aijishu.com/a/1060000000386952</link>
        </item>
        <item>
            <title><![CDATA[推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结]]></title>
            <description><![CDATA[<h1>0.前言:召回排序流程策略算法简介</h1><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/44083e4c130841f894e36366a71f8d96.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>推荐可分为以下四个流程,分别是召回、粗排、精排以及重排:</p><ol><li>召回是源头,在某种意义上决定着整个推荐的天花板;</li><li>粗排是初筛,一般不会上复杂模型;</li><li>精排是整个推荐环节的重中之重,在特征和模型上都会做的比较复杂;</li><li>重排,一般是做打散或满足业务运营的特定强插需求,同样不会使用复杂模型;</li></ol><ul><li><p><strong>召回层</strong>:召回解决的是从海量候选item中召回千级别的item问题</p><ul><li>统计类,热度,LBS;</li><li>协同过滤类,UserCF、ItemCF;</li><li>U2T2I,如基于user tag召回;</li><li>I2I类,如Embedding(Word2Vec、FastText),GraphEmbedding(Node2Vec、DeepWalk、EGES);</li><li>U2I类,如DSSM、YouTube DNN、Sentence Bert;</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/b935ff75e3e84d7f88de39613bb02bad.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p></li><li><strong>模型类</strong>:模型类的模式是将用户和item分别映射到一个向量空间,然后用向量召回,这类有itemcf,usercf,embedding(word2vec),Graph embedding(node2vec等),DNN(如DSSM双塔召回,YouTubeDNN等),RNN(预测下一个点击的item得到用户emb和item emb);向量检索可以用Annoy(基于LSH),Faiss(基于矢量量化)。此外还见过用逻辑回归搞个预估模型,把权重大的交叉特征拿出来构建索引做召回</li><li><p><strong>排序策略</strong>,learning to rank 流程三大模式(pointwise、pairwise、listwise),主要是特征工程和CTR模型预估;</p><ul><li><p><strong>粗排层</strong>:本质上跟精排类似,只是特征和模型复杂度上会精简,此外也有将精排模型通过蒸馏得到简化版模型来做粗排</p><ul><li>常见的特征挖掘(user、item、context,以及相互交叉);</li></ul></li><li><p><strong>精排层</strong>:精排解决的是从千级别item到几十这个级别的问题</p><ul><li><strong>CTR预估</strong>:lr,gbdt,fm及其变种(fm是一个工程团队不太强又对算法精度有一定要求时比较好的选择),widedeep,deepfm,NCF各种交叉,DIN,BERT,RNN</li><li><strong>多目标</strong>:MOE,MMOE,MTL(多任务学习)</li><li><strong>打分公式融合</strong>: 随机搜索,CEM(性价比比较高的方法),在线贝叶斯优化(高斯过程),带模型CEM,强化学习等</li></ul></li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c764dfd7b65048f3a2ab2b97214135a3.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p></li><li><strong>重排层</strong>:重排层解决的是展示列表总体最优,模型有 MMR,DPP,RNN系列(参考阿里的globalrerank系列)</li><li><p><strong>展示层</strong>:</p><ul><li><strong>推荐理由</strong>:统计规则、行为规则、抽取式(一般从评论和内容中抽取)、生成式;排序可以用汤普森采样(简单有效),融合到精排模型排等等</li><li><strong>首图优选</strong>:CNN抽特征,汤普森采样</li></ul></li><li><strong>探索与利用</strong>:随机策略(简单有效),汤普森采样,bandit,强化学习(Q-Learning、DQN)等</li><li><strong>产品层</strong>:交互式推荐、分tab、多种类型物料融合</li></ul><h1>1.淘宝逛逛召回算法实践总结</h1><p>内容化这几年越来越成为电商的重点,用户来到网购的时候越来越不局限在只有明确需求的时候,而更多的是没有明确需求的时候,就像是逛街一样。逛逛就是在这样的背景下诞生的内容化产品,打造出有用、有趣、潮流、奇妙、新鲜的内容,为消费者提供全新的内容消费体验。在这个场景下的内容召回有很多问题需要探索,其中主要的特点和挑战有:</p><ol><li><strong>强时效性</strong>:内容推荐场景下的内容新旧汰换非常快,新内容的用户行为少,很难用用户历史行为去描述新内容,而用户行为正是老内容投放主要的依赖。所以当不能依靠用户行为数据来建模内容之间关系的时候,我们必须要找到其他可以表征内容的方法。</li><li><strong>多兴趣表征</strong>:多兴趣表征,特别是多峰召回是这几年比较主流的一个趋势。但是目前多峰模型中峰的数量是固定的,当用户行为高度集中的时候,强制的将用户行为拆分成多向量,又会影响单个向量的表达能力。如何去平衡不同用户行为特点,特别是收敛和发散的兴趣分布,就成了此类任务的挑战。</li></ol><p>在设计优化方向的时候,我们重点考虑上面描述问题的解法(召回本身也需要兼顾精准性和多样性,所以单一召回模型显然无法满足这些要求,我们的思路是开发多个互补的召回模型)。详细的介绍在后面的章节以及对应的后续文章中展开:</p><ol><li><strong>跨域联合召回</strong>:除了单纯把多域的信息平等输入到模型中,如何更好利用跨域之间的信息交互就变的尤为重要。目前有很多优秀的工作在讨论这样的问题,比如通过用户语义,通过差异学习和辅助loss等。我们提出了<strong>基于异构序列融合的多兴趣深度召回模型CMDM</strong>(a cross-domain multi-interest deep matching network),以及<strong>双序列融合网络Contextual Gate DAN</strong> 2种模型结构来解决这个问题。</li><li><strong>语义&amp;图谱&amp;多模态</strong>:解决时效性,最主要的问题就是怎么去建模新内容,最自然的就是content-based的思想。content-based的关键是真正理解内容本身,而content-based里主要的输入信息就是语义,图像,视频等多模态信息。目前有许多工作在讨论这样的问题,比如通过认知的方式来解决,多模态表征学习,结合bert和高阶张量等方式等等。在语义召回上,我们不仅仅满足于语义信息的融入,还通过<strong>Auxiliary Sequence Mask Learning</strong>去对行为序列进行高阶语义层面的提纯。更进一步,我们利用内容图谱信息来推荐,并且引入了个性化动态图谱的概念。对于新老内容上表达能力的差异问题,我们通过<strong>multi-view learning</strong>的思想去将id特征和多模态特征做融合。</li><li><strong>泛多峰</strong>:为了解决多峰强制将兴趣拆分的问题,我们考虑到单峰和多峰的各自特点,特别是在泛化和多样性上各自有不同的建模能力。基于此,我们提出了泛多峰的概念。</li></ol><h2>1.1 跨域联合召回</h2><h3>1.1.1 基于异构序列融合的多兴趣深度召回</h3><p>在单一推荐场景下,深度召回模型只需要考虑用户在当前场景下的消费行为,通过序列建模技术提取用户兴趣进而与目标商品或内容进行匹配建模。而在本推荐场景下,深度召回模型需要同时考虑用户内容消费行为和商品消费行为,进行跨场景建模。为此,我们提出了CMDM多兴趣召回模型架构,能够对用户的跨场景异构行为序列进行融合建模。在CMDM中,我们设计了用于异构序列建模的层级注意力模块,通过层级注意力模块提取的多个用户兴趣向量与目标内容向量进行匹配建模。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/5ec96266756549119c23db2c1be555e4.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h3>1.1.2 双序列融合网络Contextual Gate DAN</h3><p>除了通过层次注意力的方式,异构序列中还有个特点就是在时间上更接近交叉并存的状态。为了学习到两个序列之间的信息交叉,充分融合商品点击序列和内容点击序列,我们从自然语言处理的VQA任务中得到启发。VQA是用自然语言回答给定图像的问题的任务,常用做法是在图片上应用视觉注意力,在文本上应用文本注意力,再分别将图片、文字多模态向量输入到一个联合的学习空间,通过融合映射到共享语义空间。而DAN结构是VQA任务中一个十分有效的模型结构,DAN通过设计模块化网络,允许视觉和文本注意力在协作期间相互引导并共享语义信息。我们对DAN结构进行了改进,设计了Contextual Gate DAN 双序列融合网络:</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/667c7ec2baa446828f102eeecca1430e.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h2>1.2 语义&amp;图谱&amp;多模态</h2><h3>1.2.1 多模态语义召回</h3><p>在内容推荐场景内,存在大量新内容需要冷启动,我们主要通过语义和多模态2种方式。相对于搜索任务,语义匹配是一个从单点到多点,解空间更大更广的问题。首先是用户行为的不确定性,内容推荐场景下用户决策空间更大更广,从而导致用户对推荐系统的反馈信号本身就存在较大的不确定性;再就是语义空间表达的对齐问题,这里的对齐包含两个方面,第一个方面是单个序列里的内容表达的语义标签提取方式差别大(比如cpv、分词、语义标签、多模态表征等等),另外一个方面是多序列(内容和商品等)之间的语义空间对齐问题。多模态的召回方式融合了文本,图像,音频等大量模式跨域信息,由于与内容互动解耦,在缓解内容冷启动上具有一定的优势。多模态召回主要是通过理解内容多模态表征,先后进行了collaborative filtering、聚类中心召回、个性化多模态表征相关的探索工作,在多样性方面取得了一定的效果,深度语义召回方面针对用户行为去噪和更好的表达语义信息角度出发,迭代了cate-aware和query-aware和序列mask 自监督任务的模型。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/b02b18f872a848f1836a56964dc7665b.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h3>1.2.2 行为稀疏场景下的图模型实践</h3><p>更进一步,我们利用内容图谱信息来推荐。知识图谱构建的出发点就是对用户的深度认知,能够帮助系统以用户需求出发构建概念,从而可以帮助理解用户行为背后的语义和逻辑。这样可以将用户的每次点击行为,都用图谱的形式极大的丰富,图谱带来的可解释的能力还可以大大加快模型的收敛速度。知识图谱有个特点,就是其中的信息是相对固定的,或者说是静态的,因为知识图谱基本是由先验信息构成的。但是从各个用户的角度,知识图谱的数据中的链接重要度并不相同。比如一个电影,有的用户是因为主演看的,有的用户是因为导演看的,那么这个电影连接的主演边和导演边的权重就因人而异了。我们提出了一种新的方法来融合用户动态信息和静态图谱数据。每个行为都用图谱扩展,这样行为序列变成行为图谱序列, 并且加入KnowledgeGraph-guided gating的自适应的生成式门控图注意力,去影响知识图谱融入到模型中的点边的权重。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/1574f85900324ef58bf47f0ee8f25524.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h3>1.2.3 融合多模态信息的跨模态召回</h3><p>针对新内容冷启动的问题,我们提出了跨模态召回模型来兼顾content-based和behaviour-based的召回各自的优点。在跨模态召回模型构建前,我们首先引入了多模态meta信息为主的“语义” deep collaborative filtering召回,两者的显著差别主要在target side的特征组成中相较与behaviour-based的特征,多模态特征构建的模型去除了影响较大的内容id类的特征,将这些特征更换为了来自多模态预训练技术得到的多模态表征输入。除了上面的变化,我们还加入了triplet loss的部分使得embedding空间更具有区分度,效率指标也有了较大幅度的提升。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f0608e9fe8244ac7acf46b3c22ced524.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h2>1.3 用户多兴趣表征(多模型簇联合学习):泛多峰</h2><p>多峰召回模型通过对用户侧产生多个表征不同“兴趣”的向量进行多个向量的召回,是对于单峰的一个拓展,将单个用户的表达扩展成了多个兴趣表达, 更精确地刻画了用户, 从而取得更好的效果。我们通过对于单峰模型及多峰模型的观察发现,用户行为高度集中的序列单峰模型的线上效率相对于多峰模型会更有优势,而那些用户序列类目丰富度较高的则多峰模型的效率明显占优。所以这里提出了泛多峰u2i模型的概念,尝试将多峰模型容易拟合行为序列类目丰富度较高的用户,而单峰模型则更容易拟合行为序列类目丰富度较为集中的用户的优势进行结合。使得单一模型能够通过产生不同算法簇的多个不同表征的向量在不同簇的内容向量中进行召回,从而具备这两种召回范式的优点。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f9b12f3921e944289369a5f57d5e2301.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h2>1.4 提升优化:</h2><p>▐  认知推荐</p><p>我们正在尝试,将图谱用于user embedding投影,投影的平面空间就是语义空间,这样做到可控多维度语义可解释embedding。另外,对于召回,采样方式对模型效果影响非常大,结合知识图谱来进行graph-based Learning to sample的优化,对于正负样本的选取更加做到关联可控,加快迭代速度,提升效果。</p><p>▐  兴趣破圈</p><p>在内容化推荐领域,仅仅相似度提高的优化,会导致用户没有新鲜感,对平台粘性变低。如何帮助用户探索他更多的兴趣,是现在内容化推荐亟待解决的另一个问题。一种做法是兴趣近邻,从已有兴趣出发,慢慢通过兴趣之间的相似,扩展用户未知的领域,可以参考MIND,CLR一些思路。另一种做法是对兴趣构建推理引擎,在对已有兴趣推理过程建模之后,加入扰动来探索用户可能新的兴趣。</p><h1>2.阿里飞猪个性化推荐:召回篇</h1><blockquote>常见的有基于user profile的召回,基于协同过滤的召回,还有最近比较流程的基于embedding向量相似度的topN召回等等。方法大家都知道,但具体问题具体分析,对应到旅行场景中这些方法都面临着种种挑战。例如:旅行用户需求周期长,行为稀疏导致训练不足;行为兴趣点发散导致效果相关性较差;冷启动用户多导致整体召回不足,并且热门现象严重;同时,具备旅行特色的召回如何满足,例如:针对有明确行程的用户如何精准召回,差旅用户的周期性复购需求如何识别并召回等。</blockquote><p>本次分享将介绍在飞猪旅行场景下,是如何针对这些问题进行优化并提升效果的。主要内容包括:⻜猪旅行场景召回问题、冷启动用户的召回、行程的表达与召回、基于用户行为的召回、周期性复购的召回。</p><h2>2.1 飞猪旅行场景召回问题</h2><p>推荐系统流程</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/a1144942282b46bfb5b6be5179c2a300.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>首先介绍推荐的整体流程。整体上分为5个阶段。从全量的商品池开始,之后依此是召回阶段,粗排/精排阶段,最后的混排模块根据业务实际情况而定,并不是大多数推荐系统必须的。粗排和精排在另外一次分享中已经介绍过了,本次分享主要介绍一下飞猪推荐系统的召回问题,召回可以说决定了推荐系统效果的上限。</p><p>下面说一下召回和粗排/精排的区别。从召回到粗排再到精排模块,商品的数据量是递减的,模型的复杂度会增高。具体会体现在输入特征数量和模型复杂度的增加,更新往往也会更频繁。对应的训练和上线的方式也会不同,拿召回来讲,出于性能的考虑,往往采用离线训练+打分或者离线训练得到向量表达+向量检索的方式,而排序阶段为了更好的准确率和线上指标,更多的是离线训练+实时打分,甚至在线学习的方式。</p><p>召回的本质其实就是将用户和商品从不同维度关联起来。常见的方法比如content-base匹配,或者item/user based的协同过滤,还有最近比较流行的向量化召回。向量化召回常用做法是用深度学习将用户和商品都表达成向量,然后基于内积或欧式距离通过向量检索的方式找到和用户最匹配的商品。</p><h3>2.1.1 飞猪推荐场景</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c8a47ed183f14473b1b8b35f371f8784.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>飞猪的推荐页面有很多,比如首页,支付成功页,订单列表页,订单详情页都有猜你喜欢。不同页面对应了不同的场景,用户在不同场景下需求不同,也有一定的交叉。比如首页偏重逛/种草,但支付完成后推荐一些与订单相关的商品会更好。</p><p><strong>我们大致可以把用户分为三类:无行为、有行为,还有一种是飞猪场景下特殊的一类"有行程"。</strong></p><h3>2.1.2 主要问题</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/46d789608a884377baa09b9b5f9b59fe.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>本次分享的主要内容就是针对这三类用户在推荐过程中存在的问题+周期性复购场景 ( 出差/回家 ) 的解决。<br>航旅场景下的召回存在以下问题:</p><ul><li>冷启动:航旅商品的热门现象严重,user profile缺乏。</li><li>相关性vs搭配性:航旅场景下要求搭配性比较高,传统的I2I只偏重相关性。但用户的行程需求不是单点的,比如买了飞机票还要看住宿。行程受上下文影响比较多,比如季节、用户近期行为等。</li><li>相关性不足:航旅用户的行为稀疏又发散,目前的召回结果噪音较多。</li></ul><p>下面会对我们在优化过程中碰到的相关问题一一介绍。我们知道,召回处于推荐链路的底端,对召回常规的离线评估方式有预测用户未来点击的TopN准确率或者用户未来点击的商品在召回队列中平均位置等等。但是在工业系统中,为了召回的多样性和准确率,都是存在多路召回的,离线指标的提高并不代表线上效果的提升,一种常见的评估某路召回效果的方式就是对比同类召回通道的线上点击率,这种评估更能真实反映线上的召回效果,基于篇幅的考虑,后面的介绍主要展示了线上召回通道点击率的提升效果。</p><h2>2.2 冷启动用户召回</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/fd4c807bdd794d1091442f3d2a8dbd44.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h3>2.2.1 User冷启动召回</h3><p>用户冷启动召回主要有以下几种方案:Global Hot、Cross Domain、基于用户属性的召回。</p><ul><li>全局热门:缺点是和user无关,相关性差。</li><li>Cross domain:一种做法是基于不同域 ( 例如飞猪和淘宝 ) 共同用户的行为将不同域的用户映射到同一个向量空间,然后借助其他域的丰富行为提升本域冷启动用户的召回效果。</li><li><p>基于用户属性:单一属性的缺点是热门现象严重,个性化不足。我们采用了基于多属性组合的方法。</p><h3>2.2.2 UserAttr2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/ba11bfc0cdf24de6aa4fff068a31e847.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在这里介绍我们的方案UserAttr2I,使用类似排序模型的方法,输入用户+商品的属性,预测用户是否会点击一个商品。</p></li></ul><p>开始用线性FTRL模型,效果不是很好。原因是线性模型无法学习高阶特征,并且解释性比较差。针对这两个问题,通过DeepNet提高泛化性,同时用GBDT来做特征筛选。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/6724c7ef758a44c285efebb7ad1e642e.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>下面对比双塔结构和深度特征交叉两种方案,优缺点如图所示。最终选择了第二种,原因是目标用户是冷启动,能用到的特征比较少。如果放弃挖掘用户和宝贝之间的关系会导致相关性比较差。模型结构如下:<br><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/1c8b8e0fc2d54d3b9059cb59a0018e36.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>通过attention操作以及GBDT的叶子节点即可满足冷启动的可解释性。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/95ce5cec11004ae2b66176a7ca5d6f0b.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>对比其他冷启动的召回方式,Attribute2I的点击率最高。</p><h2>2.3 行程的表达与召回</h2><h3>2.3.1 Order2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c141e0757d8645c4b2c6a47ada2cea16.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在飞猪场景下用户有类似如下的需求:买了去某地的机票,用户很可能需要与之搭配的签证/wifi/酒店等等,而协同过滤通常只能推出同类型商品,比如门票推门票,酒店推酒店。另外飞猪不像淘宝用户可能会经常逛,有比较丰富的历史行为信息可以供我们去分析和计算,飞猪用户通常是"买完即走"。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/aba52ce8bb7549bd8232b975f2d2b670.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>通过数据分析我们发现订单附近的行为数据和订单有较高搭配关系,我们通过Graph Embedding的方式学习订单和宝贝的Embed,以此来学习搭配关系。</p><p>难点有以下几个:</p><ul><li>如何挖掘反映搭配关系的数据集合</li><li>搭配的限制性比较强,如果仅仅基于用户行为构建图,由于用户行为噪音多,会造成较多badcase</li><li>如果完全基于随机游走学习Embed,最后的召回结果相关性差,因此需要行业知识的约束</li><li>数据稀疏,覆盖商品少,冷启动效果差</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/d4e84017696741ab9c8ec83b375a1eee.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>**解决方案:<br>利用航旅知识图谱以及用户的行为序列进行加权异构图的构建 ( 机票/火车票节点利用业务线+出发地+目的地唯一标示、宝贝&amp;酒店利用其id唯一标示 )。之后的流程和传统的Graph Embedding类似。**</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/d3a417bea35b4f6192a0cea4f29c7d77.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br><strong>具体过程:</strong><br>① 以订单粒度对用户的行为做拆分和聚合,同时加入点击行为缓解稀疏问题。</p><p>② 边的权重的计算同时考虑知识图谱和用户行为,这种做法一方面可以增加约束控制效果,另一方面也可以抑制稀疏,解决冷启动的问题。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/eb64259ef2544b3296c7e5b512175907.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>③ 序列采样过程中会基于转移概率进行剪枝操作,用来抑制噪声和缓解热门问题。</p><p>④ skip-gram+负采样训练。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/560c1e09762c4309afa62ec8e33b345c.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>这里有一个具体的case,用户订了一张去曼谷的机票,order2I召回了曼谷的一些自助餐,落地签,热门景点等,体现了较好的搭配性。整体的指标上order2I的点击率也明显高于其他方式。</p><h3>2.3.2 journey2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/0f24570ee2ff49a88f5b750f31b3640f.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>Order2I将订单进行向量化表达,从而进行召回。<strong>但是它还有一些问题:用户的某次行程可能由多个订单组成,甚至有的订单只是中转的作用</strong>,Graph Embedding还是基于单个订单进行搭配的推荐;用户的某次行程不是一个出发地+目的地就能描述的,它不仅与行程本身属性 ( 例如出发/到达时间,目的地,行程意图等 ) 相关,还与用户的属性和偏好 ( 例如年龄,是否是亲子用户 ) 相关。因此行程既是User-Aware又是Context-Aware的。而Order2I学习的还是一种全局的整体偏好,与用户无关,不够个性化。因此我们尝试在行程的粒度做召回,综合考虑用户属性、行程意图、上下文等因素,更个性化的召回与用户这次行程以及用户自身强相关的的宝贝。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c34c3c6d8b9349a99873023b5ad597d4.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>以行程为粒度,对多个订单做聚合,并且增加行程相关的特征。融入用户的基础属性特征和历史行为序列。丰富行程特征并引入attention机制。采用双塔模型离线存储商品向量,在线做向量化召回。模型结构如下:<br><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/97ca47e2d5e44b52bfbdba9b76f29fed.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>模型左边主要是利用行程特征对订单序列以及用户的历史行为序列进行attention操作,用于识别关键订单以及用户关键行为。在此基础上融合行程特征和用户属性特征学习用户该段行程的Embed。模型右边是商品特征,经过多层MLP之后学习到的宝贝Embed。两边做内积运算,利用交叉熵损失进行优化,这样保证召回的结果不仅与行程相关还与用户行为相关。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/551cbcc2062d431f9a0b2ffb4eabbf97.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>两个同样是上海到西安的用户。用户1点击了历史博物馆和小吃,不仅召回了与机票搭配的接送机,还召回了与行为行为相关的小吃街附近的酒店以及历史博物馆相关的宝贝。</p><p>用户2点击了一个接送机,除了召回接送机还召回了机场附近的酒店和热门的POI景点门票。可以看出基于用户的不同行为,召回结果不仅满足搭配关系还与用户行为强相关。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/fdaf52164b224e699f4aee7595234630.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>从指标来看Journey2I相对Order2I有进一步明显的提升。</p><h2>2.4 基于用户行为的召回</h2><h3>2.4.1 Session-Based I2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/0bdcfe9e5d784df2a8172e5dd01cba16.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>航旅用户的行为有稀疏和发散的特点。利用右图一个具体的用户实例来说明这两个特点:用户在第一天点击了两个大理一日游,第20天点击了一些马尔代夫蜜月相关的商品,第21天又点击了大理的一日游。稀疏性体现在一个月只来了3次,点击了8个宝贝。发散性体现在用户大理一日游和出国蜜月游两个topic感兴趣。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/6392441264c04e219d9375727c0d1ae1.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在用户有行为的情况下进行召回,我们常采用的方法是基于User-Rate矩阵的协同过滤方法 ( 如ItemCF,Swing。ItemCF认为同时点击两个商品的用户越多则这两个商品越相似。Swing是在阿里多个业务被验证过非常有效的一种召回方式,它认为user-item-user的结构比itemCF的单边结构更稳定 ),但是由于航旅用户行为稀疏,基于User-Rate矩阵召回结果的准确率比较低,泛化性差。针对这两个问题我们可以通过扩充历史数据来增加样本覆盖。航旅场景因为用户点击数据比较稀疏,需要比电商 ( 淘宝 ) 扩充更多 ( 时间更长 ) 的数据才够。这又带来了兴趣点转移多的问题。在这里我们采用对行为序列进行session划分,保证相关性。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f39142d4548243afbf30e44fdc9f415c.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>这里以swing为例讲解一下构造约束的方式。我们以用户的行为意图为中心,将表示共同意图的商品聚合在一个序列中,如上图对用户行为序列的切分。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/203dd021745b41bd9774c33dff30a88d.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在这个case中,上面是传统swing的召回结果,下面是基于session的召回结果。当trigger是沙溪古镇一日游的时候,上面有一个杭州莫干山和玉龙雪山一日游,这两个不相关结果的出现是因为它们是热门商品,也称哈利波特效应。下面的召回结果就都是和沙溪古镇相关的了。从指标来看,session-based召回比swing和itemCF都高。</p><h3>2.4.2 Meta-Path Graph Embedding</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/1122cce89a984bd7b8399c209c9baaf3.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>基于I2I相关矩阵的优点是相关性好,缺点是覆盖率比较低。而Embed的方式虽然新颖性好但是相关性差。右边的case是Embed的召回结果,上海迪士尼乐园召回了一个珠海长隆的企鹅酒店和香港迪士尼。我们期望的应该是在上海具有亲子属性,或者在上海迪士尼附近的景点。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/eddd33153f5946a9bbfedabde0603dde.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>解决Embed相关性低的方式借鉴了session-based召回的经验,将航旅知识图谱融合,构建航旅特定的Meta-Path。效果上看meta-path的效果是比deepwalk更好。</p><h2>2.5周期性复购的召回</h2><p>复购场景的需求来自于:飞猪有大量的差旅和回家用户,该部分用户的行为有固定模式,会在特定的时间进行酒店和交通的购买,那么该如何满足这部分用户的需求?</p><h3>2.5.1 Rebuy2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c1a8b317a655413dbb858a651d2d8c58.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>我们的目标是在正确的时间点来给用户推出合适的复购商品,下面以酒店为例具体讲解 ( 其他的品类原理类似 )。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/11e827c034274aa6bb2fa0791e768f6d.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>输入用户在飞猪的酒店历史购买数据,输出是用户在某个时间点对某个酒店的复购概率。当有多个可复购酒店时,按照概率降序排序。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/463fa849ed85441cad16f4175bd3a9fc.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>常见做法有以下几种:</p><ul><li>利用酒店本身的复购概率</li><li>基于用户购买历史的Retarget</li><li>利用Poission-Gamma分布的统计建模</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/abefcb8bf5c24efeb356c45150cf391e.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>首先取用户对酒店的购买历史,利用矩估计/参数估计计算酒店的购买频次 ( 参数α和β )。接下来就可以调整每个用户的购买概率,k是购买次数,t是第一次购买距离最近一次购买的时间间隔。最后代入Possion分布计算复购概率,加入用户的平均购买周期来缓解刚刚完成购买的酒店复购概率最大的问题。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/46d024871f87424eae851ea5244b4f6f.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>从左图可以看出在购买一段时间以后,复购概率达到最大值,之后递减。实际使用中复购单独作为一路召回,效果比前面提到的retarget和热门召回更好。</p><h2>2.6 总结</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/5c2be163d48549799d0e0d665c46ea94.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>最后总结一下做好召回的几个思路:</p><p>首先要基于业务场景,来发掘用户需求,发现自有场景的特点。接下来通过ca

...

@github-actions
Copy link
Contributor

http://localhost:1200/aijishu/u/bandaotitouzilia - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[集微网 - 极术社区]]></title>
        <link>https://aijishu.com/u/bandaotitouzilia</link>
        <atom:link href="http://localhost:1200/aijishu/u/bandaotitouzilia" rel="self" type="application/rss+xml" />
        <description><![CDATA[集微网 - 极术社区 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 16:48:59 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[引领仪器设备产业“突围”,国产半导体责无旁贷]]></title>
            <description><![CDATA[引领仪器设备产业“突围”,国产半导体责无旁贷]]></description>
            <pubDate>Mon, 27 Feb 2023 07:48:57 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387113</guid>
            <link>https://aijishu.com/a/1060000000387113</link>
        </item>
        <item>
            <title><![CDATA[南芯科技公开带预唤醒功能的Type-C接口插入检测电路方案]]></title>
            <description><![CDATA[<p>【爱集微点评】南芯科技公开的带预唤醒功能的Type-C接口插入检测电路方案,该方案通过增加Type‑C接口预唤醒电路,在接口电路休眠时,可以将Type‑C接口检测电路关闭。从而实现减低系统待机功耗的同时实现接口插入检测功能,通过简单的电路结构解决了Type‑C接口插入检测和低功耗之间的矛盾。</p><p>集微网消息,在集成电路应用当中,特别是手机或者充电设备的Type‑C接口电路应用中,通常为了降低系统待机功耗,在未检测到手机或者充电设备插入时,整个系统会进入休眠模式。</p><p>但是为了快速响应手机或者充电设备的插入,在休眠时Type‑C接口检测电路需要一直工作,这就大大增加了系统休眠时的待机电流,从而大大缩短电池的续航时间。</p><p>为此,南芯科技在2022年3月11日申请了一项名为“一种带预唤醒功能的Type-C接口插入检测电路”的发明专利(申请号:202210236444.X),申请人为上海南芯半导体科技股份有限公司。</p><p>根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/522483438041.0886.png" alt="image" title="image"></p><p>如上图,为该专利中公开的充电设备端和手机端上设置的Type‑C接口检测电路通过Type‑C数据线连接的结构示意图。可以看到,在手机或者充电设备(如适配器、充电宝等)的Type‑C接口电路应用中,为了快速响应手机或者充电设备的插入,在休眠时Type‑C接口检测电路需要一直工作。这就大大增加了系统休眠时的待机电流,从而大大缩短了手机或者充电设备的电池的续航时间。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1435664442736.5054.png" alt="image" title="image"></p><p>如上图,为现有方案中Type‑C接口检测电路的电路连接示意图。在充电设备端,P型开关管M2的源端连接电源VDD,栅端连接控制信号EN_Rp,漏端连接上拉电流源Irp的源端。Irp的输出端连接到引脚CC,引脚CC同时连接到检测比较器P的反向端,比较器P的正向端连接参考电压VREF,比较器P输出信号为CC_DET_P。</p><p>在手机端,N型开关管M1的源端连接GND(即接地),栅端连接控制信号EN_Rd,漏端连接下拉电阻Rd的一端,下拉电阻Rd另一端连接到引脚CC。引脚CC同时连接到检测比较器D的同向端,比较器D的反向端连接参考电压VREF,比较器D的输出电压为CC_DET_D。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/168830725881.94025.png" alt="image" title="image"><br>在该专利中,主要通过在Type‑C接口检测电路的基础上增加预唤醒电路,在休眠时关闭Type‑C接口检测电路,来降低系统待机功耗。在设备插入时,通过触发预唤醒电路,再将Type‑C接口检测电路使能,实现快速响应设备的插入。</p><p>如上图所示,该检测电路包括:Type‑C接口检测电路以及Type‑C接口预唤醒电路。该充电设备端接口检测电路包括P型开关管M2、上拉电流源Irp和比较器P。手机端接口检测电路包括N型开关管M1、下拉电阻Rd和比较器D。</p><p>充电设备端接口预唤醒电路包括P型开关管M3、上拉电阻Rp_Pre、P型开关管M4、电阻R1、电阻R2以及反相器PI1。手机端接口预唤醒电路复用手机端接口检测电路的N型开关管M1和下拉电阻Rd。此外,手机端接口预唤醒电路还包括N型开关管M5、电阻R3、电阻R4和反相器PI2。</p><p>该装置的工作原理如下:在充电设备端,通过开关管M3和上拉电阻Rp_Pre实现上拉功能,开关管M4、电阻R1以及R2实现Rd插入预唤醒功能。在充电设备接口休眠时,开关管M3栅极控制电压为0,开关管M2栅极控制电压为1,关闭Irp上拉电流源,同时比较器P处于关闭状态。在手机端,下拉电阻部分将复用接口检测电路部分,开关管M5、电阻R3以及R4实现上拉插入预唤醒功能。在手机端接口休眠时,开关管M1栅极控制电压为1,打开M1,通过电阻Rd实现下拉,同时比较器D处于关闭状态。</p><p>引脚CC没有插入上拉时,CC引脚被Rd和M1下拉至GND,CC引脚通过ESD保护电阻R4接到开关管M5栅极,M5处于关断状态,输出被电阻R3上拉至VDD。然后经过反相器,输出为低,整个Type‑C接口电路没有工作电流,系统功耗很低。</p><p>当引脚CC插入上拉时,CC引脚电压即为开关管M5栅极电压,M5被打开,将信号拉低,输出CC_DET_D_PRE即为高电平。从而实现上拉插入预唤醒,然后打开比较器D,Type‑C接口检测电路将开始工作。</p><p>以上就是南芯科技公开的带预唤醒功能的Type-C接口插入检测电路方案,该方案通过增加Type‑C接口预唤醒电路,在接口电路休眠时,可以将Type‑C接口检测电路关闭。从而实现减低系统待机功耗的同时实现接口插入检测功能,通过简单的电路结构解决了Type‑C接口插入检测和低功耗之间的矛盾。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387106</guid>
            <link>https://aijishu.com/a/1060000000387106</link>
        </item>
        <item>
            <title><![CDATA[解密禾赛科技最新激光雷达专利]]></title>
            <description><![CDATA[<p>【爱集微点评】禾赛科技的激光雷达专利,通过色散偏折件实现多波长光源所产生光线的分光和出射,同时色散偏折件还能起到扩束的作用,能够有效增大激光雷达的口径,提升测远能力。而且不会过多增加激光雷达的光路高度,有效的压缩了激光雷达的高度和体积。</p><p>集微网消息,近日,禾赛科技在纳斯达克成功上市,意味着中国“激光雷达”向全球又迈进了一步,同时禾赛科技也成为中国“激光雷达第一股”。</p><p>激光雷达是一种常用的测距传感器,其工作原理是利用激光往返于雷达和目标之间所用的时间,或者调频连续光在雷达和目标之间往返所产生的频移来评估目标的距离或速度等信息。为了获得较大的视场范围,激光雷达通常采用扫描装置进行扫描。激光雷达常用的扫描方式有机械旋转式、反射镜扫描式、光学相控阵(OPA)扫描、Flash扫描等。另外,还有一种扫描方式是波长扫描。波长扫描的扫描装置是利用光栅、棱镜等色散元件基于波长将多波长光源产生的光线分开以达到扫描的效果。但是现有波长扫描的扫描装置往往存在装配不方便的问题。</p><p>为此,禾赛科技于2022年8月29日申请了一项名为“激光雷达的发射模块及激光雷达”的发明专利(申请号:202222291141.6),申请人为上海禾赛科技有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1126334138789.4883.png" alt="image" title="image"></p><p>图1 波长扫描装置的光路示意图</p><p>图1为传统波长扫描装置的光路示意图,在激光雷达的应用中,通过不同波长的光线向不同角度衍射来实现激光雷达对不同垂直角度的扫描。因此,为了使多束衍射光的出射方向靠近水平面,实现对垂直0°角和垂直方向正角度和负角度一定范围的扫描,如图1所示,通常在色散元件12下游的光路中会设置反射镜13。但是反射镜13的反射面与水平方向之间的夹角较大,所以会增大光路沿垂直方向的尺寸,使得激光雷达光路垂直方向的高度增大,从而不利于激光雷达体积的缩小。此外,也会使激光雷达光路的不同光学元件在不同高度的水平面上,从而造成了激光雷达的安装不便。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1342321041364.585.png" alt="image" title="image"></p><p>图2 新型激光雷达发射模块结构示意图</p><p>图2为本专利提出的一种新型激光雷达发射模块结构示意图,在此主要引入色散偏折件129,其主要包括光栅层127和导光体128。光栅层127朝向导光体128的表面并与导光体128的表面直接接触。导光体128的两个表面分别为第一面121和第二面122,第一光线131从第一面121入射至导光体128,第三光线133自第二面122从导光体128出射。色散面和偏折面集成于一体化结构的导光体128上,能够使光学元件体积大幅缩小,并且一体化的光学元件结构更加稳定,能够有效提高光路的鲁棒性。此外,一般而言,导光体128材料的折射率大于1。将导光体128的材料设置为比较常见的大于1的材料以控制折射角度,可以实现扩束效果。</p><p>简而言之,禾赛科技的激光雷达专利,通过色散偏折件实现多波长光源所产生光线的分光和出射,同时色散偏折件还能起到扩束的作用,能够有效增大激光雷达的口径,提升测远能力。而且不会过多增加激光雷达的光路高度,有效的压缩了激光雷达的高度和体积。</p><p>禾赛科技是一家致力于激光雷达研发与制造的全球化公司,其客户遍布全球主流汽车厂商、自动驾驶和机器人公司,覆盖40个国家和90多个城市。作为以技术为核心竞争力的公司,禾赛科技的成功并非偶然,而是在多年的产品打磨和技术投入中诞生的。中国需要有世界级自主研发能力的公司,相信禾赛科技也有实力成为全球领先企业。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387119</guid>
            <link>https://aijishu.com/a/1060000000387119</link>
        </item>
        <item>
            <title><![CDATA[兆芯如何保证处理器模拟/真实请求传输路径一致?]]></title>
            <description><![CDATA[<p>【爱集微点评】兆芯的处理器建模专利,采用两套信息来记录一个请求路径的关键信息,解决多个请求在汇聚点装置中路径不明确的问题。同时依据第二路径信息可以纠正第一路径信息在汇聚点装置导致的路径错误,使模拟请求传输路径的建模跟真实硬件传输路径更为一致。</p><p>集微网消息,近日,兆芯独家入选《上海金融科技发展白皮书》基础设施支持类科技企业,同时兆芯的新一代嵌入式处理器也一并入选白皮书。</p><p>在处理器建模领域中,当处理器传输数据的整个路径上只有一个源端发送请求时,功能加时序模型可以很好地模拟真实处理器的性能。但是,如果整个路径上有多个源端可以发送请求,由于功能模型是在请求生成的时候就进行调用,而多个源端到达请求汇聚点的路径延时是不确定的,汇聚点是指多个请求都会通过的路径节点或装置,这样会导致多个源端的请求在汇聚点看到的时序状态跟在请求生成时的差距较大。当大量的请求的处理路径跟功能模型不一致的情况下,最终建模呈现的性能指标就不能反映真实处理器的性能。因此,如何真实的模拟出处理器的性能,已成为本领域需解决的问题之一。</p><p>为此,兆芯于2020年9月29日申请了一项名为“处理器建模系统及处理器建模方法”的发明专利(申请号:202011054563.0),申请人为上海兆芯集成电路有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1141850468081.4688.png" alt="image" title="image"></p><p>图1 处理器建模系统的示意图</p><p>图1为本专利提出的一种处理器建模系统的示意图,处理器建模系统100包含多个源端装置A1~Am及一汇聚点装置PL。其中,源端装置A1~Am是向处理器发出请求的装置,例如输入输出装置、储存装置、图形处理器、预取装置等。</p><p>源端装置A1和An+1分别产生第一/二请求,并于第一/二传送时点传送两个请求。而汇聚点装置PL分别在第一接收时点和第二接收时点接收两个请求,并依据第一请求/第二请求选择传送路径(例如PT1)。其中,第一传送时点早于第二传送时点,第一接收时点接收晚于第二接收时点,且第一请求与第二请求欲存取的目标数据地址相同。如此一来,在多源端的处理器的仿真建模过程会发生多请求在到达汇聚点装置时出现路径不明的情况,最终导致建模结果呈现的性能指标与真实处理器不一致。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/538297132002.6487.png" alt="image" title="image"></p><p>图2 处理器建模方法的流程图</p><p>图2是本专利提出的一种处理器建模方法流程图,首先源端装置A1产生第一请求,第一请求为主路径请求。对于每一个请求,用第一路径信息来表示传统的功能模型的关键信息,用第二路径信息来表示真实时序的关键信息(可以真实反映时序的关键信息)(步骤210)。然后第一请求分别调用功能模型和时许模型,得到第一、二路径信息(步骤220、230)。然后第一请求被传送到汇聚点装置PL(步骤240),而汇聚点装置PL判断是否存在第二请求(步骤250)。汇聚点装置PL依据第二请求的第二路径信息选择传送路径PT1。因为目标数据地址中的信息已经先被先到汇聚点装置PL的第二请求取走了,所以依据第二请求的第二路径信息选择传送路径PT1(步骤260)。最后,汇聚点装置PL更新第二请求状态为合法的(步骤270)。</p><p>简而言之,兆芯的处理器建模专利,采用两套信息来记录一个请求路径的关键信息,解决多个请求在汇聚点装置中路径不明确的问题。同时依据第二路径信息可以纠正第一路径信息在汇聚点装置导致的路径错误,使模拟请求传输路径的建模跟真实硬件传输路径更为一致。</p><p>兆芯成立于2013年,掌握中央处理器、图形处理器、芯片组等三大核心技术。自从成立以来,兆芯已经成功研发、量产了多款通用处理产品,在业内得到了高度评价,并多次入围Silicon 100榜单、荣获各种“创新奖”、“成就奖”、“金奖”。希望在2023年成立十年之际,兆芯可以再创辉煌、更上一层楼!</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387102</guid>
            <link>https://aijishu.com/a/1060000000387102</link>
        </item>
        <item>
            <title><![CDATA[后ChatGPT时代,AI芯片如何继往开来]]></title>
            <description><![CDATA[<p>集微网消息:“英伟达是否低估了芯片危机?”</p><p>2022年9月,《经济学人》杂志向黄仁勋发出了这样的质疑,彼时的英伟达,正被加密货币泡沫破裂、高端GPU出口遭限等事件连番打击,股价创下两年新低,市值距离2021年末的高点已蒸发逾60%。</p><p>杂志记者略显刻薄地评论道:“当他透过眼镜打量他觉得会改变AI面貌的花哨新模型,以及像元宇宙这样更模糊的概念,他是否存在低估此时此地残酷性的危险?”</p><p>一百多天后如火如荼的ChatGPT热潮下,黄仁勋在加州大学伯克利分校喊出“这是人工智能的iPhone时刻”,一吐胸中块垒。</p><p>的确,ChatGPT既是热度空前的“杀手应用”,也为英伟达股价注入强心剂,伴随去年末ChatGPT热度起势,英伟达在几家大芯片巨头中,也走出了久违的领涨表现,同期在外围市场,但凡能编织出“ChatGPT与我的故事”,不少芯片企业也获得了投资者的追捧。</p><p>不过在短暂的集体狂欢后,“ChatGPT概念”也必将分化,各路企业描绘的新蓝图成色几何,需要一把技术的标尺加以衡量。</p><p>垂直一体化模式的松动</p><p>毋庸置疑,ChatGPT远超前辈AlphaGo的热度,已经像火炬般清晰照亮了大模型应用前景。然而回顾iPhone当年横空出世之时,不少外界观察者仍习惯以现有厂商格局线性外推,认为苹果公司探明的“新大陆”,最终仍将是诺基亚囊中之物。</p><p>在“人工智能的iPhone时刻”后,AI产业新机遇,同样并非理所当然应许给旧玩家。</p><p>值得指出的是,从0到1完成复现乃至超越ChatGPT实际体验的大模型,对许多团队而言面临工程能力和经济成本的双重约束。</p><p>从工程能力要求看,大型语言模型(LLM)参数量短短几年从亿级迈入千亿级,对算力需求已远超处理器性能迭代速度,分布式并行计算也因此进入“深水区”,易并行(embarrassingly parallel)方法撞上天花板,必须开发子计算任务与处理器之间更为复杂的调度方法,相关人才目前十分稀缺。</p><p>而在经济成本上,以ChatGPT的“母体”GPT-3模型为例,据称如使用英伟达V100 GPU集群训练一次,不考虑调参排故的理论最低成本也将达到460万美元,微软公司专门为其开发者OpenAI打造的超算系统据称拥有超过28万个CPU内核和1万个GPU,整体性能可以达到2020年时全球TOP500超级计算机榜单前五,如果这一宣传基本属实,则相当于OpenAI在用一套完整的天河2号超算系统专门支撑其模型训练,这对大多数企业而言无疑太过奢侈。</p><p>以此观之,人工智能厂商目前从数据、算法到AI芯片、硬件终端、项目实施的端到端垂直一体化模式,未来或将走向更明晰的专业分工,少数拥有巨型算力集群的科技巨头在云端进行大规模预训练模型迭代,并将接口开放给下游厂商、开发者,产业链下游则基于领域特定知识在边侧、端侧以更低代价、更短周期完成模型精调,实现对垂直应用场景的高可用交付。</p><p>面对呼之欲出的“范式转变”,对大多数新老厂商而言,比起抢发“我司也有类似模型开发中”的新闻,更重要的工作,恐怕是对如何挖掘特定场景商业价值深思熟虑。</p><p>针对该话题的采访中,思必驰研发总监樊帅指出,“从现实来讲,平台巨头企业在研发投入、团队投入等方面拥有优势,这是毋庸置疑的”。不过随着ChatGPT的应用延伸,上下游企业都将在产业链关键环节做出贡献,对于下游厂商而言,“探索类GPT产品的市场应用,实现技术的商业价值是企业关注的重点,无论是产品工具还是产品方案,挖掘潜力场景,进行技术融合,输出整体性、结果导向性的实用解决方案才是现实问题。”</p><p>作为国内专业的对话式人工智能平台型公司,思必驰在类GPT模型的应用落地上也有颇多洞察。</p><p>樊帅表示,现在ChatGPT是以文本交互机器人的形式呈现,这种文本生成的方式其实有很大的应用空间,比如在智能客服方向,现在的智能客服是检索式AI,但是生成式AI主动性更高,更具亲和力和有效性。不论是搜索引擎、电商客服还是AI辅助生成,ChatGPT应用级创新能力很强。</p><p>樊帅预测,在需要基于一定背景知识的创作型产业,以及刚需AIGC的场景、具有SOP(标准作业程序)的行业,比如智能写作、智能客服、文档管理、代码生成、甚至游戏NPC等,是ChatGPT适宜落地的土壤。大模型技术可通过强化上下文理解能力、思维链推理、增强指令学习,来实现场景的融合应用。例如,在会议场景下,根据上千字的会议记录,工具可以迅速根据需求指令,整理出会议纲要及重点,清晰列出待办事项。</p><p>进一步具体到语音交互领域,樊帅认为,“未来往语音对话机器人去进阶,强化语音、文本、图像等深度融合的多模态交互技术应用,应对复杂场景的变化。这些都给大家留下思考、应用和探索的空间。思必驰聚焦对话技术,从对话能力输出上来看,具备情感化、高度拟人化的语音TTS存在发展潜力”,他还介绍称,思必驰在这一方向上已进行了探索,推出过具有“高兴、撒娇、抱歉”情感的语音合成技术,应用在有声阅读、智能客服、语音助手、视频配音等行业场景,能够满足更接近真人情感化表达的语音效果。</p><p>AI芯片路线之辨</p><p>正如上文所述,类GPT大模型的开发极度依赖于算力支撑,随着大模型参数量从百亿、千亿向万亿演进,新的人工智能产业竞争将进一步向算力环节聚焦,与此同时,上下游推理、训练工作负载的需求差异将越来越显著,也对芯片技术演进带来了新的牵引。</p><p>围绕这一议题,集微网采访了国内通用GPU领域产业化步伐领先的天数智芯半导体有限公司(简称天数智芯),该公司是国内首家实现通用GPU产品量产及规模应用的厂商,其天垓100产品目前已支撑近百个客户应用,产品涵盖数百个人工智能模型的训练业务场景。</p><p>天数智芯产品线总裁邹翾分析,ChatGPT背后的GPT3.5是一种颠覆性的底层技术,其惊艳的应用效果建立在巨量语料库以及超大规模的AI算力基础之上。随着应用场景的演进, 核心技术会加速发展,包括AI模型的复杂度还会不断演进, 这将产生对算力的产生井喷需求。</p><p>国内顶尖的企业和机构正在进行ChatGPT相关的技术研究及商用级产品开发。面对国内应用环境及中文语料,相关算法及模型预计将在未来1年左右逐步成熟。在互联网入口,家庭接入设备,办公等各不同领域,针对不同的场景可能会有不同的算法及产品出现,而支撑这些模型的算力底座需要具有良好的通用性及扩展性,才能够快速的支持这些变化的需求,实现商业的可持续化演化。</p><p>邹翾表示,未来继续看好通用GPU架构训练产品的发展空间,其通用性、兼容性、以及生态成熟度仍是未来一段时间内人工智能算法及应用构建的主要支撑。</p><p>与云侧对通用性、扩展性的需求相比,</p><p>在边侧、端侧,推理芯片面对的需求则有所差异。</p><p>思必驰研发总监樊帅表示,AI专用芯片可以在侧重于场景化的端侧实现特定场景低能耗,高算力,从定制化来看,ASIC专用AI芯片从效率角度更具优势,随着大模型的普及及应用,能够提升相关芯片产品的性价比。</p><p>与此同时,由于数据量的急剧提升,无论在云侧还是端侧,对于数据的隐私保护也提出了更高要求。樊帅强调,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。基于AI的应用和其他衍生的工具级产品,在隐私安全、知识产权风险等方面亟待规范。</p><p>邹翾也谈到,在近期的客户交流中能够感受到各界对ChatGPT的关注及开发态度,希望其成为效率提升的有效工具。不过用户也有对数据隐私的担忧,未来随应用扩展,亟需提供隐私计算的技术方案,实现“可用不可见“的计算方式,这也要求更强及更通用的算力支撑。</p><p>值得一提的是,对于大模型训练芯片,特斯拉、Cerebras等海外厂商正试图探索另一条前无古人的道路—通过设计等效超算集群的单个处理器训练大模型,完全绕过分布式并行计算的调度瓶颈。</p><p>特斯拉近期公布的Dojo D1自研AI芯片,就是将25个裸片通过硅中介层互联,构成单块“Dojo Training Tile”,更为激进的Cerebras,则推出了面积达462平方厘米的WSE-2处理器,声称具有85万个用于张量运算的可编程内核,单张WSE-2支撑的CS-2机柜,据称最多可支撑万亿参数规模的大模型训练。</p><p>邹翾表示,新兴技术是针对目标问题的探索,会呈现出百花齐放的局面,在开放环境下竞争将驱使其收敛,市场是最终检测的试金石。在技术发展路线上需要从各个方向去尝试,最终都是为产业的发展贡献自己的力量。</p><p>结语</p><p>“人工智能的iPhone时刻”,的确代表了许多人对ChatGPT热潮的感受,全球公众与行业机构被“卷入”其中的速度,已经清晰昭示出未来更多、更大应用创新沿着这一方向喷薄而出的图景。</p><p>在警惕短期过度炒作和跟风的同时,类GPT模型对人工智能商业模式和产业格局带来的长期影响,亟需相关厂商冷静观察,沉着应付,有所作为。</p>
                                                    ]]></description>
            <pubDate>Fri, 24 Feb 2023 16:48:57 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386766</guid>
            <link>https://aijishu.com/a/1060000000386766</link>
        </item>
        <item>
            <title><![CDATA[3nm的“剧本杀”:有人吃饱,有人跌倒,有人意难平……]]></title>
            <description><![CDATA[<p>集微网报道(文/李映)开局不利,这会是代工巨头台积电在2023年首季的剧本吗?</p><p>面临行业景气度下行以及去库存消化的影响,台积电不仅下调Q1营收及全年资本支出,还放下身段松动代工价格,并在多方考量之下推迟欧洲建厂。在收缩战线之际,又传出英特尔推迟与台积电3nm合作订单的消息。</p><p>作为先进工艺的王者,台积电在今年3nm(N3)的规划是占其总营收的4-6%,估算下来为30-45亿美元。对于英特尔订单推迟,业界先有分析称将影响产能利用率,对其营运造成影响。</p><p>但反转比变脸还快。据透露,苹果已采购了100%的初始N3供应,很可能用于即将推出的 iPhone 15 Pro 系列以及计划于2023年下半年推出的新款 MacBook。且在手机去库存加速和HPC等需求高涨走势下,联发科、高通、AMD、英伟达等相比预计会加快下单3nm以及更具优化的N3E工艺,台积电全年3nm将走向满载。</p><p>反观3nm的先行者三星虽然率先量产,但目前买单者只有一些矿机企业,对比之下或不得不发出“起了大早赶个晚集”的喟叹。</p><p>英特尔数次推迟</p><p>推迟的戏码可谓是一再上演。</p><p>按照英特尔最初的计划,第14代Meteor Lake系列处理器采用多芯片堆叠设计,GPU部分将交付台积电3nm代工。但后来转向5/6nm制程,计划下一代即第15代Arrow Lake的GPU部分导入台积电3nm工艺。</p><p>没想到由于产品设计和工艺验证问题,该计划被推迟到2023年上半年,后来该产品的量产计划又因某种原因再次推迟到2023年底,现在则又要推迟到2024年4季度……</p><p>业内人士表示,这一推迟几乎完全取消了原定于2023年的3nm产能,只剩下少量的晶圆投入用于工程验证。</p><p>但从客户优先级来说,上述人士认为,在3nm工艺层面,苹果、AMD、英伟达下订单的时间都比英特尔更早,客观来说英特尔的订单优先级或相对靠后,而延后或是一种保护面子的“官方说法”。</p><p>再三推迟之下,英特尔原本期待的首发看来要变成“末发”了。英特尔近年流年不利,遭遇PC和服务器市场需求下滑和竞争对手的反击,导致PC平台蓝图频繁修改,产品上市延迟也进一步扰乱了供应链的节奏。</p><p>而英特尔的麻烦不止于此。面对2022年营收和利润快速下降的情形,英特尔不久前表示,正计划削减整个公司的管理层薪酬。且在PC市场疲软和竞争加剧的情况下,预计2023年第一季度仍将继续亏损。</p><p>台积电3nm将“满载”</p><p>在英特尔延后3nm订单仅仅两日,就爆出苹果包圆台积电3nm产能的消息,苹果这一举动着实给台积电送上了“定心丸”,特别是在代工业迎来“倒春寒”之际。</p><p>受经济下行叠加多重因素影响,有称台积电2023年上半年整体晶圆厂产能利用率预估跌至80%,其中7/6nm制程产能利用率跌幅扩大,5/4nm产能利用率从今年1月开始逐月下滑。台积电虽未直接松动代工价格,但私下按客户与订单规模不同,给予优惠。</p><p>但代工价格高昂的3nm制程却是“另一番天地”,在客户、产能等方面,正从一个胜利走向另一个胜利。</p><p>随着手机去库存加速,不仅苹果已获得了N3的所有可用订单,且高通、联发科也在加速下单。高通预计2023年第4季推出的Snapdragon 8 Gen 3将采用N3E制程;原预期2024年才会加入3nm行列的联发科,预计最快2023年12月就会推出首款N3E制程芯片。此外也传出Oppo已计划在台积电投片3nm。</p><p>N3E是3nm的升级工艺。目前N3工艺的EUV光罩层数为25层,预计二三季度量产的N3E工艺的EUV光罩层数则从25层减少到21层,可使芯片拥有更佳的效能、功耗和良率。</p><p>在手机芯片3nm起势之际,HPC需求也持续强劲,相应的AMD、英伟达等一众“拥趸”也将为台积电3nm节点营收贡献动能。</p><p>此外,在产能方面也会一扫稼动率不足的窘境。据悉台积电的3nm工艺于12月下旬开始,并在逐步扩大工艺产能,3月晶圆月产量将达到 45000片。有分析称,其3nm制程不仅在第一二季满载,在进入下半年后加上N3E的量产以及新客户的加持,全年3nm产能都呈现满载状况。</p><p>看起来,3nm俨然要成为台积电的新“台柱”。</p><p>三星“起大早赶晚集”</p><p>反观作为第一首发3nm的三星,市场天平却依旧没有向它倾斜。</p><p>三星抢先于2022年6月底进入3nm GAA世代,但据上述行业人士透露,从价格来看,相当于台积电价格打九折,相比于巨大的研发和设备开支,也算是诚意满满了。但目前只有一些中国矿机企业下单,对比台积电3nm“王者联盟”式的客户,仍有巨大落差。</p><p>而良率无疑是横亘其中的一大“障碍”。有关台积电及三星的3nm良率一直都是个谜,此前传闻说三星3nm良率仅有10-20%,台积电3nm良率可达70-80%,这恐有失偏颇。而且后者的良率也太高了,又被戳穿实际上只有不到50%的良率。</p><p>尽管实际对比不会这么悬殊,但三星3nm良率不如台积电应是实情。三星自然也在加足马力,通过全面合作和全力攻关,据悉三星3nm良率已大幅提高。</p><p>三星一位高管在日前受访时表示,相比于此前受困的良率问题,三星第一代的3nm制程良率已接近完美,第二代3nm工艺也迅速展开。</p><p>相应的,客户的积极性也在提升。据悉除了三星自用之外,其3nm工艺还锁定了四大客户,包括IBM、英伟达、高通及国内的百度公司,这些公司综合考虑了过去的战略合作伙伴关系、供应链的必要性等因素,选择三星作为芯片代工企业。</p><p>值得一提的是,英特尔计划于2023年底推出3nm(Intel 3)节点,在三大巨头皆进入3nm制程时代之后,未来3nm制程亦将成为先进工艺代工的主流。有预计到2025年,3nm制程市场的产值将会高达255亿美元,超越当时5nm制程预估的193亿美元产值。</p><p>而谁会笑在最后?</p>
                                                    ]]></description>
            <pubDate>Fri, 24 Feb 2023 16:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386774</guid>
            <link>https://aijishu.com/a/1060000000386774</link>
        </item>
        <item>
            <title><![CDATA[澜起科技提出系统安全防御方案 避免恶意程序攻击而崩溃]]></title>
            <description><![CDATA[<p>【爱集微点评】澜起科技提出的用于保护系统安全的安全防御方案,该方案通过双架构中的安全区对接收来自用户区的指令来源进行身份验证,从而避免了被恶意程序攻击而导致的系统安全问题。</p><p>集微网消息,目前,CPU和内存等芯片在物理设计时有其正常工作的电压和频率范围,超出正常范围则存在功耗过大烧毁或者时序、逻辑运算不稳定或者死机的情况,不稳定可能导致被攻击,防护程序被绕过或者密钥被窃取等问题。</p><p>电压和频率的控制是通过主板和内存条上的智能硬件电路来实现的,通过驱动程序等软件修改相应的CPU寄存器、主板相关电路的地址或端口、内存相应的参数区中的参数来实现电压和频率的调节。</p><p>为了系统安全,此类操作往往需要最高的系统权限,甚至在BIOS固件里进行调节,但是固件、木马或者攻破操作系统获得系统权限的恶意程序可以实现电压和频率配置,从而导致系统不安全。</p><p>为此,澜起科技在2022年3月16日申请了一项名为“一种安全防御方法、装置、设备及存储介质”的发明专利(申请号:202210259021.X),申请人为澜起科技股份有限公司。</p><p>根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/437905773410.57446.png" alt="image" title="image"></p><p>如上图,为该专利中公开的一种安全防御方法的流程图,该方法可以应用于中央处理器中的安全区。首先,系统接收加密的目标选项调节指令,以便利用预存储的密钥对加密的目标选项调节指令进行解密操作,以判断加密的目标选项调节指令的来源是否为用户区。</p><p>其次,当加密的目标选项调节指令的来源为用户区时,将本地存储区域内存储的第一随机码发送至选项控制单元,以便选项控制单元对第一随机码进行验证,并在验证成功后执行目标选项调节指令。在该过程中,当加密的目标选项调节指令的来源为用户区时,会将本地存储区域内存储的第一随机码发送至选项控制单元。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/690881846244.347.png" alt="image" title="image"></p><p>如上图,为上述安全防御方法的示意图。中央处理器采用双架构,将中央处理器分为用户区与安全区两部分,其中安全区是物理隔离,不会受到用户区的攻击。当目标调节指令为电压和频率调节指令时,图中左侧标有叉号的箭头直接连接用户区与电压和频率控制单元,表示现有技术中用户区会与电压和频率控制单元直接通信,可能会存在电压和频率控制单元执行来源为恶意程序的目标选项调节指令的情况发生。</p><p>在该方案中,中央处理器的安全区接收到电压和频率调节指令,然后利用预存储的密钥对加密的目电压和频率调节指令进行解密操作,即图中的验签操作。若电压和频率调节指令的来源为中央处理器的用户区时,将安全区中存储的随机码发送至电压和频率控制单元进行比对,比对成功后执行电压和频率调节指令。</p><p>最后,接收选项控制单元发送的第二随机码,并在本地存储区域内存储用于替换第一随机码的第二随机码。这是由于中央处理器中的安全区将第一随机码发送至选项控制单元后,第一随机码已失效。因此需要将接收到的选项控制单元发送的第二随机码存储在本地存储区域内,使用第二随机码覆盖第一随机码,使得本地存储区域内仍旧只存储一个随机码。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/330692839827.988.png" alt="image" title="image"></p><p>如上图,为上述安全防御装置的结构示意图。该装置包括有:指令接收模块11、随机码验证模块12和随机码更新模块13。指令接收模块用于接收加密的目标选项调节指令,以便利用预存储的密钥对加密的目标选项调节指令进行解密操作。随机码验证模块用于当加密的目标选项调节指令的来源为用户区时,将本地存储区域内存储的第一随机码发送至选项控制单元。随机码更新模块用于接收选项控制单元发送的第二随机码,并在本地存储区域内存储用于替换第一随机码的第二随机码。</p><p>以上就是澜起科技提出的用于保护系统安全的安全防御方案,该方案通过双架构中的安全区对接收来自用户区的指令来源进行身份验证,从而避免了被恶意程序攻击而导致的系统安全问题。</p>
                                                    ]]></description>
            <pubDate>Fri, 24 Feb 2023 16:48:50 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386770</guid>
            <link>https://aijishu.com/a/1060000000386770</link>
        </item>
        <item>
            <title><![CDATA[关注设备电池健康 国轩高科提出电池健康状态实时监控及评估方案]]></title>
            <description><![CDATA[<p>【爱集微点评】国轩高科公开的电池健康状态实时监控及评估预测方案,针对当前传统三维度电池健康监控及评估的短板,基于四维度电池健康监控及评估方法,通过结构创新,采用三个不同层级分别对电池的实时压力进行采集。进而通过信号处理和分析,实现了电池健康的实时监控和评估。</p><p>集微网消息,锂离子电池在运行过程中,近似于一个黑匣子,它的安全始终是消费者关注的问题,能够实现电池健康状态可视化也是各大主机厂十分关心的难题。现有的用于电芯实时状态监控和评估的健康因子有电压(U)、电流(I)和温度(T)。</p><p>然而,在此基础上的健康状态评估存在一个短板,就是“U/I/T”在电池生命周期的不同状态下的差别并不大,仅会在一些突发状态下个别因子才会发生较大波动。而这已经不是真正意义上的健康评估,而是突发状态下的预警,这对于电池实时的健康评估和监控是远远不够的,存在安全隐患。</p><p>基于现有最新的研究成果,电池在生命周期运行过程中的压力和寿命之间有着密切联系,并且呈现出正相关的关系。当电池的寿命衰减加速时,对应的压力也呈现出相同的加速增长的趋势,当电池运行稳定时,其压力变化也相对稳定,不会发生较大的突变,完全可以通过压力的变化趋势,实现电池的健康评估。</p><p>该原理为通过压力的实时数值和离群度,实现电池的实时健康监控。并且将电池运行过程中的压力作为新的健康因子,建立电压(U)、电流(I)、温度(T)和压力(P)四个维度上的健康监管平台。从而辅助电池更准确、更及时的健康监控和评估,以弥补传统“U/I/T”三维度评估的短板。</p><p>因此,为了实现这种能够实时监控和评估电池健康状态的方案,国轩高科在2022年11月11日申请了一项名为“一种电池健康状态实时监控及评估预测装置”的发明专利(申请号:202211409572.6),申请人为合肥国轩高科动力能源有限公司。</p><p>该专利分别在电芯级别、多层电芯级别以及系统级别描述了如何实现电池的健康状态评估及实时监控。根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/818099872778.0901.png" alt="image" title="image"></p><p>首先,在电芯级别,如上图,为集成有喷涂式压力传感器的电池内部示意图。对于电芯内部极片102,根据极片的成组原理,沿着箭头方向,最外围的极片的远离电芯中心的面在电池运行过程中并不会参与电化学反应,也就是说该极片表面并没有被充分利用。</p><p>而为了实现电池健康状态的评估,可以选取该极片表面实现喷涂式压力传感器101的布置,进而在电芯制作过程中就实现电芯本体与压力传感器的集成,并且该种压力传感器可实现信号的无线传输。该种形式的电芯在模组或者系统成组后,可以完成本体的压力自测,后将压力信号输出后,配合电池管理系统实现信号的处理和分析,进而根据压力和电芯寿命的关系,实现电池的健康状态评估及实时监控。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/93603020343.23683.png" alt="image" title="image"></p><p>如上图,为该专利中展示的电芯压力与寿命之间关系示意图。可以看到,随着循环圈数的增加,电池容量保持率(电池寿命)和压力之间的关系。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1571811746644.0806.png" alt="image" title="image"></p><p>其次,在电芯级别中,还要考虑不同层之间电芯层级的关系,如上图所示,为集成有离电柔性压力传感器的电池内部示意图。电芯内部极片102之间插入离电柔性压力传感器201层,作为独立的一层。进而在电芯制作过程中就实现电芯本体与压力传感器的集成,并且该种压力传感器可实现信号的无线传输。该种形式的电芯在模组或者系统成组后,可以完成本体的压力自测。然后将压力信号输出后,配合电池管理系统实现信号的处理和分析,进而根据压力和电芯寿命的关系,实现电池的健康状态评估及实时监控。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1398234646315.2043.png" alt="image" title="image"><br>最后,在系统层级,如上图,为集成有圆环式力传感器的系统示意图。通过在成组电芯301与箱体401之间布置圆环式力传感器402,进而在系统制作过程中实现电芯与压力传感器的集成。该种形式的系统在完成装配后,可以完成电芯的压力监测,后将压力信号输出后,配合电池管理系统实现信号的处理和分析,进而根据压力和电芯寿命的关系,实现电池的健康状态评估及实时监控。</p><p>以上就是国轩高科公开的电池健康状态实时监控及评估预测方案,该方案针对当前传统三维度电池健康监控及评估的短板,基于四维度电池健康监控及评估方法,通过结构创新,采用三个不同层级分别对电池的实时压力进行采集。进而通过信号处理和分析,实现了电池健康的实时监控和评估。</p>
                                                    ]]></description>
            <pubDate>Thu, 23 Feb 2023 16:48:57 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386469</guid>
            <link>https://aijishu.com/a/1060000000386469</link>
        </item>
        <item>
            <title><![CDATA[ChatGPT席卷全球背后:中美人工智能差距几何?]]></title>
            <description><![CDATA[<p>集微网报道 (文/陈兴华)ChatGPT以迅雷不及掩耳之势席卷全球多国同时,在中国也掀起前所未有的舆论热议,同时多家互联网、人工智能及产业链企业均表示将推进类ChatGPT应用和相关AI技术。</p><p>然而,国内舆论主要聚焦在ChatGPT使用体验、产业链相关受益方以及对产业变革影响等方面,鲜有探讨其背后折射出的中美人工智能生态竞争差异,中国缘何没有率先创造出ChatGPT,以及应如何利用相关AI技术带来的新机遇赋能国内产业经济发展。</p><p>相比之下,主流外媒对这类话题从制度、创新环境和人才竞争等多个层面提供了一些可供参考的分析借鉴。此外,国内行业人士指出,ChatGPT将刺激开启AI经济新时代,推动中国相关数据、算法和算力技术开发建设,对万物互联的数字经济发展意义非凡。</p><p>为什么ChatGPT没有出现在中国?</p><p>作为科技产业、社会经济发展的一项变革性技术与关键性力量,人工智能未来将深刻影响各国经济、科技和军事等综合实力对比,甚至重塑世界竞争格局。而经过多年行业发展演变,目前全球人工智能发展呈现中美两国引领、主要国家激烈竞逐的总体格局。</p><p>对于为何ChatGPT这一现象级消费类AI应用没有率先出现在中国,纽约时报、路透社、南华早报、CNBC等国际主流媒体刊文和一些分析师观点均提及“审查制度”,包括中国正寻求加强与美国AI竞争以及技术监督之间的平衡,但审查管制阻碍了科技产业发展。即使中国开发出ChatGPT相关产品,“过多限制、内容监管也可能会阻碍其商业化和进一步创新。”</p><p>另一方面,以往基于政府支持及较宽松的发展环境,中国互联网科技企业曾创造出举世瞩目的成就,但后续也因一定程度的无序扩张等因素引致监管。如今,随着国际地缘和产业发展形势演变,如何权衡互联网及AI等科技领域的监管力度和方式已成为国内重要课题。</p><p>“任何重要技术方面的产品发展,其实都离不开制度和整个环境,”斯坦福中国经济与制度研究中心高级研究学者许成钢表示。他以TikTok的中国版抖音为例,称中国企业未来可能无法再实现此类创新。因为开放的环境一旦没有了,重大创新就很难出现。</p><p>对于中国未首先打造出ChatGPT类似产品,产经观察家、IT行业分析师丁少将对集微网表示,在当前宏观经济和产业环境下涉及多重原因,包括创新和文化环境、内容监管,行业企业的资本投入、技术实力以及资源整合和商用落地等多方面。另外,“这类产品推出之前还有很多确保内容安全等前置性工作需要去做,这在中国特别重要。”</p><p>从产业发展角度来看,这也考验的是国内企业家和投资者的魄力。丁少将指出,“ChatGPT背后AI的数据训练、数据建模和人力投入等成本其实非常高。但基于商业化前景不明朗和自身资源实力等判断,中国公司在这方面投入还有所欠缺,不及微软等巨头公司。”</p><p>不过,国外科技媒体Semafor表示,美国进行开放式人工智能研究的传统比中国要长得多,而且并非“只是受利润动机的限制”。OpenAI最初是一家非营利性研究组织,其唯一目的是开发先进的人工智能。从这一角度而言,或许可以引发国内产业界更多思考。</p><p>中美AI产业链底层技术尚存差距</p><p>正如百度创始人、董事长兼CEO李彦宏1月在百度Create开发者大会上所言,“芯片卡脖子很要紧,但软件卡脖子其实一样要紧”。需要客观承认的是,ChatGPT在全球多国势如破竹同时,也映衬出中国在AI产业链软硬件关键及底层技术存在的部分差距及相关挑战。</p><p>众所周知,ChatGPT是一种由OpenAI训练的大型语言模型。在业内人士看来,目前全球还没有能跟ChatGPT抗衡的大模型,业界共识是中美差距在两年以上。“中国必须要有自主基座、应用大模型。由于OpenAI关键模型不开源只给API使用,中国已经是被‘卡脖子’了。”清华大学计算机科学与技术系长聘副教授黄民烈日前对国内媒体表示。</p><p>此外,黄民烈还提到,在迭代至GPT-3过程中,OpenAI建立起了真实的用户调用和模型迭代之间的飞轮,以及非常重视真实世界数据的调用和数据对模型的迭代,同时也推动相关生态建立。但业内人士称,目前国内还没有比较好的公司把数据和模型的飞轮完整转起来。</p><p>“从已有资料看,ChatGPT、文心一言都使用了包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用技术。从这四方面,如果说相关技术被‘卡脖子’,芯片可能是一个,既要算得便宜还要算得快,需要至少6纳米芯片,将来还需要更精密的3纳米以下芯片。”中国电信首席专家、美国贝尔实验室院士毕奇日前接受《法制周末》表示。</p><p>另据国内外媒体和专家学者均指出,美国的半导体禁令和其他贸易制裁将可能导致中国在最新的人工智能竞赛中处于劣势。由于担心美国进一步制裁,中国大型科技企业已储备足够的先进芯片,但如果无法获得下一代芯片,人工智能技术的进一步发展可能会受到严重阻碍。</p><p>与此同时,顶尖AI人才外流也是重要挑战。根据智库MacroPolo的数据,虽然中国总体培养了大约30%的顶尖AI研究人员,但大多数流失到了美国。纽约时报曾刊文《美国人工智能领域的秘密武器:中国人才》指出,在人工智能尖端热门领域,很多来自美国的开创性工作都由华人的智慧推动。这便不难解释美国顶尖AI研究及学术机构、专家学者等不乏华人身影。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1354563635305.925.jpg" alt="image" title="image"></p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/100775343913.72034.jpg" alt="image" title="image"></p><p>图源:纽约时报</p><p>AI新技术应用将催化数字经济发展</p><p>尽管ChatGPT的大模型产品当前在全球相对领先,但由于中美在AI大数据、算法、大模型发展路径存在一定程度不同,中国在相关技术产品的发展上也有自身特有优势,其中包括中国产业界在ChatGPT等人工智能技术软件层面具有更好的传统开发实力,以及能够让更多大数据应用积极地与人工智能结合,尤其在如今系统芯片呈现算法固化的特点情况下等。</p><p>此外,麻省理工科技评论援引华盛顿大学政治学助理教授杰弗里·丁(Jeffrey Ding)的话进一步表示,中国可以更好获得中文AI训练材料,并且出于商业目的快速开发新的产品。OpenAI、微软主要是针对英语市场进行优化。相对而言,百度等中国公司并非要占领英语市场,会针对中文领域进行专门优化升级。这其中存在一个真实而独特的优势和机会。</p><p>毋庸置疑,ChatGPT的大热也将促进国内数据算法迭代升级、智算中心建设乃至整个人工智能产业生态的发展。例如以GPT为代表的大模型正在催化新一轮AI算力储备,国内智算中心项目近期密集公布新进展。目前,全国已有超过30个城市正在建设或提出建设智算中心,可带动人工智能核心产业和相关科技产业实现数倍级增长。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/573235005362.3618.jpg" alt="image" title="image"></p><p>湖北随州5A级智算中心 图源:中科曙光</p><p>在ChatGPT刺激推动下,创道投资咨询总经理步日欣表示,“AI如果进一步与工业、制造业、交通运输业等传统行业结合,将实质性提高生产力水平,并且有助于缓解即将到来的人口老龄化等社会经济问题,从而体现技术最根本的价值。”另据麦肯锡的报告表示,随着人工智能和机器学习技术渗透到各行各业,其每年可为中国经济带来达6000亿美元GDP。</p><p>为了释放这一庞大产业价值,中国需要对数据生态、前沿技术、各类人才和商业模式以及标准和法规进一步投资和完善,并利用相关优势应对挑战和“扬长补短”。如对于高性能芯片受制于人,相关专家表示,解决方法包括自研CPU芯片,采用Chiplet或分布式芯片替代。而弯道超车路径之一是,号召各类拥有数据的机构参与预训练及与芯片计算架构公司等深度合作。</p><p>对于如何把握AI新技术为国内产业发展带来的机遇,丁少将建议称,第一,对发展前沿科技而言,构建开放包容的环境至关重要。第二,国家及社会资本应更加活跃,并加大对创新型企业的激励和战略支持。第三,推动AI科技创新和各产业发展相融合,让其成为具有商业潜力和前景的新技术和产业,进而成为各企业新的增长引擎,乃至促进整个国民经济发展。</p><p>(校对/杜莎)</p>
                                                    ]]></description>
            <pubDate>Thu, 23 Feb 2023 16:48:57 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386418</guid>
            <link>https://aijishu.com/a/1060000000386418</link>
        </item>
        <item>
            <title><![CDATA[为提高电阻器抗浪涌能力 鼎声微电提出相关技术及加工设备方案]]></title>
            <description><![CDATA[<p>【爱集微点评】鼎声微电公开的抗浪涌电阻器及其加工设备方案,鉴于目前电阻器的发展受到尺寸的约束,该方案在电阻器本体的侧面增加了侧面电阻体,这样无需增加电阻器本体的尺寸,也可进一步提高电阻器本体的抗浪涌能力。</p><p>集微网消息,贴片电阻又名片式固定电阻器,常规的贴片电阻多是采用丝网印刷将电阻性材料淀积在绝缘基体上,然后烧结形成的,具有耐潮湿、耐高温和可靠度高的优点。贴片电阻是使用的过程中,常会遇到浪涌,浪涌也叫突波,顾名思义就是超出正常工作电压的瞬间过电压,电阻被施加这种浪涌电压时,过度的电应力会使电阻特性受到影响,最坏的情况下可能导致芯片损坏。</p><p>抗浪涌电阻器具有较好的抗浪涌能力,其原理是:拉长电极间距,使电位梯度平缓,从而减少对芯片的损坏。简单的说:正常情况下,贴片电阻上的电阻体在两个电极之间是直来直往的,呈一条直线状。而抗浪涌电阻器上的电阻体则呈波浪状,通过在电极之间设置长度较长的电阻体,使得电极间的导通路径变长,进而使得电位梯度变得平缓,从而提高抗浪涌能力。</p><p>在现有技术中,贴片电阻上的电阻体都是先通过丝网印刷的方式,将电阻性材料按照一定的形状印刷在绝缘基体上,然后再烧结而成的。常规的丝网印刷只能将电阻性材料印刷在绝缘基体的上表面处,但是绝缘基体的上表面的面积是有限的。当需要进一步提高电阻的抗浪涌能力时,只能采用增加电阻器尺寸的方式来实现,而大尺寸电阻器则需要更多的电路板空间,虽然增加了电阻器的抗浪涌能力,但是又会带来新的其他问题。</p><p>为此,鼎声微电在2021年11月16日申请了一项名为“一种抗浪涌电阻器及其加工设备”的发明专利(申请号:202111354948.3),申请人为宁波鼎声微电子科技有限公司。</p><p>根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1417490822062.9102.png" alt="image" title="image"></p><p>如上图,为该专利中公开的抗浪涌电阻器本体结构的示意图,在该电阻器的两端均设置有电极2和电阻3,电阻由端部电阻体301、表面电阻体302和侧面电阻体303三部分组成。表面电阻体呈长条状,均布在电阻器本体的上表面。侧面电阻体呈U形状,位于电阻器本体的两侧,通过侧面电阻体将表面电阻体相互连接在一起。端部电阻体位于电阻器本体的两端,通过端部电阻体使电极与表面电阻体连接在一起。</p><p>为了提高电阻器本体的抗浪涌能力,在本体上设置了由端部电阻体、表面电阻体和侧面电阻体组成的电阻,端部电阻体和表面电阻体均位于电阻器本体的上表面。正常情况下,电阻器本体上表面的面积是有限的,如果采用增加电阻长度的方式来提高电阻器本体的抗浪涌能力,当电阻器本体上表面的电阻的长度无法再增加时,只能增加电阻器本体的尺寸。</p><p>当电阻器本体的尺寸变大后,这样电阻器本体的上表面就可排布更多的电阻,但是电阻器本体的尺寸变大后,则会带来新的问题。该专利中的方案对电阻器本体进行改进时,在电阻器本体的侧面增加了侧面电阻体,端部电阻体、表面电阻体和侧面电阻体为一个整体,这样就无需增加电阻器本体的尺寸,也可进一步提高电阻器本体的抗浪涌能力。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1576156235607.1685.png" alt="image" title="image"></p><p>为了能够方便加工该抗浪涌电阻器,在该专利中还公开了一种抗浪涌电阻器的加工设备,如上图所示。印刷台4的上侧设有丝网印刷机构,该结构包括丝网印板5、第一升降板6和第二升降板7。第一升降板上对称设有第一气缸8,第二升降板位于第一升降板的一侧,且第二升降板与第一气缸的活塞杆固定连接。第二升降板的下端设有刮板,丝网印板上设有若干个第一开口501。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1361348511722.1265.png" alt="image" title="image"></p><p>如上图,为丝网印板、第一固定座和第二固定座的剖视图。丝网印板的下侧设有若干个侧面印刷组件,且侧面印刷组件包括第一固定座10和第二固定座11,二者均为空心结构,并与丝网印板滑动连接。且两个固定座的一侧均设有走料槽12,走料槽与第一开口连通。</p><p>在该结构中,通过对现有的电阻印刷设备进行改进,使得在对电阻进行丝网印刷时,可以在电阻器本体的上表面及侧面均印刷上电阻体,加工更加方便。具体的工作原理:在印刷台上设有丝网印刷机构,丝网印刷机构的下侧设有若干个侧面印刷组件,丝网印刷机构与侧面印刷组件配合使用,共同完成电阻器本体上表面和侧面的电阻体的印刷。</p><p>在使用时,浆液状的电阻性材料通过管接口13进入第一固定座和第二固定座内,在充满两个固定座的内部空腔后,会通过走料槽流出。走料槽的形状与侧面电阻体相同,而且走料槽的上端与第一开口连通。物料通过走料槽进入第一开口并聚集,随着物料的聚集,部分物料会堆积在第一开口内,然后管接口停止进料,第二气缸工作,使第一升降板向下运动。</p><p>此时,第一升降板会带着第一气缸及第二升降板一起运动,第二升降板上的刮板与丝网印板抵触。随后第一气缸工作,推动第二升降板和刮板往复运动,通过刮板来将第一开口处的物料刮平。同时,在印刷台一侧设有刮料机构,通过刮料机构可以将走料槽处的物料刮平,随后第一固定座和第二固定座反向运动,接着第一升降板和第二升降板回归原位。侧面电阻体和上表面电阻体同时印刷完成,然后将丝网印板取下,将带有印刷工件的载料板取走即可。</p><p>以上就是鼎声微电公开的抗浪涌电阻器及其加工设备方案,鉴于目前电阻器的发展受到尺寸的约束,该方案在电阻器本体的侧面增加了侧面电阻体,这样无需增加电阻器本体的尺寸,也可进一步提高电阻器本体的抗浪涌能力。</p>
                                                    ]]></description>
            <pubDate>Wed, 22 Feb 2023 16:48:57 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386150</guid>
            <link>https://aijishu.com/a/1060000000386150</link>
        </item>
        <item>
            <title><![CDATA[欧洲推迟建厂 台积电今年日子不好过]]></title>
            <description><![CDATA[<p>集微网报道(文/李映)继被注重自由现金流的“股神”巴菲特去年第四季度重砍台积电ADR股票达5176万股、减持幅度高达86%之后,台积电又传出欧洲建厂将延后两年的消息,让业界心头一紧,台积电现金流真的吃紧了吗?</p><p>复盘台积电延后欧洲建厂的逻辑,或许不止于现金流的考量,更是在市场供需变化、投资回报率权衡之后做出的理性选择。</p><p>大幅抛售引发现金流忧虑?</p><p>被“股神”巴菲特仅仅“青睐”一季之后就被大幅抛售,对台积电来说不啻一场次生灾难,股价重挫4%即是实证。</p><p>而在集微网“买进卖出只一季 “股神”看不懂半导体?”文章中已分析出这一举动背后的逻辑:即台积电在日本、美国、中国台湾都将进行大笔投资,还有可能在德国进一步投建晶圆代工厂,而在日本、美国、德国投建晶圆代工厂成本非常高,需占用大量的资本,初期可能会持续亏损,并不断稀释台积电的利润,影响未来的自由现金流,这与巴菲特看重自由现金流的投资逻辑相违背。</p><p>就现金流而言,2022年台积电的全年资本开支为363亿美元,或1.1万亿新台币,产生了经营现金流1.6万亿新台币,自由现金流为5280亿新台币,算得上财才雄厚。</p><p>伴随着地缘政治思维的抬头,将半导体业视为攸关战略产业的美国、欧洲、日本等相继推出数千亿美元大手笔投资计划力促半导体制造业回流。台积电作为代工业第一巨头,成为各国争抛橄榄枝的主力,也频频释出重大投资或扩产计划。</p><p>有半导体行业人士指出,尽管有各国政府的补贴,但建厂尤其是先进工艺厂的成本支出十分庞大。原本台积电在日本晶圆代工厂计划投资86亿美元,在美国晶圆厂投资120亿美元,但在去年12月台积电将美国晶圆厂投资从120亿美元增加到了400美元,且台积电还计划在中国台湾、欧洲德国投建代工厂,未来几年台积电将产生大量的资本支出,对其持续稳定的自由现金流造成影响。</p><p>加之有台积电在美建8英寸厂Wafertech成本高企、长期亏损之后才转为盈利、2021年营收仅为77.35亿元新台币形同鸡肋的“珠玉”在前,台积电在美国、日本、欧洲等地建厂如何不拖累整体业绩、如何快速产生正反馈都成为台积电不得不直面的问题。</p><p>更值得忧虑的是,台积电已处于地缘政治风暴眼之中。近日由于担忧台海风险,由美国前副总统高尔(Al Gore)联合创建的Generation Investment Management金融服务公司也出清台积电ADR共326,654股持股,换算价值达2240万美元。</p><p>多重因素导致暂时搁置</p><p>急行军的台积电在此时为欧洲建厂按下了“刹车”,但这背后的考量或不止现金流那么简单。</p><p>去年底又传出台积电将计划在欧洲设厂的消息。今年1月12日,在台积电的财报发布会上,台积电也表示正考虑到欧洲德国建设汽车芯片工厂,但仅过了一月,台积电就宣布单方“推迟”,变化总比计划更快。</p><p>业内人士对集微网指出,这既有行业环境变化的因素,也涉及台积电投资建厂的策略调整。</p><p>前两年受多重因素影响汽车芯片持续短缺,导致多家整车厂家停产或减产汽车。据AFS的最新数据显示,截至去年12月11日,今年全球汽车市场累计减产约435.1万辆汽车。不过受疫情放开和包括英飞凌、瑞萨、TI等汽车芯片大厂陆续释出大手笔投资扩产的消息,芯片短缺将有所缓解。</p><p>因而上述人士分析,台积电在欧洲建厂的政治诉求与商业因素相比美国、日本的权重本身就较弱,且考虑到汽车芯片供需将放缓,产能可转至中国台湾甚至转往日本、美国等地新厂生产,有助于更好地调配产能,因而台积电将欧洲新厂时程延后亦在情理之中。</p><p>此外,更现实的因子还在于,在欧洲建厂面临资金、人才、水电供应等诸多压力,且赴欧洲设厂成本估计更高于美国与日本,将对台积电资本支出、人力投入和运维造成更多的考验。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/187541081557.0785.png" alt="image" title="image"></p><p>甚至还有消息称,环球晶收购德国同业世创因德国官方以“审核时间来不及”为由而失利,引起了连锁效应。有消息人士透露,原本称赴德国设厂还处于“非常非常早期”的台积电,恐因环球晶收购世创未成,欧洲新厂落脚地点或将转向评估捷克。</p><p>联想到台积电在去年回应欧洲建厂所言:“设厂地点选择有诸多考量因素,台积电拓展全球制造版图是基于客户需求、商机、运营效率和成本等多方面的考量,不排除任何可能性,一切以公司正式对外公告为主。”</p><p>或许一切变数都藏在“不排除”之中。</p><p>今年日子不太好过?</p><p>虽然现代工业在2022年整体表现出“逃逸”下行周期的强大力场,但由于终端需求反映到代工订单的滞后性,这一份“寒意”传导至2023年之际冲击已然更加强烈。</p><p>反映到现实就是各大代工厂的产能利用率在不断下探,有的甚至直接接近“腰斩”。代工厂不得不使出浑身解数,无论是裁员、代工降价、资本支出削减等举措频出,为今年走势蒙上了阴霾。</p><p>尽管台积电经营有年,长期致力于平台建设、工艺多元化,相对受损面较小,但在寒潮大势之下,台积电亦无法独善其身。</p><p>在台积电的产能利用率中,8英寸相对健康,但12英寸先进制程的较低。即便代工报价并未变化,但据称私下按客户与订单规模不同,给予优惠。并且,已调低今年第一季度营收值,预计营收为167亿~175亿美元,将同比下降12.2%~16.2%;毛利率也因产能利用率及3nm初期折旧提升,预计下降到53.5%~55.5%。</p><p>或许这还只是开始。</p><p>更有报道称,由于苹果和AMD的订单减少,台积电2023年首季5/4nm工艺节点的产能利用率将降至约75%,第二季度有可能降至70%以下。作为台积电的主要营收入来源,5/4nm工艺的产能利用率在第二季度如果进一步下滑,将导致这一工艺的营收进一步降低,如果其他工艺不能有效弥补,其营收在第二季度也就可能继续环比下滑。</p><p>从2023年全年来看,台积电面临下行周期冲击,且海外投资建厂背负高昂资本支出、各项成本大增等因素也将进一步蚕食其盈利水平,台积电的毛利率也不得不打折扣,将全年毛利率回调至53%。</p><p>至于海外建厂之路,考虑到国外产业环境与商业诉求,行业人士最后表示,台积电在美国建厂是“逼不得已”,不做也得做,但欧洲建厂对台积电来说并没有太多的利好,今年产能稼动率在持续走低,后续或犹存变局。(校对 林美炳)</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 16:48:57 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385740</guid>
            <link>https://aijishu.com/a/1060000000385740</link>
        </item>
        <item>
            <title><![CDATA[比克电池最新圆柱电池专利]]></title>
            <description><![CDATA[<p>【爱集微点评】比克电池的圆柱电池专利,通过将正极多极耳、负极多极耳设置在电极组件中同侧,减少了装配工艺流程,降低生产成本。同时便于观察到焊点尺寸及形貌,降低了电池单体制程检测难度,提高异常品检出率。</p><p>集微网消息,比克电池官宣大圆柱电池项目落户常州,该项目计划总投资高达130亿元,如果未来大圆柱电池成为发展主流,那么本土产业链将因此受益。</p><p>现有圆柱锂二次电池结构采用的结构大多为极性相反的极耳从圆柱体电极组件两端引出,导致正极耳、负极耳与二次电池金属外壳进行焊接加工或其他电连接加工时需要采取不同的方案、使用不同的设备,造成装配工序的增加、工艺难度的提高和制造成本的上升。</p><p>为此,比克电池于2022年8月12日申请了一项名为“一种新型圆柱锂电池结构”的发明专利(申请号:202210967642.3),申请人为郑州比克电池有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/609808775485.0284.png" alt="image" title="image"></p><p>图1 集流构件式剖面结构示意图</p><p>图1为本专利提出的一种新型圆柱锂电池结构,壳体1为一端有底封闭,一端开口的空心圆柱型容器,一般采用镀镍钢板或不锈钢板通过冲压拉伸一体成型。</p><p>在壳体1内部设有容置腔,容置腔内放置电极组件2。电极组件2由正极极片、负极极片、隔膜卷绕而成,电极组件2的中心为中心孔14。电极组件2的上部向上引出正极多极耳4与负极多极耳3,正极多极耳4极片箔材一般采用铝箔,负极多极耳3极片箔材一般采用铜箔,通过激光模切或其他模切方式,极片边缘的未涂覆空箔区域形成间隔分布的极耳,并在卷绕后位于电极组件2的同侧且对称于中心孔14分布。使极性相同的极耳收拢、聚合在一起。</p><p>另外,电极组件2的上方设置端盖,端盖包括主体5、极柱6、绝缘构件7、密封构件8。主体5一般选用镀镍钢或不锈钢圆片,其中心开设通孔,主体接近边缘位置设有注液孔13,可以用于封口后注入电解液及开口化成。绝缘构件7包裹极柱6外圆周表面,极柱6位于通孔内,绝缘构件7密封极柱6与端盖间隙,密封构件8采用聚丙烯(PP)、聚对苯二甲酸丁二醇酯(PBT)、可溶性聚四氟乙烯(PFA)、聚苯硫醚(PPS)或其他绝缘且耐电解液腐蚀的材料注塑成型,密封主体5与壳体1上沿。壳体1的上沿向内弯折至少90°,压合密封构件8,主体5与壳体1组成密闭空间。</p><p>此外,负极多极耳3和正极多极耳4分别电连接主体5和极柱6。极柱6的横切面为工字形,极柱6的上下两部分分别将绝缘构件7压合在主体5的上下表面上。而且壳体1上设置有向内凹陷的环形的内凹槽路9,内凹槽路9位于电极组件2与密封构件8之间,其下沿紧密贴合电极组件2上端,端盖与电极组件2之间安装正极集流构件12与负极集流构件11。</p><p>简而言之,比克电池的圆柱电池专利,通过将正极多极耳、负极多极耳设置在电极组件中同侧,减少了装配工艺流程,降低生产成本。同时便于观察到焊点尺寸及形貌,降低了电池单体制程检测难度,提高异常品检出率。</p><p>比克电池早在2005年就在深圳成立了,其核心业务包括消费数码电池、动力电池以及电池回收。其中比克电池在动力电池领域的应用范围遍布全系车型,服务全球十余家一线汽车制造商。而且自从21年发布全极耳大圆柱电池至今,比克电池已经在该领域持续领先。</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 16:48:57 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385788</guid>
            <link>https://aijishu.com/a/1060000000385788</link>
        </item>
        <item>
            <title><![CDATA[一手、二手设备进口同步承压,光刻机自立自强该如何破题?]]></title>
            <description><![CDATA[<p>集微网消息,对华先进半导体制造设备的管制之网,正越收越紧、越撒越广。</p><p>2月16日,美国商务部、司法部、FBI、国土安全调查局与12个州的检察官办公室联合组建出口管制执法“特别工作组”,以“打击非法行为者”并保护先进半导体制造设备等关键技术不被“民族国家对手”获取。</p><p>织密自家网眼的同时,这张瞄准先进半导体制造设备贸易的大网也已纳入日本、荷兰,外界普遍预计两国将看齐美商务部去年10月7日新规。</p><p>正如中国半导体行业协会严正声明所述,此举如果成为现实,将对中国半导体产业造成巨大伤害。</p><p>作为半导体制造设备中公认“最短的短板”,光刻机再次成为各界关注这一问题的焦点,不过遍观行业内外当前堪称汗牛充栋的讨论,在“要做什么”(What)的层面往往过于宏观、流于务虚,对“怎样去做”(How)更甚少着墨。</p><p>比设备禁运更巨大的威胁是什么?</p><p>回顾去年10月7日以来的不少“专家”观点,往往对美国当局的政策影响和“后手”布局预期不足,以至于在一步紧似一步的快节奏地缘因素变化中,颇有“今日割五城,明日割十城,然后得一夕安寝。起视四境,而秦兵又至矣”的被动感。</p><p>按照目前推测,日本、荷兰光刻机对华出口管制标准将是能否实现28纳米以下产品制造。部分高端DUV浸没式光刻机如ASML NXT:2050i,由于具备通过多次曝光等工艺增强方法制造7纳米、甚至5纳米先进制程产品的技术潜力,因此尽管其良率、精度上都无法与EUV光刻机媲美,但此次恐怕将很难幸免于管制罗网。</p><p>ASML财报预计,荷兰管制新规起草生效将需要“很多个月”(many months),因此在2023年内不会产生实质性影响,但这绝不意味着能够喘口气,歇歇脚。这一新规对光刻机的限制是否会涵盖相应零配件和运维服务,目前仍有相当大不确定性,需要引起国内高度关注。</p><p>作为技术复杂度极高的设备,光刻机使用过程中需要持续、高强度的运维保障,如定期针对光学镜头磨损进行像差、焦距的调整;不定期更新定标、校正、运动控制的大量软件算法;或根据晶圆厂工艺技术研发需求协助改装升级产品,提升产量或分辨率。</p><p>以ASML为例,这家“光刻巨人”配备超过9000人的客户支持团队,在中国、韩国等客户密集区域就近设有维修厂站,2022年服务板块收入就达到了57亿欧元。深入晶圆制造一线的现场工程师团队,也如同毛细血管一样,源源不断将基础数据与knowhow反馈给公司研发部门,为新产品迭代建立了坚实基础。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/600664647912.70261374332161306.1428.png" alt="image" title="image"></p><p>正因如此,假如ASML等厂商被迫停止对特定型号浸没式光刻机的运维支持,即便相关设备已经“抢购”、“抢运”到位,后续的技术升级乃至基础运维也有巨大的不确定性。有近二十年半导体厂设备材料实务经验的工程师杜元贺向集微网表示,没有原厂支持,光刻机部分软件功能将无法更新升级,而如果说软件受限还能勉强“凑合”,一旦出现大的故障,专用备件又该从何而来?</p><p>外界有观点认为,目前东亚、东南亚区域的二手半导体设备流通网络可以解决这一问题,然而在美国当局将组建“特别工作组”强化执行的情况下,这一网络的可靠性面临考验。事实上,2012年、2014年,就先后有两位中国公民因万机仪器(MKS Instruments)敏感设备转售伊朗,而遭美国执法部门海外诱捕,其中一位还是MKS中国分支机构销售经理。值得一提的是,MKS也同样是ASML的重要上游供应商,从这一案例,不难窥见美国一旦“认真起来”,对敏感技术海外地下市场流通的控制力。</p><p>更进一步展望,杜工向集微网指出,在尝到甜头后,美国当局或许会越来越激进地将光刻机等关键核心半导体设备“武器化”:“这就是高悬在我国半导体事业上的达摩克里斯之剑。随时都有可能对我进行封锁禁运,如果参照俄乌冲突,我们有任何一个地方忤逆或者没有按照美国的意愿行事,这个达摩克里斯之剑随时都会砸到我们的头上。何止DUV光刻机,哪怕美国,日本,荷兰I线光刻机,包括二手光刻机禁运,我们也将十分被动。”<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/998220003584.1417400574149634.22784.png" alt="image" title="image"></p><p>此外,在光刻工艺量测设备领域,ASML与KLA也具有垄断性优势。在KLA业已受限的情况下,ASML量测设备接着断供,影响或将向成熟制程领域进一步扩散。</p><p>破解卡脖子难关,航发带来的启示</p><p>短期来看,在日本、荷兰设备出口新规出台前,抓紧机会超量采购是国内下游厂商的当务之急。放眼长远,光刻机等关键半导体设备的自立自强无疑是必由之路。除了胜利,我们别无选择。</p><p>不过在当下,怎样实现光刻机的自立自强,舆论场上存在着相当明显的分歧。尽管多数有识之士呼吁依靠新型举国体制突围,但也有难以忽视的声音认为,过多的产业政策干预很难起到设想的作用,国产光刻机在前道制程环节的应用现状,是其核心论据。</p><p>客观地说,我国高端光刻机研发与产业化现状,的确与当下的应用急需存在一定落差,例如科技部2017年印发的《“十三五”先进制造技术领域科技创新专项规划》明确提出,光刻机及核心部件领域应实现“研制28纳米浸没式光刻机产品,进入大生产线考核;开展配套光学系统、双工件台等核心部件产品研发,并集成到整机。”</p><p>为什么历经02专项和“大基金”十余年接力,光刻机的进展依然不尽如人意?围绕这一问题,众多所谓“专家”开出了令人眼花缭乱的“诊断”和“药方”,却少有人实际梳理过相关投入情况。</p><p>事实上,回望02专项启动之初的2009年,该重大专项面向全国广泛征集项目,经过严格的筛选及“三评两审”立项程序,拟启动54个项目,其中装备整机15项、成套工艺11项、关键材料9项、关键技术与零部件11项、前瞻性研究等8项。</p><p>以上所有项目,总投资180多亿元人民币,其中光刻机能够分到多大的蛋糕不难想象,而同在2009年,ASML单年的研发投入就达到约45亿元人民币,这还是该公司遭遇产业寒冬,大幅削减研发经费的结果。</p><p>与菲薄的投入相比,我国光刻机乃至更广泛半导体制程设备的自主研发能够达到目前的进展,可以说已经堪称“奇迹”。不可否认,在02专项和“大基金”的具体推进中,也存在一些不足,杜工就谈到,国内在光刻机研发上“有点急功近利,走没有学会就想学跑。结果企业的发展就是基础不牢地动山摇。光刻机慢工出细活,那点投资杯水车薪,指望一个公司能做通光刻机全产业链是不可能的”。</p><p>对高技术复杂度产品研发规律认识不足,并非当时半导体领域所独有,事实上,今天已经彻底摆脱“卡脖子”痛楚的我国军用航空发动机,十多年前同样存在类似痼疾,以至于行业泰斗感言:“墨守单纯‘解决有无’理念,不尊重科学规律,反而阻碍发动机技术发展。事实证明,材料尚未研究成功,抗疲劳技术尚未研究,使关键基础构件成为无源之水。未研究关键基础构件就装配发动机,使发动机成为无本之木。在型号研制中‘材料、工艺攻关’、‘型号带材料’、‘型号带制造’、‘设计牵头材料、制造技术’等不科学理念和急于求成、急功近利的方法不仅研制周期较国外长,各种风险集中在型号上。”</p><p>我国航空工业之所以能够突破军用航发这一同样多学科高度综合的现代制造业结晶,关键在于咬牙吃劲的关头能够克服走捷径的诱惑,果断改变通过试验验证,基于研仿原型逐次修改的传统研制方法,咬牙走通了一个突破单项关键技术-部件验证-核心机-验证机-型号研制的完整过程,打破了0和1之间的反复循环,打开了从10到100的迭代空间。</p><p>以此观之,我国光刻机自立自强,或许也应真正经历一场关键机型完整的正向研发“洗礼”。</p><p>杜工也向集微网表示,光刻机的研发应该先学会走路,再学会跑步,与其被美国制裁指挥棒调动,疲于追赶EUV、先进DUV风口,不妨从基础的KrF乃至I线光刻机扎扎实实吃透,真正建立起技术和系统的迭代基础,而这一过程,正是新型举国体制大有作为的舞台。</p><p>他同样以军工领域两弹一星为例,指出类似中央专委、国防科工委等高层级专责机构在重大科技攻关中必不可少:“国家不仅仅应该规划光刻机研发的结果,更必须亲历亲为管理过程,单靠一家企业‘揭榜挂帅’,坐等到点验收,不适合光刻机这样高度复杂的系统,必须要协调全产业链,集中攻关突破,对于光刻机的重要零部件和系统集成,应该国家有统一的协调调度,大学科研院所,国有民营公司都要参与进来,发挥各自的优势做关键零部件,然后由有实力的公司进行系统协调,先打通上下游供应链,再系统集成。”</p><p>结语</p><p>面对拍向半导体产业链的“惊涛骇浪”,我们已无需再抱有过多侥幸、缅怀和幻想,光刻机为代表的关键核心装备自立自强,是对外部霸凌的最有力回答。</p><p>已然化身科技自立自强进程“试金石”的光刻机,当下无疑承载了太多应有或不应有、合理或不合理的焦虑指点,但从另一个角度看,这样的喧嚣,恰恰也折射出全社会对技术进步的渴望和期待,这样的志气和心气在,终将推动我们不屈不挠地抵达胜利彼岸。</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 16:48:57 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385768</guid>
            <link>https://aijishu.com/a/1060000000385768</link>
        </item>
        <item>
            <title><![CDATA[极海如何做到后视镜“丝滑”调控?]]></title>
            <description><![CDATA[<p>【爱集微点评】极海的后视镜调节专利,通过提供方向盘域控制器、行驶域控制器、后视镜控制器以及后视镜电机等设备,使其能够根据方向盘角度信号和车辆速度信号对后视镜进行连续调控。</p><p>集微网消息,近日极海推出性能高、存储强、连接广的车规级MCU,其实随着汽车电子的多样性发展,极海在汽车电子领域已经为用户展现了众多技术实力,其中就包括车辆相关芯片。</p><p>目前,车辆的后视镜调节技术通常是通过采集车辆的角度信息、全球定位系统(Global Positioning System,GPS)接收器信息和地图信息等进行后视镜的自动控制,需要获取的信息冗余,设计复杂。实际使用中,由于变道的转向角不同,视野存在差异且随着转向过程中盲区也是不断发生变化,因此无法实现对后视镜的连续调控。</p><p>为此,极海于2021年11月24日申请了一项名为“后视镜调节系统、方法和微处理芯片”的发明专利(申请号:202111410716.5),申请人为珠海极海半导体有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1124881063527.1484.png" alt="image" title="image"></p><p>图1 后视镜调节系统的结构示意图</p><p>图1为本专利提出的一种后视镜调节系统的结构示意图,后视镜调节系统10所包含的模块如上图所示。其中,方向盘角度传感器11和车辆速度传感器12分别用于采集车辆的方向盘角度信号、车辆速度信号。方向盘域控制器13可以用来接收方向盘角度传感器11采集的方向盘角度信号,并将方向盘角度信号传递至后视镜控制器15。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1412352318357.311.png" alt="image" title="image"></p><p>图2 后视镜调节系统的具体结构示意图</p><p>图2为图1中从方向盘角度传感器到后视镜电机的示意图,方向盘域控制器13包括:A/D转换器131、中央处理器132、电源135、复位136、存储器137、第一CAN控制器138和第一CAN收发器139。</p><p>A/D转换器131用于将模拟信号的方向盘角度信号转换为数字信号的方向盘角度信号,并将转换为数字信号的方向盘角度信号发送至中央处理器122。中央处理器132用于处理数字信号的方向盘角度信号,并根据上述的方向盘角度信号生成“驱动”后视镜控制器15的处理单元151开始计时的命令信号。此外还将数字信号的方向盘角度信号传递至第一CAN控制器138,其用于将方向盘角度信号打包成CAN数据包,并将CAN数据包发送至第一CAN收发器139。第一CAN收发器139用于将CAN数据包转换为电压信号,并将电压信号发送至总线17,以使电压信号通过总线17传输至后视镜控制器15,在后视镜控制器15中可执行相关CAN数据的解包获得方向盘角度信号。</p><p>后视镜控制器15在接收到方向盘角度信号或车辆速度信号后开始计时并生成计时信息。根据方向盘角度信号、车辆速度信号和计时信息得到目标角度以及生成电机控制信号,同时将电机控制信号发送至后视镜电机16。能够优化后视镜调节的智能响应,避免意外触发后视镜转向,保证行驶安全。</p><p>简而言之,极海的后视镜调节专利,通过提供方向盘域控制器、行驶域控制器、后视镜控制器以及后视镜电机等设备,使其能够根据方向盘角度信号和车辆速度信号对后视镜进行连续调控。</p><p>极海是一家致力于开发工业级/车规级微控制器、高性能模拟芯片及系统级芯片的集成电路设计型企业,其团队拥有多年集成电路设计经验和嵌入式系统开发能力。极海在科技创新中持续投入了大量的精力,不断加速产业升级,为广大用户带来更优质的产品及方案。</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 16:48:57 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385764</guid>
            <link>https://aijishu.com/a/1060000000385764</link>
        </item>
        <item>
            <title><![CDATA[一线机构纷纷出手,国产线控底盘加速突围]]></title>
            <description><![CDATA[<p>集微网报道 (文/王丽英) 如果说电动化是新能源汽车变革的上半场,那么智能化无疑将是下半场变革的核心。作为汽车智能化的终极目标-自动驾驶要想落地实施,线控底盘是其中离不开的一项关键技术。</p><p>最近,一则小米子公司投资线控底盘企业千顾科技的消息引发热议,毕竟,小米造车正在关键推进期,围绕汽车领域的一举一动自然备受关注,事实上,小米产投在去年就曾领投同为线控底盘企业的同驭汽车。</p><p>除小米产投外,其他一些头部投资机构也纷纷出手线控底盘领域,多家创业企业都拿到了不菲的融资,线控底盘技术上车有望迎来加速期。</p><p>自动驾驶的基石,渗透率有望快速提升</p><p>在新的电子电气架构下,汽车执行系统同步发生变革,底盘系统逐步走向智能化、线控化。</p><p>汽车线控底盘主要由线控转向、线控制动、线控驱动(包含线控换挡、线控油门)和线控悬架(例如,线控空气悬架)四部分组成。线控底盘使用电信号取代传统的机械、液压或气动等形式来实现车辆的转向、制动和前进等操控。相比传统底盘,线控底盘可以实现对执行机构高效、精准的主动控制,是实现自动驾驶的基石。</p><p>从目前的装车量来看,这四部分中,线控油门技术已较为成熟,渗透率接近 100%;线控换挡技术难度较小,目前渗透率也比较高;线控制动与线控悬架技术部分已相对成熟,但装配率较低;线控转向技术仍处于发展中,渗透率极低。</p><p>线控制动是线控底盘的核心,技术难度高。它可实现底盘与车身之间的解耦,更好地适配L3级别以上智能驾驶方案。预计随着高级别自动驾驶车型渗透率不断提升,线控制动有望实现新的增长点。</p><p>根据传输介质的不同,线控制动系统可分为电子液压制动系统(EHB)和电子机械制动系统(EMB)。相较于EHB,EMB 完全摒弃了传统制动系统的制动液及液压管路等部件,是真正意义上的线控制动系统,但目前技术成熟度还有待提升。</p><p>线控空气悬架是底盘智能化的重要组成部分,可显著提高汽车操纵性和舒适性,在燃油车时代,是高端车型的豪华选项配置。对于电动汽车,线控空气悬架不仅提升驾乘体验,还有助于底盘轻量化,减少能耗提高续航里程,成为众多品牌追求的配置亮点。目前蔚来、理想、小鹏、东风、吉利、红旗、上汽大众均已推出配备或可选配空气悬架的车型。</p><p>作为自动驾驶的执行机构,线控底盘的性能好坏将直接影响自动驾驶的使用效果和安全性能。随着自动驾驶向更高级别发展,对感知层、决策层、执行层都提出了更高的要求,要进一步满足响应快、延迟低、精度高等要求。线控底盘通过电信号传导可以实现对执行机构高效、精准的主动控制,实现快速响应,有望替代传统底盘加速上车。</p><p>机构预测,2025年我国线控制动渗透率有望达30%以上,市场规模或达200亿元,2022~2025 年年复合增长率43%;2025年我国空气悬架市场有望达331亿元,2022~2025 年年复合增长率69%。</p><p>机构纷纷出手,国产力量加速突围</p><p>全球线控底盘市场多年来主要由国际Tier 1 厂商垄断,例如,博世、大陆集团、采埃孚、日立等,其中,在线控制动领域,博世的市占率更是超过90%。头部企业在技术研发、市场等方面掌握主要话语权,对本土OEM的开放度较低,导致国内线控底盘技术整体发展缓慢。</p><p>随着燃油车向新能源汽车的转型,传统汽车供应链体系正在被打破。尤其是过去两年汽车缺芯事件,推动了国内汽车供应链的自主建设,缺芯使得国内整车企业更重视供应链的安全可控。把握难得的供应链切入窗口期,国内多个线控底盘厂商获得知名整车厂定点,国产线控底盘企业在逐渐崛起。</p><p>例如,线控制动领域有拿森科技 英创汇智、同驭汽车、伯特利、比亚迪 、利氪科技、精工底盘、亚太股份、千顾科技等,线控空气悬架领域有保隆科技、中鼎股份、拓普集团等。</p><p>资本的嗅觉最敏锐,面对中国在新能源汽车市场产销量NO.1的强大市场背景,线控底盘市场呈现出了诱人的增量应用前景,头部机构纷纷出手,同时,线控底盘赛道涌现出了多家本土创业企业,并获得融资。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/702124138724.4385646038517716.1816.png" alt="image" title="image"></p><p>2021年12月,成立于2016年的拿森科技宣布完成5亿元的C轮融资,由中银投资、宁德时代、国投招商、高瓴创投等联合领投,将持续加强线控底盘的新产品开发、产业化以及客户服务能力,实现配套量产规模增长;2022年3月,同样成立于2016年的同驭科技完成由小米产投与东风交银联合领投的近2亿元A+轮融资,将助力其线控底盘新技术与新产品的开发投入、新产能建设。其后,线控底盘领域的初创企业融资接续而来,格陆博、利氪科技、千顾科技、英创汇智、比博斯特、时驾科技、济驭科技等先后拿到产业头部机构的投资。</p><p>尽管有资本护航,又面临应用爆发的黄金时期,但国内的线控底盘企业仍挑战重重。</p><p>业内人士指出,线控底盘整体渗透率不高,作为自动驾驶的关键基础,安全性要求苛刻,特别是线控制动技术门槛颇高,国产化率水平极低,国内厂商基本处于从0 到1的发展阶段,亟待整体性能提升,整车企业提供试用上车机会也非常关键。</p><p>与此同时,线控底盘行业需要发展出一套统一的行业基准。目前,不同品牌、不同车型底盘性能各不相同,各机构和厂家对线控底盘的评价指标和评价方法各不相同,在自动驾驶系统量产过程中,需要针对不同性能车型进行重复适配开发,造成资源浪费。</p><p>在汽车供应链自主可控的大趋势下,以及汽车智能化发展不断向L3等高级别自动驾驶系统升级推进下,国内线控底盘企业唯有以产品技术作为突发点,打破原有线控底盘核心技术壁垒,赢得整车企业及市场认可,才能逐步建立起国产化线控底盘的技术护城河,在这一新兴蓝海市场中获得主导权。</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 16:48:57 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385760</guid>
            <link>https://aijishu.com/a/1060000000385760</link>
        </item>
        <item>
            <title><![CDATA[本源量子提出量子计算任务异常发现方法]]></title>
            <description><![CDATA[<p>【爱集微点评】本源量子的量子计算机专利,通过提出的量子计算机架构使得在量子计算任务的执行过程中及时发现异常,有效提高了量子计算机执行量子计算任务的效率。</p><p>集微网消息,本源量子作为中国第一家量子计算公司,一直钻研量子相关技术,近日中国最新量子计算机“悟空”即将在这里诞生。</p><p>量子计算机与经典计算机一样,其核心都是为了解决某种问题而进行的数学计算。在量子计算机执行量子计算任务时,在各个阶段均有可能会出现异常情况,现有技术中判断量子计算机运行过程中是否出现异常时需要人工参与,且只能在量子计算任务的执行结果出现错误时才能发现,效率极低。目前在量子芯片中量子比特位数不多的情况下,采用现有的方案尚能勉强支持,但是随着量子技术的不断研究,在可预期的未来,必然会出现大规模甚至超大规模的量子芯片,届时需要解决的量子计算任务肯定会更加复杂。与之对应地,量子计算机需要面临的异常情况也将更加频繁且复杂。如果还是按照现有的技术方案,那么量子计算机在执行量子计算任务时的效率将会极低。</p><p>为此,本源量子于2022年2月28日申请了一项名为“量子计算机”的发明专利(申请号:202210191402.9),申请人为合肥本源量子计算科技有限责任公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1569703232406.8203.png" alt="image" title="image"><br>图1 量子计算机的结构示意图</p><p>图1为本专利提出的一种量子计算机的结构示意图,主要包括量子计算任务接收设备100、编译设备200、量子控制设备300、量子处理器400以及与编译模块和量子控制设备300通信连接的监控设备500。</p><p>其中量子计算任务接收设备100被配置为接受量子计算任务,编译设备200可以对量子计算任务进行编译处理,并输出对应的任务数据包。量子控制设备300和量子处理器400分别用于对当前任务数据包输出相应的调控信号以及执行量子计算任务。而监控设备500可以对编译设备200和量子控制设备300进行状态监控并分析编译设备200和/量子控制设备300是否发生异常情况。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/235340009981.79117.png" alt="image" title="image"></p><p>图2 量子计算机监控设备的结构示意图</p><p>图2为量子计算机监控设备具体的结构示意图,监控设备主要包括信息采集模块501、异常判断模块502、异常类型辨别模块503、异常存储模块504、异常更新模块505以及异常处理模块506。</p><p>其中,信息采集模块501和异常判断模块502分别从编译设备200/量子控制设备300中获取编译处理以及调控信号的第一相关信息,并判断是否发生异常情况。异常类型辨别模块503在得到异常判断模块502的结果后用于分辨具体的异常类型(硬件异常和软件异常)。异常存储模块504会预先存储设置的异常情况以及对应的异常类型,而异常更新模块505则对该存储数据进行更新,以便在后面碰到相同问题时可以及时辨别以及处理。最后,异常处理模块506会对相应的异常进行处理,解决策略包括重新启动编译设备200或对量子控制设备300进行复位等。</p><p>简而言之,本源量子的量子计算机专利,通过提出的量子计算机架构使得在量子计算任务的执行过程中及时发现异常,有效提高了量子计算机执行量子计算任务的效率。</p><p>本源量子是国内量子计算龙头企业,聚焦于量子计算产业生态建设,打造自主可控工程化量子计算机,积极推动量子计算产业落地,并探索量子计算产业应用。随着量子计算成果的逐渐推进,相信在不久将来,本源量子一定可以实现“让量子计算走出实验室,真正为人类服务”这一宗旨。</p>
                                                    ]]></description>
            <pubDate>Sun, 19 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385458</guid>
            <link>https://aijishu.com/a/1060000000385458</link>
        </item>
        <item>
            <title><![CDATA[小鹏汽车减少充电桩终端器件的损耗]]></title>
            <description><![CDATA[<p>【爱集微点评】小鹏汽车的充电桩专利,在充电枪供电或断电的切换过程中,摒弃了纯终端实现的方式,而是采用主机开启或关闭供电,实现了对于充电枪供电和断电的切换过程中减少终端器件损耗的效果。</p><p>集微网消息,据统计超过九成的充电桩生产企业近日已经复工了,今年充电桩在生产淡季产量仍迎来突破,随着新能源汽车销量的不断增长,充电桩的需求水涨船高。</p><p>随着新能源的不断发展,充电桩也正在不断的增设中。现有的充电桩主要由两部分组成,一部分是用于控制充电枪的充电控制结构,通常习惯于称之为终端,另一部分是用于对输入电源进行整流的整流控制结构称为主机。充电桩的使用过程中会存在供电和断电的切换,例如断电切换包括带电拔枪或出现异常断开等情况,此时需要迅速切断提供给充电枪的电能,传统技术中往往是在通流状态下直接关断充电控制结构一侧的接触器,该方式较为简单快速,但是长期使用该方式进行切换容易造成充电控制结构一侧的接触器主触点粘连,此时非但达不到切断电能的目的还具备一定的危险性,而且还加快了充电控制结构一侧的接触器损耗速度,增加运维成本的问题。</p><p>为此,小鹏汽车于2022年6月27日申请了一项名为“充电桩控制系统、充电桩及充电桩系统”的发明专利(申请号:202210744552.8),申请人为广州小鹏汽车科技有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/440317574971.7564.png" alt="image" title="image"></p><p>图1 充电桩控制系统的结构示意图</p><p>图1为本专利提出的一种充电桩控制系统的结构示意图,主要包括主机2和一个或多个终端1,终端1与主机2设于不同柜体内。其中终端1用于检测充电枪的状态信息,基于状态信息生成第一控制指令,并将第一控制指令发送至主机2。主机2包括一个或多个供电模块21,供电模块21用于为充电枪提供电能,而主机2基于第一控制指令控制对应的供电模块21的开启或关闭。</p><p>在实际使用时,上面场景主要应用于分体式的直流充电桩,主机2主要起到与电网连接将电网的交流电转换为直流电的作用,并将转换后的电源输送至终端1;而终端1则主要起到与充电枪连接的作用,例如终端1通过获取充电枪是否与电动汽车进行连接、用户是否对终端1进行充电操作如扫码或刷卡等信息,确定需要为充电枪进行供电或者断电。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1087328373158.4751.png" alt="image" title="image"></p><p>图2 充电桩控制系统的使用场景示意图</p><p>图2为充电桩控制系统的使用场景示意图,当充电枪4从电动汽车5上拔出时,此时终端1检测到充电枪4的状态信息为充电枪4与电动汽车5断开连接的电信号,因此生成需要关闭供电的第一控制指令,并将关闭供电的第一控制指令发送至主机2。主机2接收到关闭供电的第一控制指令时,基于第一控制指令确定为该充电枪4供电的一个供电模块21,并关闭该供电模块21,以此实现通过主机2断开充电枪4电流的效果。最后在终端1检测到无供电模块21的电流输出时,则关闭终端1用于控制充电枪4的开关元件如接触器进行断开,以此起到了开关元件在无电流的情况下进行闭合,大大减低了开关元件的损耗。</p><p>简而言之,小鹏汽车的充电桩专利,在充电枪供电或断电的切换过程中,摒弃了纯终端实现的方式,而是采用主机开启或关闭供电,实现了对于充电枪供电和断电的切换过程中减少终端器件损耗的效果。</p><p>作为一家专注未来出行的科技公司,小鹏汽车自成立的7年多以来,在国内、北美等地均设立研发中心,完成了全球化布局。同时坚持以开放包容的态度,吸纳全球各界人才,现在已经成为国内领先的智能电动汽车公司之一。相信在未来,小鹏可以在智能电车领域中取得更多硕果。</p>
                                                    ]]></description>
            <pubDate>Sun, 19 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385445</guid>
            <link>https://aijishu.com/a/1060000000385445</link>
        </item>
        <item>
            <title><![CDATA[普莱信智能提高芯片封装效率和精度]]></title>
            <description><![CDATA[<p>【爱集微点评】普莱信智能的芯片封装专利,通过对点位轨迹速度曲线进行优化调节,降低总运动时间。同时限制允许激起能量强度值,能够提高芯片封装效率、防止速度规划超调、提高芯片封装控制的精度。</p><p>集微网消息,普莱信智能深耕半导体封装领域多年,近日,普莱信智能从15737家广东省创新型中小企业中脱颖而出,荣获广东省“专精特新”中小企业。</p><p>随着集成电路产业的快速发展和芯片制造工艺的不断提高,小型化、多引脚、细间距的芯片对其封装设备高加速运动系统的响应能力、定位精度、定位时间等伺服性能提出了更高的要求。芯片封装的快速高精度定位要求主要通过加速度、定位精度和运行时间三个方面的参数进行体现。但是,由于芯片封装控制系统具有短行程高加速高速高精度定位的特点,且位移相对固定,现有技术方案难以发挥作用。因此,亟需一种用于芯片封装控制的速度规划方法,以提高芯片封装精度、降低所需时间。</p><p>为此,普莱信智能于2021年4月7日申请了一项名为“芯片封装控制的速度规划方法及芯片封装控制装置”的发明专利(申请号:202110373352.1),申请人为东莞普莱信智能技术有限公司。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1279684058249.9426.png" alt="image" title="image"></p><p>图1 芯片封装控制的速度规划方法示意图</p><p>图1为本专利提出的一种芯片封装控制的速度规划方法示意图,封装控制的点位轨迹速度曲线为非对称S曲线,点位的运动通过轴电机驱动。其中非对称S曲线按加减速特征划分为七个运行阶段:加加速段0T1、匀加速段T1T2、减加速段T2T3、匀速段T3T4、加减速段T4T5、匀减速段T5T6和减减速段T6T7。</p><p>实现的具体规划方法如下,首先设定插补周期、启动端插补周期数量、停止端插补周期数量、允许激起能量强度值、调节变化率上限、速度修改分辨率、加速度修改分辨率。根据如图1所示的各个参数间关系,设定初始速度Vs、结束速度Ve、最大速度Vmax、最大加速度A、最大减速度D、加加速度Ja、减加速度Jd、位移值S。</p><p>之后通过Vs、Vmax、A、D、Ja、Jd、S,计算点位轨迹速度曲线,获取总运动时间Tb;若是首次计算Tb,使Ta=Tb。接着根据插补周期、启动端插补周期数量、点位轨迹速度曲线,计算启动端各单个插补周期设备运行速度频率所激起的能量强度。然后计算得到各个插补周期的能量强度之和,并判断是否大于允许激起能量强度值,最后根据两者大小以及Ta、Tb的值对相关参数进行调节。</p><p>比如当能量强度之和大于允许激起能量强度值时对A、D、Ja、Jd进行优化调节,直至能量强度之和小于允许激起能量强度值,从而抑制芯片封装系统中轴电机的震动造成的残余振动,提高芯片封装控制的精度。此外,还可以调节A、D、Ja、Jd使总运动时间Tb减小,从而提高芯片封装效率。同时通过速度修改分辨率、加速度修改分辨率约束A、D、Ja、Jd的调节幅度,以此控制参数调节结果的变化率,防止速度规划超调。</p><p>简而言之,普莱信智能的芯片封装专利,通过对点位轨迹速度曲线进行优化调节,降低总运动时间。同时限制允许激起能量强度值,能够提高芯片封装效率、防止速度规划超调、提高芯片封装控制的精度。</p><p>普莱信智能在创立之初,就汇聚了运动控制、算法、机器视觉、直线电机、半导体设备和自动化设备领域的资深人士,希望在未来,普莱信智能可以继续通过国际级的先进技术来提高国内制造业水平,最终助力实现中国制造的智能化升级。</p>
                                                    ]]></description>
            <pubDate>Thu, 16 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385153</guid>
            <link>https://aijishu.com/a/1060000000385153</link>
        </item>
        <item>
            <title><![CDATA[PA去库存临近尾声 2023或成模组化元年]]></title>
            <description><![CDATA[<p>集微网报道(文/王小方) 阴云笼聚于上空,一道期待已久的曙光终于浮现眼前。据供应链消息,在经历了近一年半库存去化阶段后,随着智能手机厂商2022年囤积的PA库存不断出清,库存去化已逐渐步入尾声,并有望于今年Q1或Q2正式完结。</p><p>预计2023年伴随着终端厂商库存去化及消费者预期转好,智能手机等消费电子终端需求将逐步复苏。不过,由于需求端尚未产生十分明朗的复苏信号,PA厂商在短期内的压力依旧很大,它们既要应对当下的内卷困局,也需要瞄准未来的市场机会抢先下注。</p><p>5G仍是最强增长动能</p><p>对国内PA厂商而言,深陷长达一年半的库存去化周期,着实是一段备受煎熬的日子。不过,想要真正理解这一漫长的库存去化周期,还得追溯前因。</p><p>据IDC发布的数据显示,2020年全球智能手机市场出货量为12.92亿台,同比下跌5.9%。进入2021年后显露出些许回温势头,智能手机市场似乎已经从“黑暗期”中走出,再加上华为遭受美方制裁,释放出大块市场份额,各大手机厂商自然想要抓住这一难得契机,在2021年下半年间纷纷超额下单、致使库存水位快速上涨。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1284795508459.52441587226810157.241.png" alt="image" title="image"></p><p>图 集微网整理(数据来源 IDC)</p><p>由此可见,后来的库存积压与此前的“囤货潮”有着密切关联,根本原因在于彼时手机厂商对市场预期过于乐观,不曾料想仅数月后便转入库存调整期。而后在俄乌战争、通货膨胀、加息等因素的影响下,用户的消费需求进一步萎缩,库存去化不得不拉长战线。为了缓解库存压力,手机厂商也不得不减缓线下渠道的扩张节奏,追求更稳健的渠道布局。</p><p>在下游吃紧的形势下,寒气早已弥散至产业链各大环节。从代工方面看,受手机厂商库存去化影响,在2022年里稳懋、宏捷科、全新等上游砷化镓代工厂的产能利用率一再下滑,营收都跌至近年来的最低点。据一位业界资深人士透露,目前砷化镓代工产能存在一定程度过剩,几大头部厂商的平均产能利用率估计还不到60%。不过,砷化镓的富余产能可能会逐渐用于高性能滤波器、氮化镓等第三代半半导体的开发和规模化生产。</p><p>据IDC于不久前披露的数据显示,2022年全球智能手机出货量同比下降11.3%至12.1亿台,创下2013年以来的最低年度出货量。就国内市场而言,2022年中国智能手机市场出货量约为2.86亿台,同比下降13.2%。不过,IDC认为2023年销量将会出现反弹,预计2023年全球智能手机出货量达12.7亿部,同比增长2.8%。</p><p>“就国内一月的增长情况看还是不错的,智能手机的销量每周都在攀升,这可能源自疫情放开后报复性的消费反弹,最终全年销量有望超乎先前预期。总体而言,今年国内智能手机市场最终销量小幅上涨的概率是比较大的,但全球市场的情况则没有这么乐观。”爱集微咨询业务部副总赵翼说道。</p><p>即便面临库存积压和需求不振的挑战,但5G带来的巨大市场机会并未消退。同时,5G也给设计带来了不小的挑战,射频前端的采购流程、系统设计的复杂度都大幅提升,射频前端方案也在加快由分立射频元件向整合型模组化方向演变。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1022597149254.901346882222080.9907.png" alt="image" title="image"></p><p>图 集微网整理(数据来源 IDC)</p><p>就长期趋势而言,在5G的牵引下,国产射频前端向高端化、模组化突破的大方向不会动摇。本月初,据中国台湾省媒体报道,联发科和高通均决定不再推出新4G手机芯片,这反映出国际厂商主推5G、退出4G的决心,将导致5G总体市场份额增加,也将推动相关厂商增加对5G PA的布局。</p><p>目前,国内智能手机市场已初步显现回暖迹象,但由于这一观察时间区段较短,如果增长势头能持续到2023年Q1末,整个市场止跌回升的概率将大幅增加,届时产业链对于市场复苏的信心也将明显回升。</p><p>2023年有望成为PA模组化元年</p><p>就长期发展而言,射频前端行业在2022年出现的波动是暂时的,大趋势仍将是产业的长期增势。目前,去库存阶段已经逐渐不再是问题,在通货膨胀的背景下,需求端何时真正复苏才是当下业界真正关心的问题。</p><p>“目前,在国内射频前端产业中,头部PA厂商具有明显的规模效应优势,有了4G上的积累,相信5G也将是国产公司的天下。”赵翼进一步指出,“接下来,对射频前端的资源整合能力将更加凸显,能不能做好PA与滤波器之间的融合,将是PA公司制胜的关键。此外,在库存压力逐步缓解和疫情政策放开的双重刺激下,头部PA公司的产值预计将稳定增长。”</p><p>盛世投资管理合伙人、盛世智达总经理陈立志认为,国内PA厂商正逐步向高端产品市场迈进,呈现出高度集成化的趋势,模组化和射频前端全覆盖成为主力方向。长远来看,国内PA领域具有马太效应,龙头厂商与其他厂商的差距将会越来越大,行业有望迎来并购、合作的潮流。</p><p>从投融资方面看,随着资本市场逐渐趋于理性,对芯片设计公司的投资趋于谨慎,初创公司融资愈加困难,加上PA产能过剩导致的竞争加剧,面临较高的洗牌风险,正在加速市场出清;另一方面,头部PA厂商纷纷冲刺IPO,追求更高层次的发展,整个行业将逐渐淡出价格战,行业竞争将逐渐进入相对合理的阶段。</p><p>一位业界资深人士表示,随着PA厂商在高集成度模组产品上不断取得突破,2023年有望成为中国PA公司的模组化元年。目前,对于当前的内卷局面,PA厂商应该从设计层面下功夫,通过新颖的设计降低成本,为客户提供更具性价比的产品方案,这样才能既保障自身的毛利率,又能给客户带来更好的成本优势,而不是靠融资去补贴客户,从而将行业拉入内卷的泥淖。</p><p>目前,大多数国内PA厂商几乎全部收入都来自于手机业务,而国际巨头厂商非手机业务收入占比较高,如Skyworks的非手机业务收入占比在2022年已达36%。因此,对于国内PA厂商而言,还需在手机之外开拓更多市场,丰富产品线并进一步提升竞争力,寻找新的增长点。</p><p>陈立志认为,虽然不免受到行业内卷与市场需求低迷的直接影响,但对于国内PA厂商而言,机遇与挑战并存,一方面在5G基站、AIoT、可穿戴设备、汽车电子等方面,对于高端化、集成化PA产品的需求持续旺盛;另一方面,受国际局势影响,下游客户对于国产替代的意愿十分强烈。</p><p>“近年来,国际局势愈加扑朔迷离,贸易摩擦和专利冲突增加,这要求国内厂商提高知识产权保护意识,加快建设知识产权体系。”陈立志还特别提及。</p><p>就产业发展趋势而言,随着手机厂商逐渐走出库存去化周期,5G依旧会带来巨大的成长机会,模组化的突破也逐渐显露成效,国产射频前端的成长步伐不会减慢。</p>
                                                    ]]></description>
            <pubDate>Thu, 16 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385145</guid>
            <link>https://aijishu.com/a/1060000000385145</link>
        </item>
        <item>
            <title><![CDATA[代工业亮出“家底”:狂欢之后准备过冬?]]></title>
            <description><![CDATA[<p>集微网报道(文/李映)代工业的“全家桶”在财报陆续出炉之后基本集齐,也都亮出了各自的家底。</p><p>受宏观经济下行影响,全球2022年消费电子市场需求走向疲软,而代工业可谓逆风而行,</p><p>交出了一份“普涨”的成绩单。</p><p>但要看到的是,由于终端需求反映到代工订单的滞后性,代工厂在去年第三和第四季度已在承压前行。当这一份“寒意”传导至2023年之际,眼见冲击更甚,无论是代工降价、产能稼动率降低、资本支出削减等举措频出,为今年代工业走势蒙上了阴霾。</p><p>全年营收“普涨” 但季收已现跌势</p><p>久坐“铁王座”的台积电表现依旧抢眼。2022年营收创下751亿美元的纪录,同比增长42.6%。而利润增长逾70%,同样创历史新高。以第四季度来看,台积电营收约合1386.8亿元,毛利率超过此前预期,达到62.2%,营业利润率为52.0%,毛利率和营业利率双双创新高。</p><p>作为全球代工“榜眼”的三星,尽管受多重因素影响利润暴跌90%以上,但在代工方面,上季和2022年全年营收都创新高,其利润或超过约109.79亿人民币,这一数字反映了其先进制程产能的扩大。据透露,三星全年8nm以下营收占总营收的六成。</p><p>反观英特尔虽然2022年第四季度和全年营收大幅下挫,但代工业务增势明显。2022年其代工服务同比增长14%,第四季度营收为3.19亿美元,同比增长30%。</p><p>可以说,先进工艺三雄能够在下行周期逆势增长,一方面说明凭借多年的积淀,有着较强的抗周期和风险能力,另一方面消费市场疲软对成熟制程代工冲击较大,而对先进工艺影响甚微。</p><p>围绕着成熟制程的争夺,联电、格芯、中芯国际、华虹等代工厂商也冲出了下行“风暴”,交出了飘红的答卷。2022全年度联电营收折合人民币约622.41亿元,年增30.84%;格芯2022年营收同比增长23%,为81.08亿美元。</p><p>同为国内半导体代工双雄,中芯国际2022年全年营收突破72亿美元,同比增长34%,实现2021年、2022连续两年年增幅超过三成;而华虹得益于在成熟工艺上的深耕,以及汽车芯片、功率器件等需求的大幅增长,实现全年营收达24.75亿美元,逆势增长51.8%,创下历史新高。</p><p>但受行业下行周期所致,大多数代工厂商第四季度的产能利用率已开始下探,让行业切身感受到寒潮已至。如联电晶圆出货量比前年同期减少14.8%,整体产能利用率降至90%。</p><p>毛利润“分化” 产能利用率持续下探</p><p>如果说2022年全年营收还在基本水准之上,但从毛利率变化也可看出成熟工艺与先进工艺之前仍存“落差”。</p><p>台积电的毛利率依旧维持“高位”。2022年全年毛利率高达59.6%,比2021财年的51.6%涨了8个百分点,不得不说先进工艺居功至伟。据财报显示,其16nm占比13%,7nm占比27%,5nm占比26%,总计超66%。而且有,随着台积电在3nm工艺量产在加速推进,据预计3nm及升级版3nm制程的产品将贡献台积电2023年营收的4%至6%。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1615500030471.139195447789652.77463.jpg" alt="image" title="image"></p><p>同为成熟制程工艺擂台上的竞技者,联电表现相对出色,平均毛利率增至45.1%,比去年33.8%大增一成以上,而格芯、中芯国际和华虹的毛利率则集中于30%左右,完全竞争市场的激烈度可见一斑。</p><p>而且由于各家Fab厂工艺定位、产品结构、合作客户的不同,一位业内人士表示,下行周期对于经营有年,长期致力于平台建设、制造平台多元化的代工厂的影响相对较小。</p><p>如华虹营收保持长期成长,其有竞争力的特色工艺组合功不可没,且抓住了国内汽车电子和工业电子等高成长产业,进一步提升了营收质量。而格芯第一大收入来源智能设备业绩在第四季度大幅下滑至8.23亿美元,同比、环比下降幅度分别达7%和14%,但家庭与工业物联网、通信和数据中心业务则同比大增64%和27%,汽车业务也在强劲增长,因而对冲之下业绩依旧飘红。</p><p>但代工业看似已行至“龙卷风”中心,避无可避。集微咨询认为,从业绩表现来看,代工业整体处于向上发展态势,但毛利率均有所下降,且由于终端需求变化反馈到代工的时间差,去年第三季度和第四季度已释放出了危险信号,今年第一、二季度行情不太乐观,产能利用率下滑明显,代工厂需多管齐下开源节流。</p><p>有分析称第二梯队的晶圆代工厂,12英寸产能利用率在2023年第一季度平均落在70~80%,有部分到60%;而8英寸平均落在60~70%,也有部分落在50%左右,可谓是断崖式下跌。</p><p>不得不说,产能利用率的大幅下降对营收和毛利率的冲击也是“立竿见影”。台积电率先承认,受半导体产业持续调整库存及季节性淡季的双重影响,2023年第一季度营收为167~175亿美元,将同比下降12.2%~16.2%;毛利率也因产能利用率及3nm初期折旧提升,预计下降到53.5%~55.5%。格芯也预计第一季度营收将处于18.10亿至18.50亿美元之间,毛利率降至27.1%。格芯称,产能利用率的下降同步拉低了毛利率。</p><p>多方救火 2023年上半年准备过冬</p><p>产能还是产能,看来已成为代工业的新“魔咒”。而产业共识是代工产能利用率的回升将从第二季度开始,真正回到接近满载的产能利用率要到下半年甚至是年底。</p><p>上述人士也指出,从产品结构来看,消费类如手机、笔记本电脑等还处于库存消化阶段,加之终端需求的恢复和消费信心的提振还需要时间,反映到产能利用率的提升也就需要更长的周期。</p><p>为此集微咨询建议,代工厂一方面可减少人力成本,一些企业已祭出裁员的举措;另一方面则着力降低资本支出,包括设备支出、扩产调整等。此外,可为客户提供相应的优惠价格,以维持更多的订单量。</p><p>各大代工看似已在准备“过冬”,均在谨慎调整资本支出。</p><p>台积电2023年的资本支出为320亿-360亿美元,而最初估计为400亿美元。联电也称,应对需求低迷,联电已进行严格的成本管控措施,并尽可能推迟部分资本支出。而中芯国际因着力成熟产能扩产及新厂基建,2023年的资本开支将与2022年大致持平。</p><p>此外,最近传出的代工价格降价成为这一“艰难”时期的注解。</p><p>据报道,三星、力积电、格芯等传出直接降价消息;台积电、联电、世界先进等代工价并未变化,但私下与客户协调给予优惠,以维持ASP(平均销售价格)与毛利率。由 “供不应求”到纷纷降价,代工厂商的价格战已然打响。</p><p>值得一提的是,尽管产能利用率均在降低,但3nm等先进制程的进度仍在不断推进。有分析称,台积电4/5nm甚至3nm工艺的产品仍可维持产销平衡。</p><p>无论如何,2023年上半年对于代工业来说或许真的是“凛冬已至”。</p>
                                                    ]]></description>
            <pubDate>Thu, 16 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385139</guid>
            <link>https://aijishu.com/a/1060000000385139</link>
        </item>
    </channel>
</rss>

...

docs/programming.md Outdated Show resolved Hide resolved
docs/programming.md Show resolved Hide resolved
lib/v2/aijishu/radar.js Outdated Show resolved Hide resolved
lib/v2/aijishu/radar.js Outdated Show resolved Hide resolved
lib/v2/aijishu/radar.js Outdated Show resolved Hide resolved
@github-actions
Copy link
Contributor

Successfully generated as following:

http://localhost:1200/aijishu/blog/armsoft - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[Arm服务器 - 极术社区]]></title>
        <link>https://aijishu.com/blog/armsoft</link>
        <atom:link href="http://localhost:1200/aijishu/blog/armsoft" rel="self" type="application/rss+xml" />
        <description><![CDATA[Arm服务器 - 极术社区 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 17:48:59 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[StratoVirt 的 vCPU 拓扑(SMP)]]></title>
            <description><![CDATA[<p>CPU 拓扑用来表示 CPU 在硬件层面的组合方式,本文主要讲解 CPU 拓扑中的 SMP(Symmetric Multi-Processor,对称多处理器系统)架构,CPU 拓扑还包括其他信息,比如:cache 等,这些部分会在后面进行补充。CPU 拓扑除了描述 CPU 的组成关系外,还为内核的调度器提供服务,从而提供更好的性能。在 StratoVirt 中,支持 CPU 拓扑为后续的 CPU 热插拔开发打下一个基础。</p><p>常见的 CPU SMP 结构是:</p><pre><code>Socket --&gt; die --&gt; cluster --&gt; core --&gt; thread
</code></pre><ul><li>socket:对应主板上的 CPU 插槽</li><li>die:处理器在生产过程中,从晶圆上切割下来的一个个小方块,Die 之间的组件是通过片内总线互联的。</li><li>cluster:簇,大核或者小核的一种组合</li><li>core:表示独立的物理 CPU</li><li>thread:逻辑 CPU,英特尔超线程技术引入的新概念</li></ul><h2>CPU 拓扑的获取原理</h2><p>因为 x86 和 ARM 的拓扑获取方式不同,下面将会分开进行介绍。</p><h3>x86</h3><p>在 x86 架构下面,操作系统会通过读取 CPUID 来获取 CPU 拓扑结构。在 x86 体系结构中,CPUID 指令(由 CPUID 操作码标识)是处理器补充指令(其名称源自 CPU 标识),允许软件发现处理器的细节。程序可以使用 CPUID 来确定处理器类型。</p><p>CPUID 隐式使用 EAX 寄存器来确定返回的信息的主要类别,这被称为 CPUID 叶。跟 CPU 拓扑相关的 CPUID 叶分别是:0BH 和 1FH。1FH 是 0BH 的扩展,可以用来表示更多的层级。Intel 建议先检查 1FH 是否存在,如果 1FH 存在会优先使用它。当 EAX 的值被初始化为 0BH 的时候,CPUID 会在 EAX,EBX,ECX 和 EDX 寄存器中返回 core/logical 处理器拓扑信息。这个函数(EAX=0BH)要求 ECX 同时被初始化为一个 index,这个 index 表示的是在 core 层级还是 logical processor 层级。OS 调用这个函数是按 ECX=0,1,2..n 这个顺序调用的。返回处理器拓扑级别的顺序是特定的,因为每个级别报告一些累积数据,因此一些信息依赖于从先前级别检索到的信息。在 0BH 下,ECX 可以表示的层级有:SMT 和 Core,在 1FH 下,可以表示的层级有:SMT,Core,Module,Tile 和 Die。</p><p>下表是一个更详细的一个解释:</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMdP" alt="image.png" title="image.png"></p><p>来源: Intel 64 and IA-32 Architectures Software Developer's Manual</p><h3>ARM</h3><p>在 ARM 架构下,如果操作系统是依靠 Device Tree 启动的,则会通过 Device Tree 去获取 CPU 拓扑。如果是以 ACPI 的方式启动的话,操作系统会通过解析 ACPI 的 PPTT 表去获取 CPU 拓扑结构。</p><h3>ACPI——PPTT</h3><p>ACPI 是 Advanced Configuration and Power Interface (高级配置和电源接口)的缩写,ACPI 是一种与体系结构无关的电源管理和配置框架。这个框架建立了一个硬件寄存器集合来定义电源状态。ACPI 是操作系统和固件之间的一个中间层,是他们两者之间的一个接口。ACPI 定义了两种数据结构:data tables 和 definition blocks。data tables 用于存储给设备驱动使用的 raw data。definition blocks 由一些字节码组成,这些码可以被解释器执行。</p><p>为了使硬件供应商在选择其实施时具有灵活性,ACPI 使用表格来描述系统信息、功能和控制这些功能的方法。这些表列出了系统主板上的设备或无法使用其他硬件标准检测或电源管理的设备,以及 ACPI 概念中所述的功能。它们还列出了系统功能,如支持的睡眠电源状态、系统中可用的电源平面和时钟源的说明、电池、系统指示灯等。这使 OSPM 能够控制系统设备,而不需要知道系统控制是如何实现的。</p><p>PPTT 表就是其中的一个表格,PPTT 表全称是 Processor Properties Topology Table,处理器属性拓扑表用于描述处理器的拓扑结构,该表还可以描述附加信息,例如处理器拓扑中的哪些节点构成物理包。</p><p>下表是 PPTT 表的结构,包含一个表头和主体,表头和其他的 ACPI 表差别不大。其中<code>Signature</code>用于表示这是 PPTT 表,<code>Length</code>是整张表的大小,其他的信息可以查看下面的这张表。表的主体是一系列处理器拓扑结构。<img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/01-pptt-header.bea002f9.png" alt="01-pptt-header" title="01-pptt-header">下面的表表示处理器层级节点结构,表示处理器结构的话<code>Type</code>要设置为 0,<code>Length</code>表示这个节点的字节数。<code>Flags</code>用来描述跟处理器相关的信息,详细的看后面关于<code>Flags</code>的详细信息。<code>Parent</code>用于指向这个节点的上一级节点,存放的是一个偏移量地址<img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/02-pptt-node-structure.88b66c70.png" alt="02-pptt-node-structure" title="02-pptt-node-structure">下表是<code>Flags</code>的结构,<code>Flags</code>占据 4 个字节的长度。<code>Physical package</code>:如果处理器拓扑的此节点表示物理封装的边界,则设置<code>Physical package</code>为 1。如果处理器拓扑的此实例不表示物理软件包的边界,则设置为 0。<code>Processor is a Thread</code>:对于叶条目:如果代表此处理器的处理元素与兄弟节点共享功能单元,则必须将其设置为 1。对于非叶条目:必须设置为 0。<code>Node is a Leaf</code>:如果节点是处理器层次结构中的叶,则必须设置为 1。否则必须设置为 0。<img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/03-pptt-flags.8ccf1dd9.png" alt="03-pptt-flags" title="03-pptt-flags">参考:<a href="https://aijishu.com/link?target=https%3A%2F%2Fuefi.org%2Fspecs%2FACPI%2F6.4%2F05_ACPI_Software_Programming_Model%2FACPI_Software_Programming_Model.html%23processor-properties-topology-table-pptt" target="blank">https://uefi.org/specs/ACPI/6.4/05_ACPI_Software_Programming_Model/ACPI_Software_Programming_Model.html#processor-properties-topology-table-pptt</a></p><h3>Device Tree</h3><p>Device Tree 是一种描述硬件的数据结构。内核的启动程序会将设备树加载入内存中,然后通过解析 Device Tree 来获取硬件细节。Device Tree 是树形结构,由一系列被命名的节点和属性组成,节点可以包含子节点,它们之间的关系构成一棵树。属性就是 name 和 value 的键值对。</p><p>一个典型的设备树如下图:<img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/04-device-tree.1348daa5.png" alt="04-device-tree" title="04-device-tree"></p><p>ARM 的 CPU 拓扑是定义在 cpu-map 节点内,cpu-map 是 cpu 节点的子节点。在 cpu-map 节点里可以包含三种子节点:cluster 节点,core 节点,thread 节点。整个 dts 的例子如下:</p><pre><code>cpus {
    #size-cells = &lt;0&gt;;
    #address-cells = &lt;2&gt;;
    cpu-map {
        cluster0 {
            cluster0 {
                core0 {
                    thread0 {
                        cpu = &lt;&amp;CPU0&gt;;
                    };
                    thread1 {
                        cpu = &lt;&amp;CPU1&gt;;
                    };
                };
                core1 {
                    thread0 {
                        cpu = &lt;&amp;CPU2&gt;;
                    };
                    thread1 {
                        cpu = &lt;&amp;CPU3&gt;;
                    };
                };
            };
            cluster1 {
                core0 {
                    thread0 {
                        cpu = &lt;&amp;CPU4&gt;;
                    };
                    thread1 {
                        cpu = &lt;&amp;CPU5&gt;;
                    };
                };
                core1 {
                    thread0 {
                        cpu = &lt;&amp;CPU6&gt;;
                    };
                    thread1 {
                        cpu = &lt;&amp;CPU7&gt;;
                    };
                };
            };
        };
    };
    //...
};
</code></pre><p>参考:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.kernel.org%2Fdoc%2FDocumentation%2Fdevicetree%2Fbindings%2Farm%2Ftopology.txt" target="blank">https://www.kernel.org/doc/Documentation/devicetree/bindings/arm/topology.txt</a></p><p>图来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.devicetree.org%2Fspecifications%2F" target="blank">https://www.devicetree.org/specifications/</a></p><h2>StratoVirt 具体实现</h2><h3>CPUID</h3><p>首先我们需要计算每个拓扑结构唯一的 topology ID,然后获取或者自己建立相对应的 CPUID entry,当 entry 的 function 的值等于 0xB 和 0X1F 的时候,我们需要根据 CPUID 的规范去设置相对应的 EAX, EBX, ECX 的值。EAX 设置为拓扑 ID,EBX 用来表示那个层级的有几个逻辑处理器,ECX 表示层级号。0xB 需要配置 index 等于 0,1 对应的值,0x1F 需要配置 index 等于 0,1,2 对应的值。下面是相对应的代码:</p><pre><code>// cpu/src/x86_64/mod.rs
const ECX_INVALID: u32 = 0u32 &lt;&lt; 8;
const ECX_THREAD: u32 = 1u32 &lt;&lt; 8;
const ECX_CORE: u32 = 2u32 &lt;&lt; 8;
const ECX_DIE: u32 = 5u32 &lt;&lt; 8;
impl X86CPUState {
    fn setup_cpuid(&amp;self, vcpu_fd: &amp;Arc&lt;VcpuFd&gt;) -&gt; Result&lt;()&gt; {
        // 计算 topology ID
        let core_offset = 32u32 - (self.nr_threads - 1).leading_zeros();
        let die_offset = (32u32 - (self.nr_cores - 1).leading_zeros()) + core_offset;
        let pkg_offset = (32u32 - (self.nr_dies - 1).leading_zeros()) + die_offset;
        // 获取 KVM 的 fd 和 获取它支持的 CPUID entries
        for entry in entries.iter_mut() {
            match entry.function {
                // ...
                0xb =&gt; {
                    // Extended Topology Enumeration Leaf
                    entry.edx = self.apic_id as u32;
                    entry.ecx = entry.index &amp; 0xff;
                    match entry.index {
                        0 =&gt; {
                            entry.eax = core_offset;
                            entry.ebx = self.nr_threads;
                            entry.ecx |= ECX_THREAD;
                        }
                        1 =&gt; {
                            entry.eax = pkg_offset;
                            entry.ebx = self.nr_threads * self.nr_cores;
                            entry.ecx |= ECX_CORE;
                        }
                        _ =&gt; {
                            entry.eax = 0;
                            entry.ebx = 0;
                            entry.ecx |= ECX_INVALID;
                        }
                    }
                }
                // 0x1f 扩展,支持 die 层级
                0x1f =&gt; {
                    if self.nr_dies &lt; 2 {
                        entry.eax = 0;
                        entry.ebx = 0;
                        entry.ecx = 0;
                        entry.edx = 0;
                        continue;
                    }
                    entry.edx = self.apic_id as u32;
                    entry.ecx = entry.index &amp; 0xff;
                    match entry.index {
                        0 =&gt; {
                            entry.eax = core_offset;
                            entry.ebx = self.nr_threads;
                            entry.ecx |= ECX_THREAD;
                        }
                        1 =&gt; {
                            entry.eax = die_offset;
                            entry.ebx = self.nr_cores * self.nr_threads;
                            entry.ecx |= ECX_CORE;
                        }
                        2 =&gt; {
                            entry.eax = pkg_offset;
                            entry.ebx = self.nr_dies * self.nr_cores * self.nr_threads;
                            entry.ecx |= ECX_DIE;
                        }
                        _ =&gt; {
                            entry.eax = 0;
                            entry.ebx = 0;
                            entry.ecx |= ECX_INVALID;
                        }
                    }
                }
                // ...
            }
        }
}
</code></pre><h3>PPTT</h3><p>根据 ACPI PPTT 表的标准来构建,我们需要计算每个节点的偏移值用于其子节点指向它。我们还需要计算每个节点的 uid,uid 初始化为 0,每增加一个节点 uid 的值加一。还需要根据 PPTT 表的标准计算 Flags 的值。最后需要计算整张表的大小然后修改原来的长度的值。</p><pre><code>// machine/src/standard_vm/aarch64/mod.rs
impl AcpiBuilder for StdMachine {
    fn build_pptt_table(
        &amp;self,
        acpi_data: &amp;Arc&lt;Mutex&lt;Vec&lt;u8&gt;&gt;&gt;,
        loader: &amp;mut TableLoader,
    ) -&gt; super::errors::Result&lt;u64&gt; {
        // ...
        // 配置 PPTT 表头
        // 添加 socket 节点
        for socket in 0..self.cpu_topo.sockets {
            // 计算到起始地址的偏移量
            let socket_offset = pptt.table_len() - pptt_start;
            let socket_hierarchy_node = ProcessorHierarchyNode::new(0, 0x2, 0, socket as u32);
            // ...
            for cluster in 0..self.cpu_topo.clusters {
                let cluster_offset = pptt.table_len() - pptt_start;
                let cluster_hierarchy_node =
                    ProcessorHierarchyNode::new(0, 0x0, socket_offset as u32, cluster as u32);
                // ...
                for core in 0..self.cpu_topo.cores {
                    let core_offset = pptt.table_len() - pptt_start;
                    // 判断是否需要添加 thread 节点
                    if self.cpu_topo.threads &gt; 1 {
                        let core_hierarchy_node =
                            ProcessorHierarchyNode::new(0, 0x0, cluster_offset as u32, core as u32);
                        // ...
                        for _thread in 0..self.cpu_topo.threads {
                            let thread_hierarchy_node =
                                ProcessorHierarchyNode::new(0, 0xE, core_offset as u32, uid as u32);
                            // ...
                            uid += 1;
                        }
                    } else {
                        let thread_hierarchy_node =
                            ProcessorHierarchyNode::new(0, 0xA, cluster_offset as u32, uid as u32);
                        // ...
                        uid += 1;
                    }
                }
            }
        }
        // 将 PPTT 表添加到 loader 中
    }
}
</code></pre><h3>Device Tree</h3><p>StratoVirt 的 microvm 使用 device tree 启动,所以我们需要配置 device tree 中的 cpus 节点下的 cpu-map 来使 microvm 支持解析 CPU 拓扑。在 StratoVirt 中,我们支持两层 cluster。我们使用了多层循环来创建这个 tree,第一层是创建第一层 cluster,第二层对应创建第二层的 cluster,第三层创建 core,第四层创建 thread。</p><pre><code>impl CompileFDTHelper for LightMachine {
    fn generate_cpu_nodes(&amp;self, fdt: &amp;mut FdtBuilder) -&gt; util::errors::Result&lt;()&gt; {
        // 创建 cpus 节点
        // ...
        // Generate CPU topology
        // 创建 cpu-map 节点
        let cpu_map_node_dep = fdt.begin_node("cpu-map")?;
        // 创建第一层 cluster 节点
        for socket in 0..self.cpu_topo.sockets {
            let sock_name = format!("cluster{}", socket);
            let sock_node_dep = fdt.begin_node(&amp;sock_name)?;
            // 创建第二层 cluster 节点
            for cluster in 0..self.cpu_topo.clusters {
                let clster = format!("cluster{}", cluster);
                let cluster_node_dep = fdt.begin_node(&amp;clster)?;
                // 创建 core 节点
                for core in 0..self.cpu_topo.cores {
                    let core_name = format!("core{}", core);
                    let core_node_dep = fdt.begin_node(&amp;core_name)?;
                    // 创建 thread 节点
                    for thread in 0..self.cpu_topo.threads {
                        let thread_name = format!("thread{}", thread);
                        let thread_node_dep = fdt.begin_node(&amp;thread_name)?;
                        // 计算 cpu 的 id
                        // let vcpuid = ...
                        // 然后添加到节点中
                    }
                    fdt.end_node(core_node_dep)?;
                }
                fdt.end_node(cluster_node_dep)?;
            }
            fdt.end_node(sock_node_dep)?;
        }
        fdt.end_node(cpu_map_node_dep)?;
        Ok(())
    }
}
</code></pre><p>这个代码构建出来设备树的结构和前面原理中展示的结构基本一致</p><h2>验证方法</h2><p>我们可以通过下面的命令启动一个虚拟机,<code>smp</code>参数用来配置 vCPU 拓扑</p><pre><code>sudo ./target/release/stratovirt \
    -machine virt \
    -kernel /home/hwy/std-vmlinux.bin.1 \
    -append console=ttyAMA0 root=/dev/vda rw reboot=k panic=1 \
    -drive file=/usr/share/edk2/aarch64/QEMU_EFI-pflash.raw,if=pflash,unit=0,readonly=true \
    -drive file=/home/hwy/openEuler-22.03-LTS-stratovirt-aarch64.img,id=rootfs,readonly=false \
    -device virtio-blk-pci,drive=rootfs,bus=pcie.0,addr=0x1c.0x0,id=rootfs \
    -qmp unix:/var/tmp/hwy.socket,server,nowait \
    -serial stdio \
    -m 2048 \
    -smp 4,sockets=2,clusters=1,cores=2,threads=1
</code></pre><p>接着,我们可以通过观察<code>/sys/devices/system/cpu/cpu0/topology</code>下面的文件来查看配置的 topology。</p><pre><code>[root@StratoVirt topology] ll
total 0
-r--r--r-- 1 root root 64K Jul 18 09:04 cluster_cpus
-r--r--r-- 1 root root 64K Jul 18 09:04 cluster_cpus_list
-r--r--r-- 1 root root 64K Jul 18 09:04 cluster_id
-r--r--r-- 1 root root 64K Jul 18 09:04 core_cpus
-r--r--r-- 1 root root 64K Jul 18 09:04 core_cpus_list
-r--r--r-- 1 root root 64K Jul 18 09:01 core_id
-r--r--r-- 1 root root 64K Jul 18 09:01 core_siblings
-r--r--r-- 1 root root 64K Jul 18 09:04 core_siblings_list
-r--r--r-- 1 root root 64K Jul 18 09:04 die_cpus
-r--r--r-- 1 root root 64K Jul 18 09:04 die_cpus_list
-r--r--r-- 1 root root 64K Jul 18 09:04 die_id
-r--r--r-- 1 root root 64K Jul 18 09:04 package_cpus
-r--r--r-- 1 root root 64K Jul 18 09:04 package_cpus_list
-r--r--r-- 1 root root 64K Jul 18 09:01 physical_package_id
-r--r--r-- 1 root root 64K Jul 18 09:01 thread_siblings
-r--r--r-- 1 root root 64K Jul 18 09:04 thread_siblings_list
</code></pre><p>比如:</p><pre><code>cat core_cpus_list
</code></pre><p>结果是</p><pre><code>0
</code></pre><p>表示和 cpu0 同一个 core 的 cpu 只有 cpu0。</p><pre><code>cat package_cpus_list
</code></pre><p>会显示</p><pre><code>0-1
</code></pre><p>表示和 cpu0 同一个 socket 的 cpu 有从 cpu0 到 cpu1。</p><p>下面这些工具也可以辅助进行验证。</p><p>比如:lscpu</p><pre><code>lscpu
</code></pre><p>通过执行<code>lscpu</code>命令会出现下面结果</p><pre><code>Architecture:            aarch64
  CPU op-mode(s):        32-bit, 64-bit
  Byte Order:            Little Endian
CPU(s):                  64
  On-line CPU(s) list:   0-63
Vendor ID:               ARM
  Model name:            Cortex-A72
    Model:               2
    Thread(s) per core:  1
    Core(s) per cluster: 16
    Socket(s):           -
    Cluster(s):          4
    Stepping:            r0p2
    BogoMIPS:            100.00
    Flags:               fp asimd evtstrm aes pmull sha1 sha2 crc32 cpuid
NUMA:
  NUMA node(s):          4
  NUMA node0 CPU(s):     0-15
  NUMA node1 CPU(s):     16-31
  NUMA node2 CPU(s):     32-47
  NUMA node3 CPU(s):     48-63
Vulnerabilities:
  Itlb multihit:         Not affected
  L1tf:                  Not affected
  Mds:                   Not affected
  Meltdown:              Not affected
  Spec store bypass:     Vulnerable
  Spectre v1:            Mitigation; __user pointer sanitization
  Spectre v2:            Vulnerable
  Srbds:                 Not affected
  Tsx async abort:       Not affected
</code></pre><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2F2022-08-27%2FStratoVirt-vCPU.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000384438">Virtio-Net 技术分析</a></li><li><a href="https://aijishu.com/a/1060000000380775">VFIO设备直通原理(二)</a></li><li><a href="https://aijishu.com/a/1060000000380640">VFIO设备直通原理(一)</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000380076">DAOS ARM64调测之旅</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Tue, 14 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000384628</guid>
            <link>https://aijishu.com/a/1060000000384628</link>
        </item>
        <item>
            <title><![CDATA[Virtio-Net 技术分析]]></title>
            <description><![CDATA[<p>简介</p><p>传统的设备模拟中,虚拟机内部设备驱动完全不知道自己处于虚拟化环境中。对于网络,存储,IO 等操作完全由虚拟机内核到 qemu,最后到宿主机内核处理,这样会产生很多的 VM exit 和 VM entry,因此性能很差。virtio 技术提高了虚拟机的性能,在该方案中,虚拟机能够感知到子集处于虚拟机环境中,并且会加载 virtio 总线驱动和 virtio 设备驱动。</p><p>virtio-net 方案,包括前端驱动和后端设备,以及自身定义的 virtio 传输协议。虚拟机作为前端驱动,安装了 virtio-net 的driver,在 qemu 中加载 virtio-net 后端设备,用来接收前端发送的 I/O 请求,然后从接收的数据中按照传输协议进行解析。最后 qemu 通过操作虚拟tap设备,对物理设备进行操作,从而完成请求,并且会通过中断机制通知前端驱动。</p><p>virtio-net网络包的发送过程:</p><p><img referrerpolicy="no-referrer" src="https://www.openeuler.org/assets/2020-11-23-virtionet.4b41c976.png" alt="2020-11-23-virtionet" title="2020-11-23-virtionet"></p><h2>Virtio-Net 后端</h2><h3>收包流程</h3><p>当网卡有数据包时,tap 设备首先会收到报文,对应 virtio-net 的 tap 设备 fd 变为可读。qemu 通过 epoll 方式监测到有网络数据包,调用回调函数发起收报流程。virtio_net_receive 函数把数据拷贝到虚拟机的 virtio 网卡接收队列。然后向虚拟机注入一个中断,虚拟机便感知到有网络数据报文。</p><pre><code>qemu/hw/net/virtio-net.c
virtio_net_receive
    virtio_net_do_receive
        virtio_net_receive_rcu
</code></pre><p>上述是 virtio-net 的函数调用关系,virtio-net 最终调用 virtio_net_receive_rcu 函数,对网络数据包添加到 virtio queue。</p><pre><code>virtio_net_receive_rcu {
    virtio_net_can_receive     // 根据vm running状态,queue和设备状态判断virtio-net是否可以收包
    virtio_net_has_buffers     // 检查缓冲区,避免出现竞争状况
    receive_filter             // 对网络包进行过滤
    while (offset &lt; size) {
        elem = virtqueue_pop     // 从vring中取出一个请求,将信息传递给elem域中
        len = iov_from_buf         // 负责将报文拷贝到buffer中,实现向guest物理地址写入数据
        virtqueue_fill             // 当数据写完后,撤销映射,更新VRingAvail.ring[]的相关字段
    }
    virtqueue_flush         // 更新VRingUsed.ring的idx,表明可以回收
    virtio_notify             // 负责注入中断,通知前端虚拟机
}
</code></pre><h3>发包流程</h3><p>虚拟机的 virtio 网卡驱动向网卡缓冲区填好报文,然后写 queue notify 寄存器。这样,触发 VM exit ,虚拟机就会退出到root 模式,在 qemu 的 vcpu 线程 virtio_mmio_write 对其处理。</p><pre><code>qemu/hw/net/virtio-net.c
virtio_net_add_queue
    virtio_net_handle_tx_bh
        qemu_bh_schedule
            virtio_net_tx_bh
                virtio_net_flush_tx
            virtio_queue_set_notification
</code></pre><p>这里将 virtio_net_handle_tx_bh 函数绑定到 tx_vq。内部调用 qemu_bh_schedule 运行指定的函数,这里绑定的是virtio_net_tx_bh。最终调用 virtio_net_flush_tx 函数发送报文。</p><pre><code>virtio_net_flush_tx
    for (;;) {
        elem = virtqueue_pop     // 从vring中取出一个请求
        qemu_sendv_packet_async // qemu发包函数
    }
</code></pre><p>在 virtio_net_flush_tx 函数中,获取报文 elem,写 tap 设备的 fd,最终发给 tap 设备,投递出去。qemu_sendv_packet_async 发送网络包的调用链为: qemu_sendv_packet_async-&gt;qemu_net_queue_send_iov-&gt;qemu_net_queue_flush- &gt;qemu_net_queue_deliver。qemu 后端最终调用 tap_write_packet- &gt;writev 写入 tap 字符设备。</p><p>接着在内核的字符设备驱动中,tun_chr_write_iter 会被调用,在 TCP/IP 协议栈进一步处理网络包。</p><h3>创建设备</h3><pre><code>virtio_net_class_init
    virtio_net_device_realize
    virtio_net_get_config
    virtio_net_get_features
    ...
</code></pre><p>virtio_net_device_realize 完成对 virtio-net 设备的初始化过程。</p><pre><code>virtio_net_device_realize
    virtio_net_set_config_size
    virtio_init
    virtio_net_set_default_queue_size
    virtio_net_add_queue
    n-&gt;ctrl_vq = virtio_add_queue(virtio_net_handle_ctrl)
    qemu_new_nic
</code></pre><p>这个函数创建了一个 VirtIODevice,virtio_init 用来初始化这个设备。接着调用 virtio_net_add_queue 初始化队列。当设置多队列特性,还要额外增加一个 ctrl_vq 队列,用作控制队列。最后,qemu_new_nic 会创建一个虚拟机里面的网卡。这里的网卡对应的是后端 tap 设备。</p><h3>模拟网卡</h3><p>tap 设备的使用:qemu 使用 tap 作为网络后端。首先需要在宿主机上创建 tap 设备,并添加到网桥 br0 上。</p><pre><code># brctl addbr br0
# ip tuntap add dev tap0 mode tap
# brctl addif br0 tap0
# ip link set dev tap0 up
</code></pre><p>在使用 qemu 命令启动虚拟机的过程中,传递参数:net,nic,model,netdev,ifname...</p><p>其中 nic 表示前端虚拟机网卡,model 表示创建网卡类型,netdev 定义后端 tap 设备,ifname 表示 tap 设备的名字。</p><p>qemu 的 main 函数会调用 net\_init\_clients 进行网络设备的初始化 ,在该函数内对 netdev 参数进行解析。</p><pre><code>net_init_clients
    qemu_opts_foreach(qemu_find_opts("netdev"),net_init_netdev, NULL, errp))
        net_init_netdev
            net_client_init-&gt;net_client_init1 // 根据不同的driver类型,调用不同的初始化函数
                net_init_tap
                    net_tap_init
                        tap_open
</code></pre><p>tap_open 函数打开一个文件 "/dev/net/tun" ,然后通过 ioctl 操作这个文件。</p><pre><code>tap_open{
    fd = open(PATH_NET_TUN, O_RDWR)
    ioctl(fd, TUNGETFEATURES, &amp;features)
    ioctl(fd, TUNSETVNETHDRSZ, &amp;len)
    ioctl(fd, TUNSETIFF, (void *) &amp;ifr)
}
</code></pre><p>最终,通过宿主机内核复杂的网络协议栈,形成一个网络包,发送到外部网络中。这样做的原因是:虚拟机将网络包发送给 qemu,qemu 没有自己的网络协议栈,因此,qemu 将网络包转换成文件流,写入 "/dev/net/tun" 字符设备。内核TUN/TAP 字符设备驱动收到这个写入的文件流,然后交给 TUN/TAP 虚拟网卡驱动。驱动将文件流再次转成网络包,交给TCP/IP 协议栈,从 tap 设备发出标准的网络包。</p><h2>Virtio-Net 前端</h2><p>虚拟机里面的进程发送一个网络包,通过文件系统和 Socket 调用网络协议栈,到达网络设备层。 这里将调用 virtio-net 驱动做进一步处理。</p><p>前端 driver 将报文发送出去,注册的 ops 函数定义如下,其中指定的发送函数为 start_xmit。</p><pre><code>kernel/drivers/net/virtio_net.c
static const struct net_device_ops virtnet_netdev = {
    .ndo_open            = virtnet_open,
    .ndo_stop            = virtnet_close,
    .ndo_start_xmit      = start_xmit,
    ...
};
</code></pre><p>调用 start\_xmit 函数,将 skb 发送到 virtqueue 中, 然后调用 virtqueue\_kick 通知 qemu 后端将数据包发送出去。</p><pre><code>start_xmit{
    free_old_xmit_skbs // 释放backend处理过的desc
    xmit_skb           // 发包
        sg_init_table
        sg_set_buf(sq-&gt;sg, hdr, hdr_len);                      // 数据包头部填入scatterlist
        num_sg = skb_to_sgvec(skb, sq-&gt;sg + 1, 0, skb-&gt;len);  // 数据包填入scatterlist
        virtqueue_add_outbuf // sg table 写入desc描述符表,head desc信息写vring.avail
    virtqueue_kick_prepare(sq-&gt;vq) &amp;&amp; virtqueue_notify(sq-&gt;vq) // kick通知qemu后端
}
</code></pre><p>当虚拟机写入一个 I/O 会使得 qemu 触发 VM exit 。接下来进入 qemu 做 virtio-net 相关处理。</p><h2>流程总结</h2><ol><li>在虚拟机里面的用户态,应用程序通过 write 系统调用写入 socket。</li><li>写入的内容经过 VFS 层,内核协议栈,到达虚拟机里面的内核的网络设备驱动,即 virtio_net。</li><li>virtio_net 网络设备有一个操作结构 struct net_device_ops,里面定义了发送一个网络包调用的函数为 start_xmit。</li><li>在 virtio_net 的前端驱动和 qemu 中的后端驱动之间,有两个队列 virtqueue,一个用于发送,一个用于接收。然后,我们需要在 start_xmit 中调用 virtqueue_add,将网络包放入发送队列,然后调用 virtqueue_notify 通知 qemu。</li><li>qemu 本来处于 KVM_RUN 的状态,收到通知后,通过 VM exit 指令退出客户机模式,进入宿主机模式。发送网络包的时候,virtio_net_handle_tx_bh 函数会被调用。</li><li>接下来是一个 for 循环,我们需要在循环中调用 virtqueue_pop,从传输队列中获取要发送的数据,然后调用 qemu_sendv_packet_async 进行发送。</li><li>qemu 会调用 writev 向字符设备文件写入,进入宿主机的内核。</li><li>在宿主机内核中字符设备文件的 file_operations 里面的 write_iter 会被调用,也即会调用 tun_chr_write_iter。</li><li>在 tun_chr_write_iter 函数中,tun_get_user 将要发送的网络包从 qemu 拷贝到宿主机内核里面来,然后调用 netif_rx_ni 开始调用宿主机内核协议栈进行处理。</li><li>宿主机内核协议栈处理完毕之后,会发送给 tap 虚拟网卡,完成从虚拟机里面到宿主机的整个发送过程。</li></ol><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2Fxinleguo%2F2020-11-23-Virtio_Net_Technology.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000380775">VFIO设备直通原理(二)</a></li><li><a href="https://aijishu.com/a/1060000000380640">VFIO设备直通原理(一)</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000380076">DAOS ARM64调测之旅</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000376121">回顾2022年计算机视觉领域最激动人心的进展</a></li><li><a href="https://aijishu.com/a/1060000000375922">量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 13 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000384438</guid>
            <link>https://aijishu.com/a/1060000000384438</link>
        </item>
        <item>
            <title><![CDATA[VFIO设备直通原理(二)]]></title>
            <description><![CDATA[<p>设备直通给虚拟机能够极大提升虚拟机对物理设备访问的性能,本文通过vfio内核模块和qemu用户态实现介绍vfio设备直通时的关键部分,包括:用户态访问设备IO地址空间,DMA重映射,中断重映射等.</p><h2>VFIO访问直通设备IO地址空间</h2><p>1.PIO和MMIO</p><p>设备的IO地址空间的访问有PIO和MMIO两种方式,前者通过独立的IO端口访问设备,而MMIO是在物理内存中映射一段区间,直接访问该内存就可以访问设备的配置空间.在虚拟化的场景下,虚拟机通过PIO访问直通设备时,首先会VM-exit到qemu,由qemu通过转换表完成对该PIO操作的转发.对于PCI设备而言,其bar空间地址是通过PIO的方式设置的,如果将设备的PIO访问完全暴露给虚拟机,虚拟机修改了真实的物理设备的PCI Bar空间基地址配置,与host上不一致,可能会出现严重的问题,所以对于设备的PIO访问需要建立转换表,在VM-exit之后由qemu来完成设置的转发.</p><p>对于设备的MMIO空间访问,则可以通过建立EPT页表将设备的MMIO物理内存映射到虚拟的MMIO地址空间,让虚拟机能够直接通过MMIO访问PCI设备的bar空间,提高IO性能.</p><p>2.获取直通设备信息</p><p>通过VFIO提供的接口可以获取到设备的基本信息,包括设备的描述符、region的数量等。</p><pre><code>vfio_get_device:
    fd = ioctl(group-&gt;fd, VFIO_GROUP_GET_DEVICE_FD, name);
    ret = ioctl(fd, VFIO_DEVICE_GET_INFO, &amp;dev_info);
    vbasedev-&gt;fd = fd;
    vbasedev-&gt;group = group;
    QLIST_INSERT_HEAD(&amp;group-&gt;device_list, vbasedev, next);
    vbasedev-&gt;num_irqs = dev_info.num_irqs;
    vbasedev-&gt;num_regions = dev_info.num_regions;
    vbasedev-&gt;flags = dev_info.flags;
</code></pre><p>2.直通设备PCI配置空间模拟</p><p>Qemu为每个PCI直通设备都建立一个虚拟数据结构 VFIOPCIDevice,保存物理PCI设备的相关信息,由vfio\_get\_device来获取,保存到vbasedev中。</p><pre><code>typedef struct VFIOPCIDevice {
    PCIDevice pdev;
    VFIODevice vbasedev;
</code></pre><p>VFIO设备作为qemu的设备模型的一部分,qemu对直通设备的模拟初始化入口在 vfio\_realize,通过vfio\_get_device获取到直通设备的基本信息之后,会调用pread设备的fd获取到设备的配置空间信息的一份拷贝,qemu会写入一些自定义的config配置。</p><pre><code>vfio_realize:
    /* Get a copy of config space */
    ret = pread(vdev-&gt;vbasedev.fd, vdev-&gt;pdev.config,
                MIN(pci_config_size(&amp;vdev-&gt;pdev), vdev-&gt;config_size),
                vdev-&gt;config_offset);
    if (ret &lt; (int)MIN(pci_config_size(&amp;vdev-&gt;pdev), vdev-&gt;config_size)) {
        ret = ret &lt; 0 ? -errno : -EFAULT;
        error_setg_errno(errp, -ret, "failed to read device config space");
        goto error;
    }
    /* vfio emulates a lot for us, but some bits need extra love */
    vdev-&gt;emulated_config_bits = g_malloc0(vdev-&gt;config_size);
    /* QEMU can choose to expose the ROM or not */
    memset(vdev-&gt;emulated_config_bits + PCI_ROM_ADDRESS, 0xff, 4);
    /* QEMU can change multi-function devices to single function, or reverse */
    vdev-&gt;emulated_config_bits[PCI_HEADER_TYPE] =
                                              PCI_HEADER_TYPE_MULTI_FUNCTION;
    /* Restore or clear multifunction, this is always controlled by QEMU */
    if (vdev-&gt;pdev.cap_present &amp; QEMU_PCI_CAP_MULTIFUNCTION) {
        vdev-&gt;pdev.config[PCI_HEADER_TYPE] |= PCI_HEADER_TYPE_MULTI_FUNCTION;
    } else {
        vdev-&gt;pdev.config[PCI_HEADER_TYPE] &amp;= ~PCI_HEADER_TYPE_MULTI_FUNCTION;
    }
    /*
     * Clear host resource mapping info.  If we choose not to register a
     * BAR, such as might be the case with the option ROM, we can get
     * confusing, unwritable, residual addresses from the host here.
     */
    memset(&amp;vdev-&gt;pdev.config[PCI_BASE_ADDRESS_0], 0, 24);
    memset(&amp;vdev-&gt;pdev.config[PCI_ROM_ADDRESS], 0, 4);
</code></pre><p>3.直通设备MMIO映射</p><p>直通PCI设备的MMIO内存主要是指其Bar空间,qemu使用vfio\_populate\_device函数调用VFIO接口获取到PCI设备的Bar空间信息,然后通过vfio\_region\_setup获取到对应region的信息,并将qemu内存虚拟化的MemoryRegion设置为IO类型的region。重要的是,qemu会为该IO类型的MemoryRegion设置ops为vfio\_region\_ops,这样后续对于该块内存的读写会经过qemu VFIO模块注册的接口来进行。</p><pre><code>vfio_populate_device:
    for (i = VFIO_PCI_BAR0_REGION_INDEX; i &lt; VFIO_PCI_ROM_REGION_INDEX; i++) {
        char *name = g_strdup_printf("%s BAR %d", vbasedev-&gt;name, i);
        ret = vfio_region_setup(OBJECT(vdev), vbasedev, &amp;vdev-&gt;bars[i].region, i, name);
            -&gt; vfio_get_region_info
            -&gt; memory_region_init_io(region-&gt;mem, obj, &amp;vfio_region_ops,
                              region, name, region-&gt;size);
        QLIST_INIT(&amp;vdev-&gt;bars[i].quirks);
    }
    ret = vfio_get_region_info(vbasedev, VFIO_PCI_CONFIG_REGION_INDEX, &amp;reg_info);
            -&gt;    ioctl(vbasedev-&gt;fd, VFIO_DEVICE_GET_REGION_INFO, *info))
    ret = ioctl(vdev-&gt;vbasedev.fd, VFIO_DEVICE_GET_IRQ_INFO, &amp;irq_info);
</code></pre><p>到这里已经获取到了PCI设备的MMIO内存信息,但是还没有真正的将物理内存中的Bar空间映射到qemu,这一动作在vfio\_bars\_setup中完成,vfio\_region\_mmap会对region中每个需要map的内存地址完成映射,然后将映射的物理内存通过qemu注册到虚拟机作为一段虚拟机的物理地址空间。</p><pre><code>vfio_bars_setup:
    for (i = 0; i &lt; PCI_ROM_SLOT; i++)
        vfio_bar_setup(vdev, i);
            vfio_region_mmap(&amp;bar-&gt;region)
                    for (i = 0; i &lt; region-&gt;nr_mmaps; i++) {
                    region-&gt;mmaps[i].mmap = mmap(NULL, region-&gt;mmaps[i].size, prot,
                                                MAP_SHARED, region-&gt;vbasedev-&gt;fd,
                                                region-&gt;fd_offset +
                                                region-&gt;mmaps[i].offset);
                    memory_region_init_ram_device_ptr
                    memory_region_add_subregion
            pci_register_bar(&amp;vdev-&gt;pdev, nr, type, bar-&gt;region.mem);
</code></pre><p>这里的映射mmap接口对应的是VFIO设备在内核中注册的vfio\_pci\_mmap 函数,在内核中,该函数会为vma注册一个mmap的ops,对应着注册了一个缺页处理函数,当用户态程序访问该段虚拟内存缺页时,调用注册的缺页处理函数,完成虚拟地址到实际物理地址的映射。</p><pre><code>vfio_pci_mmap:
    vma-&gt;vm_flags |= VM_IO | VM_PFNMAP | VM_DONTEXPAND | VM_DONTDUMP;
    vma-&gt;vm_ops = &amp;vfio_pci_mmap_ops;
        -&gt; .fault = vfio_pci_mmap_fault,
                -&gt; if (remap_pfn_range(vma, vma-&gt;vm_start, vma-&gt;vm_pgoff,
                    vma-&gt;vm_end - vma-&gt;vm_start, vma-&gt;vm_page_prot))
</code></pre><p>简单来说,对于MMIO内存的的映射,主要是将物理内存中的MMIO空间映射到了qemu的虚拟地址空间,然后再由qemu将该段内存注册进虚拟机作为虚拟机的一段物理内存,在这个过程中会建立从gpa到hpa的EPT页表映射,提升MMIO的性能。</p><h2>DMA重映射</h2><p>首先关于DMA,设备通过DMA可以直接使用iova地址访问物理内存,从iova到实际物理地址的映射是在IOMMU中完成的,一般在dma_allooc分配设备能够访问的内存的时候,会分配iova地址和实际的物理地址空间,并在iommu中建立映射关系。 所以说要让设备进行DMA最关键的几个部分:</p><ul><li>设备能够识别的地址:IOVA</li><li>一段物理内存</li><li>IOVA到物理内存在IOMMU中的映射关系</li></ul><p>基于这几点来看VFIO的DMA重映射就比较清晰,首先从VFIO设备的初始化开始,在获取设备信息之前会先获取到设备所属的group和Container,并调用VFIO\_SET\_IOMMU完成container和IOMMU的绑定,并attach由VFIO管理的所有设备。此外注意到这里的 pci\_device\_iommu\_address\_space 函数,意思是qemu为设备dma注册了一段专门的地址空间,这段内存作为虚拟机的一段物理内存存在,在VFIO\_SET\_IOMMU之后,注册该地址空间,其region\_add函数为 vfio\_listener\_region\_add,意思是当内存空间布局发生变化这里是增加内存的时候都会调用该接口。</p><pre><code>vfio_realize:
    group = vfio_get_group(groupid, pci_device_iommu_address_space(pdev), errp);
        vfio_connect_container(group, as, errp)
            ret = ioctl(fd, VFIO_SET_IOMMU, container-&gt;iommu_type);
            container-&gt;listener = vfio_memory_listener;
            memory_listener_register(&amp;container-&gt;listener, container-&gt;space-&gt;as);
                    -&gt; .region_add = vfio_listener_region_add,
</code></pre><p>那么跟DMA有什么关系呢,当为设备进行DMA分配一块内存时,实际是以MemoryRegion的形式存在的,也就是说虚拟机进行dma alloc 会调用region\_add函数,进而调用注册的memory\_listener\_region\_add函数,MemoryRegion有了意味着分配了一块物理内存,还需要IOVA和映射关系才行。这里,IOVA地址使用的是section-&gt;offset\_within\_address_space,为什么可以这样,因为IOVA地址只是作为设备识别的地址,只要建立了映射关系就有意义。</p><pre><code>vfio_listener_region_add:
    iova = TARGET_PAGE_ALIGN(section-&gt;offset_within_address_space);
    /* Here we assume that memory_region_is_ram(section-&gt;mr)==true */
    vaddr = memory_region_get_ram_ptr(section-&gt;mr) +
            section-&gt;offset_within_region +
            (iova - section-&gt;offset_within_address_space);
    ret = vfio_dma_map(container, iova, int128_get64(llsize),
                       vaddr, section-&gt;readonly);
vfio_dma_map:
    struct vfio_iommu_type1_dma_map map = {
        .argsz = sizeof(map),
        .flags = VFIO_DMA_MAP_FLAG_READ,
        .vaddr = (__u64)(uintptr_t)vaddr,
        .iova = iova,
        .size = size,
    };
    ioctl(container-&gt;fd, VFIO_IOMMU_MAP_DMA, &amp;map)
</code></pre><p>建立映射的关键在于vfio\_dma\_map,通过ioctl调用container-&gt;fd接口VFIO\_IOMMU\_MAP_DMA完成DMA重映射。为什么是container-&gt;fd,因为VFIO Container管理内存资源,与IOMMU直接绑定,而IOMMU是完成IOVA到实际物理内存映射的关键。值得注意的是qemu只知道这一段内存的虚拟地址vaddr,所以将vaddr,iova和size传给内核,由内核获取物理内存信息完成映射。</p><pre><code>vfio_dma_do_map:
    vfio_pin_map_dma
        while (size) {
            /* Pin a contiguous chunk of memory */
            npage = vfio_pin_pages_remote(dma, vaddr + dma-&gt;size,
                                size &gt;&gt; PAGE_SHIFT, &amp;pfn, limit);
            /* Map it! */
            vfio_iommu_map(iommu, iova + dma-&gt;size, pfn, npage,
                            dma-&gt;prot);
                list_for_each_entry(d, &amp;iommu-&gt;domain_list, next)
                    iommu_map(d-&gt;domain, iova, (phys_addr_t)pfn &lt;&lt; PAGE_SHIFT,
                            npage &lt;&lt; PAGE_SHIFT, prot | d-&gt;prot);
                        arm_smmu_map
                            __arm_lpae_map
            size -= npage &lt;&lt; PAGE_SHIFT;
            dma-&gt;size += npage &lt;&lt; PAGE_SHIFT;
        }
</code></pre><p>内核完成建立iova到物理内存的映射之前会将分配的DMA内存给pin住,使用vfio\_pin\_pages\_remote接口可以获取到虚拟地址对应的物理地址和pin住的页数量,然后vfio\_iommu_map进而调用iommu以及smmu的map函数,最终用iova,物理地址信息pfn以及要映射的页数量在设备IO页表中建立映射关系。</p><pre><code>+--------+  iova  +--------+  gpa  +----+
| device |   -&gt;   | memory |   &lt;-  | vm |
+--------+        +--------+       +----+
</code></pre><p>最终完成了DMA重映射,设备使用qemu分配的iova地址通过IOMMU映射访问内存,虚拟机使用gpa通过Stage 2页表映射访问内存</p><h2>中断重映射</h2><p>对于PCI直通设备中断的虚拟化,主要包括三种类型INTx,Msi和Msi-X。</p><p>1.INTx中断初始化及enable</p><p>对于INTx类型的中断,在初始化的时候就进行使能了,qemu通过VFIO device的接口将中断irq set设置到内核中,并且会注册一个eventfd,设置了eventfd的handler,当发生intx类型的中断时,内核会通过eventfd通知qemu进行处理,qemu会通知虚拟机进行处理。</p><pre><code>vfio_realize:
    if (vfio_pci_read_config(&amp;vdev-&gt;pdev, PCI_INTERRUPT_PIN, 1)) {
        pci_device_set_intx_routing_notifier(&amp;vdev-&gt;pdev, vfio_intx_update);
        ret = vfio_intx_enable(vdev, errp);
            *pfd = event_notifier_get_fd(&amp;vdev-&gt;intx.interrupt);
            qemu_set_fd_handler(*pfd, vfio_intx_interrupt, NULL, vdev);
            ret = ioctl(vdev-&gt;vbasedev.fd, VFIO_DEVICE_SET_IRQS, irq_set);
</code></pre><p>2.MSI-X初始化</p><p>MSIX在vfio_realzie初始化时,首先获取到物理设备的中断相关的配置信息,将其设置到注册给对应的MMIO内存中</p><pre><code>vfio_msix_early_setup:
    pos = pci_find_capability(&amp;vdev-&gt;pdev, PCI_CAP_ID_MSIX);
    if (pread(fd, &amp;ctrl, sizeof(ctrl),
            vdev-&gt;config_offset + pos + PCI_MSIX_FLAGS) != sizeof(ctrl)) {
    if (pread(fd, &amp;table, sizeof(table),
            vdev-&gt;config_offset + pos + PCI_MSIX_TABLE) != sizeof(table)) {
    if (pread(fd, &amp;pba, sizeof(pba),
            vdev-&gt;config_offset + pos + PCI_MSIX_PBA) != sizeof(pba)) {
    ctrl = le16_to_cpu(ctrl);
    table = le32_to_cpu(table);
    pba = le32_to_cpu(pba);
    msix = g_malloc0(sizeof(*msix));
    msix-&gt;table_bar = table &amp; PCI_MSIX_FLAGS_BIRMASK;
    msix-&gt;table_offset = table &amp; ~PCI_MSIX_FLAGS_BIRMASK;
    msix-&gt;pba_bar = pba &amp; PCI_MSIX_FLAGS_BIRMASK;
    msix-&gt;pba_offset = pba &amp; ~PCI_MSIX_FLAGS_BIRMASK;
    msix-&gt;entries = (ctrl &amp; PCI_MSIX_FLAGS_QSIZE) + 1;
vfio_msix_setup:
    msix_init(&amp;vdev-&gt;pdev, vdev-&gt;msix-&gt;entries,
                    vdev-&gt;bars[vdev-&gt;msix-&gt;table_bar].region.mem,
                    vdev-&gt;msix-&gt;table_bar, vdev-&gt;msix-&gt;table_offset,
                    vdev-&gt;bars[vdev-&gt;msix-&gt;pba_bar].region.mem,
                    vdev-&gt;msix-&gt;pba_bar, vdev-&gt;msix-&gt;pba_offset, pos);
        memory_region_init_io(&amp;dev-&gt;msix_table_mmio, OBJECT(dev), &amp;msix_table_mmio_ops, dev,
                          "msix-table", table_size);
        memory_region_add_subregion(table_bar, table_offset, &amp;dev-&gt;msix_table_mmio);
        memory_region_init_io(&amp;dev-&gt;msix_pba_mmio, OBJECT(dev), &amp;msix_pba_mmio_ops, dev,
                            "msix-pba", pba_size);
        memory_region_add_subregion(pba_bar, pba_offset, &amp;dev-&gt;msix_pba_mmio);
vfio_realize:
    /* QEMU emulates all of MSI &amp; MSIX */
    if (pdev-&gt;cap_present &amp; QEMU_PCI_CAP_MSIX) {
        memset(vdev-&gt;emulated_config_bits + pdev-&gt;msix_cap, 0xff,
               MSIX_CAP_LENGTH);
    if (pdev-&gt;cap_present &amp; QEMU_PCI_CAP_MSI) {
        memset(vdev-&gt;emulated_config_bits + pdev-&gt;msi_cap, 0xff,
               vdev-&gt;msi_cap_size);
</code></pre><ol start="3"><li>MSI/MSI-X enable 与 irqfd的注册</li></ol><p>当虚拟机因为写PCI配置空间而发生VM-exit时,最终会完成msi和msix的使能,以MSIX的使能为例,在qemu侧会设置eventfd的处理函数,并通过kvm将irqfd注册到内核中,进而注册虚拟中断给虚拟机。</p><pre><code>kvm_cpu_exec:
    vfio_pci_write_config:
        vfio_msi_enable(vdev);
        vfio_msix_enable(vdev);
            for (i = 0; i &lt; vdev-&gt;nr_vectors; i++) {
                if (event_notifier_init(&amp;vector-&gt;interrupt, 0)) {
                qemu_set_fd_handler(event_notifier_get_fd(&amp;vector-&gt;interrupt),
                                    vfio_msi_interrupt, NULL, vector);
                vfio_add_kvm_msi_virq(vdev, vector, i, false);
                    kvm_irqchip_add_msi_route(kvm_state, vector_n, &amp;vdev-&gt;pdev);
                    vfio_add_kvm_msi_virq
                        kvm_irqchip_add_irqfd_notifier_gsi
                            kvm_vm_ioctl(s, KVM_IRQFD, &amp;irqfd);
            /* Set interrupt type prior to possible interrupts */
            vdev-&gt;interrupt = VFIO_INT_MSI;
            ret = vfio_enable_vectors(vdev, false);
                ret = ioctl(vdev-&gt;vbasedev.fd, VFIO_DEVICE_SET_IRQS, irq_set);
</code></pre><h2>小结</h2><p>要让设备直通给虚拟机,需要将设备的DMA能力、中断响应和IO地址空间访问安全地暴露给用户态,本文主要介绍了VFIO设备直通关键的几个环节,包括如何在用户态访问物理设备的IO地址空间、如何进行DMA重映射和中断重映射。</p><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2Fwxggg%2F2020-11-29-vfio-passthrough-2.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000380640">VFIO设备直通原理(一)</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000380076">DAOS ARM64调测之旅</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000376121">回顾2022年计算机视觉领域最激动人心的进展</a></li><li><a href="https://aijishu.com/a/1060000000375922">量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!</a></li><li><a href="https://aijishu.com/a/1060000000375779">自制深度学习推理框架-前言-第一课</a></li><li><a href="https://aijishu.com/a/1060000000375145">YOLOv6精度提升的又一根稻草,感知量化的重参再设计,QARep值得内卷</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Wed, 18 Jan 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000380775</guid>
            <link>https://aijishu.com/a/1060000000380775</link>
        </item>
        <item>
            <title><![CDATA[VFIO设备直通原理(一)]]></title>
            <description><![CDATA[<p>现代系统大多提供DMA和中断重映射功能来确保I/O设备在有限的范围内运行,比如x86平台的AMD-Vi和Intel VT-d。VFIO(Virtual Function I/O)是一个可以将设备I/O、中断和DMA等能力安全的暴露到用户态空间,从而使用用户态驱动实现设备驱动的框架。通过VFIO进行设备直通到虚拟机,可以获得更高的设备I/O性能。</p><p>实现用户态驱动最关键的问题在于如何安全可控的将设备的DMA能力暴露到用户空间,IOMMU的出现可以限制设备对内存的访问,恶意的设备不能直接读写物理内存,经过IOMMU映射之后才能使用IOVA或者虚拟地址进行访存,由IOMMU来保证访存的安全性。</p><h2>VFIO内核组件</h2><p>VFIO内核组件主要包括如下图所示,通过设备文件向用户态提供统一访问接口vfio interface层,包括:</p><ul><li>VFIO container</li><li>VFIO group</li><li>VFIO device</li></ul><pre><code>+-----------------------------------------+
|            vfio interface               |
+-----------------------------------------+
|  vfio_iommu_driver |       vfio_pci     |
+--------------------+--------------------+
|        iommu       |       pci_bus      |
+--------------------+--------------------+
</code></pre><p>vfio interface 封装了vfio\_iommu\_driver和vfio\_pci分别和底层的IOMMU、PCI驱动进行交互,vfio\_iommu\_driver为VFIO提供了IOMMU重映射驱动,向用户态暴露DMA操作,主要是vfio\_iommu\_type1驱动,利用IOMMU管理IO页表的能力来进行IO重映射。vfio\_pci模块封装pci设备驱动并和用户态程序进行配合完成用户态的设备配置模拟、Bar空间重定向及中断重映射等功能。</p><p>VFIO框架中比较重要的几个概念包括:Container、Group和Device,其相互之间的关系如图所示,一个container可以理解为实际的物理资源集合,每个container中可以有多个group,group描述了设备在物理上的划分,一个group可以有多个device,划分的逻辑取决于硬件上的IOMMU拓扑结构。</p><pre><code>container
+------------------------+
|    group0    group1    |
|  +-------+  +------+   |
|  | dev0  |  | dev2 |   |
|  | dev1  |  +------+   |
|  +-------+             |
+------------------------+
</code></pre><p>可以结合内核中vfio.txt文件来理解Container、Group、Device和IOMMU之间的关系。</p><h2>VFIO Container</h2><pre><code>// container: /dev/vfio/vfio
struct vfio_container {
    struct kref            kref;
    struct list_head        group_list;
    struct rw_semaphore        group_lock;
    struct vfio_iommu_driver    *iommu_driver;
    void                *iommu_data;
    bool                noiommu;
};
</code></pre><p>Container是管理内存资源,和IOMMU、DMA及地址空间相关,可以通过打开设备文件/dev/vfio/vfio来获取container对应的文件描述符,在内核vfio/vfio.c中有对应该vfio设备文件的具体操作实现,ioctl主要是可以获取IOMMU相关的信息,vfio会将用户态对IOMMU相关操作发给底层的vfio_iommu驱动进行操作,通过vfio ioctl提供的接口如下:</p><ul><li>获取API versio</li><li>设置IOMMU的类型,如设置为常用的VFIO\_TYPE1\_IOMMU</li><li>获取IOMMU的信息</li><li>分配空间并进行DMA映射</li></ul><pre><code>int container, group, device, i;
struct vfio_iommu_type1_info iommu_info = { .argsz = sizeof(iommu_info) };
struct vfio_iommu_type1_dma_map dma_map = { .argsz = sizeof(dma_map) };
/* Create a new container */
container = open("/dev/vfio/vfio", O_RDWR);
if (ioctl(container, VFIO_GET_API_VERSION) != VFIO_API_VERSION)
    /* Unknown API version */
if (!ioctl(container, VFIO_CHECK_EXTENSION, VFIO_TYPE1_IOMMU))
    /* Doesn't support the IOMMU driver we want. */
/* Enable the IOMMU model we want */
ioctl(container, VFIO_SET_IOMMU, VFIO_TYPE1_IOMMU);
/* Get addition IOMMU info */
ioctl(container, VFIO_IOMMU_GET_INFO, &amp;iommu_info);
/* Allocate some space and setup a DMA mapping */
dma_map.vaddr = mmap(0, 1024 * 1024, PROT_READ | PROT_WRITE,
                MAP_PRIVATE | MAP_ANONYMOUS, 0, 0);
dma_map.size = 1024 * 1024;
dma_map.iova = 0; /* 1MB starting at 0x0 from device view */
dma_map.flags = VFIO_DMA_MAP_FLAG_READ | VFIO_DMA_MAP_FLAG_WRITE;
ioctl(container, VFIO_IOMMU_MAP_DMA, &amp;dma_map);
</code></pre><h2>VFIO Group</h2><pre><code>// group: /dev/vfio/%group_id
struct vfio_group {
    struct kref            kref;
    int                minor;
    atomic_t            container_users;
    struct iommu_group        *iommu_group;
    struct vfio_container        *container;
    struct list_head        device_list;
    struct mutex            device_lock;
    struct device            *dev;
    struct notifier_block        nb;
    struct list_head        vfio_next;
    struct list_head        container_next;
    struct list_head        unbound_list;
    struct mutex            unbound_lock;
    atomic_t            opened;
    wait_queue_head_t        container_q;
    bool                noiommu;
    struct kvm            *kvm;
    struct blocking_notifier_head    notifier;
};
</code></pre><p>Group是IOMMU进行DMA隔离的最小硬件单元,设备属于哪个group取决于IOMMU和设备的物理结构,在设备直通时需要将一个group里的所有设备都分配给一个虚拟机,其实就是多个group可以从属于一个container,而group下的所有设备也随着该group从属于该container。这样能够做到DMA隔离,避免一个container里的device通过DMA来攻击获取另一个container里的数据。</p><p>对于一个PCI设备0000:06:0d.0::,通过readlink可以在sys文件目录下获取其iommu_group,比如该PCI设备在ID为26的IOMMU group中。</p><pre><code>$ readlink /sys/bus/pci/devices/0000:06:0d.0/iommu_group
../../../../kernel/iommu_groups/26
</code></pre><p>设备挂载在pci bus下,可以使用 vfio-pci 来管理这个group。使用vfio-pci来管理设备时,首先从原来的驱动里unbind该PCI设备,然后将id写入新的vfio-pci路径下,会为这个group创建一个字符设备。</p><pre><code>$ lspci -n -s 0000:06:0d.0
06:0d.0 0401: 1102:0002 (rev 08)
$ echo 0000:06:0d.0 &gt; /sys/bus/pci/devices/0000:06:0d.0/driver/unbind
$ echo 1102 0002 &gt; /sys/bus/pci/drivers/vfio-pci/new_id
</code></pre><p>当设备绑定到vfio之后,在/dev/vfio/路径下面会产生一个新的group id,通过该id可以获取到group,完成以下操作:</p><ul><li>查询group状态,是否所有设备都绑定到vfio驱动</li><li>设置group的container</li><li>根据设备的BDF号为设备分配一个文件描述符</li></ul><pre><code>struct vfio_group_status group_status =
                { .argsz = sizeof(group_status) };
/* Open the group */
group = open("/dev/vfio/26", O_RDWR);
/* Test the group is viable and available */
ioctl(group, VFIO_GROUP_GET_STATUS, &amp;group_status);
if (!(group_status.flags &amp; VFIO_GROUP_FLAGS_VIABLE))
    /* Group is not viable (ie, not all devices bound for vfio) */
/* Add the group to the container */
ioctl(group, VFIO_GROUP_SET_CONTAINER, &amp;container);
/* Get a file descriptor for the device */
device = ioctl(group, VFIO_GROUP_GET_DEVICE_FD, "0000:06:0d.0");
</code></pre><h2>VFIO Device</h2><pre><code>struct vfio_device {
    struct kref            kref;
    struct device            *dev;
    const struct vfio_device_ops    *ops;
    struct vfio_group        *group;
    struct list_head        group_next;
    void                *device_data;
};
</code></pre><p>为了兼顾platform和pci设备,vfio统一对外提供<code>struct vfio_device</code>来描述vfio设备,并用device_data来指向如<code>struct vfio_pci_device</code>。Device即设备,但与真正的物理设备有区别的是,对于一个在硬件上独立的设备,单独构成一个iommu group,而如果是multi-function的设备,多个function之间是互联的,相互可以访问对方的数据,所以必须放到一个group里面。</p><p>通过group的ioctl操作和设备的的BDF号获取到设备描述符之后,在vfio_pci中有对应描述符的内核操作vfio_pci_ops,这个ops是在vfio_pci设备驱动vfio_pci_probe调用的时候注册到PCI设备的,probe的时候还会将设备加入到对应的group中。vfio_pci设备的ops中比较重要的是 vfio_pci_ioctl函数,提供了如下功能:</p><ul><li>VFIO_DEVICE_GET_INFO:获取设备信息,region数量、irq数量等</li><li>VFIO_DEVICE_GET_REGION_INFO:获取vfio_region的信息,包括配置空间的region和bar空间的region等</li><li>VFIO_DEVICE_GET_IRQ_INFO:获取设备中断相关的信息</li><li>VFIO_DEVICE_SET_IRQS:完成中断相关的设置</li><li>VFIO_DEVICE_RESET:设备复位</li><li>VFIO_DEVICE_GET_PCI_HOT_RESET_INFO:获取PCI设备hot reset信息</li><li>VFIO_DEVICE_PCI_HOT_RESET:设置PCI设备 hot reset</li><li>VFIO_DEVICE_IOEVENTFD:设置ioeventfd</li></ul><p>要暴露设备的能力到用户态空间,要让用户态能够直接访问设备配置空间并处理设备中断,对于PCI设备而言,其配置其配置空间是一个VFIO region,对应着一块MMIO内存,通过建立dma重映射让用户态能够直接访问设备配置空间,另外还需要建立中断重映射以让用户态驱动处理设备中断事件。</p><pre><code>struct vfio_device_info device_info = { .argsz = sizeof(device_info) };
/* Get a file descriptor for the device */
device = ioctl(group, VFIO_GROUP_GET_DEVICE_FD, "0000:06:0d.0");
/* Test and setup the device */
ioctl(device, VFIO_DEVICE_GET_INFO, &amp;device_info);
for (i = 0; i &lt; device_info.num_regions; i++) {
    struct vfio_region_info reg = { .argsz = sizeof(reg) };
    reg.index = i;
    ioctl(device, VFIO_DEVICE_GET_REGION_INFO, &amp;reg);
    /* Setup mappings... read/write offsets, mmaps
        * For PCI devices, config space is a region */
}
for (i = 0; i &lt; device_info.num_irqs; i++) {
    struct vfio_irq_info irq = { .argsz = sizeof(irq) };
    irq.index = i;
    ioctl(device, VFIO_DEVICE_GET_IRQ_INFO, &amp;irq);
    /* Setup IRQs... eventfds, VFIO_DEVICE_SET_IRQS */
}
/* Gratuitous device reset and go... */
ioctl(device, VFIO_DEVICE_RESET);
</code></pre><h2>Container,group和device绑定</h2><p>1.VFIO_SET_IOMMU: Container 绑定 IOMMU:</p><p>首先,VFIO的Container和IOMMU之间的绑定,通过在用户态通过ioctl调用VFIO_SET_IOMMU完成,绑定意味着将container管理的所有group都attach到IOMMU中,最终会将每个group中的每个设备都attach到IOMMU中,这意味着为设备建立IO页表完成初始化</p><pre><code>ioctl(container, VFIO_SET_IOMMU, VFIO_TYPE1_IOMMU)
    vfio_ioctl_set_iommu
        list_for_each_entry(group, &amp;container-&gt;group_list, container_next) {
        ret = driver-&gt;ops-&gt;attach_group(data, group-&gt;iommu_group);
            __iommu_attach_group
                ret = __iommu_group_for_each_dev(group, domain,
                     iommu_group_do_attach_device);
                        __iommu_attach_device
                            arm_smmu_attach_dev
                                建立设备的IO页表
</code></pre><p>2.VFIO\_GROUP\_SET_CONTAINER: 将Group设置到对应的Container:</p><p>VFIO提供接口由用户态指定Group绑定到哪个Container中,这个绑定操作会将group记录到container的链表中进行管理,并且如果已经设置好了vfio\_iommu\_driver,会进行group的attach操作,并进而完成该group中的设备的IO页表初始化</p><pre><code>VFIO_GROUP_SET_CONTAINER:
    vfio_group_set_container
        driver = container-&gt;iommu_driver;
        if (driver) {
            ret = driver-&gt;ops-&gt;attach_group(container-&gt;iommu_data,
                            group-&gt;iommu_group);
            if (ret)
                goto unlock_out;
        }
        group-&gt;container = container;
        container-&gt;noiommu = group-&gt;noiommu;
        list_add(&amp;group-&gt;container_next, &amp;container-&gt;group_list);
</code></pre><p>3.Device和Group之间的绑定关系源自设备和IOMMU的物理拓扑结构</p><h2>小结</h2><p>VFIO内核组件的实现与Linux内核的IOMMU、设备模型等紧密相连,通过抽象出VFIO的概念来完成对Linux内核组件的封装。本文主要通过VFIO的用户态接口的使用来介绍了VFIO的几个基本概念,包括VFIO Container、Group和Device。要让物理设备通过VFIO驱动暴露给用户态,需要完成以下步骤:</p><ul><li>首先将设备与原有驱动进行解绑,并重新绑定到VFIO驱动,VFIO驱动会为设备指定对应的group,设备属于哪个IOMMU group与设备和IOMMU的物理拓扑结构有关。</li><li>完成上述绑定之后,用户态驱动就可以通过<code>/dev/vfio/vfio</code>获取到VFIO 的container,设置vfio_iommu_driver的类型,通过container可以间接访问IOMMU完成dma映射。</li><li>然后可以通过<code>/dev/vfio/%group_id</code>获取到设备所属的group,通过ioctl将该group上的所有设备加入到container中。</li><li>然后通过group和设备BDF号可以获取到VFIO device的fd,并通过vfio提供的接口访问设备的配置空间和irq信息等,完成在用户态访问物理设备。</li></ul><p>VFIO设备直通有几个关键问题需要关注,如何访问直通设备的IO地址空间,如何完成中断重映射和DMA重映射让用户态驱动访问物理设备能力.</p><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2Fwxggg%2F2020-11-29-vfio-passthrough-1.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000380076">DAOS ARM64调测之旅</a></li><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000376121">回顾2022年计算机视觉领域最激动人心的进展</a></li><li><a href="https://aijishu.com/a/1060000000375922">量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!</a></li><li><a href="https://aijishu.com/a/1060000000375779">自制深度学习推理框架-前言-第一课</a></li><li><a href="https://aijishu.com/a/1060000000375145">YOLOv6精度提升的又一根稻草,感知量化的重参再设计,QARep值得内卷</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Tue, 17 Jan 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000380640</guid>
            <link>https://aijishu.com/a/1060000000380640</link>
        </item>
        <item>
            <title><![CDATA[DAOS ARM64调测之旅]]></title>
            <description><![CDATA[<p>背景概述</p><p>从IO500榜单上了解到,前10名有一半是DAOS,这是什么样一款存储软件,能如此优秀?从HDD到SSD,仅仅是性能提升、延迟降低,从SSD到SCM,不仅仅是性能提升,还支持按字节事务性访问,异常后回滚。SCM不带DMA,访问过程消耗大量的CPU资源,从软件架构上优化,就是想办法减少拷贝过程,诞生了RDMA零拷贝;从硬件上优化,intel推出了DSA加速器。DAOS+SCM新架构值得在ARM64上尝试。</p><h2>编译问题</h2><p>DAOS官网上明确说仅支持x86+Optane内存+NVMe SSD商用化,同时提供了用内存模拟Optane内存的实验特性。ARM64跑DAOS就有了可能。我们首先进行了版本编译,碰到了静态检查结构体大小报错。通过分析发现根因是pthread\_mutex在不同平台上,长度是不一样的,x86 64是40字节,ARM64是48字节,多了8字节,触发了结构体大小断言报错。提问题单,社区帮忙调整数据结构解决了断言错误。接下来就是依赖的SPDK组件编译报错,DAOS设置spdk\_arch是x86,修改为读编译主机arch,是ARM64就使用native方式编译,解决了SPDK编译报错问题。再下来是缺少libipmctl.so,ipmctl是intel Optane的管理工具,只有x86版本,ARM64需要去掉libipmctl依赖,增加ipmctl空接口后,解决了依赖报错问题。telemetry的go代码限制只有amd64编译,修改为amd64、arm64都编译。最后一个问题是Dup2在ARM64上不支持,使用Dup3来支持Dup2。</p><h2>IO500调测</h2><p>版本编译出来后,在ARM64上部署测试,一跑就挂死,调用栈是问号,打开所有调试信息,每次挂死前都是在mercury网络模块,无法进一步定位。直觉判定可能是内核页大小问题导致的,x86只支持4K页,ARM64支持4K、16K、64K页,改成4K页后,就能正常跑起来不挂死了。又出现了新问题,找不到网络接口,异常退出了。看日志,不支持bond、vlan等虚拟网络设备,改成使用物理网卡后,网络正常识别,集群正常起来。不一会就出现网络超时故障,查看日志有的是4秒超时,有的是请求发出去立即就超时了,看起来是集群间时间没有同步,对端收到后时间差超过超时门限,触发超时流程,时间同步后,几秒超时问题消失。跑一段时间后还是出现超时,且系统明显卡顿,查看CPU并不忙,查看内存free情况,发现内存很少,perf抓火焰图,发现内存申请走了慢路径申请,减少模拟Optane的内存大小后,网络超时问题消失。IO500测试60~70秒左右,就出现集群空间满,测试终止。查看SCM空间已用完,NVMe空间剩余还很大。上社区论坛查到,元数据只保留在SCM上,SCM空间不足也不会转存到NVMe中,直接上报空间不足错误。只能加大物理内存,从256GB加到512GB后,保留了更多的内存,IO500能测试到200秒左右还是耗光了SCM,IO500需要测试300秒,成绩才是有效的,因此需要想办法减少SCM空间使用。从DAOS架构图上看到SCM内存用来存放元数据、非对齐的数据、小块数据,查看代码,小块数据默认是4K以下就存SCM。修改容器属性,io门限值降低到2K,这样IO500终于能测试完。增加target个数,增加并发度,又出现了SCM耗尽,仔细读DAOS文档,提到每个target会预留SCM、NVMe内存做聚合使用,查看代码找到了SCM会保留2GB、NVMe保留10GB,没有设置接口,直接修改代码SCM保留512MB,每个target节省了1.5GB,一个rank 16个target共节省了24GB内存,每个rank总共分配了90GB,节省了26%的内存。IO500跑完再没出现过SCM耗尽,性能也得到了大幅提升。逐步增加客户端个数,发现mdtest部分测试项随着并发度增加能一直增加,说明客户端有瓶颈,10台客户端里有4台性能较差,更换性能更好的客户端后,性能进一步提升。开启端到端校验后测试,发现sha512新建容器大概率失败,X86每次都是成功的。执行isal_crypto下的sha512测试用例,都是通过的。看github问题列表,发现2021年就有人上报了在ARM64上sha512值错误并提供了测试程序。分析sha512代码,发现缺少了多次更新不足一块数据的追加处理,修复后,测试程序通过,DAOS端到端sha512校验也通过了。</p><h2>功能验证</h2><p>由于IO500只跑性能,没有校验数据是否正确,我们通过复制大量不同大小的文件到DAOS文件系统,重启DAOS集群后,再复制回来,检查前后的md5值是否一致,来校验数据是否正确。前后md5值是一致的,确认数据一致性没有问题。压力测试大概率出现复制回来过程中,服务端coredump,看log是池版本号为NULL触发断言,待分析。扩展测试了2/3副本、EC 2+1 2+2 4+2,数据校验均正确。</p><p>在社区上看到DAOS计划用容器来支持块设备,目前容器不支持预先指定容量。DAOS提供dfs插件支持fio测试,实际还是文件系统,并不是块设备。fio测试了单IO时延,写4K随机写110us、读160us、混合读写150us,接近100us。单台服务器4K多并发随机写测试420K IOPS。fusionstorage、阿里云已经能做到50us,100万IOPS,看来还有优化空间。</p><p>ARM64运行DAOS还有哪些问题?我们执行了daos_test、run_test.sh,跟x86对比测试,发现ARM64上出现vos小io测试错误、epoch错误、对象检查错误,分析测试代码,发现是测试代码本身的问题,x86能通过是因为局部变量初始值是0,ARM64初始值是随机的,修改测试代码后,这三个用例能通过。还发现EC一个用例失败,正在分析中,其他测试都跟x86一致。</p><h2>总结展望</h2><p>DAOS ARM64调测过程总体来说,比较顺利,主要是断言比较多,能快速定位问题。大量使用spdk、isal、isal_ctypto,pmdk模块,ARM64已经很好的适配过这些模块,因此很少补丁改动,即可在arm64上编译通过,运行稳定。dashboard使用promethues+grafana,性能测试过程可视化,方便诊断性能。每个target单线程,没有多线程并发冲突问题,也就没有ARM64弱序问题。问题分析过程中,大量参考了DAOS社区问题单,分析步骤详细,提供了分析思路。</p><p>后续重点在社区添加ARM64 CI,覆盖多种OS编译、单元测试,定期取主线版本进行性能测试。使用内存备电验证pmdk刷cache、数据校验正确性验证。社区版本支持UCX、NVMe of RDMA模块后,进行ARM64UCX、NoF功能测试。</p><h2>ARM64补丁列表</h2><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F8998" target="blank">DAOS-10569 client: fix build on aarch64</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F8984" target="blank">DAOS-10148 tse: fix TSE task buffer to account for aarch64</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9398" target="blank">DAOS-10871 build: Fix aarch64 build SPDK error</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9401" target="blank">DAOS-10872 control: Fix aarch64 build control errors</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9505" target="blank">DAOS-10922 control: Implement ipmctl for aarch64</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9487" target="blank">DAOS-10899 test: use expected variable to do assert checking</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9486" target="blank">DAOS-10898 obj: fix the assert in small_io test</a></p><p><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fdaos-stack%2Fdaos%2Fpull%2F9456" target="blank">DAOS-10891 tests: fix incorrect assert in check_oclass</a></p><blockquote>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.openeuler.org%2Fzh%2Fblog%2Ffengchunsong%2FDAOS%2520ARM64%E8%B0%83%E6%B5%8B%E4%B9%8B%E6%97%85.html" target="blank">openEuler</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000379813">Virtio协议概述</a></li><li><a href="https://aijishu.com/a/1060000000376121">回顾2022年计算机视觉领域最激动人心的进展</a></li><li><a href="https://aijishu.com/a/1060000000375922">量化部署篇 | Vision Transformer应该如何进行PTQ量化?这个方法或许可以参考!</a></li><li><a href="https://aijishu.com/a/1060000000375779">自制深度学习推理框架-前言-第一课</a></li><li><a href="https://aijishu.com/a/1060000000375145">YOLOv6精度提升的又一根稻草,感知量化的重参再设计,QARep值得内卷</a></li><li><a href="https://aijishu.com/a/1060000000374982">xNN:支付宝端侧深度学习框架</a></li></ul><blockquote>更多Arm服务器干货请关注<a href="https://aijishu.com/blog/armsoft">Arm服务器</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Thu, 12 Jan 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000380076</guid>
            <link>https://aijishu.com/a/1060000000380076</link>
        </item>
        <item>
            <title><![CDATA[Virtio协议概述]]></title>
            <description><![CDATA[<p>摘要</p><p>半虚拟化设备(Virtio Device)在当前云计算虚拟化场景下已经得到了非常广泛的应用, 并且现在也有越来越多的物理设备也开始支持Virtio协议,即所谓的<code>Virtio Offload</code>, 通过将virtio协议卸载到硬件上(例如virtio-net网卡卸载,virtio-scsi卸载)让物理机和虚拟机都能够获得加速体验。 本文中我们来重点了解一下virtio技术中的一些关键点,方便我们加深对半虚拟化的理解。 本文适合对IO虚拟化有一定了解的人群阅读,本文的目的是对想要了解virtio内部机制的读者提供帮助。</p><p>在开始了解virtio之前,我们先思考一下几个相关问题:</p><ul><li>virtio设备有哪几种呈现方式?</li><li>virtio-pci设备的配置空间都有哪些内容?</li><li>virtio前端和后端基于共享内存机制进行通信,它是凭什么可以做到无锁的?</li><li>virtio机制中有那几个关键的数据结构?virtio配置接口存放在哪里?virtio是如何工作的?</li><li>virtio前后端是如何进行通信的?irqfd和ioeventfd是什么回事儿?在virtio前后端通信中是怎么用到的?</li><li>virtio设备支持MSIx,在qemu/kvm中具体是怎么实现对MSIx的模拟呢?</li><li>virtio modern相对于virtio legay多了哪些新特性?</li></ul><h2>0. 简单了解一下Virtio Spec协议</h2><p>virtio协议标准最早由IBM提出,virtio作为一套标准协议现在有专门的技术委员会进行管理, 具体的标准可以访问<a href="https://aijishu.com/link?target=http%3A%2F%2Fdocs.oasis-open.org%2Fvirtio%2Fvirtio%2Fv1.0%2Fvirtio-v1.0.html" target="blank"><code>virtio</code>官网</a>, 开发者可以向技术委员会提供新的virtio设备提案(<code>RFC</code>),经过委员会通过后可以增加新的virtio设备类型。</p><p>组成一个virtio设备的四要素包括:<strong>设备状态域,<code>feature bits</code>,设备配置空间,一个或者多个<code>virtqueue</code></strong>。 其中设备状态域包含6种状态:</p><ul><li>ACKNOWLEDGE(1):GuestOS发现了这个设备,并且认为这是一个有效的virtio设备;</li><li>DRIVER (2) : GuestOS知道该如何驱动这个设备;</li><li>FAILED (128) : GuestOS无法正常驱动这个设备,Something is wriong;</li><li>FEATURES_OK (8) : GuestOS认识所有的feature,并且feature协商一完成;</li><li>DRIVER_OK (4) : 驱动加载完成,设备可以投入使用了;</li><li>DEVICE_NEEDS_RESET (64) :设备触发了错误,需要重置才能继续工作。</li></ul><p><code>feature bits</code>用来标志设备支持那个特性,其中bit0-bit23是特定设备可以使用的<code>feature bits</code>, bit24-bit37预给队列和feature协商机制,bit38以上保留给未来其他用途。 例如:对于virtio-net设备而言,feature bit0表示网卡设备支持checksum校验。<code>VIRTIO_F_VERSION_1</code>这个feature bit用来表示设备是否支持virtio 1.0 spec标准。</p><p>在virtio协议中,所有的设备都使用virtqueue来进行数据的传输。<strong>每个设备可以有0个或者多个virtqueue,每个virtqueue占用2个或者更多个4K的物理页</strong>。 virtqueue有<code>Split Virtqueues</code>和<code>Packed Virtqueues</code>两种模式, 在<code>Split virtqueues</code>模式下virtqueue被分成若干个部分, 每个部分都是前端驱动或者后端单向可写的(不能两端同时写)。 每个virtqueue都有一个16bit的queue size参数,表示队列的总长度。 每个virtqueue由3个部分组成:</p><pre><code>    +-------------------+--------------------------------+-----------------------+
    | Descriptor Table  |   Available Ring  (padding)    |       Used Ring       |
    +-------------------+--------------------------------+-----------------------+
</code></pre><ul><li>Descriptor Table:存放IO传输请求信息;</li><li>Available Ring:记录了Descriptor Table表中的哪些项被更新了,前端Driver可写但后端只读;</li><li>Used Ring:记录Descriptor Table表中哪些请求已经被提交到硬件,前端Driver只读但后端可写。</li></ul><p>整个virtio协议中设备IO请求的工作机制可以简单地概括为:</p><ol><li>前端驱动将IO请求放到<code>Descriptor Table</code>中,然后将索引更新到<code>Available Ring</code>中,然后kick后端去取数据;</li><li>后端取出IO请求进行处理,然后结果刷新到<code>Descriptor Table</code>中再更新<code>Using Ring</code>,然后发送中断notify前端。</li></ol><p>从virtio协议可以了解到<strong>virtio设备支持3种设备呈现模式</strong>:</p><ul><li>Virtio Over PCI BUS,依旧遵循PCI规范,挂在到PCI总线上,作为virtio-pci设备呈现;</li><li>Virtio Over MMIO,部分不支持PCI协议的虚拟化平台可以使用这种工作模式,直接挂载到系统总线上;</li><li>Virtio Over Channel I/O:主要用在s390平台上,virtio-ccw使用这种基于channel I/O的机制。</li></ul><p>其中,Virtio Over PCI BUS的使用比较广泛,作为PCI设备需按照规范要通过PCI配置空间来向操作系统报告设备支持的特性集合, 这样操作系统才知道这是一个什么类型的virtio设备,并调用对应的前端驱动和这个设备进行握手,进而将设备驱动起来。 QEMU会给virtio设备模拟PCI配置空间,对于virtio设备来说PCI Vendor ID固定为0x1AF4, PCI Device ID 为 0x1000到0x107F之间的是virtio设备。 同时,在不支持PCI协议的虚拟化平台上,virtio设备也可以直接通过MMIO进行呈现, virtio-spec 4.2<a href="https://aijishu.com/link?target=https%3A%2F%2Fdocs.oasis-open.org%2Fvirtio%2Fvirtio%2Fv1.1%2Fcsprd01%2Fvirtio-v1.1-csprd01.html%23x1-1440002" target="blank">Virtio Over MMIO</a>有针对virtio-mmio设备呈现方式的详细描述,mmio相关信息可以直接通过内核参数报告给Linux操作系统。 本文主要基于virtio-pci展开讨论。</p><p>前面提到virtio设备有<code>feature bits</code>,<code>virtqueue</code>等四要素,那么在virtio-pci模式下是如何呈现的呢? 从virtio spec来看,老的virtio协议和新的virtio协议在这一块有很大改动。 virtio legacy(virtio 0.95)协议规定,对应的配置数据结构(virtio common configuration structure) 应该存放在设备的BAR0里面,我们称之为<code>virtio legay interface</code>,其结构如下:</p><pre><code>                       virtio legacy ==&gt; Mapped into PCI BAR0
    +------------------------------------------------------------------+
    |                    Host Feature Bits[0:31]                       |
    +------------------------------------------------------------------+
    |                    Guest Feature Bits[0:31]                      |
    +------------------------------------------------------------------+
    |                    Virtqueue Address PFN                         |
    +---------------------------------+--------------------------------+
    |           Queue Select          |           Queue Size           |
    +----------------+----------------+--------------------------------+
    |   ISR Status   | Device Stat    |           Queue Notify         |
    +----------------+----------------+--------------------------------+
    |       MSI Config Vector         |         MSI Queue Vector       |
    +---------------------------------+--------------------------------+
</code></pre><p>对于新的<code>virtio modern</code>,协议将配置结构划分为5种类型:</p><pre><code>/* Common configuration */
#define VIRTIO_PCI_CAP_COMMON_CFG        1
/* Notifications */
#define VIRTIO_PCI_CAP_NOTIFY_CFG        2
/* ISR Status */
#define VIRTIO_PCI_CAP_ISR_CFG           3
/* Device specific configuration */
#define VIRTIO_PCI_CAP_DEVICE_CFG        4
/* PCI configuration access */
#define VIRTIO_PCI_CAP_PCI_CFG           5
</code></pre><p>以上的每种配置结构是直接映射到virtio设备的BAR空间内,那么如何指定每种配置结构的位置呢? 答案是通过<code>PCI Capability list</code>方式去指定,这和物理PCI设备是一样的,体现了virtio-pci的协议兼容性。</p><pre><code>struct virtio_pci_cap {
        u8 cap_vndr;    /* Generic PCI field: PCI_CAP_ID_VNDR */
        u8 cap_next;    /* Generic PCI field: next ptr. */
        u8 cap_len;     /* Generic PCI field: capability length */
        u8 cfg_type;    /* Identifies the structure. */
        u8 bar;         /* Where to find it. */
        u8 padding[3];  /* Pad to full dword. */
        le32 offset;    /* Offset within bar. */
        le32 length;    /* Length of the structure, in bytes. */
};
</code></pre><p>只是略微不同的是,virtio-pci的Capability有一个统一的结构, 其中<code>cfg_type</code>表示Cap的类型,bar表示这个配置结构被映射到的BAR空间号。 这样每个配置结构都可以通过BAR空间直接访问,或者通过PCI配置空间的<code>VIRTIO_PCI_CAP_PCI_CFG</code>域进行访问。 每个Cap的具体结构定义可以参考virtio spec 4.1.4.3小节。</p><h1>1. 前后端数据共享</h1><p>传统的纯模拟设备在工作的时候,会触发频繁的陷入陷出, 而且IO请求的内容要进行多次拷贝传递,严重影响了设备的IO性能。 virtio为了提升设备的IO性能,采用了共享内存机制,<strong>前端驱动会提前申请好一段物理地址空间用来存放IO请求,然后将这段地址的GPA告诉QEMU</strong>。 前端驱动在下发IO请求后,QEMU可以直接从共享内存中取出请求,然后将完成后的结果又直接写到虚拟机对应地址上去。<strong>整个过程中可以做到直投直取,省去了不必要的数据拷贝开销</strong>。</p><p><strong><code>Virtqueue</code>是整个virtio方案的灵魂所在</strong>。每个virtqueue都包含3张表,<code>Descriptor Table</code>存放了IO请求描述符,<code>Available Ring</code>记录了当前哪些描述符是可用的,<code>Used Ring</code>记录了哪些描述符已经被后端使用了。</p><pre><code>                          +------------------------------------+
                          |       virtio  guest driver         |
                          +-----------------+------------------+
                            /               |              ^
                           /                |               \
                          put            update             get
                         /                  |                 \
                        V                   V                  \
                   +----------+      +------------+        +----------+
                   |          |      |            |        |          |
                   +----------+      +------------+        +----------+
                   | available|      | descriptor |        |   used   |
                   |   ring   |      |   table    |        |   ring   |

...

@github-actions
Copy link
Contributor

http://localhost:1200/aijishu/blog/readings - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[极术读书 - 极术社区]]></title>
        <link>https://aijishu.com/blog/readings</link>
        <atom:link href="http://localhost:1200/aijishu/blog/readings" rel="self" type="application/rss+xml" />
        <description><![CDATA[极术读书 - 极术社区 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 17:49:02 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[免费国家精品课程:《嵌入式系统及应用》MOOC在线课程,第13次开课!]]></title>
            <description><![CDATA[<blockquote>极术读书是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>。</blockquote><p>和安谋科技技术人才生态有非常深入合作的苏州大学王宜怀教授,正在授课的基于Arm® Cortex®-M处理器的<strong>《嵌入式系统及应用》在线开放课程</strong>一直是我们极力推荐的。该课程连续几年被评为<strong>国家精品课程</strong>。</p><p>嵌入式系统是嵌入式人工智能与物联网的重要基础,该课程以Arm Cortex-M微处理器为蓝本,以软硬件构件为主线,基于嵌入式软件工程基本原理,按照"<strong>通用知识—驱动构件使用方法—测试实例—芯片编程结构—构件设计方法</strong>”的线条,逐步阐述嵌入式系统基本知识要素及较为规范的底层软硬件相结合的设计方法。</p><p><strong>目前是本课程的第13次开课,开课时间是2023年02月20日 ~ 2023年06月16日。</strong>如果你想掌握构成计算机的基本部件原理,掌握计算机高级程序设计方法,为从寄存器级理解软件干预硬件提供基础,那就赶快查看下方信息,报名学习吧!现在加入还来得及喔~</p><h2>《嵌入式系统及应用》在线开放课程</h2><p><a href="https://v.qq.com/x/page/j3325qf1xro.html">https://v.qq.com/x/page/j3325qf1xro.html</a></p><p>本视频由授课教师提供</p><h3><strong>01 基本介绍</strong></h3><ul><li><strong>课程名称:</strong>《嵌入式系统及应用》</li><li><strong>授课单位:</strong>苏州大学</li><li><strong>授课教师:</strong>王宜怀、张建、刘长勇</li><li><strong>在线学习网址:</strong>  <a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.icourse163.org%2Fcourse%2FSUDA-1001754273" target="blank">[<strong>爱课程-中国大学MOOC</strong>]</a></li><li><strong>本次开课时间:</strong>2023年02月20日 ~ 2023年06月16日</li></ul><h3>02 课程概述</h3><p>《嵌入式系统及应用》课程作为嵌入式人工智能与物联网相关专业的基础课程,以Arm Cortex-M微处理器为蓝本,采用构件化开发,针对每个知识点,提供样本程序(葫芦),学生通过模仿该程序稍加修改后可完成符合自我要求的程序(照葫芦画瓢)。课程按照<strong>“通用知识—驱动构件使用方法—测试实例—芯片编程结构—构件设计方法”</strong>的线条,逐步阐述嵌入式系统基本知识要素及较为规范的底层软硬件相结合的设计方法。</p><h3>03 课程用书</h3><p>本课程教学用书《嵌入式技术基础与实践(第6版)—基于STM32L431微控制器》,该教材历经十多年凝练,仔细梳理了嵌入式系统的通用基础知识要素,注重把握通用知识与芯片相关知识之间的平衡、把握硬件与软件的关系、对底层驱动进行构件化封装、设计合理的测试用例,教材内含简明实验套件,结合网上电子资源,方便读者进行实践与应用。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbqNk" alt="51546da303679fd168b5fe7d75d10e65.jpg" title="51546da303679fd168b5fe7d75d10e65.jpg"></p><p><strong>《嵌入式技术基础与实践(第6版)》(王宜怀主编)</strong></p><blockquote>【书内含通用嵌入式计算机GEC,型号:AHL-STM32L431,可完成书中基本实验】</blockquote><p><strong>电子资源下载地址及路径:</strong></p><p>“<a href="https://aijishu.com/link?target=https%3A%2F%2Fsumcu.suda.edu.cn%2F" target="blank">https://sumcu.suda.edu.cn/</a>”→“金葫芦专区”→“嵌入式书6版”,右边为下载索引</p><p><strong>点击<a href="https://aijishu.com/link?target=https%3A%2F%2Ftuicashier.youzan.com%2Fpay%2Fwscgoods_order%3Fbanner_id%3Dseach.16152946%7Esearch%7E7%7E7LEMSxlm%26words%3D%E5%B5%8C%E5%85%A5%E5%BC%8F%26alg%3D0%26slg%3Dconsumer-search%2CstandardModify%2C30be7fd3-df55-4535-c709-11c1b3a78e09%2C711.545_c9498a9569324a1ab4d18b403e0cc497%26reft%3D1630934839602%26spm%3Dseach.16152946%26is_share%3D1%26shopAutoEnter%3D1%26sl%3D3NTPzP%26from_params%3Dsl%7E3NTPzP%21online_kdt_id%7E16152946%26sub_kdt_id%3D16152946%26st%3D3%26alias%3D3f579wrkbwq9es4%26is_silence_auth%3D1" target="blank">链接</a>即可购买教材:</strong></p><h3><strong>04 课程大纲</strong></h3><p><strong>01 概述</strong></p><p>1.1 初识嵌入式系统<br>1.2 嵌入式系统的定义、发展简史、分类及特点<br>1.3 嵌入式系统的学习困惑、知识体系及学习建议<br>1.4 微控制器与应用处理器简介<br>1.5 嵌入式系统常用术语</p><p><strong>02 Arm Cortex-M4微处理器</strong></p><p>2.1 Arm Cortex-M4微处理器简介<br>2.2 寻址方式与机器码的获取方法<br>2.3 基本指令分类解析<br>2.4 汇编语言的基本语法</p><p><strong>03 存储器映像、中断源与硬件最小系统</strong></p><p>3.1 STM32L系列MCU概述<br>3.2 STM32L4的引脚图与硬件最小系统<br>3.3 由MCU构建通用嵌入式计算机</p><p><strong>04 GPIO及程序框架</strong></p><p>4.1 GPIO通用基础知识<br>4.2 软件干预硬件的方法<br>4.3 认识工程框架<br>4.4 GPIO构件的制作过程<br>4.5 第一个汇编语言工程:控制小灯闪烁<br>4.6 实验一 熟悉实验开发环境及GPIO编程</p><p><strong>05 嵌入式硬件构件与底层驱动构件基本规范</strong></p><p>5.1 嵌入式硬件构件<br>5.2 嵌入式底层驱动构件的概念与层次模型<br>5.3 底层驱动构件的封装规范<br>5.4 硬件构件及其驱动构件的复用与移植方法</p><p><strong>06 串行通信模块及第一个中断程序结构</strong></p><p>6.1 异步串行通信的通用基础知识<br>6.2 基于构件的串行通信编程方法<br>6.3 UART构件的制作过程<br>6.4 中断机制及中断编程步骤<br>6.5 实验二 串口通信及中断实验</p><p><strong>07 定时器相关模块</strong></p><p>7.1 定时器通用基础知识<br>7.2 STM32L431中的定时器<br>7.3 脉宽调制<br>7.4 输入捕捉与输出比较<br>7.5 实验三 定时器及PWM实验</p><p><strong>08 Flash在线编程、ADC与DAC  </strong></p><p>8.1 Flash在线编程  <br>8.2 ADC<br>8.3 DAC<br>8.4 实验四 ADC实验</p><p><strong>09&nbsp;SPI、I2C与TSC模块  </strong></p><p>9.1 串行外设接口SPI模块  <br>9.2 集成电路互联总线I2C模块<br>9.3 触摸感应控制器TSC模块<br>9.4 实验五 SPI通信实验</p><p><strong>10 CAN总线、DMA与位带操作</strong>  </p><p>10.1 CAN总线<br>10.2 DMA<br>10.3 位带操作</p><p><strong>11 系统时钟与其他功能模块</strong>  </p><p>11.1 时钟系统<br>11.2 复位模块与看门狗模块<br>11.3 电源控制模块与CRC校验模块<br>11.4 实验六 综合实验</p><p><strong>12 应用案例  </strong></p><p>12.1 嵌入式系统稳定性问题<br>12.2 外接传感器及执行部件的编程方法<br>12.3 实时操作系统的简明实例<br>12.4 嵌入式人工智能的简明实例<br>12.5 NB-IoT的应用简介<br>12.6 4G、Cat1、Wi-Fi及WSN的应用</p><h3><strong>05 预备知识</strong></h3><p>必须具备以下知识:</p><ul><li>计算机硬件基础(或模拟电路与数字电路、计算机组成、汇编语言、微机原理)</li><li>高级程序语言设计等(如C语言)</li></ul><p>学生通过学习上述课程,基本掌握构成计算机的基本部件原理,掌握计算机高级程序设计方法,为从寄存器级理解软件干预硬件提供基础。</p>
                                                    ]]></description>
            <pubDate>Wed, 22 Feb 2023 17:49:01 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385950</guid>
            <link>https://aijishu.com/a/1060000000385950</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】2023年元宵50本《嵌入式系统设计》赠书名单公布]]></title>
            <description><![CDATA[<p>2023年元宵节,极术社区联合安谋科技组织了<a href="https://aijishu.com/e/1120000000381671">【元宵赠书】50本《嵌入式系统设计—基于Cortex-M处理器与RTOS构建》新书免费领</a>,获得了很多工程师的支持。下面将中奖名单公布如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLPU" alt="1675672651957.jpg" title="1675672651957.jpg"></p><p>恭喜上面的中奖者,极术读书工作人员稍后将会发送邮件给中奖人员,请注意查收邮件。没有中奖的用户也不用灰心,极术读书会定期组织精选好书的活动,欢迎关注。</p>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000383140</guid>
            <link>https://aijishu.com/a/1060000000383140</link>
        </item>
        <item>
            <title><![CDATA[9位院士12位专家联合撰文:智能计算的新进展、挑战与未来 | Science合作期刊]]></title>
            <description><![CDATA[<blockquote>文章作者:允中  <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2Fd7PpTEHjfH33fVRTsOaucg" target="blank">量子位</a></blockquote><p>2023年1月3日,海内外9位院士及12位专家在Science《科学》合作期刊Intelligent Computing发表长篇综述论文《智能计算的最新进展、挑战和未来》。文章全面阐述了智能计算的理论基础、智能与计算的技术融合、重要应用、重大挑战和未来前景,将为学术界和工业界的相关研究人员提供全方位的参考和对智能计算领域的指引性见解。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKa" alt="image.png" title="image.png"></p><p>论文地址:<a href="https://aijishu.com/link?target=https%3A%2F%2Fspj.science.org%2Fdoi%2F10.34133%2Ficomputing.0006" target="blank">https://spj.science.org/doi/10.34133/icomputing.0006</a></p><h2>简介</h2><p>人类社会正从信息社会进入智能社会,计算已成为推动社会发展的关键要素。在万物互联的数字文明新时代,传统的基于数据的计算已经远远不能满足人类对更高智能水平的追求。</p><p>近年来,计算和信息技术飞速发展,深度学习的空前普及和成功将人工智能(AI)确立为人类探索机器智能的前沿领域。自此产生了一系列突破性的研究成果,包括Yann LeCun提出的卷积神经网络和Yoshua Bengio在深度学习因果推理领域的成果。</p><p>2016年3月,DeepMind推出的AI围棋程序<strong>AlphaGo</strong>与世界顶尖围棋高手李世石对战,在世界范围内引起了前所未有的关注。这场划时代的人机大战以AI的压倒性胜利而告终,成为将AI浪潮推向全新高度的催化剂。</p><p>AI的另一个重要推动者是<strong>大型预训练模型的出现</strong>,这些模型已经开始广泛应用于自然语言和图像处理,以在迁移学习的帮助下处理各种各样的应用。其中最具代表性的是自然语言处理模型GPT-3,已经证明具有高度结构复杂性和大量参数的大模型可以提高深度学习的性能。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKb" alt="image.png" title="image.png"></p><p>计算能力是支撑智能计算的重要因素之一。面对信息社会中庞大的数据源、异构的硬件配置和不断变化的计算需求,智能计算主要通过<strong>垂直和水平</strong>架构来满足智能任务的计算能力要求。</p><p><strong>垂直架构</strong>的特点是同质化的计算基础设施,主要通过应用智能方法提高资源利用效率来提升计算能力。</p><p>相比之下,<strong>水平架构</strong>对异构和广域计算资源进行协调和调度,使协作计算的效果最大化。例如,2020年4月,针对全球COVID-19研究的计算需求,Folding@home在三周内联合40万名计算志愿者,实现了2.5Exaflops的计算量,超过了世界上任何一台超级计算机。</p><p>尽管在智能和计算方面取得了巨大成功,但我们在这两个领域仍然面临着一些重大挑战:</p><p><strong>智能方面的挑战。</strong></p><p>使用深度学习的AI目前在可解释性、通用性、可进化性和自主性方面面临着重大挑战。与人类智能相比,当前大多数AI技术的作用都很弱,而且只能在特定领域或任务中发挥良好作用。从基于数据的智能升级到更多样化的智能,包括感知智能、认知智能、自主智能和人机融合智能等,也面临着重大的理论和技术挑战。</p><p><strong>计算方面的挑战。</strong></p><p>数字化浪潮带来了应用、连接、终端、用户以及数据量前所未有的增长,所有这些都需要巨大的计算能力。满足如此快速增长的计算能力需求变得越来越具有挑战性。智能社会中的巨型任务依赖于各种特定计算资源的高效组合。此外,传统的硬件模式不能很好地适应智能算法,制约了软件的发展。</p><p>迄今为止,智能计算还没有一个被普遍接受的定义。考虑到世界的三个基本空间,即人类社会空间、物理空间和信息空间日益紧密融合,我们从解决复杂的科学和社会问题的角度提出了智能计算的新定义:</p><blockquote><strong>智能计算是支撑万物互联的数字文明时代新的计算理论方法、架构体系和技术能力的总称。智能计算根据具体的实际需求,以最小的代价完成计算任务,匹配足够的计算能力,调用最好的算法,获得最优的结果。</strong></blockquote><p>智能计算的新定义是为响应人类社会、物理世界和信息空间三元融合快速增长的计算需求而提出的。智能计算以人为本,追求高计算能力、高能效、智能和安全。其目标是提供通用、高效、安全、自主、可靠、透明的计算服务,以支持大规模、复杂的计算任务。图1为智能计算的整体理论框架,它体现了支持人类社会—物理世界—信息空间集成的多种计算范式。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKc" alt="image.png" title="image.png"></p><h2>智能计算基础</h2><p>智能计算是数字文明时代支撑万物互联的新型计算理论方法、架构体系和技术能力的总称。利用智能计算可以实现许多经典和前沿研究领域的创新,以解决复杂的科学和社会问题。智能计算的基本要素包括人的智能、机器的能力以及由万物组成的物理世界。</p><p>在理论框架中,人是智能计算的核心和智慧的源泉,代表着原始的、与生俱来的智能,称为<strong>元智能</strong>。</p><p>元智能包括理解、表达、抽象、推理、创造和反思等人类高级能力,其中包含人类积累的知识。元智能以碳基生命为载体,是由个体和生物群体经过百万年的进化产生的,它包括生物具身智能、脑智能(尤其是人脑)和群体智能。所有的智能系统都是由人类设计和建造的。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKd" alt="image.png" title="image.png"></p><p>因此,在智能计算的理论体系中,人类的智慧是智能的源泉,计算机是人类智能的赋能。我们称计算机的智能为<strong>通用智能</strong>。</p><p>通用智能代表计算机解决具有广泛外延的复杂问题的能力,以硅基设施为载体,由个体和群体计算设备产生。生物智能可以在以下四个层次上移植到计算机上:数据智能、感知智能、认知智能和自主智能。元智能和通用智能如图2所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKe" alt="image.png" title="image.png"></p><p>智能计算面临大场景、大数据、大问题、泛在需求的挑战。算法模型变得越来越复杂,需要超级计算能力来支持越来越大的模型训练。目前,计算资源已经成为提高计算机智能研究水平的障碍。随着智能算法的发展,拥有丰富计算资源的机构可能形成系统的技术垄断。经典的超级计算机已经难以满足AI对计算能力的需求。</p><p>虽然通过算法优化可以在一定程度上降低算力需求,但并不能从根本上解决这个问题。需要从架构、加速模块、集成模式、软件栈等多个维度进行全面优化,如图3所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKf" alt="image.png" title="image.png"></p><p>智能计算在理论技术上具有以下特点(图4):理论技术上的自学习和可进化性,架构上的高计算能力和高能效,系统方法上的安全性和可靠性,运行机制上的自动化和精确性,以及服务性上的协作和泛在性。智能计算包括两个本质方面:<strong>智能和计算,两者相辅相成</strong>。</p><p>智能促进了计算技术的发展,计算是智能的基础。提高计算系统性能和效率的高级智能技术范式是<strong>“智能驱动的计算”</strong>。支持计算机智能发展的高效、强大的计算技术范式是<strong>“面向智能的计算”</strong>。</p><p>两种基本范式从五个方面进行创新,提升计算能力、能源效率、数据使用、知识表达和算法能力,实现泛在、透明、可靠、实时、自动化的服务。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKg" alt="image.png" title="image.png"></p><h2>智能驱动的计算</h2><p>提高计算的普适性对智能计算至关重要。现实场景中的问题,例如模拟、图(gragh)(图5)等,需要进行各种计算。智能计算的另一个关键点是如何提高计算的智能化水平。从经验上来说,我们常常需要向自然界的智能生物学习,计算也不例外,例如三大经典智能方法:人工神经网络(图6)、模糊系统和进化计算,都是受生物智能启发提出的算法。智能计算理论包括但不限于以上几种计算,以实现高度的泛在化和智能化。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKh" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKi" alt="image.png" title="image.png"></p><p>智能系统在开始工作之前,首先要进行<strong>智能感知</strong>。因此,感知智能在所有智能系统中都起着至关重要的作用。感知智能的重点是多模态感知、数据融合、智能信号提取和处理。</p><p>典型的例子包括智慧城市管理、自动潜水系统、智能防御系统和自主机器人。感知智能研究中最热门的领域是模拟人类的五种感觉能力,视觉、听觉、嗅觉、味觉和触觉。</p><p>此外,智能传感还包括温度、压力、湿度、高度、速度、重力等,需要大量的计算或数据训练来提高其性能。</p><p>近年来,随着模式识别和深度学习技术的全面应用,机器的感知智能已经超过人类,在语音、视觉和触觉识别方面取得了重大进展。由于其日益增长的重要性和日益拓宽的应用领域,智能传感器受到了广泛关注。如图7所示,智能传感器具有各种形式以满足不同应用的需求,并且更新更好的型号正在被不断的开发出来。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKj" alt="image.png" title="image.png"></p><p><strong>认知智能</strong>是指机器具有像人一样的逻辑理解和认知能力,特别是思考、理解、总结和主动应用知识的能力。它描述了智能体在真实环境中处理复杂事实和情况的能力。</p><p>数据识别是感知智能的核心功能,需要对图像、视频、声音等各类数据进行大规模的数据采集和特征提取,完成结构化处理。相比之下,认知智能需要理解数据元素之间的关系,分析结构化数据中的逻辑,并根据提炼出的知识做出响应。</p><p>认知智能计算主要研究机器的自然语言处理、因果推理和知识推理(图8)等领域。通过对人脑的神经生物学过程和认知机制的启发式研究,可以提高机器的认知水平,以使其获得帮助、理解、决策、洞察和发现的能力。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKk" alt="image.png" title="image.png"></p><p>驱动机器从被动输出到主动创造有两个关键要素:强泛化模型和与外部环境的持续交互。<strong>自主智能</strong>的发展路径从学习单一任务开始,举一反三,逐步达到与环境动态交互的主动学习,最终实现自我进化的高级智能。当前可以通过迁移学习、元学习和自主学习等技术寻找生成自主智能的可行路径。</p><p>尽管在智能的四个层面上(数据智能,感知智能,认知智能,自主智能)取得了重大进展,但目前仅通过计算/统计模型还难以从极其复杂的场景中实现完全的智能。</p><p>在这些场景中,人类应该继续在解决问题和决策中发挥不可或缺的作用,来探索人类认知过程中涉及的要素,并将其与机器智能相结合。下一步,将聚焦于人机交互、人机融合和脑机接口等技术。</p><h2>面向智能的计算</h2><p>AI的发现不断涌现,这在很大程度上归功于不断增长的计算能力。AI的快速变化是由新思想或革命性理论推动的。通常,最新的先进模型仅依赖于更大的神经网络和更强大的处理系统。</p><p>Open AI研究人员在2018年进行了一项研究,追踪基于计算能力的最大模型的增长情况。利用AI研究史上训练的一些最著名的AI模型所需的计算量,他们发现了计算资源快速增长的两个趋势。</p><p><strong>开发突破性模型所需的计算能力的增长速度与摩尔定律大致相同</strong>,即在2012年之前,单个微芯片的计算能力往往每两年翻一番。但图像识别系统AlexNet在2012年发布时引起了人们的新兴趣。AlexNet的引入刺激了顶级模型的计算需求急剧增加,从2012年到2018年,这种需求每3到4个月翻一番,如图9所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKl" alt="image.png" title="image.png"></p><p>当摩尔定律失效时,超大算力主要依赖于海量计算、内存和存储资源的并行叠加。</p><p>例如,“高性能计算”是指将大量计算机快速联网成一个“集群”以进行密集计算的做法,使用户能够比传统计算机更快地处理大量数据,从而获得更深入的洞察力和竞争优势。</p><p>此外,得益于云计算(图10),用户现在可以选择增加其高性能计算程序的容量,从而继续提高算力。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKn" alt="image.png" title="image.png"></p><p>推进智能计算架构创新的目标包括更高效的能源管理、更低的功耗、更便宜的总芯片成本以及更快速的错误检测和纠正。当涉及某些无法在CPU上执行的AI操作时,AI加速器可能会大大减少训练和执行时间。</p><p>在短期内,所使用加速器的架构专业化将是保持计算能力增长的最佳方式,如图11所示为已公开发布的AI加速器和处理器的峰值性能与功耗。</p><p>另外,<strong>内存计算</strong>(图12)是一个非常有效的方案,它能够使内存单元执行原始逻辑操作,因此它们可以在不需要与处理器交互的情况下进行计算,这是内存和处理器之间不断扩大速度差距的主要原因。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKo" alt="image.png" title="image.png"></p><p><strong>复杂性</strong>是传统计算机进一步突破的瓶颈。当今高度复杂的AI模型(例如深度神经网络)在边缘设备中仍然难以实现普遍使用。这是由于运行这些模型的高级GPU和加速器存在功率和带宽紧缩的缺陷,导致处理时间长并且架构设计繁琐。</p><p>由于这些问题,研究人员开始创造新的计算模式,主要包括:</p><p><strong>量子计算</strong>(图13),因为其具有纠缠或其他非经典相关性带来的量子优势,可以在许多复杂的计算问题中实现指数速度;</p><p><strong>神经形态计算</strong>(图14)的构造和操作受到大脑中神经元和突触的启发,因其能源效率高而非常适合计算,神经形态计算是事件驱动和高度并行化的,这意味着只有小部分系统同时工作,所以消耗的功率非常小;</p><p><strong>光子计算</strong>(图15)与电神经网络相比具有许多优势,包括超高带宽、快速计算速度和高并行性,所有这些都是通过使用光子硬件加速来计算复杂的矩阵向量乘法来实现的;</p><p><strong>生物计算</strong>(图16)是利用生物系统固有的信息处理机制发展起来的一种新的计算模型,主要包括蛋白质计算机、RNA计算机和DNA计算机,具有并行和分布式计算能力强、功耗低的优势。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKp" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKr" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKs" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKt" alt="image.png" title="image.png"></p><h2>智能计算的应用</h2><p>如果要跟上当前科学的快速发展,就必须不断的进行革新。现在正在进行的计算机革命的融合将以前所未有的方式极大地推动科学发现的进步。</p><p>几十年来,<strong>计算材料</strong>(图17)已成为研究材料特性和设计新材料的有力手段。然而,由于材料和材料行为的复杂性,它们的应用面临许多挑战,包括缺乏许多原子、离子以及原子和离子相互作用的力场和电位,分子动力学模拟中的不同热力学相,以及优化材料成分和工艺参数的巨大搜索空间。作为一种新的研究范式,AI集成到计算材料中是对传统计算材料的革命,并且已经在多长度、多时间尺度、多物理场耦合计算方面取得了巨大成功。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKu" alt="image.png" title="image.png"></p><p>作为最古老的观测科学之一,<strong>天文学</strong>在历史上收集了大量数据。由于望远镜技术的突破,收集到的数据爆炸性增长。天文学和天体物理学领域的特点是拥有丰富的数据和各种大口径的地面望远镜,例如即将推出的大型巡天望远镜和天基望远镜。使用高分辨率相机和相关工具,数据收集现在更加高效,并且在很大程度上实现了自动化,必须进行更高效的数据分析。因此,需要智能计算技术来解释和评估数据集。</p><p><strong>药物设计</strong>同样受益于AI(图18),AI可以帮助科学家建立蛋白质的3D结构、模拟药物和蛋白质之间的化学反应以及预测药物的功效。在药理学中,AI可以用于创建靶向化合物和多靶点药物。利用AI还可以设计合成路线、预测反应产率并了解化学合成背后的机制。AI让重新利用现有药物来治疗新的治疗目标变得更加容易。此外,AI对于识别不良反应、测定生物活性和获得药物筛选结果至关重要。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKv" alt="image.png" title="image.png"></p><p>随着大数据和AI技术使用的增长,<strong>作物育种</strong>开始进行融合与突破(图19)。AI技术可以支持服务的创建、模型的识别以及农业食品应用和供应链阶段的决策过程。AI在农业中的主要目标是准确预测结果并提高产量,同时最大限度地减少资源使用。因此,AI工具提供的算法可以评估产量,预测难以预见的问题或事件以及发生趋势。从种植到收获再到销售,AI促进了整个农业价值链。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKw" alt="image.png" title="image.png"></p><p>智能计算加速转型变革,导致经济和社会秩序的转变。由于技术进步,商品和劳动力市场正在发生巨大变化,<strong>数字社会</strong>正在逐渐形成(图20)。AI应该成为数字经济中每一个数据驱动战略的核心,包括工业4.0。例如,人工智能可以应用于预测性维护。预测性维护包括涉及通用设备或生产机械的维护,并使用来自生产线或运营线的传感器数据帮助降低运营费用或停机时间。</p><p>另外。AI可以应用于城市治理,通过开发新的策略和方法,使城市更智能。智慧城市治理旨在利用最先进的信息技术同步数据、程序、权限等,造福城市居民,主要包含四个方面:</p><blockquote>智慧决策、智慧城市治理、智慧行政和智慧城市合作。</blockquote><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLKx" alt="image.png" title="image.png"></p><h2>展望</h2><p>从新兴产业生态的角度来看,智能计算产业仍面临着一系列挑战,决定着其未来发展。</p><p><strong>第一,与传统计算理论相比,智能计算是语言和生物学驱动的计算范式的应用和发展。</strong></p><p>这意味着机器可以根据不同的场景模仿人脑解决问题和决策的能力。然而,硅基和碳基运算的底层逻辑存在根本差异,大脑智能的机制仍有待进一步探索。智能计算的下一步是通过深入探索类人智能的基本要素,其在宏观层面的相互作用机制以及在微观层面上支持不确定性生成的计算理论,进行彻底的改革。</p><p><strong>第二,探索人类如何学习并将其应用到AI的研究中具有重要意义。</strong></p><p>知识驱动的机器智能可以从人类活动中学习,模仿人脑的决策能力,使机器能够像人一样感知、识别、思考、学习和协作。需要探索多知识驱动的知识推理和持续学习的理论和关键技术,使智能系统具有类人的学习、感知、表示和决策能力,促进智能计算从数据驱动向知识驱动演进。</p><p><strong>第三,软硬件适配面临着巨大的挑战,如精度损失、调用困难、协作效率低下等。</strong></p><p>未来,计算机必须突破冯·诺依曼体系结构下固定的输入和处理范式,大力发展交叉学科的智能计算和仿生学。在算法层面进行设计,突破现有架构的局限,以更低的计算和硬件设计成本尝试更灵活、更人性化的数据处理方式。此外,开发高性能、低能耗的新型组件设计方案,提高软件和硬件的计算能力和效率,以满足快速增长的需求和智能计算应用也很重要。</p><p><strong>第四,智能计算的理论技术架构是一个复杂的系统,具有多个与其他学科相互作用的子系统。</strong></p><p>系统中的各种硬件需要更复杂的系统设计,更好的优化技术,以及系统调优的更大成本。高维计算理论复杂性的缺乏是大规模计算系统面临的主要挑战。</p><h2>结论</h2><p>当前,我们正迎来<strong>人类发展的第四次浪潮</strong>,正处于从信息社会向<strong>人类社会-物理世界-信息空间</strong>融合的智能社会的关键转型期。在这种转变中,计算技术正在经历变革,甚至是颠覆性的变化。</p><p>智能计算被认为是未来计算的发展方向,不仅是面向智能的计算,而且是智能赋能的计算。它将提供通用、高效、安全、自主、可靠和透明的计算服务,以支持当今智能社会中大规模和复杂的计算任务。</p><p>本文全面回顾了智能计算的理论基础、智能与计算的技术融合、重要应用、挑战和未来方向。</p><p>我们希望这篇综述能为研究人员和从业者提供一个很好的参考,并促进未来智能计算领域的理论和技术创新。</p><blockquote>文章作者:允中  <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2Fd7PpTEHjfH33fVRTsOaucg" target="blank">量子位</a></blockquote><blockquote>更多FPGA干货请关注<a href="https://aijishu.com/blog/readings">极术读书</a>专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000382786</guid>
            <link>https://aijishu.com/a/1060000000382786</link>
        </item>
        <item>
            <title><![CDATA[招募 | 基于Arm MCU数字控制系统的低代码开发方面的技术专著翻译合作]]></title>
            <description><![CDATA[<p>兔年伊始,机械工业出版社又来邀请各位技术专家合作翻译Arm相关国外技术专著啦,欢迎大家关注联系~</p><h2>关于书籍《Embedded Digital Control with Microcontrollers: Implementation with C and Python (IEEE Press) 》</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbLto" alt="image.png" title="image.png"></p><p>《Embedded Digital Control with Microcontrollers: Implementation with C and Python (IEEE Press)》是关于Arm MCU数控系统低代码开发的参考书,图书介绍了简洁实用的微控制器数字控制系统实现方法和理论。</p><p>图书作者通过三个阶段的介绍,让读者更好得来进行学习。</p><ul><li>首先,图书描述了如何通过 Python 编程语言实现原型数字控制系统,以帮助读者更好地理解理论数字控制概念。</li><li>其次,本书为读者提供了使用 C 编程语言在实际微控制器上实现数字控制系统的指导。这将使读者能够解决涉及数字控制、机器人和机电一体化的现实问题。</li><li>最后,读者将学习如何通过在实际应用中实施数字控制系统,将书中讨论的理论问题与实践问题结合起来。在整本书中,使用 Python 编程语言的数字控制系统的应用确保读者可以应用其中包含的理论。</li></ul><p>书籍链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.amazon.com%2FEmbedded-Digital-Control-Microcontrollers-Implementation%2Fdp%2F1119576520%2Fref%3Dsr_1_1%3Fkeywords%3D9781119576525%26qid%3D1675070337%26s%3Dbooks%26sr%3D1-1" target="blank">https://www.amazon.com/Embedded-Digital-Control-Microcontrollers-Implementation/dp/1119576520/ref=sr_1_1?keywords=9781119576525&amp;qid=1675070337&amp;s=books&amp;sr=1-1</a></p><h2>翻译合作招募</h2><p>如果有对Arm嵌入式技术感兴趣的,并且有嵌入式编程经验的,专业和英语都不错的工程师们,欢迎联系翻译合作,具体合作细节可和负责人详细沟通。</p><p>联系人:<strong>机工社朱经理</strong><br>微信号:<strong>jack1967_zhu</strong>,添加微信请备注“Arm”<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbupq" alt="image.png" title="image.png"><br>扫一扫添加微信沟通翻译合作</p>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000381770</guid>
            <link>https://aijishu.com/a/1060000000381770</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】2023年元旦50本《Arm64体系架构编程与实践》赠书名单公布]]></title>
            <description><![CDATA[<p>为了感谢大家对极术社区的支持,2023年元旦极术社区微信服务号联合安谋科技学堂微信号组织了<a href="https://aijishu.com/e/1120000000376650">50本《Arm64体系架构编程与实践》的赠书活动</a>,近一千人参与了抽奖活动,抽奖名单已有微信抽奖助手自动公布,截图如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbKzy" alt="image.png" title="image.png"></p><p>恭喜以上中奖者,请私信兑奖码,极术社区微信号截图以及安谋科技微信号截图给极术小姐姐,如活动中未关注或者已取关的中奖用户不予兑换。</p><p>感谢大家的支持,更多读书活动请关注极术读书栏目:<a href="https://aijishu.com/books">https://aijishu.com/books</a></p>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000378287</guid>
            <link>https://aijishu.com/a/1060000000378287</link>
        </item>
        <item>
            <title><![CDATA[学习STM32/GD32开发设计,推荐《嵌入式系统设计—基于Cortex-M处理器与RTOS构建》]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>。</blockquote><p>本期极术社区推荐的是由杭州电子科技大学曾毓和黄继业老师编写,清华大学出版社出版的新书《嵌入式系统设计——基于Cortex-M处理器与RTOS构建》。该书系统介绍了基于ARM Cortex-M体系的嵌入式系统设计,同时配套有STM32芯片和GD32芯片的开发板,让工程师可以同时掌握两种芯片的开发及设计。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbKyC" alt="image.png" title="image.png"></p><h2>内容简介</h2><p>全书系统介绍了基于ARM Cortex-M体系的嵌入式系统设计,将微控制器技术、RTOS概念、传感器应用、编程技巧和实用方法与实际工程开发技术在STM32F407/GD32F407硬件平台上很好地结合起来,使读者通过本书的学习能迅速了解并掌握基于STM32/GD32的嵌入式系统设计方法和工程开发实用技术,为后续的深入学习和发展打下坚实的理论与实践基础。</p><h2>书籍特色</h2><ul><li><strong>紧跟嵌入式技术发展</strong>,基于图形化配置工具的和多任务系统设计视角介绍嵌入式系统应用设计流程。</li><li><strong>主要内容基于业内流行的FreeRTOS嵌入式实时系统</strong>,多实例演示RTOS的任务管理、优先级、信号、消息和任务通知等基础概念应用方法。</li><li><strong>应用示例丰富实用</strong>,操作讲解详实易懂,所有示例都通过了配套嵌入式平台的硬件验证,有较高的工程实践参考性。</li><li><strong>详实的嵌入式鸿蒙系统移植教程</strong>,涵盖环境搭建和工程创建、移植、编译下载过程完整步骤,帮你从零开始鸿蒙嵌入式应用开发。</li><li><strong>全书使用工具软件皆为免费、开源或作者自制软件</strong>,配套实验板资料全部开放,板载MCU器件也都可用国产MCU替代,可极大降低教学和学习成本。</li></ul><h2>配套开发板介绍</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbKyE" alt="image.png" title="image.png"><br>配套HX32F4学习板主要特点:</p><ul><li>核心芯片选用基于Cortex-M4内核的主流高性能MCU,型号STM32F407VET6/VGT6。(HX32F4的国产版本选用引脚兼容的GD32F407VET6或GD32F470VET6)</li><li>板载DAP下载调试器,仅需一根TYPE-C接口就能完成供电,下载,调试,串口调试。</li><li>板载嵌入式学习基础资源包括:8个LED、6个独立按键、4位数码管、无源蜂鸣器、麦克风、电容触摸按键,外接16MB SPI FLASH。</li><li>板载外设接口包括:3.5mm音频输出、ADC、DAC、CAN接口、ESP8266模块接口、HC05蓝牙接口、IIC接口、单总线模块接口、SD卡接口、以太网接口、USB Host和USB Device接口。</li><li>板上还提供15x2扩展接口,可直插2.4寸LCD触摸液晶屏或作为外设扩展接口,涵盖USART、SPI、IIC、ADC、DAC、定时器等外设引脚,方便进行其他的扩展实验。</li><li>原理图和PCB资料全部开放,开源地址:<a href="https://aijishu.com/link?target=https%3A%2F%2Fgitee.com%2Fzalileo%2FHX32F4-Board" target="blank">https://gitee.com/zalileo/HX32F4-Board</a></li></ul><h2>书籍目录</h2><ul><li><p>第1章 基于Cortex-M的嵌入式系统概述</p><ul><li>1.1 嵌入式系统基本概念</li><li>1.2 ARM Cortex体系结构</li><li>1.3 ARM Cortex-M各系列特点</li><li>1.4 STM32F407结构简介</li><li>1.5 实时操作系统RTOS简介</li><li>1.6 嵌入式系统在物联网中的发展</li></ul></li><li><p>第2章 Cortex-M嵌入式硬件平台</p><ul><li>2.1 硬件平台简介</li><li>2.2 主要器件</li><li>2.3 主要功能模块</li></ul></li><li><p>第3章 嵌入式开发工具与设计流程</p><ul><li>3.1 STM32开发工具</li><li><p>3.2 ARM Keil MDK工具</p><ul><li>3.3 STM32CubeMX使用方法</li><li>3.3.1 STM32Cube简介</li><li>3.3.2 STM32CubeMX软件安装</li></ul></li><li><p>3.4    基于HAL库的程序设计流程</p><ul><li>3.4.1 STM32 HAL介绍</li><li>3.4.2 CubeMX工程创建流程</li></ul></li><li>3.5 第一个LED点灯程序</li><li>实验1 按键扫描与流水灯设计</li></ul></li><li><p>第4章 FreeRTOS操作系统</p><ul><li>4.1 FreeRTOS系统简介</li><li>4.2 FreeRTOS系统移植</li><li><p>4.3 多任务系统基本概念</p><ul><li>4.3.1 任务及任务管理</li><li>4.3.2 优先级</li><li>4.3.3 消息队列</li><li>4.3.4 信号量</li><li>4.3.5 互斥量</li><li>4.3.6 事件</li><li>4.3.7 任务通知</li><li>4.3.8 内存管理</li></ul></li><li><p>4.4 创建第一个RTOS工程</p><ul><li>4.4.1 CubeMX工程配置</li><li>4.4.2 导出MDK工程</li><li>4.4.3 编写功能代码</li></ul></li><li>实验2 多任务键盘与流水灯实验</li></ul></li><li><p>第5章 简单外设应用</p><ul><li>5.1 数码管应用</li><li>5.2 按键与外部中断</li><li><p>5.3 麦克风与ADC应用</p><ul><li>5.3.1 添加串口打印输出</li><li>5.3.2 ADC模块介绍</li><li>5.3.3 麦克风AD采样示例</li></ul></li><li>5.4 单总线温湿度传感器应用</li><li>5.5 IIC接口陀螺仪传感器应用</li><li>实验3 声控延时亮灯实验</li><li>实验4 温度报警与倾角检测实验</li></ul></li><li><p>第6章 串口通信应用</p><ul><li>6.1 学习板虚拟串口概述</li><li>6.2 轮询接收方式串口通信</li><li><p>6.3 中断接收方式串口通信</p><ul><li>6.3.1 串口接收中断示例</li><li>6.3.2 DMA空闲中断示例</li><li>6.3.3 流水灯串口通信应用</li></ul></li><li>6.4    使用SWO调试</li></ul></li><li>实验5 简单串口通信实验</li><li>实验6 数据采集与串口通信实验</li><li><p>第7章 无线通信应用</p><ul><li><p>7.1 蓝牙HC05通信模块介绍</p><ul><li>7.1.1 HC05蓝牙模块用法介绍</li><li>7.1.2 HC05蓝牙模块AT指令介绍</li></ul></li><li>7.2 蓝牙通信实践</li><li><p>7.3 ESP8266WiFi通信模块介绍</p><ul><li>7.3.1 ESP01模块用法介绍</li><li>7.3.2 ESP01模块AT指令介绍</li></ul></li><li>7.4 WIFI通信实践</li><li><p>7.5    物联网连接应用实践</p><ul><li>7.5.1 创建OneNET平台设备</li><li>7.5.2 连接OneNET平台</li></ul></li><li>实验7 蓝牙手机遥控实验</li><li>实验8 数据采集及Wifi通信实验</li></ul></li><li><p>第8章     GUI显示应用</p><ul><li><p>8.1 OLED应用介绍</p><ul><li>8.1.1 单色IIC接口OLED介绍</li><li>8.1.2 OLED显示屏驱动程序介绍</li><li>8.1.3 GUISlim图形库介绍</li><li>8.1.4 汉字点阵文件介绍</li></ul></li><li>8.2 OLED应用实践</li><li>8.3 MCU接口LCD介绍</li><li><p>8.4 LCD应用实践</p><ul><li>8.4.1 emWin图形库介绍</li><li>8.4.2 FSMC总线配置</li><li>8.4.3 LCD屏驱动移植接口</li><li><p>8.4.4 GUI应用设计</p><ul><li>实验9 OLED显示屏数据曲线绘制实验</li></ul></li></ul></li><li>实验10 LCD液晶屏GUI设计实验</li></ul></li><li><p>第9章 定时器应用</p><ul><li><p>9.1 STM32F4定时器介绍</p><ul><li>9.1.1 常规定时器</li><li>9.1.2 HAL库定时器模块设计方法</li><li>9.1.3 定时器基本概念介绍</li></ul></li><li>9.2 定时器基本功能应用</li><li>9.3 PWM输出应用</li><li>9.4 信号捕捉应用</li><li>9.5 外部脉冲计数应用</li><li>实验11 简易闹铃设计实验</li><li>实验12 呼吸灯设计实验</li><li>实验13 简易频率计设计实验</li><li>实验14 简单录音机设计实验</li></ul></li><li><p>第10章 RTC与低功耗应用</p><ul><li>10.1 RTC实时时钟应用</li><li>10.2 STM32低功耗模式介绍</li><li>10.3 STM32低功耗应用</li><li>实验15 基于RTC的电子钟设计</li><li>实验16 低功耗待机与唤醒实验</li></ul></li><li><p>第11章 FatFs文件系统应用</p><ul><li>11.1 FatFs介绍</li><li><p>11.2 SPI FLASH应用实践</p><ul><li>11.2.1 添加配置SPI外设</li><li>11.2.2 添加SPI FLASH驱动</li><li>11.2.3 SPI FLASH直接读写操作实践</li><li>11.2.4 SPI FLASH文件读写操作实践</li></ul></li><li><p>11.3 SD卡应用实践</p><ul><li>11.3.1 添加配置SDIO外设</li><li>11.3.2 SD卡文件读写操作实践</li></ul></li><li><p>11.4 U盘挂载应用实践</p><ul><li>11.4.1 添加配置USB HOST组件</li><li>11.4.2 U盘文件读写操作实践</li></ul></li><li>实验17 数据存储实验</li><li>实验18 文件传输实验</li></ul></li><li><p>第12章 STM32 IAP程序设计</p><ul><li>12.1 STM32 IAP概念介绍</li><li>12.2 STM32内部FLASH介绍</li><li>12.3 STM32内部FLASH读写实践</li><li>12.4 程序跳转应用实践</li><li>12.5 IAP程序设计实践</li><li>实验19 串口IAP设计实验</li><li>实验20 U盘IAP设计实验</li></ul></li><li><p>第13章 鸿蒙嵌入式系统移植</p><ul><li><p>13.1 OpenHarmony介绍</p><ul><li>13.1.1 LiteOS-M内核简介</li><li>13.1.2 开发环境配置</li></ul></li><li><p>13.2 OpenHarmony系统移植</p><ul><li>13.2.1 创建裸机工程</li><li>13.2.2 系统编译构建移植</li><li>13.2.3 系统启动过程适配</li><li>13.2.4 编译及烧录</li></ul></li><li><p>13.3 OpenHarmony应用开发示例</p><ul><li>13.3.1 hello world示例</li><li>13.3.2 流水灯示例</li></ul></li><li>实验21 OpenHarmony系统移植实验</li></ul></li></ul><h2>作者介绍</h2><p>本书适用对象:电子、计算机类相关专业的高等院校本专科学生。<br>本书适用课程:单片机、嵌入式实践和电子系统综合设计等相关实践课程。</p><h2>书籍购买</h2><p>书籍购买链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13603919.html" target="blank">https://item.jd.com/13603919.html</a></p><p>相关课件及教学资料下载:<a href="https://aijishu.com/link?target=https%3A%2F%2Fgitee.com%2Fzalileo%2FHX32F4-Board" target="blank">https://gitee.com/zalileo/HX32F4-Board</a>,书籍课件在其下的“07 相关资料”目录中,书籍实验示例工程在其下的“05 学习板配套教材示例代码”目录中,如有下载问题,可联系邮箱:<a href="https://aijishu.com/link?target=mailto%3Azyu20%40hdu.edu.cn" target="blank">zyu20@hdu.edu.cn</a></p><p>老师可以免费申请该书籍,申请链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fdocs.qq.com%2Fform%2Fpage%2FDYkNBY2hVWGVvdG1v%23%2Ffill" target="blank">https://docs.qq.com/form/page/DYkNBY2hVWGVvdG1v#/fill</a><br>配套开发板购买:<br><a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.taobao.com%2Fitem.htm%3Fspm%3Da1z10.5-c-s.w4002-23113581213.10.1f823de1YJY0ga%26id%3D696813161080" target="blank">https://item.taobao.com/item.htm?spm=a1z10.5-c-s.w4002-23113581213.10.1f823de1YJY0ga&amp;id=696813161080</a></p><blockquote>更多书籍推荐及赠书活动请关注<a href="https://aijishu.com/books">极术读书</a>页面。</blockquote>
                                                    ]]></description>
            <pubDate>Invalid Date</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000378231</guid>
            <link>https://aijishu.com/a/1060000000378231</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】50本《智能网联汽车计算平台测试装调》赠书名单公布]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>栏目。</blockquote><p>2022年11月30日至12月5日,极术社区联合安谋科技学堂,机械工业出版社赠送50本《<a href="https://aijishu.com/e/1120000000368246"><strong>智能网联汽车计算平台测试装调</strong></a>》,非常感谢大家的积极参与,赠书名单如下,恭喜下方的小伙伴,下面每人将收到极术读书赠送的一本《智能网联汽车计算平台测试装调》。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbI8e" alt="df93aa6972e82e1338bfd90b7f03c6a.png" title="df93aa6972e82e1338bfd90b7f03c6a.png"></p><blockquote><p>祝贺以上获奖的小伙伴!</p><p>极术读书工作人员将给中奖用户发送邮件通知确认后尽快安排寄出。</p><p>暂时没有获奖的的小伙伴也不要着急,接下来极术读书及安谋科技学堂会多多组织类似的活动,努力为大家谋福利!<br>本次赠书活动感谢机械工业出版社和书籍作者上海交大刘彦博老师的大力支持!</p></blockquote><p><strong>活动原文</strong>:<a href="https://aijishu.com/e/1120000000368246">【极术读书】冬季送50本《智能网联汽车计算平台测试装调》,带你全面掌握智能汽车计算平台软硬件!</a></p><blockquote>关注<a href="https://aijishu.com/books">极术读书栏目</a>,即时获取最新推荐好书以及读书活动。</blockquote><p><strong>学习公号推荐</strong>:关注<strong>安谋科技学堂</strong>公众号,学习更多技术知识!<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbiNv" alt="安谋科技学堂.png" title="安谋科技学堂.png"></p><p><strong>如何购买?</strong><br>京东旗舰店:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13457369.html" target="blank">https://item.jd.com/13457369.html</a></p><blockquote>本活动最终解释权归极术社区所有。</blockquote>
                                                    ]]></description>
            <pubDate>Sun, 04 Dec 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000372749</guid>
            <link>https://aijishu.com/a/1060000000372749</link>
        </item>
        <item>
            <title><![CDATA[新书推荐| 《智能网联汽车计算平台测试装调》带你全面学习智能汽车计算平台]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>。</blockquote><p>在政策、技术与市场等多重因素的影响下,汽车这一传统产业与能源、交通、信息通信等领域有关技术加速融合,正在形成电动化、智能化、网联化的发展格局。智能网联汽车的发展已经进入快车道。而随着无人驾驶技术的发展,智能网联汽车计算平台在智能驾驶中的作用也愈发重要。为了让大家更快掌握智能网联汽车计算平台,极术读书给大家推荐由北京电子科技职业学院汽车工程学院院长冯志新和上海交大刘彦博编写,机械工业出版社最新出版的《智能网联汽车计算平台测试装调》。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbHXm" alt="image.png" title="image.png"></p><h2>内容简介</h2><p>本书是智能网联计算平台测试应用与调试开发的初级教材,主要是为了满足行业对智能网联汽车技术专业人才的需求,促进高职院校汽车专业的建设。</p><p>全书共8章,以学习任务为出发点贯穿教学,通过任务导入、任务分析、任务资讯、任务准备、任务实施、任务检查与评价逐层深入实践。</p><p>本书内容包括智能网联车载计算平台的基础知识、框架结构和硬件认知,Python 语言和Linux 系统的相关操作和基础知识,华为MDC 平台和智行者计算平台的拆装与调试,以及相关软件的环境部署和操作技巧。</p><h2>书籍特色</h2><p>本书具有以下特点:</p><p>1)紧跟汽车新技术的发展步伐,结合智能网联汽车技术专业的职业取向、培养目标进行内容设置,及时反映产业升级和行业发展需求,体现新知识、新技术、新工艺、新方法、新材料。</p><p>2)采用学习任务式编写体例。每一个学习任务都对应有相关的任务驱动,且配备有对应的技能操作步骤,可操作性强。</p><p>3)注重实践应用能力的培养和技能的提升,实现“理实一体”,旨在为行业培养高素质的汽车智能技术技能人才。</p><p>本书在编写过程中大量参考了<strong>华为、百度、英伟达、安谋科技、亚马逊、迈斯沃克、恩智浦、盛心杰缘智能科技、九州华海科技、盛子智能科技</strong>等知名公司的工程技术专家提供的资料,具备一定的先进性和工程性。</p><h2>书籍目录</h2><ul><li>1 计算平台认知</li><li>2 计算平台架构认知</li><li>3 计算平台硬件认知</li><li>4 Python 基础知识</li><li>5 Linux 基础知识</li><li>6 华为MDC 300F 平台的拆装与调试</li><li>7 智行者计算平台的拆装与调试</li><li>8 软件部署</li></ul><h2>作者介绍</h2><ul><li><strong>冯志新</strong>,工学博士,教授,北京电子科技职业学院 汽车工程学院院长,北京市级专业带头人,教育部课程思政教学名师,教育部汽车职业教育教学指导委员会委员。全国“双高”汽车制造与装配技术专业群建设负责人,北京市市级教师教学创新团队和高校继续教育高水平教学团队负责人。曽获教育教学成果一等奖1项,获北京市级教育教学成果一等奖2项,主持和参与厅局级以上课题8项,主编教材4部。兼任中国机械工业教育协会第五届理事,国家职业技能鉴定高级考评员和质量督导员,机械工业人才评价工作专家委员会委员。</li><li><strong>刘彦博</strong> ,中国汽车产品高级工程师,上海交通大学教辅系列青年教师<br>,华为云MVP专家/华为鲲鹏计算先锋教师,百度自动驾驶培训讲师,英伟达自动驾驶培训讲师,IEEE上海会员。主要研究方向为汽车电子、智能网联感知融合技术、智能网联网络拓扑优化等。精通嵌入式系统、硬件电路设计,熟悉多种智能网联车载平台系统。主要参与的项目有信息产业部中国电子科技集团公司2U/3U车载计算平台设计、车载采集监控系统、北斗车载控制系统、车载电子控制系统,教育部产学研华为云智能驾驶开发设计、教育部产学研无人驾驶课程开发、教育部产学研5G车路协同开发等项目。发表EI核心论文30余篇、发明专利5篇、软件著作5篇,著有《 智能网联汽车计算平台测试装调》《新能源汽车技术研究进展微探》,《电子控制技术》等教材。</li></ul><h2>书籍购买</h2><p>京东链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13457369.html" target="blank">https://item.jd.com/13457369.html</a></p><blockquote>更多书籍推荐及赠书活动请关注<a href="https://aijishu.com/books">极术读书</a>页面。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 21 Nov 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000368242</guid>
            <link>https://aijishu.com/a/1060000000368242</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】赠卡活动第二期名单公布]]></title>
            <description><![CDATA[<p>11月第一周,极术读书栏目又组织了<a href="https://aijishu.com/e/1120000000361727">第二次极客时间月卡赠送活动</a>。活动获得了很多社区用户的支持,恭喜以下的用户获得极客时间超级会员月卡。<br>姓名    手机<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbG7u" alt="jikeshijian.png" title="jikeshijian.png"></p><blockquote>工作人员会在1~2个工作日发邮件到大家登记邮箱说明如何免费兑换卡券,敬请关注邮件。请在<strong>2022年12月2日</strong>前兑换,超过时间则不予兑换。如有任何问题欢迎微信联系极术小姐姐(微信:aijishu20)</blockquote><p><strong>推荐目前极术社区正在组织的活动</strong></p><ul><li><a href="https://aijishu.com/e/1120000000359788">「免费申请」基于Arm Cortex-M4的兆易创新GD32F427高性能开发板试用活动</a></li></ul><p>更多赠书赠卡活动敬请关注<a href="https://aijishu.com/books"><strong>极术读书</strong></a>。</p>
                                                    ]]></description>
            <pubDate>Sun, 06 Nov 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000365015</guid>
            <link>https://aijishu.com/a/1060000000365015</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】国庆《嵌入式实时操作系统 ―基于ARM Mbed OS的应用实践》赠书名单公布]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>栏目。</blockquote><p>2022年9月28日至10月8日,极术社区联合安谋科技学堂赠送50本《<a href="https://aijishu.com/e/1120000000355587"><strong>嵌入式实时操作系统 ―基于ARM Mbed OS的应用实践</strong></a>》,非常感谢大家的积极参与,赠书名单如下,恭喜下方的小伙伴,下面每人将收到极术读书赠送的一本《嵌入式实时操作系统 ―基于ARM Mbed OS的应用实践》。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbFwu" alt="2022年国庆赠书.png" title="2022年国庆赠书.png"></p><blockquote><p>祝贺以上获奖的小伙伴!</p><p>极术读书工作人员将给中奖用户发送邮件通知确认后尽快安排寄出。</p><p>暂时没有获奖的的小伙伴也不要着急,接下来极术读书及安谋科技学堂会多多组织类似的活动,努力为大家谋福利!<br>本次赠书活动感谢电子工业出版社和书籍作者王宜怀教授的大力支持!</p></blockquote><p><strong>活动原文</strong>:<a href="https://aijishu.com/e/1120000000355587">【极术读书】国庆赠书50本《嵌入式实时操作系统 ―基于ARM Mbed OS的应用实践》,掌握实时操作系统应用及原理!</a></p><blockquote>关注<a href="https://aijishu.com/books">极术读书栏目</a>,即时获取最新推荐好书以及读书活动。</blockquote><p><strong>学习公号推荐</strong>:关注<strong>安谋科技学堂</strong>公众号,学习更多技术知识!<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbiNv" alt="安谋科技学堂.png" title="安谋科技学堂.png"></p><p><strong>如何购买?</strong><br>京东旗舰店:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13237887.html" target="blank">https://item.jd.com/13237887.html</a></p><blockquote>本活动最终解释权归极术社区所有。</blockquote>
                                                    ]]></description>
            <pubDate>Fri, 07 Oct 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000358877</guid>
            <link>https://aijishu.com/a/1060000000358877</link>
        </item>
        <item>
            <title><![CDATA[极术读书 | 新书推荐《嵌入式实时操作系统 ――基于ARM Mbed OS的应用实践》]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/books">极术读书</a>。</blockquote><p>嵌入式实时操作系统是嵌入式人工智能与物联网终端的重要工具和运行载体,也是嵌入式工程师必备知识。本篇极术读书将推荐安谋科技合作图书,苏州大学王宜怀教授所著《<strong>嵌入式实时操作系统 ――基于ARM Mbed OS的应用实践</strong>》。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbEw2" alt="image.png" title="image.png"></p><h2>内容介绍</h2><p>虽然实时操作系统种类繁多,有国外的,也有国产的;有收费的,也有免费的;有开发者持续维护升级的,也有依赖爱好者更新升级的。但是无论哪一种, 学习实时操作系统时都必须以一个具体的实时操作系统为蓝本。实际上,不同的实时操作系统,其应用方法及原理大同小异,掌握其共性是学习的关键,这样才能达到举一反三的效果。</p><p>本书推荐的Mbed OS是ARM公司于2014年开始推出并逐步完善的一款免费的 开源嵌入式实时操作系统,Mbed OS专为基于ARM Cortex-M内核的MCU设计, 主要面向物联网终端。该书以ARM Mbed OS实时操作系统为背景,阐述实时操作系统的线程、调度、延时函数、事件、消息队列、线程信号、信号量、互斥量等基本要素,给出实时操作系统下的程序设计方法。</p><p>本书分为基础应用篇(第1~7章)、原理剖析篇(第8~12章)及综合实践篇(第13、14章)三大部分,如果读者只做实时操作系统下的应用开发,可只阅读基础应用篇与综合实践篇;如果希望理解实时操作系统原理,那么建议通读全书。</p><p>本书适合软件开发工程师,可作为实时操作系统的技术培训书籍,书籍配套有实践的开发板。</p><h2>书籍目录</h2><p><strong>第1篇 基础应用篇</strong></p><ul><li><p>第1章 实时操作系统的基本概念与线程基础知识 3</p><ul><li><p>1.1 实时操作系统的基本含义 3</p><ul><li>1.1.1 嵌入式系统的基本分类 3</li><li>1.1.2 无操作系统与实时操作系统 4</li><li>1.1.3 实时操作系统与非实时操作系统 5</li></ul></li><li><p>1.2 实时操作系统中的基本概念 6</p><ul><li>1.2.1 线程与调度的基本含义 6</li><li>1.2.2 内核的基本概念 7</li><li>1.2.3 线程的基本概念 9</li></ul></li><li><p>1.3 线程的三要素、四种状态及三种基本形式 10</p><ul><li>1.3.1 线程的三要素 10</li><li>1.3.2 线程的四种状态 11</li><li>1.3.3 线程的三种基本形式 13</li></ul></li><li>1.4 本章小结 14</li></ul></li><li><p>第2章 相关基础知识 17</p><ul><li><p>2.1 CPU内部寄存器的分类及ARM Cortex-M处理器的主要寄存器 17</p><ul><li>2.1.1 CPU内部寄存器的分类 17</li><li>2.1.2 ARM Cortex-M处理器的主要寄存器 18</li></ul></li><li><p>2.2 C语言中的构造类型及编译相关问题 21</p><ul><li>2.2.1 C语言中的构造类型 21</li><li>2.2.2 编译相关问题 25</li></ul></li><li><p>2.3 实时操作系统内核使用的数据结构 26</p><ul><li>2.3.1 栈与堆 26</li><li>2.3.2 队列 28</li><li>2.3.3 链表 29</li></ul></li><li><p>2.4 汇编语言概述 36</p><ul><li>2.4.1 汇编语言格式 36</li><li>2.4.2 常用伪指令简介 38</li></ul></li><li>2.5 本章小结 40</li></ul></li><li><p>第3章 Mbed OS第一个样例工程 41</p><ul><li>3.1 Mbed OS简介 41</li><li><p>3.2 软件和硬件开发平台 42</p><ul><li>3.2.1 GEC架构简介 42</li><li>3.2.2 硬件平台 43</li><li>3.2.3 软件平台 44</li><li>3.2.4 网上电子资源 45</li></ul></li><li><p>3.3 第一个样例工程 46</p><ul><li>3.3.1 样例程序功能 46</li><li>3.3.2 工程框架设计原则 46</li><li>3.3.3 无操作系统的工程框架 47</li><li>3.3.4 Mbed OS的工程框架 51</li></ul></li><li>3.4 本章小结 56</li></ul></li><li><p>第4章 实时操作系统下应用程序的基本要素 57</p><ul><li><p>4.1 中断的基本概念及处理过程 57</p><ul><li>4.1.1 中断的基本概念 57</li><li>4.1.2 中断处理的基本过程 58</li></ul></li><li><p>4.2 时间嘀嗒与延时函数 60</p><ul><li>4.2.1 时间嘀嗒 60</li><li>4.2.2 延时函数 60</li></ul></li><li><p>4.3 调度策略 61</p><ul><li>4.3.1 调度基础知识 61</li><li>4.3.2 Mbed OS中使用的调度策略 62</li><li>4.3.3 Mbed OS中的固有线程 63</li></ul></li><li><p>4.4 实时操作系统中的功能列表 64</p><ul><li>4.4.1 就绪列表 64</li><li>4.4.2 延时列表 64</li><li>4.4.3 等待列表 64</li><li>4.4.4 条件阻塞列表 64</li></ul></li><li>4.5 本章小结 65</li></ul></li><li><p>第5章 同步与通信的应用方法 67</p><ul><li><p>5.1 实时操作系统中同步与通信的基本概念 67</p><ul><li>5.1.1 同步的含义与通信手段 67</li><li>5.1.2 同步类型 68</li></ul></li><li><p>5.2 事件 69</p><ul><li>5.2.1 事件的含义及应用场合 69</li><li>5.2.2 事件的常用函数 69</li><li>5.2.3 事件的编程举例:通过事件实现中断与线程的通信 71</li><li>5.2.4 事件的编程举例:通过事件实现线程之间的通信 74</li></ul></li><li><p>5.3 消息队列 76</p><ul><li>5.3.1 消息队列的含义及应用场合 76</li><li>5.3.2 消息队列的常用函数 76</li><li>5.3.3 消息队列的编程举例 78</li></ul></li><li><p>5.4 线程信号 82</p><ul><li>5.4.1 线程信号的含义及应用场合 82</li><li>5.4.2 线程信号的常用函数 83</li><li>5.4.3 线程信号的编程举例 84</li></ul></li><li><p>5.5 信号量 87</p><ul><li>5.5.1 信号量的含义及应用场合 87</li><li>5.5.2 信号量的常用函数 88</li><li>5.5.3 信号量的编程举例 89</li></ul></li><li><p>5.6 互斥量 92</p><ul><li>5.6.1 互斥量的含义及应用场合 92</li><li>5.6.2 互斥量的常用函数 94</li><li>5.6.3 互斥量的编程举例 95</li></ul></li><li>5.7 本章小结 98</li></ul></li><li><p>第6章 底层硬件驱动构件 99</p><ul><li><p>6.1 嵌入式构件概述 99</p><ul><li>6.1.1 制作构件的必要性 99</li><li>6.1.2 构件的基本概念 99</li><li>6.1.3 嵌入式开发中构件的分类 100</li><li>6.1.4 构件的基本特征与表达形式 101</li></ul></li><li><p>6.2 底层硬件驱动构件设计原则与方法 102</p><ul><li>6.2.1 底层硬件驱动构件设计的基本原则 102</li><li>6.2.2 底层硬件驱动构件设计要点分析 103</li><li>6.2.3 底层硬件驱动构件封装规范概要 104</li><li>6.2.4 封装的前期准备 105</li></ul></li><li><p>6.3 底层硬件驱动构件设计举例 106</p><ul><li>6.3.1 GPIO构件 106</li><li>6.3.2 UART构件 114</li><li>6.3.3 Flash构件 119</li><li>6.3.4 ADC构件 123</li><li>6.3.5 PWM构件 127</li></ul></li><li><p>6.4 应用构件及软件构件设计实例 131</p><ul><li>6.4.1 应用构件设计实例 131</li><li>6.4.2 软件构件设计实例 133</li></ul></li><li>6.5 本章小结 142</li></ul></li><li><p>第7章 实时操作系统下的程序设计方法 143</p><ul><li><p>7.1 程序稳定性问题 143</p><ul><li>7.1.1 稳定性的基本要求 143</li><li>7.1.2 看门狗复位与定期复位的应用 144</li><li>7.1.3 临界区的处理 147</li></ul></li><li><p>7.2 中断服务程序设计、线程划分及优先级安排问题 148</p><ul><li>7.2.1 中断服务程序设计的基本问题 148</li><li>7.2.2 线程划分的简明方法 149</li><li>7.2.3 线程优先级安排问题 149</li></ul></li><li><p>7.3 利用信号量解决并发与资源共享的问题 150</p><ul><li>7.3.1 并发与资源共享的问题 150</li><li>7.3.2 应用实例 151</li></ul></li><li><p>7.4 优先级反转问题 155</p><ul><li>7.4.1 优先级反转问题的出现 155</li><li>7.4.2 Mbed OS中避免优先级反转问题的方法 157</li></ul></li><li>7.5 本章小结 162<br> <strong>第2篇 原理剖析篇</strong></li></ul></li><li><p>第8章 理解Mbed OS的启动过程 165</p><ul><li><p>8.1 芯片启动到main函数之前的运行过程 165</p><ul><li>8.1.1 寻找第一条被执行指令的存放处 165</li><li>8.1.2 通过启动文件理解芯片启动过程 167</li></ul></li><li><p>8.2 Mbed OS启动流程概要 169</p><ul><li>8.2.1 相关宏定义及结构体 169</li><li>8.2.2 栈和堆的配置 176</li><li>8.2.3 启动过程概述 179</li><li>8.2.4 如何运行到主线程 181</li><li>8.2.5 启动过程总流程源代码 182</li></ul></li><li><p>8.3 深入理解启动过程(一):内核初始化解析 183</p><ul><li>8.3.1 内核初始化准备工作 183</li><li>8.3.2 进入SVC中断服务程序SVC_Handler 186</li><li>8.3.3 实际内核初始化函数 187</li><li>8.3.4 返回流程 199</li></ul></li><li><p>8.4 深入理解启动过程(二):创建主线程、启动内核 200</p><ul><li>8.4.1 创建主线程 201</li><li>8.4.2 启动内核 215</li><li>8.4.3 定时器线程函数 226</li><li>8.4.4 消息获取与处理函数 228</li><li>8.4.5 线程延时等待函数 238</li></ul></li><li><p>8.5 中断服务程序SVC_Handler详解 240</p><ul><li>8.5.1 SVC_Handler功能概要 241</li><li>8.5.2 SVC_Handler完整流程 241</li><li>8.5.3 SVC_Handler功能分段解析 243</li><li>8.5.4 SVC_Handler完整代码注释 246</li><li>8.6 函数调用关系总结及存储空间分析 249</li><li>8.6.1 启动过程中函数的调用关系总结 250</li><li>8.6.2 启动过程存储空间分析 253</li></ul></li><li>8.7 本章小结 257</li></ul></li><li><p>第9章 理解时间嘀嗒 259</p><ul><li><p>9.1 时间嘀嗒的建立与使用 259</p><ul><li>9.1.1 SysTick定时器的寄存器 259</li><li>9.1.2 SysTick定时器的初始化 260</li><li>9.1.3 SysTick中断服务程序 263</li></ul></li><li><p>9.2 延时函数 266</p><ul><li>9.2.1 线程延时等待函数 266</li><li>9.2.2 线程延时嘀嗒函数 267</li><li>9.2.3 其他时间嘀嗒函数 269</li></ul></li><li><p>9.3 延时等待列表工作机制 271</p><ul><li>9.3.1 线程插入延时等待列表函数 271</li><li>9.3.2 从延时等待列表中移除线程的函数 274</li><li>9.3.3 延时函数调度过程实例剖析 275</li></ul></li><li><p>9.4 与时间相关的函数 279</p><ul><li>9.4.1 获取系统运行时间函数 280</li><li>9.4.2 日期转时间戳函数 281</li><li>9.4.3 时间戳转日期函数 283</li></ul></li><li>9.5 本章小结 286</li></ul></li><li><p>第10章 理解调度机制 287</p><ul><li><p>10.1 ARM Cortex-M4的SVC和PendSV中断的调度作用 287</p><ul><li>10.1.1 SVC中断的调度作用 287</li><li>10.1.2 PendSV中断的调度作用 288</li><li>10.1.3 列表分析 288</li></ul></li><li><p>10.2 中断服务程序PendSV_Handler剖析 289</p><ul><li>10.2.1 osRtxPendSV _Handler的功能概要 289</li><li>10.2.2 osRtxPendSV_Handler函数源代码解析 290</li><li>10.2.3 跳转到SVC_Context进行上下文切换 291</li><li>10.2.4 PendSV_Handler函数完整代码注释 291</li></ul></li><li><p>10.3 PendSV应用举例 292</p><ul><li>10.3.1 PendSV在事件中的应用 292</li><li>10.3.2 PendSV在线程信号中的应用 296</li></ul></li><li>10.4 本章小结 300</li></ul></li><li><p>第11章 理解事件与消息队列 301</p><ul><li><p>11.1 事件 301</p><ul><li>11.1.1 事件的相关结构体 301</li><li>11.1.2 事件函数深入剖析 302</li><li>11.1.3 事件调度剖析 307</li></ul></li><li><p>11.2 消息队列 311</p><ul><li>11.2.1 消息或消息队列结构体 311</li><li>11.2.2 消息队列函数深入剖析 313</li><li>11.2.3 消息队列调度剖析 318</li></ul></li><li>11.3 本章小结 322</li></ul></li><li><p>第12章 理解线程信号、信号量与互斥量 323</p><ul><li><p>12.1 线程信号 323</p><ul><li>12.1.1 线程操作函数 323</li><li>12.1.2 线程信号函数深入剖析 329</li><li>12.1.3 线程信号调度剖析 333</li></ul></li><li><p>12.2 信号量 337</p><ul><li>12.2.1 信号量控制块结构体 337</li><li>12.2.2 信号量函数深入剖析 337</li><li>12.2.3 信号量调度剖析 341</li></ul></li><li><p>12.3 互斥量 345</p><ul><li>12.3.1 互斥量结构体 345</li><li>12.3.2 互斥量函数深入剖析 346</li><li>12.3.3 互斥量调度剖析 352</li><li>12.3.4 互斥量避免优先级反转问题调度剖析 356</li></ul></li><li>12.4 本章小结 359<br><strong>第3篇 综合实践篇</strong></li></ul></li><li><p>第13章 基于Mbed OS的AHL-EORS应用 363</p><ul><li><p>13.1 AHL-EORS简介 363</p><ul><li>13.1.1 硬件清单 363</li><li>13.1.2 硬件测试导引 364</li></ul></li><li><p>13.2 卷积神经网络概述 364</p><ul><li>13.2.1 卷积神经网络的技术特点 364</li><li>13.2.2 卷积神经网络原理 365</li></ul></li><li><p>13.3 AHL-EORS选用模型分析 368</p><ul><li>13.3.1 MobileNetV2模型 369</li><li>13.3.2 NCP模型 370</li></ul></li><li><p>13.4 AHL-EORS的数据采集与训练过程 373</p><ul><li>13.4.1 数据采集程序 373</li><li>13.4.2 模型训练与部署 376</li></ul></li><li>13.5 在通用嵌入式计算机GEC上进行的推理过程 377</li><li>13.6 本章小结 380</li></ul></li><li><p>第14章 基于Mbed OS的NB-IoT应用开发 381</p><ul><li><p>14.1 窄带物联网应用开发概述 381</p><ul><li>14.1.1 窄带物联网简介 381</li><li>14.1.2 NB-IoT应用开发所面临的难题及解决思路 382</li><li>14.1.3 直观体验NB-IoT数据传输 383</li><li>14.1.4 金葫芦NB-IoT开发套件简介 384</li></ul></li><li><p>14.2 NB-IoT应用架构及通信基本过程 386</p><ul><li>14.2.1 建立NB-IoT应用架构的基本原则 386</li><li>14.2.2 终端UE、信息邮局MPO与人机交互系统HCI的基本定义 386</li><li>14.2.3 基于信息邮局粗略了解基本通信过程 387</li></ul></li><li><p>14.3 终端UE与云侦听程序的通信过程 388</p><ul><li>14.3.1 基于mbed的终端UE模板工程设计 389</li><li>14.3.2 云侦听模板工程功能简介 391</li><li>14.3.3 建立云侦听程序的运行场景 392</li><li>14.3.4 运行云侦听与终端UE模板工程 394</li><li>14.3.5 通信过程中的常见错误说明 396</li></ul></li><li><p>14.4 通过Web网页的数据访问 397</p><ul><li>14.4.1 运行Web模板观察自己终端UE的数据 397</li><li>14.4.2 NB-IoT的Web网页模板工程结构 398</li></ul></li><li><p>14.5 通过微信小程序的数据访问 399</p><ul><li>14.5.1 运行小程序模板观察自己终端UE的数据 399</li><li>14.5.2 NB-IoT的微信小程序模板工程结构 401</li></ul></li></ul></li><li>参考文献 403</li></ul><h2>作者简介</h2><p>王宜怀,博士,教授、博士生导师、网络工程系主任;苏州大学嵌入式系统与物联网研究所所长;苏州市政协常委、中国农工民主党苏州市委常委;江苏省计算机学会嵌入式系统与物联网专业委员会主任、中国软件行业协会嵌入式系统分会理事。主要研究方向:嵌入式系统、物联网与智能控制技术。</p><h2>书籍购买</h2><p>书籍购买:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F13237887.html" target="blank">https://item.jd.com/13237887.html</a><br>试读链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Fcread.jd.com%2Fread%2FstartRead.action%3FbookId%3D30817514%26readType%3D1" target="blank">https://cread.jd.com/read/startRead.action?bookId=30817514&amp;readType=1</a></p><p>配套电子资源获取(包含文档和源代码):点击<a href="https://aijishu.com/link?target=http%3A%2F%2Fsumcu.suda.edu.cn%2FmbedOS%2Flist.htm" target="blank">苏州大学嵌入式学习社区官网</a>,在【<strong>著作</strong>】-【<strong>mebdOS</strong>】下栏目下获得电子资源。</p><blockquote>更多书籍推荐请关注<a href="https://aijishu.com/blog/armjiaoyushengta"><strong>极术读书专栏</strong></a>,用知识武装头脑,增强个人竞争力。</blockquote>
                                                    ]]></description>
            <pubDate>Tue, 20 Sep 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000355068</guid>
            <link>https://aijishu.com/a/1060000000355068</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】极客时间月卡赠卡第一期获奖名单]]></title>
            <description><![CDATA[<p>上周<a href="https://aijishu.com/books">极术读书栏目</a>组织了极客时间月卡赠卡第一期活动,收到了很多社区用户的支持。下方为社区中奖用户名单,非常感谢大家的支持。欢迎大家继续关注<a href="https://aijishu.com/books">极术读书栏目</a>,我们会推荐更多嵌入式,AI,芯片设计,安全等领域的好书以及组织webinar和赠书活动。</p><p>中奖名单如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbDzn" alt="a5d1f6022a5601cc6cc20a95a6630b2.png" title="a5d1f6022a5601cc6cc20a95a6630b2.png"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbDzo" alt="bfb41fd344bc64dd5fd8c4922c2cd6e.jpg" title="bfb41fd344bc64dd5fd8c4922c2cd6e.jpg"></p><blockquote><p>恭喜以上用户,我们将尽快将月卡兑换码发到您的申请邮箱。没有获奖的小伙伴也不要灰心,请关注我们更多活动。</p><p>暂时没有获奖的的小伙伴也不要着急,接下来极术读书及安谋科技学堂会多多组织类似的活动,努力为大家谋福利!</p></blockquote><p><strong>活动原文</strong>:<a href="https://aijishu.com/e/1120000000346486">【极术读书】赠卡活动第一期,200张极客时间月卡免费领,从零开始学芯片</a></p><p><strong>学习推荐</strong>:关注<strong>安谋科技学堂</strong>公众号<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbiNv" alt="安谋科技学堂.png" title="安谋科技学堂.png"></p><blockquote>本活动最终解释权归极术社区所有。</blockquote>
                                                    ]]></description>
            <pubDate>Sun, 04 Sep 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000351369</guid>
            <link>https://aijishu.com/a/1060000000351369</link>
        </item>
        <item>
            <title><![CDATA[免费学习国家精品课程:《嵌入式系统及应用》在线课程,第12次开课!]]></title>
            <description><![CDATA[<p>和安谋科技教育计划有非常深入合作的苏州大学王宜怀教授,正在授课的基于Arm® Cortex®-M处理器的<strong>《嵌入式系统及应用》在线开放课程</strong>一直是我们极力推荐的。目前该课程已经被评为<strong>国家精品课程</strong>。</p><p>嵌入式系统是嵌入式人工智能与物联网的重要基础,该课程以Arm Cortex-M微处理器为蓝本,以软硬件构件为主线,基于嵌入式软件工程基本原理,按照"通用知识—驱动构件使用方法—测试实例—芯片编程结构—构件设计方法”的线条,逐步阐述嵌入式系统基本知识要素及较为规范的底层软硬件相结合的设计方法。</p><p><strong>目前是本课程的第12次开课,开课时间是2022年09月05日 ~ 2023年01月06日。</strong>如果你想掌握构成计算机的基本部件原理,掌握计算机高级程序设计方法,为从寄存器级理解软件干预硬件提供基础,那就赶快查看下方信息,报名学习吧!现在加入还来得及喔~</p><h2>《嵌入式系统及应用》在线开放课程</h2><p><a href="https://v.qq.com/x/page/j3325qf1xro.html">https://v.qq.com/x/page/j3325qf1xro.html</a></p><p>本视频由授课教师提供</p><h4><strong>01 基本介绍</strong></h4><ul><li><strong>课程名称:</strong>《嵌入式系统及应用》</li><li><strong>授课单位:</strong>苏州大学</li><li><strong>授课教师:</strong>王宜怀、张建、刘长勇</li><li><strong>在线学习网址:</strong>  <a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.icourse163.org%2Fcourse%2FSUDA-1001754273" target="blank">[爱课程-中国大学MOOC]</a></li></ul><h4><strong>02 课程概述</strong></h4><p>《嵌入式系统及应用》课程作为嵌入式人工智能与物联网相关专业的基础课程,以Arm Cortex-M微处理器为蓝本,采用构件化开发,针对每个知识点,提供样本程序(葫芦),学生通过模仿该程序稍加修改后可完成符合自我要求的程序(照葫芦画瓢)。课程按照<strong>“通用知识—驱动构件使用方法—测试实例—芯片编程结构—构件设计方法”</strong>的线条,逐步阐述嵌入式系统基本知识要素及较为规范的底层软硬件相结合的设计方法。</p><h4><strong>03 课程用书</strong></h4><p>本课程教学用书《嵌入式技术基础与实践(第6版)—基于STM32L431微控制器》,该教材历经十多年凝练,仔细梳理了嵌入式系统的通用基础知识要素,注重把握通用知识与芯片相关知识之间的平衡、把握硬件与软件的关系、对底层驱动进行构件化封装、设计合理的测试用例,教材内含简明实验套件,结合网上电子资源,方便读者进行实践与应用。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbqNk" alt="51546da303679fd168b5fe7d75d10e65.jpg" title="51546da303679fd168b5fe7d75d10e65.jpg"></p><p><strong>《嵌入式技术基础与实践(第6版)》(王宜怀主编)</strong></p><blockquote>【书内含通用嵌入式计算机GEC,型号:AHL-STM32L431,可完成书中基本实验】</blockquote><p><strong>电子资源下载地址及路径:</strong></p><p>“<a href="https://aijishu.com/link?target=https%3A%2F%2Fsumcu.suda.edu.cn%2F" target="blank">https://sumcu.suda.edu.cn/</a>”→“金葫芦专区”→“嵌入式书6版”,右边为下载索引</p><p><strong>点击<a href="https://aijishu.com/link?target=https%3A%2F%2Ftuicashier.youzan.com%2Fpay%2Fwscgoods_order%3Fbanner_id%3Dseach.16152946%7Esearch%7E7%7E7LEMSxlm%26words%3D%E5%B5%8C%E5%85%A5%E5%BC%8F%26alg%3D0%26slg%3Dconsumer-search%2CstandardModify%2C30be7fd3-df55-4535-c709-11c1b3a78e09%2C711.545_c9498a9569324a1ab4d18b403e0cc497%26reft%3D1630934839602%26spm%3Dseach.16152946%26is_share%3D1%26shopAutoEnter%3D1%26sl%3D3NTPzP%26from_params%3Dsl%7E3NTPzP%21online_kdt_id%7E16152946%26sub_kdt_id%3D16152946%26st%3D3%26alias%3D3f579wrkbwq9es4%26is_silence_auth%3D1" target="blank">链接</a>即可购买教材:</strong></p><h4><strong>04 课程大纲</strong></h4><p><strong>01 概述</strong></p><p>1.1 初识嵌入式系统<br>1.2 嵌入式系统的定义、发展简史、分类及特点<br>1.3 嵌入式系统的学习困惑、知识体系及学习建议<br>1.4 微控制器与应用处理器简介<br>1.5 嵌入式系统常用术语</p><p><strong>02 Arm Cortex-M4微处理器</strong></p><p>2.1 Arm Cortex-M4微处理器简介<br>2.2 寻址方式与机器码的获取方法<br>2.3 基本指令分类解析<br>2.4 汇编语言的基本语法</p><p><strong>03 存储器映像、中断源与硬件最小系统</strong></p><p>3.1 STM32L系列MCU概述<br>3.2 STM32L4的引脚图与硬件最小系统<br>3.3 由MCU构建通用嵌入式计算机</p><p><strong>04 GPIO及程序框架</strong></p><p>4.1 GPIO通用基础知识<br>4.2 软件干预硬件的方法<br>4.3 认识工程框架<br>4.4 GPIO构件的制作过程<br>4.5 第一个汇编语言工程:控制小灯闪烁<br>4.6 实验一 熟悉实验开发环境及GPIO编程</p><p><strong>05 嵌入式硬件构件与底层驱动构件基本规范</strong></p><p>5.1 嵌入式硬件构件<br>5.2 嵌入式底层驱动构件的概念与层次模型<br>5.3 底层驱动构件的封装规范<br>5.4 硬件构件及其驱动构件的复用与移植方法</p><p><strong>06 串行通信模块及第一个中断程序结构</strong></p><p>6.1 异步串行通信的通用基础知识<br>6.2 基于构件的串行通信编程方法<br>6.3 UART构件的制作过程<br>6.4 中断机制及中断编程步骤<br>6.5 实验二 串口通信及中断实验</p><p><strong>07 定时器相关模块</strong></p><p>7.1 定时器通用基础知识<br>7.2 STM32L431中的定时器<br>7.3 脉宽调制<br>7.4 输入捕捉与输出比较<br>7.5 实验三 定时器及PWM实验</p><p><strong>08 Flash在线编程、ADC与DAC  </strong></p><p>8.1 Flash在线编程  <br>8.2 ADC<br>8.3 DAC<br>8.4 实验四 ADC实验</p><p><strong>09&nbsp;SPI、I2C与TSC模块  </strong></p><p>9.1 串行外设接口SPI模块  <br>9.2 集成电路互联总线I2C模块<br>9.3 触摸感应控制器TSC模块<br>9.4 实验五 SPI通信实验</p><p><strong>10 CAN总线、DMA与位带操作</strong>  </p><p>10.1 CAN总线<br>10.2 DMA<br>10.3 位带操作</p><p><strong>11 系统时钟与其他功能模块</strong>  </p><p>11.1 时钟系统<br>11.2 复位模块与看门狗模块<br>11.3 电源控制模块与CRC校验模块<br>11.4 实验六 综合实验</p><p><strong>12 应用案例  </strong></p><p>12.1 嵌入式系统稳定性问题<br>12.2 外接传感器及执行部件的编程方法<br>12.3 实时操作系统的简明实例<br>12.4 嵌入式人工智能的简明实例<br>12.5 NB-IoT的应用简介<br>12.6 4G、Cat1、Wi-Fi及WSN的应用</p><h4><strong>05 预备知识</strong></h4><p>必须具备以下知识:</p><ul><li>计算机硬件基础(或模拟电路与数字电路、计算机组成、汇编语言、微机原理)</li><li>高级程序语言设计等(如C语言)</li></ul><p>学生通过学习上述课程,基本掌握构成计算机的基本部件原理,掌握计算机高级程序设计方法,为从寄存器级理解软件干预硬件提供基础。</p>
                                                    ]]></description>
            <pubDate>Wed, 31 Aug 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000350157</guid>
            <link>https://aijishu.com/a/1060000000350157</link>
        </item>
        <item>
            <title><![CDATA[【极术读书】《软硬件融合--超大规模云计算架构创新之路》赠书名单公布]]></title>
            <description><![CDATA[<blockquote><strong>极术读书</strong>是极术社区推出的读书栏目。极术读书专栏定期推荐嵌入式,人工智能,物联网,云计算,安全,半导体等智能计算领域的图书及技术管理类图书,同时策划社区赠书活动和作者webinar方便读者交流互动,欢迎关注<a href="https://aijishu.com/blog/armjiaoyushengta">极术读书</a>专栏。</blockquote><p>2022年7月27日至8月1日,极术社区联合安谋科技学堂赠送50本《<a href="https://aijishu.com/e/1120000000340363"><strong>软硬件融合-超大规模云计算创新之路</strong></a>》,非常感谢大家的积极参与,赠书名单如下,恭喜下方的小伙伴,下面每人将收到极术读书赠送的一本《软硬件融合--超大规模云计算架构创新之路》。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbBDd" alt="1659338014008.jpg" title="1659338014008.jpg"></p><blockquote><p>祝贺以上获奖的小伙伴!</p><p>极术读书工作人员将给中奖用户发送邮件通知并尽快安排寄出。</p><p>暂时没有获奖的的小伙伴也不要着急,接下来极术读书及安谋科技学堂会多多组织类似的活动,努力为大家谋福利!</p></blockquote><p><strong>活动原文</strong>:<a href="https://aijishu.com/e/1120000000340363">【极术读书赠书活动】50本《软硬件融合》免费领,学习从DPU到异构计算的超大规模计算创新之路</a></p><p><strong>资源推荐</strong>:关注<strong>安谋科技学堂</strong>公众号,回复 “<strong>软硬件融合</strong>” 获取软硬件融合相关资源!<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbiNv" alt="安谋科技学堂.png" title="安谋科技学堂.png"></p><p><strong>如何购买?</strong><br>京东旗舰店:<a href="https://aijishu.com/link?target=https%3A%2F%2Fitem.jd.com%2F12836605.html" target="blank">https://item.jd.com/12836605.html</a></p><blockquote>本活动最终解释权归极术社区所有。</blockquote>
                                                    ]]></description>
            <pubDate>Sun, 31 Jul 2022 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000343915</guid>
            <link>https://aijishu.com/a/1060000000343915</link>
        </item>
    </channel>
</rss>

...

@github-actions
Copy link
Contributor

http://localhost:1200/aijishu/channel - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[极术社区 - 连接开发者与智能计算生态]]></title>
        <link>https://aijishu.com/</link>
        <atom:link href="http://localhost:1200/aijishu/channel" rel="self" type="application/rss+xml" />
        <description><![CDATA[极术社区 - 连接开发者与智能计算生态 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 17:49:06 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[抢先入局AIGC,新华三底层能力何在?]]></title>
            <description><![CDATA[<p>2022年11月,智能对话机器人模型ChatGPT上线,其连续对话能力、强大的理解力、回答的准确度和创造性使其迅速走红。数据显示,ChatGPT发布短短两个月时间,全球用户数便突破1亿。  </p><p>可以说,这项火遍全球的突破性人工智能对话技术,为整个科技行业带来了全新的想象力。而在国内,由百度打造的首个“类ChatGPT”——百度文心一言(ERNIE Bot)也即将在今年3月呈现,这是先进的人工智能对话技术在国内数字化领域中的首次大规模落地尝试,其价值无疑深远而重大。  </p><p><img referrerpolicy="no-referrer" src="https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/6ded7ccf62ea480d89d72aa5f4f8be39~tplv-tt-shrink:640:0.image?traceid=20230227174332DA60910EFE6C344C7866&amp;x-expires=2147483647&amp;x-signature=PzGM3fUwuBa9BuJ%2F70g%2Fv1HfU3k%3D" alt="" title="">  </p><p>值得一提的是,紫光股份旗下新华三集团日前也宣布正式成为百度文心一言的首批生态合作伙伴。接下来,双方将会把领先的智能对话技术成果应用在数字化领域,深度赋能百行百业的数字化转型和智能化升级。  </p><p>回头来看,新华三之所以能够成为百度文心一言的首批生态合作伙伴,无疑是其长期在ICT基础设施领域深厚技术沉淀和释放的一种体现,而这背后也让整个产业看到了新的可能——那就是站在企业数字化转型和智能化升级的重要关口,新华三以其智算基础架构构筑的超大模型底座,无疑可以为百行百业创造出更多具有想象空间的新业态、新服务和新模式,让智能化的大潮 “普惠”每一家企业和每一个个人,释放智能化生产力的“乘数效应”。  </p><p><strong>新华三牵手百度文心一言背后</strong>  </p><p>目前,以ChatGPT为代表的AIGC内容生成方式通过学习人类的思考方式,查阅、挖掘大量素材,以低边际成本、少人力限制等高效率的方式生成大量满足人们差异化需求的内容。  </p><p><img referrerpolicy="no-referrer" src="https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/2f718b62e00544a7981e09717999fe9c~tplv-tt-shrink:640:0.image?traceid=20230227174332DA60910EFE6C344C7866&amp;x-expires=2147483647&amp;x-signature=efX7OTdHEhxAdShYjUSRZJikEnU%3D" alt="" title="">  </p><p>文心一言,正是百度基于文心大模型技术推出的生成式AI产品。作为国内少有的拥有大模型技术的企业,百度在人工智能领域深耕十余年,拥有产业级知识增强文心大模型ERNIE,具备跨模态、跨语言的深度语义理解与生成能力,而这种能力,也在搜索问答、云计算、内容创作生成、智能办公等众多领域具有较大的“用武之地”。  </p><p>而本次新华三之所以率先成为百度文心一言的首批生态合作伙伴,其实也在“情理之中”。据了解,新华三与百度的合作有着长久的历史积淀,双方在ICT基础设施优化升级、百度智能云建设、信息检索、自动驾驶、生态建设等众多领域均有研发级别的合作,目前相关成果已广泛落地,对双方的产品技术发展产生了积极而深远的影响。  </p><p>而展望未来,新华三也将继续携手百度,为智能交通、自动驾驶、智慧城市、智慧医疗、智慧教育、智慧金融、多域互联等领域推出更多场景化解决方案,开拓内容生态和智能服务领域的全新可能性,全面引领数字化时代的产业变革与升级。  </p><p><strong>以智算架构构筑超大模型底座</strong>  </p><p>接下来要追问的是,为什么是新华三能够率先成为百度文心一言的首批生态合作伙伴呢?其实,要回答这一问题,就不得不提到类似ChatGPT和百度文心一言这样的AI基础模型(基于大规模数据集和大规模算力训练的大型预训练模型),要训练出这样的超大基础模型,往往是需要多方面的关键技术作为支撑的——除了大模型算法、分布式训练系统、高质量数据集的相关工具等,对计算、网络、存储等基础设施做出了巨大挑战。  </p><p>例如,训练大模型首先就需要大规模算力资源做支撑;同时大型训练对显存以及数据集缓存要求同样很高,训练过程中还会面临显存墙问题(模型是否能跑起来)以及计算/通信墙问题(能否在合理时间内完成训练);此外,大模型的训练同样对网络也提出了更高的要求,即需高性能网络满足节点间参数同步,且GPU服务器节点间需要高速网络来实现模型训练参数交换和存取等等。  </p><p>正是由于大模型的训练对存储、计算、网络等各个层面都提出了比较严苛的要求,长期深耕ICT领域的新华三,也基于自身在存储、计算、网络等领域深厚的技术积淀,打造出了一套全新的智算基础架构,该架构分为两大区域,即智算训练区和智算推理区,由此能够为大模型的训练提供强大的技术底座能力,具体来看:  </p><p><img referrerpolicy="no-referrer" src="https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/5bd8f2b9a2d94617be87edd9202d9527~tplv-tt-shrink:640:0.image?traceid=20230227174332DA60910EFE6C344C7866&amp;x-expires=2147483647&amp;x-signature=okFNlp6zeraUxFTj8uGC3VkVV30%3D" alt="" title="">  </p><p><strong>一是,在训练集群方面,</strong>目前大模型的训练使用的服务器通常都是搭载NVIDIA NVLink GPU模块作为标准机,而新华三能够提供H3C UniServer R5500 G5这样机型,其搭载了NVIDIA HGX A800 8-GPU 80G模块,能够支持英特尔Whitley平台和AMD Milan平台,最大支持2颗Icelake(40C、270W)或2颗Milan(64C、280W)的CPU,存储方面能够最大支持12个U.2 NVMe SSD,其中8个支持GDS(GDS, GPU Direct Storage),可以最大化地满足训练集群的算力需求。  </p><p>不仅如此,在2023年初,新华三还发布了搭载NVIDIA H800 NVLink模块的新一代机型R5500 G6,支持英特尔EGS和AMD Genoa平台,PCIe 5.0及400GE网络的加持,也能够给大模型的训练带来更高的算力提升。  </p><p>另外,一些大型互联网公司还会使用自研GPU Box搭配计算节点的方式组建训练集群,GPU Box里面会搭载NVIDIA NVLink GPU模块或其他厂商的OAM模组,而OAM是开源的GPU模块,由OCP社区服务器项目组下的OAI小组开发并制定标准。在这方面,新华三也是OAI2.0规范制定的重要参与者,后续在R5500 G6上,新华三也可支持不同厂家GPU的OAM模组。  </p><p><strong>二是,在推理集群方面,</strong>GPU推理集群的规模主要取决于业务预期的QPS并发需求,一般会多机多卡多实例部署。同样,新华三也提供了相关的产品以满足实际的业务需求,以H3C UniServer R5300 G5为例,其最大支持2颗英特尔Icelake(40C、270W)CPU,并可搭配多厂家多种类型的GPU产品,包括GPU、XPU、NPU等。  </p><p>而在大规模推理场景下,新华三 UniServer R5300 G5也支持多种类型的GPU方案,包括4 PCIe GPU方案、8 PCIe GPU方案和16 PCIe GPU方案,以应对不同客户不同算力的推理集群搭建需求。此外,在去年11月份,新华三还发布了基于AMD Genoa平台的GPU服务器R5350 G6,可实现90%的CPU性能提升和50%的内核数量提升,应该说多种类型人工智能加速卡的支持,可以帮助客户应对人工智能不同场景下对异构算力的需求。  </p><p><strong>三是,高性能存储和网络也是大模型训练的重要组成部分。</strong>其中,高性能存储一般采用分布式并行文件存储,而新华三CX系列存储,就采用了全对称分布式架构,可结合IBM Spectrum Scale,为客户提供高带宽、低延时的存储服务。  </p><p>以新华三CX5036为例,配置2颗5218 CPU、4块1T NVMe和32块6T SATA HDD,4节点集群部署,测试大文件小IO(4KB)平均单节点IOPS可达2.55W(随机读)、2.36W(随机写),多客户端并发(16MB)平均单节点带宽可达3.57GB/s(顺序读)、2.08GB/s(顺序写),单客户端单流16MB IO聚合带宽可达5.45GB/s、1MB IO聚合带宽3.7GB/s。  </p><p>高性能网络方面,通常有两种网络搭建方式:第一种是RoCE网络,作为互联网400G领域的市场领头羊,基于新华三提供的S9825/S9855交换机配合AI ECN方案,也可以迅速搭建大模型训练所需的高性能网络。与此同时,随着大模型训练所需网络带宽的不断提升,网络主芯片性能也会迅速增加,当800G/1.6T时代来临时,CPO/NPO交换机将会登上互联网舞台,在这方面新华三也提前做了布局,其S9825-32D32DO交换机,同时支持32个400G光模块接口和32个400G光引擎接口,后续可以平滑升级至51.2T平台;第二种方式是DDC方案,DDC网络架构(分布式分解结构)可以很轻易解决负载均衡和阻塞问题,同时也能实现更优的网络性能和更快的网络收敛。在这方面,新华三的DDC方案也在进行相关验证中。  </p><p>由此可见,从新华三智算基础架构的技术细节中,可以看到新华三以智算基础架构为超大模型训练构筑了坚实的底座,不仅能够为包括AIGC为代表的超大模型提供关键技术支撑,同时也是新华三率先成为百度文心一言的首批生态合作伙伴的关键所在。  </p><p><strong>释放智能化生产力“乘数效应”</strong>  </p><p>客观地说,智能化已经成为了当下中国产业升级和企业数字化转型中的新动能和驱动力。特别是由于线上线下生态及场景远比其他国家丰富、多元,中国经济中结构性的差异,以及细分行业中不同的应用场景需求,都给了基于AIGC为代表的新技术的创新以巨大的想象力,而新华三以智算架构构筑的超大模型底座,不仅可以帮助企业借助AIGC提升效率,创造新价值,持续推动产业智能化的升级,同时也让AI真正“扎根”百行百业奠定了关键基础,背后更体现出了全新的价值,可以从两个方面来做观察:  </p><p><img referrerpolicy="no-referrer" src="https://p3-sign.toutiaoimg.com/tos-cn-i-qvj2lq49k0/f3a59c74357546fe8fdb0c988f5ce441~tplv-tt-shrink:640:0.image?traceid=20230227174332DA60910EFE6C344C7866&amp;x-expires=2147483647&amp;x-signature=dEI4BKWYukYdL445%2Bjv%2B7jemLOk%3D" alt="" title="">  </p><p><strong>一方面,是为AI超大模型的训练提供了坚实的技术支撑。</strong>随着关键技术与基础理论不断突破,大算力、大数据、大模型将成为未来AI发展的重点发展方向,由此带动自然语言处理、翻译模型、生成算法和数据集等细分要素持续提升,推动产出的内容细节、类型更丰富、质量更高。  </p><p>这背后显然离不开强大的算力和网络的支撑。而新华三打造的智算基础架构,基于新华三长期在ICT基础设施领域的沉淀,充分融合了其在计算、存储和网络等领域的优势,就切实地为超大模型训练提供了技术支撑。  </p><p>在此基础上,新华三还积极坚持前沿技术创新,其中全面支持在网计算的H3C P4可编程交换机,就能够支持Pytorch框架和DPDK UDP、RoCE通信方式,将数据需求聚合统一操作,优化通信网络拥堵,减少主机的数据处理量。据新华三内部实验室测算,使用H3C P4可编程交换机加速数据并行训练,模型训练精度不受影响,计算节点间通信数据量平均减少30%,最多可以减少48%的训练时间,可大幅提升分布式集群的整体训练效率,创造更加出色的应用价值。可以说在产品、技术和方案上的领先性,是新华三差异化的优势所在,更是其能够助力各类企业AIGC展开研发和推进的价值所在。  </p><p><strong>另一方面,新华三还正与产业各方积极合作,探索新范式和新路径,推动普惠算力更为广泛地落地,使能百行百业的智能化升级,共同推进中国人工智能产业的发展。</strong>  </p><p>这方面,新华三率先成为百度文心一言首批生态合作伙伴就是具体的印证。众所周知,今天AI正在极大改变人们的生活方式,目前也正在开始加速渗透到企业的研发设计、生产制造、供应链管理、客户服务等各个环节,深刻改变着人们的生产方式。  </p><p>因此,以提升效率和优化配置为核心主题的AI应用和创新,是数字经济深化发展的全新阶段,更是传统产业转型升级的必然要求。在这种大背景下,新华三和包括百度在内的产业合作伙伴通力合作,并通过旗下丰富的产品和解决方案为百行百业的用户注入云原生及人工智能技术,也能加速整个行业的智能化升级,释放智能化生产力“乘数效应”。  </p><p>总的来说,中国产业智能化的转型升级,中国数字经济的落地和发展,任重而道远。在此过程中,新华三以全新的智算架构支撑超大模型训练,并与产业合作伙伴深度合作,让AIGC这样的新技术能够加速行业落地的步伐,而这种创新力、前瞻力和爆发力,相信也将能够推动中国的人工智能产业呈现出“百花齐放”的状态,更能够提速整个行业智能化时代的到来,这不仅是未来的趋势所在,也是新华三不断创新与突破的重要体现。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 09:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387147</guid>
            <link>https://aijishu.com/a/1060000000387147</link>
        </item>
        <item>
            <title><![CDATA[神奇的MTE Tag在哪里?]]></title>
            <description><![CDATA[<p>常有人问MTE Tag在哪里?</p><h4>MTE Tag存在于两个地方:</h4><ol><li>MTE tag放在访问地址的bit 56:59,比如通过LDR Xm, [Xn]访问内存,Xn里面存放的是访问地址,当MTE使能的时候,真正用于访问内存的地址是bit 0:47(不考虑arm的52bit地址扩展)和bit 55 (bit55用于决定是高虚拟地址空间还是低虚拟地址空间),bit 56:59 这4个bit用于存放该地址的tag<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSb" alt="1.jpg" title="1.jpg"></li></ol><p>Xn的Tag生成和插入可以IRG,ADDG,SUBG等这些指令来实现:</p><ul><li>IRG Xn, Xn:为Xn中的地址生成一个随机的Tag,并插入到Xn的bit 56:59</li><li>ADDG Xm,Xn,#offset,#Tag  or</li><li>ADDG Xm,Xn,#offset,#Tag: 对Xn中的地址进行加减操作,并将指令中的Tag值插入到目的寄存器中</li></ul><p>当然软件也可以直接通过一般的指令直接改Xn寄存器的bit 56:59,比如<br>AND Xn, Xn, #~(0xf&lt;&lt;56)</p><ol start="2"><li>MTE tag放在内存中(内存可以是cache或是外部内存):<br>  每16-bye的物理地址空间有与之对应的4-bit的Tag存储空间<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSc" alt="7.jpg" title="7.jpg"></li></ol><p>在cache中,可以如下类似方式存储一个cache line(较新处理器Data cache都是PIPT的)对应的Tag:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSd" alt="12.jpg" title="12.jpg"></p><p>对于外部内存,实际系统中设计上,可以设计为在同一系统内存中大部分内存作为正常的数据存储使用,一部分内存用于存储数据对应的Tag(其关系是4-bit/16-byte, 既Tag的存储空间大小是正常数据存储大小的1/32)。每16-byte的物理内存对可以找到与之对应的4-bit Tag存储物理内存。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSe" alt="8.jpg" title="8.jpg"></p><p>下面通过一实例来演示。<br>假设访问的地址放在X0中<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSb" alt="1.jpg" title="1.jpg"></p><ol><li>为这个地址产生设置一个Tag,可以通过IRG指令来实现<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSf" alt="2.jpg" title="2.jpg"></li><li>将这个Tag保存到Tag存储内存,可以通过,STG,STGZ, ST2G / STZ2G这些指令来实现<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSg" alt="3.jpg" title="3.jpg"></li><li>对Tagged内存进行load/store访问,这会触发硬件的tag check操作<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSh" alt="4.jpg" title="4.jpg"></li></ol><p>在这个例子里面X0里面的tag和内存中保存的tag是match的,因此Tag Check成功。</p><ol start="4"><li>通过ADDG指令修改Xn中地址的Tag<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSi" alt="5.jpg" title="5.jpg"></li><li>对Tagged内存进行load/store访问,这会触发硬件的tag check操作<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSj" alt="6.jpg" title="6.jpg"></li></ol><p>X0里面的tag和内存中保存的tag不match,因此Tag Check失败。</p><h4>Tag存储和check的示例</h4><p>以上内容阐述了tag存储和check的基本知识,下面以一个实际的例子来帮助更深入理解。<br>我们从上面的IRG,STG,LDR/STR等指令可以看出,Tag的存储在软件上看并没有独立的访问地址,对Tag的访问是使用其对应的数据访问地址:</p><ol><li>如果数据在处理器的cache中,那么其该数据所在的cache line也可以包含数据对应的Tag, MTE Tag check可以在CPU中进行。</li><li>但如果数据不在cache中(cache的大小有限),那么就需要将数据和Tag存放在系统内存(DRAM)中。那系统如何在系统内存中存放和访问数据和Tag呢?Tag check发生在哪里?<br>我们以一个使用CI-700的系统为例。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSk" alt="9.jpg" title="9.jpg"></li></ol><p>CI-700可以包含支持MTE Tag的system cache, 除此之外,它还可以包含MTSX,而MTSX包含:</p><ol><li>支持计算一个访问地址在DRAM中对应的Tag访问地址的split logic, 通过软件设置的Tag_base_address, split logic可以换算出一个地址对对应的Tag在DRAM存放的位置。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSe" alt="8.jpg" title="8.jpg"></li><li>支持Tag check (Tag 比较)</li><li>支持对专门只缓存Tag值的MTE Tag cache,这是一个可选的功能。</li></ol><p>MTSX split logic可以将CPU发送的Tagged address访问拆分成正常的数据访问和对Tag的访问,从而使DMC不需要区别正常数据访问和Tag访问(DMC对数据还是Tag访问无感,DMC不需要对MTE做特殊的支持)。</p><p>以STG X0,[X0]为例,这个指令如果在cache中miss,那么将产生一个TagOps为Update的CHI transaction,传输到MTSX,这个transaction包含放在X0中的数据访问地址和Tag Value。MTSX的split logic负责换算出这个数据访问地址对应的Tag在DRAM中的地址,然后使用这个地址将Tag value更新到DRAM中。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSl" alt="10.jpg" title="10.jpg"></p><p>如果一个Tagged address的数据从cache中write back到DRAM中,将产生一个TagOps为Match的CHI transaction, 传输到MTSX, 这个transaction包含数据访问地址,数据值和Tag Value,MTSX的split logic负责其拆分为:</p><ol><li>Tag访问:换算出这个数据访问地址对应的Tag在DRAM中的地址,从这个地址中取出Tag值,然后由MTSX的Tag Compare logic比较取出Tag值和transaction带有的Tag Value。</li><li>正常数据写操作<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMSm" alt="11.jpg" title="11.jpg"></li></ol>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 08:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387141</guid>
            <link>https://aijishu.com/a/1060000000387141</link>
        </item>
        <item>
            <title><![CDATA[解密禾赛科技最新激光雷达专利]]></title>
            <description><![CDATA[<p>【爱集微点评】禾赛科技的激光雷达专利,通过色散偏折件实现多波长光源所产生光线的分光和出射,同时色散偏折件还能起到扩束的作用,能够有效增大激光雷达的口径,提升测远能力。而且不会过多增加激光雷达的光路高度,有效的压缩了激光雷达的高度和体积。</p><p>集微网消息,近日,禾赛科技在纳斯达克成功上市,意味着中国“激光雷达”向全球又迈进了一步,同时禾赛科技也成为中国“激光雷达第一股”。</p><p>激光雷达是一种常用的测距传感器,其工作原理是利用激光往返于雷达和目标之间所用的时间,或者调频连续光在雷达和目标之间往返所产生的频移来评估目标的距离或速度等信息。为了获得较大的视场范围,激光雷达通常采用扫描装置进行扫描。激光雷达常用的扫描方式有机械旋转式、反射镜扫描式、光学相控阵(OPA)扫描、Flash扫描等。另外,还有一种扫描方式是波长扫描。波长扫描的扫描装置是利用光栅、棱镜等色散元件基于波长将多波长光源产生的光线分开以达到扫描的效果。但是现有波长扫描的扫描装置往往存在装配不方便的问题。</p><p>为此,禾赛科技于2022年8月29日申请了一项名为“激光雷达的发射模块及激光雷达”的发明专利(申请号:202222291141.6),申请人为上海禾赛科技有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1126334138789.4883.png" alt="image" title="image"></p><p>图1 波长扫描装置的光路示意图</p><p>图1为传统波长扫描装置的光路示意图,在激光雷达的应用中,通过不同波长的光线向不同角度衍射来实现激光雷达对不同垂直角度的扫描。因此,为了使多束衍射光的出射方向靠近水平面,实现对垂直0°角和垂直方向正角度和负角度一定范围的扫描,如图1所示,通常在色散元件12下游的光路中会设置反射镜13。但是反射镜13的反射面与水平方向之间的夹角较大,所以会增大光路沿垂直方向的尺寸,使得激光雷达光路垂直方向的高度增大,从而不利于激光雷达体积的缩小。此外,也会使激光雷达光路的不同光学元件在不同高度的水平面上,从而造成了激光雷达的安装不便。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1342321041364.585.png" alt="image" title="image"></p><p>图2 新型激光雷达发射模块结构示意图</p><p>图2为本专利提出的一种新型激光雷达发射模块结构示意图,在此主要引入色散偏折件129,其主要包括光栅层127和导光体128。光栅层127朝向导光体128的表面并与导光体128的表面直接接触。导光体128的两个表面分别为第一面121和第二面122,第一光线131从第一面121入射至导光体128,第三光线133自第二面122从导光体128出射。色散面和偏折面集成于一体化结构的导光体128上,能够使光学元件体积大幅缩小,并且一体化的光学元件结构更加稳定,能够有效提高光路的鲁棒性。此外,一般而言,导光体128材料的折射率大于1。将导光体128的材料设置为比较常见的大于1的材料以控制折射角度,可以实现扩束效果。</p><p>简而言之,禾赛科技的激光雷达专利,通过色散偏折件实现多波长光源所产生光线的分光和出射,同时色散偏折件还能起到扩束的作用,能够有效增大激光雷达的口径,提升测远能力。而且不会过多增加激光雷达的光路高度,有效的压缩了激光雷达的高度和体积。</p><p>禾赛科技是一家致力于激光雷达研发与制造的全球化公司,其客户遍布全球主流汽车厂商、自动驾驶和机器人公司,覆盖40个国家和90多个城市。作为以技术为核心竞争力的公司,禾赛科技的成功并非偶然,而是在多年的产品打磨和技术投入中诞生的。中国需要有世界级自主研发能力的公司,相信禾赛科技也有实力成为全球领先企业。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387119</guid>
            <link>https://aijishu.com/a/1060000000387119</link>
        </item>
        <item>
            <title><![CDATA[河南农信社数字化转型实践方案]]></title>
            <description><![CDATA[<p>农信机构立足地方“三农”,普遍规模较小,高地域集中度在县域和农村地区,容易受到地方农村经济脆弱性的影响。</p><p>农信机构由于信贷项目要求多,单笔贷款业务批复的额度相对较小,在信用档案登记环节,造成业务量和工作量相对较多。同时,信用信息采集不够精确,不能全面且合理地评定农民信用等级,最终结果就是贷款主题的信用评级被高估,部分贷款主题获得超出实际所需额度的贷款,不能予以偿还,提高了农信系统的不良率。</p><p><strong>农信社信贷普遍面临担保条件难以落实、营销运营成本高、人员操作道德风险大、客户授信主观化、办理速度慢等问题。</strong></p><p>数字化转型是一场科技革命,能够精准解决农村普惠金融推进过程中的痛点。农信社以数字综合治理为契机,加强数据全周期管理,建立数据治理长效机制,提升农信社核心竞争力,为数字化转型奠定基础。多举措提升创新研发和数字应用能力。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMrZ" alt="2.png" title="2.png"></p><h2>河南农信的数字化实践</h2><p>农信系统改革,是2023年银行业的“重头戏”。11月23日,《河南日报》报道了河南省农信社改革进展。据报道,河南省农信社改革方案已获得银保监会批复,将通过组建河南农商联合银行,自上而下理顺股权结构,完善公司治理,推进系统重塑,提升全省农信社体系健康度,充分发挥其地方金融“压舱石”的作用。基于对自身的调研、思考和探索,河南农信给出了数字化转型的应对之策。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRS" alt="图片1.png" title="图片1.png"></p><p><strong>建立高效的数字化架构。</strong>通过构建数字化的IT支撑平台,形成数据开发、共享、使用和管理流程机制,完成向现代银行、智慧银行的数字化转型,将存贷汇、融资理财、在线信贷、金融咨询等标准化产品嵌入各种场景,把金融服务融入客户工作和生活,从而吸引客户、留住客户,增强客户的黏性和忠诚度。</p><p><strong>建设数字化授信体系。</strong>全面推进农户、个体商户、社区居民的信息采集、加工、评价和维护、加快客户信息系统建设和大数据技术应用,对小微经营户、农户信用风险进行数量化精确计量,通过采集高度简化的现场客观信息和互联网大数据信息,实现低成本、高效率、客观准确的授信决策。</p><p><strong>增强业务风险管理水平。</strong>运用大数据、人工智能、建模等技术,引入顶象无感验证,发挥智能风控的决策支持作用,构建和不断优化风控分析模型,建立营销、评级、授信、用信、审批、预警、清收等端到端的反馈机制,强化贷前、贷中、贷后全流程风险管理,从根本上提升风险防控效率和水平。</p><p><strong>优化线上营销服务。</strong>开展范围广泛、影响力大的线上营销活动,统筹安排和有效支持精准营销活动,开展线上营销培训,提高全员线上营销服务意识和能力;要通过数据整合、数据分析和数据运算,形成数据洞察能力,对客户进行精准画像,采取交叉销售,定向推荐等差异化营销策略,实现精准营销、智能营销。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRU" alt="640.jfif" title="640.jfif"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMrZ" alt="2.png" title="2.png"></p><h2>验证码助力数字化转型</h2><p>验证码是智能风控的重要组成部分,作为人机交互界面经常出现的关键要素,是身份核验、防范风险的重要组成,也是用户交互体验的第一关口,广泛应用金融服务上。</p><p>2020年2月,中国人民银行发布新版《网上银行系统信息安全通用规范》提出,从系统构成、客户端运行环境、短信/图形验证码、生物特征、通信链路等环节要求。特别提到,金融机构应通过行为分析、机器学习等技术不断优化风险评估模型,结合生物探针、客户行为分析等手段,切实提升安全防护能力。</p><p>2020年7月,中国银保监发布《商业银行互联网贷款管理暂行办法》,要求商业银行应当对互联网贷款业务建立全面等下管理体系,在贷前、贷中、贷后全流程进行风险控制。</p><p>顶象无感验证以防御云为核心,集13种验证方式,多种防控策略,以智能验证码服务、验证决策引擎服务、设备指纹服务、人机模型服务为一体的云端交互安全验证系统。其汇集了4380条风险策略、112类风险情报、覆盖24个行业、118种风险类型,防控精准度&gt;99.9%,1天内便可实现从风险到情报的转化,行业风险感知能力实力加强,同时支持安全用户无感通过,实时对抗处置能力更是缩减至60s内。</p><p>截至目前,顶象无感验证已为100多家金融机构提供专业服务。</p><hr><p>业务安全大讲堂:<a href="https://aijishu.com/link?target=https%3A%2F%2Fjinshuju.net%2Ff%2FtYyi3u" target="blank">立即报名</a></p><p>业务安全产品:<a href="https://aijishu.com/link?target=https%3A%2F%2Fuser.dingxiang-inc.com%2Fuser%2Fregister%23%2F" target="blank">免费试用</a></p><p>业务安全交流群:<a href="https://aijishu.com/link?target=https%3A%2F%2Fwww.dingxiang-inc.com%2Fblog%2Fpost%2F599" target="blank">加入畅聊</a></p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387115</guid>
            <link>https://aijishu.com/a/1060000000387115</link>
        </item>
        <item>
            <title><![CDATA[南芯科技公开带预唤醒功能的Type-C接口插入检测电路方案]]></title>
            <description><![CDATA[<p>【爱集微点评】南芯科技公开的带预唤醒功能的Type-C接口插入检测电路方案,该方案通过增加Type‑C接口预唤醒电路,在接口电路休眠时,可以将Type‑C接口检测电路关闭。从而实现减低系统待机功耗的同时实现接口插入检测功能,通过简单的电路结构解决了Type‑C接口插入检测和低功耗之间的矛盾。</p><p>集微网消息,在集成电路应用当中,特别是手机或者充电设备的Type‑C接口电路应用中,通常为了降低系统待机功耗,在未检测到手机或者充电设备插入时,整个系统会进入休眠模式。</p><p>但是为了快速响应手机或者充电设备的插入,在休眠时Type‑C接口检测电路需要一直工作,这就大大增加了系统休眠时的待机电流,从而大大缩短电池的续航时间。</p><p>为此,南芯科技在2022年3月11日申请了一项名为“一种带预唤醒功能的Type-C接口插入检测电路”的发明专利(申请号:202210236444.X),申请人为上海南芯半导体科技股份有限公司。</p><p>根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/522483438041.0886.png" alt="image" title="image"></p><p>如上图,为该专利中公开的充电设备端和手机端上设置的Type‑C接口检测电路通过Type‑C数据线连接的结构示意图。可以看到,在手机或者充电设备(如适配器、充电宝等)的Type‑C接口电路应用中,为了快速响应手机或者充电设备的插入,在休眠时Type‑C接口检测电路需要一直工作。这就大大增加了系统休眠时的待机电流,从而大大缩短了手机或者充电设备的电池的续航时间。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1435664442736.5054.png" alt="image" title="image"></p><p>如上图,为现有方案中Type‑C接口检测电路的电路连接示意图。在充电设备端,P型开关管M2的源端连接电源VDD,栅端连接控制信号EN_Rp,漏端连接上拉电流源Irp的源端。Irp的输出端连接到引脚CC,引脚CC同时连接到检测比较器P的反向端,比较器P的正向端连接参考电压VREF,比较器P输出信号为CC_DET_P。</p><p>在手机端,N型开关管M1的源端连接GND(即接地),栅端连接控制信号EN_Rd,漏端连接下拉电阻Rd的一端,下拉电阻Rd另一端连接到引脚CC。引脚CC同时连接到检测比较器D的同向端,比较器D的反向端连接参考电压VREF,比较器D的输出电压为CC_DET_D。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/168830725881.94025.png" alt="image" title="image"><br>在该专利中,主要通过在Type‑C接口检测电路的基础上增加预唤醒电路,在休眠时关闭Type‑C接口检测电路,来降低系统待机功耗。在设备插入时,通过触发预唤醒电路,再将Type‑C接口检测电路使能,实现快速响应设备的插入。</p><p>如上图所示,该检测电路包括:Type‑C接口检测电路以及Type‑C接口预唤醒电路。该充电设备端接口检测电路包括P型开关管M2、上拉电流源Irp和比较器P。手机端接口检测电路包括N型开关管M1、下拉电阻Rd和比较器D。</p><p>充电设备端接口预唤醒电路包括P型开关管M3、上拉电阻Rp_Pre、P型开关管M4、电阻R1、电阻R2以及反相器PI1。手机端接口预唤醒电路复用手机端接口检测电路的N型开关管M1和下拉电阻Rd。此外,手机端接口预唤醒电路还包括N型开关管M5、电阻R3、电阻R4和反相器PI2。</p><p>该装置的工作原理如下:在充电设备端,通过开关管M3和上拉电阻Rp_Pre实现上拉功能,开关管M4、电阻R1以及R2实现Rd插入预唤醒功能。在充电设备接口休眠时,开关管M3栅极控制电压为0,开关管M2栅极控制电压为1,关闭Irp上拉电流源,同时比较器P处于关闭状态。在手机端,下拉电阻部分将复用接口检测电路部分,开关管M5、电阻R3以及R4实现上拉插入预唤醒功能。在手机端接口休眠时,开关管M1栅极控制电压为1,打开M1,通过电阻Rd实现下拉,同时比较器D处于关闭状态。</p><p>引脚CC没有插入上拉时,CC引脚被Rd和M1下拉至GND,CC引脚通过ESD保护电阻R4接到开关管M5栅极,M5处于关断状态,输出被电阻R3上拉至VDD。然后经过反相器,输出为低,整个Type‑C接口电路没有工作电流,系统功耗很低。</p><p>当引脚CC插入上拉时,CC引脚电压即为开关管M5栅极电压,M5被打开,将信号拉低,输出CC_DET_D_PRE即为高电平。从而实现上拉插入预唤醒,然后打开比较器D,Type‑C接口检测电路将开始工作。</p><p>以上就是南芯科技公开的带预唤醒功能的Type-C接口插入检测电路方案,该方案通过增加Type‑C接口预唤醒电路,在接口电路休眠时,可以将Type‑C接口检测电路关闭。从而实现减低系统待机功耗的同时实现接口插入检测功能,通过简单的电路结构解决了Type‑C接口插入检测和低功耗之间的矛盾。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387106</guid>
            <link>https://aijishu.com/a/1060000000387106</link>
        </item>
        <item>
            <title><![CDATA[用人工智能设计芯片及对IC设计就业市场的影响]]></title>
            <description><![CDATA[<p>集成电路 (IC) 设计是一项复杂的工作,不断突破密度和性能的界限。现在,人工智能 (AI)在 IC 设计中的作用越来越大。</p><p>虽然 AI 最近因其在 ChatGPT 等自然语言处理器方面的惊人能力而受到更多关注,但该工具也被用于 IC 设计的各个阶段,包括设计优化、布局、仿真和验证。人工智能算法还可以帮助更有效地探索设计空间,比传统方法更快地发现最佳设计配置。</p><h5>随着设计变得比以往任何时候都更加复杂,人工智能可以成为 IC 设计师的强大资产。</h5><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRe" alt="image.png" title="image.png"></p><p>本文重点介绍了AI如何被用作IC设计的工具,以及这项技术如何影响IC设计工程师的专业价值。</p><p><strong>利用 AI 来实现严格的设计约束</strong></p><h3>由于数十亿个晶体管被限制在一个很小的芯片区域,IC 设计师的任务是在严格约束的情况下优化设计。&nbsp;</h3><p>首先,芯片面积必须最小,以适应当今设备的小尺寸,并降低制造成本。布局的功耗也是值得关注的;功耗同样会影响部署成本以及芯片对环境的影响。某些密集区域和配置容易过热,需要冷却机制或更巧妙的布局。考虑到这些因素和许多其他因素,IC设计人员大约需要八到九个月的时间来生成一个满足每个严格要求的芯片布局。</p><p>为了加快和优化 IC 设计流程,许多公司(包括科技行业的一些最大公司)现在都在投资 AI 工具来完成一些繁重的工作。</p><p><strong>谷歌人工智能在几个小时内设计出芯片</strong></p><p>据谷歌称,谷歌的深度学习强化学习 (RL) 方法可以在比人类工程师少得多的时间内生成有效的布局,而且结果在质量上也不相上下。</p><p>谷歌表示,谷歌的深度学习强化学习(RL)方法可以在比人类少得多的时间内产生有效的布局,而且结果在质量上也不相上下。2022年3月,谷歌研究院推出了PRIME,这是一种深度学习方法,利用现有的数据,如功率和延迟来创建加速器设计,比用传统方法设计的芯片更快、更小。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRf" alt="image.png" title="image.png"></p><p>谷歌研究人员使用 10,000 个芯片平面图来训练他们的模型。人工智能生成的芯片设计时间不到六个小时。谷歌表示,这种方法已经被利用来实现谷歌的张量处理单元(TPU),这是谷歌基于云的机器学习应用的一部分。</p><p><strong>EDA公司在AI设计系统上加倍投入</strong></p><p>不仅仅是谷歌转向机器学习模型。像Synopsys和Cadence这样的EDA公司也在其最新工具中使用到AI技术。比如最近,Synopsys凭借其 Synopsys DSO.ai 自主芯片设计系统注册了 100 个商业流片。该系统最近的客户包括 意法半导体(ST)和 SK Hynix。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRg" alt="image.png" title="image.png"></p><p>ST 和 Synopsys 于 2022 年 2 月初首次在微软的云端使用 DSO.ai 来设计工作芯片。使用 Synopsys 的 DSO.ai 设计系统,结合 Microsoft Azure 上的 Synopsys Fusion Compiler 和 IC Compiler,该工具将功耗、性能和面积 (PPA) 指标提高了 3 倍以上,总功耗降低了 25%,并且显著缩小了芯片尺寸。</p><p>除了芯片设计,人工智能还在芯片测试和验证中找到了应用——芯片制造商在这两个领域花费了大量时间。为了解决这一设计阶段的问题,西门子发布了Questa Verification IQ,这是一个帮助IC设计工程师加快验证过程的软件平台。</p><p><strong>英伟达用GPU设计GPU</strong></p><p>NVIDIA(英伟达)为芯片设计设计了另一种深度学习方法。该公司制作了一个名为PrefixRL的 RL 模型,证明 AI 可以从头开始学习电路设计,并使用最新的 EDA 工具制造更小、更快的电路。NVIDIA 的架构由 13,000 个使用 AI 技术设计的电路组成。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRh" alt="image.png" title="image.png"></p><p>针对自动化单元迁移,该公司开发了NVCell,可以无错迁移92%的单元库。人类工程师可以对剩下的 8% 没有自动迁移的单元进行处理。NVIDIA 首席科学家 Bill Dally 表示:</p><p><em>“所以这就像一个 Atari 视频游戏,但它是一个用于修复标准单元中的设计规则错误的视频游戏。通过强化学习来研究和修复这些设计规则错误,我们能够基本完成我们标准的设计单元。”</em></p><p><strong>人工智能对 IC 设计就业市场的影响</strong></p><p>虽然人工智能可以自动执行传统上由IC设计人员执行的某些任务,例如布局设计和优化,但它也减少了设计过程中对手动方面的需求。虽然这提高了整体效率,但也可能导致IC设计的某些领域的最终工作被取代。</p><p>另一方面,人工智能还可以帮助 IC 设计人员更高效、更有效地开展工作。例如,AI 可以分析大量数据并提供见解,建议工程师以前可能没有考虑过的设计替代方案。这种趋势可以提高 IC 设计人员在行业中的价值,使他们能够专注于更复杂和更具创造性的设计方面,并最终生产出更好的产品。</p><p>不过人工智能不太可能完全取代对熟练IC设计师的需求。随着人工智能在行业中越来越普遍,对这类工程师的需求甚至可能会增加,因为在设计过程中,将需要能够准确验证和利用人工智能工具和算法的个人。</p><hr><blockquote>作者:  Darshil Patel <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FN_pgzMV26mvgCMAxWMgieQ" target="blank">EETOP</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000386323">行业前瞻,神奇的忆阻器</a></li><li><a href="https://aijishu.com/a/1060000000386135">芯片验证调研报告:首次流片成功率越来越低、Verilog 使用逐渐减少、UVM地位无法动摇</a></li><li><a href="https://aijishu.com/a/1060000000385729">PCIe 6.0:在有损HVM通道中使用PAM4实现64GT/s的挑战</a></li><li><a href="https://aijishu.com/a/1060000000385482">Wi-R 一种全新的通信方式,让你的身体充当媒介!芯片已推出!</a></li><li><a href="https://aijishu.com/a/1060000000383891">科普:DDR</a></li></ul><blockquote>更多IC设计技术干货请关注IC设计技术专栏。<br>迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387068</guid>
            <link>https://aijishu.com/a/1060000000387068</link>
        </item>
        <item>
            <title><![CDATA[优秀的IC/FPGA开源项目(六)-手语字母翻译器]]></title>
            <description><![CDATA[<p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQU" alt="image.png" title="image.png"></p><p>《优秀的IC/FPGA开源项目》是新开的系列,旨在介绍单一项目,会比《优秀的 Verilog/FPGA开源项目》内容介绍更加详细,包括但不限于综合、上板测试等。两者相辅相成,互补互充~</p><hr><p>一种智能手套,可将手语字母翻译成带显示器的书面字母。</p><h1>绪论</h1><p>在这个项目中,我们的主要目的是开发一款智能手套,帮助使用手语的人在日常生活中轻松交流。</p><p>学习手语是一个要求很高的过程。因此,许多健康人并不了解这个过程。在这款智能手套的帮助下,那些健康的人将能够理解那些使用手语的人。智能手套还可以用作想要学习手语的健康人的模拟器。</p><p>这个项目主要涉及到模拟字母,字母是语言的基石。在这个项目中,我们使用 FPGA 来实现将手势模拟为视觉字母的算法。检测手势是通过手指上的柔性传感器测量出手的形状。vga监视器用于直观显示FPGA中转换为字母的手势。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQW" alt="image.png" title="image.png"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQX" alt="image.png" title="image.png"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQY" alt="image.png" title="image.png"><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQZ" alt="image.png" title="image.png"></p><p>上三图说明了 VGA 控制器产生的时序信号。控制器包含两个计数器。一个计数器在像素时钟上递增并控制 h\_sync(水平同步)信号的时序。通过将其设置为显示时间从计数器值 0 开始,计数器值在显示时间内等于像素的列坐标。水平显示时间之后是消隐时间,消隐时间包括水平前沿、水平同步脉冲本身和水平后沿,每个都有指定的持续时间。在行的末尾,计数器重置以开始下一行。v\_sync 计数器在垂直轴内应用相同的操作。</p><p>使用这些计数器,VGA 控制器输出水平同步、垂直同步、显示启用和像素坐标信号。每个 VGA 模式的同步脉冲被指定为正极性或负极性。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ0" alt="image.png" title="image.png"></p><p>我们首先创建随机图像并使用 RGB 信号改变它们的颜色,如上图所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ1" alt="image.png" title="image.png"></p><p>要在屏幕上显示文本或字符串,有一个众所周知的 Font Rom Map -上图 - 包括所有 ASCII 字符(每个字符为 8x16 位)。通过使用 Font Rom,我们的代码现在能够在显示器上书写文本或字母,如下图所示 。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ2" alt="image.png" title="image.png"></p><p>为了转换来自柔性传感器的模拟数据,我们使用了ADC-每通道具有 12 位分辨率。由于 4 个手指足以执行大多数手语字母,因此一个 4 通道ADC就足够了。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ3" alt="image.png" title="image.png"></p><p>ADC的通信的逻辑如下图所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ4" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ5" alt="image.png" title="image.png"></p><p>作为总结,项目的架构如下图所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ6" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ7" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ8" alt="image.png" title="image.png"></p><p>作为参考手语,我们使用了ASL,它具有下图中的手势。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQ9" alt="image.png" title="image.png"></p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRa" alt="image.png" title="image.png"></p><p>现在执行工程就可以识别到上图中标记的字母。</p><p>工程链接:</p><blockquote><a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fumuttoksoy%2F10ISTK---Sign-Language-Translator" target="blank">https://github.com/umuttoksoy/10ISTK---Sign-Language-Translator</a></blockquote><blockquote>原文:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FcvBboi8DlRSWQzCUUpyTsw" target="blank">OpenFPGA</a>  <br>作者:碎碎思</blockquote><p><strong>相关文章推荐</strong></p><ul><li><a href="https://aijishu.com/a/1060000000384570"><strong>从FPGA说起的深度学习(三)</strong></a></li><li><a href="https://aijishu.com/a/1060000000383485"><strong>从FPGA说起的深度学习(二)</strong></a></li><li><a href="https://aijishu.com/a/1060000000383015"><strong>使用 AXI CDMA 制作 FPGA AI 加速器通道</strong></a></li><li><a href="https://aijishu.com/a/1060000000381372"><strong>从FPGA说起的深度学习(一)</strong></a></li></ul><blockquote>更多FPGA干货请关注<a href="https://aijishu.com/blog/fpgadeluoji"><strong>FPGA的逻辑</strong></a>技术专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387048</guid>
            <link>https://aijishu.com/a/1060000000387048</link>
        </item>
        <item>
            <title><![CDATA[兆芯如何保证处理器模拟/真实请求传输路径一致?]]></title>
            <description><![CDATA[<p>【爱集微点评】兆芯的处理器建模专利,采用两套信息来记录一个请求路径的关键信息,解决多个请求在汇聚点装置中路径不明确的问题。同时依据第二路径信息可以纠正第一路径信息在汇聚点装置导致的路径错误,使模拟请求传输路径的建模跟真实硬件传输路径更为一致。</p><p>集微网消息,近日,兆芯独家入选《上海金融科技发展白皮书》基础设施支持类科技企业,同时兆芯的新一代嵌入式处理器也一并入选白皮书。</p><p>在处理器建模领域中,当处理器传输数据的整个路径上只有一个源端发送请求时,功能加时序模型可以很好地模拟真实处理器的性能。但是,如果整个路径上有多个源端可以发送请求,由于功能模型是在请求生成的时候就进行调用,而多个源端到达请求汇聚点的路径延时是不确定的,汇聚点是指多个请求都会通过的路径节点或装置,这样会导致多个源端的请求在汇聚点看到的时序状态跟在请求生成时的差距较大。当大量的请求的处理路径跟功能模型不一致的情况下,最终建模呈现的性能指标就不能反映真实处理器的性能。因此,如何真实的模拟出处理器的性能,已成为本领域需解决的问题之一。</p><p>为此,兆芯于2020年9月29日申请了一项名为“处理器建模系统及处理器建模方法”的发明专利(申请号:202011054563.0),申请人为上海兆芯集成电路有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1141850468081.4688.png" alt="image" title="image"></p><p>图1 处理器建模系统的示意图</p><p>图1为本专利提出的一种处理器建模系统的示意图,处理器建模系统100包含多个源端装置A1~Am及一汇聚点装置PL。其中,源端装置A1~Am是向处理器发出请求的装置,例如输入输出装置、储存装置、图形处理器、预取装置等。</p><p>源端装置A1和An+1分别产生第一/二请求,并于第一/二传送时点传送两个请求。而汇聚点装置PL分别在第一接收时点和第二接收时点接收两个请求,并依据第一请求/第二请求选择传送路径(例如PT1)。其中,第一传送时点早于第二传送时点,第一接收时点接收晚于第二接收时点,且第一请求与第二请求欲存取的目标数据地址相同。如此一来,在多源端的处理器的仿真建模过程会发生多请求在到达汇聚点装置时出现路径不明的情况,最终导致建模结果呈现的性能指标与真实处理器不一致。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/538297132002.6487.png" alt="image" title="image"></p><p>图2 处理器建模方法的流程图</p><p>图2是本专利提出的一种处理器建模方法流程图,首先源端装置A1产生第一请求,第一请求为主路径请求。对于每一个请求,用第一路径信息来表示传统的功能模型的关键信息,用第二路径信息来表示真实时序的关键信息(可以真实反映时序的关键信息)(步骤210)。然后第一请求分别调用功能模型和时许模型,得到第一、二路径信息(步骤220、230)。然后第一请求被传送到汇聚点装置PL(步骤240),而汇聚点装置PL判断是否存在第二请求(步骤250)。汇聚点装置PL依据第二请求的第二路径信息选择传送路径PT1。因为目标数据地址中的信息已经先被先到汇聚点装置PL的第二请求取走了,所以依据第二请求的第二路径信息选择传送路径PT1(步骤260)。最后,汇聚点装置PL更新第二请求状态为合法的(步骤270)。</p><p>简而言之,兆芯的处理器建模专利,采用两套信息来记录一个请求路径的关键信息,解决多个请求在汇聚点装置中路径不明确的问题。同时依据第二路径信息可以纠正第一路径信息在汇聚点装置导致的路径错误,使模拟请求传输路径的建模跟真实硬件传输路径更为一致。</p><p>兆芯成立于2013年,掌握中央处理器、图形处理器、芯片组等三大核心技术。自从成立以来,兆芯已经成功研发、量产了多款通用处理产品,在业内得到了高度评价,并多次入围Silicon 100榜单、荣获各种“创新奖”、“成就奖”、“金奖”。希望在2023年成立十年之际,兆芯可以再创辉煌、更上一层楼!</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387102</guid>
            <link>https://aijishu.com/a/1060000000387102</link>
        </item>
        <item>
            <title><![CDATA[灵动微课堂 |FlexCAN OTA]]></title>
            <description><![CDATA[<h1><strong>1 简介</strong></h1><p>FlexCAN OTA 是由灵动提供的一种基于 UDS 协议使用 CAN 总线实现对 MCU 的 App 固件更新的解决方案。该解决方案的软件部分主要由:Bootloader、App和PC Tool三部分构成,硬件部分如图 1 所示。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRw" alt="image.png" title="image.png"></p><p><strong>1.1&nbsp; 关键特性&nbsp;&nbsp;</strong></p><p>基于 UDS(ISO14229) 标准</p><p>基于 CAN(ISO11891-1) 标准</p><p>具备对 App 固件 CRC 完整性校验功能</p><p>使用主机上传 Flash driver 到 MCU</p><p>在 Bootloader 中进行 App 有效性检查</p><p>提供用于验证 App 固件更新的 PC 端上位机工具</p><p><strong>1.2 &nbsp;什么是 FlexCAN ?&nbsp;</strong></p><p>CAN 是控制器域网 (Controller Area Network, CAN) 的简称,是一种功能丰富的车用总线标准,被设计用于在不需要主机(Host)的情况下,允许网络上的单芯片和仪器相互通信。是由研发和生产汽车电子产品著称的德国 BOSCH 公司开发,并最终成为国际标准(ISO11898),是国际上应用最广泛的现场总线之一。</p><p>FlexCAN 是 CAN 协议的一个高完成度版本。以灵动 MM32F0140 系列 MCU 内嵌的 FlexCAN 为例,其符合 ISO 11898-1 标准,支持 CAN 2.0B 版本协议,位速率高达 1 Mbps,具有非常灵活的用于传输和接收的邮箱系统,可以接收和发送 11 位标识符的标准帧,也可以接收和发送 29 位标识符的扩展帧,主要被设计用作车载串行总线,可满足实时处理、车辆在电磁干扰环境下的可靠操作、成本效益、带宽等要求。</p><p><strong>1.3 &nbsp;什么是 UDS ?&nbsp;</strong></p><p>UDS(Unified Diagnostic Services,统一诊断服务)是一种用于汽车电子控制器 ECU (Electronic Control Units) 环境下的一种诊断通信协议,可实现诊断、固件更新、日常测试等功能,在 ISO 14229 中规定了其实现标准。</p><p>在本实例中,UDS 通信是在客户端-服务端关系中执行的。客户端是上位机下载软件运行于 PC 机,服务端是带有FlexCAN IP模块的 MM32 MCU。例如,将 CAN 总线接口连接到 MCU,并将 UDS 请求发送到 MCU。当 MCU 支持 UDS 服务时,它将根据客户端发出的请求做出相应的响应。</p><p><strong>1.4 &nbsp;为什么用 Bootloader ?&nbsp;</strong></p><p>对于 MCU 而言,如果程序内置有基于FlexCAN 的 Bootloader,则每次更新 MCU 的固件则不需要拆开外壳也不必再使用烧录器进行烧录,而可直接通过 CAN 总线来更新程序,这样更方便也更安全,而且随着智能化的普及,甚至可以对 MCU 进行远程升级。Bootloader 程序结构对比如图 2 所示:</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRx" alt="image.png" title="image.png"></p><p><strong>1.5 &nbsp;为什么基于 UDS ?&nbsp;</strong></p><p>为了规范 Bootloader 的全过程,通过使用成熟的平台进而提供高质量 Bootloader。因 UDS 在设计时考虑了 Bootloader 的需求,并为 Bootloader 提供了相关服务以供使用,比如诊断会话控制、ECU 重置、读取数据、请求下载、传输数据、请求传输退出等,可以实现更高效和可靠的刷写功能。故主机厂普遍会要求在 UDS 规范的基础上完成 Bootloader 功能。</p><p><strong>1.6 &nbsp;用到了哪些 UDS 服务?&nbsp;</strong></p><p>在 Bootloader 中,使用到 UDS 的 $10、$11、$27 和 $3E 基础诊断服务,$22、$2E 读写 DID 服务,$31、$34、$36 和 $37 固件数据传输相关服务。UDS 服务概览如表 1-1 所示:</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRy" alt="image.png" title="image.png"></p><h1><strong>2 Bootloader</strong></h1><p>Bootloader 是一段允许在不使用烧录器的情况下更新App固件的代码,基于灵动 MindSDK 实现的 Bootloader 样例工程支持 MDK、IAR 和 ARMGCC 三种工具链进行开发。在实际的使用过程中只需要在第一次使用时通过烧录器将 Bootloader 烧录进 MCU,后续的 App 都可以通过使用基于 CAN 总线的 UDS协议完成固件更新。</p><p><strong>2.1&nbsp; Bootloader 功能特性&nbsp;&nbsp;</strong></p><p>支持 Service 27,用户可根据自身需求添加安全访问算法。</p><p>支持 Service 22 和 Service 2E,用户可以根据自身需求添加策略,进行信息读出与存储。</p><p>外置 Flash driver,使用时通过外部 PC 或后台将 Flash driver 加载到 MCU 的 RAM 中进行安全的 Flash 擦写操作。</p><p>提供看门狗监控功能,用户可根据自身需求选择性开启看门狗监控程序。</p><p><strong>2.2&nbsp; 客制化修改说明&nbsp;&nbsp;</strong></p><p><strong>修改诊断 ID</strong></p><p>可在样例工程的 board/FblHalCan.h 中修改诊断 ID 的值。</p><p><strong>指定数据填充值</strong></p><p>当需要发送的数据长度不满足 8 字节长度时,通过宏定义可以更改填充,用户可以在样例工程的 board/FblHalCan.h 中指定填充值。</p><p><strong>使能看门狗</strong></p><p>用户可以在样例工程的 board/FblMacros.h 中打开宏开关 WDG\_ENABLE 使能看门狗服务,并且实现 ResetWdg 操作。</p><p><strong>安全访问算法接口</strong></p><p>Bootloader中支持 27 Service,用户可在样例工程的 board/FblMacros.h 中使能宏开关 ENABLE_SECURITY_ALGORITHM_VERIFICATION 根据自身需求添加安全访问算法。</p><p><strong>2.3&nbsp; Flash driver 介绍&nbsp;&nbsp;</strong></p><p><strong>什么是Flash driver?</strong></p><p>在OTA程序升级过程中,发送App可执行文件之前,向底层先发送一段二进制文件,这段代码实现了对MCU片内 Flash 的擦写功能,称为 Flash driver。</p><p><strong>Flash driver存在的意义</strong></p><p>在车载ECU控制器中,为了安全考虑,会尽可能的避免在代码中固化有对flash进行擦写操作,主要为了避免在程序跑飞时误调用该部分代码,使软件代码部分受到破坏。</p><p><strong>Flash driver的实现方式</strong></p><p><strong>a.</strong> 将flash driver固化在底层flash中,在运行的时候将flash中的flash driver拷贝到ram中来运行,这是比较传统的方式,但是避免不了提到的安全性问题。</p><p><strong>b.</strong> 将flash driver这段代码保存在PC端或后台,在每次执行OTA升级前,将这段代码先发送给MCU,这样可以避免方式 a 中提到的安全性问题。</p><h1><strong>3 App</strong></h1><p>基于灵动 MindSDK 提供的 flexcan\_ota\_app 样例工程进行开发和生成用于更新的 HEX 格式 App 固件生成,无需任何适配操作即可生成用于 OTA 升级的 App 固件。</p><p><strong>3.1&nbsp; 使用说明&nbsp;&nbsp;</strong></p><p>将 Bootloader 通过下载器下载到 MCU 中后,可通过提供的 PC Tool 来刷写生成的固件,通过 PC Tool 下载成功后,一方面 PC 终端会有下载成功提示,另一方面也可以查看开发板上对应固件实现的功能是否开始执行。</p><p>关于 App 固件可从提供的 flexcan\_ota\_app 样例工程编译源码并将生成“.hex”格式的 App 固件进行加载。</p><p><strong>3.2&nbsp; App 设计规范&nbsp;&nbsp;</strong></p><p>App 与 Bootloader 存放在 MCU 的同一块 Flash 的两个不同区域中,为保证两个软件的正常使用,App 设计遵循表 2-1 和表 2-2 所述规范。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRz" alt="image.png" title="image.png"></p><h1><strong>4 PC Tool</strong></h1><p>Flexcan OTA PC Tool 是用于验证灵动 MindSDK 中提供的 FlexCAN OTA 解决方案的简易 PC 端上位机工具。</p><p><strong>4.1&nbsp; 功能特性&nbsp;&nbsp;</strong></p><p>支持 CAN 通信速率自定义</p><p>支持 Win10 操作系统下运行</p><p>支持默认参数直接运行和命令行下带参数运行</p><p>支持直接加载 MDK 和 IAR 工具链下生成的 HEX 格式文件</p><p>基于 Python 使用 python-udsoncan 开发,可根据不同需求灵活进行二次开发</p><p><strong>4.2&nbsp; 开发环境&nbsp;&nbsp;</strong></p><p>本工具在 Win10 平台使用 Python 进行开发,基于 UDS 使用 CAN 协议,支持 PEAK CAN卡与 MCU 进行通讯。</p><p><strong>4.3&nbsp; 使用说明&nbsp;&nbsp;</strong></p><p>请按照如下步骤进行操作:</p><p><strong>a 下载 Bootloader 到 MCU</strong></p><p>将提供的 flexcan_ota_bootloader 样例工程编译并下载到开发板中。</p><p><strong>b 安装 CAN 卡驱动并连接 MCU</strong></p><p>在这里我们用到的是PCAN-USB,下载并安装驱动(<a href="https://aijishu.com/link?target=https%3A%2F%2Fpeak-system.com.cn%2Fdriver%2F" target="blank">https://peak-system.com.cn/dr...</a>) ,并将 PCAN-USB 和开发板上的 CAN 收发器通过双绞线连接以及通过 USB 和 PC 机连接。</p><p><strong>c 运行 FlexCAN OTA PC Tool</strong></p><p>方式一:按照默认参数直接运行</p><p>直接双击 flexcan_ota_pc_tool_v1.0.exe,如图 3 所示,默认将按照 500Kbps 的比特率进行 CAN 通信,Flash_driver 文件的加载地址为当前路径下的文件(./flash_driver.hex), App 文件的加载路径为当前路径下文件(./app.hex)。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRA" alt="image.png" title="image.png"></p><p>方式二:按照指定参数运行</p><p>在 Win10 平台下启动命令行窗口并切换到当前路径下,获取帮助如图4所示,输入如下指令并按回车键:</p><pre><code>flexcan_ota_pc_tool_v1.0.exe&nbsp;-h&nbsp;</code></pre><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRB" alt="image.png" title="image.png"><br>按照指定参数运行如图 5 所示,输入如下指令并按回车键:</p><pre><code>flexcan_ota_pc_tool_v1.0.exe&nbsp;-b&nbsp;500000&nbsp;-f&nbsp;"./flash_driver.hex"&nbsp;-a&nbsp;"./app.hex"</code></pre><p>其中 flash_driver.hex 文件为用于安全地擦写片内 flash 的代码,在每次 OTA 更新中复用即可。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRC" alt="image.png" title="image.png"></p><p><strong>d 结束</strong></p><p>等待 FlexCAN OTA 固件更新流程结束,并按任意按键退出。</p><h1><strong>5 注意事项</strong></h1><p>FlexCAN OTA Tool 为用于验证基于 UDS 使用 CAN 协议进行 App 固件更新的上位机工具,PC 端使用 PEAK-CAN 与 MCU 通讯,仅支持在 Win 10 操作系统下运行,&nbsp;&nbsp; 且用于功能性验证,若遇到软件闪退等问题请重启该软件并复位 MCU。该工具可根据开发者项目需求进行二次开发。</p><p>以上介绍是基于MM32F0140 系列 MCU 进行介绍和示例演示,相关源码请访问灵动官网进行获取:</p><p><strong>01</strong></p><p>进入灵动官网(www.mm32mcu.com)</p><p><strong>02</strong></p><p>打开“产品”菜单下 MM32F0140 页面,浏览“文档”列表。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRD" alt="image.png" title="image.png"></p><p><strong>03</strong></p><p>在“应用笔记”中下载“AN0035_FlexCAN_OTA”文档,获取源码。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRE" alt="image.png" title="image.png"></p><p><strong>6 参考文献</strong></p><p>《ISO11898-1》</p><p>《ISO14229》</p><blockquote>作者:灵动MM32  <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2F87OMwn8rlluytkhuKJ-xXQ" target="blank">灵动MM32MCU</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000385095">灵动微课堂 |单独下载可执行文件到MM32F5微控制器</a></li><li><a href="https://aijishu.com/a/1060000000379844">基于灵动MM32 MCU的便携式血氧仪应用</a></li><li><a href="https://aijishu.com/a/1060000000378709">灵动微课堂 |使用MM32F3270基于Azure RTOS定时器组的应用</a></li><li><a href="https://aijishu.com/a/1060000000376861">灵动微课堂 | MM32L013x——LPTIM的应用介绍</a></li></ul><blockquote>更多MM32F5系列资料请关注<a href="https://aijishu.com/blog/lingdongmm32mcu">灵动MM32 MCU</a>专栏。如想进行MM32相关芯片技术交流,请添加极术小姐姐微信(id:aijishu20)加入微信群。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387086</guid>
            <link>https://aijishu.com/a/1060000000387086</link>
        </item>
        <item>
            <title><![CDATA[聊聊身边的嵌入式:价格不菲的护眼灯,是眼睛保护神还是智商税?]]></title>
            <description><![CDATA[<p>神兽归笼这个词,不知道哪位大师发明的,充分表达了广大家长望子成龙,却又忧心忡忡,寝食难安的心情。让家长们焦虑的,不只是孩子的学习,还有健康。就拿视力来说,一份官方的报告,看了也是让人心中一惊。近视率从小学的35.6%,到初中的71.1%,再到到高中的80.5%,一路攀高,估计到大学生,就更没法看了。</p><p>众多的商家,从中嗅出了机会,护眼台灯就是其中一种。市场上的台灯,也是鱼龙混杂。对于但求最贵,不求最好的主,价格成千乃至上万。若是囊中羞涩,或者说但求最好,不求最贵的买家,在拼XX上,十块八块也能买一个,据称也是专为读书设计,国AA级照度的护眼灯。</p><p>这水挺深!</p><p>对于一种产品,即使你用一大堆指标去测试,区别好像也不大,似乎都挺好。只有我们深入了解了它的工作原理,才能清楚其中奥秘。我们今天拆个某东上卖的挺火的台灯,看一下究竟有什么高科技。</p><ol><li><strong>护眼台灯拆解</strong></li></ol><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRk" alt="image.png" title="image.png"></p><p>这灯外观看着还是挺漂亮的。面板采用了触控设计,打开电源开关后,手指在滑条滑动,可以调整光的亮度。这灯拿在手里,沉甸甸的,满满的科技感。我们接下来拆开看一下。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRm" alt="image.png" title="image.png"></p><p>这一拆开,首先被这一坨铁惊住了!据说某个乐善好施的活雷锋,早年卖医疗设备,为增加科技感,用的就是这一招。不过跟这个还真不一回事儿,这个台灯没有这坨铁,估计就头重脚轻站不住了。电路分为两个大部分,上面大板子是触摸控制板,下面小板子是电源变换和调光模块。</p><p>台灯外配220V转24V的电源,电源变换和调光模块把24V转换成5V供给控制板。反过来,控制板输出的PWM,控制此模块输出电流的大小,来调光亮度。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRn" alt="image.png" title="image.png"></p><p>翻过来看一下,两个带线圈的电感,用来滤除输入电源干扰。电路板的核心是一个LED调光芯片,上面的丝印比较模糊,最后我们会推测一下它的型号。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRo" alt="image.png" title="image.png"></p><p>灯的中间是圆形的白色导光板,然后四周围有91颗侧面发光的LED灯珠。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRp" alt="image.png" title="image.png"></p><p>再来看一下触摸控制板部分,有两颗芯片,一颗负责触摸按键和滑条的检测,一颗负责LED指示灯的控制,以及根据手指在滑条的位置,输出占空比不同的PWM波给电源控制和调光模块。这两颗芯片没有丝印,我们只好推测一下了。如果雷同,纯属巧合。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRq" alt="image.png" title="image.png"></p><p>触摸控制板用塑料柱锁死在面板上了,拆下来就废了。所以我们来透视一下,大概能看出四个按键,以及触摸滑条的样子。根据实测,台灯的亮度并不是连续可调的,而是有7级亮度,所以触摸滑条的分辨率也不用做的很高。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRr" alt="image.png" title="image.png"></p><ol start="2"><li><strong>原理框图</strong></li></ol><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRs" alt="image.png" title="image.png"></p><p>根据电路推测,这个方案应该是用到了台系的芯片,通泰的调光芯片TTP933和触控单片机TTP258。从手册来看,TTP933的性能还是不错的。而TTP258居然是一个4位机,厂家为压缩成本这也是拼了。作为对比,我们从拼XX上买了一款12块钱的护眼灯,还在运输途中,等货到了后再拆开和大家一起研究一下。</p><p>如果我们留意身边的家电,就会发现触摸控制,用的越来越多起来。我们后续也会持续关注这一技术,并和大家一起探讨它的神奇之处。</p><hr><blockquote>作者:Norman<br>来源: <a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FYTjf85HBOVs1dTPGU02t2Q" target="blank">TopSemic嵌入式</a><br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bV7v5" alt="aijishu_TopSemic_1.jpg" title="aijishu_TopSemic_1.jpg"></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000379643">MCU如何实现对外部脉冲信号的计数功能?</a></li><li><a href="https://aijishu.com/a/1060000000375025">老前辈教你选 TVS</a></li><li><a href="https://aijishu.com/a/1060000000368824">初始化串口后,低功耗模式下电流高是怎么回事?</a></li><li><a href="https://aijishu.com/a/1060000000368608">一网打尽,国产MCU厂商</a></li><li><a href="https://aijishu.com/a/1060000000354916">到底什么是I/O的驱动能力?</a></li></ul><blockquote>更多芯片嵌入式电子技术分享请关注<a href="https://aijishu.com/blog/topsemicqianrush"><strong>Topsemic嵌入式</strong></a>极术专栏。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387075</guid>
            <link>https://aijishu.com/a/1060000000387075</link>
        </item>
        <item>
            <title><![CDATA[「微侃」特斯拉对智能汽车设计的考虑]]></title>
            <description><![CDATA[<p>聚焦汽车科技,剖析产业趋势和变革浪潮  <br>————————  </p><p>早在2016年,马斯克就在《特斯拉宏图计划第二篇章》提到要发展自动驾驶,但特斯拉与当时最热的自动驾驶技术路线有所不同——Google的Waymo为代表的众多自动驾驶企业,以L4级别和量产自动驾驶出租车Robetaxi为目标。  </p><p>特斯拉走的垂直整合路线:不仅自己开发自动驾驶相关的软件和硬件,还自己造车:开创了将自动驾驶与汽车量产结合的技术路线——简单来说,就是在量产车上安装低级别自动驾驶系统收集数据,凭借数据不断完善自动驾驶算法,最终实现由较低级别的自动驾驶向高级别自动驾驶间融合过渡。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQz" alt=" title=" 微信图片_20230227121317.png""="" title=" title=">  </p><p>目前来看,后者的自动驾驶技术方案是比较成功的。他的路线甚至从车成功复制到机器人。  </p><p>那么特斯拉是怎么考虑智能汽车的设计的呢?  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbtWN" alt=" title=" 微信图片_20230227121320.png""="" title=" title=">  </p><p>Part 1  </p><p>特斯拉的整车设计  </p><p>特斯拉与传统主机厂把设计开发交给供应商的方式不同,而是反过来,不断从供应商手中拿回主导开发权。我们看到,在整个EE架构里面,特斯拉不断在把大量的部件做成In-house Design然后再由非传统的一级供应商来代工的模式进行,不断把系统内化。  </p><p>●芯片层面的全面考虑  </p><p>特斯拉会和芯片企业直接交流设计开发,这样一方面在过去几年缺芯的状态下,可以优先获取支持。另一方面,这样的直接接触,可以把自己的设计思路传递到芯片企业,同时获取最新的设计方案。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQA" alt=" title=" 微信图片_20230227121326.png""="" title=" title=">  </p><p>◎最重要的计算类SOC芯片:座舱层面依靠Intel和AMD计算芯片、特斯拉自研FSD的芯片  </p><p>◎通信芯片:从以太网的Marvell扩展到下一代  </p><p>◎存储芯片:SK海力士和Sumsung  </p><p>◎功率芯片:由SiC的英飞凌和ST供应,低压小功率的主要包括安森美  </p><p>◎MCU:全方面的拥抱TI和ST  </p><p>◎其他芯片:也是和ADI、Microchip等战略芯片供应商合作  </p><p>●电子电气架构的设计  <br>特斯拉在设计电子电气架构时,不仅从Model 3 开始就采用了集中式的架构,还很早就导入了Zonal控制器的概念,这样的架构可以尽可能的简化线束,提高整车安装效率。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQB" alt=" title=" 微信图片_20230227121334.png""="" title=" title=">  </p><p>特斯拉设计了三个区域控制器,分布在车身的左、右和前部中间,这三个控制器大量合并了原有分布式系统的功能,比如:车身控制、热管理、驻车还有座椅控制等。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQC" alt=" title=" 微信图片_20230227121342.png""="" title=" title=">  </p><p>如果按其他车企的设计,至少会分为七八个模块(门模块、集成式车身控制器、座椅控制器、热管理控制器HVAC和前端冷却控制器Theraml Unit和泊车控制器、灯光控制)。  </p><p>但特斯拉通过这三个区域控制器既能实现基本功能,又可以做一些顶层的应用,实现系统的整体控制。整个控制逻辑复杂的部分都在上层,底层的可以实现冗余和执行功能。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQD" alt=" title=" 微信图片_20230227121349.png""="" title=" title=">  </p><p>比如热管理的控制中,复杂的热泵模式功能是在顶层的软件系统里面来定义的,再由区域控制器负责执行。这个创新性的设计,就让特斯拉把握了整体软件和系统方面的设计,供应商只负责做结构设计集成,特斯拉在热管理功能上实现了自主开发控制。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbuK9" alt=" title=" 微信图片_20230227121353.png""="" title=" title=">  </p><p>Part 2  </p><p>特斯拉的自动驾驶设计  </p><p>●自动驾驶软件部分  <br>2019 年前后,自动驾驶技术堆栈出现了颠覆性变化,特斯拉引领了这次变革。这次变革是从规则驱动,转向为数据驱动。这几乎改变了整个技术堆栈,甚至是工程师的思考方式。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQE" alt=" title=" 微信图片_20230227121400.png""="" title=" title=">  </p><p>所谓规则驱动,简单来说,以前的自动驾驶,是依靠提前设计好一定的规则;数据驱动,则是围绕AI的算法模型,通过感知AI、规控AI,以及数据改进自动驾驶的效果,跟现在很火热的ChatGPT类似。  </p><p>●自动驾驶硬件部分  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQF" alt=" title=" 微信图片_20230227121407.png""="" title=" title=">  </p><p>特斯拉的驾驶辅助硬件经过了HW1.0到3.0的迭代:  </p><p>◎ 1.0的版本硬件选型为成熟商品。特斯拉做了多传感器融合+应用层软件开发。  <br>◎ 2.0的版本,采用了英伟达的芯片,提升传感器数量提升,特斯拉在原有的技术基础上,增加了图像识别算法的开发。  <br>◎ 3.0 是特斯拉的驾驶辅助硬件的重大革新,首次采用自研的高度集成自动驾驶SoC+MCU芯片。此时的特斯拉已经具备:全套芯片设计能力。  <br>◎ 正在开发的基于自研的自动驾驶芯片的第二代控制器,也就是4.0版本,马上要发布,我们会持续地跟踪。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQG" alt=" title=" 微信图片_20230227121415.png""="" title=" title=">  </p><p>我们看到特斯拉在Model S、Model X、Model 3到Model Y上,一步步深化了自己的设计范围,而全球车企包括大量的中国汽车企业也开始了这个过程。  </p><p>总结  <br>虽说特斯拉的自动驾驶技术路线很成功,但并不是没有问题。首先就表现在有各种召回。这是因为自主设计的开发难度的确很大,随着车主增多,会遇到很多激进的工况。但换个角度来看,特斯拉就是通过量产车上收集到的数据不断完善自己的产品,最终要实现不仅是智能汽车,还有马斯克本人的Master plan。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 04:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387037</guid>
            <link>https://aijishu.com/a/1060000000387037</link>
        </item>
        <item>
            <title><![CDATA[「微侃」插电混动的技术路线分析(下篇)]]></title>
            <description><![CDATA[<p>聚焦汽车科技,剖析产业趋势和变革浪潮  <br>————————  </p><p>前段时间在梳理完中国汽车自主品牌产业格局以后,我们觉得2023年汽车市场最重要的竞争会来自插电混动领域。在上一期《插电混动的技术路线分析》中,我们盘点完比亚迪、长城和吉利的路线,今天我们接着来讲长安、奇瑞、上汽这三家企业的混动技术,为国内的插电混动技术做一个完整的画像(文末有汇总图)。  </p><p>● 上汽  <br>上汽混动开发主要有两个主体,一个是专门开发电动汽车的捷能,一个是传统动力总成部门,前两代的系统是由捷能主导开发的。  </p><p>上汽是国内很早开始自研混动系统的主机厂,2013年上汽第一代EDU是发动机+P1发电机+P2驱动电机+2档AMT结构 ,非常典型的串并联结构。这是典型的双电机方案,主要用于发电和调整发动机转速的ISG电机和另一个则是主要用于驱动的TM电机。 第一代上汽EDU混动系统加入了2挡变速机构(2AMT),设计的初衷是让「发动机」和「电机」都能维持在相对高效率的运转区间。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP6" alt=" title=" 微信图片_20230227120635.png""="" title=" title=">  </p><p>第一代系统的加入了2挡的变速机构,可以更好地实现电机和发动机的工作点的调节。  </p><p>这套系统的优点是:  </p><p>◎系统效率高,发动机可完全解耦工作在高效区间,油耗比较低  </p><p>◎控制策略灵活,串并联结构,可串联可并联,甚至可以发动机双电机并联,能2档调速  </p><p>◎在电池SOC高的时候,发动机双电机同时出力  </p><p>当然这套系统也是有缺点的,比如:  </p><p>◎平顺性和动力中断:2档AMT的换档速度慢,换档动力短暂中断以及换档顿挫这些问题始终是影响了性能。  </p><p>◎故障率和成本:由于整套系统设计初期参数方面需要优化,而切降低成本也比较困难。  </p><p>上汽在第一代的技术上最终选择了推翻重来,研发了第二代「上汽EDU混动系统」。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP7" alt=" title=" 微信图片_20230227120647.png""="" title=" title=">  </p><p>第二代上汽EDU混动系统,可以认为是单电机P2.5并联结构,发动机+6AMT+P2电机+4AMT并联,由发动机、驱动电机、齿轮轴系、离合器以及整车控制器等控制模块组成,属于三平行轴式的单电机电驱 方案。这套系统有18组齿轮,4个同步器,3组同步器与离合器主要用于调节整套系统的换挡逻辑,将发动机与电机相结合。  </p><p>◎油耗层面某些地方还是不错的,发动机和变速箱分别能在各自不同的最佳档位上并联输出  </p><p>◎动力特性比较好,单电机在电控和电机方面成本下降  </p><p>缺点是:  </p><p>◎这套基础结构是P2.5单电机,发动机无法解耦,因此在馈电情况下油耗也降不下去。  </p><p>由于整个系统比较复杂,通过多种机械耦合以后整体的效率并没有设想的更高  </p><p>在上汽乘用车的传统动力总成部门,也在开发P1P3的新混动架构,等正式发布以后我们可以再展开来说。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP8" alt=" title=" 微信图片_20230227120659.png""="" title=" title=">  </p><p>● 长安 iDD  <br>长安汽车的混动车型是从2008年开始筹划建立,2017年和2018年分别推出了搭载P2-7DCT的逸动PHEV和搭载P134串并联电四驱的CS75PHEV量产车型,2021年最新推出的蓝鲸iDD混动系统,采用P2-6DCT并联混动变速器。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP9" alt=" title=" 微信图片_20230227120705.png""="" title=" title=">  </p><p>长安iDD是一套P2架构的单电机混动类型,1.5T四缸发动机最大功率122千瓦、最大扭矩255牛米,与之搭档的电机最大功率85千瓦、最大扭矩330牛米。这两个动力源通过一台六挡三离合变速器传输,是典型的P2混动系统。2021年,长安UNI-K iDD改进了这套混合动力系统,最大功率可达122kW,最大峰值扭矩为255 N·m。通过安装了一块容量为30.74kWh的电池。  </p><p>长安这套系统目前来看并不是主流的方向,单电机并联式方案在欧洲采用比较多,目前最大的缺点是馈电油耗高。由于P2的结构特性,不能实现一边发电一边驱动,这就会导致车辆的主要动力输出是依靠发动机来实现的,那么在馈电状态下,油耗就会非常高。  </p><p>● 奇瑞  </p><p>奇瑞2021年发布了3挡串并联混动变速器鲲鹏混动系统。奇瑞鲲鹏混动系统是一套混联式混合动力,驱动核心是一台115kW的1.5T发动机加上两台(P2 55kW、P2.5 70kW)永磁同步电机。 动力系统的核心在于三档双离合的混动变速箱上,两台电机中的P2.5电机与双离合变速箱中的奇数轴相连,在驱动状态下有两个挡位可以切换。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQa" alt=" title=" 微信图片_20230227120713.png""="" title=" title=">  </p><p>P2电机则直接挂在发动机输出轴的离合器C1的另一端,可通过变速箱输出动力,也可在发动机带动下发电。发动机则是处在三档变速箱的最顶端,可直驱,也可增程。  </p><p>这套系统最大的特点是9种工作模式和11个组合挡位,包括单电机纯电模式、双电机纯电模式、串联增程模式、发动机直驱模式、并联驱动模式、驻车充电模式、行车充电模式、单电机制动能量回收,以及双电机制动回收模式。  </p><p>优点:理论上这套系统可以做得很牛,理论上可以覆盖更多的使用场景,而且将电机和发动机的效率最大化;  </p><p>缺点:缺点也很明显,整个动力系统的结构会非常复杂,电机、电池和发动机等不同配置调整以后,整个系统需要一遍遍调教,需要大量的车型推出来不断优化,这使得整车重量和调校会有难度。而且这套系统的BOM成本和制造成本来看,很短在初期降下来。  </p><p>小结:混动系统并不容易做,插电混动也是在新能源汽车鼓励政策下不断支持以后,才有今天的成绩。我们希望中国的混动系统越来越好,每家都有机会完善自己的方案。  </p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQb" alt=" title=" 微信图片_20230227120720.png""="" title=" title="></p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 04:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387009</guid>
            <link>https://aijishu.com/a/1060000000387009</link>
        </item>
        <item>
            <title><![CDATA[南京大学&港中文提出首个支持超高分辨率(10000x10000)图像风格迁移方案]]></title>
            <description><![CDATA[<p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP4" alt="image.png" title="image.png"></p><p>paper:<a href="https://aijishu.com/link?target=https%3A%2F%2Farxiv.org%2Fabs%2F2103.11784" target="blank">https://arxiv.org/abs/2103.11784</a></p><p>code:<a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fczczup%2FURST" target="blank">https://github.com/czczup/URST</a></p><blockquote>本文是南京大学&amp;香港大学的路通&amp;罗平等人在风格迁移领域的一次突破性探索,提出了<strong>首个支持超高分辨率(比如10000x10000大小)图像风格迁移的方案URST</strong>。针对现有风格迁移模型在图像块处理时存在的块间不一致问题,<strong>提出了一种新颖的“Thumbnail Instance Normalization”</strong>;与此同时,针对高分辨率图像风格迁移存在的“small stroke size”问题,<strong>提出了一种新颖的辅助损失</strong>。所提方案可以轻易与现有风格迁移网络组合并取得性能提升。</blockquote><h2>Abstract</h2><p>本文提出一种非常简单的极限分辨率的风格迁移框架URST,首个可以处理任意高分辨率(比如)图像的进行风格迁移的方案。当处理超高分辨率图像时,受限于较大的内存占用与<code>small stroke size</code>问题,现有风格迁移方法往往难以真正应用。</p><p>URST通过以下两种策略避免了超高分辨率图像导致的内存问题:(1) 将图像划分成小的图像块进行处理;(2)提出一种新颖的<code>Thumbnail Instance Normalization (TIN)</code>进行块级风格迁移。具体来说,TIN可以提取缩略图的规范化统计信息并应用到小图像块上,确保了不同块之间的风格一致性。</p><p>总而言之,相比已有方案,本文所提URST具有这样几个优点:</p><ul><li>通过将图像拆分为小块并采用TIN成功的对任意高分辨图像进行风格迁移;</li><li>受益于所提感知损失,所提方法在超高分辨率图像上取得了超过其他SOTA方案的效果;</li><li>所提URST可以轻易的嵌入到现有风格迁移方案中,无需进行训练即可提升其性能。</li></ul><h2>Introduction</h2><p>超高分辨率图像风格迁移存在两个关键性挑战:</p><ul><li>超高分辨图像需要非常大的内存占用,甚至超出现有GPU的最大显存;</li><li>过小的笔画描边会导致不自然的纹理。</li></ul><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQd" alt="image.png" title="image.png"></p><p>针对第一个问题,现有方法往往采用轻量型网络、模型剪枝、知识蒸馏等方法降低显存占用。然而这些方法仅仅能起到缓和的作用,以上图为例,随着分辨率的提升,显存的占用呈指数增长,很快超出了现有GPU的峰值。这就驱动我们<strong>设计一种更有效的策略用于超高分辨率图像的风格迁移</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQe" alt="image.png" title="image.png"></p><p>超高分辨率图像的笔画边缘过小会呈现出不自然的现象,可参考上图(b)。增大笔画边缘是一种广泛采用的解决上述问题的方法;此外扩大风格迁移网络的感受野是另一种解决方案。然而这些方法并不适用于超高分辨率风格迁移。</p><p>为解决上述问题,本文提出了URST用于对任意高分辨率图像在有限内存约束下进行风格迁移,效果可参考上图(d)。</p><h2>Method</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQh" alt="image.png" title="image.png"></p><p>上图给出了本文所提URST的整体框架示意图。所提方案包含三个关键设计思想:</p><ul><li><strong>一种灵活的块级风格迁移</strong>,它可以将高计算量的风格迁移任务拆分为多个地计算量的块级风格迁移;</li><li>提出<strong>一种新颖的缩略图实例规范化TIN</strong>,它可以提取缩略图规范化统计信息并将其应用到小图像块上以确保不同块间的风格一致性;</li><li>精心设计了<strong>一种笔画感知损失</strong>以聚焦于笔画边缘的感知差异,促使风格迁移网络生成大的笔画边缘。</li></ul><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQi" alt="image.png" title="image.png"></p><p>由于该方案中的风格迁移网络可以是任意方法(比如AdaIN、LinearWCT),为方便起见,我们定义所选择方法原始损失为,在训练过程中,我们首先采用原始损失基于缩略图优化风格迁移网络。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQj" alt="image.png" title="image.png"></p><h3>Patch-wise Style Transfer</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQk" alt="image.png" title="image.png"></p><p>相比已有方法采用完整图像作为输入,所提框架可以灵活的处理任意高分辨率图像,同时也可以轻易嵌入到现有风格迁移方法(比如AdaIN、WCT、LinearWCT)中。正如前面所提到的,由于不同块的统计特性独立性,不同图像块的风格化可能存在不一致性问题。</p><h3>Thumbnail Instance Normalization</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQl" alt="image.png" title="image.png"></p><p>然而,我们发现IN并不适用于块级风格迁移,会导致块间风格不一致问题,可参考下图。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQm" alt="image.png" title="image.png"></p><p>在上图(a)中,我们对输入作为整体进行规范化;在上图(b)中我们将输入拆分为四块分贝进行规范化。这就导致最终的结果存在风格不一致问题。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQn" alt="image.png" title="image.png"></p><p>通过这种方式,TIN可以确保不同块间的风格一致性间,上图(c)。</p><h3>Stroke Perceptual Loss</h3><p>所提方法驱动我们提出一种辅助损失增大笔画边缘,该损失定义如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQo" alt="image.png" title="image.png"></p><h2>Experiments</h2><p>为验证所提方法的有效性,我们将其与AdaIN、WCT等方法进行了对比,见下图。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQp" alt="image.png" title="image.png"><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQp" alt="image.png" title="image.png"></p><p>从上图可以看到:(1) IN导致了明显的块间风格不一致问题;(2) <strong>所提方法取得了与全图相似的效果且显存占用更低</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQO" alt="image.png" title="image.png"></p><p>与此同时,我们还对比了所提损失函数的影响分析,见上图。可以看到:<strong>基于所提损失引导,这些模型可以生成更粗的线条与更稀疏的纹理,这有助于改善超高分辨率风格迁移</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQP" alt="image.png" title="image.png"><br>此外,我们还提供了不同风格迁移方案在不同输入分辨率输入时的显存占用对比。可以看到:大多方法甚至不能处理的高分辨率图像;而<strong>本文所提方法甚至可以处理分辨率图像且显存占用不超过5GB</strong>。理论上,本文所提方法可以处理任意高分辨率图像。</p><p>最后,我们提供一个超高分辨率图像风格迁移效果图作为结尾。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQQ" alt="image.png" title="image.png"></p><blockquote>来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FJqRUmFZLGtXDt814wH7ppA" target="blank">AIWalker</a><br>作者:   Happy</blockquote><p>推荐阅读</p><ul><li><a href="https://aijishu.com/a/1060000000386282"><strong>深入分析MobileAI图像超分最佳方案:ABPN</strong></a></li><li><a href="https://aijishu.com/a/1060000000385959"><strong>HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法</strong></a></li><li><a href="https://aijishu.com/a/1060000000385643"><strong>一层卷积能做啥?BOE告诉你:一层卷积可以做超分!</strong></a></li><li><a href="https://aijishu.com/a/1060000000385377"><strong>一层卷积能做啥?BOE告诉你:一层卷积可以做超分!</strong></a></li><li><a href="https://aijishu.com/a/1060000000380384"><strong>YOLOv6 v3.0 | 重磅升级!性能超越V8!</strong></a></li></ul><blockquote>本文章著作权归作者所有,任何形式的转载都请注明出处。更多动态滤波,图像质量,超分辨相关请关注我的专栏<a href="https://aijishu.com/blog/aiwalker">AIWalker</a>。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 04:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386996</guid>
            <link>https://aijishu.com/a/1060000000386996</link>
        </item>
        <item>
            <title><![CDATA[【TVM 学习资料】TensorIR 快速入门]]></title>
            <description><![CDATA[<p>本篇文章译自英文文档  [Blitz Course to TensorIR<br>](<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2Ftutorial%2Ftensor_ir_blitz_course.html" target="blank">https://tvm.apache.org/docs/t...</a>) 作者是 Siyuan Feng。更多 TVM 中文文档可访问→<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.hyper.ai%2F" target="blank">TVM 中文站</a> </p><p>TensorIR 是深度学习领域的特定语言,主要有两个作用:</p><ul><li>在各种硬件后端转换和优化程序。</li><li>自动 <em>tensorized</em> 程序优化的抽象。</li></ul><pre><code class="bash">import tvm
from tvm.ir.module import IRModule
from tvm.script import tir as T
import numpy as np</code></pre><h1>IRModule</h1><p>IRModule 是 TVM 的核心数据结构,它包含深度学习程序,并且是 IR 转换和模型构建的基础。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/eab85e2bd22d4c2199a5245e93ab04a5.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>上图展示的是 IRModule 的生命周期,它可由 TVMScript 创建。转换 IRModule 的两种主要方法是 TensorIR 的 schedule 原语转换和 pass 转换。此外,也可直接对 IRModule 进行一系列转换。注意,可以在任何阶段将 IRModule 打印到 TVMScript。完成所有转换和优化后,可将 IRModule 构建为可运行模块,从而部署在目标设备上。</p><p>基于 TensorIR 和 IRModule 的设计,可创建一种新的编程方法:</p><ol><li>基于 Python-AST 语法,用 TVMScript 编写程序。</li><li>使用 Python API 转换和优化程序。</li><li>使用命令式转换 API 交互检查和提高性能。</li></ol><h1>创建 IRModule</h1><p>IRModule 是 TVM IR 的一种可往返语法,可通过编写 TVMScript 来创建。</p><p>与通过张量表达式创建计算表达式(使用张量表达式操作算子)不同,TensorIR 允许用户通过 TVMScript(一种嵌在 Python AST 中的语言)进行编程。新方法可以编写复杂的程序并进一步调度和优化。</p><p>下面是向量加法的示例:</p><pre><code class="bash">@tvm.script.ir_module
class MyModule:
    @T.prim_func
    def main(a: T.handle, b: T.handle):
        # 我们通过 T.handle 进行数据交换,类似于内存指针
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # 通过 handle 创建 Buffer
        A = T.match_buffer(a, (8,), dtype="float32")
        B = T.match_buffer(b, (8,), dtype="float32")
        for i in range(8):
            # block 是针对计算的抽象
            with T.block("B"):
                # 定义一个空间(可并行)block 迭代器,并且将它的值绑定成 i
                vi = T.axis.spatial(8, i)
                B[vi] = A[vi] + 1.0
ir_module = MyModule
print(type(ir_module))
print(ir_module.script())</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.ir.module.IRModule'&gt;
# from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i in T.serial(8):
            with T.block("B"):
                vi = T.axis.spatial(8, i)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><p>此外,我们还可以使用张量表达式 DSL 编写简单的运算符,并将它们转换为 IRModule。</p><pre><code class="bash">from tvm import te
A = te.placeholder((8,), dtype="float32", name="A")
B = te.compute((8,), lambda *i: A(*i) + 1.0, name="B")
func = te.create_prim_func([A, B])
ir_module_from_te = IRModule({"main": func})
print(ir_module_from_te.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i0 in T.serial(8):
            with T.block("B"):
                i0_1 = T.axis.spatial(8, i0)
                T.reads(A[i0_1])
                T.writes(B[i0_1])
                B[i0_1] = A[i0_1] + T.float32(1)</code></pre><h1>构建并运行 IRModule</h1><p>可将 IRModule 构建为特定 target 后端的可运行模块。</p><pre><code class="bash">mod = tvm.build(ir_module, target="llvm")  # CPU 后端的模块
print(type(mod))</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.driver.build_module.OperatorModule'&gt;</code></pre><p>准备输入数组和输出数组,然后运行模块:</p><pre><code class="bash">a = tvm.nd.array(np.arange(8).astype("float32"))
b = tvm.nd.array(np.zeros((8,)).astype("float32"))
mod(a, b)
print(a)
print(b)</code></pre><p>输出结果:</p><pre><code class="bash">[0. 1. 2. 3. 4. 5. 6. 7.]
[1. 2. 3. 4. 5. 6. 7. 8.]</code></pre><h1>转换 IRModule</h1><p>IRModule 是程序优化的核心数据结构,可通过 Schedule 进行转换。schedule 包含多个 primitive 方法来交互地转换程序。每个 primitive 都以特定方式对程序进行转换,从而优化性能。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f1d1c2925359488883e2cb5e0a43802f.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>上图是优化张量程序的典型工作流程。首先,用 TVMScript 或张量表达式创建一个初始 IRModule,然后在这个初始 IRModule 上创建 schedule。接下来,使用一系列调度原语来提高性能。最后,我们可以将其降低并构建成一个可运行模块。</p><p>上面只演示了一个简单的转换。首先,在输入 ir_module 上创建 schedule:</p><pre><code class="bash">sch = tvm.tir.Schedule(ir_module)
print(type(sch))</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.tir.schedule.schedule.Schedule'&gt;</code></pre><p>将嵌套循环展开成 3 个循环,并打印结果:</p><pre><code class="bash"># 通过名字获取 block
block_b = sch.get_block("B")
# 获取包围 block 的循环
(i,) = sch.get_loops(block_b)
# 展开嵌套循环
i_0, i_1, i_2 = sch.split(i, factors=[2, 2, 2])
print(sch.mod.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0, i_1, i_2 in T.grid(2, 2, 2):
            with T.block("B"):
                vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><p>还可对循环重新排序。例如,将循环 i_2 移到 i_1 之外:</p><pre><code class="bash">sch.reorder(i_0, i_2, i_1)
print(sch.mod.script())</code></pre><p>输出结果</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0, i_2, i_1 in T.grid(2, 2, 2):
            with T.block("B"):
                vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><h1>转换为 GPU 程序</h1><p>要在 GPU 上部署模型必须进行线程绑定。幸运的是,也可以用原语来增量转换。</p><pre><code class="bash">sch.bind(i_0, "blockIdx.x")
sch.bind(i_2, "threadIdx.x")
print(sch.mod.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0 in T.thread_binding(2, thread="blockIdx.x"):
            for i_2 in T.thread_binding(2, thread="threadIdx.x"):
                for i_1 in T.serial(2):
                    with T.block("B"):
                        vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                        T.reads(A[vi])
                        T.writes(B[vi])
                        B[vi] = A[vi] + T.float32(1)</code></pre><p>绑定线程后,用 cuda 后端来构建 IRModule:</p><pre><code class="bash">ctx = tvm.cuda(0)
cuda_mod = tvm.build(sch.mod, target="cuda")
cuda_a = tvm.nd.array(np.arange(8).astype("float32"), ctx)
cuda_b = tvm.nd.array(np.zeros((8,)).astype("float32"), ctx)
cuda_mod(cuda_a, cuda_b)
print(cuda_a)
print(cuda_b)</code></pre><p>输出结果:</p><pre><code class="bash">[0. 1. 2. 3. 4. 5. 6. 7.]
[1. 2. 3. 4. 5. 6. 7. 8.]</code></pre><p><a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2F_downloads%2Feac4389b114db015e95cb3cdf8b86b83%2Fauto_scheduler_matmul_x86.py" target="blank">下载 Python 源代码</a><br><a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2F_downloads%2F246d4b8509474fd9046e69f6cc9b7f87%2Fauto_scheduler_matmul_x86.ipynb" target="blank">下载 Jupyter Notebook</a></p><p>以上就是该文档的全部内容,查看更多 TVM 中文文档,请访问→<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.hyper.ai%2F" target="blank">TVM 中文站</a></p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 03:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386987</guid>
            <link>https://aijishu.com/a/1060000000386987</link>
        </item>
        <item>
            <title><![CDATA[ECCV'22 Oral|VQFR|基于矢量量化字典与双解码器的人脸盲修复网络]]></title>
            <description><![CDATA[<h2>ECCV'22 Oral|VQFR|基于矢量量化字典与双解码器的人脸盲修复网络</h2><p>ECCV'22 Oral - VQFR: Blind Face Restoration with Vector-Quantized Dictionary and Parallel Decoder</p><p>解读:Owen718 论文链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Farxiv.org%2Fpdf%2F2205.06803.pdf" target="blank">https://arxiv.org/pdf/2205.06803.pdf</a></p><h2>Background&amp;Motivation</h2><p>尽管生成式面部先验和结构化面部先验最近已经证明了可以生成高质量的人脸盲修复结果,稳定、可靠生成更细粒度的脸部细节仍然是一个具有挑战性的问题。这篇文章受最近基于字典的方法和基于矢量量化的方法启发,提出了一种 基于矢量量化(VQ-based)的人脸盲修复方法VQFR。VQFR从高质量的图像中抽取特征,构建low-level特征库从而恢复逼真的面部细节。</p><p>这篇工作重点关注如下两个问题:</p><ul><li>1.<strong>codebook中每个code对应的原图patch大小会极大影响人脸网络修复结果的质量与保真度权衡,而实际落地应用中,质量与保真度需要做到良好的平衡以获得最佳视觉效果。</strong></li><li>2.<strong>原图退化特征需要与来自codebook的高质量特征做融合,融合过程中,如何做到高质量特征不被退化特征所干扰而导致性能降低?</strong></li></ul><h2>详细介绍引入</h2><p>人脸恢复的目标是恢复低质量(LQ)面孔并纠正未知退化,例如噪声、模糊、下采样引起的退化等。在实际情况下,此任务变得更具挑战性,因为存在更复杂的退化、多样的面部姿势和表情。以前的作品通常利用特定于人脸的先验,包括几何先验、生成先验和参考先验。具体来说,几何先验通常包括面部标志、面部解析图和面部组件热图。它们可以为恢复准确的面部形状提供全局指导,但不能帮助生成逼真的细节。此外,几何先验是从退化图像中估计出来的,因此对于具有严重退化的输入变得不准确。这些特性促使研究人员寻找更好的先验。最近的人脸修复工作开始研究生成先验(GAN-Prior),并取了优异的性能。这些方法通常利用预先训练的人脸生成对抗网络(例如StyleGAN)的强大生成能力来生成逼真的纹理。这些方法通常将退化的图像投影回GAN潜在空间,然后使用预先训练的生成器解码高质量(HQ)人脸结果。尽管基于GAN先验的方法最初从整体上讲具有良好的恢复质量,但仍然无法生成细粒度的面部细节,特别是精细的头发和精致的面部组件。这是因为训练有素的GAN模型,其潜在空间仍然是不够完善的。基于参考的方法(Reference-based methods)—探索了高质量的指导面孔或面部组件字典来解决面部恢复问题。DFDNet是该类别中的代表方法,它不需要访问相同身份的面孔,就可以产生高质量的结果。它明确建立高质量的“纹理库”,用于几个面部组件,然后用字典中最近的高质量面部组件替换退化的面部组件。这种离散的替换操作可以直接弥合低质量面部部件与高质量部件之间的差距,因此具有提供良好面部细节的潜力。然而,DFDNet中的面部组件字典仍然有两个缺点。<strong>1)它使用预先训练的VGGFace网络进行离线生成,该网络是为识别任务优化的,明显并不适合恢复任务。2)它只关注几个面部组件(即眼睛、鼻子和嘴巴),但不包括其他重要区域,例如头发和皮肤。</strong></p><p>面部组件

...

@github-actions
Copy link
Contributor

http://localhost:1200/aijishu/channel/ai - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[AI 应用 - 极术社区]]></title>
        <link>https://aijishu.com/channel/ai</link>
        <atom:link href="http://localhost:1200/aijishu/channel/ai" rel="self" type="application/rss+xml" />
        <description><![CDATA[AI 应用 - 极术社区 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 17:49:09 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[用人工智能设计芯片及对IC设计就业市场的影响]]></title>
            <description><![CDATA[<p>集成电路 (IC) 设计是一项复杂的工作,不断突破密度和性能的界限。现在,人工智能 (AI)在 IC 设计中的作用越来越大。</p><p>虽然 AI 最近因其在 ChatGPT 等自然语言处理器方面的惊人能力而受到更多关注,但该工具也被用于 IC 设计的各个阶段,包括设计优化、布局、仿真和验证。人工智能算法还可以帮助更有效地探索设计空间,比传统方法更快地发现最佳设计配置。</p><h5>随着设计变得比以往任何时候都更加复杂,人工智能可以成为 IC 设计师的强大资产。</h5><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRe" alt="image.png" title="image.png"></p><p>本文重点介绍了AI如何被用作IC设计的工具,以及这项技术如何影响IC设计工程师的专业价值。</p><p><strong>利用 AI 来实现严格的设计约束</strong></p><h3>由于数十亿个晶体管被限制在一个很小的芯片区域,IC 设计师的任务是在严格约束的情况下优化设计。&nbsp;</h3><p>首先,芯片面积必须最小,以适应当今设备的小尺寸,并降低制造成本。布局的功耗也是值得关注的;功耗同样会影响部署成本以及芯片对环境的影响。某些密集区域和配置容易过热,需要冷却机制或更巧妙的布局。考虑到这些因素和许多其他因素,IC设计人员大约需要八到九个月的时间来生成一个满足每个严格要求的芯片布局。</p><p>为了加快和优化 IC 设计流程,许多公司(包括科技行业的一些最大公司)现在都在投资 AI 工具来完成一些繁重的工作。</p><p><strong>谷歌人工智能在几个小时内设计出芯片</strong></p><p>据谷歌称,谷歌的深度学习强化学习 (RL) 方法可以在比人类工程师少得多的时间内生成有效的布局,而且结果在质量上也不相上下。</p><p>谷歌表示,谷歌的深度学习强化学习(RL)方法可以在比人类少得多的时间内产生有效的布局,而且结果在质量上也不相上下。2022年3月,谷歌研究院推出了PRIME,这是一种深度学习方法,利用现有的数据,如功率和延迟来创建加速器设计,比用传统方法设计的芯片更快、更小。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRf" alt="image.png" title="image.png"></p><p>谷歌研究人员使用 10,000 个芯片平面图来训练他们的模型。人工智能生成的芯片设计时间不到六个小时。谷歌表示,这种方法已经被利用来实现谷歌的张量处理单元(TPU),这是谷歌基于云的机器学习应用的一部分。</p><p><strong>EDA公司在AI设计系统上加倍投入</strong></p><p>不仅仅是谷歌转向机器学习模型。像Synopsys和Cadence这样的EDA公司也在其最新工具中使用到AI技术。比如最近,Synopsys凭借其 Synopsys DSO.ai 自主芯片设计系统注册了 100 个商业流片。该系统最近的客户包括 意法半导体(ST)和 SK Hynix。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRg" alt="image.png" title="image.png"></p><p>ST 和 Synopsys 于 2022 年 2 月初首次在微软的云端使用 DSO.ai 来设计工作芯片。使用 Synopsys 的 DSO.ai 设计系统,结合 Microsoft Azure 上的 Synopsys Fusion Compiler 和 IC Compiler,该工具将功耗、性能和面积 (PPA) 指标提高了 3 倍以上,总功耗降低了 25%,并且显著缩小了芯片尺寸。</p><p>除了芯片设计,人工智能还在芯片测试和验证中找到了应用——芯片制造商在这两个领域花费了大量时间。为了解决这一设计阶段的问题,西门子发布了Questa Verification IQ,这是一个帮助IC设计工程师加快验证过程的软件平台。</p><p><strong>英伟达用GPU设计GPU</strong></p><p>NVIDIA(英伟达)为芯片设计设计了另一种深度学习方法。该公司制作了一个名为PrefixRL的 RL 模型,证明 AI 可以从头开始学习电路设计,并使用最新的 EDA 工具制造更小、更快的电路。NVIDIA 的架构由 13,000 个使用 AI 技术设计的电路组成。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMRh" alt="image.png" title="image.png"></p><p>针对自动化单元迁移,该公司开发了NVCell,可以无错迁移92%的单元库。人类工程师可以对剩下的 8% 没有自动迁移的单元进行处理。NVIDIA 首席科学家 Bill Dally 表示:</p><p><em>“所以这就像一个 Atari 视频游戏,但它是一个用于修复标准单元中的设计规则错误的视频游戏。通过强化学习来研究和修复这些设计规则错误,我们能够基本完成我们标准的设计单元。”</em></p><p><strong>人工智能对 IC 设计就业市场的影响</strong></p><p>虽然人工智能可以自动执行传统上由IC设计人员执行的某些任务,例如布局设计和优化,但它也减少了设计过程中对手动方面的需求。虽然这提高了整体效率,但也可能导致IC设计的某些领域的最终工作被取代。</p><p>另一方面,人工智能还可以帮助 IC 设计人员更高效、更有效地开展工作。例如,AI 可以分析大量数据并提供见解,建议工程师以前可能没有考虑过的设计替代方案。这种趋势可以提高 IC 设计人员在行业中的价值,使他们能够专注于更复杂和更具创造性的设计方面,并最终生产出更好的产品。</p><p>不过人工智能不太可能完全取代对熟练IC设计师的需求。随着人工智能在行业中越来越普遍,对这类工程师的需求甚至可能会增加,因为在设计过程中,将需要能够准确验证和利用人工智能工具和算法的个人。</p><hr><blockquote>作者:  Darshil Patel <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FN_pgzMV26mvgCMAxWMgieQ" target="blank">EETOP</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000386323">行业前瞻,神奇的忆阻器</a></li><li><a href="https://aijishu.com/a/1060000000386135">芯片验证调研报告:首次流片成功率越来越低、Verilog 使用逐渐减少、UVM地位无法动摇</a></li><li><a href="https://aijishu.com/a/1060000000385729">PCIe 6.0:在有损HVM通道中使用PAM4实现64GT/s的挑战</a></li><li><a href="https://aijishu.com/a/1060000000385482">Wi-R 一种全新的通信方式,让你的身体充当媒介!芯片已推出!</a></li><li><a href="https://aijishu.com/a/1060000000383891">科普:DDR</a></li></ul><blockquote>更多IC设计技术干货请关注IC设计技术专栏。<br>迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387068</guid>
            <link>https://aijishu.com/a/1060000000387068</link>
        </item>
        <item>
            <title><![CDATA[南京大学&港中文提出首个支持超高分辨率(10000x10000)图像风格迁移方案]]></title>
            <description><![CDATA[<p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMP4" alt="image.png" title="image.png"></p><p>paper:<a href="https://aijishu.com/link?target=https%3A%2F%2Farxiv.org%2Fabs%2F2103.11784" target="blank">https://arxiv.org/abs/2103.11784</a></p><p>code:<a href="https://aijishu.com/link?target=https%3A%2F%2Fgithub.com%2Fczczup%2FURST" target="blank">https://github.com/czczup/URST</a></p><blockquote>本文是南京大学&amp;香港大学的路通&amp;罗平等人在风格迁移领域的一次突破性探索,提出了<strong>首个支持超高分辨率(比如10000x10000大小)图像风格迁移的方案URST</strong>。针对现有风格迁移模型在图像块处理时存在的块间不一致问题,<strong>提出了一种新颖的“Thumbnail Instance Normalization”</strong>;与此同时,针对高分辨率图像风格迁移存在的“small stroke size”问题,<strong>提出了一种新颖的辅助损失</strong>。所提方案可以轻易与现有风格迁移网络组合并取得性能提升。</blockquote><h2>Abstract</h2><p>本文提出一种非常简单的极限分辨率的风格迁移框架URST,首个可以处理任意高分辨率(比如)图像的进行风格迁移的方案。当处理超高分辨率图像时,受限于较大的内存占用与<code>small stroke size</code>问题,现有风格迁移方法往往难以真正应用。</p><p>URST通过以下两种策略避免了超高分辨率图像导致的内存问题:(1) 将图像划分成小的图像块进行处理;(2)提出一种新颖的<code>Thumbnail Instance Normalization (TIN)</code>进行块级风格迁移。具体来说,TIN可以提取缩略图的规范化统计信息并应用到小图像块上,确保了不同块之间的风格一致性。</p><p>总而言之,相比已有方案,本文所提URST具有这样几个优点:</p><ul><li>通过将图像拆分为小块并采用TIN成功的对任意高分辨图像进行风格迁移;</li><li>受益于所提感知损失,所提方法在超高分辨率图像上取得了超过其他SOTA方案的效果;</li><li>所提URST可以轻易的嵌入到现有风格迁移方案中,无需进行训练即可提升其性能。</li></ul><h2>Introduction</h2><p>超高分辨率图像风格迁移存在两个关键性挑战:</p><ul><li>超高分辨图像需要非常大的内存占用,甚至超出现有GPU的最大显存;</li><li>过小的笔画描边会导致不自然的纹理。</li></ul><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQd" alt="image.png" title="image.png"></p><p>针对第一个问题,现有方法往往采用轻量型网络、模型剪枝、知识蒸馏等方法降低显存占用。然而这些方法仅仅能起到缓和的作用,以上图为例,随着分辨率的提升,显存的占用呈指数增长,很快超出了现有GPU的峰值。这就驱动我们<strong>设计一种更有效的策略用于超高分辨率图像的风格迁移</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQe" alt="image.png" title="image.png"></p><p>超高分辨率图像的笔画边缘过小会呈现出不自然的现象,可参考上图(b)。增大笔画边缘是一种广泛采用的解决上述问题的方法;此外扩大风格迁移网络的感受野是另一种解决方案。然而这些方法并不适用于超高分辨率风格迁移。</p><p>为解决上述问题,本文提出了URST用于对任意高分辨率图像在有限内存约束下进行风格迁移,效果可参考上图(d)。</p><h2>Method</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQh" alt="image.png" title="image.png"></p><p>上图给出了本文所提URST的整体框架示意图。所提方案包含三个关键设计思想:</p><ul><li><strong>一种灵活的块级风格迁移</strong>,它可以将高计算量的风格迁移任务拆分为多个地计算量的块级风格迁移;</li><li>提出<strong>一种新颖的缩略图实例规范化TIN</strong>,它可以提取缩略图规范化统计信息并将其应用到小图像块上以确保不同块间的风格一致性;</li><li>精心设计了<strong>一种笔画感知损失</strong>以聚焦于笔画边缘的感知差异,促使风格迁移网络生成大的笔画边缘。</li></ul><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQi" alt="image.png" title="image.png"></p><p>由于该方案中的风格迁移网络可以是任意方法(比如AdaIN、LinearWCT),为方便起见,我们定义所选择方法原始损失为,在训练过程中,我们首先采用原始损失基于缩略图优化风格迁移网络。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQj" alt="image.png" title="image.png"></p><h3>Patch-wise Style Transfer</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQk" alt="image.png" title="image.png"></p><p>相比已有方法采用完整图像作为输入,所提框架可以灵活的处理任意高分辨率图像,同时也可以轻易嵌入到现有风格迁移方法(比如AdaIN、WCT、LinearWCT)中。正如前面所提到的,由于不同块的统计特性独立性,不同图像块的风格化可能存在不一致性问题。</p><h3>Thumbnail Instance Normalization</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQl" alt="image.png" title="image.png"></p><p>然而,我们发现IN并不适用于块级风格迁移,会导致块间风格不一致问题,可参考下图。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQm" alt="image.png" title="image.png"></p><p>在上图(a)中,我们对输入作为整体进行规范化;在上图(b)中我们将输入拆分为四块分贝进行规范化。这就导致最终的结果存在风格不一致问题。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQn" alt="image.png" title="image.png"></p><p>通过这种方式,TIN可以确保不同块间的风格一致性间,上图(c)。</p><h3>Stroke Perceptual Loss</h3><p>所提方法驱动我们提出一种辅助损失增大笔画边缘,该损失定义如下:<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQo" alt="image.png" title="image.png"></p><h2>Experiments</h2><p>为验证所提方法的有效性,我们将其与AdaIN、WCT等方法进行了对比,见下图。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQp" alt="image.png" title="image.png"><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQp" alt="image.png" title="image.png"></p><p>从上图可以看到:(1) IN导致了明显的块间风格不一致问题;(2) <strong>所提方法取得了与全图相似的效果且显存占用更低</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQO" alt="image.png" title="image.png"></p><p>与此同时,我们还对比了所提损失函数的影响分析,见上图。可以看到:<strong>基于所提损失引导,这些模型可以生成更粗的线条与更稀疏的纹理,这有助于改善超高分辨率风格迁移</strong>。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQP" alt="image.png" title="image.png"><br>此外,我们还提供了不同风格迁移方案在不同输入分辨率输入时的显存占用对比。可以看到:大多方法甚至不能处理的高分辨率图像;而<strong>本文所提方法甚至可以处理分辨率图像且显存占用不超过5GB</strong>。理论上,本文所提方法可以处理任意高分辨率图像。</p><p>最后,我们提供一个超高分辨率图像风格迁移效果图作为结尾。</p><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMQQ" alt="image.png" title="image.png"></p><blockquote>来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FJqRUmFZLGtXDt814wH7ppA" target="blank">AIWalker</a><br>作者:   Happy</blockquote><p>推荐阅读</p><ul><li><a href="https://aijishu.com/a/1060000000386282"><strong>深入分析MobileAI图像超分最佳方案:ABPN</strong></a></li><li><a href="https://aijishu.com/a/1060000000385959"><strong>HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法</strong></a></li><li><a href="https://aijishu.com/a/1060000000385643"><strong>一层卷积能做啥?BOE告诉你:一层卷积可以做超分!</strong></a></li><li><a href="https://aijishu.com/a/1060000000385377"><strong>一层卷积能做啥?BOE告诉你:一层卷积可以做超分!</strong></a></li><li><a href="https://aijishu.com/a/1060000000380384"><strong>YOLOv6 v3.0 | 重磅升级!性能超越V8!</strong></a></li></ul><blockquote>本文章著作权归作者所有,任何形式的转载都请注明出处。更多动态滤波,图像质量,超分辨相关请关注我的专栏<a href="https://aijishu.com/blog/aiwalker">AIWalker</a>。欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 04:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386996</guid>
            <link>https://aijishu.com/a/1060000000386996</link>
        </item>
        <item>
            <title><![CDATA[【TVM 学习资料】TensorIR 快速入门]]></title>
            <description><![CDATA[<p>本篇文章译自英文文档  [Blitz Course to TensorIR<br>](<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2Ftutorial%2Ftensor_ir_blitz_course.html" target="blank">https://tvm.apache.org/docs/t...</a>) 作者是 Siyuan Feng。更多 TVM 中文文档可访问→<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.hyper.ai%2F" target="blank">TVM 中文站</a> </p><p>TensorIR 是深度学习领域的特定语言,主要有两个作用:</p><ul><li>在各种硬件后端转换和优化程序。</li><li>自动 <em>tensorized</em> 程序优化的抽象。</li></ul><pre><code class="bash">import tvm
from tvm.ir.module import IRModule
from tvm.script import tir as T
import numpy as np</code></pre><h1>IRModule</h1><p>IRModule 是 TVM 的核心数据结构,它包含深度学习程序,并且是 IR 转换和模型构建的基础。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/eab85e2bd22d4c2199a5245e93ab04a5.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>上图展示的是 IRModule 的生命周期,它可由 TVMScript 创建。转换 IRModule 的两种主要方法是 TensorIR 的 schedule 原语转换和 pass 转换。此外,也可直接对 IRModule 进行一系列转换。注意,可以在任何阶段将 IRModule 打印到 TVMScript。完成所有转换和优化后,可将 IRModule 构建为可运行模块,从而部署在目标设备上。</p><p>基于 TensorIR 和 IRModule 的设计,可创建一种新的编程方法:</p><ol><li>基于 Python-AST 语法,用 TVMScript 编写程序。</li><li>使用 Python API 转换和优化程序。</li><li>使用命令式转换 API 交互检查和提高性能。</li></ol><h1>创建 IRModule</h1><p>IRModule 是 TVM IR 的一种可往返语法,可通过编写 TVMScript 来创建。</p><p>与通过张量表达式创建计算表达式(使用张量表达式操作算子)不同,TensorIR 允许用户通过 TVMScript(一种嵌在 Python AST 中的语言)进行编程。新方法可以编写复杂的程序并进一步调度和优化。</p><p>下面是向量加法的示例:</p><pre><code class="bash">@tvm.script.ir_module
class MyModule:
    @T.prim_func
    def main(a: T.handle, b: T.handle):
        # 我们通过 T.handle 进行数据交换,类似于内存指针
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # 通过 handle 创建 Buffer
        A = T.match_buffer(a, (8,), dtype="float32")
        B = T.match_buffer(b, (8,), dtype="float32")
        for i in range(8):
            # block 是针对计算的抽象
            with T.block("B"):
                # 定义一个空间(可并行)block 迭代器,并且将它的值绑定成 i
                vi = T.axis.spatial(8, i)
                B[vi] = A[vi] + 1.0
ir_module = MyModule
print(type(ir_module))
print(ir_module.script())</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.ir.module.IRModule'&gt;
# from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i in T.serial(8):
            with T.block("B"):
                vi = T.axis.spatial(8, i)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><p>此外,我们还可以使用张量表达式 DSL 编写简单的运算符,并将它们转换为 IRModule。</p><pre><code class="bash">from tvm import te
A = te.placeholder((8,), dtype="float32", name="A")
B = te.compute((8,), lambda *i: A(*i) + 1.0, name="B")
func = te.create_prim_func([A, B])
ir_module_from_te = IRModule({"main": func})
print(ir_module_from_te.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i0 in T.serial(8):
            with T.block("B"):
                i0_1 = T.axis.spatial(8, i0)
                T.reads(A[i0_1])
                T.writes(B[i0_1])
                B[i0_1] = A[i0_1] + T.float32(1)</code></pre><h1>构建并运行 IRModule</h1><p>可将 IRModule 构建为特定 target 后端的可运行模块。</p><pre><code class="bash">mod = tvm.build(ir_module, target="llvm")  # CPU 后端的模块
print(type(mod))</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.driver.build_module.OperatorModule'&gt;</code></pre><p>准备输入数组和输出数组,然后运行模块:</p><pre><code class="bash">a = tvm.nd.array(np.arange(8).astype("float32"))
b = tvm.nd.array(np.zeros((8,)).astype("float32"))
mod(a, b)
print(a)
print(b)</code></pre><p>输出结果:</p><pre><code class="bash">[0. 1. 2. 3. 4. 5. 6. 7.]
[1. 2. 3. 4. 5. 6. 7. 8.]</code></pre><h1>转换 IRModule</h1><p>IRModule 是程序优化的核心数据结构,可通过 Schedule 进行转换。schedule 包含多个 primitive 方法来交互地转换程序。每个 primitive 都以特定方式对程序进行转换,从而优化性能。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f1d1c2925359488883e2cb5e0a43802f.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>上图是优化张量程序的典型工作流程。首先,用 TVMScript 或张量表达式创建一个初始 IRModule,然后在这个初始 IRModule 上创建 schedule。接下来,使用一系列调度原语来提高性能。最后,我们可以将其降低并构建成一个可运行模块。</p><p>上面只演示了一个简单的转换。首先,在输入 ir_module 上创建 schedule:</p><pre><code class="bash">sch = tvm.tir.Schedule(ir_module)
print(type(sch))</code></pre><p>输出结果:</p><pre><code class="bash">&lt;class 'tvm.tir.schedule.schedule.Schedule'&gt;</code></pre><p>将嵌套循环展开成 3 个循环,并打印结果:</p><pre><code class="bash"># 通过名字获取 block
block_b = sch.get_block("B")
# 获取包围 block 的循环
(i,) = sch.get_loops(block_b)
# 展开嵌套循环
i_0, i_1, i_2 = sch.split(i, factors=[2, 2, 2])
print(sch.mod.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0, i_1, i_2 in T.grid(2, 2, 2):
            with T.block("B"):
                vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><p>还可对循环重新排序。例如,将循环 i_2 移到 i_1 之外:</p><pre><code class="bash">sch.reorder(i_0, i_2, i_1)
print(sch.mod.script())</code></pre><p>输出结果</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0, i_2, i_1 in T.grid(2, 2, 2):
            with T.block("B"):
                vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                T.reads(A[vi])
                T.writes(B[vi])
                B[vi] = A[vi] + T.float32(1)</code></pre><h1>转换为 GPU 程序</h1><p>要在 GPU 上部署模型必须进行线程绑定。幸运的是,也可以用原语来增量转换。</p><pre><code class="bash">sch.bind(i_0, "blockIdx.x")
sch.bind(i_2, "threadIdx.x")
print(sch.mod.script())</code></pre><p>输出结果:</p><pre><code class="bash"># from tvm.script import tir as T
@tvm.script.ir_module
class Module:
    @T.prim_func
    def main(A: T.Buffer[8, "float32"], B: T.Buffer[8, "float32"]) -&gt; None:
        # function attr dict
        T.func_attr({"global_symbol": "main", "tir.noalias": True})
        # body
        # with T.block("root")
        for i_0 in T.thread_binding(2, thread="blockIdx.x"):
            for i_2 in T.thread_binding(2, thread="threadIdx.x"):
                for i_1 in T.serial(2):
                    with T.block("B"):
                        vi = T.axis.spatial(8, i_0 * 4 + i_1 * 2 + i_2)
                        T.reads(A[vi])
                        T.writes(B[vi])
                        B[vi] = A[vi] + T.float32(1)</code></pre><p>绑定线程后,用 cuda 后端来构建 IRModule:</p><pre><code class="bash">ctx = tvm.cuda(0)
cuda_mod = tvm.build(sch.mod, target="cuda")
cuda_a = tvm.nd.array(np.arange(8).astype("float32"), ctx)
cuda_b = tvm.nd.array(np.zeros((8,)).astype("float32"), ctx)
cuda_mod(cuda_a, cuda_b)
print(cuda_a)
print(cuda_b)</code></pre><p>输出结果:</p><pre><code class="bash">[0. 1. 2. 3. 4. 5. 6. 7.]
[1. 2. 3. 4. 5. 6. 7. 8.]</code></pre><p><a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2F_downloads%2Feac4389b114db015e95cb3cdf8b86b83%2Fauto_scheduler_matmul_x86.py" target="blank">下载 Python 源代码</a><br><a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.apache.org%2Fdocs%2F_downloads%2F246d4b8509474fd9046e69f6cc9b7f87%2Fauto_scheduler_matmul_x86.ipynb" target="blank">下载 Jupyter Notebook</a></p><p>以上就是该文档的全部内容,查看更多 TVM 中文文档,请访问→<a href="https://aijishu.com/link?target=https%3A%2F%2Ftvm.hyper.ai%2F" target="blank">TVM 中文站</a></p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 03:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386987</guid>
            <link>https://aijishu.com/a/1060000000386987</link>
        </item>
        <item>
            <title><![CDATA[ECCV'22 Oral|VQFR|基于矢量量化字典与双解码器的人脸盲修复网络]]></title>
            <description><![CDATA[<h2>ECCV'22 Oral|VQFR|基于矢量量化字典与双解码器的人脸盲修复网络</h2><p>ECCV'22 Oral - VQFR: Blind Face Restoration with Vector-Quantized Dictionary and Parallel Decoder</p><p>解读:Owen718 论文链接:<a href="https://aijishu.com/link?target=https%3A%2F%2Farxiv.org%2Fpdf%2F2205.06803.pdf" target="blank">https://arxiv.org/pdf/2205.06803.pdf</a></p><h2>Background&amp;Motivation</h2><p>尽管生成式面部先验和结构化面部先验最近已经证明了可以生成高质量的人脸盲修复结果,稳定、可靠生成更细粒度的脸部细节仍然是一个具有挑战性的问题。这篇文章受最近基于字典的方法和基于矢量量化的方法启发,提出了一种 基于矢量量化(VQ-based)的人脸盲修复方法VQFR。VQFR从高质量的图像中抽取特征,构建low-level特征库从而恢复逼真的面部细节。</p><p>这篇工作重点关注如下两个问题:</p><ul><li>1.<strong>codebook中每个code对应的原图patch大小会极大影响人脸网络修复结果的质量与保真度权衡,而实际落地应用中,质量与保真度需要做到良好的平衡以获得最佳视觉效果。</strong></li><li>2.<strong>原图退化特征需要与来自codebook的高质量特征做融合,融合过程中,如何做到高质量特征不被退化特征所干扰而导致性能降低?</strong></li></ul><h2>详细介绍引入</h2><p>人脸恢复的目标是恢复低质量(LQ)面孔并纠正未知退化,例如噪声、模糊、下采样引起的退化等。在实际情况下,此任务变得更具挑战性,因为存在更复杂的退化、多样的面部姿势和表情。以前的作品通常利用特定于人脸的先验,包括几何先验、生成先验和参考先验。具体来说,几何先验通常包括面部标志、面部解析图和面部组件热图。它们可以为恢复准确的面部形状提供全局指导,但不能帮助生成逼真的细节。此外,几何先验是从退化图像中估计出来的,因此对于具有严重退化的输入变得不准确。这些特性促使研究人员寻找更好的先验。最近的人脸修复工作开始研究生成先验(GAN-Prior),并取了优异的性能。这些方法通常利用预先训练的人脸生成对抗网络(例如StyleGAN)的强大生成能力来生成逼真的纹理。这些方法通常将退化的图像投影回GAN潜在空间,然后使用预先训练的生成器解码高质量(HQ)人脸结果。尽管基于GAN先验的方法最初从整体上讲具有良好的恢复质量,但仍然无法生成细粒度的面部细节,特别是精细的头发和精致的面部组件。这是因为训练有素的GAN模型,其潜在空间仍然是不够完善的。基于参考的方法(Reference-based methods)—探索了高质量的指导面孔或面部组件字典来解决面部恢复问题。DFDNet是该类别中的代表方法,它不需要访问相同身份的面孔,就可以产生高质量的结果。它明确建立高质量的“纹理库”,用于几个面部组件,然后用字典中最近的高质量面部组件替换退化的面部组件。这种离散的替换操作可以直接弥合低质量面部部件与高质量部件之间的差距,因此具有提供良好面部细节的潜力。然而,DFDNet中的面部组件字典仍然有两个缺点。<strong>1)它使用预先训练的VGGFace网络进行离线生成,该网络是为识别任务优化的,明显并不适合恢复任务。2)它只关注几个面部组件(即眼睛、鼻子和嘴巴),但不包括其他重要区域,例如头发和皮肤。</strong></p><p>面部组件字典的局限性促使VQFR探索<strong>矢量量化(VQ)码本</strong>,这是一个为所有面部区域构建的字典。VQFR提出的人脸恢复方法VQFR既利用字典方法又利用GAN训练,但不需要任何几何或GAN先验。与面部组件字典相比,VQ码本可以提供更全面的低层特征库,而不局限于有限的面部组件。它也是通过面部重建任务以端到端的方式来学习的。此外,矢量量化的机制使其在不同的退化情况下更加稳健。尽管简单地应用VQ码本可以取得不错的效果,但要实现良好的结果也不容易。后续进一步介绍了两个特殊的网络设计以应对前文提到的两个problems,这将帮助VQFR在细节生成和身份保留方面都超越先前的方法。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPM" alt="image.png" title="image.png"></p><p>具体来说,为了生成逼真的细节,作者发现选择适当的压缩补丁大小至关重要,它表示codebook的一个code“由多大的补丁表示”。如图2所示,较大的patch可以带来更好的视觉质量,但是真实度却会下降。经过全面的调查,我们建议输入图像大小512x512时,32大小的patch size最合适。然而,这种选择只是在质量和真实度之间进行权衡。表情和身份也可能会因适当的压缩补丁大小而有很大的变化。一个直接的解决方案是将输入特征与不同的解码器层融合,这与GFP-GAN中的操作类似。尽管输入特征可以带来更多的真实度信息,但它们也会干扰从VQ代码本生成的逼真细节特征。这个问题引出了作者的第二个网络设计:并行解码器。具体而言,并行解码器结构包括纹理解码器和主解码器。VQFR的纹理解码器仅接收来自VQ代码本的潜在表示的信息,而主解码器将纹理解码器中的特征做变换以匹配退化输入的需保留的特征。<strong>为了避免高质量细节的损失并更好地匹配退化的面部,VQFR在主解码器中进一步采用了具有可变卷积的纹理变换模块。通过VQ codebook作为面部字典和并行解码器设计,VQFR可以实现更高质量的面部细节修复,同时尽可能得保留面部恢复的真实度。</strong></p><h2>VQFR方法概述</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPN" alt="image.png" title="image.png"></p><p>VQFR模型架构图。VQFR由一个编码器组成,用于映射退化的人脸 进入潜在和并行解码器以利用 HQ 代码和输入功能。编码器 和解码器由矢量量化模型和预训练的 HQ 码本,将编码的latent feature替换为 HQ 代码</p><p>Vector-Quantized Codebook最早在VQVAE中被引入,旨在学习离散的先验来编码图像。VQFR中的codebook部分与VQGAN中的基本一致。VQGAN 主要是采用了感知损失和对抗性损失以鼓励具有更好感知质量的重建。VQFR方法主要基于以下两个观察来提高修复性能:</p><ol><li><strong>通过采用合适的压缩补丁大小,可以用仅由高品质人脸训练的VQ码本来去除LQ人脸的退化。</strong></li><li><strong>在训练恢复任务时,在改进的细节纹理和保真度变化之间需要保持一个平衡。</strong></li></ol><p>针对观察现象一,VQFR采用合适的f大小来控制codebook效果,f取32最佳。针对观察现象二,VQFR提出利用双分支架构的decoder来逐渐将高质量纹理特征补充进待修复特征中,texture warp module利用可变形卷积很好的实现了这一目的。反观之前的相似工作,之前工作中单一分支decoder架构很难较好的融合低质特征和高质量特征,这导致了恢复性能不佳。</p><h2>实验</h2><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPO" alt="image.png" title="image.png"></p><p>VQFR在CelebA-Test数据集和LFW数据集上均取得了领先的性能结果,值得关注的是其PSNR/SSIM指标并不十分出色,但是FID、NIQE、LMD指标非常不错,视觉效果也体现了该方法的优越性。</p><h3>真实度与保真度的平衡</h3><p><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPP" alt="image.png" title="image.png"></p><p>可以看出VQFR取得了非常不错的真实度与保真度的平衡,实验效果很出色。</p><h2>总结</h2><p>本文提出的VQFR是一种性能非常不错的人脸盲修复方法,文章思路非常清晰,明确点出核心motivation和为解决的相关问题,最后的实验结果也非常精彩,很好的证明了方法的基本理论与出发点,更多细节建议大家参考原文。</p><blockquote>作者: owen      <br>文章来源:<a href="https://aijishu.com/link?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2FxGhgltsOTeO6-2VILnJsLQ" target="blank">GiantPandaCV</a></blockquote><p><strong>推荐阅读</strong></p><ul><li><a href="https://aijishu.com/a/1060000000386641">编译器优化那些事儿(4):归纳变量</a></li><li><a href="https://aijishu.com/a/1060000000386334">编译器优化那些事儿(3):Lazy Code Motion</a></li><li><a href="https://aijishu.com/a/1060000000386007">编译器优化那些事儿(2):常量传播</a></li></ul><blockquote>欢迎大家点赞留言,更多Arm技术文章动态请关注极术社区<a href="https://aijishu.com/blog/qianrushikezhan">嵌入式客栈</a>专栏欢迎添加极术小姐姐微信(id:aijishu20)加入技术交流群,请备注研究方向。</blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 02:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386978</guid>
            <link>https://aijishu.com/a/1060000000386978</link>
        </item>
        <item>
            <title><![CDATA[推荐系统[八]算法实践总结V0:腾讯音乐全民K歌推荐系统架构及粗排设计]]></title>
            <description><![CDATA[<h1>1.前言:召回排序流程策略算法简介</h1><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/44083e4c130841f894e36366a71f8d96.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>推荐可分为以下四个流程,分别是召回、粗排、精排以及重排:</p><ol><li>召回是源头,在某种意义上决定着整个推荐的天花板;</li><li>粗排是初筛,一般不会上复杂模型;</li><li>精排是整个推荐环节的重中之重,在特征和模型上都会做的比较复杂;</li><li>重排,一般是做打散或满足业务运营的特定强插需求,同样不会使用复杂模型;</li></ol><ul><li><p><strong>召回层</strong>:召回解决的是从海量候选item中召回千级别的item问题</p><ul><li>统计类,热度,LBS;</li><li>协同过滤类,UserCF、ItemCF;</li><li>U2T2I,如基于user tag召回;</li><li>I2I类,如Embedding(Word2Vec、FastText),GraphEmbedding(Node2Vec、DeepWalk、EGES);</li><li>U2I类,如DSSM、YouTube DNN、Sentence Bert;</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/b935ff75e3e84d7f88de39613bb02bad.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p></li><li><strong>模型类</strong>:模型类的模式是将用户和item分别映射到一个向量空间,然后用向量召回,这类有itemcf,usercf,embedding(word2vec),Graph embedding(node2vec等),DNN(如DSSM双塔召回,YouTubeDNN等),RNN(预测下一个点击的item得到用户emb和item emb);向量检索可以用Annoy(基于LSH),Faiss(基于矢量量化)。此外还见过用逻辑回归搞个预估模型,把权重大的交叉特征拿出来构建索引做召回</li><li><p><strong>排序策略</strong>,learning to rank 流程三大模式(pointwise、pairwise、listwise),主要是特征工程和CTR模型预估;</p><ul><li><p><strong>粗排层</strong>:本质上跟精排类似,只是特征和模型复杂度上会精简,此外也有将精排模型通过蒸馏得到简化版模型来做粗排</p><ul><li>常见的特征挖掘(user、item、context,以及相互交叉);</li></ul></li><li><p><strong>精排层</strong>:精排解决的是从千级别item到几十这个级别的问题</p><ul><li><strong>CTR预估</strong>:lr,gbdt,fm及其变种(fm是一个工程团队不太强又对算法精度有一定要求时比较好的选择),widedeep,deepfm,NCF各种交叉,DIN,BERT,RNN</li><li><strong>多目标</strong>:MOE,MMOE,MTL(多任务学习)</li><li><strong>打分公式融合</strong>: 随机搜索,CEM(性价比比较高的方法),在线贝叶斯优化(高斯过程),带模型CEM,强化学习等</li></ul></li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c764dfd7b65048f3a2ab2b97214135a3.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p></li><li><strong>重排层</strong>:重排层解决的是展示列表总体最优,模型有 MMR,DPP,RNN系列(参考阿里的globalrerank系列)</li><li><p><strong>展示层</strong>:</p><ul><li><strong>推荐理由</strong>:统计规则、行为规则、抽取式(一般从评论和内容中抽取)、生成式;排序可以用汤普森采样(简单有效),融合到精排模型排等等</li><li><strong>首图优选</strong>:CNN抽特征,汤普森采样</li></ul></li><li><strong>探索与利用</strong>:随机策略(简单有效),汤普森采样,bandit,强化学习(Q-Learning、DQN)等</li><li><strong>产品层</strong>:交互式推荐、分tab、多种类型物料融合</li></ul><h1>2.业务背景</h1><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/979ec768bf184537b6cdf2a4696229c5.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>全民K歌涉及多样化的推荐场景,涵盖内容、直播、歌房、用户等多种形态。</p><p>具体的推荐功能如上图所示,主要包括以下几类:</p><p>① 基于内容的推荐,包括优质UGC推荐、关注流推荐、同城社交推荐等功能模块。</p><ul><li>优质UGC推荐,将平台原生原创的优质音视频内容进行推荐</li><li>关注流推荐,对关注的内容进行混排</li><li>同城社交推荐,基于同城的社交进行推荐</li></ul><p>② 除了内容推荐外,我们也会负责一些其他类型的推荐,包括直播推荐、点歌推荐、歌房推荐和点评推荐,都是在K歌生态下独有的推荐。</p><h1>3.推荐系统架构及挑战</h1><p>推荐系统主要分为四个部分,包括召回层、粗排层、精排层及重排层。</p><h2>3.1召回层</h2><p>召回层的作用主要是从海量的item中筛选小量级的用户可能感兴趣的内容。在这个模块中最重要、大家了解最多的肯定就是召回模块本身。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/28d6ce28d0ad475ca1526f0714be96e9.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>一般来说,我们线上的召回方法会分为索引类的召回、泛社交的召回以及模型的召回。</p><ul><li>索引类的召回:主要根据画像的结果做精准的ID类召回,比如对用户感兴趣的歌曲进行召回,以及用户感兴趣的创作者进行召回。</li><li>泛社交的召回:主要基于用户在站内丰富的社交关系,比如用户可能会关注一些其他的用户,也可能加入一些家族,我们会根据这些社团的发现结果做泛化召回。</li><li>模型的召回:基于模型的召回的方法比较多,在后面会展开介绍。</li></ul><p>除了召回模块之外,我们在召回层认为另外一个比较重要的是内容的比例筛选,因为我们整体的内容发表量比较大,每天可能有500万的作品在平台内发表,如何从中筛选出合适的内容,需要基于音视频的理解,以及基于我们自己的流量策略来综合发现。</p><h2>3.2 粗排层</h2><p>粗排层到精排层相当于是一个承上启下的作用,它会把我们召回到的一些万量级的作品进一步筛选到千量级,既要考虑打分的性能问题,又要考虑排序粗排精准度的问题。一般来说,粗排模型会用一些模型蒸馏的方法,包括<strong>特征蒸馏或者基于模型本身的结构蒸馏</strong>,以及把这些不同的蒸馏方法组合起来等等。在粗排层,除了做粗排的打分外,我们还会重点做生态的控制,特别在一些内容推荐场景或者直播推荐场景中,我们会注重这里面的内容生态,包括时效性,内容的调性,多样性等等。</p><h2>3.3 精排层</h2><p>粗排层之后就来到了精排层,精排层主要根据千量级的作品进一步的进行精排打分来筛选到百量级的作品。在精排层,我们主要注意以下几方面:</p><ul><li>一个就是精排模型本身,我们早期也采用了类似LR的线性模型和LightGBM这样的树模型,之后随着深度模型的技术发展,我们所有的场景都切换到了深度模型,并且随着深度网络的设计复杂度,以及样本规模的逐步增加,让早期基于TF训练的一些深度模型引擎,在训练的速度以及对模型大小规模的限制,已经对我们产生了影响。所以我们现在已经过渡到基于参数服务器框架下,训练深度模型。</li><li>在精排前,除了模型怎么训练构造外,另外两个比较重要的是特征和样本的构造,以及在这个场景下的多目标设计。特别是多目标的问题,可能还涉及到具体的网络结构如何做,以及最后的结果如何融合。</li></ul><ol start="4"><li>重排层</li></ol><p>从精排层排序出百量级的作品后,就会进入到重排层。重排层会基于业务规则进行进一步的干预,比如同一首歌曲的视频不能连续出现,同一个创作者的视频不能连续出现等等。除了基于规则性的限制外,我们也会考虑使用模型化的方法做多样性的打散,并且在第4部分,我们也会具体介绍DPP算法的原理和思想。除了模型方法之外,我们也在考虑通过list wise的方法做内容的重排。</p><h1>4.粗排模块算法设计</h1><h2>4.1 粗排模块定位和方案路线</h2><p>粗排模型和精排模型不同,<strong>它可能既需要解决模型预测的准确性,又需要解决模型预测的效率</strong>。接下来,为大家介绍我们整个推荐系统如何在线上真实运转。</p><p>粗排模块主要包含两部分:</p><ul><li>第一部分是粗排的排序部分,这一部分主要就是为了解决一个大规模item的预排序问题。</li><li>第二个部分是多样性控制部分,作为一个UGC平台,我们需要考量内容在整个内容生态中的分发状况,以及均衡的考量生产者跟消费者之间的关系。我们是通过多样性调节算法来间接实现这个目的的。</li></ul><p>让我们再回顾下前面所提到的整个召回系统架构,我们可以看到它其实是一个典型的节点架构,从内容发现到召回,到粗排到精排,然后重排,最后把合适的内容推荐给用户。由于我们是一个比较大的UGC生产平台,从一个UGC平台的角度来考虑,我们倾向于分发较为新的作品,因为新的作品的分发会为那些活跃的创作者带来一定的流量激励,使得生产端跟消费端产生联动,促进了一种正向的循环。<br><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/a482dc35c51b4eb888e3ee59e8754550.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>我们以三个月内的站内发布作品为例,三个月内的站内发布作品大概会到十的九次方量级,然后我们通过一些内容挖掘跟优质内容发现的方式,从中找到更为优质的一部分内容,这部分内容仍然有十的七次方量级,相当于从百万量级的作品库做兴趣的召回。这是一个非常大的候选集场景,从优质内容的发现到召回,是整个UGC平台和推荐系统的连接,背后承载着我们对整个UGC的分发、内容生态的理解。这一部分我们会在第三个环节去做进一步详细的介绍。召回可以看到有十的七次方的候选集召回,通常完成召回过程之后仍然有十的五次方候选集,而精排通常只能去处理一个千级别的规模,所以我们看到这中间存在一个比较大的漏斗,很多时候会成为我们在效果或者一些收益上的瓶颈。这时,粗排模块的重要性就体现出来了。粗排模块的一个重要的作用就是防止召回到精排之间的漏斗过大,导致过多的信息损失。</p><p>大家可能比较了解的是,召回跟精排召回更像是一个集合,选择的过程更侧重于选择效率最高的方法,至于topk中item之间的先后顺序,其实不是最关心的因素;而精排环节相对来说它更强调次序,也就是说item A跟item B的先后顺序是非常敏感和关键的。</p><p>粗排夹在召回跟精排之间,它的定位是什么?相比于召回,粗排更强调排序性,也就是更强调topk内部的排序关系;相对于精排,粗排更强调性能,因为精排通常有非常复杂的网络结构,非常大的参数量,这也意味着它在实际应用的过程中比较难去处理一个较大规模量级的候选集的打分,这时粗排就必须要解决这个问题,所以它在性能上会相较于精排有更多的要求。现在主流的粗排方案有两条路线,这两条路线是基于两个出发点来思考的:</p><ul><li>第一条路线是把粗排当成是召回的一种延伸,它的技术选型会像是一种集合,<strong>选择的方案和目标是选出效率最高的子集</strong>。常用的方式,简单的可以通过实时的serving或者一些实时的指标对召回排序的结果做一个选择。总体来说,这条技术路线最大的优点是算力消耗非常小、性能非常好,但是它的缺点是本身的表达能力是有限的,可以明显预估到它的天花板。</li><li>第二条路线是从精排的角度,把粗排当成是精排的迁移或压缩,也就是说这是一条排序的路线,<strong>它的建模目标是预估值</strong>。这种方法的好处是它的表达能力很强,因为通常会用到一些比较复杂的网络结构,而且它跟精排的联动性是更好的,可以让粗排跟精排的目标保持某种程度上的一致性。同时,它的缺点也凸显出来了,就是我们用到了复杂的方法,算力的消耗一定也会相应的提升。因此,<strong>需要着重解决的是如何在有限的算力下尽可能地突破表达能力上限</strong>。在这种路线下,我们通常会在架构选择上选择双塔结构模型。</li></ul><h2>4.2 粗排双塔模型实践</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f5af219903eb4f7ba4be13edd86ecbaa.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><blockquote>我们通过把user和item的feature进行结构解耦与分开建模,然后完成整个架构的设计,在模型训练完毕之后,我们会通过user serving实时的产出user embedding,再通过索引服务把该用户所有的候选集合的ID给取出来,最后在userembedding跟item embedding之间做內积的运算,得到一个粗排的预估值,作为整个粗排阶段的排序依据。</blockquote><p><strong>这么做的优势是user/item 结构是解耦的,内积计算的算力消耗小。</strong></p><p>同时,它的缺点也非常的明显:</p><ul><li>第一个是它在特征表达上是缺失的,因为user跟item解耦之后,很难使用一些交叉特征,一旦用了交叉特征,有多少item就得进行多少次预估,这违背了我们使用双塔模型的初衷。</li><li>第二个是它在结构上也是有缺陷的,我们回忆一下上面这幅框架图,可以看到user跟item的交互非常少,这会限制它的表达能力的上限。</li></ul><p>如果我们选择了这种技术方案,我们可以保障它的性能,但是我们需要进一步的考虑如何避免这种简易的结构所带来的效果上的损失。在这种情况下,我们通常会使用一些模型蒸馏的方式。</p><p>模型蒸馏有两个关键词,第一个是它本质上是一种迁移学习,也就是transfer learning,第二个是transfer的方式是通过所谓的label,区别于我们平时理解的样本label离散值,变为了0到1之间的一个连续值。常见的蒸馏模型架构,会有涉及到两个模型,第一个模型叫做教师模型,叫做teacher,第二个模型是学生模型,叫做student。这两个模型的总体思路是teacher模型是一个非常大、非常复杂、学习到的东西非常多的模型,teacher模型会把学习到的知识传导给student模型,受限于某些原因,该模型没有办法做得很复杂,或者它的规模必须限制在一定范围内的子模型。</p><p>具体流程如下:</p><ol><li>准备训练样本,对teacher模型预训练,即得到了teacher模型;</li><li>把teacher模型最后一层或倒数第二层的输出结果,作为传递给student模型的信息,这部分通常是logits或softmax的形式,也叫做soft labels;</li><li>把soft labels传导到student模型,作为模型loss的一部分,因为student模型除了要拟合teacher模型传递的信息,也要去拟合样本真实的分布。</li></ol><p><strong>针对上述流程里涉及到了几个概念,有如下的进一步解释:</strong></p><ul><li><strong>关于logits</strong>:<strong>它是teacher模型层层映射后的一个抽象度很高且信息浓度很大的结果,是整个知识传递的媒介</strong>。在logits后,<strong>通常会接一个softmax,但是softmax会放大logits的两极差异,造成细节损失,而这些细节恰恰是帮助student模型更好学习的关键</strong>。为了克服以上问题,我们选用了改进的softmax,即softmax with temperature</li></ul><p>$q_i=\frac{\exp \left(z_i / T\right)}{\sum_j \exp \left(z_j / T\right)}$</p><p>这里,引入一个超参数T控制整个softmax分布的陡峭或平滑程度,间接控制蒸馏的强度。通常,T要设置成多少没有一个定论,与实际场景相关,依赖相应场景下的一些实验设计。</p><ul><li>关<strong>于loss</strong>:预训练好teacher模型后,转而关注student模型,它的最小化loss由两部分构成,<strong>一部分是尽可能拟合teacher模型的输出结果,另一部分是尽可能拟合真实样本</strong>。<strong>由于student模型的表达能力有限</strong>,直接用student模型拟合真实样本可能学不好或者学偏;<strong>teacher模型传递过来的信息对student模型做了约束和纠正,指导student模型的优化方向,进而加强了student模型的学习能力。</strong></li></ul><p><strong>整个模型蒸馏的收益表现如下:</strong></p><p>引入<strong>soft labels</strong>的概念,不再是原本的非零即一状况,<strong>需要考虑正样本有多正和负样本有多负</strong>。这看起来<em>类似把分类问题转换成回归问题,但实质并不是。如果构建样本时,用回归的方式构建,通常会基于作品的完播率或规则组合等,人工敲定样本的回归值,这种方式过于主观,没有一个非常合理或可矫正的指标进行后续比对</em>;<strong>而模型蒸馏的soft labels是基于teacher 模型,即由teacher 模型对真实样本进行充分训练后给出,包含更多的隐含信息且不受人为主观因素影响。</strong></p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/795f0ad3a0eb44a2b570e9dfa4910fd0.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>具体的,来看看我们如何做粗排模块的蒸馏,主要是分为两个大的方向:</p><ul><li><strong>模型蒸馏</strong>,主要适用于模型不同但特征相同的情况,比如,包含多个场景的框架里,某些场景对性能有要求;由于有一些额外的外部限制,使某场景无法用很复杂参数量非常大的模型,可以用一个子模型使用全部特征。此时,模型蒸馏主要是弥补子模型缺少复杂结构或交互结构导致的部分收益损失,本质上是一种模型压缩方案。</li><li><strong>特征蒸馏</strong>,主要适用于模型相同但特征不同的情况,比如,在某些场景,无法使用全量特征 ( 如交叉特征 ) 或部分特征必须是剪裁过的,即特征没被完全利用,存在一部分损失。这时,通过一个更大的teacher模型学习全量特征,再把学到的知识迁移到子模型,即弥补了上述的部分特征损失。</li></ul><p>基于以上描述可知,粗排模块可以通过蒸馏的方式,补足双塔模型在结构和特征上的缺陷。接下来的问题就是如何找到一个合适的teacher模型?精排模型通常是一个被充分训练的、参数量很大、表达能力很强的模型,如果通过蒸馏精排模型获取粗排模型,那么目标的一致性和学习能力的上限都符合我们预期的。</p><ul><li>teacher模型是精排模型,该模型使用全量的特征,包括三大类,即user侧特征、item侧特征及它们的交叉特征;曲线框里是一些复杂的拓扑结构;最后的softmax with temperature就是整个精排模型的输出内容,后续会给到粗排模型进行蒸馏。</li><li>中间的粗排模型,user tower只用user features,item tower只用item features,即整体上看,模型未使用交叉特征。在user tower和item tower交互后,加上精排模型传递过来的logits信息,共同的构成了粗排模型的优化目标。整个粗排模型的优化目标,同时对真实样本和teacher信息进行了拟合。</li><li><p>右侧展示的是训练完粗排模型后,在线上产出user serving,通过user serving产出user embedding,再与item embedding做内积运算,完成整个排序的过程。上述流程即实现了粗排和精排的联动过程,并且训练完粗排模型就可以进行一个非常高效的serving,进行粗排排序。</p><h2>4.3. 线上的粗排双塔模型</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/650b567c1a6e4efc95b4a7179cc99d40.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>实践中,粗排模型训练时,依赖的精排输出结果来自上报精排日志。如果在离线重新对样本进行预估再输出,其实是对线下资源的浪费,所以通常在线上精排预估时,就把一些结果作为日志进行上报。粗排模型异步训练,产出模型提供给Serving。</p></li></ul><p>Serving环节主要包括异步Serving和User Serving两部分,具体功能如下:</p><ul><li><strong>异步Serving</strong>,主要通过刷库Item Serving捕获所有的item embedding,以异步的方式反复刷库。大家经常会问的一个问题:如果模型更新了,item embedding有的是新的,有的是旧的,版本不一致怎么办?如果更新周期比较短,item embedding的分布不会发生较明显的偏移,即相邻版本比较接近,这间接保障了一致性,不需要版本是强一致性的,只要更新周期比较短就可以。</li><li><strong>User Serving</strong>,当用户请求推荐引擎后,获取该用户的user features,然后请求User Serving产出user embedding;同时,会拿到该用户的所有召回item集合,基于刷库结果产出的索引服务,取到所有的item embedding。由此可见,User Serving的最大优势是可以做实时计算且只需计算一次,效率非常高。并且,双塔粗排Serving阶段是做内积运算,这种高效的计算方式也使它更适合大规模的预排序场景。</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/74ad5786e33b4e38986c4697b77a5503.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>整个粗排模块上线后,我们关注的两类指标:互动类指标和播放类指标,都有非常明显的正向提升,具体的指标提升幅度可以参考上图的在线实验结果。</p><p>一般,粗排模块的表现和实际场景有较大的相关性:在候选集非常大的推荐场景下,粗排到精排间的漏斗有好几个量级,这时粗排模块会带来非常显著的收益;在候选集比较小的推荐场景下,从召回到精排间的漏斗不是很大,这时粗排的收益可能就比较有限。</p><h2>4.4 进一步优化</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/757af659b60344ea83de0fce27ee6a9a.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><ol><li>首先,上述粗排蒸馏过程本质上是pointwise,但通过上报精排日志可以拿到精排模型给出的完整再推荐列表,用pairwise学习精排排出来的序,可以进一步逼近精排结果,能更多的提取精排传递出的信息。</li><li>其次,前面虽然不断地用teacher模型和student模型描述整个过程,但实际效果上student模型不一定低于teacher模型。换一个角度,student模型其实是基于teacher模型做进一步训练,所以student模型的表征能力有可能超过teacher模型。事实上,如何让student模型通过反复的蒸馏,效果超过teacher模型,在模型蒸馏领域也有许多相关方法。</li><li>最后,粗排到底是召回的延伸,还是精排的压缩跟前置?虽然召回和精排都是一个检索的过程,但二者实际侧重点还有一些不同,比如,召回在多样性上有更多的考量,精排更强调排序次序的精准性,而粗排处于这两个环节之间,如何利用粗排模块更好地平衡召回和精排?通常而言,会考虑设计多样性调节算法解决这一问题。</li></ol><h1>5.多样性调节算法设计</h1><h2>5.1 推荐多样性的意义</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/1aa9fd0dfc36482e80aae6c92ab2e5a8.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>样性的概念在推荐系统里常被提到,在不同视角下,推荐多样性对应着不同的问题。</p><ul><li>在系统角度下,<strong>多样性是一种popularity bias,即流行度的偏置</strong>。流量在UGC作品上的分布,体现了系统层面的多样性:一个多样性弱的系统,更像是中心化分发的,只分发非常头部、非常类似的一部分作品;而一个多样性强的系统,则是一个去中心化分发的,<strong>会更多地兼顾中长尾内容流量的供给</strong>。实际上,在推荐系统中普遍会遇到如下问题:如果没有对推荐系统做额外的干预和纠偏,不可避免地会使推荐系统往多样性弱的方向发展。从数据层面解释,有丰富数据的那部分内容会在推荐过程被反复加强,使整个推荐循环链路越缩越小,<strong>马太效应越来越严重</strong>。对于一个ugc平台,需要考量生产者或创作者的利益,而这种聚集在部分创作者身上的马太效应是我们不愿意看到的。</li><li>在用户角度下,<strong>多样性就是Explore&amp;Exploit问题</strong>,对用户做兴趣的探索与聚焦。如果多样性弱,推荐的item同质化严重,都很像,那么推荐系统可能没办法发现用户的真实兴趣,因为系统可能都没给用户推荐过这类item;如果多样性强,那么用户的推荐流里的内容会很不一样,坏处可能是用户在持续消费过程的兴趣聚焦程度不同,比如用户看了五个item,明明对其中某一两个item更感兴趣,但和这一两个item相似的item的后续推送密度却跟不上,这对用户体验是有损的。如果不做额外的优化,用户角度的多样性会越来越小,因为通常选用的pointwise模型会导致同质化的现象,比如说用户喜欢的item是乐器类的,则pointwise在每一个单点上的预估都觉得乐器是最好的,最后可能连续给用户推了5个乐器,在单点上收益最高不代表用户对整个推荐结果 ( 5~10个item ) 的满意度是最高的,所以这里也需要做多样性控制,提升用户的满意度。</li></ul><h2>5.2 多样性控制的方案路线</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/6dca1c96e53d4bc384d56d050af2681d.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在具体实现上,多样性有三个主流的技术方案:<strong>规则打散、embedding打散和DPP</strong>,下面会详细介绍:</p><ul><li>基于规则打散,比如从item里抽象出发布作者、标签、伴奏等特征,基于这些特征去做一个session内的频控。这种方法的好处是易实现,缺点也非常明显,该方案本质上是进行枚举加排列组合,扩展性非常差,永远没办法枚举所有可能的情况,枚举出来的情况不一定能真实表征两个item间的相似或差异程度有多大。</li><li>基于embedding打散,一个连续值的方案。好处是它可以基于embedding对候选集做离散性的评估,相当于此时可以用向量化的方式表达item。缺点在于它虽然可以衡量离散性或多样性,但难以衡量相关性,从而无法实现联合的收益评估。事实上,多样性只是我们的一个目标,相关性也很重要,如果推了很多不同的东西,但和用户不怎么相关,可能会适得其反。</li><li>DPP概率模型,本质上是一种集合选择技术,选择出一个子集使得多样性和相关性联合建模的收益最大。直观理解,先基于多样性和相关性构建一个矩阵,该矩阵行列式的物理含义是矩阵中各向量张成的平行多面体体积的平方,这样就把问题转换成了一种可度量的方式:要想同时最大化多样性和相关性,只需要最大化平行多面体的体积。</li></ul><h2>5.3 DPP 技术细节</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/ca152d8173ad469fb201400664ab3ab3.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>DPP算法的具体实现比较复杂,这里主要介绍两个关键点:</p><p>①基于多样性和相关性构建矩阵L,该矩阵的行列式等价于最终要度量的目标。如何去定义相关性和多样性?</p><ul><li>多样性(diversity)是指两个item相似不相似,如果很相似就不多样。利用两个item各自的item embedding计算内积,即表示两个item的相似度。</li><li>相关性(relativity)是一个候选item与当前用户的匹配程度。在不同环节的实现有差异:在粗排层的DPP,一般是基于user embedding和item embedding计算内积。在精排层的DPP,需要精排的CTR或CVR预估结果,因为这些预估结果反映了当前用户对候选item的喜爱程度。</li></ul><p>基于上述定义的相关性和多样性就可以构建矩阵L:用户与itemi的相关性 ( 偏好程度 )、用户与itemj的相关性 ( 偏好程度 )、itemi与itemj的多样性三者乘积。通过最大化矩阵L,就可以实现相关性和多样性的联合度量。</p><p>②如何优化求矩阵L行列式的复杂度,该行列式的原始计算复杂度是三阶,线上难以支撑这样的运算性能消耗,可以通过贪婪算法把计算复杂度进一步降低至一阶。</p><ul><li>先进行矩阵分解,基于分解的结果将计算复杂度降低到二阶。</li><li>用增量的方式更新参数,绕过求解线性方程组的部分,将复杂度进一步降低到一阶。</li></ul><p>由此,行列式的求解过程由三阶降低到一阶,满足了线上的性能,上图最下方给出的paper就是相关方向的论述。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/343326d38df34378ae0a9b33fd5f3034.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在线上做多样性的相关实验,我们较关注的系统和数据两部分,都有明显收益:</p><ul><li>系统收益,作为一个ugc平台,会考量推荐系统分发覆盖了多少创作者、覆盖了多少作品以及内容的时效性,从上图右侧三条曲线可见,在加入多样性的控制后,三个指标都有稳步的提升。</li><li>数据收益,有关播放时长、关注渗透、点赞渗透相关的指标都有1~2个点的提升,这也体现了多样性是有必要的,因为它相当于对pointwise进行了简单的listwise化,形象化阐述就是,用户浏览多个session时,多样性调节避免了同质化内容扎堆。</li></ul><h2>5.4  DPP优化</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/6fbb98a7f2a2477d84c1dade671e47f9.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>针对上述基于多样性和相关性构建矩阵L的过程,有两方面可以做进一步优化:</p><ul><li>多样性本质上是定义什么样的item是相似的,用相似矩阵刻画这种相似关系。在我们K歌平台,会做一些内容的混排,比如音频跟视频的混排,如果在原始的item embedding构建出来的item similarity matrix基础上,加入一些预设的先验信息,判断什么样的item是更相似的,比如音频跟音频间更相似,视频跟视频间更相似,那么它最后的度量目标就加入了对作品类型的考量,这就间接实现了内容的混排。</li><li>相关性本质上是定义什么样的item更匹配当前用户,之前都是从消费者的角度去考量用户更喜欢什么样的item,而我们作为一个ugc平台,很多时候也要考量什么样的item更适合被分发,比如某item是不是更有平台的画风,更符合我们对内容分发的理解,这时,就是从平台系统或者生产者的角度去理解什么样的item更应该被优先推荐。如果已知一部分item更需要被优先推荐,在构建用户跟item间的相关性分时,可以对relativity score加调节权重进行干预,实现流量分配。比如,如果要使乐器类item比其他item有更高的权重,这时,可以调高乐器类item和用户的匹配权重。</li></ul><p>综上可知,DPP不只是一个多样性或相关性的度量,它本身是一种调控方式,具体调控的量和业务场景相关,具有非常大的挖掘空间。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 02:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386964</guid>
            <link>https://aijishu.com/a/1060000000386964</link>
        </item>
        <item>
            <title><![CDATA[反其道而行,大学教授鼓励学生用 ChatGPT 写论文]]></title>
            <description><![CDATA[<p>新 AI 工具 ChatGPT 的到来,正在教育圈呈现出冰火两重天的态势,教授们几家欢喜几家愁。</p><p>这不近日,来自宾夕法尼亚大学沃顿商学院的一位专门研究创业与创新的资深教授 Ethan Mollick 发表了一篇长文呼吁,让学生拥抱 ChatGPT,也可以使用 ChatGPT 写论文,因为只有这样,才能让学生们经过事实核查从而能够很快理解 AI 的准确性和偏见问题。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPr" alt="1.png" title="1.png"></p><h2>反其道而行:使用 ChatGPT,大学生快上车!</h2><p>作为大学教授,这一不走寻常路的举措,引发了不少人的关注。</p><p>毕竟此前据调查显示,美国 89% 的大学生在用 ChatGPT 做作业。当时的这个结果让很多教育界的高校老师都感到头疼,来自弗曼大学哲学助理教授 Darren Hick 也曾发文斥责,「ChatGPT 都成学生的作弊神器了,这让我感到极度恐惧。」</p><p>为了让学生能够潜下心踏踏实实地学习,国内外多所学校发布相应应对措施,如美国纽约市教育部宣布,纽约市的学生和教师,无法再在教育部设备或互联网上访问 ChatGPT;斯坦福研究人员推出了 DetectGPT,便于检测出 AI 生成文本;香港大学向师生发出内部邮件,明确禁止在港大所有课堂、作业和评估中使用 ChatGPT 或其他 AI 工具......</p><p>可以说,ChatGPT 诞生的近三个月间,尤其是老师群体反对的声音颇为强烈。Ethan Mollick 如今的做法,似乎在反其道而行。</p><p>不过,在 Ethan Mollick 教授看来,倘若一味地禁止,只会适得其反。当然,也不能完全地放任学生使用 AI 工具而不顾,得有教学策略。</p><p>他表示,过去一学期已经在课堂上完全接受 AI 的存在,也会要求学生以多种方式使用 AI 工具。通过实践,Ethan Mollick 给出直观的总结:太好用了!而且我还已经学到了一些我认为值得传承的早期课程。效果非常成功,但也有一些教训要吸取。</p><h2>学术中使用 ChatGPT 的前提条件</h2><p>首先,在大的背景上,Ethan Mollick 教授要求在三个独立的面向本科和硕士级别的创业和创新课程中以稍微不同的方式使用 AI。具体模式如下:</p><ol><li>第一门课程整体建立在广泛使用人工智能的基础上。其要求学生使用人工智能来帮助他们产生想法、制作书面材料、帮助创建应用程序、生成图像等等。</li><li>第二门课程中的作业要求学生使用 AI。</li><li>第三门课程中,Ethan Mollick 向学生介绍了 AI 工具并提出了使用建议,但没有具体的 AI 作业。<br>在三种不同的课程中,Ethan Mollick 使用了相同的 AI 政策:</li></ol><p>我希望你在这门课上使用 AI(至少是 ChatGPT 和图像生成工具)。学习使用人工智能是一项新兴的技能,我在 Canvas 中提供关于如何使用它们的教程。我很乐意在办公时间或课后与学生见面并帮助他们使用这些工具。</p><p>请注意使用 ChatGPT 的限制:</p><ul><li>如果你提供最少的描述提示,你会得到低质量的结果。你需要改进你的提示,以获得良好的结果。这一点非常有用。</li><li>不要相信它说的任何东西。如果它给你一个数字或事实,除非你知道答案或可以通过其他来源查询验证,否则就一定要认为它是错误的。你将对该工具提供的任何错误或遗漏负责。它对你理解的主题效果最好。</li><li>Al 是一个工具,但你需要承认它的使用。请在任何使用人工智能工具的作业的结尾处附上一段话,解释你使用人工智能的目的以及你使用什么提示来获得结果。如果不这样做,就违反了学术诚信政策。</li><li>这个工具在用的时候要深思熟虑。如果它不适合相关的案例或情况,就不要使用它。<br><img referrerpolicy="no-referrer" src="https://aijishu.com/img/bVbMPs" alt="2.png" title="2.png"></li></ul><h2>没有培训,每个人都用错了 AI</h2><p>Ethan Mollick 表示,“我一直听到老师抱怨,说他们看到很多写得不好的人工智能文章,尽管 ChatGPT 其实能够写得相当好。我想我知道为什么,几乎每个人在使用人工智能方面的最初尝试都很糟糕。”</p><p>因此,他为了找到原因,在布置的一次作业中,要求学生用 ChatGPT "作弊"。学生们需要写一篇 5 段话的文章,题目与大家在课堂上学到的课程有关(如团队动力、选择领导者、行动后的回顾反思、沟通愿景,随大家自由选择)。前提条件是要让 AI 来写,同时这篇文章里面至少要插入 1 张应景的图片,且学生必须至少提供 5 个描述,而且他们必须在最后写一份关于人工智能如何做的反思稿件。</p><p>经过测试,Ethan Mollick 发现几乎每个学生提供的第一个描述提示都是非常直接了当的,他们往往会直接复制作业的要求,往 ChatGPT 的对话窗口粘贴,等待结果的自动生成,然后再将结果复制粘贴到新文本中,提交给老师审阅,由此出现了大多数老师疯狂吐槽各种论文的场景。</p><p>不过,在 Ethan Mollick 布置的作业中,其要求学生使用多个提示,这迫使学生不断思考如何提高 AI 产出内容的质量。在这一点上,学生们经过多轮的描述,往往会朝着下面三个方向走去:</p><p><strong>方法 1 :细微地变化,让 AI 完成作业</strong></p><ol><li>生成一篇关于选择领导者的 5 段话文章</li><li>生成一篇关于团队如何选择领导者的 5 段话文章</li><li>生成一篇关于团队如何选择领导者以及团队流程如何运作的 5 段话文章</li><li>生成一篇关于如何通过团队、团队流程和领导能力选择领导者的 5 段话文章</li><li>生成一篇关于如何通过团队、团队流程和领导能力选择领导者的 5 段话文章,250 字。</li></ol><p><strong>方法 2:增加一些限制和专业知识</strong></p><ol><li>生成一篇关于选择领导者的 5 段话文章</li><li>生成一篇关于选择领导者的 5 段话文章,内容包括:能说会道的能力、领导者地位影响和资历</li><li>生成一篇关于选择领导者的 5 段话文章,内容包括:能说会道的能力、领导者地位影响和资历。解释谁能说会道,谁就能成为领导者。</li><li>生成一篇关于选择领导者的 5 段话文章,内容包括:能说会道的能力、领导者地位影响和资历。解释谁能说会道,谁就能成为领导者。并举例说明。使用生动的语言,并从一个回国攻读 MBA 的管理顾问的角度出发。为 MBA 课程的教授写一篇关于团队战略和企业家精神的文章。</li><li>生成一篇关于选择领导者的 5 段话文章,内容包括:能说会道的能力、领导者地位影响和资历。解释谁能说会道,谁就能成为领导者。考虑每种能力的挑战和优势。举例说明。使用主动时态和讲故事的方式。使用生动的语言,并从一个回国攻读 MBA 的管理顾问的角度出发。为 MBA 课程的教授写一篇关于团队战略和企业家精神的文章。</li></ol><p><strong>方法 3:共同编辑</strong></p><ol><li>生成一篇关于选择领导者的 5 段话文章</li><li>那很好,但第三段不对。能说会道是指谁说得最多,谁就能成为领导者。纠正这一点,并增加更多关于如何使用这种能力的细节。在第 2 段中增加一个示例</li><li>第 2 段的示例不对,总统选举是每 4 年举行一次。让最后一段的语气更有趣。不要用 "总而言之 "这个短语</li><li>给我三个可以用在第 4 段中的示例,并确保它们具有更多的故事性和更生动的语言。不要使用仅以男性为特征的例子。</li><li>把这一段加回到故事中去,把第二段换成关于个人领导风格的一段。修正最后一段,使文字在以充满希望的感情上结束。</li></ol><p>毋庸置疑,第一种只有细微的修改,让 ChatGPT 生成的内容显得非常平庸,还很空洞。</p><p>第二种方法明显要好得多,但结果却不可控,因为学生要根据整个提示进行反复试验。这使得对一篇好文章进行微调变得很困难,使用这种方法的学生经常反馈称,他们觉得自己对 AI 的输出没有太多的控制权。</p><p>到目前为止,最好的方法便是第三种——采取“AI+人工”共同编辑的方法,这往往会带来一篇令人影响深刻的论文。不过,这种方法需要学生非常仔细地关注 AI 的输出,这也使得它对学生的学习非常有用。</p><p>因此,Ethan Mollick 建议,如果高校的老师们打算将 AI 引入进自己的课堂,那么第三种方式最为推荐。</p><h2>上至 CEO,下至程序员,ChatGPT 无处不在</h2><p>现如今,无论是否接受,AI 已经渗透到学术、产业、研究等领域。据《华尔街日报》最新报道,上至 CEO,下至程序员,从传统互联网公司 Google、微软、Netflix 再到石油和天然气生产商 Devon Energy,很多公司已经开始尝试使用生成式人工智能技术。</p><p>“它所服务的目的不是让你知道你不知道的事情。这真的是一个工具,让你能够更好地做你的工作”,人工智能研究初创公司 Hugging Face 的首席伦理科学家 Margaret Mitchell 说道。</p><p>对于学术界而言,学生本是一张空白纸,如果在新技术到来之际,与其想着如何避免学生去接触,Ethan Mollick 认为可以花更多的时间引导学生如何正确使用 AI 工具,譬如 ChatGPT 生成的内容质量与提示语有很大的相关性,很多学生在没有引导下使用,只会提供一个非常简单的描述,如上述方法 1 所示。因此,对 AI 工具的培训真的很重要,需要向学生展示提示语制作的基本知识。</p><p>最后,Ethan Mollick 对所有的老师呼吁,不要总是担心学生会被 ChatGPT 生成的虚假内容所吸引。事实上,如果遵循自己对自己论文中的事实负责原则,很多学生会进一步去进行查证,也有能力理解工具的局限性,对事实的查找学习会迫使学生进一步关注 AI 论文的细节,创造一些真正的可教时刻。</p><blockquote>参考链接:<br><a href="https://aijishu.com/link?target=https%3A%2F%2Foneusefulthing.substack.com%2Fp%2Fmy-class-required-ai-heres-what-ive" target="blank">https://oneusefulthing.substa...</a></blockquote>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 02:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386961</guid>
            <link>https://aijishu.com/a/1060000000386961</link>
        </item>
        <item>
            <title><![CDATA[特斯拉重新捡回来的毫米波雷达,下一步脚落何处?-IOTE物联网展]]></title>
            <description><![CDATA[<p>一石激起千层浪。</p><p>最近,特斯拉又有大动作——搭载4D毫米波雷达的特斯拉要来了。</p><p>日前,Twitter博主Greetheonly曝光了特斯拉全新HW4.0硬件,指出该产品具备至少两个以太网接口。与此同时,近日特斯拉也向欧洲监管机构提交的车辆变更申请,证实最新自动驾驶硬件HW4.0即将量产上车。据悉,在即将到来的HW 4.0硬件系统中,特斯拉配置了一枚高精度4D毫米波雷达,且该车型可能率先在中国工厂生产。</p><p>曾经因“幽灵刹车”现象一直被人诟病,特斯拉一度抛弃了毫米波雷达,而且还提出“纯视觉方案”。如今,特斯拉又重新捡回毫米波雷达,引得“毫米波雷达”相关概念股在“狂飙”。</p><p>为何特斯拉重新拾回毫米波雷达?</p><p>毫米波雷达,是一种工作在毫米波频段(millimeter wave)的雷达传感器,可以精准探测目标的距离、速度、方位角和微动等信息。</p><p>毫米波雷达最早于1940年代开始研制,70年代中后期取得技术突破,90年代后期开始批量应用于车载领域,2000年后锗硅技术提高芯片集成度、降低成本,毫米波雷达迎来爆发式增长,2021年后技术较为成熟,成为主力传感器之一,未来将会向4D毫米波雷达路线发展。</p><p>4D毫米波雷达,又称4D成像毫米波雷达。所谓的4D,就是指在原有“距离、方位、速度”的基础上增加了对目标“高度”数据的解析,能够实现“3D+高度”四个维度的信息感知。</p><p>相比于普通毫米波雷达,4D毫米波雷达具有广视角、高精度、高分辨、能探测静物等优势;而且相较于激光雷达,它的成本也比较低。</p><p>了解特斯拉的都知道,特斯拉经常出现“幽灵刹车”等安全问题,而造成这种现象的重要原因是特斯拉曾配置的性能较差的ARS-4B毫米波雷达而促成的。对此,2021年特斯拉抛弃了毫米波雷达,并提出了“摄像头+算法”的纯视觉方案。</p><p>不过,现在的4D毫米波雷达比普通毫米波雷达的性能有了大大的提升,除了在原来距离、速度、方位等数据信息的基础上,4D毫米波雷达还增加了被测目标俯仰角的高度信息,并在速度分辨率等多方面均有提升,可通过高分辨率点云来感知汽车周围环境,增强了环境测绘和场景感知的能力,有效地弥补了传统毫米波雷达的性能短板。</p><p>德邦证券发布研究报告称,在L2+层级上,通过前置1颗4D毫米波雷达能够基本涵盖毫米波&amp;激光雷达的功能需求。因此,笔者认为,这极有可能也是特斯拉重新拾回毫米波雷达的重要原因。</p><p>“赛车手”过招</p><p>4D毫米波雷达或成主战场</p><p>得益于汽车产业的快速发展,尤其是汽车智能化、网联化的趋势越发显著,毫米波雷达市场需求十分旺盛。</p><p>作为ADAS的重要感知元器件,毫米波雷达并不仅仅只是一个硬件设备,它需要与车辆适配,才能较好地实现相应的功能。</p><p>在智能汽车L0~L2阶段,毫米波雷达主要应用于自动紧急制动、自适应巡航、前向碰撞预警、盲区监测、后向碰撞预警、倒车车侧预警、开门预警、自动泊车、变道辅助、乘客成员监测、驾驶员生命体征监测、手势识别等等。</p><p>根据GGAI、AIOT星图研究院整理统计,2022年1-6月中国市场(不含进出口)乘用车新车前装标配搭载前向毫米波雷达361.12万颗,同比增长12.55%;标配搭载角雷达(含后向)384.15万颗,同比增长37.89%。按照目前的新车搭载增速,预计2022年中国市场乘用车毫米波雷达搭载量将升至1800万颗左右。</p><p>现阶段,ADAS的市场渗透率还在不断攀升,尤其是伴随着自动驾驶等级的提升以及市场对自动驾驶能力需求的不断升级,市场对毫米波雷达的性能提出了更高的要求,而有着比普通毫米波雷达更高性能的4D毫米波雷达,成为了各车企的“眼中钉”,且4D毫米波雷达的渗透率也在逐渐增加。根据市场调研机构Yelo预测,2027年全球4D毫米波雷达市场将达到35亿美元。</p><p>当前,4D毫米波雷达这个赛道已经涌入诸多玩家,包括国外的Arbe、Waymo、大陆集团、采埃孚、安波福、博世、RADSee、Smart Radar等,以及国内的华为、华域汽车、森思泰克、安智杰、木牛科技、承泰科技、纳瓦电子、复睿智行、苏州毫米波、华域、楚航科技、威孚科技、几何伙伴等等。</p><p>此次特斯拉采用4D毫米波雷达的消息曝光后,更是带动了“4D毫米波雷达”概念股的涨停,预计将利好射频前端、信息处理系统以及后端算法。据盖世汽车研究院,射频部分占比约40%,其中MMIC(25%)、PCB(10%)、其他(5%),信息处理系统DSP占比10%,后端算法占比最高达50%。</p><p>综上所述,不难得出,在汽车智能化、网联化的催生下,毫米波雷达的成长速度会越来越快,其市场也会得到快速增长。</p><p>活力无限</p><p>毫米波雷达市场广阔</p><p>当然,不止于车端应用市场,毫米波雷达也常常被应用于交通、安防、工业、家居、康养等领域上。</p><p>在全球智能化变革浪潮之下,汽车、交通、安防、工业、家居、健康监护等诸多产业的蓬勃发展,创造了巨大的感知产品增量需求。</p><p>在交通领域,交通堵塞是许多城市发展都需要面临的难题,将毫米波雷达应用在车路协同系统,可以同时监控多个车道的平均速度、车流量、车道占有率等交通流基本信息,并根据交通流信息有效地调整交通信号灯,提高道路通行效率(可提高 10%),促进节能减排(可降低 10%-15% 的油耗),有效减轻交通堵塞等问题。当下,随着中国车路协同市场的发展,毫米波雷达的需求量也将随之上涨。</p><p>在智能家居、健康监护领域,毫米波雷达的应用案例也在不断增加。由于毫米波雷达可以监测到人体呼吸、心跳等健康信息,在全屋智能中也可实现精准的人体存在感知,从而与室内照明、窗帘、空调等产生联动;同时,随着老龄化进程的加速,毫米波雷达与智慧养老相结合已演化出跌倒报警、睡眠监控等很多新用例。</p><p>当然,还有安防、工业、民航、船舶等其他领域也应用了毫米波雷达,更多详细内容可见《中国毫米波雷达市场调研报告(2022年)》。</p><p>可以预见的是,智慧交通、智能家居、健康监护、安防、工业等领域,均是毫米波雷达的重要潜在市场。</p><p>未来,随着我国汽车、交通、安防、工业、家居、康养等产业的智能化升级不断推进,毫米波雷达的应用将进一步扩大。预计到2026年中国毫米波雷达市场规模将达到197亿元,年复合增长率为23.3%。</p><p>写在最后</p><p>不论是特斯拉采用4D毫米波雷达,还是眼下“毫米波雷达”相关概念股的涨停,可以肯定的是,随着中国各产业领域智能化、数字化的转型升级,必将给毫米波雷达创造更多的应用市场。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 01:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386952</guid>
            <link>https://aijishu.com/a/1060000000386952</link>
        </item>
        <item>
            <title><![CDATA[推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结]]></title>
            <description><![CDATA[<h1>0.前言:召回排序流程策略算法简介</h1><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/44083e4c130841f894e36366a71f8d96.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>推荐可分为以下四个流程,分别是召回、粗排、精排以及重排:</p><ol><li>召回是源头,在某种意义上决定着整个推荐的天花板;</li><li>粗排是初筛,一般不会上复杂模型;</li><li>精排是整个推荐环节的重中之重,在特征和模型上都会做的比较复杂;</li><li>重排,一般是做打散或满足业务运营的特定强插需求,同样不会使用复杂模型;</li></ol><ul><li><p><strong>召回层</strong>:召回解决的是从海量候选item中召回千级别的item问题</p><ul><li>统计类,热度,LBS;</li><li>协同过滤类,UserCF、ItemCF;</li><li>U2T2I,如基于user tag召回;</li><li>I2I类,如Embedding(Word2Vec、FastText),GraphEmbedding(Node2Vec、DeepWalk、EGES);</li><li>U2I类,如DSSM、YouTube DNN、Sentence Bert;</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/b935ff75e3e84d7f88de39613bb02bad.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p></li><li><strong>模型类</strong>:模型类的模式是将用户和item分别映射到一个向量空间,然后用向量召回,这类有itemcf,usercf,embedding(word2vec),Graph embedding(node2vec等),DNN(如DSSM双塔召回,YouTubeDNN等),RNN(预测下一个点击的item得到用户emb和item emb);向量检索可以用Annoy(基于LSH),Faiss(基于矢量量化)。此外还见过用逻辑回归搞个预估模型,把权重大的交叉特征拿出来构建索引做召回</li><li><p><strong>排序策略</strong>,learning to rank 流程三大模式(pointwise、pairwise、listwise),主要是特征工程和CTR模型预估;</p><ul><li><p><strong>粗排层</strong>:本质上跟精排类似,只是特征和模型复杂度上会精简,此外也有将精排模型通过蒸馏得到简化版模型来做粗排</p><ul><li>常见的特征挖掘(user、item、context,以及相互交叉);</li></ul></li><li><p><strong>精排层</strong>:精排解决的是从千级别item到几十这个级别的问题</p><ul><li><strong>CTR预估</strong>:lr,gbdt,fm及其变种(fm是一个工程团队不太强又对算法精度有一定要求时比较好的选择),widedeep,deepfm,NCF各种交叉,DIN,BERT,RNN</li><li><strong>多目标</strong>:MOE,MMOE,MTL(多任务学习)</li><li><strong>打分公式融合</strong>: 随机搜索,CEM(性价比比较高的方法),在线贝叶斯优化(高斯过程),带模型CEM,强化学习等</li></ul></li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c764dfd7b65048f3a2ab2b97214135a3.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p></li><li><strong>重排层</strong>:重排层解决的是展示列表总体最优,模型有 MMR,DPP,RNN系列(参考阿里的globalrerank系列)</li><li><p><strong>展示层</strong>:</p><ul><li><strong>推荐理由</strong>:统计规则、行为规则、抽取式(一般从评论和内容中抽取)、生成式;排序可以用汤普森采样(简单有效),融合到精排模型排等等</li><li><strong>首图优选</strong>:CNN抽特征,汤普森采样</li></ul></li><li><strong>探索与利用</strong>:随机策略(简单有效),汤普森采样,bandit,强化学习(Q-Learning、DQN)等</li><li><strong>产品层</strong>:交互式推荐、分tab、多种类型物料融合</li></ul><h1>1.淘宝逛逛召回算法实践总结</h1><p>内容化这几年越来越成为电商的重点,用户来到网购的时候越来越不局限在只有明确需求的时候,而更多的是没有明确需求的时候,就像是逛街一样。逛逛就是在这样的背景下诞生的内容化产品,打造出有用、有趣、潮流、奇妙、新鲜的内容,为消费者提供全新的内容消费体验。在这个场景下的内容召回有很多问题需要探索,其中主要的特点和挑战有:</p><ol><li><strong>强时效性</strong>:内容推荐场景下的内容新旧汰换非常快,新内容的用户行为少,很难用用户历史行为去描述新内容,而用户行为正是老内容投放主要的依赖。所以当不能依靠用户行为数据来建模内容之间关系的时候,我们必须要找到其他可以表征内容的方法。</li><li><strong>多兴趣表征</strong>:多兴趣表征,特别是多峰召回是这几年比较主流的一个趋势。但是目前多峰模型中峰的数量是固定的,当用户行为高度集中的时候,强制的将用户行为拆分成多向量,又会影响单个向量的表达能力。如何去平衡不同用户行为特点,特别是收敛和发散的兴趣分布,就成了此类任务的挑战。</li></ol><p>在设计优化方向的时候,我们重点考虑上面描述问题的解法(召回本身也需要兼顾精准性和多样性,所以单一召回模型显然无法满足这些要求,我们的思路是开发多个互补的召回模型)。详细的介绍在后面的章节以及对应的后续文章中展开:</p><ol><li><strong>跨域联合召回</strong>:除了单纯把多域的信息平等输入到模型中,如何更好利用跨域之间的信息交互就变的尤为重要。目前有很多优秀的工作在讨论这样的问题,比如通过用户语义,通过差异学习和辅助loss等。我们提出了<strong>基于异构序列融合的多兴趣深度召回模型CMDM</strong>(a cross-domain multi-interest deep matching network),以及<strong>双序列融合网络Contextual Gate DAN</strong> 2种模型结构来解决这个问题。</li><li><strong>语义&amp;图谱&amp;多模态</strong>:解决时效性,最主要的问题就是怎么去建模新内容,最自然的就是content-based的思想。content-based的关键是真正理解内容本身,而content-based里主要的输入信息就是语义,图像,视频等多模态信息。目前有许多工作在讨论这样的问题,比如通过认知的方式来解决,多模态表征学习,结合bert和高阶张量等方式等等。在语义召回上,我们不仅仅满足于语义信息的融入,还通过<strong>Auxiliary Sequence Mask Learning</strong>去对行为序列进行高阶语义层面的提纯。更进一步,我们利用内容图谱信息来推荐,并且引入了个性化动态图谱的概念。对于新老内容上表达能力的差异问题,我们通过<strong>multi-view learning</strong>的思想去将id特征和多模态特征做融合。</li><li><strong>泛多峰</strong>:为了解决多峰强制将兴趣拆分的问题,我们考虑到单峰和多峰的各自特点,特别是在泛化和多样性上各自有不同的建模能力。基于此,我们提出了泛多峰的概念。</li></ol><h2>1.1 跨域联合召回</h2><h3>1.1.1 基于异构序列融合的多兴趣深度召回</h3><p>在单一推荐场景下,深度召回模型只需要考虑用户在当前场景下的消费行为,通过序列建模技术提取用户兴趣进而与目标商品或内容进行匹配建模。而在本推荐场景下,深度召回模型需要同时考虑用户内容消费行为和商品消费行为,进行跨场景建模。为此,我们提出了CMDM多兴趣召回模型架构,能够对用户的跨场景异构行为序列进行融合建模。在CMDM中,我们设计了用于异构序列建模的层级注意力模块,通过层级注意力模块提取的多个用户兴趣向量与目标内容向量进行匹配建模。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/5ec96266756549119c23db2c1be555e4.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h3>1.1.2 双序列融合网络Contextual Gate DAN</h3><p>除了通过层次注意力的方式,异构序列中还有个特点就是在时间上更接近交叉并存的状态。为了学习到两个序列之间的信息交叉,充分融合商品点击序列和内容点击序列,我们从自然语言处理的VQA任务中得到启发。VQA是用自然语言回答给定图像的问题的任务,常用做法是在图片上应用视觉注意力,在文本上应用文本注意力,再分别将图片、文字多模态向量输入到一个联合的学习空间,通过融合映射到共享语义空间。而DAN结构是VQA任务中一个十分有效的模型结构,DAN通过设计模块化网络,允许视觉和文本注意力在协作期间相互引导并共享语义信息。我们对DAN结构进行了改进,设计了Contextual Gate DAN 双序列融合网络:</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/667c7ec2baa446828f102eeecca1430e.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h2>1.2 语义&amp;图谱&amp;多模态</h2><h3>1.2.1 多模态语义召回</h3><p>在内容推荐场景内,存在大量新内容需要冷启动,我们主要通过语义和多模态2种方式。相对于搜索任务,语义匹配是一个从单点到多点,解空间更大更广的问题。首先是用户行为的不确定性,内容推荐场景下用户决策空间更大更广,从而导致用户对推荐系统的反馈信号本身就存在较大的不确定性;再就是语义空间表达的对齐问题,这里的对齐包含两个方面,第一个方面是单个序列里的内容表达的语义标签提取方式差别大(比如cpv、分词、语义标签、多模态表征等等),另外一个方面是多序列(内容和商品等)之间的语义空间对齐问题。多模态的召回方式融合了文本,图像,音频等大量模式跨域信息,由于与内容互动解耦,在缓解内容冷启动上具有一定的优势。多模态召回主要是通过理解内容多模态表征,先后进行了collaborative filtering、聚类中心召回、个性化多模态表征相关的探索工作,在多样性方面取得了一定的效果,深度语义召回方面针对用户行为去噪和更好的表达语义信息角度出发,迭代了cate-aware和query-aware和序列mask 自监督任务的模型。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/b02b18f872a848f1836a56964dc7665b.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h3>1.2.2 行为稀疏场景下的图模型实践</h3><p>更进一步,我们利用内容图谱信息来推荐。知识图谱构建的出发点就是对用户的深度认知,能够帮助系统以用户需求出发构建概念,从而可以帮助理解用户行为背后的语义和逻辑。这样可以将用户的每次点击行为,都用图谱的形式极大的丰富,图谱带来的可解释的能力还可以大大加快模型的收敛速度。知识图谱有个特点,就是其中的信息是相对固定的,或者说是静态的,因为知识图谱基本是由先验信息构成的。但是从各个用户的角度,知识图谱的数据中的链接重要度并不相同。比如一个电影,有的用户是因为主演看的,有的用户是因为导演看的,那么这个电影连接的主演边和导演边的权重就因人而异了。我们提出了一种新的方法来融合用户动态信息和静态图谱数据。每个行为都用图谱扩展,这样行为序列变成行为图谱序列, 并且加入KnowledgeGraph-guided gating的自适应的生成式门控图注意力,去影响知识图谱融入到模型中的点边的权重。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/1574f85900324ef58bf47f0ee8f25524.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h3>1.2.3 融合多模态信息的跨模态召回</h3><p>针对新内容冷启动的问题,我们提出了跨模态召回模型来兼顾content-based和behaviour-based的召回各自的优点。在跨模态召回模型构建前,我们首先引入了多模态meta信息为主的“语义” deep collaborative filtering召回,两者的显著差别主要在target side的特征组成中相较与behaviour-based的特征,多模态特征构建的模型去除了影响较大的内容id类的特征,将这些特征更换为了来自多模态预训练技术得到的多模态表征输入。除了上面的变化,我们还加入了triplet loss的部分使得embedding空间更具有区分度,效率指标也有了较大幅度的提升。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f0608e9fe8244ac7acf46b3c22ced524.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h2>1.3 用户多兴趣表征(多模型簇联合学习):泛多峰</h2><p>多峰召回模型通过对用户侧产生多个表征不同“兴趣”的向量进行多个向量的召回,是对于单峰的一个拓展,将单个用户的表达扩展成了多个兴趣表达, 更精确地刻画了用户, 从而取得更好的效果。我们通过对于单峰模型及多峰模型的观察发现,用户行为高度集中的序列单峰模型的线上效率相对于多峰模型会更有优势,而那些用户序列类目丰富度较高的则多峰模型的效率明显占优。所以这里提出了泛多峰u2i模型的概念,尝试将多峰模型容易拟合行为序列类目丰富度较高的用户,而单峰模型则更容易拟合行为序列类目丰富度较为集中的用户的优势进行结合。使得单一模型能够通过产生不同算法簇的多个不同表征的向量在不同簇的内容向量中进行召回,从而具备这两种召回范式的优点。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f9b12f3921e944289369a5f57d5e2301.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h2>1.4 提升优化:</h2><p>▐  认知推荐</p><p>我们正在尝试,将图谱用于user embedding投影,投影的平面空间就是语义空间,这样做到可控多维度语义可解释embedding。另外,对于召回,采样方式对模型效果影响非常大,结合知识图谱来进行graph-based Learning to sample的优化,对于正负样本的选取更加做到关联可控,加快迭代速度,提升效果。</p><p>▐  兴趣破圈</p><p>在内容化推荐领域,仅仅相似度提高的优化,会导致用户没有新鲜感,对平台粘性变低。如何帮助用户探索他更多的兴趣,是现在内容化推荐亟待解决的另一个问题。一种做法是兴趣近邻,从已有兴趣出发,慢慢通过兴趣之间的相似,扩展用户未知的领域,可以参考MIND,CLR一些思路。另一种做法是对兴趣构建推理引擎,在对已有兴趣推理过程建模之后,加入扰动来探索用户可能新的兴趣。</p><h1>2.阿里飞猪个性化推荐:召回篇</h1><blockquote>常见的有基于user profile的召回,基于协同过滤的召回,还有最近比较流程的基于embedding向量相似度的topN召回等等。方法大家都知道,但具体问题具体分析,对应到旅行场景中这些方法都面临着种种挑战。例如:旅行用户需求周期长,行为稀疏导致训练不足;行为兴趣点发散导致效果相关性较差;冷启动用户多导致整体召回不足,并且热门现象严重;同时,具备旅行特色的召回如何满足,例如:针对有明确行程的用户如何精准召回,差旅用户的周期性复购需求如何识别并召回等。</blockquote><p>本次分享将介绍在飞猪旅行场景下,是如何针对这些问题进行优化并提升效果的。主要内容包括:⻜猪旅行场景召回问题、冷启动用户的召回、行程的表达与召回、基于用户行为的召回、周期性复购的召回。</p><h2>2.1 飞猪旅行场景召回问题</h2><p>推荐系统流程</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/a1144942282b46bfb5b6be5179c2a300.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>首先介绍推荐的整体流程。整体上分为5个阶段。从全量的商品池开始,之后依此是召回阶段,粗排/精排阶段,最后的混排模块根据业务实际情况而定,并不是大多数推荐系统必须的。粗排和精排在另外一次分享中已经介绍过了,本次分享主要介绍一下飞猪推荐系统的召回问题,召回可以说决定了推荐系统效果的上限。</p><p>下面说一下召回和粗排/精排的区别。从召回到粗排再到精排模块,商品的数据量是递减的,模型的复杂度会增高。具体会体现在输入特征数量和模型复杂度的增加,更新往往也会更频繁。对应的训练和上线的方式也会不同,拿召回来讲,出于性能的考虑,往往采用离线训练+打分或者离线训练得到向量表达+向量检索的方式,而排序阶段为了更好的准确率和线上指标,更多的是离线训练+实时打分,甚至在线学习的方式。</p><p>召回的本质其实就是将用户和商品从不同维度关联起来。常见的方法比如content-base匹配,或者item/user based的协同过滤,还有最近比较流行的向量化召回。向量化召回常用做法是用深度学习将用户和商品都表达成向量,然后基于内积或欧式距离通过向量检索的方式找到和用户最匹配的商品。</p><h3>2.1.1 飞猪推荐场景</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c8a47ed183f14473b1b8b35f371f8784.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>飞猪的推荐页面有很多,比如首页,支付成功页,订单列表页,订单详情页都有猜你喜欢。不同页面对应了不同的场景,用户在不同场景下需求不同,也有一定的交叉。比如首页偏重逛/种草,但支付完成后推荐一些与订单相关的商品会更好。</p><p><strong>我们大致可以把用户分为三类:无行为、有行为,还有一种是飞猪场景下特殊的一类"有行程"。</strong></p><h3>2.1.2 主要问题</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/46d789608a884377baa09b9b5f9b59fe.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>本次分享的主要内容就是针对这三类用户在推荐过程中存在的问题+周期性复购场景 ( 出差/回家 ) 的解决。<br>航旅场景下的召回存在以下问题:</p><ul><li>冷启动:航旅商品的热门现象严重,user profile缺乏。</li><li>相关性vs搭配性:航旅场景下要求搭配性比较高,传统的I2I只偏重相关性。但用户的行程需求不是单点的,比如买了飞机票还要看住宿。行程受上下文影响比较多,比如季节、用户近期行为等。</li><li>相关性不足:航旅用户的行为稀疏又发散,目前的召回结果噪音较多。</li></ul><p>下面会对我们在优化过程中碰到的相关问题一一介绍。我们知道,召回处于推荐链路的底端,对召回常规的离线评估方式有预测用户未来点击的TopN准确率或者用户未来点击的商品在召回队列中平均位置等等。但是在工业系统中,为了召回的多样性和准确率,都是存在多路召回的,离线指标的提高并不代表线上效果的提升,一种常见的评估某路召回效果的方式就是对比同类召回通道的线上点击率,这种评估更能真实反映线上的召回效果,基于篇幅的考虑,后面的介绍主要展示了线上召回通道点击率的提升效果。</p><h2>2.2 冷启动用户召回</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/fd4c807bdd794d1091442f3d2a8dbd44.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><h3>2.2.1 User冷启动召回</h3><p>用户冷启动召回主要有以下几种方案:Global Hot、Cross Domain、基于用户属性的召回。</p><ul><li>全局热门:缺点是和user无关,相关性差。</li><li>Cross domain:一种做法是基于不同域 ( 例如飞猪和淘宝 ) 共同用户的行为将不同域的用户映射到同一个向量空间,然后借助其他域的丰富行为提升本域冷启动用户的召回效果。</li><li><p>基于用户属性:单一属性的缺点是热门现象严重,个性化不足。我们采用了基于多属性组合的方法。</p><h3>2.2.2 UserAttr2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/ba11bfc0cdf24de6aa4fff068a31e847.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在这里介绍我们的方案UserAttr2I,使用类似排序模型的方法,输入用户+商品的属性,预测用户是否会点击一个商品。</p></li></ul><p>开始用线性FTRL模型,效果不是很好。原因是线性模型无法学习高阶特征,并且解释性比较差。针对这两个问题,通过DeepNet提高泛化性,同时用GBDT来做特征筛选。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/6724c7ef758a44c285efebb7ad1e642e.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>下面对比双塔结构和深度特征交叉两种方案,优缺点如图所示。最终选择了第二种,原因是目标用户是冷启动,能用到的特征比较少。如果放弃挖掘用户和宝贝之间的关系会导致相关性比较差。模型结构如下:<br><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/1c8b8e0fc2d54d3b9059cb59a0018e36.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>通过attention操作以及GBDT的叶子节点即可满足冷启动的可解释性。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/95ce5cec11004ae2b66176a7ca5d6f0b.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>对比其他冷启动的召回方式,Attribute2I的点击率最高。</p><h2>2.3 行程的表达与召回</h2><h3>2.3.1 Order2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c141e0757d8645c4b2c6a47ada2cea16.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在飞猪场景下用户有类似如下的需求:买了去某地的机票,用户很可能需要与之搭配的签证/wifi/酒店等等,而协同过滤通常只能推出同类型商品,比如门票推门票,酒店推酒店。另外飞猪不像淘宝用户可能会经常逛,有比较丰富的历史行为信息可以供我们去分析和计算,飞猪用户通常是"买完即走"。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/aba52ce8bb7549bd8232b975f2d2b670.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>通过数据分析我们发现订单附近的行为数据和订单有较高搭配关系,我们通过Graph Embedding的方式学习订单和宝贝的Embed,以此来学习搭配关系。</p><p>难点有以下几个:</p><ul><li>如何挖掘反映搭配关系的数据集合</li><li>搭配的限制性比较强,如果仅仅基于用户行为构建图,由于用户行为噪音多,会造成较多badcase</li><li>如果完全基于随机游走学习Embed,最后的召回结果相关性差,因此需要行业知识的约束</li><li>数据稀疏,覆盖商品少,冷启动效果差</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/d4e84017696741ab9c8ec83b375a1eee.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>**解决方案:<br>利用航旅知识图谱以及用户的行为序列进行加权异构图的构建 ( 机票/火车票节点利用业务线+出发地+目的地唯一标示、宝贝&amp;酒店利用其id唯一标示 )。之后的流程和传统的Graph Embedding类似。**</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/d3a417bea35b4f6192a0cea4f29c7d77.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br><strong>具体过程:</strong><br>① 以订单粒度对用户的行为做拆分和聚合,同时加入点击行为缓解稀疏问题。</p><p>② 边的权重的计算同时考虑知识图谱和用户行为,这种做法一方面可以增加约束控制效果,另一方面也可以抑制稀疏,解决冷启动的问题。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/eb64259ef2544b3296c7e5b512175907.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>③ 序列采样过程中会基于转移概率进行剪枝操作,用来抑制噪声和缓解热门问题。</p><p>④ skip-gram+负采样训练。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/560c1e09762c4309afa62ec8e33b345c.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>这里有一个具体的case,用户订了一张去曼谷的机票,order2I召回了曼谷的一些自助餐,落地签,热门景点等,体现了较好的搭配性。整体的指标上order2I的点击率也明显高于其他方式。</p><h3>2.3.2 journey2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/0f24570ee2ff49a88f5b750f31b3640f.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>Order2I将订单进行向量化表达,从而进行召回。<strong>但是它还有一些问题:用户的某次行程可能由多个订单组成,甚至有的订单只是中转的作用</strong>,Graph Embedding还是基于单个订单进行搭配的推荐;用户的某次行程不是一个出发地+目的地就能描述的,它不仅与行程本身属性 ( 例如出发/到达时间,目的地,行程意图等 ) 相关,还与用户的属性和偏好 ( 例如年龄,是否是亲子用户 ) 相关。因此行程既是User-Aware又是Context-Aware的。而Order2I学习的还是一种全局的整体偏好,与用户无关,不够个性化。因此我们尝试在行程的粒度做召回,综合考虑用户属性、行程意图、上下文等因素,更个性化的召回与用户这次行程以及用户自身强相关的的宝贝。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c34c3c6d8b9349a99873023b5ad597d4.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>以行程为粒度,对多个订单做聚合,并且增加行程相关的特征。融入用户的基础属性特征和历史行为序列。丰富行程特征并引入attention机制。采用双塔模型离线存储商品向量,在线做向量化召回。模型结构如下:<br><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/97ca47e2d5e44b52bfbdba9b76f29fed.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>模型左边主要是利用行程特征对订单序列以及用户的历史行为序列进行attention操作,用于识别关键订单以及用户关键行为。在此基础上融合行程特征和用户属性特征学习用户该段行程的Embed。模型右边是商品特征,经过多层MLP之后学习到的宝贝Embed。两边做内积运算,利用交叉熵损失进行优化,这样保证召回的结果不仅与行程相关还与用户行为相关。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/551cbcc2062d431f9a0b2ffb4eabbf97.png" alt="在这里插入图片描述" title="在这里插入图片描述"></p><p>两个同样是上海到西安的用户。用户1点击了历史博物馆和小吃,不仅召回了与机票搭配的接送机,还召回了与行为行为相关的小吃街附近的酒店以及历史博物馆相关的宝贝。</p><p>用户2点击了一个接送机,除了召回接送机还召回了机场附近的酒店和热门的POI景点门票。可以看出基于用户的不同行为,召回结果不仅满足搭配关系还与用户行为强相关。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/fdaf52164b224e699f4aee7595234630.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>从指标来看Journey2I相对Order2I有进一步明显的提升。</p><h2>2.4 基于用户行为的召回</h2><h3>2.4.1 Session-Based I2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/0bdcfe9e5d784df2a8172e5dd01cba16.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>航旅用户的行为有稀疏和发散的特点。利用右图一个具体的用户实例来说明这两个特点:用户在第一天点击了两个大理一日游,第20天点击了一些马尔代夫蜜月相关的商品,第21天又点击了大理的一日游。稀疏性体现在一个月只来了3次,点击了8个宝贝。发散性体现在用户大理一日游和出国蜜月游两个topic感兴趣。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/6392441264c04e219d9375727c0d1ae1.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在用户有行为的情况下进行召回,我们常采用的方法是基于User-Rate矩阵的协同过滤方法 ( 如ItemCF,Swing。ItemCF认为同时点击两个商品的用户越多则这两个商品越相似。Swing是在阿里多个业务被验证过非常有效的一种召回方式,它认为user-item-user的结构比itemCF的单边结构更稳定 ),但是由于航旅用户行为稀疏,基于User-Rate矩阵召回结果的准确率比较低,泛化性差。针对这两个问题我们可以通过扩充历史数据来增加样本覆盖。航旅场景因为用户点击数据比较稀疏,需要比电商 ( 淘宝 ) 扩充更多 ( 时间更长 ) 的数据才够。这又带来了兴趣点转移多的问题。在这里我们采用对行为序列进行session划分,保证相关性。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/f39142d4548243afbf30e44fdc9f415c.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>这里以swing为例讲解一下构造约束的方式。我们以用户的行为意图为中心,将表示共同意图的商品聚合在一个序列中,如上图对用户行为序列的切分。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/203dd021745b41bd9774c33dff30a88d.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>在这个case中,上面是传统swing的召回结果,下面是基于session的召回结果。当trigger是沙溪古镇一日游的时候,上面有一个杭州莫干山和玉龙雪山一日游,这两个不相关结果的出现是因为它们是热门商品,也称哈利波特效应。下面的召回结果就都是和沙溪古镇相关的了。从指标来看,session-based召回比swing和itemCF都高。</p><h3>2.4.2 Meta-Path Graph Embedding</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/1122cce89a984bd7b8399c209c9baaf3.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>基于I2I相关矩阵的优点是相关性好,缺点是覆盖率比较低。而Embed的方式虽然新颖性好但是相关性差。右边的case是Embed的召回结果,上海迪士尼乐园召回了一个珠海长隆的企鹅酒店和香港迪士尼。我们期望的应该是在上海具有亲子属性,或者在上海迪士尼附近的景点。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/eddd33153f5946a9bbfedabde0603dde.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>解决Embed相关性低的方式借鉴了session-based召回的经验,将航旅知识图谱融合,构建航旅特定的Meta-Path。效果上看meta-path的效果是比deepwalk更好。</p><h2>2.5周期性复购的召回</h2><p>复购场景的需求来自于:飞猪有大量的差旅和回家用户,该部分用户的行为有固定模式,会在特定的时间进行酒店和交通的购买,那么该如何满足这部分用户的需求?</p><h3>2.5.1 Rebuy2I</h3><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/c1a8b317a655413dbb858a651d2d8c58.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>我们的目标是在正确的时间点来给用户推出合适的复购商品,下面以酒店为例具体讲解 ( 其他的品类原理类似 )。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/11e827c034274aa6bb2fa0791e768f6d.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>输入用户在飞猪的酒店历史购买数据,输出是用户在某个时间点对某个酒店的复购概率。当有多个可复购酒店时,按照概率降序排序。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/463fa849ed85441cad16f4175bd3a9fc.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>常见做法有以下几种:</p><ul><li>利用酒店本身的复购概率</li><li>基于用户购买历史的Retarget</li><li>利用Poission-Gamma分布的统计建模</li></ul><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/abefcb8bf5c24efeb356c45150cf391e.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>首先取用户对酒店的购买历史,利用矩估计/参数估计计算酒店的购买频次 ( 参数α和β )。接下来就可以调整每个用户的购买概率,k是购买次数,t是第一次购买距离最近一次购买的时间间隔。最后代入Possion分布计算复购概率,加入用户的平均购买周期来缓解刚刚完成购买的酒店复购概率最大的问题。</p><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/46d024871f87424eae851ea5244b4f6f.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>从左图可以看出在购买一段时间以后,复购概率达到最大值,之后递减。实际使用中复购单独作为一路召回,效果比前面提到的retarget和热门召回更好。</p><h2>2.6 总结</h2><p><img referrerpolicy="no-referrer" src="https://img-blog.csdnimg.cn/5c2be163d48549799d0e0d665c46ea94.png" alt="在这里插入图片描述" title="在这里插入图片描述"><br>最后总结一下做好召回的几个思路:</p><p>首先要基于业务场景,来发掘用户需求,发现自有场景的特点。接下来通过ca

...

@github-actions
Copy link
Contributor

http://localhost:1200/aijishu/u/bandaotitouzilia - Success
<?xml version="1.0" encoding="UTF-8"?>
<rss  xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"
>
    <channel>
        <title><![CDATA[集微网 - 极术社区]]></title>
        <link>https://aijishu.com/u/bandaotitouzilia</link>
        <atom:link href="http://localhost:1200/aijishu/u/bandaotitouzilia" rel="self" type="application/rss+xml" />
        <description><![CDATA[集微网 - 极术社区 - Made with love by RSSHub(https://github.com/DIYgod/RSSHub)]]></description>
        <generator>RSSHub</generator>
        <webMaster>i@diygod.me (DIYgod)</webMaster>
        <language>zh-cn</language>
        <lastBuildDate>Mon, 27 Feb 2023 17:49:12 GMT</lastBuildDate>
        <ttl>5</ttl>
        <item>
            <title><![CDATA[引领仪器设备产业“突围”,国产半导体责无旁贷]]></title>
            <description><![CDATA[引领仪器设备产业“突围”,国产半导体责无旁贷]]></description>
            <pubDate>Mon, 27 Feb 2023 07:49:11 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387113</guid>
            <link>https://aijishu.com/a/1060000000387113</link>
        </item>
        <item>
            <title><![CDATA[解密禾赛科技最新激光雷达专利]]></title>
            <description><![CDATA[<p>【爱集微点评】禾赛科技的激光雷达专利,通过色散偏折件实现多波长光源所产生光线的分光和出射,同时色散偏折件还能起到扩束的作用,能够有效增大激光雷达的口径,提升测远能力。而且不会过多增加激光雷达的光路高度,有效的压缩了激光雷达的高度和体积。</p><p>集微网消息,近日,禾赛科技在纳斯达克成功上市,意味着中国“激光雷达”向全球又迈进了一步,同时禾赛科技也成为中国“激光雷达第一股”。</p><p>激光雷达是一种常用的测距传感器,其工作原理是利用激光往返于雷达和目标之间所用的时间,或者调频连续光在雷达和目标之间往返所产生的频移来评估目标的距离或速度等信息。为了获得较大的视场范围,激光雷达通常采用扫描装置进行扫描。激光雷达常用的扫描方式有机械旋转式、反射镜扫描式、光学相控阵(OPA)扫描、Flash扫描等。另外,还有一种扫描方式是波长扫描。波长扫描的扫描装置是利用光栅、棱镜等色散元件基于波长将多波长光源产生的光线分开以达到扫描的效果。但是现有波长扫描的扫描装置往往存在装配不方便的问题。</p><p>为此,禾赛科技于2022年8月29日申请了一项名为“激光雷达的发射模块及激光雷达”的发明专利(申请号:202222291141.6),申请人为上海禾赛科技有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1126334138789.4883.png" alt="image" title="image"></p><p>图1 波长扫描装置的光路示意图</p><p>图1为传统波长扫描装置的光路示意图,在激光雷达的应用中,通过不同波长的光线向不同角度衍射来实现激光雷达对不同垂直角度的扫描。因此,为了使多束衍射光的出射方向靠近水平面,实现对垂直0°角和垂直方向正角度和负角度一定范围的扫描,如图1所示,通常在色散元件12下游的光路中会设置反射镜13。但是反射镜13的反射面与水平方向之间的夹角较大,所以会增大光路沿垂直方向的尺寸,使得激光雷达光路垂直方向的高度增大,从而不利于激光雷达体积的缩小。此外,也会使激光雷达光路的不同光学元件在不同高度的水平面上,从而造成了激光雷达的安装不便。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1342321041364.585.png" alt="image" title="image"></p><p>图2 新型激光雷达发射模块结构示意图</p><p>图2为本专利提出的一种新型激光雷达发射模块结构示意图,在此主要引入色散偏折件129,其主要包括光栅层127和导光体128。光栅层127朝向导光体128的表面并与导光体128的表面直接接触。导光体128的两个表面分别为第一面121和第二面122,第一光线131从第一面121入射至导光体128,第三光线133自第二面122从导光体128出射。色散面和偏折面集成于一体化结构的导光体128上,能够使光学元件体积大幅缩小,并且一体化的光学元件结构更加稳定,能够有效提高光路的鲁棒性。此外,一般而言,导光体128材料的折射率大于1。将导光体128的材料设置为比较常见的大于1的材料以控制折射角度,可以实现扩束效果。</p><p>简而言之,禾赛科技的激光雷达专利,通过色散偏折件实现多波长光源所产生光线的分光和出射,同时色散偏折件还能起到扩束的作用,能够有效增大激光雷达的口径,提升测远能力。而且不会过多增加激光雷达的光路高度,有效的压缩了激光雷达的高度和体积。</p><p>禾赛科技是一家致力于激光雷达研发与制造的全球化公司,其客户遍布全球主流汽车厂商、自动驾驶和机器人公司,覆盖40个国家和90多个城市。作为以技术为核心竞争力的公司,禾赛科技的成功并非偶然,而是在多年的产品打磨和技术投入中诞生的。中国需要有世界级自主研发能力的公司,相信禾赛科技也有实力成为全球领先企业。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387119</guid>
            <link>https://aijishu.com/a/1060000000387119</link>
        </item>
        <item>
            <title><![CDATA[南芯科技公开带预唤醒功能的Type-C接口插入检测电路方案]]></title>
            <description><![CDATA[<p>【爱集微点评】南芯科技公开的带预唤醒功能的Type-C接口插入检测电路方案,该方案通过增加Type‑C接口预唤醒电路,在接口电路休眠时,可以将Type‑C接口检测电路关闭。从而实现减低系统待机功耗的同时实现接口插入检测功能,通过简单的电路结构解决了Type‑C接口插入检测和低功耗之间的矛盾。</p><p>集微网消息,在集成电路应用当中,特别是手机或者充电设备的Type‑C接口电路应用中,通常为了降低系统待机功耗,在未检测到手机或者充电设备插入时,整个系统会进入休眠模式。</p><p>但是为了快速响应手机或者充电设备的插入,在休眠时Type‑C接口检测电路需要一直工作,这就大大增加了系统休眠时的待机电流,从而大大缩短电池的续航时间。</p><p>为此,南芯科技在2022年3月11日申请了一项名为“一种带预唤醒功能的Type-C接口插入检测电路”的发明专利(申请号:202210236444.X),申请人为上海南芯半导体科技股份有限公司。</p><p>根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/522483438041.0886.png" alt="image" title="image"></p><p>如上图,为该专利中公开的充电设备端和手机端上设置的Type‑C接口检测电路通过Type‑C数据线连接的结构示意图。可以看到,在手机或者充电设备(如适配器、充电宝等)的Type‑C接口电路应用中,为了快速响应手机或者充电设备的插入,在休眠时Type‑C接口检测电路需要一直工作。这就大大增加了系统休眠时的待机电流,从而大大缩短了手机或者充电设备的电池的续航时间。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1435664442736.5054.png" alt="image" title="image"></p><p>如上图,为现有方案中Type‑C接口检测电路的电路连接示意图。在充电设备端,P型开关管M2的源端连接电源VDD,栅端连接控制信号EN_Rp,漏端连接上拉电流源Irp的源端。Irp的输出端连接到引脚CC,引脚CC同时连接到检测比较器P的反向端,比较器P的正向端连接参考电压VREF,比较器P输出信号为CC_DET_P。</p><p>在手机端,N型开关管M1的源端连接GND(即接地),栅端连接控制信号EN_Rd,漏端连接下拉电阻Rd的一端,下拉电阻Rd另一端连接到引脚CC。引脚CC同时连接到检测比较器D的同向端,比较器D的反向端连接参考电压VREF,比较器D的输出电压为CC_DET_D。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/168830725881.94025.png" alt="image" title="image"><br>在该专利中,主要通过在Type‑C接口检测电路的基础上增加预唤醒电路,在休眠时关闭Type‑C接口检测电路,来降低系统待机功耗。在设备插入时,通过触发预唤醒电路,再将Type‑C接口检测电路使能,实现快速响应设备的插入。</p><p>如上图所示,该检测电路包括:Type‑C接口检测电路以及Type‑C接口预唤醒电路。该充电设备端接口检测电路包括P型开关管M2、上拉电流源Irp和比较器P。手机端接口检测电路包括N型开关管M1、下拉电阻Rd和比较器D。</p><p>充电设备端接口预唤醒电路包括P型开关管M3、上拉电阻Rp_Pre、P型开关管M4、电阻R1、电阻R2以及反相器PI1。手机端接口预唤醒电路复用手机端接口检测电路的N型开关管M1和下拉电阻Rd。此外,手机端接口预唤醒电路还包括N型开关管M5、电阻R3、电阻R4和反相器PI2。</p><p>该装置的工作原理如下:在充电设备端,通过开关管M3和上拉电阻Rp_Pre实现上拉功能,开关管M4、电阻R1以及R2实现Rd插入预唤醒功能。在充电设备接口休眠时,开关管M3栅极控制电压为0,开关管M2栅极控制电压为1,关闭Irp上拉电流源,同时比较器P处于关闭状态。在手机端,下拉电阻部分将复用接口检测电路部分,开关管M5、电阻R3以及R4实现上拉插入预唤醒功能。在手机端接口休眠时,开关管M1栅极控制电压为1,打开M1,通过电阻Rd实现下拉,同时比较器D处于关闭状态。</p><p>引脚CC没有插入上拉时,CC引脚被Rd和M1下拉至GND,CC引脚通过ESD保护电阻R4接到开关管M5栅极,M5处于关断状态,输出被电阻R3上拉至VDD。然后经过反相器,输出为低,整个Type‑C接口电路没有工作电流,系统功耗很低。</p><p>当引脚CC插入上拉时,CC引脚电压即为开关管M5栅极电压,M5被打开,将信号拉低,输出CC_DET_D_PRE即为高电平。从而实现上拉插入预唤醒,然后打开比较器D,Type‑C接口检测电路将开始工作。</p><p>以上就是南芯科技公开的带预唤醒功能的Type-C接口插入检测电路方案,该方案通过增加Type‑C接口预唤醒电路,在接口电路休眠时,可以将Type‑C接口检测电路关闭。从而实现减低系统待机功耗的同时实现接口插入检测功能,通过简单的电路结构解决了Type‑C接口插入检测和低功耗之间的矛盾。</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 07:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387106</guid>
            <link>https://aijishu.com/a/1060000000387106</link>
        </item>
        <item>
            <title><![CDATA[兆芯如何保证处理器模拟/真实请求传输路径一致?]]></title>
            <description><![CDATA[<p>【爱集微点评】兆芯的处理器建模专利,采用两套信息来记录一个请求路径的关键信息,解决多个请求在汇聚点装置中路径不明确的问题。同时依据第二路径信息可以纠正第一路径信息在汇聚点装置导致的路径错误,使模拟请求传输路径的建模跟真实硬件传输路径更为一致。</p><p>集微网消息,近日,兆芯独家入选《上海金融科技发展白皮书》基础设施支持类科技企业,同时兆芯的新一代嵌入式处理器也一并入选白皮书。</p><p>在处理器建模领域中,当处理器传输数据的整个路径上只有一个源端发送请求时,功能加时序模型可以很好地模拟真实处理器的性能。但是,如果整个路径上有多个源端可以发送请求,由于功能模型是在请求生成的时候就进行调用,而多个源端到达请求汇聚点的路径延时是不确定的,汇聚点是指多个请求都会通过的路径节点或装置,这样会导致多个源端的请求在汇聚点看到的时序状态跟在请求生成时的差距较大。当大量的请求的处理路径跟功能模型不一致的情况下,最终建模呈现的性能指标就不能反映真实处理器的性能。因此,如何真实的模拟出处理器的性能,已成为本领域需解决的问题之一。</p><p>为此,兆芯于2020年9月29日申请了一项名为“处理器建模系统及处理器建模方法”的发明专利(申请号:202011054563.0),申请人为上海兆芯集成电路有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1141850468081.4688.png" alt="image" title="image"></p><p>图1 处理器建模系统的示意图</p><p>图1为本专利提出的一种处理器建模系统的示意图,处理器建模系统100包含多个源端装置A1~Am及一汇聚点装置PL。其中,源端装置A1~Am是向处理器发出请求的装置,例如输入输出装置、储存装置、图形处理器、预取装置等。</p><p>源端装置A1和An+1分别产生第一/二请求,并于第一/二传送时点传送两个请求。而汇聚点装置PL分别在第一接收时点和第二接收时点接收两个请求,并依据第一请求/第二请求选择传送路径(例如PT1)。其中,第一传送时点早于第二传送时点,第一接收时点接收晚于第二接收时点,且第一请求与第二请求欲存取的目标数据地址相同。如此一来,在多源端的处理器的仿真建模过程会发生多请求在到达汇聚点装置时出现路径不明的情况,最终导致建模结果呈现的性能指标与真实处理器不一致。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/538297132002.6487.png" alt="image" title="image"></p><p>图2 处理器建模方法的流程图</p><p>图2是本专利提出的一种处理器建模方法流程图,首先源端装置A1产生第一请求,第一请求为主路径请求。对于每一个请求,用第一路径信息来表示传统的功能模型的关键信息,用第二路径信息来表示真实时序的关键信息(可以真实反映时序的关键信息)(步骤210)。然后第一请求分别调用功能模型和时许模型,得到第一、二路径信息(步骤220、230)。然后第一请求被传送到汇聚点装置PL(步骤240),而汇聚点装置PL判断是否存在第二请求(步骤250)。汇聚点装置PL依据第二请求的第二路径信息选择传送路径PT1。因为目标数据地址中的信息已经先被先到汇聚点装置PL的第二请求取走了,所以依据第二请求的第二路径信息选择传送路径PT1(步骤260)。最后,汇聚点装置PL更新第二请求状态为合法的(步骤270)。</p><p>简而言之,兆芯的处理器建模专利,采用两套信息来记录一个请求路径的关键信息,解决多个请求在汇聚点装置中路径不明确的问题。同时依据第二路径信息可以纠正第一路径信息在汇聚点装置导致的路径错误,使模拟请求传输路径的建模跟真实硬件传输路径更为一致。</p><p>兆芯成立于2013年,掌握中央处理器、图形处理器、芯片组等三大核心技术。自从成立以来,兆芯已经成功研发、量产了多款通用处理产品,在业内得到了高度评价,并多次入围Silicon 100榜单、荣获各种“创新奖”、“成就奖”、“金奖”。希望在2023年成立十年之际,兆芯可以再创辉煌、更上一层楼!</p>
                                                    ]]></description>
            <pubDate>Mon, 27 Feb 2023 06:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000387102</guid>
            <link>https://aijishu.com/a/1060000000387102</link>
        </item>
        <item>
            <title><![CDATA[后ChatGPT时代,AI芯片如何继往开来]]></title>
            <description><![CDATA[<p>集微网消息:“英伟达是否低估了芯片危机?”</p><p>2022年9月,《经济学人》杂志向黄仁勋发出了这样的质疑,彼时的英伟达,正被加密货币泡沫破裂、高端GPU出口遭限等事件连番打击,股价创下两年新低,市值距离2021年末的高点已蒸发逾60%。</p><p>杂志记者略显刻薄地评论道:“当他透过眼镜打量他觉得会改变AI面貌的花哨新模型,以及像元宇宙这样更模糊的概念,他是否存在低估此时此地残酷性的危险?”</p><p>一百多天后如火如荼的ChatGPT热潮下,黄仁勋在加州大学伯克利分校喊出“这是人工智能的iPhone时刻”,一吐胸中块垒。</p><p>的确,ChatGPT既是热度空前的“杀手应用”,也为英伟达股价注入强心剂,伴随去年末ChatGPT热度起势,英伟达在几家大芯片巨头中,也走出了久违的领涨表现,同期在外围市场,但凡能编织出“ChatGPT与我的故事”,不少芯片企业也获得了投资者的追捧。</p><p>不过在短暂的集体狂欢后,“ChatGPT概念”也必将分化,各路企业描绘的新蓝图成色几何,需要一把技术的标尺加以衡量。</p><p>垂直一体化模式的松动</p><p>毋庸置疑,ChatGPT远超前辈AlphaGo的热度,已经像火炬般清晰照亮了大模型应用前景。然而回顾iPhone当年横空出世之时,不少外界观察者仍习惯以现有厂商格局线性外推,认为苹果公司探明的“新大陆”,最终仍将是诺基亚囊中之物。</p><p>在“人工智能的iPhone时刻”后,AI产业新机遇,同样并非理所当然应许给旧玩家。</p><p>值得指出的是,从0到1完成复现乃至超越ChatGPT实际体验的大模型,对许多团队而言面临工程能力和经济成本的双重约束。</p><p>从工程能力要求看,大型语言模型(LLM)参数量短短几年从亿级迈入千亿级,对算力需求已远超处理器性能迭代速度,分布式并行计算也因此进入“深水区”,易并行(embarrassingly parallel)方法撞上天花板,必须开发子计算任务与处理器之间更为复杂的调度方法,相关人才目前十分稀缺。</p><p>而在经济成本上,以ChatGPT的“母体”GPT-3模型为例,据称如使用英伟达V100 GPU集群训练一次,不考虑调参排故的理论最低成本也将达到460万美元,微软公司专门为其开发者OpenAI打造的超算系统据称拥有超过28万个CPU内核和1万个GPU,整体性能可以达到2020年时全球TOP500超级计算机榜单前五,如果这一宣传基本属实,则相当于OpenAI在用一套完整的天河2号超算系统专门支撑其模型训练,这对大多数企业而言无疑太过奢侈。</p><p>以此观之,人工智能厂商目前从数据、算法到AI芯片、硬件终端、项目实施的端到端垂直一体化模式,未来或将走向更明晰的专业分工,少数拥有巨型算力集群的科技巨头在云端进行大规模预训练模型迭代,并将接口开放给下游厂商、开发者,产业链下游则基于领域特定知识在边侧、端侧以更低代价、更短周期完成模型精调,实现对垂直应用场景的高可用交付。</p><p>面对呼之欲出的“范式转变”,对大多数新老厂商而言,比起抢发“我司也有类似模型开发中”的新闻,更重要的工作,恐怕是对如何挖掘特定场景商业价值深思熟虑。</p><p>针对该话题的采访中,思必驰研发总监樊帅指出,“从现实来讲,平台巨头企业在研发投入、团队投入等方面拥有优势,这是毋庸置疑的”。不过随着ChatGPT的应用延伸,上下游企业都将在产业链关键环节做出贡献,对于下游厂商而言,“探索类GPT产品的市场应用,实现技术的商业价值是企业关注的重点,无论是产品工具还是产品方案,挖掘潜力场景,进行技术融合,输出整体性、结果导向性的实用解决方案才是现实问题。”</p><p>作为国内专业的对话式人工智能平台型公司,思必驰在类GPT模型的应用落地上也有颇多洞察。</p><p>樊帅表示,现在ChatGPT是以文本交互机器人的形式呈现,这种文本生成的方式其实有很大的应用空间,比如在智能客服方向,现在的智能客服是检索式AI,但是生成式AI主动性更高,更具亲和力和有效性。不论是搜索引擎、电商客服还是AI辅助生成,ChatGPT应用级创新能力很强。</p><p>樊帅预测,在需要基于一定背景知识的创作型产业,以及刚需AIGC的场景、具有SOP(标准作业程序)的行业,比如智能写作、智能客服、文档管理、代码生成、甚至游戏NPC等,是ChatGPT适宜落地的土壤。大模型技术可通过强化上下文理解能力、思维链推理、增强指令学习,来实现场景的融合应用。例如,在会议场景下,根据上千字的会议记录,工具可以迅速根据需求指令,整理出会议纲要及重点,清晰列出待办事项。</p><p>进一步具体到语音交互领域,樊帅认为,“未来往语音对话机器人去进阶,强化语音、文本、图像等深度融合的多模态交互技术应用,应对复杂场景的变化。这些都给大家留下思考、应用和探索的空间。思必驰聚焦对话技术,从对话能力输出上来看,具备情感化、高度拟人化的语音TTS存在发展潜力”,他还介绍称,思必驰在这一方向上已进行了探索,推出过具有“高兴、撒娇、抱歉”情感的语音合成技术,应用在有声阅读、智能客服、语音助手、视频配音等行业场景,能够满足更接近真人情感化表达的语音效果。</p><p>AI芯片路线之辨</p><p>正如上文所述,类GPT大模型的开发极度依赖于算力支撑,随着大模型参数量从百亿、千亿向万亿演进,新的人工智能产业竞争将进一步向算力环节聚焦,与此同时,上下游推理、训练工作负载的需求差异将越来越显著,也对芯片技术演进带来了新的牵引。</p><p>围绕这一议题,集微网采访了国内通用GPU领域产业化步伐领先的天数智芯半导体有限公司(简称天数智芯),该公司是国内首家实现通用GPU产品量产及规模应用的厂商,其天垓100产品目前已支撑近百个客户应用,产品涵盖数百个人工智能模型的训练业务场景。</p><p>天数智芯产品线总裁邹翾分析,ChatGPT背后的GPT3.5是一种颠覆性的底层技术,其惊艳的应用效果建立在巨量语料库以及超大规模的AI算力基础之上。随着应用场景的演进, 核心技术会加速发展,包括AI模型的复杂度还会不断演进, 这将产生对算力的产生井喷需求。</p><p>国内顶尖的企业和机构正在进行ChatGPT相关的技术研究及商用级产品开发。面对国内应用环境及中文语料,相关算法及模型预计将在未来1年左右逐步成熟。在互联网入口,家庭接入设备,办公等各不同领域,针对不同的场景可能会有不同的算法及产品出现,而支撑这些模型的算力底座需要具有良好的通用性及扩展性,才能够快速的支持这些变化的需求,实现商业的可持续化演化。</p><p>邹翾表示,未来继续看好通用GPU架构训练产品的发展空间,其通用性、兼容性、以及生态成熟度仍是未来一段时间内人工智能算法及应用构建的主要支撑。</p><p>与云侧对通用性、扩展性的需求相比,</p><p>在边侧、端侧,推理芯片面对的需求则有所差异。</p><p>思必驰研发总监樊帅表示,AI专用芯片可以在侧重于场景化的端侧实现特定场景低能耗,高算力,从定制化来看,ASIC专用AI芯片从效率角度更具优势,随着大模型的普及及应用,能够提升相关芯片产品的性价比。</p><p>与此同时,由于数据量的急剧提升,无论在云侧还是端侧,对于数据的隐私保护也提出了更高要求。樊帅强调,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。基于AI的应用和其他衍生的工具级产品,在隐私安全、知识产权风险等方面亟待规范。</p><p>邹翾也谈到,在近期的客户交流中能够感受到各界对ChatGPT的关注及开发态度,希望其成为效率提升的有效工具。不过用户也有对数据隐私的担忧,未来随应用扩展,亟需提供隐私计算的技术方案,实现“可用不可见“的计算方式,这也要求更强及更通用的算力支撑。</p><p>值得一提的是,对于大模型训练芯片,特斯拉、Cerebras等海外厂商正试图探索另一条前无古人的道路—通过设计等效超算集群的单个处理器训练大模型,完全绕过分布式并行计算的调度瓶颈。</p><p>特斯拉近期公布的Dojo D1自研AI芯片,就是将25个裸片通过硅中介层互联,构成单块“Dojo Training Tile”,更为激进的Cerebras,则推出了面积达462平方厘米的WSE-2处理器,声称具有85万个用于张量运算的可编程内核,单张WSE-2支撑的CS-2机柜,据称最多可支撑万亿参数规模的大模型训练。</p><p>邹翾表示,新兴技术是针对目标问题的探索,会呈现出百花齐放的局面,在开放环境下竞争将驱使其收敛,市场是最终检测的试金石。在技术发展路线上需要从各个方向去尝试,最终都是为产业的发展贡献自己的力量。</p><p>结语</p><p>“人工智能的iPhone时刻”,的确代表了许多人对ChatGPT热潮的感受,全球公众与行业机构被“卷入”其中的速度,已经清晰昭示出未来更多、更大应用创新沿着这一方向喷薄而出的图景。</p><p>在警惕短期过度炒作和跟风的同时,类GPT模型对人工智能商业模式和产业格局带来的长期影响,亟需相关厂商冷静观察,沉着应付,有所作为。</p>
                                                    ]]></description>
            <pubDate>Fri, 24 Feb 2023 17:49:11 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386766</guid>
            <link>https://aijishu.com/a/1060000000386766</link>
        </item>
        <item>
            <title><![CDATA[3nm的“剧本杀”:有人吃饱,有人跌倒,有人意难平……]]></title>
            <description><![CDATA[<p>集微网报道(文/李映)开局不利,这会是代工巨头台积电在2023年首季的剧本吗?</p><p>面临行业景气度下行以及去库存消化的影响,台积电不仅下调Q1营收及全年资本支出,还放下身段松动代工价格,并在多方考量之下推迟欧洲建厂。在收缩战线之际,又传出英特尔推迟与台积电3nm合作订单的消息。</p><p>作为先进工艺的王者,台积电在今年3nm(N3)的规划是占其总营收的4-6%,估算下来为30-45亿美元。对于英特尔订单推迟,业界先有分析称将影响产能利用率,对其营运造成影响。</p><p>但反转比变脸还快。据透露,苹果已采购了100%的初始N3供应,很可能用于即将推出的 iPhone 15 Pro 系列以及计划于2023年下半年推出的新款 MacBook。且在手机去库存加速和HPC等需求高涨走势下,联发科、高通、AMD、英伟达等相比预计会加快下单3nm以及更具优化的N3E工艺,台积电全年3nm将走向满载。</p><p>反观3nm的先行者三星虽然率先量产,但目前买单者只有一些矿机企业,对比之下或不得不发出“起了大早赶个晚集”的喟叹。</p><p>英特尔数次推迟</p><p>推迟的戏码可谓是一再上演。</p><p>按照英特尔最初的计划,第14代Meteor Lake系列处理器采用多芯片堆叠设计,GPU部分将交付台积电3nm代工。但后来转向5/6nm制程,计划下一代即第15代Arrow Lake的GPU部分导入台积电3nm工艺。</p><p>没想到由于产品设计和工艺验证问题,该计划被推迟到2023年上半年,后来该产品的量产计划又因某种原因再次推迟到2023年底,现在则又要推迟到2024年4季度……</p><p>业内人士表示,这一推迟几乎完全取消了原定于2023年的3nm产能,只剩下少量的晶圆投入用于工程验证。</p><p>但从客户优先级来说,上述人士认为,在3nm工艺层面,苹果、AMD、英伟达下订单的时间都比英特尔更早,客观来说英特尔的订单优先级或相对靠后,而延后或是一种保护面子的“官方说法”。</p><p>再三推迟之下,英特尔原本期待的首发看来要变成“末发”了。英特尔近年流年不利,遭遇PC和服务器市场需求下滑和竞争对手的反击,导致PC平台蓝图频繁修改,产品上市延迟也进一步扰乱了供应链的节奏。</p><p>而英特尔的麻烦不止于此。面对2022年营收和利润快速下降的情形,英特尔不久前表示,正计划削减整个公司的管理层薪酬。且在PC市场疲软和竞争加剧的情况下,预计2023年第一季度仍将继续亏损。</p><p>台积电3nm将“满载”</p><p>在英特尔延后3nm订单仅仅两日,就爆出苹果包圆台积电3nm产能的消息,苹果这一举动着实给台积电送上了“定心丸”,特别是在代工业迎来“倒春寒”之际。</p><p>受经济下行叠加多重因素影响,有称台积电2023年上半年整体晶圆厂产能利用率预估跌至80%,其中7/6nm制程产能利用率跌幅扩大,5/4nm产能利用率从今年1月开始逐月下滑。台积电虽未直接松动代工价格,但私下按客户与订单规模不同,给予优惠。</p><p>但代工价格高昂的3nm制程却是“另一番天地”,在客户、产能等方面,正从一个胜利走向另一个胜利。</p><p>随着手机去库存加速,不仅苹果已获得了N3的所有可用订单,且高通、联发科也在加速下单。高通预计2023年第4季推出的Snapdragon 8 Gen 3将采用N3E制程;原预期2024年才会加入3nm行列的联发科,预计最快2023年12月就会推出首款N3E制程芯片。此外也传出Oppo已计划在台积电投片3nm。</p><p>N3E是3nm的升级工艺。目前N3工艺的EUV光罩层数为25层,预计二三季度量产的N3E工艺的EUV光罩层数则从25层减少到21层,可使芯片拥有更佳的效能、功耗和良率。</p><p>在手机芯片3nm起势之际,HPC需求也持续强劲,相应的AMD、英伟达等一众“拥趸”也将为台积电3nm节点营收贡献动能。</p><p>此外,在产能方面也会一扫稼动率不足的窘境。据悉台积电的3nm工艺于12月下旬开始,并在逐步扩大工艺产能,3月晶圆月产量将达到 45000片。有分析称,其3nm制程不仅在第一二季满载,在进入下半年后加上N3E的量产以及新客户的加持,全年3nm产能都呈现满载状况。</p><p>看起来,3nm俨然要成为台积电的新“台柱”。</p><p>三星“起大早赶晚集”</p><p>反观作为第一首发3nm的三星,市场天平却依旧没有向它倾斜。</p><p>三星抢先于2022年6月底进入3nm GAA世代,但据上述行业人士透露,从价格来看,相当于台积电价格打九折,相比于巨大的研发和设备开支,也算是诚意满满了。但目前只有一些中国矿机企业下单,对比台积电3nm“王者联盟”式的客户,仍有巨大落差。</p><p>而良率无疑是横亘其中的一大“障碍”。有关台积电及三星的3nm良率一直都是个谜,此前传闻说三星3nm良率仅有10-20%,台积电3nm良率可达70-80%,这恐有失偏颇。而且后者的良率也太高了,又被戳穿实际上只有不到50%的良率。</p><p>尽管实际对比不会这么悬殊,但三星3nm良率不如台积电应是实情。三星自然也在加足马力,通过全面合作和全力攻关,据悉三星3nm良率已大幅提高。</p><p>三星一位高管在日前受访时表示,相比于此前受困的良率问题,三星第一代的3nm制程良率已接近完美,第二代3nm工艺也迅速展开。</p><p>相应的,客户的积极性也在提升。据悉除了三星自用之外,其3nm工艺还锁定了四大客户,包括IBM、英伟达、高通及国内的百度公司,这些公司综合考虑了过去的战略合作伙伴关系、供应链的必要性等因素,选择三星作为芯片代工企业。</p><p>值得一提的是,英特尔计划于2023年底推出3nm(Intel 3)节点,在三大巨头皆进入3nm制程时代之后,未来3nm制程亦将成为先进工艺代工的主流。有预计到2025年,3nm制程市场的产值将会高达255亿美元,超越当时5nm制程预估的193亿美元产值。</p><p>而谁会笑在最后?</p>
                                                    ]]></description>
            <pubDate>Fri, 24 Feb 2023 17:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386774</guid>
            <link>https://aijishu.com/a/1060000000386774</link>
        </item>
        <item>
            <title><![CDATA[澜起科技提出系统安全防御方案 避免恶意程序攻击而崩溃]]></title>
            <description><![CDATA[<p>【爱集微点评】澜起科技提出的用于保护系统安全的安全防御方案,该方案通过双架构中的安全区对接收来自用户区的指令来源进行身份验证,从而避免了被恶意程序攻击而导致的系统安全问题。</p><p>集微网消息,目前,CPU和内存等芯片在物理设计时有其正常工作的电压和频率范围,超出正常范围则存在功耗过大烧毁或者时序、逻辑运算不稳定或者死机的情况,不稳定可能导致被攻击,防护程序被绕过或者密钥被窃取等问题。</p><p>电压和频率的控制是通过主板和内存条上的智能硬件电路来实现的,通过驱动程序等软件修改相应的CPU寄存器、主板相关电路的地址或端口、内存相应的参数区中的参数来实现电压和频率的调节。</p><p>为了系统安全,此类操作往往需要最高的系统权限,甚至在BIOS固件里进行调节,但是固件、木马或者攻破操作系统获得系统权限的恶意程序可以实现电压和频率配置,从而导致系统不安全。</p><p>为此,澜起科技在2022年3月16日申请了一项名为“一种安全防御方法、装置、设备及存储介质”的发明专利(申请号:202210259021.X),申请人为澜起科技股份有限公司。</p><p>根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/437905773410.57446.png" alt="image" title="image"></p><p>如上图,为该专利中公开的一种安全防御方法的流程图,该方法可以应用于中央处理器中的安全区。首先,系统接收加密的目标选项调节指令,以便利用预存储的密钥对加密的目标选项调节指令进行解密操作,以判断加密的目标选项调节指令的来源是否为用户区。</p><p>其次,当加密的目标选项调节指令的来源为用户区时,将本地存储区域内存储的第一随机码发送至选项控制单元,以便选项控制单元对第一随机码进行验证,并在验证成功后执行目标选项调节指令。在该过程中,当加密的目标选项调节指令的来源为用户区时,会将本地存储区域内存储的第一随机码发送至选项控制单元。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/690881846244.347.png" alt="image" title="image"></p><p>如上图,为上述安全防御方法的示意图。中央处理器采用双架构,将中央处理器分为用户区与安全区两部分,其中安全区是物理隔离,不会受到用户区的攻击。当目标调节指令为电压和频率调节指令时,图中左侧标有叉号的箭头直接连接用户区与电压和频率控制单元,表示现有技术中用户区会与电压和频率控制单元直接通信,可能会存在电压和频率控制单元执行来源为恶意程序的目标选项调节指令的情况发生。</p><p>在该方案中,中央处理器的安全区接收到电压和频率调节指令,然后利用预存储的密钥对加密的目电压和频率调节指令进行解密操作,即图中的验签操作。若电压和频率调节指令的来源为中央处理器的用户区时,将安全区中存储的随机码发送至电压和频率控制单元进行比对,比对成功后执行电压和频率调节指令。</p><p>最后,接收选项控制单元发送的第二随机码,并在本地存储区域内存储用于替换第一随机码的第二随机码。这是由于中央处理器中的安全区将第一随机码发送至选项控制单元后,第一随机码已失效。因此需要将接收到的选项控制单元发送的第二随机码存储在本地存储区域内,使用第二随机码覆盖第一随机码,使得本地存储区域内仍旧只存储一个随机码。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/330692839827.988.png" alt="image" title="image"></p><p>如上图,为上述安全防御装置的结构示意图。该装置包括有:指令接收模块11、随机码验证模块12和随机码更新模块13。指令接收模块用于接收加密的目标选项调节指令,以便利用预存储的密钥对加密的目标选项调节指令进行解密操作。随机码验证模块用于当加密的目标选项调节指令的来源为用户区时,将本地存储区域内存储的第一随机码发送至选项控制单元。随机码更新模块用于接收选项控制单元发送的第二随机码,并在本地存储区域内存储用于替换第一随机码的第二随机码。</p><p>以上就是澜起科技提出的用于保护系统安全的安全防御方案,该方案通过双架构中的安全区对接收来自用户区的指令来源进行身份验证,从而避免了被恶意程序攻击而导致的系统安全问题。</p>
                                                    ]]></description>
            <pubDate>Fri, 24 Feb 2023 17:49:05 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386770</guid>
            <link>https://aijishu.com/a/1060000000386770</link>
        </item>
        <item>
            <title><![CDATA[关注设备电池健康 国轩高科提出电池健康状态实时监控及评估方案]]></title>
            <description><![CDATA[<p>【爱集微点评】国轩高科公开的电池健康状态实时监控及评估预测方案,针对当前传统三维度电池健康监控及评估的短板,基于四维度电池健康监控及评估方法,通过结构创新,采用三个不同层级分别对电池的实时压力进行采集。进而通过信号处理和分析,实现了电池健康的实时监控和评估。</p><p>集微网消息,锂离子电池在运行过程中,近似于一个黑匣子,它的安全始终是消费者关注的问题,能够实现电池健康状态可视化也是各大主机厂十分关心的难题。现有的用于电芯实时状态监控和评估的健康因子有电压(U)、电流(I)和温度(T)。</p><p>然而,在此基础上的健康状态评估存在一个短板,就是“U/I/T”在电池生命周期的不同状态下的差别并不大,仅会在一些突发状态下个别因子才会发生较大波动。而这已经不是真正意义上的健康评估,而是突发状态下的预警,这对于电池实时的健康评估和监控是远远不够的,存在安全隐患。</p><p>基于现有最新的研究成果,电池在生命周期运行过程中的压力和寿命之间有着密切联系,并且呈现出正相关的关系。当电池的寿命衰减加速时,对应的压力也呈现出相同的加速增长的趋势,当电池运行稳定时,其压力变化也相对稳定,不会发生较大的突变,完全可以通过压力的变化趋势,实现电池的健康评估。</p><p>该原理为通过压力的实时数值和离群度,实现电池的实时健康监控。并且将电池运行过程中的压力作为新的健康因子,建立电压(U)、电流(I)、温度(T)和压力(P)四个维度上的健康监管平台。从而辅助电池更准确、更及时的健康监控和评估,以弥补传统“U/I/T”三维度评估的短板。</p><p>因此,为了实现这种能够实时监控和评估电池健康状态的方案,国轩高科在2022年11月11日申请了一项名为“一种电池健康状态实时监控及评估预测装置”的发明专利(申请号:202211409572.6),申请人为合肥国轩高科动力能源有限公司。</p><p>该专利分别在电芯级别、多层电芯级别以及系统级别描述了如何实现电池的健康状态评估及实时监控。根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/818099872778.0901.png" alt="image" title="image"></p><p>首先,在电芯级别,如上图,为集成有喷涂式压力传感器的电池内部示意图。对于电芯内部极片102,根据极片的成组原理,沿着箭头方向,最外围的极片的远离电芯中心的面在电池运行过程中并不会参与电化学反应,也就是说该极片表面并没有被充分利用。</p><p>而为了实现电池健康状态的评估,可以选取该极片表面实现喷涂式压力传感器101的布置,进而在电芯制作过程中就实现电芯本体与压力传感器的集成,并且该种压力传感器可实现信号的无线传输。该种形式的电芯在模组或者系统成组后,可以完成本体的压力自测,后将压力信号输出后,配合电池管理系统实现信号的处理和分析,进而根据压力和电芯寿命的关系,实现电池的健康状态评估及实时监控。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/93603020343.23683.png" alt="image" title="image"></p><p>如上图,为该专利中展示的电芯压力与寿命之间关系示意图。可以看到,随着循环圈数的增加,电池容量保持率(电池寿命)和压力之间的关系。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1571811746644.0806.png" alt="image" title="image"></p><p>其次,在电芯级别中,还要考虑不同层之间电芯层级的关系,如上图所示,为集成有离电柔性压力传感器的电池内部示意图。电芯内部极片102之间插入离电柔性压力传感器201层,作为独立的一层。进而在电芯制作过程中就实现电芯本体与压力传感器的集成,并且该种压力传感器可实现信号的无线传输。该种形式的电芯在模组或者系统成组后,可以完成本体的压力自测。然后将压力信号输出后,配合电池管理系统实现信号的处理和分析,进而根据压力和电芯寿命的关系,实现电池的健康状态评估及实时监控。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1398234646315.2043.png" alt="image" title="image"><br>最后,在系统层级,如上图,为集成有圆环式力传感器的系统示意图。通过在成组电芯301与箱体401之间布置圆环式力传感器402,进而在系统制作过程中实现电芯与压力传感器的集成。该种形式的系统在完成装配后,可以完成电芯的压力监测,后将压力信号输出后,配合电池管理系统实现信号的处理和分析,进而根据压力和电芯寿命的关系,实现电池的健康状态评估及实时监控。</p><p>以上就是国轩高科公开的电池健康状态实时监控及评估预测方案,该方案针对当前传统三维度电池健康监控及评估的短板,基于四维度电池健康监控及评估方法,通过结构创新,采用三个不同层级分别对电池的实时压力进行采集。进而通过信号处理和分析,实现了电池健康的实时监控和评估。</p>
                                                    ]]></description>
            <pubDate>Thu, 23 Feb 2023 17:49:11 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386469</guid>
            <link>https://aijishu.com/a/1060000000386469</link>
        </item>
        <item>
            <title><![CDATA[ChatGPT席卷全球背后:中美人工智能差距几何?]]></title>
            <description><![CDATA[<p>集微网报道 (文/陈兴华)ChatGPT以迅雷不及掩耳之势席卷全球多国同时,在中国也掀起前所未有的舆论热议,同时多家互联网、人工智能及产业链企业均表示将推进类ChatGPT应用和相关AI技术。</p><p>然而,国内舆论主要聚焦在ChatGPT使用体验、产业链相关受益方以及对产业变革影响等方面,鲜有探讨其背后折射出的中美人工智能生态竞争差异,中国缘何没有率先创造出ChatGPT,以及应如何利用相关AI技术带来的新机遇赋能国内产业经济发展。</p><p>相比之下,主流外媒对这类话题从制度、创新环境和人才竞争等多个层面提供了一些可供参考的分析借鉴。此外,国内行业人士指出,ChatGPT将刺激开启AI经济新时代,推动中国相关数据、算法和算力技术开发建设,对万物互联的数字经济发展意义非凡。</p><p>为什么ChatGPT没有出现在中国?</p><p>作为科技产业、社会经济发展的一项变革性技术与关键性力量,人工智能未来将深刻影响各国经济、科技和军事等综合实力对比,甚至重塑世界竞争格局。而经过多年行业发展演变,目前全球人工智能发展呈现中美两国引领、主要国家激烈竞逐的总体格局。</p><p>对于为何ChatGPT这一现象级消费类AI应用没有率先出现在中国,纽约时报、路透社、南华早报、CNBC等国际主流媒体刊文和一些分析师观点均提及“审查制度”,包括中国正寻求加强与美国AI竞争以及技术监督之间的平衡,但审查管制阻碍了科技产业发展。即使中国开发出ChatGPT相关产品,“过多限制、内容监管也可能会阻碍其商业化和进一步创新。”</p><p>另一方面,以往基于政府支持及较宽松的发展环境,中国互联网科技企业曾创造出举世瞩目的成就,但后续也因一定程度的无序扩张等因素引致监管。如今,随着国际地缘和产业发展形势演变,如何权衡互联网及AI等科技领域的监管力度和方式已成为国内重要课题。</p><p>“任何重要技术方面的产品发展,其实都离不开制度和整个环境,”斯坦福中国经济与制度研究中心高级研究学者许成钢表示。他以TikTok的中国版抖音为例,称中国企业未来可能无法再实现此类创新。因为开放的环境一旦没有了,重大创新就很难出现。</p><p>对于中国未首先打造出ChatGPT类似产品,产经观察家、IT行业分析师丁少将对集微网表示,在当前宏观经济和产业环境下涉及多重原因,包括创新和文化环境、内容监管,行业企业的资本投入、技术实力以及资源整合和商用落地等多方面。另外,“这类产品推出之前还有很多确保内容安全等前置性工作需要去做,这在中国特别重要。”</p><p>从产业发展角度来看,这也考验的是国内企业家和投资者的魄力。丁少将指出,“ChatGPT背后AI的数据训练、数据建模和人力投入等成本其实非常高。但基于商业化前景不明朗和自身资源实力等判断,中国公司在这方面投入还有所欠缺,不及微软等巨头公司。”</p><p>不过,国外科技媒体Semafor表示,美国进行开放式人工智能研究的传统比中国要长得多,而且并非“只是受利润动机的限制”。OpenAI最初是一家非营利性研究组织,其唯一目的是开发先进的人工智能。从这一角度而言,或许可以引发国内产业界更多思考。</p><p>中美AI产业链底层技术尚存差距</p><p>正如百度创始人、董事长兼CEO李彦宏1月在百度Create开发者大会上所言,“芯片卡脖子很要紧,但软件卡脖子其实一样要紧”。需要客观承认的是,ChatGPT在全球多国势如破竹同时,也映衬出中国在AI产业链软硬件关键及底层技术存在的部分差距及相关挑战。</p><p>众所周知,ChatGPT是一种由OpenAI训练的大型语言模型。在业内人士看来,目前全球还没有能跟ChatGPT抗衡的大模型,业界共识是中美差距在两年以上。“中国必须要有自主基座、应用大模型。由于OpenAI关键模型不开源只给API使用,中国已经是被‘卡脖子’了。”清华大学计算机科学与技术系长聘副教授黄民烈日前对国内媒体表示。</p><p>此外,黄民烈还提到,在迭代至GPT-3过程中,OpenAI建立起了真实的用户调用和模型迭代之间的飞轮,以及非常重视真实世界数据的调用和数据对模型的迭代,同时也推动相关生态建立。但业内人士称,目前国内还没有比较好的公司把数据和模型的飞轮完整转起来。</p><p>“从已有资料看,ChatGPT、文心一言都使用了包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用技术。从这四方面,如果说相关技术被‘卡脖子’,芯片可能是一个,既要算得便宜还要算得快,需要至少6纳米芯片,将来还需要更精密的3纳米以下芯片。”中国电信首席专家、美国贝尔实验室院士毕奇日前接受《法制周末》表示。</p><p>另据国内外媒体和专家学者均指出,美国的半导体禁令和其他贸易制裁将可能导致中国在最新的人工智能竞赛中处于劣势。由于担心美国进一步制裁,中国大型科技企业已储备足够的先进芯片,但如果无法获得下一代芯片,人工智能技术的进一步发展可能会受到严重阻碍。</p><p>与此同时,顶尖AI人才外流也是重要挑战。根据智库MacroPolo的数据,虽然中国总体培养了大约30%的顶尖AI研究人员,但大多数流失到了美国。纽约时报曾刊文《美国人工智能领域的秘密武器:中国人才》指出,在人工智能尖端热门领域,很多来自美国的开创性工作都由华人的智慧推动。这便不难解释美国顶尖AI研究及学术机构、专家学者等不乏华人身影。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1354563635305.925.jpg" alt="image" title="image"></p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/100775343913.72034.jpg" alt="image" title="image"></p><p>图源:纽约时报</p><p>AI新技术应用将催化数字经济发展</p><p>尽管ChatGPT的大模型产品当前在全球相对领先,但由于中美在AI大数据、算法、大模型发展路径存在一定程度不同,中国在相关技术产品的发展上也有自身特有优势,其中包括中国产业界在ChatGPT等人工智能技术软件层面具有更好的传统开发实力,以及能够让更多大数据应用积极地与人工智能结合,尤其在如今系统芯片呈现算法固化的特点情况下等。</p><p>此外,麻省理工科技评论援引华盛顿大学政治学助理教授杰弗里·丁(Jeffrey Ding)的话进一步表示,中国可以更好获得中文AI训练材料,并且出于商业目的快速开发新的产品。OpenAI、微软主要是针对英语市场进行优化。相对而言,百度等中国公司并非要占领英语市场,会针对中文领域进行专门优化升级。这其中存在一个真实而独特的优势和机会。</p><p>毋庸置疑,ChatGPT的大热也将促进国内数据算法迭代升级、智算中心建设乃至整个人工智能产业生态的发展。例如以GPT为代表的大模型正在催化新一轮AI算力储备,国内智算中心项目近期密集公布新进展。目前,全国已有超过30个城市正在建设或提出建设智算中心,可带动人工智能核心产业和相关科技产业实现数倍级增长。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/573235005362.3618.jpg" alt="image" title="image"></p><p>湖北随州5A级智算中心 图源:中科曙光</p><p>在ChatGPT刺激推动下,创道投资咨询总经理步日欣表示,“AI如果进一步与工业、制造业、交通运输业等传统行业结合,将实质性提高生产力水平,并且有助于缓解即将到来的人口老龄化等社会经济问题,从而体现技术最根本的价值。”另据麦肯锡的报告表示,随着人工智能和机器学习技术渗透到各行各业,其每年可为中国经济带来达6000亿美元GDP。</p><p>为了释放这一庞大产业价值,中国需要对数据生态、前沿技术、各类人才和商业模式以及标准和法规进一步投资和完善,并利用相关优势应对挑战和“扬长补短”。如对于高性能芯片受制于人,相关专家表示,解决方法包括自研CPU芯片,采用Chiplet或分布式芯片替代。而弯道超车路径之一是,号召各类拥有数据的机构参与预训练及与芯片计算架构公司等深度合作。</p><p>对于如何把握AI新技术为国内产业发展带来的机遇,丁少将建议称,第一,对发展前沿科技而言,构建开放包容的环境至关重要。第二,国家及社会资本应更加活跃,并加大对创新型企业的激励和战略支持。第三,推动AI科技创新和各产业发展相融合,让其成为具有商业潜力和前景的新技术和产业,进而成为各企业新的增长引擎,乃至促进整个国民经济发展。</p><p>(校对/杜莎)</p>
                                                    ]]></description>
            <pubDate>Thu, 23 Feb 2023 17:49:11 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386418</guid>
            <link>https://aijishu.com/a/1060000000386418</link>
        </item>
        <item>
            <title><![CDATA[为提高电阻器抗浪涌能力 鼎声微电提出相关技术及加工设备方案]]></title>
            <description><![CDATA[<p>【爱集微点评】鼎声微电公开的抗浪涌电阻器及其加工设备方案,鉴于目前电阻器的发展受到尺寸的约束,该方案在电阻器本体的侧面增加了侧面电阻体,这样无需增加电阻器本体的尺寸,也可进一步提高电阻器本体的抗浪涌能力。</p><p>集微网消息,贴片电阻又名片式固定电阻器,常规的贴片电阻多是采用丝网印刷将电阻性材料淀积在绝缘基体上,然后烧结形成的,具有耐潮湿、耐高温和可靠度高的优点。贴片电阻是使用的过程中,常会遇到浪涌,浪涌也叫突波,顾名思义就是超出正常工作电压的瞬间过电压,电阻被施加这种浪涌电压时,过度的电应力会使电阻特性受到影响,最坏的情况下可能导致芯片损坏。</p><p>抗浪涌电阻器具有较好的抗浪涌能力,其原理是:拉长电极间距,使电位梯度平缓,从而减少对芯片的损坏。简单的说:正常情况下,贴片电阻上的电阻体在两个电极之间是直来直往的,呈一条直线状。而抗浪涌电阻器上的电阻体则呈波浪状,通过在电极之间设置长度较长的电阻体,使得电极间的导通路径变长,进而使得电位梯度变得平缓,从而提高抗浪涌能力。</p><p>在现有技术中,贴片电阻上的电阻体都是先通过丝网印刷的方式,将电阻性材料按照一定的形状印刷在绝缘基体上,然后再烧结而成的。常规的丝网印刷只能将电阻性材料印刷在绝缘基体的上表面处,但是绝缘基体的上表面的面积是有限的。当需要进一步提高电阻的抗浪涌能力时,只能采用增加电阻器尺寸的方式来实现,而大尺寸电阻器则需要更多的电路板空间,虽然增加了电阻器的抗浪涌能力,但是又会带来新的其他问题。</p><p>为此,鼎声微电在2021年11月16日申请了一项名为“一种抗浪涌电阻器及其加工设备”的发明专利(申请号:202111354948.3),申请人为宁波鼎声微电子科技有限公司。</p><p>根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1417490822062.9102.png" alt="image" title="image"></p><p>如上图,为该专利中公开的抗浪涌电阻器本体结构的示意图,在该电阻器的两端均设置有电极2和电阻3,电阻由端部电阻体301、表面电阻体302和侧面电阻体303三部分组成。表面电阻体呈长条状,均布在电阻器本体的上表面。侧面电阻体呈U形状,位于电阻器本体的两侧,通过侧面电阻体将表面电阻体相互连接在一起。端部电阻体位于电阻器本体的两端,通过端部电阻体使电极与表面电阻体连接在一起。</p><p>为了提高电阻器本体的抗浪涌能力,在本体上设置了由端部电阻体、表面电阻体和侧面电阻体组成的电阻,端部电阻体和表面电阻体均位于电阻器本体的上表面。正常情况下,电阻器本体上表面的面积是有限的,如果采用增加电阻长度的方式来提高电阻器本体的抗浪涌能力,当电阻器本体上表面的电阻的长度无法再增加时,只能增加电阻器本体的尺寸。</p><p>当电阻器本体的尺寸变大后,这样电阻器本体的上表面就可排布更多的电阻,但是电阻器本体的尺寸变大后,则会带来新的问题。该专利中的方案对电阻器本体进行改进时,在电阻器本体的侧面增加了侧面电阻体,端部电阻体、表面电阻体和侧面电阻体为一个整体,这样就无需增加电阻器本体的尺寸,也可进一步提高电阻器本体的抗浪涌能力。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1576156235607.1685.png" alt="image" title="image"></p><p>为了能够方便加工该抗浪涌电阻器,在该专利中还公开了一种抗浪涌电阻器的加工设备,如上图所示。印刷台4的上侧设有丝网印刷机构,该结构包括丝网印板5、第一升降板6和第二升降板7。第一升降板上对称设有第一气缸8,第二升降板位于第一升降板的一侧,且第二升降板与第一气缸的活塞杆固定连接。第二升降板的下端设有刮板,丝网印板上设有若干个第一开口501。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1361348511722.1265.png" alt="image" title="image"></p><p>如上图,为丝网印板、第一固定座和第二固定座的剖视图。丝网印板的下侧设有若干个侧面印刷组件,且侧面印刷组件包括第一固定座10和第二固定座11,二者均为空心结构,并与丝网印板滑动连接。且两个固定座的一侧均设有走料槽12,走料槽与第一开口连通。</p><p>在该结构中,通过对现有的电阻印刷设备进行改进,使得在对电阻进行丝网印刷时,可以在电阻器本体的上表面及侧面均印刷上电阻体,加工更加方便。具体的工作原理:在印刷台上设有丝网印刷机构,丝网印刷机构的下侧设有若干个侧面印刷组件,丝网印刷机构与侧面印刷组件配合使用,共同完成电阻器本体上表面和侧面的电阻体的印刷。</p><p>在使用时,浆液状的电阻性材料通过管接口13进入第一固定座和第二固定座内,在充满两个固定座的内部空腔后,会通过走料槽流出。走料槽的形状与侧面电阻体相同,而且走料槽的上端与第一开口连通。物料通过走料槽进入第一开口并聚集,随着物料的聚集,部分物料会堆积在第一开口内,然后管接口停止进料,第二气缸工作,使第一升降板向下运动。</p><p>此时,第一升降板会带着第一气缸及第二升降板一起运动,第二升降板上的刮板与丝网印板抵触。随后第一气缸工作,推动第二升降板和刮板往复运动,通过刮板来将第一开口处的物料刮平。同时,在印刷台一侧设有刮料机构,通过刮料机构可以将走料槽处的物料刮平,随后第一固定座和第二固定座反向运动,接着第一升降板和第二升降板回归原位。侧面电阻体和上表面电阻体同时印刷完成,然后将丝网印板取下,将带有印刷工件的载料板取走即可。</p><p>以上就是鼎声微电公开的抗浪涌电阻器及其加工设备方案,鉴于目前电阻器的发展受到尺寸的约束,该方案在电阻器本体的侧面增加了侧面电阻体,这样无需增加电阻器本体的尺寸,也可进一步提高电阻器本体的抗浪涌能力。</p>
                                                    ]]></description>
            <pubDate>Wed, 22 Feb 2023 17:49:11 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000386150</guid>
            <link>https://aijishu.com/a/1060000000386150</link>
        </item>
        <item>
            <title><![CDATA[一线机构纷纷出手,国产线控底盘加速突围]]></title>
            <description><![CDATA[<p>集微网报道 (文/王丽英) 如果说电动化是新能源汽车变革的上半场,那么智能化无疑将是下半场变革的核心。作为汽车智能化的终极目标-自动驾驶要想落地实施,线控底盘是其中离不开的一项关键技术。</p><p>最近,一则小米子公司投资线控底盘企业千顾科技的消息引发热议,毕竟,小米造车正在关键推进期,围绕汽车领域的一举一动自然备受关注,事实上,小米产投在去年就曾领投同为线控底盘企业的同驭汽车。</p><p>除小米产投外,其他一些头部投资机构也纷纷出手线控底盘领域,多家创业企业都拿到了不菲的融资,线控底盘技术上车有望迎来加速期。</p><p>自动驾驶的基石,渗透率有望快速提升</p><p>在新的电子电气架构下,汽车执行系统同步发生变革,底盘系统逐步走向智能化、线控化。</p><p>汽车线控底盘主要由线控转向、线控制动、线控驱动(包含线控换挡、线控油门)和线控悬架(例如,线控空气悬架)四部分组成。线控底盘使用电信号取代传统的机械、液压或气动等形式来实现车辆的转向、制动和前进等操控。相比传统底盘,线控底盘可以实现对执行机构高效、精准的主动控制,是实现自动驾驶的基石。</p><p>从目前的装车量来看,这四部分中,线控油门技术已较为成熟,渗透率接近 100%;线控换挡技术难度较小,目前渗透率也比较高;线控制动与线控悬架技术部分已相对成熟,但装配率较低;线控转向技术仍处于发展中,渗透率极低。</p><p>线控制动是线控底盘的核心,技术难度高。它可实现底盘与车身之间的解耦,更好地适配L3级别以上智能驾驶方案。预计随着高级别自动驾驶车型渗透率不断提升,线控制动有望实现新的增长点。</p><p>根据传输介质的不同,线控制动系统可分为电子液压制动系统(EHB)和电子机械制动系统(EMB)。相较于EHB,EMB 完全摒弃了传统制动系统的制动液及液压管路等部件,是真正意义上的线控制动系统,但目前技术成熟度还有待提升。</p><p>线控空气悬架是底盘智能化的重要组成部分,可显著提高汽车操纵性和舒适性,在燃油车时代,是高端车型的豪华选项配置。对于电动汽车,线控空气悬架不仅提升驾乘体验,还有助于底盘轻量化,减少能耗提高续航里程,成为众多品牌追求的配置亮点。目前蔚来、理想、小鹏、东风、吉利、红旗、上汽大众均已推出配备或可选配空气悬架的车型。</p><p>作为自动驾驶的执行机构,线控底盘的性能好坏将直接影响自动驾驶的使用效果和安全性能。随着自动驾驶向更高级别发展,对感知层、决策层、执行层都提出了更高的要求,要进一步满足响应快、延迟低、精度高等要求。线控底盘通过电信号传导可以实现对执行机构高效、精准的主动控制,实现快速响应,有望替代传统底盘加速上车。</p><p>机构预测,2025年我国线控制动渗透率有望达30%以上,市场规模或达200亿元,2022~2025 年年复合增长率43%;2025年我国空气悬架市场有望达331亿元,2022~2025 年年复合增长率69%。</p><p>机构纷纷出手,国产力量加速突围</p><p>全球线控底盘市场多年来主要由国际Tier 1 厂商垄断,例如,博世、大陆集团、采埃孚、日立等,其中,在线控制动领域,博世的市占率更是超过90%。头部企业在技术研发、市场等方面掌握主要话语权,对本土OEM的开放度较低,导致国内线控底盘技术整体发展缓慢。</p><p>随着燃油车向新能源汽车的转型,传统汽车供应链体系正在被打破。尤其是过去两年汽车缺芯事件,推动了国内汽车供应链的自主建设,缺芯使得国内整车企业更重视供应链的安全可控。把握难得的供应链切入窗口期,国内多个线控底盘厂商获得知名整车厂定点,国产线控底盘企业在逐渐崛起。</p><p>例如,线控制动领域有拿森科技 英创汇智、同驭汽车、伯特利、比亚迪 、利氪科技、精工底盘、亚太股份、千顾科技等,线控空气悬架领域有保隆科技、中鼎股份、拓普集团等。</p><p>资本的嗅觉最敏锐,面对中国在新能源汽车市场产销量NO.1的强大市场背景,线控底盘市场呈现出了诱人的增量应用前景,头部机构纷纷出手,同时,线控底盘赛道涌现出了多家本土创业企业,并获得融资。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/702124138724.4385646038517716.1816.png" alt="image" title="image"></p><p>2021年12月,成立于2016年的拿森科技宣布完成5亿元的C轮融资,由中银投资、宁德时代、国投招商、高瓴创投等联合领投,将持续加强线控底盘的新产品开发、产业化以及客户服务能力,实现配套量产规模增长;2022年3月,同样成立于2016年的同驭科技完成由小米产投与东风交银联合领投的近2亿元A+轮融资,将助力其线控底盘新技术与新产品的开发投入、新产能建设。其后,线控底盘领域的初创企业融资接续而来,格陆博、利氪科技、千顾科技、英创汇智、比博斯特、时驾科技、济驭科技等先后拿到产业头部机构的投资。</p><p>尽管有资本护航,又面临应用爆发的黄金时期,但国内的线控底盘企业仍挑战重重。</p><p>业内人士指出,线控底盘整体渗透率不高,作为自动驾驶的关键基础,安全性要求苛刻,特别是线控制动技术门槛颇高,国产化率水平极低,国内厂商基本处于从0 到1的发展阶段,亟待整体性能提升,整车企业提供试用上车机会也非常关键。</p><p>与此同时,线控底盘行业需要发展出一套统一的行业基准。目前,不同品牌、不同车型底盘性能各不相同,各机构和厂家对线控底盘的评价指标和评价方法各不相同,在自动驾驶系统量产过程中,需要针对不同性能车型进行重复适配开发,造成资源浪费。</p><p>在汽车供应链自主可控的大趋势下,以及汽车智能化发展不断向L3等高级别自动驾驶系统升级推进下,国内线控底盘企业唯有以产品技术作为突发点,打破原有线控底盘核心技术壁垒,赢得整车企业及市场认可,才能逐步建立起国产化线控底盘的技术护城河,在这一新兴蓝海市场中获得主导权。</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 17:49:11 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385760</guid>
            <link>https://aijishu.com/a/1060000000385760</link>
        </item>
        <item>
            <title><![CDATA[欧洲推迟建厂 台积电今年日子不好过]]></title>
            <description><![CDATA[<p>集微网报道(文/李映)继被注重自由现金流的“股神”巴菲特去年第四季度重砍台积电ADR股票达5176万股、减持幅度高达86%之后,台积电又传出欧洲建厂将延后两年的消息,让业界心头一紧,台积电现金流真的吃紧了吗?</p><p>复盘台积电延后欧洲建厂的逻辑,或许不止于现金流的考量,更是在市场供需变化、投资回报率权衡之后做出的理性选择。</p><p>大幅抛售引发现金流忧虑?</p><p>被“股神”巴菲特仅仅“青睐”一季之后就被大幅抛售,对台积电来说不啻一场次生灾难,股价重挫4%即是实证。</p><p>而在集微网“买进卖出只一季 “股神”看不懂半导体?”文章中已分析出这一举动背后的逻辑:即台积电在日本、美国、中国台湾都将进行大笔投资,还有可能在德国进一步投建晶圆代工厂,而在日本、美国、德国投建晶圆代工厂成本非常高,需占用大量的资本,初期可能会持续亏损,并不断稀释台积电的利润,影响未来的自由现金流,这与巴菲特看重自由现金流的投资逻辑相违背。</p><p>就现金流而言,2022年台积电的全年资本开支为363亿美元,或1.1万亿新台币,产生了经营现金流1.6万亿新台币,自由现金流为5280亿新台币,算得上财才雄厚。</p><p>伴随着地缘政治思维的抬头,将半导体业视为攸关战略产业的美国、欧洲、日本等相继推出数千亿美元大手笔投资计划力促半导体制造业回流。台积电作为代工业第一巨头,成为各国争抛橄榄枝的主力,也频频释出重大投资或扩产计划。</p><p>有半导体行业人士指出,尽管有各国政府的补贴,但建厂尤其是先进工艺厂的成本支出十分庞大。原本台积电在日本晶圆代工厂计划投资86亿美元,在美国晶圆厂投资120亿美元,但在去年12月台积电将美国晶圆厂投资从120亿美元增加到了400美元,且台积电还计划在中国台湾、欧洲德国投建代工厂,未来几年台积电将产生大量的资本支出,对其持续稳定的自由现金流造成影响。</p><p>加之有台积电在美建8英寸厂Wafertech成本高企、长期亏损之后才转为盈利、2021年营收仅为77.35亿元新台币形同鸡肋的“珠玉”在前,台积电在美国、日本、欧洲等地建厂如何不拖累整体业绩、如何快速产生正反馈都成为台积电不得不直面的问题。</p><p>更值得忧虑的是,台积电已处于地缘政治风暴眼之中。近日由于担忧台海风险,由美国前副总统高尔(Al Gore)联合创建的Generation Investment Management金融服务公司也出清台积电ADR共326,654股持股,换算价值达2240万美元。</p><p>多重因素导致暂时搁置</p><p>急行军的台积电在此时为欧洲建厂按下了“刹车”,但这背后的考量或不止现金流那么简单。</p><p>去年底又传出台积电将计划在欧洲设厂的消息。今年1月12日,在台积电的财报发布会上,台积电也表示正考虑到欧洲德国建设汽车芯片工厂,但仅过了一月,台积电就宣布单方“推迟”,变化总比计划更快。</p><p>业内人士对集微网指出,这既有行业环境变化的因素,也涉及台积电投资建厂的策略调整。</p><p>前两年受多重因素影响汽车芯片持续短缺,导致多家整车厂家停产或减产汽车。据AFS的最新数据显示,截至去年12月11日,今年全球汽车市场累计减产约435.1万辆汽车。不过受疫情放开和包括英飞凌、瑞萨、TI等汽车芯片大厂陆续释出大手笔投资扩产的消息,芯片短缺将有所缓解。</p><p>因而上述人士分析,台积电在欧洲建厂的政治诉求与商业因素相比美国、日本的权重本身就较弱,且考虑到汽车芯片供需将放缓,产能可转至中国台湾甚至转往日本、美国等地新厂生产,有助于更好地调配产能,因而台积电将欧洲新厂时程延后亦在情理之中。</p><p>此外,更现实的因子还在于,在欧洲建厂面临资金、人才、水电供应等诸多压力,且赴欧洲设厂成本估计更高于美国与日本,将对台积电资本支出、人力投入和运维造成更多的考验。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/187541081557.0785.png" alt="image" title="image"></p><p>甚至还有消息称,环球晶收购德国同业世创因德国官方以“审核时间来不及”为由而失利,引起了连锁效应。有消息人士透露,原本称赴德国设厂还处于“非常非常早期”的台积电,恐因环球晶收购世创未成,欧洲新厂落脚地点或将转向评估捷克。</p><p>联想到台积电在去年回应欧洲建厂所言:“设厂地点选择有诸多考量因素,台积电拓展全球制造版图是基于客户需求、商机、运营效率和成本等多方面的考量,不排除任何可能性,一切以公司正式对外公告为主。”</p><p>或许一切变数都藏在“不排除”之中。</p><p>今年日子不太好过?</p><p>虽然现代工业在2022年整体表现出“逃逸”下行周期的强大力场,但由于终端需求反映到代工订单的滞后性,这一份“寒意”传导至2023年之际冲击已然更加强烈。</p><p>反映到现实就是各大代工厂的产能利用率在不断下探,有的甚至直接接近“腰斩”。代工厂不得不使出浑身解数,无论是裁员、代工降价、资本支出削减等举措频出,为今年走势蒙上了阴霾。</p><p>尽管台积电经营有年,长期致力于平台建设、工艺多元化,相对受损面较小,但在寒潮大势之下,台积电亦无法独善其身。</p><p>在台积电的产能利用率中,8英寸相对健康,但12英寸先进制程的较低。即便代工报价并未变化,但据称私下按客户与订单规模不同,给予优惠。并且,已调低今年第一季度营收值,预计营收为167亿~175亿美元,将同比下降12.2%~16.2%;毛利率也因产能利用率及3nm初期折旧提升,预计下降到53.5%~55.5%。</p><p>或许这还只是开始。</p><p>更有报道称,由于苹果和AMD的订单减少,台积电2023年首季5/4nm工艺节点的产能利用率将降至约75%,第二季度有可能降至70%以下。作为台积电的主要营收入来源,5/4nm工艺的产能利用率在第二季度如果进一步下滑,将导致这一工艺的营收进一步降低,如果其他工艺不能有效弥补,其营收在第二季度也就可能继续环比下滑。</p><p>从2023年全年来看,台积电面临下行周期冲击,且海外投资建厂背负高昂资本支出、各项成本大增等因素也将进一步蚕食其盈利水平,台积电的毛利率也不得不打折扣,将全年毛利率回调至53%。</p><p>至于海外建厂之路,考虑到国外产业环境与商业诉求,行业人士最后表示,台积电在美国建厂是“逼不得已”,不做也得做,但欧洲建厂对台积电来说并没有太多的利好,今年产能稼动率在持续走低,后续或犹存变局。(校对 林美炳)</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 17:49:11 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385740</guid>
            <link>https://aijishu.com/a/1060000000385740</link>
        </item>
        <item>
            <title><![CDATA[比克电池最新圆柱电池专利]]></title>
            <description><![CDATA[<p>【爱集微点评】比克电池的圆柱电池专利,通过将正极多极耳、负极多极耳设置在电极组件中同侧,减少了装配工艺流程,降低生产成本。同时便于观察到焊点尺寸及形貌,降低了电池单体制程检测难度,提高异常品检出率。</p><p>集微网消息,比克电池官宣大圆柱电池项目落户常州,该项目计划总投资高达130亿元,如果未来大圆柱电池成为发展主流,那么本土产业链将因此受益。</p><p>现有圆柱锂二次电池结构采用的结构大多为极性相反的极耳从圆柱体电极组件两端引出,导致正极耳、负极耳与二次电池金属外壳进行焊接加工或其他电连接加工时需要采取不同的方案、使用不同的设备,造成装配工序的增加、工艺难度的提高和制造成本的上升。</p><p>为此,比克电池于2022年8月12日申请了一项名为“一种新型圆柱锂电池结构”的发明专利(申请号:202210967642.3),申请人为郑州比克电池有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/609808775485.0284.png" alt="image" title="image"></p><p>图1 集流构件式剖面结构示意图</p><p>图1为本专利提出的一种新型圆柱锂电池结构,壳体1为一端有底封闭,一端开口的空心圆柱型容器,一般采用镀镍钢板或不锈钢板通过冲压拉伸一体成型。</p><p>在壳体1内部设有容置腔,容置腔内放置电极组件2。电极组件2由正极极片、负极极片、隔膜卷绕而成,电极组件2的中心为中心孔14。电极组件2的上部向上引出正极多极耳4与负极多极耳3,正极多极耳4极片箔材一般采用铝箔,负极多极耳3极片箔材一般采用铜箔,通过激光模切或其他模切方式,极片边缘的未涂覆空箔区域形成间隔分布的极耳,并在卷绕后位于电极组件2的同侧且对称于中心孔14分布。使极性相同的极耳收拢、聚合在一起。</p><p>另外,电极组件2的上方设置端盖,端盖包括主体5、极柱6、绝缘构件7、密封构件8。主体5一般选用镀镍钢或不锈钢圆片,其中心开设通孔,主体接近边缘位置设有注液孔13,可以用于封口后注入电解液及开口化成。绝缘构件7包裹极柱6外圆周表面,极柱6位于通孔内,绝缘构件7密封极柱6与端盖间隙,密封构件8采用聚丙烯(PP)、聚对苯二甲酸丁二醇酯(PBT)、可溶性聚四氟乙烯(PFA)、聚苯硫醚(PPS)或其他绝缘且耐电解液腐蚀的材料注塑成型,密封主体5与壳体1上沿。壳体1的上沿向内弯折至少90°,压合密封构件8,主体5与壳体1组成密闭空间。</p><p>此外,负极多极耳3和正极多极耳4分别电连接主体5和极柱6。极柱6的横切面为工字形,极柱6的上下两部分分别将绝缘构件7压合在主体5的上下表面上。而且壳体1上设置有向内凹陷的环形的内凹槽路9,内凹槽路9位于电极组件2与密封构件8之间,其下沿紧密贴合电极组件2上端,端盖与电极组件2之间安装正极集流构件12与负极集流构件11。</p><p>简而言之,比克电池的圆柱电池专利,通过将正极多极耳、负极多极耳设置在电极组件中同侧,减少了装配工艺流程,降低生产成本。同时便于观察到焊点尺寸及形貌,降低了电池单体制程检测难度,提高异常品检出率。</p><p>比克电池早在2005年就在深圳成立了,其核心业务包括消费数码电池、动力电池以及电池回收。其中比克电池在动力电池领域的应用范围遍布全系车型,服务全球十余家一线汽车制造商。而且自从21年发布全极耳大圆柱电池至今,比克电池已经在该领域持续领先。</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 17:49:11 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385788</guid>
            <link>https://aijishu.com/a/1060000000385788</link>
        </item>
        <item>
            <title><![CDATA[一手、二手设备进口同步承压,光刻机自立自强该如何破题?]]></title>
            <description><![CDATA[<p>集微网消息,对华先进半导体制造设备的管制之网,正越收越紧、越撒越广。</p><p>2月16日,美国商务部、司法部、FBI、国土安全调查局与12个州的检察官办公室联合组建出口管制执法“特别工作组”,以“打击非法行为者”并保护先进半导体制造设备等关键技术不被“民族国家对手”获取。</p><p>织密自家网眼的同时,这张瞄准先进半导体制造设备贸易的大网也已纳入日本、荷兰,外界普遍预计两国将看齐美商务部去年10月7日新规。</p><p>正如中国半导体行业协会严正声明所述,此举如果成为现实,将对中国半导体产业造成巨大伤害。</p><p>作为半导体制造设备中公认“最短的短板”,光刻机再次成为各界关注这一问题的焦点,不过遍观行业内外当前堪称汗牛充栋的讨论,在“要做什么”(What)的层面往往过于宏观、流于务虚,对“怎样去做”(How)更甚少着墨。</p><p>比设备禁运更巨大的威胁是什么?</p><p>回顾去年10月7日以来的不少“专家”观点,往往对美国当局的政策影响和“后手”布局预期不足,以至于在一步紧似一步的快节奏地缘因素变化中,颇有“今日割五城,明日割十城,然后得一夕安寝。起视四境,而秦兵又至矣”的被动感。</p><p>按照目前推测,日本、荷兰光刻机对华出口管制标准将是能否实现28纳米以下产品制造。部分高端DUV浸没式光刻机如ASML NXT:2050i,由于具备通过多次曝光等工艺增强方法制造7纳米、甚至5纳米先进制程产品的技术潜力,因此尽管其良率、精度上都无法与EUV光刻机媲美,但此次恐怕将很难幸免于管制罗网。</p><p>ASML财报预计,荷兰管制新规起草生效将需要“很多个月”(many months),因此在2023年内不会产生实质性影响,但这绝不意味着能够喘口气,歇歇脚。这一新规对光刻机的限制是否会涵盖相应零配件和运维服务,目前仍有相当大不确定性,需要引起国内高度关注。</p><p>作为技术复杂度极高的设备,光刻机使用过程中需要持续、高强度的运维保障,如定期针对光学镜头磨损进行像差、焦距的调整;不定期更新定标、校正、运动控制的大量软件算法;或根据晶圆厂工艺技术研发需求协助改装升级产品,提升产量或分辨率。</p><p>以ASML为例,这家“光刻巨人”配备超过9000人的客户支持团队,在中国、韩国等客户密集区域就近设有维修厂站,2022年服务板块收入就达到了57亿欧元。深入晶圆制造一线的现场工程师团队,也如同毛细血管一样,源源不断将基础数据与knowhow反馈给公司研发部门,为新产品迭代建立了坚实基础。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/600664647912.70261374332161306.1428.png" alt="image" title="image"></p><p>正因如此,假如ASML等厂商被迫停止对特定型号浸没式光刻机的运维支持,即便相关设备已经“抢购”、“抢运”到位,后续的技术升级乃至基础运维也有巨大的不确定性。有近二十年半导体厂设备材料实务经验的工程师杜元贺向集微网表示,没有原厂支持,光刻机部分软件功能将无法更新升级,而如果说软件受限还能勉强“凑合”,一旦出现大的故障,专用备件又该从何而来?</p><p>外界有观点认为,目前东亚、东南亚区域的二手半导体设备流通网络可以解决这一问题,然而在美国当局将组建“特别工作组”强化执行的情况下,这一网络的可靠性面临考验。事实上,2012年、2014年,就先后有两位中国公民因万机仪器(MKS Instruments)敏感设备转售伊朗,而遭美国执法部门海外诱捕,其中一位还是MKS中国分支机构销售经理。值得一提的是,MKS也同样是ASML的重要上游供应商,从这一案例,不难窥见美国一旦“认真起来”,对敏感技术海外地下市场流通的控制力。</p><p>更进一步展望,杜工向集微网指出,在尝到甜头后,美国当局或许会越来越激进地将光刻机等关键核心半导体设备“武器化”:“这就是高悬在我国半导体事业上的达摩克里斯之剑。随时都有可能对我进行封锁禁运,如果参照俄乌冲突,我们有任何一个地方忤逆或者没有按照美国的意愿行事,这个达摩克里斯之剑随时都会砸到我们的头上。何止DUV光刻机,哪怕美国,日本,荷兰I线光刻机,包括二手光刻机禁运,我们也将十分被动。”<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/998220003584.1417400574149634.22784.png" alt="image" title="image"></p><p>此外,在光刻工艺量测设备领域,ASML与KLA也具有垄断性优势。在KLA业已受限的情况下,ASML量测设备接着断供,影响或将向成熟制程领域进一步扩散。</p><p>破解卡脖子难关,航发带来的启示</p><p>短期来看,在日本、荷兰设备出口新规出台前,抓紧机会超量采购是国内下游厂商的当务之急。放眼长远,光刻机等关键半导体设备的自立自强无疑是必由之路。除了胜利,我们别无选择。</p><p>不过在当下,怎样实现光刻机的自立自强,舆论场上存在着相当明显的分歧。尽管多数有识之士呼吁依靠新型举国体制突围,但也有难以忽视的声音认为,过多的产业政策干预很难起到设想的作用,国产光刻机在前道制程环节的应用现状,是其核心论据。</p><p>客观地说,我国高端光刻机研发与产业化现状,的确与当下的应用急需存在一定落差,例如科技部2017年印发的《“十三五”先进制造技术领域科技创新专项规划》明确提出,光刻机及核心部件领域应实现“研制28纳米浸没式光刻机产品,进入大生产线考核;开展配套光学系统、双工件台等核心部件产品研发,并集成到整机。”</p><p>为什么历经02专项和“大基金”十余年接力,光刻机的进展依然不尽如人意?围绕这一问题,众多所谓“专家”开出了令人眼花缭乱的“诊断”和“药方”,却少有人实际梳理过相关投入情况。</p><p>事实上,回望02专项启动之初的2009年,该重大专项面向全国广泛征集项目,经过严格的筛选及“三评两审”立项程序,拟启动54个项目,其中装备整机15项、成套工艺11项、关键材料9项、关键技术与零部件11项、前瞻性研究等8项。</p><p>以上所有项目,总投资180多亿元人民币,其中光刻机能够分到多大的蛋糕不难想象,而同在2009年,ASML单年的研发投入就达到约45亿元人民币,这还是该公司遭遇产业寒冬,大幅削减研发经费的结果。</p><p>与菲薄的投入相比,我国光刻机乃至更广泛半导体制程设备的自主研发能够达到目前的进展,可以说已经堪称“奇迹”。不可否认,在02专项和“大基金”的具体推进中,也存在一些不足,杜工就谈到,国内在光刻机研发上“有点急功近利,走没有学会就想学跑。结果企业的发展就是基础不牢地动山摇。光刻机慢工出细活,那点投资杯水车薪,指望一个公司能做通光刻机全产业链是不可能的”。</p><p>对高技术复杂度产品研发规律认识不足,并非当时半导体领域所独有,事实上,今天已经彻底摆脱“卡脖子”痛楚的我国军用航空发动机,十多年前同样存在类似痼疾,以至于行业泰斗感言:“墨守单纯‘解决有无’理念,不尊重科学规律,反而阻碍发动机技术发展。事实证明,材料尚未研究成功,抗疲劳技术尚未研究,使关键基础构件成为无源之水。未研究关键基础构件就装配发动机,使发动机成为无本之木。在型号研制中‘材料、工艺攻关’、‘型号带材料’、‘型号带制造’、‘设计牵头材料、制造技术’等不科学理念和急于求成、急功近利的方法不仅研制周期较国外长,各种风险集中在型号上。”</p><p>我国航空工业之所以能够突破军用航发这一同样多学科高度综合的现代制造业结晶,关键在于咬牙吃劲的关头能够克服走捷径的诱惑,果断改变通过试验验证,基于研仿原型逐次修改的传统研制方法,咬牙走通了一个突破单项关键技术-部件验证-核心机-验证机-型号研制的完整过程,打破了0和1之间的反复循环,打开了从10到100的迭代空间。</p><p>以此观之,我国光刻机自立自强,或许也应真正经历一场关键机型完整的正向研发“洗礼”。</p><p>杜工也向集微网表示,光刻机的研发应该先学会走路,再学会跑步,与其被美国制裁指挥棒调动,疲于追赶EUV、先进DUV风口,不妨从基础的KrF乃至I线光刻机扎扎实实吃透,真正建立起技术和系统的迭代基础,而这一过程,正是新型举国体制大有作为的舞台。</p><p>他同样以军工领域两弹一星为例,指出类似中央专委、国防科工委等高层级专责机构在重大科技攻关中必不可少:“国家不仅仅应该规划光刻机研发的结果,更必须亲历亲为管理过程,单靠一家企业‘揭榜挂帅’,坐等到点验收,不适合光刻机这样高度复杂的系统,必须要协调全产业链,集中攻关突破,对于光刻机的重要零部件和系统集成,应该国家有统一的协调调度,大学科研院所,国有民营公司都要参与进来,发挥各自的优势做关键零部件,然后由有实力的公司进行系统协调,先打通上下游供应链,再系统集成。”</p><p>结语</p><p>面对拍向半导体产业链的“惊涛骇浪”,我们已无需再抱有过多侥幸、缅怀和幻想,光刻机为代表的关键核心装备自立自强,是对外部霸凌的最有力回答。</p><p>已然化身科技自立自强进程“试金石”的光刻机,当下无疑承载了太多应有或不应有、合理或不合理的焦虑指点,但从另一个角度看,这样的喧嚣,恰恰也折射出全社会对技术进步的渴望和期待,这样的志气和心气在,终将推动我们不屈不挠地抵达胜利彼岸。</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 17:49:11 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385768</guid>
            <link>https://aijishu.com/a/1060000000385768</link>
        </item>
        <item>
            <title><![CDATA[极海如何做到后视镜“丝滑”调控?]]></title>
            <description><![CDATA[<p>【爱集微点评】极海的后视镜调节专利,通过提供方向盘域控制器、行驶域控制器、后视镜控制器以及后视镜电机等设备,使其能够根据方向盘角度信号和车辆速度信号对后视镜进行连续调控。</p><p>集微网消息,近日极海推出性能高、存储强、连接广的车规级MCU,其实随着汽车电子的多样性发展,极海在汽车电子领域已经为用户展现了众多技术实力,其中就包括车辆相关芯片。</p><p>目前,车辆的后视镜调节技术通常是通过采集车辆的角度信息、全球定位系统(Global Positioning System,GPS)接收器信息和地图信息等进行后视镜的自动控制,需要获取的信息冗余,设计复杂。实际使用中,由于变道的转向角不同,视野存在差异且随着转向过程中盲区也是不断发生变化,因此无法实现对后视镜的连续调控。</p><p>为此,极海于2021年11月24日申请了一项名为“后视镜调节系统、方法和微处理芯片”的发明专利(申请号:202111410716.5),申请人为珠海极海半导体有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1124881063527.1484.png" alt="image" title="image"></p><p>图1 后视镜调节系统的结构示意图</p><p>图1为本专利提出的一种后视镜调节系统的结构示意图,后视镜调节系统10所包含的模块如上图所示。其中,方向盘角度传感器11和车辆速度传感器12分别用于采集车辆的方向盘角度信号、车辆速度信号。方向盘域控制器13可以用来接收方向盘角度传感器11采集的方向盘角度信号,并将方向盘角度信号传递至后视镜控制器15。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1412352318357.311.png" alt="image" title="image"></p><p>图2 后视镜调节系统的具体结构示意图</p><p>图2为图1中从方向盘角度传感器到后视镜电机的示意图,方向盘域控制器13包括:A/D转换器131、中央处理器132、电源135、复位136、存储器137、第一CAN控制器138和第一CAN收发器139。</p><p>A/D转换器131用于将模拟信号的方向盘角度信号转换为数字信号的方向盘角度信号,并将转换为数字信号的方向盘角度信号发送至中央处理器122。中央处理器132用于处理数字信号的方向盘角度信号,并根据上述的方向盘角度信号生成“驱动”后视镜控制器15的处理单元151开始计时的命令信号。此外还将数字信号的方向盘角度信号传递至第一CAN控制器138,其用于将方向盘角度信号打包成CAN数据包,并将CAN数据包发送至第一CAN收发器139。第一CAN收发器139用于将CAN数据包转换为电压信号,并将电压信号发送至总线17,以使电压信号通过总线17传输至后视镜控制器15,在后视镜控制器15中可执行相关CAN数据的解包获得方向盘角度信号。</p><p>后视镜控制器15在接收到方向盘角度信号或车辆速度信号后开始计时并生成计时信息。根据方向盘角度信号、车辆速度信号和计时信息得到目标角度以及生成电机控制信号,同时将电机控制信号发送至后视镜电机16。能够优化后视镜调节的智能响应,避免意外触发后视镜转向,保证行驶安全。</p><p>简而言之,极海的后视镜调节专利,通过提供方向盘域控制器、行驶域控制器、后视镜控制器以及后视镜电机等设备,使其能够根据方向盘角度信号和车辆速度信号对后视镜进行连续调控。</p><p>极海是一家致力于开发工业级/车规级微控制器、高性能模拟芯片及系统级芯片的集成电路设计型企业,其团队拥有多年集成电路设计经验和嵌入式系统开发能力。极海在科技创新中持续投入了大量的精力,不断加速产业升级,为广大用户带来更优质的产品及方案。</p>
                                                    ]]></description>
            <pubDate>Tue, 21 Feb 2023 17:49:11 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385764</guid>
            <link>https://aijishu.com/a/1060000000385764</link>
        </item>
        <item>
            <title><![CDATA[本源量子提出量子计算任务异常发现方法]]></title>
            <description><![CDATA[<p>【爱集微点评】本源量子的量子计算机专利,通过提出的量子计算机架构使得在量子计算任务的执行过程中及时发现异常,有效提高了量子计算机执行量子计算任务的效率。</p><p>集微网消息,本源量子作为中国第一家量子计算公司,一直钻研量子相关技术,近日中国最新量子计算机“悟空”即将在这里诞生。</p><p>量子计算机与经典计算机一样,其核心都是为了解决某种问题而进行的数学计算。在量子计算机执行量子计算任务时,在各个阶段均有可能会出现异常情况,现有技术中判断量子计算机运行过程中是否出现异常时需要人工参与,且只能在量子计算任务的执行结果出现错误时才能发现,效率极低。目前在量子芯片中量子比特位数不多的情况下,采用现有的方案尚能勉强支持,但是随着量子技术的不断研究,在可预期的未来,必然会出现大规模甚至超大规模的量子芯片,届时需要解决的量子计算任务肯定会更加复杂。与之对应地,量子计算机需要面临的异常情况也将更加频繁且复杂。如果还是按照现有的技术方案,那么量子计算机在执行量子计算任务时的效率将会极低。</p><p>为此,本源量子于2022年2月28日申请了一项名为“量子计算机”的发明专利(申请号:202210191402.9),申请人为合肥本源量子计算科技有限责任公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1569703232406.8203.png" alt="image" title="image"><br>图1 量子计算机的结构示意图</p><p>图1为本专利提出的一种量子计算机的结构示意图,主要包括量子计算任务接收设备100、编译设备200、量子控制设备300、量子处理器400以及与编译模块和量子控制设备300通信连接的监控设备500。</p><p>其中量子计算任务接收设备100被配置为接受量子计算任务,编译设备200可以对量子计算任务进行编译处理,并输出对应的任务数据包。量子控制设备300和量子处理器400分别用于对当前任务数据包输出相应的调控信号以及执行量子计算任务。而监控设备500可以对编译设备200和量子控制设备300进行状态监控并分析编译设备200和/量子控制设备300是否发生异常情况。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/235340009981.79117.png" alt="image" title="image"></p><p>图2 量子计算机监控设备的结构示意图</p><p>图2为量子计算机监控设备具体的结构示意图,监控设备主要包括信息采集模块501、异常判断模块502、异常类型辨别模块503、异常存储模块504、异常更新模块505以及异常处理模块506。</p><p>其中,信息采集模块501和异常判断模块502分别从编译设备200/量子控制设备300中获取编译处理以及调控信号的第一相关信息,并判断是否发生异常情况。异常类型辨别模块503在得到异常判断模块502的结果后用于分辨具体的异常类型(硬件异常和软件异常)。异常存储模块504会预先存储设置的异常情况以及对应的异常类型,而异常更新模块505则对该存储数据进行更新,以便在后面碰到相同问题时可以及时辨别以及处理。最后,异常处理模块506会对相应的异常进行处理,解决策略包括重新启动编译设备200或对量子控制设备300进行复位等。</p><p>简而言之,本源量子的量子计算机专利,通过提出的量子计算机架构使得在量子计算任务的执行过程中及时发现异常,有效提高了量子计算机执行量子计算任务的效率。</p><p>本源量子是国内量子计算龙头企业,聚焦于量子计算产业生态建设,打造自主可控工程化量子计算机,积极推动量子计算产业落地,并探索量子计算产业应用。随着量子计算成果的逐渐推进,相信在不久将来,本源量子一定可以实现“让量子计算走出实验室,真正为人类服务”这一宗旨。</p>
                                                    ]]></description>
            <pubDate>Sun, 19 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385458</guid>
            <link>https://aijishu.com/a/1060000000385458</link>
        </item>
        <item>
            <title><![CDATA[小鹏汽车减少充电桩终端器件的损耗]]></title>
            <description><![CDATA[<p>【爱集微点评】小鹏汽车的充电桩专利,在充电枪供电或断电的切换过程中,摒弃了纯终端实现的方式,而是采用主机开启或关闭供电,实现了对于充电枪供电和断电的切换过程中减少终端器件损耗的效果。</p><p>集微网消息,据统计超过九成的充电桩生产企业近日已经复工了,今年充电桩在生产淡季产量仍迎来突破,随着新能源汽车销量的不断增长,充电桩的需求水涨船高。</p><p>随着新能源的不断发展,充电桩也正在不断的增设中。现有的充电桩主要由两部分组成,一部分是用于控制充电枪的充电控制结构,通常习惯于称之为终端,另一部分是用于对输入电源进行整流的整流控制结构称为主机。充电桩的使用过程中会存在供电和断电的切换,例如断电切换包括带电拔枪或出现异常断开等情况,此时需要迅速切断提供给充电枪的电能,传统技术中往往是在通流状态下直接关断充电控制结构一侧的接触器,该方式较为简单快速,但是长期使用该方式进行切换容易造成充电控制结构一侧的接触器主触点粘连,此时非但达不到切断电能的目的还具备一定的危险性,而且还加快了充电控制结构一侧的接触器损耗速度,增加运维成本的问题。</p><p>为此,小鹏汽车于2022年6月27日申请了一项名为“充电桩控制系统、充电桩及充电桩系统”的发明专利(申请号:202210744552.8),申请人为广州小鹏汽车科技有限公司。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/440317574971.7564.png" alt="image" title="image"></p><p>图1 充电桩控制系统的结构示意图</p><p>图1为本专利提出的一种充电桩控制系统的结构示意图,主要包括主机2和一个或多个终端1,终端1与主机2设于不同柜体内。其中终端1用于检测充电枪的状态信息,基于状态信息生成第一控制指令,并将第一控制指令发送至主机2。主机2包括一个或多个供电模块21,供电模块21用于为充电枪提供电能,而主机2基于第一控制指令控制对应的供电模块21的开启或关闭。</p><p>在实际使用时,上面场景主要应用于分体式的直流充电桩,主机2主要起到与电网连接将电网的交流电转换为直流电的作用,并将转换后的电源输送至终端1;而终端1则主要起到与充电枪连接的作用,例如终端1通过获取充电枪是否与电动汽车进行连接、用户是否对终端1进行充电操作如扫码或刷卡等信息,确定需要为充电枪进行供电或者断电。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1087328373158.4751.png" alt="image" title="image"></p><p>图2 充电桩控制系统的使用场景示意图</p><p>图2为充电桩控制系统的使用场景示意图,当充电枪4从电动汽车5上拔出时,此时终端1检测到充电枪4的状态信息为充电枪4与电动汽车5断开连接的电信号,因此生成需要关闭供电的第一控制指令,并将关闭供电的第一控制指令发送至主机2。主机2接收到关闭供电的第一控制指令时,基于第一控制指令确定为该充电枪4供电的一个供电模块21,并关闭该供电模块21,以此实现通过主机2断开充电枪4电流的效果。最后在终端1检测到无供电模块21的电流输出时,则关闭终端1用于控制充电枪4的开关元件如接触器进行断开,以此起到了开关元件在无电流的情况下进行闭合,大大减低了开关元件的损耗。</p><p>简而言之,小鹏汽车的充电桩专利,在充电枪供电或断电的切换过程中,摒弃了纯终端实现的方式,而是采用主机开启或关闭供电,实现了对于充电枪供电和断电的切换过程中减少终端器件损耗的效果。</p><p>作为一家专注未来出行的科技公司,小鹏汽车自成立的7年多以来,在国内、北美等地均设立研发中心,完成了全球化布局。同时坚持以开放包容的态度,吸纳全球各界人才,现在已经成为国内领先的智能电动汽车公司之一。相信在未来,小鹏可以在智能电车领域中取得更多硕果。</p>
                                                    ]]></description>
            <pubDate>Sun, 19 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385445</guid>
            <link>https://aijishu.com/a/1060000000385445</link>
        </item>
        <item>
            <title><![CDATA[普莱信智能提高芯片封装效率和精度]]></title>
            <description><![CDATA[<p>【爱集微点评】普莱信智能的芯片封装专利,通过对点位轨迹速度曲线进行优化调节,降低总运动时间。同时限制允许激起能量强度值,能够提高芯片封装效率、防止速度规划超调、提高芯片封装控制的精度。</p><p>集微网消息,普莱信智能深耕半导体封装领域多年,近日,普莱信智能从15737家广东省创新型中小企业中脱颖而出,荣获广东省“专精特新”中小企业。</p><p>随着集成电路产业的快速发展和芯片制造工艺的不断提高,小型化、多引脚、细间距的芯片对其封装设备高加速运动系统的响应能力、定位精度、定位时间等伺服性能提出了更高的要求。芯片封装的快速高精度定位要求主要通过加速度、定位精度和运行时间三个方面的参数进行体现。但是,由于芯片封装控制系统具有短行程高加速高速高精度定位的特点,且位移相对固定,现有技术方案难以发挥作用。因此,亟需一种用于芯片封装控制的速度规划方法,以提高芯片封装精度、降低所需时间。</p><p>为此,普莱信智能于2021年4月7日申请了一项名为“芯片封装控制的速度规划方法及芯片封装控制装置”的发明专利(申请号:202110373352.1),申请人为东莞普莱信智能技术有限公司。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1279684058249.9426.png" alt="image" title="image"></p><p>图1 芯片封装控制的速度规划方法示意图</p><p>图1为本专利提出的一种芯片封装控制的速度规划方法示意图,封装控制的点位轨迹速度曲线为非对称S曲线,点位的运动通过轴电机驱动。其中非对称S曲线按加减速特征划分为七个运行阶段:加加速段0T1、匀加速段T1T2、减加速段T2T3、匀速段T3T4、加减速段T4T5、匀减速段T5T6和减减速段T6T7。</p><p>实现的具体规划方法如下,首先设定插补周期、启动端插补周期数量、停止端插补周期数量、允许激起能量强度值、调节变化率上限、速度修改分辨率、加速度修改分辨率。根据如图1所示的各个参数间关系,设定初始速度Vs、结束速度Ve、最大速度Vmax、最大加速度A、最大减速度D、加加速度Ja、减加速度Jd、位移值S。</p><p>之后通过Vs、Vmax、A、D、Ja、Jd、S,计算点位轨迹速度曲线,获取总运动时间Tb;若是首次计算Tb,使Ta=Tb。接着根据插补周期、启动端插补周期数量、点位轨迹速度曲线,计算启动端各单个插补周期设备运行速度频率所激起的能量强度。然后计算得到各个插补周期的能量强度之和,并判断是否大于允许激起能量强度值,最后根据两者大小以及Ta、Tb的值对相关参数进行调节。</p><p>比如当能量强度之和大于允许激起能量强度值时对A、D、Ja、Jd进行优化调节,直至能量强度之和小于允许激起能量强度值,从而抑制芯片封装系统中轴电机的震动造成的残余振动,提高芯片封装控制的精度。此外,还可以调节A、D、Ja、Jd使总运动时间Tb减小,从而提高芯片封装效率。同时通过速度修改分辨率、加速度修改分辨率约束A、D、Ja、Jd的调节幅度,以此控制参数调节结果的变化率,防止速度规划超调。</p><p>简而言之,普莱信智能的芯片封装专利,通过对点位轨迹速度曲线进行优化调节,降低总运动时间。同时限制允许激起能量强度值,能够提高芯片封装效率、防止速度规划超调、提高芯片封装控制的精度。</p><p>普莱信智能在创立之初,就汇聚了运动控制、算法、机器视觉、直线电机、半导体设备和自动化设备领域的资深人士,希望在未来,普莱信智能可以继续通过国际级的先进技术来提高国内制造业水平,最终助力实现中国制造的智能化升级。</p>
                                                    ]]></description>
            <pubDate>Thu, 16 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385153</guid>
            <link>https://aijishu.com/a/1060000000385153</link>
        </item>
        <item>
            <title><![CDATA[PA去库存临近尾声 2023或成模组化元年]]></title>
            <description><![CDATA[<p>集微网报道(文/王小方) 阴云笼聚于上空,一道期待已久的曙光终于浮现眼前。据供应链消息,在经历了近一年半库存去化阶段后,随着智能手机厂商2022年囤积的PA库存不断出清,库存去化已逐渐步入尾声,并有望于今年Q1或Q2正式完结。</p><p>预计2023年伴随着终端厂商库存去化及消费者预期转好,智能手机等消费电子终端需求将逐步复苏。不过,由于需求端尚未产生十分明朗的复苏信号,PA厂商在短期内的压力依旧很大,它们既要应对当下的内卷困局,也需要瞄准未来的市场机会抢先下注。</p><p>5G仍是最强增长动能</p><p>对国内PA厂商而言,深陷长达一年半的库存去化周期,着实是一段备受煎熬的日子。不过,想要真正理解这一漫长的库存去化周期,还得追溯前因。</p><p>据IDC发布的数据显示,2020年全球智能手机市场出货量为12.92亿台,同比下跌5.9%。进入2021年后显露出些许回温势头,智能手机市场似乎已经从“黑暗期”中走出,再加上华为遭受美方制裁,释放出大块市场份额,各大手机厂商自然想要抓住这一难得契机,在2021年下半年间纷纷超额下单、致使库存水位快速上涨。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1284795508459.52441587226810157.241.png" alt="image" title="image"></p><p>图 集微网整理(数据来源 IDC)</p><p>由此可见,后来的库存积压与此前的“囤货潮”有着密切关联,根本原因在于彼时手机厂商对市场预期过于乐观,不曾料想仅数月后便转入库存调整期。而后在俄乌战争、通货膨胀、加息等因素的影响下,用户的消费需求进一步萎缩,库存去化不得不拉长战线。为了缓解库存压力,手机厂商也不得不减缓线下渠道的扩张节奏,追求更稳健的渠道布局。</p><p>在下游吃紧的形势下,寒气早已弥散至产业链各大环节。从代工方面看,受手机厂商库存去化影响,在2022年里稳懋、宏捷科、全新等上游砷化镓代工厂的产能利用率一再下滑,营收都跌至近年来的最低点。据一位业界资深人士透露,目前砷化镓代工产能存在一定程度过剩,几大头部厂商的平均产能利用率估计还不到60%。不过,砷化镓的富余产能可能会逐渐用于高性能滤波器、氮化镓等第三代半半导体的开发和规模化生产。</p><p>据IDC于不久前披露的数据显示,2022年全球智能手机出货量同比下降11.3%至12.1亿台,创下2013年以来的最低年度出货量。就国内市场而言,2022年中国智能手机市场出货量约为2.86亿台,同比下降13.2%。不过,IDC认为2023年销量将会出现反弹,预计2023年全球智能手机出货量达12.7亿部,同比增长2.8%。</p><p>“就国内一月的增长情况看还是不错的,智能手机的销量每周都在攀升,这可能源自疫情放开后报复性的消费反弹,最终全年销量有望超乎先前预期。总体而言,今年国内智能手机市场最终销量小幅上涨的概率是比较大的,但全球市场的情况则没有这么乐观。”爱集微咨询业务部副总赵翼说道。</p><p>即便面临库存积压和需求不振的挑战,但5G带来的巨大市场机会并未消退。同时,5G也给设计带来了不小的挑战,射频前端的采购流程、系统设计的复杂度都大幅提升,射频前端方案也在加快由分立射频元件向整合型模组化方向演变。</p><p><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1022597149254.901346882222080.9907.png" alt="image" title="image"></p><p>图 集微网整理(数据来源 IDC)</p><p>就长期趋势而言,在5G的牵引下,国产射频前端向高端化、模组化突破的大方向不会动摇。本月初,据中国台湾省媒体报道,联发科和高通均决定不再推出新4G手机芯片,这反映出国际厂商主推5G、退出4G的决心,将导致5G总体市场份额增加,也将推动相关厂商增加对5G PA的布局。</p><p>目前,国内智能手机市场已初步显现回暖迹象,但由于这一观察时间区段较短,如果增长势头能持续到2023年Q1末,整个市场止跌回升的概率将大幅增加,届时产业链对于市场复苏的信心也将明显回升。</p><p>2023年有望成为PA模组化元年</p><p>就长期发展而言,射频前端行业在2022年出现的波动是暂时的,大趋势仍将是产业的长期增势。目前,去库存阶段已经逐渐不再是问题,在通货膨胀的背景下,需求端何时真正复苏才是当下业界真正关心的问题。</p><p>“目前,在国内射频前端产业中,头部PA厂商具有明显的规模效应优势,有了4G上的积累,相信5G也将是国产公司的天下。”赵翼进一步指出,“接下来,对射频前端的资源整合能力将更加凸显,能不能做好PA与滤波器之间的融合,将是PA公司制胜的关键。此外,在库存压力逐步缓解和疫情政策放开的双重刺激下,头部PA公司的产值预计将稳定增长。”</p><p>盛世投资管理合伙人、盛世智达总经理陈立志认为,国内PA厂商正逐步向高端产品市场迈进,呈现出高度集成化的趋势,模组化和射频前端全覆盖成为主力方向。长远来看,国内PA领域具有马太效应,龙头厂商与其他厂商的差距将会越来越大,行业有望迎来并购、合作的潮流。</p><p>从投融资方面看,随着资本市场逐渐趋于理性,对芯片设计公司的投资趋于谨慎,初创公司融资愈加困难,加上PA产能过剩导致的竞争加剧,面临较高的洗牌风险,正在加速市场出清;另一方面,头部PA厂商纷纷冲刺IPO,追求更高层次的发展,整个行业将逐渐淡出价格战,行业竞争将逐渐进入相对合理的阶段。</p><p>一位业界资深人士表示,随着PA厂商在高集成度模组产品上不断取得突破,2023年有望成为中国PA公司的模组化元年。目前,对于当前的内卷局面,PA厂商应该从设计层面下功夫,通过新颖的设计降低成本,为客户提供更具性价比的产品方案,这样才能既保障自身的毛利率,又能给客户带来更好的成本优势,而不是靠融资去补贴客户,从而将行业拉入内卷的泥淖。</p><p>目前,大多数国内PA厂商几乎全部收入都来自于手机业务,而国际巨头厂商非手机业务收入占比较高,如Skyworks的非手机业务收入占比在2022年已达36%。因此,对于国内PA厂商而言,还需在手机之外开拓更多市场,丰富产品线并进一步提升竞争力,寻找新的增长点。</p><p>陈立志认为,虽然不免受到行业内卷与市场需求低迷的直接影响,但对于国内PA厂商而言,机遇与挑战并存,一方面在5G基站、AIoT、可穿戴设备、汽车电子等方面,对于高端化、集成化PA产品的需求持续旺盛;另一方面,受国际局势影响,下游客户对于国产替代的意愿十分强烈。</p><p>“近年来,国际局势愈加扑朔迷离,贸易摩擦和专利冲突增加,这要求国内厂商提高知识产权保护意识,加快建设知识产权体系。”陈立志还特别提及。</p><p>就产业发展趋势而言,随着手机厂商逐渐走出库存去化周期,5G依旧会带来巨大的成长机会,模组化的突破也逐渐显露成效,国产射频前端的成长步伐不会减慢。</p>
                                                    ]]></description>
            <pubDate>Thu, 16 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385145</guid>
            <link>https://aijishu.com/a/1060000000385145</link>
        </item>
        <item>
            <title><![CDATA[代工业亮出“家底”:狂欢之后准备过冬?]]></title>
            <description><![CDATA[<p>集微网报道(文/李映)代工业的“全家桶”在财报陆续出炉之后基本集齐,也都亮出了各自的家底。</p><p>受宏观经济下行影响,全球2022年消费电子市场需求走向疲软,而代工业可谓逆风而行,</p><p>交出了一份“普涨”的成绩单。</p><p>但要看到的是,由于终端需求反映到代工订单的滞后性,代工厂在去年第三和第四季度已在承压前行。当这一份“寒意”传导至2023年之际,眼见冲击更甚,无论是代工降价、产能稼动率降低、资本支出削减等举措频出,为今年代工业走势蒙上了阴霾。</p><p>全年营收“普涨” 但季收已现跌势</p><p>久坐“铁王座”的台积电表现依旧抢眼。2022年营收创下751亿美元的纪录,同比增长42.6%。而利润增长逾70%,同样创历史新高。以第四季度来看,台积电营收约合1386.8亿元,毛利率超过此前预期,达到62.2%,营业利润率为52.0%,毛利率和营业利率双双创新高。</p><p>作为全球代工“榜眼”的三星,尽管受多重因素影响利润暴跌90%以上,但在代工方面,上季和2022年全年营收都创新高,其利润或超过约109.79亿人民币,这一数字反映了其先进制程产能的扩大。据透露,三星全年8nm以下营收占总营收的六成。</p><p>反观英特尔虽然2022年第四季度和全年营收大幅下挫,但代工业务增势明显。2022年其代工服务同比增长14%,第四季度营收为3.19亿美元,同比增长30%。</p><p>可以说,先进工艺三雄能够在下行周期逆势增长,一方面说明凭借多年的积淀,有着较强的抗周期和风险能力,另一方面消费市场疲软对成熟制程代工冲击较大,而对先进工艺影响甚微。</p><p>围绕着成熟制程的争夺,联电、格芯、中芯国际、华虹等代工厂商也冲出了下行“风暴”,交出了飘红的答卷。2022全年度联电营收折合人民币约622.41亿元,年增30.84%;格芯2022年营收同比增长23%,为81.08亿美元。</p><p>同为国内半导体代工双雄,中芯国际2022年全年营收突破72亿美元,同比增长34%,实现2021年、2022连续两年年增幅超过三成;而华虹得益于在成熟工艺上的深耕,以及汽车芯片、功率器件等需求的大幅增长,实现全年营收达24.75亿美元,逆势增长51.8%,创下历史新高。</p><p>但受行业下行周期所致,大多数代工厂商第四季度的产能利用率已开始下探,让行业切身感受到寒潮已至。如联电晶圆出货量比前年同期减少14.8%,整体产能利用率降至90%。</p><p>毛利润“分化” 产能利用率持续下探</p><p>如果说2022年全年营收还在基本水准之上,但从毛利率变化也可看出成熟工艺与先进工艺之前仍存“落差”。</p><p>台积电的毛利率依旧维持“高位”。2022年全年毛利率高达59.6%,比2021财年的51.6%涨了8个百分点,不得不说先进工艺居功至伟。据财报显示,其16nm占比13%,7nm占比27%,5nm占比26%,总计超66%。而且有,随着台积电在3nm工艺量产在加速推进,据预计3nm及升级版3nm制程的产品将贡献台积电2023年营收的4%至6%。<br><img referrerpolicy="no-referrer" src="http://s.laoyaoba.com/jwImg/1615500030471.139195447789652.77463.jpg" alt="image" title="image"></p><p>同为成熟制程工艺擂台上的竞技者,联电表现相对出色,平均毛利率增至45.1%,比去年33.8%大增一成以上,而格芯、中芯国际和华虹的毛利率则集中于30%左右,完全竞争市场的激烈度可见一斑。</p><p>而且由于各家Fab厂工艺定位、产品结构、合作客户的不同,一位业内人士表示,下行周期对于经营有年,长期致力于平台建设、制造平台多元化的代工厂的影响相对较小。</p><p>如华虹营收保持长期成长,其有竞争力的特色工艺组合功不可没,且抓住了国内汽车电子和工业电子等高成长产业,进一步提升了营收质量。而格芯第一大收入来源智能设备业绩在第四季度大幅下滑至8.23亿美元,同比、环比下降幅度分别达7%和14%,但家庭与工业物联网、通信和数据中心业务则同比大增64%和27%,汽车业务也在强劲增长,因而对冲之下业绩依旧飘红。</p><p>但代工业看似已行至“龙卷风”中心,避无可避。集微咨询认为,从业绩表现来看,代工业整体处于向上发展态势,但毛利率均有所下降,且由于终端需求变化反馈到代工的时间差,去年第三季度和第四季度已释放出了危险信号,今年第一、二季度行情不太乐观,产能利用率下滑明显,代工厂需多管齐下开源节流。</p><p>有分析称第二梯队的晶圆代工厂,12英寸产能利用率在2023年第一季度平均落在70~80%,有部分到60%;而8英寸平均落在60~70%,也有部分落在50%左右,可谓是断崖式下跌。</p><p>不得不说,产能利用率的大幅下降对营收和毛利率的冲击也是“立竿见影”。台积电率先承认,受半导体产业持续调整库存及季节性淡季的双重影响,2023年第一季度营收为167~175亿美元,将同比下降12.2%~16.2%;毛利率也因产能利用率及3nm初期折旧提升,预计下降到53.5%~55.5%。格芯也预计第一季度营收将处于18.10亿至18.50亿美元之间,毛利率降至27.1%。格芯称,产能利用率的下降同步拉低了毛利率。</p><p>多方救火 2023年上半年准备过冬</p><p>产能还是产能,看来已成为代工业的新“魔咒”。而产业共识是代工产能利用率的回升将从第二季度开始,真正回到接近满载的产能利用率要到下半年甚至是年底。</p><p>上述人士也指出,从产品结构来看,消费类如手机、笔记本电脑等还处于库存消化阶段,加之终端需求的恢复和消费信心的提振还需要时间,反映到产能利用率的提升也就需要更长的周期。</p><p>为此集微咨询建议,代工厂一方面可减少人力成本,一些企业已祭出裁员的举措;另一方面则着力降低资本支出,包括设备支出、扩产调整等。此外,可为客户提供相应的优惠价格,以维持更多的订单量。</p><p>各大代工看似已在准备“过冬”,均在谨慎调整资本支出。</p><p>台积电2023年的资本支出为320亿-360亿美元,而最初估计为400亿美元。联电也称,应对需求低迷,联电已进行严格的成本管控措施,并尽可能推迟部分资本支出。而中芯国际因着力成熟产能扩产及新厂基建,2023年的资本开支将与2022年大致持平。</p><p>此外,最近传出的代工价格降价成为这一“艰难”时期的注解。</p><p>据报道,三星、力积电、格芯等传出直接降价消息;台积电、联电、世界先进等代工价并未变化,但私下与客户协调给予优惠,以维持ASP(平均销售价格)与毛利率。由 “供不应求”到纷纷降价,代工厂商的价格战已然打响。</p><p>值得一提的是,尽管产能利用率均在降低,但3nm等先进制程的进度仍在不断推进。有分析称,台积电4/5nm甚至3nm工艺的产品仍可维持产销平衡。</p><p>无论如何,2023年上半年对于代工业来说或许真的是“凛冬已至”。</p>
                                                    ]]></description>
            <pubDate>Thu, 16 Feb 2023 16:00:00 GMT</pubDate>
            <guid isPermaLink="false">https://aijishu.com/a/1060000000385139</guid>
            <link>https://aijishu.com/a/1060000000385139</link>
        </item>
    </channel>
</rss>

...

@TonyRL TonyRL merged commit 12c639d into DIYgod:master Feb 27, 2023
nullqwertyuiop pushed a commit to nullqwertyuiop/RSSHub that referenced this pull request Mar 1, 2023
* channel ok

* index ok

* code complete

* add docs for aijishu

* fix deepscan

* 1. use friendly url 2. remove duplicated leading slash in api url

* fix docs and radar
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Auto: Route Test Complete Auto route test has finished on given PR Route: v2 v2 route related
Projects
None yet
Development

Successfully merging this pull request may close these issues.

aijishu.com 极术社区
2 participants