最新流出的DeepSeek R1推理基准测试显示,Radeon RX 7900 XTX在运行这款爆火AI模型时,竟以15%的效能优势碾压RTX 4090。这场看似不可能的逆袭,背后藏着AMD怎样的破局逻辑?
继续阅读
CXL SSD的性能是如何提升的
近期的研究开发和模拟了利用CXL接口加速固态硬盘(SSD)。他们旨在通过接口提供一个比全DRAM池更便宜的大型持久内存池
继续阅读Google AI TPU
近期的研究开发和模拟了利用CXL接口加速固态硬盘(SSD)。他们旨在通过接口提供一个比全DRAM池更便宜的大型持久内存池
继续阅读CXL(计算快速链接)是一种开放的行业互连标准,可在主机处理器和设备(如加速器、内存缓冲区和智能I/O设备)之间提供高带宽、低延迟连接。
继续阅读无论用于深度学习应用程序、大规模并行处理、密集型 3D 游戏或其他要求严苛的工作负载,人们希望当今的系统可以执行比以往任何时候都要多的任务。
继续阅读poll和select一样,都是Linux下I/O复用模型的一种实现。和select相比,poll主要在数据结构上有一些变化,通常情况下select最大描述符为1024
继续阅读我们知道在Linux中一切皆文件,那么一台服务器最大能打开多少个文件呢?Linux上能打开的最大文件数量受三个参数影响,分别是:
继续阅读当涉及选择服务器存储方案时,硬盘驱动器(HDD)和固态驱动器(SSD)都是常见的选项。
继续阅读在2023年“Linux存储、文件系统、内存管理和BPF峰会”的首日全体会议上,Stephen Bates主持了一场关于“点对点DMA(P2PDMA)”的讨论。这个想法的核心在于,从一个连接了PCIe的设备向另一个设备传输数据时,消除主机系统的介入。
继续阅读不管你是否考虑使用卸载卡、SmartNIC、GPU、DPU还是SPU,有一点是肯定的,它们并非都是相同水平的。
继续阅读请妥善利用源代码!如果这方面的工作还没有列入您的重要事项,那么现在就请设想一下,您的团队将在两个方面受到局限:一是修改代码的能力,二是技术支持的长期可用性。
继续阅读如果说曾经的RISC-V是沿着ARM的道路前行,努力做好“替代”的工作,那AI时代的RISC-V就获得了超越ARM的机会。
继续阅读