2026.07.02

打造安全高效的本地AI基础设施

分享：

前言

随着生成式AI、AI代理（AI Agents）与企业级AI应用持续扩展，企业正逐渐将目光从云端转向更贴近自身数据的AI部署方式。在数据主权、安全性、延迟性与长期运营成本等考量日益受到重视的驱动下，端侧（On-Premises）AI基础设施已成为企业追求更高掌控力、效能与可扩展性的战略性选择。

为何选择端侧AI

- 数据自主与安全
对于需要管理敏感信息的企业而言，将AI工作负载保留在端侧，能够完全掌握数据集、AI模型与知识产权。在受控环境中处理数据，有助于简化法规遵循流程，降低网络安全风险，并免除将机密信息传输至公有云服务的必要性。

- 低延迟AI效能
包括AI安全防护、工业自动化、智慧影像分析以及企业级智慧助理（Copilot）在内的关键任务型AI应用，都需要具备即时推理能力与可预测的效能表现。端侧部署不仅能消除网络延迟，还能为AI推理、模型再训练与微调提供专属运算资源，无需承担反复产生的云端运算费用。

- 面向多元AI工作负载的弹性基础设施
不同AI应用对基础设施的需求差异非常大。部分工作负载依赖高强度GPU运算，另一些则更注重网络带宽、存储吞吐量或加密运算加速。端侧平台可根据特定工作负载需求，灵活配置CPU、GPU、内存、存储、网络与PCIe扩展，使基础设施能够随着AI模型快速演进而同步扩展。

端侧AI基础设施的核心构成要素

- 高效能运算
结合强大的CPU与GPU的均衡架构，是现代AI基础设施的根本基础。CPU负责数据预处理、系统调度、存储与应用服务，GPU则加速AI训练、微调与推理作业。面向未来的平台设计，支持最新的服务器级处理器、大容量内存、高速PCIe扩展能力以及可扩展的GPU配置。

- 高速网络
随着AI模型规模持续扩大，网络效能已与运算效能同等重要。高带宽以太网连接能力，可确保AI服务器、存储设备、边缘装置与云端资源之间实现高效通信，同时将分布式训练与推理过程中产生的瓶颈降至最低。弹性的NIC配置设计，也让企业能够随着AI工作负载演进调整网络效能。

- 安全加速
保护AI数据与专有模型，需要在存储、传输与处理的各个环节均采用加密措施。相较于以软件方式加密而耗费宝贵的CPU运算资源，采用如Intel QuickAssist Technology（Intel QAT）等硬件加速技术，能够将加密运算工作卸载处理，同时提升安全性与整体系统效能。

AEWIN：完整的端侧AI基础设施解决方案

- 面向AI运算打造的AI服务器
AEWIN提供完整的AI服务器产品组合，专为AI推理、模型再训练、微调与高性能运算而设计。通过支持最新的服务器级处理器、GPU加速器、大容量内存以及灵活的PCIe扩展能力，AEWIN平台让客户能够根据多元AI部署场景灵活配置算力资源，并通过模块化平台设计加快产品上市速度。

- 打造安全AI连接的网络设备
安全的网络架构是企业级AI基础设施不可或缺的关键环节。凭借在高性能网络平台领域深耕数十年的专业技术，AEWIN的网络设备与模块提供灵活的以太网连接能力，确保AI服务器、存储系统与分布式AI环境之间的安全通信。为进一步强化安全性与效率，AEWIN支持Intel QAT加速卡，将加密、解密与压缩工作负载从CPU卸载，同时维持高网络吞吐量。

- 面向可持续AI打造的两相直接液冷解决方案
随着AI算力密度不断提升，高效散热管理已成为维持系统效能并控制运营成本的关键。AEWIN整合旗下子公司其曜科技（Arivor）所研发的两相直接液冷（2P DLC）解决方案，并搭配机柜内的冷却液分配单元（CDU），共同支撑下一代AI基础设施。
相较于传统风冷方式，2P DLC能够显著提升散热效率、提高机柜密度、降低功耗，并改善整体可持续性。该方案使企业在部署高密度GPU集群的同时，降低能源消耗，并为数据中心未来AI增长提前做好准备。

总结

企业要成功部署AI，不仅需要强大的GPU。还需要安全的数据保护、可扩展的算力能力、高速网络，以及节能的基础设施，使其协同运作成为完整的平台。通过整合AI服务器、网络设备、Intel QAT加速技术与先进的两相直接液冷技术，AEWIN提供完整的端侧AI基础设施解决方案，助力企业打造安全、高效能且可持续的AI环境。