Skip to content
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
18 changes: 18 additions & 0 deletions blog/hami-meetup-shenzhen-2026/index.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,18 @@
---
title: "HAMi Meetup Shenzhen 2026 Recap"
date: "2026-04-25"
description: "HAMi Meetup Shenzhen was held on April 25, 2026. This article is available in Chinese only."
authors: [hami_community]
tags: ["Meetup"]
unlisted: true
---

This article about the HAMi Meetup Shenzhen event is **only available in Chinese**.

**Please switch to the Chinese version to read the full content.**

<!-- truncate -->

---

Use the language selector in the top right corner to switch to **简体中文** (Simplified Chinese).
4 changes: 0 additions & 4 deletions docusaurus.config.js
Original file line number Diff line number Diff line change
Expand Up @@ -233,10 +233,6 @@ module.exports = {
defaultMode: "dark",
respectPrefersColorScheme: false,
},
announcementBar: {
id: "hami-meetup-shenzhen-3rd", // Increment on change
content: 'theme.announcementBar.message',
},
navbar: {
title: "HAMi",
logo: {
Expand Down
Original file line number Diff line number Diff line change
@@ -0,0 +1,105 @@
---
title: "第三届 HAMi Meetup 深圳站回顾"
date: "2026-04-25"
description: "4 月 25 日,HAMi Meetup 深圳站成功举办。来自 CNCF、顺丰科技、招商银行、燧原科技、深信服、博维智慧科技及密瓜智能的七位技术专家,围绕 AI 基础设施云原生演进、GPU 算力池化、异构调度、DRA 技术展望等前沿话题展开深度分享。"
image: ./meetup-shenzhen-group-photo.webp
tags: ["HAMi", "Meetup", "深圳", "GPU 虚拟化", "异构算力调度", "DRA", "云原生", "AI 基础设施"]
authors: [hami_community]
---

![HAMi Meetup 深圳站](meetup-shenzhen-group-photo.webp)

4 月 25 日,HAMi 社区在深圳成功举办第三场线下 Meetup。来自 CNCF、顺丰科技、招商银行、燧原科技、深信服、博维智慧科技及密瓜智能的七位技术专家,围绕 AI 基础设施云原生演进、GPU 算力池化、异构调度、DRA 技术展望等前沿话题,为现场观众带来了一场深度技术盛宴。

本次活动由 HAMi 社区发起,由密瓜智能主办,顺丰科技协办并提供场地支持。

<!-- truncate -->

## 活动亮点速览

- **Keith Chan(CNCF 中国区总监、Linux 基金会亚太区副总裁)** 从全球视角解读 AI 基础设施的云原生趋势,透露 KubeCon 上海站 AI 相关议题占比高达 60%-80%
- **李孟轩(密瓜智能联合创始人兼 CTO、HAMi Maintainer)** 首次公开 v2.9 版本核心特性,揭秘 DRA 生态联盟布局与异构算力统一管理愿景
- **陈俊超(顺丰科技后端开发高级工程师)** 分享 5 个私有云集群 + 多家公有云的 GPU 池化落地实战,集群平均利用率从 40% 提升至 90%
- **苏茜(招商银行研发工程师)** 揭秘超节点硬件适配与网络拓扑感知调度,跨机调度概率降低 30%
- **马达(燧原科技)** 展示基于 GPU Operator + CDI + DRA 的全栈云原生集成方案
- **贾毫杰(深信服云 AI 总架构师)** 分享 AI 算力网关治理策略,将每一分算力转化为可衡量的业务价值
- **欧彬凯(博维智慧科技研究员、广东省智能科技研究院脑机数字融合实验室主管)** 展示一键部署平台与 HAMi 深度整合的 GPU 虚拟化实践

## 技术分享回顾

### AI 基础设施全面云原生化

CNCF 中国区总监、Linux 基金会亚太区副总裁 **Keith Chan** 分享的 CNCF 调研数据显示,全球已有 66% 的企业将 AI 负载运行在云原生环境上。Kubernetes 已成为 AI 基础设施的统一编排层,NVIDIA 正式加入 CNCF 成为白金会员,PyTorch 社区与云原生社区深度融合。AI 领域的竞争焦点正在从"堆算力"转向"用算力",如何以最低成本、最高效率利用算力成为核心命题。

### HAMi v2.9 版本特性与 DRA 生态联盟

密瓜智能联合创始人兼 CTO、HAMi Maintainer **李孟轩** 首次公开了 HAMi v2.9 版本的核心特性与未来规划:

- DRA(Dynamic Resource Allocation)生态联盟,连接设备厂商与用户,推动 DRA 在真实场景中的落地与标准化演进
- 面向 NVIDIA / Ascend / Enflame 的 DRA 方案落地实践
- HAMi v2.9 核心能力预览:更细粒度的昇腾切分能力、支持 kai-scheduler 调度、Dynamic MIG 调度优化

### 顺丰科技:多云 GPU 池化落地实战

顺丰科技后端开发高级工程师 **陈俊超** 分享了顺丰科技基于 HAMi 构建统一算力池化方案的实践经验:

- 在多云 Kubernetes 集群上实现 AI 算力的统一调度与精细化管理
- 成功解决 GPU 利用率低、资源割裂和运维复杂等核心挑战
- 目前已在顺丰科技多个生产集群中稳定运行

### 招商银行:异构 AI 算力调度优化实践

招商银行研发工程师 **苏茜** 分享了基于 HAMi 构建统一纳管多源异构 AI 算力调度平台的实践:

- 适配昇腾 910C 超节点,实现算力资源 100% 入池与大模型高性能通信
- 借助 HAMi-vNPU-Core 软切分方案,以用户态拦截方式实现显存与算力的细粒度共享,显著提升单卡承载任务数
- 自研网络拓扑感知调度算法,将跨机调度概率降低 30%,有效破解分布式训练的网络瓶颈

### 燧原科技:Kubernetes 生态与 GPU 集成实践

燧原科技 **马达** 展示了基于 GPU Operator + CDI + DRA 的全栈云原生集成方案:

- 基于 GPU Operator 的标准化设备管理
- CDI(Container Device Interface)实现不侵入业务容器的资源管理
- DRA 技术实现动态资源分配,提升调度灵活性

### 深信服:AI 算力网关算力优化与模型治理实践

深信服云 AI 总架构师 **贾毫杰** 分享了深信服 AI 算力网关产品在算力优化和模型治理过程中的实践经验:

- 将每一分算力转化为客户可衡量的业务价值
- 通过语义分析将简单问题路由至低成本模型、复杂问题路由至高价模型
- 结合安全护栏机制,实现算力成本与效果的最优平衡

### 博维智慧科技:GPU 虚拟化与集群管理实践

博维智慧科技研究员 **欧彬凯** 分享了博维创新研发部打造一键部署平台(OCDP)的研发历程:

- 针对算力纳管中的"显存碎片化"与"监控盲区"等核心痛点,深度集成 HAMi 虚拟化技术
- 实现 GPU 资源的细粒度切分与弹性调度
- 通过与 HAMi 的深度整合,将复杂的底层算力封装为简单、高效的云原生服务,让 GPU 资产实现商业价值最大化

## 核心技术趋势

本次 Meetup 汇聚了多位行业专家的深度思考,以下几个技术趋势尤为突出:

**GPU 虚拟化与算力池化成为刚需:** 从顺丰科技到招商银行,多家企业分享了通过 HAMi 实现 GPU 池化与虚拟化的实战经验。核心诉求一致:打破 GPU 独占模式,通过细粒度切分实现多任务复用,将集群 GPU 利用率从 40% 左右提升至 90%。显存超分、算力软切分、拓扑感知调度等高级特性已成为生产环境的标配需求。

**异构算力统一管理加速落地:** 英伟达、昇腾、燧原、寒武纪等多家芯片厂商正在积极拥抱云原生生态。HAMi 通过统一调度层屏蔽底层硬件差异,DRA(Dynamic Resource Allocation)技术成为异构算力管理的新方向。

**AI 算力治理从"能用"走向"用好":** 深信服的分享揭示了企业级 AI 算力治理的新维度——不仅要做资源调度,还要做智能路由与成本控制,实现算力价值最大化。

## 视频回放

- **B 站回放:** [HAMi Community Meetup 深圳站](https://www.bilibili.com/video/BV1Sqo6BBE2h/)
- **视频号回放:** HAMi 社区

![视频回放](meetup-shenzhen-video-qr.png)

## PPT 分享

PPT 下载链接:[HAMi Meetup 深圳站 PPT 合集](https://github.com/Project-HAMi/community/tree/main/hami-meetup/03-shenzhen-20260425)

## 结语

算力效率不是单点能力,而是调度、虚拟化、软件栈与业务场景共同作用的结果。从 AI 基础设施的云原生化演进,到 GPU 池化与异构算力统一管理,再到算力治理的智能化升级,本届 HAMi Meetup 深圳站充分展现了社区在异构算力调度领域的技术深度与生态活力。
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
2 changes: 1 addition & 1 deletion i18n/zh/docusaurus-theme-classic/announcementBar.json
Original file line number Diff line number Diff line change
@@ -1,3 +1,3 @@
{
"theme.announcementBar.message": "📢 第三届 HAMi Meetup 深圳站(4月25日周六下午)正在报名中!<a target=\"_blank\" rel=\"noopener noreferrer\" href=\"https://hdxu.cn/1GN1S\">点击报名 →</a>"
"theme.announcementBar.message": ""
}
1 change: 0 additions & 1 deletion src/pages/styles.module.css
Original file line number Diff line number Diff line change
Expand Up @@ -44,7 +44,6 @@
font-size: clamp(2.2rem, 3vw, 2.9rem);
line-height: 1.08;
color: #f5f7fa;
text-shadow: 0 6px 24px rgba(0, 0, 0, 0.28);
}

.heroSubtitle {
Expand Down
Loading