2026
2026 本科生 · 进科研 · 进团队
课题组招新
面向AI推理服务的云端系统性能优化
广东工业大学 · 计算机学院
导师:吴朝锐
导师照片
广东工业大学 · 计算机学院
吴朝锐
工学博士 · 博士后研究员
合作导师:李小平教授(计算机学院院长)

主要研究方向为云计算与AI计算系统优化,聚焦大规模AI服务在云端部署时面临的性能、效率与成本问题。在Serverless计算、容器化数据中心、冷启动优化等领域有深入积累。
邮箱:z.wu@gdut.edu.cn
主页:githubdiom.github.io
代表性发表期刊
CCF A
IEEE TPDS
体系结构 / 并行与分布计算
CCF A
IEEE TC
体系结构 / 并行与分布计算
CCF C
IEEE TCC
云计算
SCI
IEEE TNSM
网络与服务管理
代表性工作
  • 冷启动加速:函数哈希缓存复用
  • 批处理调度:提升函数吞吐效率
  • 容器层优化:镜像分层按需加载
  • 关键路径迁移:工作流延迟压缩
  • 网络功能编排:链式服务性能优化
广东工业大学 · 计算机学院
面向AI推理服务的系统性能优化
模型再强,也需要高效的计算系统来承载。当千万用户同时发起推理请求,背后的系统如何秒级响应、控制成本、合理调度资源?这是本课题组的核心研究问题。
01
AI模型冷启动优化
AI推理服务从零启动时,模型加载、运行时初始化、依赖准备各阶段存在显著延迟。通过缓存策略、预加载机制、层级复用等手段,系统性压缩启动时间。
02
推理调度策略研究
面对波动的用户请求,智能决策何时启动新实例、何时复用已有实例,在延迟与成本之间找到最优平衡点。设计并验证调度算法。
03
多阶段推理流水线
实际AI应用涉及多模型串联/并联调用(如RAG中的检索+生成)。研究关键路径识别与端到端延迟优化策略。
广东工业大学 · 计算机学院
当你用Claude Code / AI Agent写代码时,
我们在优化哪些环节?
每一次"帮我写一下"的背后,都是一条横跨云端的推理链路。我们的研究,就是让这条链路更快、更稳、更省。
> 你输入: "帮我修复这个bug"
👤 你 Claude Code 用户 请求 ① 服务冷启动 容器拉起 · 依赖加载 运行时初始化 ⚠ 延迟数秒 首次调用卡顿 ② 模型加载 模型权重载入GPU KV Cache预热 ⚠ 大模型耗时长 显存占用高 ③ Agent多步骤工作流 (推理 · 工具调用 · 检索 · 迭代) 读代码 Read tool LLM推理 分析问题 搜索/检索 Grep · RAG LLM推理 生成方案 改代码 Edit tool 跑测试 Bash tool ⚠ 每步都有延迟,累积放大 返回 ✓ 修复完成 bug fixed commit ready 方向 ① 冷启动优化 缓存 · 预热 · 复用 → 秒级启动 方向 ② 推理调度 智能分配 · 动态扩缩 · 成本最优 方向 ③ 多阶段流水线优化 关键路径识别 · 端到端延迟压缩
广东工业大学 · 计算机学院
本科生可参与的三类工作
🔬
学术研究
在导师指导下参与课题研究,学习论文阅读与撰写方法。表现优秀者有机会发表学术论文。
🏆
竞赛参与
基于课题组现有研究成果和系统,参加服创大赛、系统能力大赛、人工智能类等学科竞赛。课题组提供技术指导和资源支持。
💻
应用开发
参与AI在实际场景中的应用开发工作,如推理服务系统搭建、性能监控平台开发等,锻炼工程实践能力。
欢迎对学术研究、打比赛或做实际应用感兴趣的同学加入!
广东工业大学 · 计算机学院
对参与者的期望
🎓
计算机或相关专业本科生,不限年级
🐍
具备Python编程基础即可,不要求修过特定专业课程
📖
有较强的自学意愿,在导师指导下逐步学习
🏅
有数学建模或编程竞赛经历者尤其欢迎
每周能保证一定的科研时间投入
✦ 你将获得
📝科研论文写作与发表的全流程指导
云计算与AI系统的前沿实践经验
🎯保研或出国申请的科研经历支撑
👨‍🏫导师定期一对一指导与组会交流
期待你的加入!
导师照片
吴朝锐
工学博士 · 广东工业大学计算机学院
100%
自适应