返回
人工智能
已发布

大模型压缩与部署技术

清华大学

技术描述

针对百亿参数级大语言模型的高效压缩算法,可将模型体积压缩至原大小的1/8,同时保持95%以上精度。支持多种硬件平台部署,已在工业场景验证。

应用场景

智能终端、工业质检、金融风控

关键词

大模型
模型压缩
边缘部署
量化

团队信息

张明华

清华大学

相关专利

  • 一种大模型压缩方法及系统

    CN202310123456.7

    已授权
  • 边缘设备推理优化装置

    CN202210654321.2

    实质审查
  • 多硬件平台部署适配方法

    CN202410789012.3

    已申请

TRL评估

估值信息

850.0万

预期转让/许可价格

联系方式

tech-transfer@清华.edu.cn

010-xxxxxxxx