返回
人工智能
已发布大模型压缩与部署技术
清华大学
技术描述
针对百亿参数级大语言模型的高效压缩算法,可将模型体积压缩至原大小的1/8,同时保持95%以上精度。支持多种硬件平台部署,已在工业场景验证。
应用场景
智能终端、工业质检、金融风控
关键词
大模型
模型压缩
边缘部署
量化
团队信息
张明华
清华大学
相关专利
一种大模型压缩方法及系统
CN202310123456.7
已授权边缘设备推理优化装置
CN202210654321.2
实质审查多硬件平台部署适配方法
CN202410789012.3
已申请
TRL评估
估值信息
850.0万
预期转让/许可价格
联系方式
tech-transfer@清华.edu.cn
010-xxxxxxxx