从百度文心一言、阿里巴巴通义万相,到华为云盘古大模型、京东言犀大模型、中国移动九天大模型……今年以来,ChatGPT持续火爆,掀起人工智能大模型应用热潮,科技厂商争先涌入,大模型新产品进入“井喷”阶段。据不完全统计,目前全国已经发布了106个大模型。
调研发现,当前,苏州工业园区以国家新一代人工智能创新发展试验区核心区建设为引领,加强重点场景应用突破、牵引行业生态集聚,依托AI大模型加速千行百业的智能化改造和数字化转型,在为国内大模型突破发展不断贡献代表性样本的过程中,全力打造一流的AI大模型应用创新高地。在园区,从通用大模型、专用垂直领域模型到企业级GPT产品工具研发应用,从语言计算、芯片设计到科技信息服务,以大数据驱动的通用大模型和以知识驱动的垂直行业专业模型深度融合,形成多个应用标杆。
思必驰:DFM-2树立语言大模型“新标杆”
《中国人工智能大模型地图研究报告》显示,自然语言处理是目前大模型研发最活跃的重点领域,数量达49个,占比超过60%。然而,通用语言大模型在行业应用中面临真实性存疑,私域知识难包含、不准确,判别式任务精度及时效性不足等问题,再加上模型训练所需数据量巨大,在实际应用中还存在成本高、速度慢等缺陷。
思必驰科技股份有限公司(以下简称“思必驰”)联合创始人、首席科学家俞凯认为,行业语言计算大模型在解决这些问题方面更具优势,因其既具备情境理解、指令学习等通用智能及知识,又能够在行业场景落地中实现个性化知识技能定制、小型化低成本部署、全链路低延迟交互等,通过大模型与对话式语言技术的联动,能够为用户带来更优质的体验。
思必驰DFM-2发布会现场
作为国内最早开启对话式人工智能系列技术研发的公司之一,思必驰在对话式语言基础大模型领域技术积累丰厚,2021年提出Dialogue Foundation Model(DFM)模型,率先实现集理解、生成、表征三大能力为一体;2022年发布DialogZoo数据集,是目前国际上最全的公开对话研究数据集合平台;今年7月正式发布百亿参数行业语言计算大模型DFM-2,在通用场景28项任务上做到行业领先。
据介绍,作为具有通用智能的行业语言大模型,DFM-2既具备常识问答、内容生成、数学计算和代码生成等通用智能能力,又与全链路综合对话技术联动,可以实现具体的场景化落地,满足行业个性化需求,有效解决技术厂商的通用型技术与B端企业高度灵活的个性化需求无法匹配的行业痛点。
以物联网领域为例,智能终端存在算力各异、需求分散、场景庞杂、定制需求多、完整交互体验要求高等特点,这决定了通用人工智能技术很难在复杂多变的智能终端和应用场景中落地。思必驰基于通用人工智能技术不断发展完善自身的产品标准化能力和规模化定制能力,能够支持客户自主构建个性化语音交互解决方案,满足不同场景复杂个性化需求,实现人工智能的柔性定制,大大提升标准化软硬件产品的“非标交付”效率。
为进一步满足市场的多元化需求,思必驰将全链路智能对话系统定制开发平台(DUI)与DFM-2大模型相结合,推出DUI 2.0,完成对话式AI全链路技术升级。目前,DUI 2.0已在智能汽车、智能家居、政务服务、医疗健康、科学研究等领域得到应用,例如思必驰自研的汽车语音助手天琴系统,会议办公类软硬件产品“麦耳会记”、AI转写麦克风音箱M6、AI追踪双目语音摄像头C60等均已上市并得到广泛应用。
俞凯表示,未来,思必驰将紧抓科技部“语言计算国家新一代人工智能开放创新平台”建设机遇,持续深入应用场景,基于DFM-2大模型能力及相关技术成果,与专有场景深度结合,打造更具行业特色的专用模型,赋能千行百业。
智慧芽:“AIGC+搜索引擎”打造科技创新信息服务“智能助手”
科技情报是科技创新不可或缺的战略资源。研究表明,科研人员充分利用专利情报,能节约科研经费40-50%,节省科研时间60-70%。随着科学研究范式发生深刻变革,传统的科技信息服务已无法满足实际创新需求,且海量数据的人工处理成本极高,制约了科技创新效率进一步提升。
“大语言模型等人工智能相关技术的突破,极大提升了科技创新信息获取效率,将催生全新形态的产品服务。”智慧芽信息科技(苏州)有限公司(以下简称“智慧芽”)创始人兼CEO张济徽说。实际上,将GPT大模型技术引入科技创新信息服务领域,需要具备一系列条件,如要有覆盖面足够广泛的研发数据库,建立专门针对该领域的数据分析算法模型,形成相对完备的产品矩阵以满足研发人员的多元化需求等。
智慧芽专利数据库服务界面
其中,数据资源是核心要素。1.76亿+全球专利数据、1.6亿+科技文献数据,260万+科研资助信息、86万+投资信息,6.1万+全球新药数据、4.4万+靶点数据……作为科技创新信息服务商,智慧芽多年来积累的海量专利文献数据、科研信息数据和生物医药数据,为训练类GPT大模型奠定了扎实的数据基础。在算法层面,智慧芽运用深度学习、自然语言处理、计算机视觉以及预训练语言模型等技术,在海量全球多语言技术文本中进行自动化、智能化的数据分析与文本挖掘,并实现深层次语义分析。
今年以来,智慧芽将大模型技术引入科技创新信息服务领域,计划于年内推出基于知识产权与研发创新场景开发的大语言模型“智慧芽GPT”,并同步上线专利检索专家、技术交底书助手、技术研发助理等功能,帮助研发人员自动编写复杂检索式、自动撰写技术交底书,且能够对话式解答研发人员的技术问题。
“当前,科技创新信息服务仍停留在工具阶段,不能称之为强大助手。例如大部分专利数据库本质上就是专利领域的搜索引擎,返回的是大量技术文档而非直接答案,很难满足用户复杂、结构化的需求。”张济徽说,智慧芽的目标是打造“AIGC+搜索引擎”新模式,当用户提出问题后,该应用可快速理解用户意图,并从相关搜索结果中给出经处理的总结性回答。未来,通过调用智慧芽底层的产品能力,用户仅需通过一个聊天框输入问题就能快速得到想要的答案,为科技创新信息服务打造真正强大的“智能助手”。
异格技术:借力企业级GPT产品推动芯片研发设计跑出“加速度”
一边,借助公用大模型,自研企业办公工具和知识库,辅助员工进行代码开发、技术手册编写等;一边,积极研发部署内部私有大模型,实现对内部代码的生成、审查、注释等功能,显著提升研发效率……位于苏州工业园区的苏州异格技术有限公司(以下简称“异格技术”)专注于国产高端FPGA芯片的研发与设计,该企业几年前便着手布局大模型等AI技术工具在芯片设计领域的应用,今年更是引入专业高层次人才,并成立单独部门专项负责相关技术研发,初步成效开始显现。
高性能芯片设计比较复杂,需要花费大量的时间和人力成本。在设计过程中,任何一个错误都可能导致大量时间和资源的浪费,甚至导致整个项目的失败。“把大模型技术引入芯片设计领域,能够大幅减少研发过程中一部分重复且繁杂的工作,缩短产品开发周期,还可以帮助设计师整合通信、控制和信号处理等不同领域知识,以实现更高效和创新的设计。”异格技术相关部门负责人说。
目前,异格技术正在尝试将大模型技术应用于芯片验证中,对部分公开协议代码的研发已经实现明显的效率提升。该企业还利用公用大模型 API构建了飞书机器人,实现对公用大模型信息交互的安全管控,飞书机器人中内置各种角色,支持语言对话、图像生成等功能,极大提升员工办公效率。
在使用公用大模型基础上,异格技术尝试构建内部知识库,对代码或文档进行深层次分析,包括顶层架构、代码细节设计到算法、数据结构,通过整合公司内部的文档和API参考,使开发人员更方便查找所需内部信息,提高开发效率。
“下一步,我们计划研发采用FPGA芯片的AIGC大模型企业级私有化部署方案。该方案专注对模型进行优化压缩(量化、剪枝等)以更适配FPGA芯片,同时更好满足金融、通信、边缘计算等领域应用需求。”异格技术相关部门负责人说。
278平方公里不算宽广的土地上,大模型技术与各细分场景的融合应用正以极高的密度涌现,并逐步走向“深水区”。
目前,一大批园区企业正基于原有人工智能技术和行业数据积累,积极布局通用大模型、专用垂直领域模型以及企业级GPT产品工具研发和应用等大模型赛道,推动技术创新、场景落地和生态建构。如美能华智借助大模型技术及互联网海量中英文语料,开发企业级大语言模型——星语大语言模型,并推出星语专家系统、小星助手两款应用产品,服务范围涉及政务、金融、跨境物流、医疗健康等多个领域。企查查发布全球首款商查大模型——企查查“知彼阿尔法”,百图生科研发生命科学大模型驱动的AIGP(AI Generated Protein)平台,清睿教育发布教育领域清睿ArynGPT大模型等。
AI大模型应用同时带动算力需求猛增。据统计,园区仅30家人工智能核心企业的算力需求就达到172 PFLOPS。依托国科数据中心这一亚洲首家按照国际数据中心行业最高等级(Tier IV)标准设计和建设的第三方专业数据中心,该区正加快构建多云互联、算力互联新模式,与华为云等主流云服务商以及上海超算中心、昆山超算中心、合肥先进计算中心等加强合作,充分利用本地自建算力单位,提升算力调度能力,实现算力资源的横向扩展,满足企业算力需求。
为进一步推动大模型的应用推广,抢抓AIGC新赛道,园区将以国家新一代人工智能创新发展试验区核心区建设为引领,加强垂直领域攻关,实现重点场景应用突破,丰富行业应用生态,紧跟大模型相关技术发展趋势,加速汇聚高端资源,坚持以产业创新为引领、科技创新为动力、开放创新为支撑,通过AI大模型应用创新高地建设,为开放创新的世界一流高科技园区增添更多动力。