

大模型每3个月迭代一次,但要真正赋能产业应用,还有一道很高的门槛。曾有业内专家坦言,做算法的人很多,因为容易出彩,而真正愿意去“啃”模型工程化的人少之又少。但是,工程化又如此重要,它的每一点提升,不仅能产生与算法改进相同的经济价值,甚至还关系着项目落地的“从0到1”。
上海和今信息科技有限公司(简称“和鲸科技”)首席技术官蒋仕龙,就是一位愿意啃“硬骨头”的创业者。怀揣着“让数据把人连接起来”的宗旨,他率领团队致力于将大模型与真实业务场景结合起来,为客户提供算力调度、数据治理、任务管理、开发流程等一条龙服务。
如今,和鲸科技70%的客户来自高校和科研院所。这条深耕科研的路并不好走,但或许正是对于技术的热情,让选择做困难事的和鲸科技拥有了“护城河”。可以预见,随着AI4S(人工智能驱动科学)的蓬勃演进,这个领域将迎来黄金发展期。
“不响”的声量
在上海交通大学逸夫楼那间由团委借出的办公室里,和鲸科技的故事悄然开始。读书期间,蒋仕龙和几位通过大数据社团结识的同学,怀揣着帮助企业挖掘数据价值的初心,踏上创业之路。从最初组织数千人规模的大数据竞赛,到逐渐演化出一个拥有70多万用户的活跃社区,和鲸科技选择了一条埋头苦干的路径。
“不响”,是这家成立7年的公司给人的印象。在信息爆炸的时代,你很难在媒体报道和行业论坛之外找到它的踪迹,尽管它的客户名单上赫然排列着国家气象信息中心、上海申康医院发展中心、浙江大学等重量级名字。这种低调,或许源自创始人蒋仕龙“技术宅”的秉性——坚信技术的价值无需喧哗,自会在解决实际问题过程中撞出声响。
接踵而至的奖项证明“不响”已响。近期,他们刚刚获得有关部门资助,用以奖励人工智能开源社区。此前,他们曾接连获得上海市高新技术企业、上海市专精特新企业和大张江国家自主创新示范区专项发展资金支持。

为“风云”策算
国家气象信息中心,是和鲸科技从社区走向产业应用的第一个关键客户,也是其技术实力最好的试金石。气象数据并非简单的二维表格,而是包含时间、空间、多层次物理量的复杂三维乃至多维数据,其处理和分析对计算基础设施提出极高要求。
2020年双方合作伊始,和鲸科技需要为该中心打造一个数据挖掘支撑平台。蒋仕龙带领团队研发了一项将高性能计算集群与高效调度基础设施相结合的专利技术,使得大规模超算集群的利用效率提升数倍。
“以前计算集群只能发大任务,没办法精细‘接单’,和鲸科技打造的平台将原本碎片化的工作流串联起来,形成一条敏捷处理全任务流程的流水线。”蒋仕龙说。这意味着,科研人员无需再手动搬运数据、反复编写任务脚本,而是可以在网页端一键调用计算资源,实现多任务并行开发、离线训练,极大解放了生产力。在双方持续建设下,它已成为统筹融合新老智能算力资源,总算力超过2PFlops的多种类、多架构智能平台,目前已为基于深度学习的短中期预报试验等多个应用提供服务。
赋能全球科研协作
如果说与国家气象信息中心的合作证明了和鲸科技在垂直领域的深耕能力,那么,2022年与浙江大学地球科学学院合作的“跨云项目”,则是对其基础架构极限的一次挑战,也是公司发展的另一个里程碑。
当时,和鲸科技与浙江大学地球科学学院合作参与由我国科学家主导发起的国际大科学计划,合力攻关建设其核心模块,打造一套完整、成熟且具备开放创新生态的地学在线协同科研系统。这个全球科研项目的核心难点在于“数据跨云”与“算力异构”,需要协调欧亚地区几十个科研团队协同工作,计算资源横跨四五个大型集群、数百台设备,架构涵盖X86、AMD和GPU,堪称一个复杂的异构算力“联合国”。面对PB量级的数据跨云调度量和庞杂的计算任务,传统的云服务模式显得力不从心。
蒋仕龙带队潜心研发跨云异构调度技术。该技术不仅实现异地数据的快速加载与调度,还通过智能模型提前分析并预测科研团队所需的“热点数据”,将其缓存在本地边缘节点,实现“数据未动,粮草先行”。这套系统打破地域和异构算力的壁垒,让全球科学家能够像在同一个实验室一样,高效进行地球科学领域的协同研究。“这项技术已申请专利,标志着我们已有支撑起世界级前沿科研合作的设施基础。”蒋仕龙说。
从赋能国家气象信息中心的精准预测,到助力全球科研的无界协作,和鲸科技的未来之路愈发清晰。在蒋仕龙看来,大模型对基础设施的要求越来越高,因为每一步的复杂度都在提高。在这场将大模型转化为真正生产力的赛跑中,“不响”的和鲸科技或许正酝酿着足以震动产业的大声响。
人物小传
蒋仕龙,和鲸科技联合创始人、首席技术官,上海交通大学计算机系本硕,上海市东方英才计划青年项目、徐汇区光启人才计划项目入选者。长期专注于人工智能基础设施与大模型应用研发平台方向,主导建设服务科研、教育与企业场景的ModelWhale数据科学与AI协同平台。
富灯网提示:文章来自网络,不代表本站观点。