工业场景将成为AI大模型的重要战场
2024年,各大公司推出强大理解能力的多模态大模型,将引领人工智能(AI)技术创新和应用,工业场景将成为多模态大模型的最佳实践场地。随着GPT-4o、Gemini1.5Pro、LLaVA1.6的发布,基于Transformer架构和海量数据训练的多模态大模型再次点燃通用人工智能(AGI),其对文本、图像等多模态输入的支持和强大的理解能力也象征着人工智能迈向通用人工智能(AGI)的新阶段。随着工业智能化的推进,大模型有望重构智能制造的系统,为工业智能化提供新动力。
工业场景将成为大模型最佳的“练兵场”
据专业机构统计,2023年我国全部工业增加值约40万亿元,而当前多模态大模型在应用中部署仅占了8%,未来存在巨大的上升空间。工业生产整个流程主要分为研发、生产、管理等环节,为AI落地提供了丰富的场景。在当前阶段工业AI的应用主要以专用的小模型为主,专用小模型在具体的某个细分场景会针对性地收集较大的标注数据,如在工业质检领域通常每类缺陷需要收集百张以上的产品图,然后对该场景进行精细化调优,从而保证了模型的准确性和稳定性。而专用小模型定制化的设计模式制约了其在应用中的进一步渗透,其在研发和交付过程中依赖较长周期的数据采集及较复杂的个性化定制的业务逻辑功能,导致模型通常无法在其他场景通用。多模态大模型借助强大的理解能力、泛化能力和丰富的多模态输入的支持,有望和小模型进一步互补融合,为工业制造注入新的动力。未来,AI应用技术会加快往工业领域迁移,通过场景适配和多种部署形式,最终实现工业大模型的落地赋能。
多模态大模型深度赋能智能制造,将进一步推动生产制造的提质增效
在大模型的驱动下,工业场景下的丰富数据有望进一步整合并开源,如MvTec、Real-IAD等,为多模态大模型奠定并丰富数据基础,促进行业大模型的快速发展,同时反哺生产制造的提质增效。在研发设计环节,大模型可以通过对结构化数据以及产品结构的理解,能辅助产品设计图的布局优化、参数校核并可进行动态仿真,进而缩短研发周期,提升研发设计的效率。在生产环节,大模型强大的理解能力和迁移学习能力可以对不同生产场景中的产品质量缺陷、零部件装配、工作人员作业规范进行高效的视觉感知,进而提升产品生产的品质,降低质检人员数量,并对厂区安全合规全方位监控。例如在缺陷检测中,通常需要大量的质检人员对产品质量缺陷进行识别并分拣,存在人力成本高、效率低、检测结果一致性弱等问题。大模型的强大泛化能力和迁移学习能力能进一步强化机器视觉的能力,未来只需少量数据进行场景适配调优,即可达到客户要求。在管理环节,文本、文档、图片甚至视频数据会进一步整合,从而强化多模态大模型的能力,能全方位对异常图像、故障数据、文档数据进行分析理解并自动化处理,快速提升任务处理的效率。
大模型的落地,助力重构智能制造系统,推进工厂智能化,提升新质生产力
工业发展是一个逐步演化的过程,经历了机械化,电气自动化,信息化等阶段,正处于从数字化迈向智能化的阶段。在迈向智能化的过程中,工业和各类创新技术的融合进而对工业生产体系进行智能化升级和改造,以提高生产效率,降低成本,提高产品品质和生产安全。当前,工业制造累积了大量的数据,为大模型提供了良好的基础条件。随着高质量数据的积累,大模型的理解能力会大大提升,首先将会在生产的各个环节得到大量的部署和应用。在多模态输入的加持下,文本、图像、语音等混合交互模式进一步提升生产效率,智能化感知和交互也将重构整个制造管理体系。未来有望实现“智能感知,智能决策,智能执行”的全新智能化工厂。
评论 (0人参与)
最新评论