《AI时代的科学》:人工智能如何改变科学研究的本质和方法
本报告由英国皇家学会2024年6月出版,近年来,人工智能 (AI) 的进步速度和规模空前,这表明社会可能正在经历一个拐点。随着大型数据集、新算法技术和计算能力的提高,AI 正在成为科学领域研究人员为古老问题寻求新解决方案的成熟工具。现在,人类比以往任何时候都更需要了解 AI 对科学的变革性影响程度,以及科学界需要做些什么才能充分利用它的好处。
本报告《AI 时代的科学》(Science in the Age of AI) (PDF) 探讨了深度学习或大型语言模型等 AI 技术如何改变科学探究的性质和方法。它还探讨了研究诚信的概念如何;研究技能或研究伦理不可避免地会发生变化,以及它们对科学和科学家的未来有何影响。
该报告解决了以下问题:
AI 驱动的技术如何改变科学研究的方法和性质?
这些技术在科学研究中的机会、局限性和风险是什么?
相关利益相关者(政府、大学、行业、研究资助者等)如何最好地支持 AI 驱动技术在科学研究中的开发、采用和使用?
在回答这些问题时,该报告整合了来自一系列来源的证据,包括与 100 多名科学家开展的研究活动和专家工作组的建议,以及科学中人工智能的分类法 、关于颠覆性技术在改变科学和社会中的作用的历史回顾 ,以及人工智能相关发明的专利态势回顾 。 哪些内容可供下载
2024年6 月 6 日,联合国教科文组织和英国皇家学会在巴黎联合国教科文组织总部举办了一场活动,探讨了人工智能与开放科学之间的关系。在本次活动之前,Alison Noble 教授(人工智能时代的科学工作组主席)分享了她的见解。
报告内容摘要
近年来,人工智能(AI)的发展速度和规模前所未有,这表明社会可能正处于一个转折点。像ChatGPT和Midjourney这样的平台能够生成类似人类的文本和图像内容,它们的病毒式传播加速了公众对这一领域的兴趣,并引起了政策制定者的关注,他们担心基于AI的技术如何被整合进更广泛的社会中。除此之外,著名计算机科学家和公众人物对AI对人类构成的风险的评论,已经将这个主题转变为一个主流的政治问题。
对于科学研究人员来说,AI并不是一个新话题,几十年来一直以某种形式被采用。然而,学术界和行业主导的研究中对AI的增加投资、兴趣和采用,导致了所谓的“深度学习革命”1,正在改变科学发现的格局。
得益于大数据的出现(例如,从望远镜、卫星和其他高级传感器收集的大量异构数据),基于AI的技术正在帮助识别大型数据集中的新模式和关系,这些模式和关系在其他情况下可能难以识别。这为科学研究提供了巨大的潜力,并鼓励科学家采用在其领域内超越现有方法的更复杂技术。
AI工具的能力,从现有内容中识别模式并生成新内容的预测,还允许科学家运行更准确的模拟并创建合成数据。这些模拟,从许多不同的来源(可能实时)提取数据,可以帮助决策者更准确地评估潜在干预措施的有效性,并解决紧迫的社会或环境挑战。本报告和三个案例研究(关于其在气候科学、材料科学和罕见疾病诊断中的应用)深入探讨了AI为科学研究带来的机遇。
除了这些机会,增加采用AI也带来了各种挑战。这些包括可复制性(其他研究人员无法复制使用AI工具进行的实验);跨学科性(AI和非AI学科之间的有限合作可能导致AI在各个领域的采用不够严格);环境成本(操作大型计算基础设施所需的高能耗)。还有,由于AI系统的黑箱特性和推动AI基础研究的商业模型的透明度有限,有效采用开放科学原则的障碍也在增加。此外,科学生态系统中不断变化的激励措施可能正在增加研究人员采用先进AI技术的压力,忽视了更传统的研究方法,或者成为“擅长AI”而不是“擅长科学”2。
本报告在研究完整性、技能和跨学科性、创新和私营部门以及研究伦理等章节详细阐述了这些挑战和潜在解决方案。作为一个旨在促进科学用于人类利益的组织,这个主题对英国皇家学会非常重要。本报告《AI时代的科学》概述了AI积极转变科学努力所需解决的关键问题。其建议,如果综合考虑,应确保AI在科学研究中的应用能够充分发挥其潜力,并帮助维护公众对科学和科学方法完整性的信任。
本报告由AI和应用科学领域的领先专家工作组指导,并由英国皇家学会开展的一系列活动提供信息。这些活动包括与皇家学会会员的访谈;全球专利景观分析;历史文献回顾;委托的AI科学应用分类;以及从大型语言模型到沉浸式技术等主题的几次研讨会。这些活动在附录中有详细列出。总共有100多位来自不同学科的领先科研人员为本报告做出了贡献。
虽然本报告涵盖了与AI在科学研究中的作用相关的一些关键领域,但它并不全面,例如,它没有涵盖高性能计算基础设施的提供、人工通用智能的潜力,也没有详细分解跨行业和学术界所需的新技能。下面概述了进一步的研究问题。
学会的两个工作计划《数学未来》3和《科学2040》4将更深入地探讨与技能和大学相关的相关挑战。
关键发现• 除了AlphaFold这样的标志性案例,AI应用可以在整个STEM领域找到,特别是在医学、材料科学、机器人学、农业、遗传学和计算机科学等领域。
• 高质量的数据是AI应用的基础,但研究人员面临与可用数据的体量、异构性、敏感性和偏见相关的障碍。一些科学数据的大量(例如,从望远镜和卫星收集的数据)可以达到拍字节,这使得数据共享和互操作性等目标难以实现。从传感器数据收集的数据的异构性也给人类注释和标准化带来了困难,而在有偏见的输入上训练AI模型可能会导致有偏见的输出。鉴于这些挑战,数据管理员和信息管理者对于维护质量并解决与人工数据生成相关的风险(如数据伪造、污染或污染)至关重要
• 行业和学术机构正在推进AI创新以用于科学研究6。过去十年,与科学相关的AI专利申请激增,中国、美国、日本和韩国在这些领域的专利申请数量上占据主导地位。为本报告委托的审查表明,全球AI市场的价值(截至2022年)约为1069.9亿英镑7。
• 中国约占专利格局的62%。在欧洲,英国在与生命科学相关的AI专利方面仅次于德国,拥有第二大份额,牛津大学、帝国理工学院和剑桥大学等学术机构在英国的顶级专利申请者中占据显著位置。Alphabet、西门子、IBM和三星等公司在科学与工程领域似乎展现出相当的影响力。
• AI工具的黑箱特性,以及潜在的专有性质,正在限制基于AI的研究的可复制性。诸如文档不足、缺乏对基础设施(例如代码、数据和计算能力)的访问以及对AI工具如何得出结论(可解释性)的缺乏理解等障碍,使得独立研究人员难以审查、验证和复制实验。使用复杂的深度学习模型推进发现的巨大潜力,也可能鼓励科学家或资助者优先考虑使用AI而非严谨性。
• 跨学科合作对于弥补技能差距和优化AI在科学研究中的好处至关重要。通过分享彼此领域的知识和技能,AI专家和领域主题专家(包括来自艺术、人文和社会科学的研究人员)之间的合作可以帮助产生更有效和准确的AI模型。然而,这种合作被孤立的研究环境和不奖励跨学科合作以促进职业发展的激励结构所阻碍。
• 生成性AI工具可以协助推进科学研究。它们有望加速常规科学任务,如处理非结构化数据、解决复杂的编码挑战或支持学术文章的多语言翻译。此外,文本生成模型可能被用于学术和非学术书面任务,对学术交流和研究评估可能产生影响。对此,资助者和学术机构正在设定规范以防止不希望的使用9,10。
未来研究问题研究活动中出现了以下主题,作为未来AI在科学中的关键考虑因素:
AI和科学计算基础设施:如何优化AI工作负载以充分利用科学研究中异构计算基础设施的潜力,同时考虑到不同科学领域的多样化需求?
AI和小数据:在只有小数据可用的情况下,AI日益增长的使用对研究人员有何影响?如何有效使用AI技术来增强小数据集以用于训练目的?在应用于小数据场景时,模型尺寸减小与性能保持之间的权衡是什么?
AI和科学系统中的不平等:在为代表性不足的社区提供公平获取AI技术方面存在哪些障碍?AI如何被用来扩大包括代表性不足的学者和非科学家公众在内的科学和专家社区的参与?
AI和知识产权:AI系统的哪些输入(数据集、算法或输出)对知识产权保护至关重要,它与科学中开放科学原则的应用以何种方式相互作用?
AI和科学技能的未来:随着AI日益融入,科学研究中的技能需求如何变化?未来研究人员将需要哪些能力,需要哪些努力来促进AI素养在不同科学学科中的普及?
AI和学术交流的未来:随着AI技术的融合,学术交流和科学交流的格局如何发展?如何利用AI来改善学术成果的知识转化、多语言和多模态?
AI和环境可持续性:AI在促进科学界可持续实践方面可以发挥什么作用?如何优化AI算法以增强环境建模的能源效率,并在气候科学、生态学和环境监测等领域促进可持续实践?
AI标准和科学研究:AI标准如何帮助解决基于AI的科学研究中的可复制性或互操作性挑战?科学界如何有助于建立AI标准.
评论 (0人参与)
最新评论