您好,欢迎来到广搜网 [] [会员注册]
您现在的位置: > 广搜网 > 焦点新闻 >火遍全球的DeepSeek:科学家是怎么用它的?

火遍全球的DeepSeek:科学家是怎么用它的?

来源:广搜网  日期:2025/3/31 20:14:53   浏览次数:    我要收藏

火遍全球的DeepSeek:科学家是怎么用它的?
elizabeth gibney

科研人员正在测试这个开源模型执行科研任务的能力——从数学一直到认知科学。



deepseek的模型能在一个对话机器人app上使用。来源:deepseek官网

两周前,一家中国公司推出的deepseek-r1让美国股市大幅震荡——deepseek-r1是一款平价但强大的人工智能(ai)“推理”模型。



经过反复测试,deepseek-r1回答数学和科学问题的能力与o1模型不相上下——o1是由加州旧金山openai公司去年9月推出的一款模型,openai的推理模型一直被视为行业顶尖水准。



虽然r1在科研人员想尝试的各种任务上仍力有不逮,但它让全球科学家有机会根据其学科内的问题,量身训练定制款的推理模型。



“基于它的绝佳表现和低成本,我们相信deepseek-r1能鼓励更多科学家在日常科研工作中使用大语言模型(llm),同时不同担心成本问题,”俄亥俄州立大学的ai研究员huan sun说,“几乎所有从事ai的同事和合作者都在谈论它。”

开放季

对于科研人员来说,r1的平价和开源可能会改变传统:使用它的应用编程接口(api),就能以其专利竞品收取的一小部分费用对这个模型提问;其在线对话机器人deepthink(深度思考)的使用更是免费。科研人员还能在自己的服务器上下载这个模型,免费运行和拓展模型——这些都是闭源竞品模型o1办不到的。



r1从1月20日推出以来,“大量研究人员”基于r1或以r1为灵感,尝试训练自己的推理模型,加拿大不列颠哥伦比亚大学的ai研究员cong lu说道。这从开放科学ai资源库hugging face的数据中便可看出——deepseek-r1的代码就储存在hugging face上。在模型发布后的一周内,hugging face上各版本的r1下载量就超过300万次,包括独立用户已经扩展过的模型。

科研任务

一些初步测试让r1执行数据型科研任务——这些任务选自生物信息、计算化学、认知神经科学等领域的真实论文——结果r1的表现与o1不相上下,sun说。她的团队让这两个ai模型完成他们创建的一系列问题中的20个任务,这个系列被称为scienceagentbench。这些任务包括数据分析和可视化。两个模型只能答对其中约1/3的问题。用api运行r1的成本只要o1的1/13,但r1的“思考”时间比o1更长,sun说。



r1在数学上也开始崭露头角。英国牛津大学的数学家、计算科学家frieder simon让这两个模型给出泛函分析这一抽象领域的一个证明,发现r1的证明比o1的更好。但考虑到这类模型通常会犯的错误,如果想要从这些模型中获益,研究人员本身就要具备鉴别证明水平的能力,他说。



r1令人激动的一大原因在于,它以“open-weight”(开放权重)的形式公开,说明其算法不同部分之间习得的关联可以进一步拓展。下载了r1或其“蒸馏”小模型(也由deepseek发布)的科学家能通过额外训练提升其能力,这也称为微调。如果有合适的数据集,科研人员或能通过训练,提高该模型在特定科研步骤编写代码的能力。



能在本地系统下载并部署r1也是个加分项 ,sun说,因为这样科研人员就能掌控他们的数据和研究结果。“对于涉及敏感和隐私数据的学科来说,比如医学研究,这一点尤其重要。”

推理跨越

deepseek也搅动了ai科研领域,因为它指出了一条能优化无数其他模型的道路,旧金山ai公司anthropic的联合创始人jack clark说。clark的模型叫claude。



deepseek通过将它的“推理”能力教授给其他大语言模型(llm)——如meta的llama——创建了这个蒸馏模型。deepseek在1月22日在arxiv上发布的预印本论文[1]揭示了这背后的方法:用整理好的来自deepseek-r1的80万个逐步式“思维链”回答的样本训练这些大语言模型。



“现在网上有了一个开放权重的模型,你能用它让其他足够强大的基础模型变身为一个ai推理器,”clark在他的简报import ai中写道,“全球的ai能力又向前了一步。”



科研人员还在应用“强化学习”——用来创建deepseek-r1的试、错、赏技术——但打磨它在特定任务上的应用,lu说。lu去年联合创建了“ai scientist”,这是一个能完成一整套机器学习科研任务的模型,从扫描文献到创建假说再到撰写论文。通过定义适当的“奖赏信号”,科学家能朝着任何目标训练这个模型,他说。



但deepseek-r1还远谈不上完美。对话机器人deepthink在o1等大语言模型会“碰壁”的简单任务上也失败了,这类问题包括统计名字中含字母w的美国州的数量。lu说:“也许有的人认为这个模型能把水变成酒,这只是炒作,但对于其实际能力来说,它确实是最棒的。”

原文以scientists flock to deepseek: how they’re using the blockbuster ai model标题发表在2025年1月29日《自然》的新闻版块上



? nature

doi:10.1038/d41586-025-00275-0


点击阅读原文查看英文原文

版权声明:

本文由施普林格·自然上海办公室负责翻译。中文内容仅供参考,一切内容以英文原版为准。欢迎转发至朋友圈,如需转载,请邮件china@nature.com。未经授权的翻译是侵权行为,版权方将保留追究法律责任的权利。

? 2025 springer nature limited. all rights reserved

本文经授权转载自:自然序列(id: nature-portfolio)



上观号作者:上海科协

>> 更多相关信息:
在百度中搜索火遍全球的DeepSeek:科学家是怎么用它的?    在好搜中搜索火遍全球的DeepSeek:科学家是怎么用它的?
在必应中搜索火遍全球的DeepSeek:科学家是怎么用它的?    在搜狗中搜索火遍全球的DeepSeek:科学家是怎么用它的?


广搜网

QQ:3864692706

请所有会员信息发布时严格遵守国家互联网信息规定,我们拒绝任何违规信息!投诉邮箱:3864692706@qq.com