DeepSeek赢麻了,首个推理模型就超越OpenAI o1
今年早些时候,赢麻国内科技公司DeepSeek(深度求索)因V2模型一举成名,推理成名的模型广元政务新闻网官网公告原因简单粗暴,主打高性价比。赢麻在当时,推理DeepSeek V2的模型API定价约等于谷歌的七分之一,GPT-4 Turbo的赢麻七十分之一。
时隔几个月,推理这家被业界冠以“AI界拼多多”之称的模型公司,迅速推出首个推理模型「DeepSeek-R1预览版」。赢麻该模型一经推出,推理便在AIME以及全球顶级编程竞赛(codeforces)等权威评测中,模型大幅超越了GPT4o,赢麻广元政务新闻网官网公告甚至o1-preview,推理一夜之间轰动全球。模型

时间倒退回今年5月前后,在大模型领域,国内各大厂牌内卷最凶猛,创立于2023年4月的DeepSeek一战成名,毫无疑问是当时的“黑马”。但是,人们提起DeepSeek总是带着“高性价比”的标签,不自觉让大家忽视他们强大的技术力。
如今,推理模型DeepSeek-R1预览版在AIME和MATH这两个关键基准测试上超越了OpenAI o1,大家终于不只以“性价比”来衡量DeepSeek。

这里简单解释一下,AIME在美国数学竞赛(AMC)中难度等级最高,所以常被用来测试不同模型解决推理问题的性能。DeepSeek-R1预览版在解决这些复杂数学问题时拥有极强的“拆解能力”,能够将复杂任务分解为更小的步骤并逐一执行,从而提高其准确性。
同时,DeepSeek-R1预览版的思维过程是完全透明的,允许用户验证不同阶段得出的答案。

值得注意的是,DeepSeek-R1预览版与OpenAI o1模型类似,会根据问题的复杂度,在回答前“思考”一会儿,有时甚至长达数十秒。
就在该预览版发布后不久,DeepSeek便表示计划开源DeepSeek-R1并发布API,果然,这就是开源精神。在中国所有大模型创业公司中,DeepSeek是为数不多未做to C应用的公司,而且坚持开源,深受社区欢迎。

此次一战成名,全世界不少人对DeepSeek这家中国公司产生兴趣。虽然DeepSeek是打响“价格战”后让大家熟知,但深入了解后发现,DeepSeek不仅没有烧钱补贴,甚至有利润。
在DeepSeek-R1预览版后,低调的“技术大牛”形象深入人心,让我们更加期待DeepSeek(深度求索)未来继续带来更多惊艳的AI模型。
分享到
0个赞- 精彩渔获
-
商务部将28家美国实体列入出口管制管控名单 -
“感知到中华文化之美” -
【开局之年看中国·遇见不一样的江苏】从一座城的两座“灯塔”,看江苏制造业的转型升级之路 -
潜口镇举行“腊八”旅游文化节 -
长三角百强企业年营收首次突破20万亿元 -
“我们的中国梦”——文化进万家暨“文化年货”活动举行 -
驱鸟声时而裂声如炮时而厉啸如雕 吵得附近居民夜不能寐 机场表示将持续优化作业时段,减少干扰 -
太平财险湖北分公司开展全民国家安全教育日宣传活动 -
王得立:这个书记真“得力” -
奥运冠军高崚砍杨树被邻居举报 自称为治理杨絮 -
安庆市四个村入选“全国乡村治理示范村” -
大S产后代班《康熙》献首秀 小S受伤停工再惹家暴传言 -
房地产税收新政策实施首月新增减免税116.9亿元 -
合肥:传统文化润心田 -
食品流通、餐饮服务许可证“两证合一”最快三天 -
李康生称波多野结衣适合娶回家当老婆 神似林志玲 -
商务部:坚决反对欧盟对俄制裁列单中企和个人 -
河南省新版食品经营许可证正式启用 -
喝酸奶能预防糖尿病吗?没错! -
机场高速将开启双向8车道时代 上周已开始转换 -
中新人物丨对话维妮娜:在乘风之前,她已经跑了很久 -
郑州再启Ⅱ级应急减排措施 机关停驶30%公车 -
《侏罗纪世界》剧情版预告片公布 恐龙主题公园显露 -
敬一丹本人证实4月底退休 还将继续做教育工作 -
中新人物丨“网红”导游迪丽努尔:想做一个小小而结实的桥梁 -
合肥:传统文化润心田 -
60岁敬一丹月底将退休颐养天年 曾获金话筒奖(图) -
苹果卖服务几乎和卖手机一样挣钱,但好日子可能要到头了 -
新春逛黄山许村:诗书传家,古村有戏更有味 -
《鲁豫有约》闫妮自曝离婚往事 张艾嘉揭底李宗盛

长三角一体化古镇发展大会在铜陵市大通古镇举办
三名男子在麻将馆装作弊设备“出老千” 均因诈骗罪被判刑并处罚金
金秀贤谈出演《制作人》:想尝试自毁形象
驱鸟声时而裂声如炮时而厉啸如雕 吵得附近居民夜不能寐 机场表示将持续优化作业时段,减少干扰
汪绍琴:甘做居民“贴心人”
武汉这个移民村的2000株樱桃树果实满枝 “思乡树”变“摇钱树”