标签:代码

阿里云推出最新通义千问 QwQ-32B 推理模型,仅 1/20 参数媲美 DeepSeek R1

阿里云通义千问官方今日宣布推出最新的推理模型 QwQ-32B。这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 ...

为DeepSeek MoE模型带来「免费午餐」加速,专家链可大幅提升LLM的信息处理能力

我们都知道,DeepSeek-R1 的训练过程使用了一种名为专家混合模型(Mixture-of-Experts, MoE)的技术,而当前的 MoE 技术依然还有显著的优化空间。近日,美国...

视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源

今天给大家重磅推荐一个突破性的视觉强化微调开源项目 —— Visual-RFT (Visual Reinforcement Fine-Tuning)。 论文地址:  https://arxiv.org/abs/2503.01...

腾讯元宝半个月投了近 3 亿元做推广,“高冷”微信也成导流工具

据财经天下报道,2 月 13 日,腾讯元宝宣布接入 DeepSeek 后,开始在各个渠道凶猛投放广告。据悉,元宝的广告几乎刷遍了包括腾讯系 App 在内的所有平台。连腾...

AI 玩《超级马力欧兄弟》:Claude 3.7 操作最溜,推理模型表现不佳

加利福尼亚大学圣地亚哥分校的 Hao 人工智能实验室(Hao AI Lab)上周五开展了一项独特的研究,将人工智能(AI)引入经典游戏《超级马力欧兄弟》中,以测试其...

AI三小时做的小游戏,9天赚12万,马斯克:AI游戏前景无限

太酷了! 一个人,只用3个小时,完全靠AI开发游戏,9天时间就赚了17360美元(折合人民币12.64万)。 就是这样一个飞行模拟游戏,最近引来上千万人围观热议...

DeepSeek开源周启幕,Flash MLA解码内核引领AI效率革新

DeepSeek公司近期宣布了一项重大举措——“开源周”,旨在向全球开发者社区开放其技术研究成果。作为这一活动的开场,首个亮相的代码库是Flash MLA,一个专为Hopp...

DeepSeek来了!人工智能知识产权法律保护须强化

2025年1月28日,深度探索DeepSeek发布,在世界产生巨大反响,DeepSeek在知识问答、长文本处理、代码生成和数学能力等方面达到顶尖水平,实现中国人工智能技术...

激活AI产业链 DeepSeek持续扩大生态圈

DeepSeek(深度求索)成为继ChatGPT之后的又一现象级AI产品。据国内AI产品榜统计数据,DeepSeek应用在上线仅20天后,其日活跃用户数(DAU)迅速突破2000万大...

生成式人工智能产品快速普及应用

数据来源:中国互联网络信息中心 版式设计:蔡华伟 “请帮我给朋友写一段新春祝福”“请作首春节题材的诗”“请帮我解出这道数学题”……今年春节期间,凭借卓越的...
123433