标签:LLM

阿里云推出最新通义千问 QwQ-32B 推理模型,仅 1/20 参数媲美 DeepSeek R1

阿里云通义千问官方今日宣布推出最新的推理模型 QwQ-32B。这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 ...

为DeepSeek MoE模型带来「免费午餐」加速,专家链可大幅提升LLM的信息处理能力

我们都知道,DeepSeek-R1 的训练过程使用了一种名为专家混合模型(Mixture-of-Experts, MoE)的技术,而当前的 MoE 技术依然还有显著的优化空间。近日,美国...

斯坦福大学研究:教育水平较低地区的 AI 写作工具使用率更高

自 2022 年底 ChatGPT 推出以来,关于人工智能语言模型将如何广泛影响世界的讨论一直存在。如今,随着一项由斯坦福大学牵头的新研究的发布,这一图景逐渐清晰...

日本儿童虐待检测 AI 系统项目宣告失败,耗资十亿日元开发

随着人工智能(AI)技术的快速发展,日本企业和部分政府部门纷纷涉足这一领域,试图通过技术手段提升效率、解决人手短缺等问题。然而,该国一项旨在保护儿童...

耶鲁、剑桥等开发MindLLM,将脑成像直接转换为文本

编辑 | 萝卜皮 将功能性磁共振成像 (fMRI) 信号解码为文本一直是神经科学界面临的一项重大挑战,它有望推动脑机接口的发展,并加深对大脑机制的了解。然而,...

知名分析师发文 DeepSeek爆红后端侧AI趋势有望加速

知名分析师郭明錤日前发文指出,DeepSeek爆红后,端侧AI趋势将加速。DeepSeek的爆红直接提升英伟达H100的训练需求,这证明优化训练方式(也可视为成本降低)有...

AI已经越过红线?复旦大学研究表明:在知道自己将被关闭后,AI复制了自己

AI能自己复制自己了,人类还能掌控局面吗? 复旦大学研究人员于2024年12月9日发表的一项开创性研究表明,来自Meta和阿里巴巴的两个大型语言模型(LLM)成功...

神州数码郭为:AI驱动流程再造拓展企业价值增长点

2025年伊始,神州数码正加快推动企业级AI应用落地的步伐。近日,由神州数码携手生态合作伙伴共同打造的DC·AI生态创新中心在深圳正式开幕。这一AI科创新地标集...

神州数码加速AI应用落地 DC·AI生态创新中心启幕

2025年,神州数码开始加速AI应用产业落地。 1月15日,由神州数码携手生态伙伴共同打造的DC·AI生态创新中心正式启幕。该中心位于深圳湾超总基地神州数码国...

提升AI代理可靠性 英伟达推出容器化微服务Inference Microservices

英伟达周四推出用于加速生成式AI模型的部署的容器化微服务Nvidia Inference Microservices(NIM),希望帮助企业提高人工智能代理的信任、安全和可靠性。 ...
12322