AI资讯
DeepSeek开源第三弹,极致榨干GPU,FP8训推秘籍公开
内置JIT,像教程一样干净! 刚刚,DeepSeek开源周第三弹发布——DeepGEMM,一个支持密集和MoE GEMM的FP8 GEMM库,为V3/R1训练和推理提供动力。 ⚡ Hopp...
传DeepSeek R2提速,字节豆包灰测深度思考,微软Copilot已免费开放
今日,微软宣布面向所有Copilot用户推出免费、无限制访问的Voice(语音)和Think Deeper(深度思考)功能,由OpenAI的o1模型提供支持。 在DeepSeek带飞AI推...
高盛中国AI医疗指数里的新叙事
2025年,在现象级DeepSeek热潮的影响下,投资者看到了中国在AI各个领域取得的进展。 随着这股劲风吹向医药板块,AI医疗概念愈发火热。受此影响,在港股市场...
开源的风吹到视频生成:阿里开源登顶VBench的万相大模型,一手实测来了
当很多 AI 公司还就是否该走开源路线而感到左右为难时,阿里的技术团队又开源了一个新的模型 —— 万相(Wan)视频生成大模型(包括全部推理代码和权重,最宽松...
人形机器人商业化前夜:“裸泳者”和“孤泳者”的游戏
2004年,电影《我,机器人》在全球上映,影片描绘了一个设定在2035年的未来世界,人形机器人高度发达,已经成功融入人类的生产与生活之中。这些机器人不仅具...
刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1
就在刚刚,Anthropic祭出首个混合推理Claude 3.7 Sonnet,堪称扩展思考模式的最强模型。在最新编码测试中,新模型暴击o3-mini、DeepSeek R1,AI编码王者出世...
DeepSeek,为互联网医疗指了条新出路
DeepSeek的热度仍在延续,深度推理模型、深度思考模式充分展现出较长思维链的优势。用户通过与DeepSeek的对话,能获得更加全面、清晰、思路严谨的优质解答。 ...
DeepSeek给的压力太大,前国产大模型之光Kimi变阵
之暗面还不想从这个赛道退出,所以才要放弃眼前的利益。 DeepSeek的横空出世无异于是AI界的一次“小行星撞地球”,直到现在它的连锁反应还在继续,不仅是A...
降价到三四千元,宇树科技要用小米模式让机器狗普及?
已在机器狗(四足机器人)行业占据主导地位的宇树科技,打算实现更伟大的目标——将机器狗的价格降低至三四千元,让每个人都买得起。 机器狗领域宇树科技与波...
谷歌超硬核教科书来了,Jeff Dean带货揭Gemini训练秘籍:在TPU上scaling
谷歌团队发布LLM硬核技术教科书,从「系统视图」揭秘LLM Scaling的神秘面纱。Jeff Dean强调书中藏着谷歌最强AI模型Gemini训练的更多信息。 由于深度学习的「...