2025-06-16
2025-06-15
- 纯Prompt提示LLM的多阶段知识图谱三元组抽取及Schema生成方案
- 【源头活水】何恺明改进了谢赛宁的REPA:极大简化但性能依旧强悍
- 李飞飞:AI的下一个大脑是理解3D空间的世界模型
- 谢赛宁敲响学界警钟!AI研究可能陷入一场注定失败的有限游戏
- 深度|GitHub CEO :真正的变革不是程序员被AI取代,而是写代码的起点、过程与目的正在被AI重构
- 为何我们被简洁公式吸引?从信息论视角来解析数学美学的本质
- 阶跃星辰高管离职,跳槽京东;百度最大规模抢夺顶尖AI人才,岗位增超60%;阿里自曝:被DeepSeek逼急了 | AI周报
- 被骂“在乱讲”的专家,这次可能说对了:传统数据仓库正在被 Agentic AI 吞噬
- 智能投顾的大模型应用,为什么选择了“大小模型协同”?
- 复旦大学/上海创智学院邱锡鹏:Context Scaling,通往AGI的下一幕
- 谢赛宁敲响学界警钟!AI研究可能陷入一场注定失败的有限游戏
- AI记忆伪装被戳穿!GPT、DeepSeek等17款主流大模型根本记不住数字
- CVPR 2025 Highlight | 国科大等新方法破译多模态「黑箱」,精准揪出犯错元凶
- 放弃博士学位加入OpenAI,他要为ChatGPT和AGI引入记忆与人格
- 机器人也能边想边做!清华团队OneTwoVLA让机器人煮火锅、炒菜、调酒样样精通
- 通过对话即可执行DNA、RNA和蛋白质任务,InstaDeep提出多模态智能体ChatNT
- MCP:AI界的“Type-C”——让AI模型和世界对话从此“零代沟”!
- 通报批评!抄袭基金申请书、买卖论文等,涉及多所高校!基金委最新通报一批不端行为案件
- 【深度学习】全面讲透,Transformer的5大核心优势 !!
- 我特别喜欢的三个DeepSeek版本
- 不喜欢ggplot2,R老年人可以试试ggfree!
- 阿里员工内网发表万字离职帖,马云亲自发帖回应,引发全网共鸣!离职员工也回应来了!
- 【CVPR 2025亮点】SCSA:即插即用的语义连续-稀疏注意力新范式
- 爆笑!研究生录取通知书能有多敷衍?同学,得麻烦你自己打印了…
- 如何将 Jupyter Notebook 配置的既美丽又高效!
- WebDancer:从零训练一个DeepResearch类智能体
- 李宏毅:语言模型如何学会说话 — 概述语音语言模型发展历程
- 从RAG到DeepSearch
- Kaggle最新LLM相关大赛复盘总结!
- AI 协作的未来?Anthropic 多智能体系统的实战设计
- ICLR 2025 | 中国团队颠覆AI视频分析!纯文本模型+工具包吊打GPT-4o
- 多人视频生成技术新突破!清华提出 DanceTogether:从单张图像到多人互动视频生成,从此告别身份混淆。
- Google DeepMind 发布最强视频生成工具 Veo 3, 可为作品添加音效、环境噪音、对话,文中附体验链接。
- CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?
- 全方位实测首个AI原生浏览器!618比价、写高考作文…网友:再见Chrome
- 比马斯克Neuralink工艺更先进!我国成功开展首例侵入式脑机接口临床试验
- AI ASMR突然火爆全网!3天狂揽近10万粉丝,一条切水果视频播放量破1650万
- 破解三大数据库AI难题!北大&亚马逊推出全球首个图中心RDB基础模型
- CONFIDENCE IS ALL YOU NEED
- AI 彻底摆脱人类!Anthropic让模型自己微调自己,左脚踩右脚要上天……
- 要不要搞多智能体?Anthropic和Cognition干起来了……
- 陶哲轩 x Lex Fridman = π!3小时14分播客:AI 能帮人类解决最难的问题吗?
- 陶哲轩 x Lex Fridman 3小时14分播客【续】
- 10张图全面理解AI Agents、Agentic、RAG、MCP技术栈。
- 首例!苹果竟被AI大模型Claude写论文驳斥:R1思考幻觉的幻觉!
2025-06-14
- 【他山之石】何恺明评审,谢赛宁贾扬清获奖!牛津华人博士生拿下CVPR 2025最佳论文
- 自主agent路线错了!华人学者提出LLM-HAS:从“自主能力”转向“协作智能”
- “多模态方法无法实现AGI”
- 万字追问:人类需要AI,还是更需要自身AI化?
- 大模型能否读懂真实病历?哈佛医学院发布BRIDGE大规模多语言评测基准
- 员工每天花1000美元也要用ClaudeCode!创始人:太贵了,大公司专属,但它比 Cursor 猛!
- “多模态方法无法实现AGI”
- 看不见的底座:大模型 Infra 工程师的实战日常 | 直播预告
- LLM已能自我更新权重,自适应、知识整合能力大幅提升,AI醒了?
- 多智能体在「燃烧」Token!Anthropic公开发现的一切
- 苹果《思考的错觉》再挨批,Claude与人类共著论文指出其三大关键缺陷
- 单卡4090也能高质量视频编辑!西湖AGI Lab无训练框架FlowDirector来了
- 通用 Agent 之外,Agentic Age 流量赛还有哪些「隐藏副本」?
- 首个统一的图像与视频AIGC可解释性检测框架,多榜单SOTA性能
- 大模型能否读懂真实病历?哈佛医学院发布BRIDGE大规模多语言评测基准
- 基础统计学
- 国企6年破茧,我“杀入”大模型算法圈
- 韦东奕在数学顶刊发文!
- 刚刚,LeCun 亲自出镜,Meta 推出新世界模型!
- CVPR2025开始集合,desk reject原因大揭秘!
- 卷积神经网络中用1*1 卷积有什么作用或者好处呢?
- 全网最全的Scikit-Learn学习手册!
- 能办成事的Agent:实时与环境交互,从经验中学习
- AI版玩具总动员!Articulate AnyMesh:开放词汇3D可动对象建模,自动给任意物体上关节然后动起来。
- 阿里开源语音黑科技!SenseVoice:50+语言识别、听懂你的情绪,速度超Whisper 15倍
- 字节推出统一多模态模型 BAGEL,GPT-4o 级的图像生成能力直接开源了!
- 不是P图!用ComfyUI复原老照片,像素级重生太惊艳了!
- 腾讯元宝新功能:微信直接提取视频号文案,附无水印下载视频方法
- 100个硬核网站第5期,沉浸式网页翻译神器,支持双语对照!
- 谢赛宁苏昊CVPR25获奖!华人博士王建元一作拿下最佳论文
- 腾讯开源最强3D生成模型,消费级显卡就能跑 | CVPR
- 从天价咨询到免费AI,夸克能改变志愿填报这门生意吗?
- 突破125年世纪难题!北大校友联手科大少年班才子破解希尔伯特第六问题
- 40岁开始预防衰老最有效!1.9万人脑扫描揭秘:大脑衰老有“关键窗口期”
- 分割/识别/解说一个模型搞定!3B参数刷新视觉理解SOTA,图像视频全适配
- Qwen3 Embedding - 合成数据 is all you need
- Cursor CEO最新访谈:编程会消亡,但品味将永存
- 传言:中国AI 公司人肉运硬盘到马来西亚训练模型,美国芯片禁令形同虚设?
- 嗑药、家暴、跳楼!纽约时报曝光恐怖细节:ChatGPT 正让人们付出生命代价
- 微软RPT:强化学习的风又吹到了预训练!
- DeepSeek R1/V3作者开源轻量级vLLM,1200行代码读懂大模型推理技术!
2025-06-13
- 三种主流文本嵌入编码范式及KG-Infused RAG做问题扩展新思路
- 今日开源(2025-06-13):Nano vLLM轻量级推理引擎,1200行代码实现,集成前缀缓存/CUDA图形优化技术
- CSDN 创始人蒋涛:“码盲”消失,新程序员崛起
- 黄铁军对大模型的四个预判:洗牌、安全核爆、GPT-5与再造DeepSeek
- AGI真方向?谷歌证明:智能体在自研世界模型,世界模型is all You Need
- 提前15天预测50种可能情景,谷歌DeepMind凭借新模型彻底改变了台风预报
- 为什么物理学能如此强悍地创造新数学?
- Kaggle赛题解析:识别数据引用与分类
- 三大云厂同时瘫了?Cursor、ChatGPT跟着倒下!网友:整个互联网都要废了
- SGLang 推理引擎的技术要点与部署实践|AICon 北京站前瞻
- 硅基流动完成新一轮数亿元融资,打造开发者首选生成式 AI 开发平台
- AGI真方向?谷歌证明:智能体在自研世界模型,世界模型is all You Need
- CVPR 2025 Highlight|北大联手智元发布首个基于说明书的家电操作评测基准
- 腾讯打出「AI岗位薪酬不限」的底气来自哪?
- 1200行代码逆袭!DeepSeek工程师开源轻量级vLLM,吞吐量逼近原版
- 刚刚,Scale AI CEO Alexandr Wang正式官宣:Meta重金投资并挖走了我
- 统一20+多智能体方法,MASLab震撼发布
- 「倒计时3天」2025 WAIC云帆奖全球征集|共青年之智,铸AGI未来
- 2025谷歌研究学者计划名单:吴佳俊、Mamba作者Albert Gu、Tri Dao等获奖
- 一粒「扣子」,开启了Agent的全生命周期进化
- 烧钱一年,李飞飞的「空间智能」愿景有变化吗?
- 刚刚,CVPR 2025奖项出炉:牛津&Meta博士生王建元获最佳论文,谢赛宁摘年轻研究者奖
- ICML 2025 | 千倍长度泛化!蚂蚁新注意力机制GCA实现16M长上下文精准理解
- 提前15天预测50种可能情景,谷歌DeepMind凭借新模型彻底改变了台风预报
- AI研究人员如何节约能源?通过反向计算
- 零训练即可实现自我演化!首个基于科学智能体架构的AI疾病生物学家发布
- LangGraph实战:构建会思考、能记忆、可人工干预的多智能体AI系统
- 挑行李回家的高考女生火了!热心网友愿资助,多方最新回应,张雪峰建议
- 【Python】这几个Jupyter Notebook高级功能,不允许你还不知道
- 【NLP】提示词入门笔记:新手的学习路径实践
- “双院士”挂帅!985,迎来新校长
- MIT博士:仅需几十行代码,GPU利用率高达70%
- 极大补充ggplot2的统计分析能力(万字详细教程来了)
- 2025 年度国家科技奖拟提名项目公示
- 何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升
- 区块链到底是怎么保证安全和透明的?这东西难不难?
- 90W?那确实可以封神了
- CVPR 2025 | 超轻量级特征匹配新突破:轻量级特征匹配Mamba网络解析
- padding 在深度学习模型中重要吗?
- 韦东奕在数学顶刊发文!
- ACL 2025 | 如何自动构造GUI Agent所需的数据
- 阿里优酷大模型算法实习生
- 理解GRPO,超越GRPO!GVPO算法详解
- 基于Qwen3的DPO/KTO/ORPO/Simpo经验总结
- 2026年校招大模型方向的一些建议
- 3B小模型吊打72B巨头!轻量级文档视觉OCR,性能超Gemini,高效且精准!(附源码)
- LSNet,2025年最新主干网络,见大观小!
- 小目标检测的12种解决方案汇总,推荐收藏!
- 作为算法工程师,工作中如何让别人更懂你的价值?
- 父爱升级,爸气上分!
- 未来之翼——人工智能创意科普作品征集活动启动
- 百试百灵!硕博五个月从零基础到发出一篇深度学习论文的详细流程分享!25年新方法!
- 无需标注和奖励模型!仅靠自信度RL,16个样本训练20步,效果飙升21%!
- 直播预约 | 安全/可信论文分享@ICML&ACL2025
- 字节、港理工提出超强统一视觉生成模型 Many-for-Many,支持10+任务,8B参数“逆袭”商业视频生成引擎。
- 集成 R1 后的 GroundingDINO 究竟强在哪?一文带你看清 DINO-R1 的性能变革
- FramePack-F1:敏神全新算法重大更新!低显存ComfyUI可体验长视频生成
- 英伟达提出最强「描述一切」模型 (DAM),可生成图像或视频特定区域的详细描述,拿下7个基准SOTA!
- 全国首个高考志愿大模型,所有考生免费用AI选志愿!
- 突发!OpenAI出现宕机,无法登录
- 刚刚,AMD、OpenAI联合发布超强AI芯片,推理提升35倍
- 极客说|从 ViT 到 VLM:视觉建模的演进与多模态交互
- 高通将以24亿美元收购Alphawave Semi,增强AI数据中心份额
- 最后1天报名 | 微软大咖技术分享+动手实践工作坊,MCP协议如何驱动AI新范式?
- 2025 Microsoft Cloud & AI 技术峰会|全栈驱动,迈向 Agentic AI 新时代
- 谷歌前CEO深度专访:AI、智能体会重塑世界
- 职场人速看!快速掌握 DeepSeek,效率直接拉满!| 锁定6月14日《1 小时 AI 公开课》
- 超越英伟达B200!AMD最强AI芯:1.6倍大内存、大模型推理快30%,奥特曼都来站台
- o3-pro答高难题文字游戏引围观,OpenAI前员工讽刺苹果:这都不叫推理那什么叫推理
- 让机器人学会系统2慢思考,叠衣服倒咖啡等不在话下 | 上海交大&智元机器人
- 智能交互终于步入真·人机交互时代了,这很讯飞
- Figure自曝完整技术:60分钟不间断打工,我们的机器人如何做到?
- AI自己给自己当网管,实现安全“顿悟时刻”,风险率直降9.6%
- 知识类型视角切入,全面评测图像编辑模型推理能力:所有模型在「程序性推理」方面表现不佳
- 视频扩散模型新突破!清华腾讯联合实现高保真3D生成,告别多视图依赖
- 韦东奕论文登数学顶刊,将散焦方程的爆破性研究扩展至d≥4
- DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版
- 120亿腾讯系AI独角兽冲刺港股IPO,北大数院校友创业19年,包揽27%世界500强客户
- 一句话生成任务专属LoRA!Transformer作者创业公司颠覆LLM微调
- 每一幕皆可控!字节发布多主体视频生成神器,人人皆主角
- 吴恩达深夜发文:GenAI 时代应用工程师的必备能力清单
- 昨夜,全球AI 集体宕机逃离!
- 太牛了!建议硕博人群都来看看这个方向……
2025-06-12
- 如何用大模型自动生成PPT?AutoPresent及SlideCoder方案
- 今日开源(2025-06-12):VJEPA2-AC世界模型,VJEPA2自监督编码器助力,互联网规模数据训练机器人运动理解
- 揭秘夸克首个高考志愿大模型!蒸馏数百名人类专家经验、Agent 可完整生成志愿报告
- LeCun亲自官宣!Meta世界模型V-JEPA 2登场!仅用62小时机器人数据,就能实现零样本控制!
- 杨立昆亲自发布:Meta最强世界模型开源!
- 首个AI Agent零点击漏洞曝光:一封邮件窃取企业AI任意敏感数据
- 竞赛总结:Kaggle Drawing with LLMs
- 被“网暴”两个月后,Yann LeCun 携最新世界模型杀回!小扎千万美元激励抢人,Meta AI 内部权利之争开始
- 长文本推理 5 倍提速!面壁MiniCPM4 端侧模型发布,0.5B模型效果秒杀同级
- 刚刚,LeCun亲自出镜,Meta推出新世界模型!
- 银河通用X清华大学发布业内首款开源人形机器人全身遥操系统OpenWBT,支持多机型、跨虚实,小时内可轻松部署
- CVPR 2025 | 多模态统一学习新范式来了,数据、模型、代码全部开源
- SIGGRAPH 2025奖项出炉:上科大、厦大入选最佳论文
- 2D图像作中介,零训练实现3D场景生成SOTA:英伟达&康奈尔提出文本驱动新流程
- 从高考到实战,豆包大模型交卷了
- 通义实验室最新成果WebDancer:开启自主智能Deep Research的新时代
- 256块NPU训成8B视频模型、超越Sora等一众闭源!抖音内容技术团队开源ContentV
- 何恺明改进了谢赛宁的REPA:极大简化但性能依旧强悍
- CVPR 2025 多模态大一统:斯坦福 x 复旦提出符号主义建模生成式任务
- 推理模型与rag搜索结合!介绍5个马上能上手的小项目
- ACL 2025 | 让大模型听懂育种的语言,科学家提出首个种子科学多任务评测基准SeedBench
- 精度达原子级,基于深度学习的动态蛋白质设计,登Science
- Jupyter MCP 来了!
- 复旦 2025 新书大规模语言模型:从理论到实践
- 刚刚!OpenAI上线o3-pro,性能碾压Gemini与Claude,重新定义“最强模型”
- 年仅37岁,青年学者在工作岗位上突发疾病离世…系南开博士后、厦大博士
- AI 味儿,互联网时代的“文字狱”?
- 1.93bit 版 DeepSeek-R1 编程超过 Claude 4 Sonnet,不用 GPU 也能运行
- 惊呆!每天2小时搞跨境,3个月收入2万+美金,太香了!
- 技术没有捷径!
- Win10退役在即,KDE发起激进宣传:怒怼微软“技术勒索”,呼吁用户改用Linux!
- Tailwind 是技术债务:组件化 CSS 才是未来之道
- 【CVPR 2025亮点】MobileMamba:轻量级多感受野视觉 Mamba 网络,突破视觉处理效率与性能瓶颈
- 回首才发现,2024 年,博士学历断崖式贬值元年
- 【arXiv 2025】新型激活函数B-SiLU,即插即用,无缝集成各种模型,涨点!
- 从 Magistral 技术报告看 RL for Reasoning LLM 的最佳实践
- Qwen3-Embedding技术报告解读
- 【实习】百度电商搜索部-研究型实习生(有转正机会)
- 异步RL框架AReaL速览
- InstructSAM, 无需训练! 根据指令检测及分割一切目标!(附论文及源码)
- 震惊!仅需一行代码,新型激活函数TeLU,即插即用,优于现有激活函数!
- Kaggle最新量化大赛–加密货币市场预测!
- 文档解析PP-StructureV3:PDF秒变高质量Markdown文件
- AI创业CEO们的真实战场,如何跑通最后一公里丨智源大会精彩回顾
- 这本书简直神!让我轻松掌握了如何使用机器学习方法来处理各种类型的信号数据!!!
- 直播预约 | 16篇精选Agent论文分享@ICML&ACL2025
- 伯克利斯坦福联手造出「科研预言家」:77%准确率押注研究想法前景
- 无需人类插手!AI战队自主进化,人类玩家瑟瑟发抖
- 确认裁员了,很严重,所有数据人做好准备吧!
- 用超级通俗易懂的方式:写出了我人生的第一个SQL,比吃饭换要简单
- Agent 知识库免费开放,快来学习吧!
- AI 智能体框架对比表
- AI界的”六边形战士”!港科大×字节提出ComfyMind:生成/编辑/推理三连冠,开源领域再掀狂潮
- 港科大&快手提出统一上下文视频编辑框架 UNIC,各种视频编辑任务一网打尽,还可进行多项任务组合!
- 字节开源换脸写真模型InfiniteYou,可实现零样本身份ID一致保持,无缝集成FLUX、ControlNets、LoRAs!
- 加利福尼亚大学提出TULIP!视觉-语言模型的新王者!AI性能全面碾压CLIP!
- 杨立昆亲自指导开源世界大模型,为AI Agent打造超级大脑
- 火山引擎发布豆包大模型1.6,加速Agent大规模应用
- Mistral AI发布一站式编程助手Mistral Code
- 小扎“超级智能”小组第一位大佬!谷歌DeepMind首席研究员,“压缩即智能”核心人物
- 每秒生成超30帧视频,支持实时交互!自回归视频生成新框架刷新生成效率
- 最大的开源GraphRag:知识图谱完全自主构建|港科大&华为
- 实测豆包1.6,最火玩法all in one!Seedance登顶视频生成榜一,豆包APP全量上线
- Day0迁移、一键部署,华为开源的昇思MindSpore成为大模型开发的“万能钥匙”
- LeCun世界模型出2代了!62小时搞定机器人训练,开启物理推理新时代
- GraphRAG太慢LightRAG延迟高?华东师大新方法一招破解双重难题
- AI代码补全哪家强?两个新指标+一套新框架,让模型更懂开发者
- CVPR2025视频生成统一评估架构,上交x斯坦福联合提出让MLLM像人类一样打分
- 何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升
- 黄仁勋发布量子计算专用CUDA!预言量子计算机几年内应用,但现在还离不开GB200
- AI自动写学术综述:10分钟生成6万字,成本不到四块钱
- RL预训练 | 真的会颠覆预训练范式吗??
- 扎克伯格炮轰苹果缺乏创新,并千万美金年薪狂招AI 人才
- Yann LeCun放出憋了20年的大招:Meta开源V-JEPA 2世界模型
- 刚刚,OpenAI开放GPT-4.1偏好优化DPO,ChatGPT能真正学会你的「品味」了!
- AI 数学机器人横扫伯克利顶尖数学家!马斯克:AI 明年就超越最聪明的人类
- ACL’25 | 多智能体叛变进行中?首个多智能体安全守卫G-Safeguard亮相!
- 12.6k,谷歌这个开源项目炸了,全栈AI Agent
2025-06-11
- MCP的9个代表项目可视化流程及近日大模型开源进展
- GraphRAG的优劣势及文档解析结合RL强化学习新思路Infinity Parser
- 炸裂!又一个AI大模型的新方向,彻底爆了!!
- 今日开源(2025-06-11):MiniCPM4.0,8B原生稀疏模型媲美Qwen3,0.5B版int4量化实现极速推理
- 【他山之石】CVPR 2025 Highlight|AdaCM2:首个面向超长视频理解的跨模态自适应记忆压缩框架
- 【源头活水】多模态方向开源数据集资源汇总
- OpenAI 的阳谋与野心!「温和的奇点」背后
- 强化学习之父最新演讲:AI的未来是经验时代,人类的未来是去中心化合作
- 科学家提出达尔文哥德尔机器,让AI通过重写自身代码来改进自己,可将编码能力提高30%
- 具备记忆的智能体操作系统,MemoryOS重构AI Agent对话的持久性与个性化
- 小鼠也会“见义勇为”?研究揭示动物世界中的“救援本能” | 科技前线
- AFAC2025挑战组-赛题二:金融保险场景下多源文件长上下文一致性校验 Baseline
- 字节 AI 卷出新高度:豆包试水“上下文定价”,Trae 覆盖内部80%工程师,战略瞄定三主线
- 对话智源王仲远:机器人的大小脑可能会“合体”,但不是今天
- OpenAI o3-pro模型发布,但不能聊天
- 高考数学全卷重赛!一道题难倒所有大模型,新选手Gemini夺冠,豆包DeepSeek并列第二
- 刚刚,OpenAI正式发布o3-pro!奥特曼激动更新博客:温和的奇点
- 时空压缩!剑桥大学提出注意力机制MTLA:推理加速5倍,显存减至1/8
- 「Next-Token」范式改变!刚刚,强化学习预训练来了
- Mistral的首个强推理模型:拥抱开源,推理速度快10倍
- 103K「硬核」题,让大模型突破数学推理瓶颈
- 10%训练数据超越100%表现,机器人学习领域迎来重要突破
- AutoMat:让「看见原子」成为「理解材料」的科学直通车
- 浙大开发的荧光纳米传感器,超96.67%的准确率识别植物信号
- 博士学位证书和成绩单造假被公示,教育部:博士学历学位无效!
- 【机器学习】通透!L1和L2核心区别 !!
- 【效率】我常用的10个办公软件,提效神器,值得推荐~
- YYDS,哈工大博士的pytorch笔记火了!!
- 图像去噪的原理及实现
- 史上最大AI投资?百亿重金!最强打工皇帝赢麻了
- Cursor与Copilot开发实战:让烦琐编程智能化
- 一个超强的推理增强大模型,开源了,本地部署
- 极大补充ggplot2的统计分析能力
- 2025年还在用LSTM的也是神人了……
- 整理了50道LLM高频面试题!!
- 刚刚,OpenAI 最强推理模型 o3-pro 诞生!碾压 Gemini 2.5 Pro!
- 靠着崛起的 AI 赛道,国外大神月入 26 万刀…
- 6 分钟狂掉 750 亿市值!苹果发布会发啥了…
- 16年精心打磨,深度学习入门经典
- SQL失宠,跌出Top10创历史新低!TIOBE 6月榜单发布
- 只用一行 CSS,秒解决布局难题
- 已确认裁员了,很严重,大家做好准备吧!
- 【CVPR 2025亮点】MambaVision:当Mamba遇上Transformer,视觉骨干网络迎来新范式
- PyCharm 常用快捷键一览
- 为什么发顶刊的往往不是最聪明的人?
- 小红书大模型dots.llm1详解:一款高效且强大的混合专家模型,附技术报告英中对照版PDF
- 字节跳动生活服务算法招聘(社招/校招/实习)
- 从YOLOv5到YOLO11!改进有多大?
- 强化学习之父Sutton在智源大会上演讲观点总结
- NVIDIA Cuda与TensorRT模型部署,性能优化实践方案!
- 小目标检测遮挡及实时性难点,FBRT-YOLO特征互补重塑!(附论文及源码)
- 2025下一个风口:大语言模型(LLM)
- Magistral 发布:用纯RL打造出首个多语言、透明Reasoning大模型!
- CVPR2025 | 多模态LLM评测Tutorial
- Sam Altman:温和奇点
- 直播预约 | 九篇Efficiency LLM论文分享@ICML&ACL2025
- 复旦联合百度发布Hallo4:让AI肖像“活”起来!新型扩散框架实现高保真音频驱动动画生成!
- 大模型再现黑马!英伟达开源Llama-Nemotron系列模型,效果优于DeepSeek-R1。
- 复旦&腾讯优图提出基于扩散的情感说话头像生成方法DICE-Talk,可为说话的肖像生成生动多样的情感。
- 告别”纸片人”试衣!阿里&浙大提出3DV-TON,用3D几何骨架+动态纹理场,让虚拟模特”活”出真实衣褶!
- 太硬核了!全网最好用的100款AI工具推荐,强烈建议收藏!!
- OpenAI深夜突发o3-Pro,价格暴降80%,史上最强模型来了
- Ilya Sutskever最新演讲:AI将接管你的一切
- AI杯·2025星际争霸2锦标赛夏季赛邀你一起战斗!
- 职场人速看!快速掌握 DeepSeek,效率直接拉满!| 锁定6月14日《1 小时 AI 公开课》
- o3-pro正式推出!说声“嗨”就花了80美元,思考1+1用时16分钟
- 小扎开9位数薪酬新建AI团队!砸千亿收购华人初创公司,Llama 4太拉胯急坏了
- 智能体自己出现问题自己找!首次提出“自动化失败归因”课题 | ICML2025 Spotlight
- 华为版《黑客帝国》首次亮相:训推复杂AI前先“彩排”,小时级预演万卡集群
- 新“SOTA”推理模型避战Qwen和R1?欧版OpenAI被喷麻了
- o3绞尽脑汁仅答对40%的题目,开源模型基本乱猜?MMSI-Bench:多图空间智能试金石
- “甲方快乐模型”诞生,拿下平面设计新SOTA!多条件一键生成,还能独立调整元素 | 复旦&字节
- 医学领域也有世界模型了:精准模拟肿瘤演化,还能规划治疗方案
- 百度推出真·AI相机,拍照存储管理一步到位
- MSRA清北推出强化预训练!取代传统自监督,14B模型媲美32B
- 端到端GUI智能体首次实现“犯错-反思-修正”闭环,模拟人类认知全过程
- MiniCPM 4.0极速狂飙,端侧模型的比赛,结束了!
- OpenAI深夜数连发:o3降价80%,o3-pro上线,奥特曼最后一次手发长文,开源模型却延期了……
- 最新12种GraphRAG技术全面评测
- RAG:2025年检索增强生成前沿技术完全指南
- LLM评估:从原型开发到生产部署的全流程实践(含code)
- 突破延迟壁垒:AI智能体优化深度解析
- 基于知识图谱的Zero-Shot问答:大语言模型的事实锚定新范式
2025-06-10
- 真实场景下文档解析中的2大类8个常见问题:目录层级解析、布局检测、阅读顺序及长表格拼接
- 高校教师,降级!
- Spring AI Alibaba 1.0 GA 正式发布!
- 高分利器:Transformer+图像处理!创新性绝了,3位 IEEE Fellow推荐的含金量!
- 不仅蒸馏数据,也蒸馏Reward
- CVPR 2025 MINIMA:首个通用多模态图像匹配架构(模型、数据已全部开源)
- 顶刊风向标!Attention+LSTM+特征融合制霸中科院一区!
- 贝叶斯深度学习!华科大《Nat. Commun.》发表BNN重大突破!
- Mamba还能这么玩?新SOTA横扫14个图像修复任务,计算量降低150倍!
- 今日开源(2025-06-10):Pixel-Reasoner,像素空间推理新范式,两阶段训练提升VLM性能,实现文本和视觉平衡
- 【他山之石】北大、阿里等提出VLM-R³: 区域识别、推理与优化 — 增强多模态思维链的视觉交互新范式
- 遥感数据任务统一!首个时间-光谱-空间维度统一的遥感密集预测模型TSSUN
- 面壁MiniCPM4端侧模型发布:长文本推理 5 倍提速,0.5B 模型拿下新SOTA
- 当 AI 能写代码修 bug,高考报计算机专业是“火坑”还是“新机遇” |深度对话 6 位专家
- LLM神话破灭?苹果论文最新实锤:难以实现真正智能
- AI自发形成人类级认知!自动化所团队揭示多模态大模型涌现类人物体概念表征
- Nature:跨界探索的代价有多大?科研“枢轴惩罚”现象解读
- 谷歌CEO最新观点:我们当前已处于“AJI ”阶段
- 天塌了!苹果刚刚证明:DeepSeek,o3,Claude等“推理”模型根本没有推理能力
- 字节把GPT-4o级图像生成能力开源了!
- DeepSeek-R1-0528,代码能力比肩Claude 4 Sonnet?
- SIGIR 25:人大+百度 揭秘RAG:LLM如何巧妙融合“大脑”与“外援”?
- 苹果憋一年终超同参数 Qwen 2.5?三行代码即可接入 Apple Intelligence,自曝如何做推理
- TypeScript“杀疯了”!60% 到 70%YC 创企用它构建 AI Agent,超越 Python 有戏了?
- 刚刚,苹果WWDC掀AI重构风暴!端侧模型全开放、AI版Siri却成最大「鸽」王
- 比自回归更灵活、比离散扩散更通用,首个纯Discrete Flow Matching多模态巨兽降临
- 大模型是「躲在洞穴里」观察世界? 强化学习大佬「吹哨」提醒LLM致命缺点
- 一块4090搞定实时视频生成!Adobe黑科技来了
- 视频生成1.3B碾压14B、图像生成直逼GPT-4o!港科&快手开源测试时扩展新范式
- 李飞飞团队新作:DiT不训练直接改架构,模型深度减半,质量还提高了
- 扩散语言模型真的会比自回归好?理论分析结果可能恰恰相反
- 一个md文件收获超400 star,这份综述分四大范式全面解析了3D场景生成
- ICML 2025 | 抗体、多肽、小分子,一网打尽:UniMoMo基于隐空间扩散模型统一生成靶向药物分子
- 不懂编程也可使用,能生成协同自驱动实验室的简易操作界面,开源协调器IvoryOS
- 超越 SKLearn!更强大的机器学习框架PyTabKit
- 复旦NLP团队2025新书《大规模语言模型:从理论到实践(第2版)》重磅来袭!
- 使用 LLM 从零构建知识图谱
- 北大回应韦东奕健康问题,呼吁保护学者让其专心治学
- 【Python】100个pandas数据清洗小技巧,助你快速完成数据处理
- 《Happy-LLM》完整PDF首发!一周2.3k+star的大模型“顶流教程”
- 《Happy-LLM》狂飙2000+🌟!“手搓大模型”的快乐,谁懂啊?
- 分布之王,一文详解高斯宇宙
- 详解ggplot2—位置调整(position)
- 多所“新大学”,叫停、延期!
- 近千篇文献淬炼!哈工大领衔发布首篇长思维链综述!!
- 无敌!多模态直接封神。。。
- 讲透一个强大算法模型,Transformer !!
- 618福利持续发放中:CSDN会员年卡买一送一!
- 技术人新蓝海!AI + TikTok + 独立站,他靠这套“双引擎”3个月开启躺平模式?
- 写了50+万行代码、创办两家公司,他押注Rust十年后:“Rust工程师的平均水平,比大多数语言都要高”
- 我如何仅用 0.80 美元使用 Cursor 构建 17,000 行代码库
- 快速学会登上nature的热门算法,LSTM!
- 工业视觉缺陷检测的算法总结
- 独家!哈工大斩获AI顶会ACL评审阶段最高分,让AI领略汉字之美
- 超强!阿里开源 Qwen3 Embedding 系列模型,多语言文本嵌入与重排的新标杆
- 仅1.24ms!目标检测与分类Transformer细粒度分析,FPN终结者!(附论文及源码)
- Pytorch框架,怎么使用C++调用部署模型?
- 2045年具身智能有望全面超越人类,代表人类走向星际丨具身智能与人形机器人论坛精彩回顾
- Agent/长上下文/CoT/多模态等实战竞赛,百万奖金,就是AFAC2025!
- 实证:现在的LLM根本不会Reasoning!
- 直播预约 | Efficiency论文分享@ICML&ACL2025
- 直播预约 | Evaluation论文分享@ICML&ACL2025
- 下半年为数不多的大模型系列比赛开启啦!聊一聊AFAC2025大赛解题思路
- Qwen3-Embedding技术报告解读
- Doc2X:⾼精度、⾼性价⽐⽂档解析 API,助力Arxiv论文智能解读Agent构建
- 北大开源音频编辑模型PlayDiffusion,可实现音频局部编辑,比传统 AR 模型的效率高出 50 倍!
- 谷歌研究院联手牛津大学推出Bolt3D!7秒内单GPU生成高保真3D,推理成本直降300倍!
- AI界新王炸,输入提示词秒变PS大神?阶跃星辰开源图像编辑模型Step1X-Edit:19B参数对标GPT-4o。
- Magic Mirror:可从单个参考图像生成电影级质量身份一致性和自然运动视频
- 刚发布就刷屏!FLUX.1 Kontext 成最强AI修图神器,角色一致性超高!
- 突发!特朗普派700名海军陆战队,逮捕加州州长
- 苹果放王炸!开放大模型访问权、全家桶集成ChatGPT,人人能开发AI应用
- 开源多智能体开发框架:支持MCP、Agent SDK,超2000颗星。
- Meta与Constellation Energy签署20年核电协议
- AI杯·2025星际争霸2锦标赛夏季赛邀你一起战斗!
- 6分钟狂掉750亿市值!苹果发布会发啥了…
- 强化学习之父:LLM主导只是暂时,扩展计算才是正解
- 60%情况下,主流大模型没理解风险只是装懂!别被模型的“安全答案”骗了
- 20年物理疑云消散!「μ子异常」最新实验未发现显著偏差,标准粒子模型屹立不倒
- 1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet,不用GPU也能运行
- 揭秘LLM“思考”之谜:推理即“梯度下降”,元学习框架解构训练过程,还给优化提供新思路
- 华为创造AI算力新纪录:万卡集群训练98%可用度,秒级恢复、分钟诊断
- 全球人工智能创新创业大赛即将启幕!杭州拱墅全力打造AI创新高地
- 英伟达港大联手革新视觉注意力机制!GSPN高分辨率生成加速超84倍
- SOTA级视频编辑新方法:无需训练一句话编辑视频,背景保持100%
- 北大伯克利联手“拷问”大模型:最强Agent也才40分!新基准专治“不听话”的AI分析师
- 不是视频模型“学习”慢,而是LLM走捷径|18万引大牛Sergey Levine
- 0.5B以小搏大拿下端侧模型新SOTA:4090可跑,长文本处理5倍常规加速丨清华&面壁开源
- 一招缓解LLM偏科!调整训练集组成,“秘方”在此 | 上交大&上海AI Lab等
- 又爆了…一些年薪90W的方向
- Vector数据库退位,AI记忆Memvid登场!
- 构建真正有效的AI代理的七个关键步骤:从理论到实践的完整指南
2025-06-09
- RAG&KG&LLM&文档智能四大领域技术前沿:老刘说NLP技术社区持续对外纳新
- 大模型应用推介:多模态RAG、语法纠错、个人财务及Baby Monitor
- 2025年小目标检测新突破!
- 今日开源(2025-06-09):dots.llm1,MoE模型激活参数14B,11.2万亿token预训练,媲美Qwen2.5
- 本周大模型新动向:知识蒸馏、超强智能体、推理行为分化
- 实现扩散与自回归架构协同优化!DiSA:让自回归图像生成又快又稳
- 对话 PyTorch 掌门人 Matt White:AI 应用应该做到“润物细无声”
- 从「记忆解题」到「深度推理」:港科大推出首个本科数学动态评测基准 UGMathBench
- 苹果重磅论文翻车!被指测试方法有大问题……网友:Cook 该裁员了!
- Nature:大脑中的多时间尺度强化学习
- AI与数学的未来
- Yann LeCun 炮轰 Anthropic CEO!这人“既要又要”:要么太自大、要么不诚实
- AI大模型重塑学习硬件:从工具到伙伴 | 网易有道孟旭
- 最新!Ilya现身多大毕业演讲:AI会完成我们能做的一切
- ICML Spotlight 2025丨追求概率质量的帕累托最优:基于广义α-β散度引导的知识蒸馏框架ABKD
- 华为昇腾万卡集群揭秘:如何驯服AI算力「巨兽」?
- 质疑DeepSeek-R1、Claude Thinking根本不会推理!苹果争议论文翻车了?
- CVPR 2025 Highlight|AdaCM2:首个面向超长视频理解的跨模态自适应记忆压缩框架
- 开启端侧长文本时代!面壁全新架构,让小钢炮最快提升220倍
- 无需SFT也不用RL,样本级推理优化神器SLOT来了,准确率轻松+10%
- 中南大学开发DeepDTAGen:用于药物靶标亲和力预测和靶标感知药物生成的多任务深度学习框架
- 训练仅8分钟,诊断仅需47毫秒,超轻量级肺癌诊断 AI 模型,无需GPU,个人笔记本可运行
- 6月,终于迈过了4W这道坎!
- 算法岗和开发岗有什么区别?
- 高考作文“抽象”冲上热搜,ChatGPT、DeepSeek等十来个推理大模型集体上场,实测来了!
- 【深度学习】CVPR2025|LLMDet:在大语言模型监督下学习强大的开放词汇目标检测器
- Science重磅:全球首例!复旦科学家团队通过脑机接口,使失明动物恢复视觉能力
- 读博士,去哪找那么多创新点?水水得了…
- 车圈52名高管大调整!7名CEO变动,董事长都换了
- 李飞飞自曝创业经历:世界模型才是未来
- 苹果公司打假大模型,反转了
- 取代后端岗,太逆天了。。
- 可视化三剑客:ggplot2 + Matplotlib + Seaborn
- 从 YOLOv5 到 YOLO11!改进有多大?
- Web3 已死?不它还活得很好!听我用“村里的账本”给你讲明白
- TikTok+独立站:程序员必学的跨境掘金秘籍!
- Deepseek喂饭指令大全:内容创作/知识付费/编程开发/电商运营等
- “别再被AI骗了,写软件真的很难!”
- 面试时最先被淘汰的,往往是准备最充分的候选人
- 图像去噪的原理及实现
- 机器视觉中的滤波
- 目标检测正负样本区分策略和平衡策略总结
- 强的离谱!CNN又杀疯了
- 一个超强的开源代码大模型,开源了,本地部署
- Qwen Agent | 将思考「工具化」提升规划能力
- 为什么说Agent是一场持久战?Kimi技术大牛的深入分析
- 探讨Entropy(熵)机制在RL中扮演的角色
- 高分辨率图像小目标检测算法,大幅超越现有最先进检测器 !(附论文及源码)
- 5年AI工程化开发经验分享,聊聊AI项目落地的那些事!
- Kaggle CZII语义分割与物体检测Top方案总结!
- LoRA+MoE: 低秩矩阵和多任务学习结合的历史工作解读
- 蚂蚁、字节跳动开启顶会人才举荐了,大厂究竟在布局什么?
- 在武汉,交到了229位好朋友
- Meta、MIT、人大、腾讯、字节、Luma AI、Sand.ai:他们正重新定义多模态 | 智源大会·多模态论坛精彩回顾
- 从vLLM部署大模型推理来看如何加载部署PyTorch类大模型
- Theory of Agent:构造知行合一的智能体
- 直播预约 | Evaluation论文分享@ICML&ACL2025
- Knowledge还是Reasoning?具体分析LLM答案正确,不代表思考过程靠谱的问题
- 港科大&快手提出统一上下文视频编辑框架 UNIC,各种视频编辑任务一网打尽,还可进行多项任务组合!
- 字节提出从单一主题发展到多主题定制的通用框架UNO,通过情境生成释放更多可控性。
- 小红书提出新面部视频交换方法DynamicFace,可生成高质量且一致的视频面部图像。
- 腾讯混元&InstantX开源InstantCharacter,跨角色外观、姿势和风格个性化生成。
- 即梦3.0重磅升级!人人都能用AI自动P图了!附实操案例+完整提示词
- 突发!特朗普派遣国民警卫队,镇压洛杉矶暴动
- 小红书开源首个大模型,11万亿非合成训练数据
- Meta正与Scale AI洽谈100亿美元投资
- 消失的Ilya现身毕业演讲:AI时代如何生存,这是我的法则
- 奥特曼ChatGPT用法错了!最新研究:要求“直接回答”降低准确率,思维链提示作用也在下降
- 破解自驾数据难题!毫米波雷达可控仿真技术新框架来了
- 太逼真!豆包·播客模型来了:一句话生成「苏超联赛」播客,很懂13太保的梗
- 双重突破:全球首个零售VLA大模型来了!开源OpenWBT让机器人遥操门槛暴降!
- 给大模型装上「思维分段引擎」:浙大InftyThink解锁无限深度推理
- AI集体“听不懂”!MMAR基准测试揭示音频大模型巨大短板
- 中科闻歌完成新一轮战略融资,引领企业级人工智能技术发展
- AI七个月突破数学家“围剿”反超人类!14位数学家深挖原始推理token:不靠死记硬背靠直觉
- 谷歌Veo 3玩法大升级!“360°”关键词解锁3D效果,Fast版同分辨率价格暴降5倍
- 李飞飞自曝详细创业经历:五年前因眼睛受伤,坚定要做世界模型
- 首创像素空间推理,7B模型领先GPT-4o,让VLM能像人类一样「眼脑并用」
- 大模型能够自发形成“人类思维地图”!Nature子刊重磅研究揭示多模态大模型类脑机制
- 苹果重磅论文翻车!被指测试方法有大问题……网友:Cook 该裁员了!
- Ilya 多伦多大学最新演讲:AI 是人类有史以来最大的挑战,克服它会带来最大的回报。
- 你可能并不需要微调
- MiniCPM 4.0来了!220倍极速狂飙,端侧模型的比赛,结束了
- 卧底房产AI三天后,我发现地产圈的「信息差」,正被这样一铲到底!
- 集齐Agent、KG、多模态的AFAC金融智能创新大赛来袭
2025-06-08
- GraphRAG是否总是有效?9大代表方案在GraphRAG-Bench的多维度对比
- Science重磅:全球首例!复旦科学家团队通过脑机接口,使失明动物恢复视觉能力
- 涌现何时发生?机器观察者可以像人类一样识别涌现吗?
- 特斯拉Optimus人形机器人项目负责人离职(附离职宣言),马斯克:感谢10年贡献
- “美国版宇树”Figure回应“机器人进宝马”质疑,60分钟无剪视频宣称“三个月性能猛增”
- 曝豆包多模态负责人准备离职;马云频繁要求汇报 Qwen3 开发进度;北大“韦神”粉丝破2000万,评论区变高考许愿池 |AI周报
- 对 MCP 的批判性审视
- 6大模型决战高考数学新一卷:豆包、元宝并列第一,OpenAI o3竟惨败垫底
- 挑战 next token prediction,Diffusion LLM 够格吗?
- 数学宇宙二维破壁成功!四人组230页证明阿贝尔曲面镜像通道,大一统要实现了?
- 为什么用错奖励,模型也能提分?新研究:模型学的不是新知识,是思维
- 告别「失忆」AI!首个大模型记忆操作系统开源框架来了!
- 大模型强化学习新突破——SPO新范式助力大模型推理能力提升!
- ICML 2025 | 全局池化+局部保留,CCA-Attention为LLM长文本建模带来突破性进展
- 重磅!清华正式开源首个全异步强化学习训练系统!
- 院士增选启动!这些院士候选人,再获国家奖
- ICLR 2025|一个 Transformer 统一多模态理解和生成!Show-o:LLM 自回归做理解,MaskGIT做生成
- pytorch怎么使用c++调用部署模型?
- 算力终结者来了!华人天团「降维打击」注意力瓶颈,AI狂飙进对数时代
- Python 图像分析:两个圆圈的故事
- 显著提升表示学习效果!一种适用于时间序列的频域数据增强方法。
- 文本训练能提升多模态Reasoning能力?三阶段训练7B小模型吊打GPT-4o
- 记忆张量联合上海交大等提出首个面向大模型记忆管理的操作系统框架MemOS
- 直播预约 | 别让AI困在题海里:模型评估如何摆脱应试枷锁?
- C语言如何直接控制硬件?指针、内存与寄存器
- IDEA 团队新作 | Rex-Thinker:通过 CoT Reasoning 推理实现稳健的指代表达理解
- Ctrl-Crash 助力交通安全:可控生成逼真车祸视频,防患于未然
- 字节跳动提出Pixel-SAIL!单一Transformer实现三大突破,性能不降反升!
- CVPR 2025 | 字节提出个性化多人图像生成新方法ID-Patch,可生成多人合影、姿势可控。
- ICIR2025 | CubeDiff:无需考虑失真,重新利用基于扩散的图像模型来生成360°全景图
- 韦东奕粉丝破2000万,评论区成了许愿池
- 苹果炮轰推理模型全是假思考!4个游戏戳破神话,o3/DeepSeek高难度全崩溃
- 腾讯顶尖学生招募启动!高中生可直接参与大模型/具身智能前沿研究
- 打破跨模态干扰,快手东北大学联合提出统一多模态框架,横扫多模态检索基准
- 8个数据集全面胜出!思维链推理刷新图学习表现上限
- Yann LeCun手撕Anthropic CEO:杞人忧天的伪君子!
- 苹果宣判推理模型死刑!Google CEO:忘了AGI吧,先用好AJI
- 木头姐:马斯克是当代爱迪生
- 苹果研究发现:DeepSeek-R1/o3/Claude都是假“思考”!
- 大模型面经——MLLM中模态对齐有哪些难点?有什么解决方法?(一)
2025-06-07
- 再看知识图谱本体生成:RAG用于Mysql数据转换及非结构化文本生成思路
- 对话智源王仲远:具身智能“小组赛”才刚刚开打,机器人需要“安卓”而非 iOS
- Claude Code 首席工程师揭秘 AI 如何重塑开发日常!
- 谷歌CEO最新深访完整版:人工智能、未来十年与人类进步的本质 | 3.5万字· 附视频
- “AGI 五年内或将实现”:AI 教父 Bengio 呼吁中美达成共识,警惕 AI 沦为人类武器
- 图灵奖得主 Yoshua Bengio 智源大会最新演讲:关于AI,我改变了信念,也改变了研究方向
- OpenAI高管最新发文:为何人类会对AI产生情感依恋?如何应对?
- 别被MCP的包装骗了!重构系统、向智能体转型,CEO亲述:关键时刻还是RPA兜底?
- 18天光速打脸!OpenAI刚夸TypeScript最合适,转头就用Rust重写Codex CLI
- 全球圈粉6000万,被国内粉丝催着上线,PixVerse「国内版」一手实测来了!
- 没想到,最Open的开源新模型,来自小红书
- 扩散语言模型扛把子LLaDA迎来新版本,数学、代码、对齐能力均提升
- ACL 2025 | 大语言模型正在偷改你的代码?
- AI 推理成本暴跌,「互联网女皇」 Mary Meeker 从中看到了什么?
- VSCode不装了!新版剑指Cursor,MCP支持buff叠满!网友看罢: 真·AI神器?
- 抖音一天涨粉超过1000万!韦东奕创造了学术界互联网涨粉的神话
- 【深度学习】50个超强pytorch操作!!
- 【Python】使用seaborn/matplotlib定制好看的confusion matrix
- 大模型写高考作文,状元是DeepSeek,榜眼是Qwen3,探花是Gemini
- 清华姚班校友爆改Transformer!!
- 知乎热议 | 为什么感觉中国大部分科研工作者都比较水,但是中国科技进步迅速而且强大?
- Matlab为何依旧坚挺?
- 开发者新神器——Deepseek AI Agent自动化开发实战
- 入门岗招聘骤降、Anthropic成“AI人才挖角王”,6.5亿职场人数据揭示AI招聘真相!
- AI 检测沦为学术酷刑,聊聊近期高校推行的 AIGC 检测制度
- 高考了,让我们再回顾一下被美国“制裁”的中国大学名单。。。
- 用Numpy手写各种距离度量
- 2025高考全国一卷作文,来看看DeepSeek, Qwen, Kimi如何作答
- “能干活才是未来”,五大先锋公司激辩智源具身智能会客厅 | 智源大会
- 从张祥雨多模态研究曲折到未来两大 GPT-4 时刻的访谈中谈谈我对智能涌现的思考
- SIGGRAGH 2025 | AI视频生成黑科技!港大&达摩院发布分层视频生成LayerFlow:再也不用视频抠图了!
- StepFun提出Step-Video-T2V!300亿参数视频生成大模型!可生成204帧视频!
- Apple提出UniGen!多模态理解生成统一xii新架构!CoT - V提升图像生成质量!
- 南洋理工 & 牛津 & 新加坡理工提出Amodal3R,可从遮挡 2D 图像重建完整 3D 资产,3D生成也卷起来了!
- 2025高考作文题目出炉,9个主流AI大模型3秒交卷,结果能打几分?
- 马斯克祸不单行!擎天柱负责人突然离职,特斯拉蒸发万亿市值
- 生图效果媲美GPT-4o,一键搞定各类视觉生成任务丨港科广&字节全新框架
- 多模态模型挑战北京杭州地铁图!o3成绩显著,但跟人类有差距
- 小红书开源大模型dots.llm1,初次出手,小有惊艳!国外网友们又炸了……
- 时空扭曲实验室突破,超光速旅行或将成为现实!
- Google研究发现:Multi-Agent的核心竟然是Prompt设计!
2025-06-06
- 有趣思考:如何带着问题去针对性学习-兼看大模型推理、强化、RAG等进展
- 今日开源(2025-06-06):Qwen3Embedding,0.6B至8B文本嵌入模型,多语言与长文本能力,检索任务显著提升
- 【源头活水】经典ReLU回归!重大缺陷「死亡ReLU问题」已被解决
- 【源头活水】MIT与Adobe联手开发AI视频生成工具,画质不输Sora,还能实时修改
- 【源头活水】统一架构新思考,北大团队UniWorld-V1统一大模型
- 【他山之石】CVPR 2025 | MaIR:Mamba没Out!S型扫描策略助力MambaIR进一步提升!
- 强化学习之父Richard Sutton:人类数据耗尽,AI正在进入“经验时代”!
- “AGI 五年内或将实现”:AI 教父 Bengio 呼吁中美达成共识,警惕 AI 沦为人类武器
- 谷歌Gemini-0605发布,全球大模型第一!
- 危险?OpenAI 模型行为负责人:人类很快会进入「AI意识」,当前最重要是控制人机关系的影响
- 深度长文|告别“失忆”与内卷:LLM炼金术,“时间回溯”如何让模型性能暴涨19%?
- 人工智能与哲学的未来:一个新的前沿
- 小白学大模型:Qwen3 嵌入和重排序模型
- 小红书hi lab首次开源文本大模型,训练资源不到Qwen2.5 72B 的四分之一
- 王兴兴回应比赛风波:挣到钱了,但现在的机器人别指望它能干活
- OpenAI 早期董事会成员:算法与神经网络成“超能架构”,我们如何自处?|文末赠书
- 免费约饭!美国CVPR 2025,相聚机器之心人才晚宴
- 深夜突袭!谷歌Gemini 2.5 Pro更新蝉联榜一:推理超越o3,编程超越opus4
- MoE推理「王炸」组合:昇腾×盘古让推理性能狂飙6-8倍
- 不愁了!开源智能体Paper2Poster「一键生成」学术海报
- 字节Seed新作:模型合并如何改变大模型预训练范式
- 刚刚,智源全新「悟界」系列大模型炸场!AI第一次真正「看见」宏观-微观双宇宙
- 类R1训练不再只看结果对错!港中文推出SophiaVL-R1模型
- 「AI+生物学」如何保证安全?Evo2等DNA基础模型生成「致病生物」怎么办?
- 错误率下降44.66%,给AI神经元装上三个突触,灵活的生物启发模块来了
- DrugCLIP:AI驱动超高通量虚拟筛选引擎,开启后AlphaFold时代创新药物发现新篇章
- 超越花书!这本经典巨著出中文版了!
- 万亿GDP城市,迎来第一所985
- 香港科技大学已取录两位哈佛转校生,此前曾宣布“向哈佛学子敞开大门”
- 快手发布大模型,融合“思考”和“非思考”能力,比DeepSeek-V3还强
- 超强!阿里又开源两个知识库领域的模型(向量化、重排)
- 读博士,去哪找那么多创新点?水水得了…
- 新版 Gemini 2.5 所有榜一,谷歌无敌了!一个月全面击败 o3,编程反超 Claude 4
- Science披露:近3年,垃圾论文激增,92%来自中国
- 机器视觉边缘检测算法详解
- 机器视觉镜头基础知识详解
- 揭示小规模SFT在R1-Style强化学习中的关键作用
- Qwen3 Embedding:基于基础模型的文本嵌入与重排序技术,附技术报告英中PDF对照版
- 大模型推理优化:KV Cache
- Cursor团队访谈:AI编程的关键判断、做什么、不做什么
- 无需训练、不靠检测也能精准计数?首个自监督视觉大模型CountingDINO!(附论文及源码)
- 刚刚,Qwen3官方开源新系列,3种尺寸可选,再次拿下SOTA!!
- 即将截止征集 | 生成式人工智能知识产权标准,欢迎加入!
- IDC发布2025基础大模型报告:文心大模型综合能力第一
- 百度飞桨 x 张江集团中学|人工智能课堂“活”起来了!
- 高考加油!世界期待的不是标准答案,而是你思考时的模样
- 图灵奖得主 Yoshua Bengio 智源大会最新演讲:关于AI,我改变了信念,也改变了研究方向
- 图灵奖得主 Richard Sutton 智源大会最新演讲:欢迎来到经验时代!
- 自然语言+数值双反馈碾压传统RL!Critique-GRPO给模型“写批注”提效300%
- 北大联手通义实验室发布ZeroSearch:成本暴降88%,无需搜索即可激活大语言模型的检索能力!
- 跟巴菲特学分析思维:让你看清未来趋势 | 什么是水平分析?
- 跟巴菲特学分析思维:如何看懂公司发展重点 | 什么是垂直分析?
- 转发有奖|AFAC2025金融智能创新大赛,持续火热招募中!
- 无需人工标注或 GPT-4o 蒸馏:MIT 提出基于循环一致性的图文对齐方法
- 科研人神器,论文秒变海报!Paper2Poster:一键生成顶会级学术Poster,再也不用为赶会熬夜做PPT啦。
- 字节开源换脸写真模型InfiniteYou,可实现零样本身份ID一致保持,无缝集成FLUX、ControlNets、LoRAs!
- 图像定制大一统?字节提出DreamO,支持人物生成、 ID保持、虚拟试穿、风格迁移等任务,有效解决多泛化性冲突。
- 7k星星爆火!用微信聊天记录训练一个自己的数字分身回信息,还能克隆声音回复语音消息。
- 太全了!50个常用AI视频提示词,解锁影视级运镜效果
- AI领域的律师服务正式开启全新篇章!
- 【AIGC应用】从模型狂热到数据务实:用AI-Ready Data破解大模型数据“三无”困境
- 【AIGC趋势】编程能力暴涨,实测直逼Claude 4,网友玩疯直呼太强了
- 【行业动态】夸克启动“深度研究”邀测,已开放邀请码申领,昇腾CANN成中国AI 创新底座
- PaperDaily,开源!
- 319-A1|高效图像生成,多条件控制,产品图像,HOI编辑;LDM平移等变性;安全篇(概念擦除,生图检测,版权保护,对抗攻击)
- 319-A2|视频身体交换,单目视频生成多视角视频,训练与推理效率,统一视频生成与密集预测,后训练提高物理准确性;图生全身说话人
- 319-A3|3D几何超分,奖励加权采样SDS,可扩展3D场景生成,3D形状VAE;3D动作角色扮演VLA模型
- 319-B1|多模态与基础模型系列
- 319-B2|偏好对齐视频描述生成,高效流式视频理解,细粒度面部视频理解,长视频理解与问答,自我中心、日常活动视频理解,时间定位
- 319-B3|多智能体图像修复;3D重建系列
- 特朗普大骂马斯克疯了!特斯拉一夜蒸发超1500亿美元
- 性能大涨!阿里开源新版Qwen3模型,霸榜文本表征
- 微软大咖技术分享+动手实践工作坊 | 从技术到商业,MCP协议如何驱动AI新范式?
- 微软发布AI Agent故障白皮书,万字解读各种恶意智能体
- Gemini新版蝉联竞技场榜一,但刚发布就被越狱了
- Qwen3深夜开源新系列:文本表征模型,3种尺寸可选,超越商业API拿下SOTA
- 12.1万高难度数学题让模型性能大涨,覆盖FIMO/Putnam等顶级赛事难度,腾讯上海交大出品
- Figure机器人分拣快递新视频曝光,网友:太像人类
- 阿里智能体多轮推理超越GPT-4o,开源模型也能做Deep Research
- 清华给电子显微镜加上Agent,DeepSeek V3全程调度,数天流程缩短至几分钟
- OpenAI首次回应人机情感问题:越来越多人对ChatGPT产生依赖,模型感知意识会继续增强
- AI眼镜沙龙|距离全民标配还有多远?
- 用大模型检测工业品异常,复旦腾讯优图新算法入选CVPR 2025
- 4位图灵奖得主布道,2大冠军机器人登台,“AI春晚”果然又高又硬
- AI文本转语音进入“Next Level”!独角兽ElevenLabs发布Eleven v3:狠狠拿捏情感控制
- 首个多模态专用慢思考框架!超GPT-o1近7个百分点,强化学习教会VLM「三思而后行」
- 多模态推理新基准!最强Gemini 2.5 Pro仅得60分,复旦港中文上海AILab等出品
- 金融大模型升级决策平台!马上消费发布“天镜”3.0破解经验碎片化难题
- Gemini 2.5 Pro深夜重磅更新,再次登顶AI竞技场!
- 开源黑科技!向量数据库,居然要被 MP4 给干掉了!
- 阿里Qwen3一口气开源多个向量&排序模型,冲!
- 从数据抓取到智能分类:用 LangChain + 爬虫构建自动化工作流的实战笔记
- 一文读懂 Embeddings 与 RAG 架构:分词、向量数据库到生产级系统设计
- 如何在不陷入复杂性陷阱的情况下构建生产就绪的 AI 代理
- 上下文窗口错觉:为什么你的 128K token 不起作用
2025-06-05
- RAG的有趣新尝试:将文本编码进MP4文件实现思路及Agentic-doc处理文档
- 为何说 “在国内做科研,最忌讳踏实”?
- 陶哲轩:感谢Lean,我又重写了20年前经典教材!
- 今日开源(2025-06-05):ShapeLLM-Omni原生多模态3D大模型,7B参数,支持文本/图像生成与编辑3D内容
- 【他山之石】用于图像分割的自监督学习(Self-Supervised Learning)方法综述
- 【源头活水】思维链也会「跳帧」?浙大团队提出CoT-Bridge,显著提升数学推理性能
- 图灵奖得主 Bengio 官宣创业:要在 AGI 到来前守住 AI 最后一公里
- Cursor 1.0 正式发布:AI 代码编辑器进入“自动审查 + 记忆”时代!
- DeepMind 最新研究:智能体就是世界模型!
- OpenAI久违发了篇「正经」论文:线性布局实现高效张量计算
- AI Agent已发现新知识,2年内大模型将有惊艳突破|2025 Snowflake峰会圆桌
- 终于来了!ChatGPT更新:新增录音功能,深度研究也可以访问文档和应用程序了
- SIGIR 25:知之为知之 SIM-RAG 反思与主动检索
- 13 年苦熬到 170 亿市值,一夜间被用户抛弃!一封“AI吹”全员信让网友“不喷不行”
- 叫板 OpenAI Sora?Manus 推出文生视频服务,计划向所有用户开放
- AI 全面渗透研发流程,我们该如何看待工程师的价值 | 直播预告
- OpenAI久违发了篇「正经」论文:线性布局实现高效张量计算
- ACL 2025 | 基于Token预算感知的大模型高效推理技术
- 真实联网搜索Agent,7B媲美满血R1,华为盘古DeepDiver给出开域信息获取新解法
- ICML 2025|趣丸研发新型人脸动画技术,声音+指令精准控制表情
- 刚刚,新一届ACM博士论文奖正式公布
- 10行代码,AIME24/25提高15%!揭秘大模型强化学习熵机制
- 多智能体真不是概念股,github上top5多智能体框架总结!
- MOOSE-Chem3重塑科研范式:AI「动态引导」实验,实现科学发现的飞跃
- SAVANA:使用长读长测序对细胞畸变进行精准测量分析
- 蒙特卡罗模拟: 高级应用的思路和实例
- 安徽师大教师被曝猥亵学生处分后进保卫处:校方已停止其一切工作
- 这几个程序员必备画图工具,很实用!
- Meta首席科学家LeCun:当前AI模型缺乏四项关键人类智能特质
- 大模型玩游戏,Deepseek-R1-0528 太强了
- ggplot2需要什么样的数据(Data) 输入?
- 55个heatmap代码模版
- seaborn又一个扩展heatmapz
- Cursor 保姆级实战,Cursor 设计总监亲自教学!
- 重磅!DeepSeek R1零门槛提示词+13大场景模板,让AI输出效率暴增300%!
- 25岁MIT辍学天才一战成名!3年成为90亿美金公司CEO
- 两周生成1.2万行代码!10年码龄开发者对AI「祛魅」:“把我整个代码库给炸了”
- 你的 Tailwind 之所以丑,是因为你像用 2006 年的内联样式那样用它
- 为什么本科生狂发顶刊,而有的博士还在为毕业挣扎?
- 【TCSVT 2025】即插即用,边缘高斯聚合模块EGA,目标检测新SOTA!
- 大语言模型(LLM)面试前50常见问题.pdf
- 成本暴降88%!通义实验室、北大发布ZeroSearch,无需搜索即可激活LLM检索能力
- 美团外卖生成式推荐精排MTGR
- 小目标检测算法,三年多研究心得分享感悟!
- 真实文档理解有多难?GPT识别率暴跌35%!字节开源 WildDoc,完美弥补差异!
- 少样本视觉异常检测,无需训练,突破跨领域限制检测!(附论文及源码)
- 六年算法从业经验总结:技术深水区的破局与定力!
- 飞桨 CINN 编译器:深度学习模型低成本性能优化“利器”
- 重磅!2025智源大会完整日程公布——全球AI先锋全阵容集结
- 写的真好啊!我发现了让深度学习硕博生快速掌握论文代码复现能力的书!!!
- 抛一枚硬币,掌握三种参数估计方法
- 微软发布GUI Agent新范式!告别传统方式,小参数少数据,7B吊打72B模型
- 直播预约 | Reasoning论文分享@ICML&ACL2025
- 73%人类认同率!Video-Bench实现视频质量精准打分
- 直播预约 | 智能体框架分享与探讨 - OWL, Alita, AG2
- Gemini开源项目DeepResearch:基于LangGraph的智能研究Agent技术原理与实现
- MCP 调用成本高到离谱?新机制让 token 成本降低 98%!
- 字节 DreamFit 虚拟试衣:任意服装随心试,多风格人体模特一键匹配生成,轻量级即插即用!
- ComfyUI | 字节DreamFit: 多主题电商服装迁移!轻量级即插即用任意服装模特匹配
- 港科&腾讯&清华提出全球首个多模态Mamba生成框架ACTalker,支持多信号输入,数字人嘴型同步再升级!
- NVIDIA提出新框架ImageRAG!RAG+AIGC提升图像生成质量!
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 看着就很贵的设计图,全是Lovart自动生成
- 318-A1.1|高效图像生成,DiT高效条件控制,散焦模糊控制;内容风格定制化,DiT风格迁移;物体移除与插入,物体移动
- 318-A1.2|中英双语图像生成,虚拟试衣,手部图像生成,统一理解与生成系列(细粒度面部,SSM),图像“标记化”系列
- 318-A1.3|潜在CLIP,向量量化,改善图文对齐,视觉文本编辑,文本驱动低光图像增强;扩散模型系列;安全系列
- 318-A2|物理合理文生视频,多事件长视频生成,多镜头视频组装,紧凑视频嵌入学习;为无声电影片段创作音乐,音视频联合生成
- 318-A3.1|图生3D,世界模型复杂环境内容稳定性,材质检索;服装重建与编辑,人类角色生成,人类多视图扩散;点云自回归生成
- 318-A3.2|单图、单目视频重建3D头;实时交互式3D分割;4D重建综述,7DGS,4D风格化;运动插值,视频到3D人类反应
- 318-B1|个体图像检测;漫画条理解,复杂像素级理解,详细图像描述化;长视频理解系列,自我中心视频环境理解
- 318-B2|3D重建与理解系列
- 突发!Reddit起诉Anthropic,非法访问10万次
- OpenAI深夜宣布ChatGPT支持MCP、会议记录,万物互联时代来了!
- 全球云数据库巨头收购Crunchy Data,增强AI Agent能力
- 听说了吗,有个可以边逛、边切磋AI技术的活动要来?
- 亚马逊投资100亿美元发展AI,并成立AI Agent团队
- 大模型公司挖墙脚哪家强?报告:Anthropic人才吸引力是OpenAI的8倍,留存率达80%
- 大神Karpathy炮轰复杂UI应用没有未来,Adobe首当其冲,网友:不提供文本交互,就是在阻挡AI浪潮
- 曝苹果AirPods推出睡眠检测等5大新功能,iOS系统也有12年来首次界面设计大改
- 大模型结构化推理优势难复制到垂直领域!最新法律AI评估标准来了,抱抱脸评测集趋势第一
- 上海AI实验室造出首个「通才」机器人大脑:看懂世界+空间推理+精准操控全拿下
- 抽象小视频秒变特效大片:原视频精髓不变角色环境任意换,Luma出品
- 推理时间减少70%!前馈3DGS「压缩神器」来了,浙大Monash联合出品
- CVPR 2025 Tutorial:从视频生成到世界模型 | MMLab@NTU团队&快手可灵等联合呈现
- 最新AI眼镜格局报告:百镜大战拉开序幕,阿里DeepSeek高通成幕后赢家
- Qwen&清华团队颠覆常识:大模型强化学习仅用20%关键token,比用全部token训练还好
- 精准调控大模型生成与推理!浙大&腾讯新方法尝试为其注入“行为定向剂”
- 刚刚,Qwen官方开源一系列向量&排序模型!
- AI时代UI已死?Karpathy称产品要给AI开后门,还分享了自己的AI编程心法
- ACL’25 | CIGEval:一种基于多模态大模型的可控生图评测智能体
- Cursor这波1.0升级,真的要把程序员饭碗摔碎了~
- 基于本地LLM与MCP架构构建AI智能体全指南
2025-06-04
- RAG&KG&LLM&文档智能四大领域技术前沿:老刘说NLP技术社区持续对外纳新
- 大模型数据处理方案全面综述:兼看视觉模型在推理过程中的认知偏差
- (CVPR 2025)大模型太贵?不如让小模型先看看图再决定用不用大模型!
- alphaxiv热榜第一|RL推理边界或被基座锁死
- 今日开源(2025-06-04):Video-XL-2,长视频多模态转换模型,块预填充+双层解码优化,高效处理视频分析与生成
- 辛顿、杨立昆等 AI 先驱都源自信号处理——对话 IEEE 首位华人主席、美国双院院士刘国瑞 | 万有引力
- 智能体时代,人类与AI如何分工?
- Meta首席科学家LeCun:当前 AI 模型缺乏四项关键人类智能特质
- GPT-5七月上线?内部爆料+奥特曼疯狂暗示,自曝前方时刻「令人恐惧」
- 刚刚,图灵奖得主Yoshua Bengio官宣LawZero:保护人类的快乐和努力
- 万字追问:如何用“时间的本质”,丈量人脑、意识与人工智能?
- 小白学大模型:适合1B模型的17个提示词(文末 送 大模型技术通关指南)
- 天塌了,Claude 全面断供Windsurf!CEO喊冤控诉也挡不住开发者退订,祸起OpenAI收购?
- Replit 怒锤“欧洲版 Cursor”:造出百款“高危”应用,普通开发者一小时内黑入,氛围编码成了黑客“天堂”?
- 冲击自回归,扩散模型正在改写下一代通用模型范式
- Meta新突破!跨模态生成告别噪声:流匹配实现任意模态无缝流转
- 重磅开源!首个全异步强化学习训练系统来了,SOTA推理大模型RL训练提速2.77倍
- 最新发现!每参数3.6比特,语言模型最多能记住这么多
- 英伟达揭示RL Scaling魔力!训练步数翻倍=推理能力质变,小模型突破推理极限
- 开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章
- 看似无害的提问,也能偷走RAG系统的记忆——IKEA:隐蔽高效的数据提取攻击新范式
- 有效性达95.5%,Deep dreaming方法可逆向设计MOF,探索材料化学空间
- 登Nature子刊,阿里云&海洋三所用蛋白质语言模型探索深海微生物磷循环
- Python 隐藏法宝:双下划线 _ Dunder _
- 手握字节 5000 股期权,想退休了。。
- 一个超强的开源代码大模型,开源了,本地部署
- 体验全程使用Seaborn完成Paper的Plots
- ggplot2科研图万能公式
- 院士增选启动!这些院士候选人,再获国家奖
- 经典ReLU回归!重大缺陷「死亡ReLU问题」已被解决
- 建议所有博士都去学一遍,赢麻了!!!
- 传统 CNN 被淘汰?注意力机制直接封神。。。
- 一份热乎的大模型应用面经!(已拿offer)
- 2025,嵌入式开发的新机遇
- Deepseek喂饭指令大全:内容创作/知识付费/编程开发/电商运营等
- Node.js效率低下?OpenAI用Rust重写了AI编程工具
- 我体验了谷歌 Stitch AI,发现了(UI 设计师的终结?)
- 傅立叶变换、拉普拉斯变换、Z 变换的联系是什么?为什么要进行这些变换?
- 经典ReLU回归!重大缺陷「死亡ReLU问题」已被解决
- 多位博士毕业去了三四流高校,现在怎么样了?
- 梳理RL-reasoning的进展
- Qwen Agent | Function Call兼容OpenAI工具调用改造
- 【蚂蚁技术研究院】语言模型组研究性实习生
- 近期7篇热门RL强化学习论文“打假”
- 一文看清 DINO-R1的性能变革,集成R1后的 GroundingDINO性能优化点拆解分析!
- RAG 挑战赛冠军方案!
- 仅499页!吃透大语言大模型
- 2025智源大会议程公开|大模型产业CEO论坛
- UIUC联合伯克利提出AlphaOne:先“深度慢想”再“秒答”,效果巨好
- 直播预约 | 多模态论文分享@ICML&ACL2025
- WebDancer:训练类DeepReaserch的Agentic Model
- 视频虚拟试穿新SOTA!浙大&VIVO提出MagicTryOn,空间建模+服装细节控制,超真实视频虚拟试穿效果。
- CVPR 2025 | 香港中文大学 MMLab 提出文生图模型 T2I - R1,文生图进入 R1 时刻!
- Google DeepMind 发布最强视频生成工具 Veo 3, 可为作品添加音效、环境噪音、对话,文中附体验链接。
- 开源数字人克隆神器HeyGem:1秒视频生成4K超高清AI形象,用AI重塑数字人创作生态!
- 我操,用户彻底怒了
- 马斯克猛烈批评特朗普:预算法案,恶心至极!
- 免费使用!OpenAI发布ChatGPT记忆功能,秒变私人助理
- 马斯克的xAI以1130亿美元估值,出售3亿美元股权
- 软银与英特尔合作,开发AI存储芯片
- ChatGPT普通会员能用编程神器Codex了!支持联网,奥特曼:更多更新在路上
- 超越GPT-4o!华人团队新框架让Qwen跨领域推理提升10%,刷新12项基准测试
- 让AI像人类一样认知真实世界!UCLA谷歌强强联手,长时记忆+3D空间理解超越基线16.5%
- 00后中国女孩0产品创业实现3亿估值:斯坦福数学博士的AI量化野心
- 单卡搞定万帧视频理解!智源研究院开源轻量级超长视频理解模型Video-XL-2
- 奥特曼宫斗要成好莱坞大片了!《哈利波特》同款制片人,主角人选被曝“蜘蛛侠”
- GPT-4o连验证码都解不了??SOTA模型成功率仅40%
- 开源播客生成MoonCast:让AI播客告别”机械味”,中英双语对话更自然!
- 图灵奖得主Bengio再创业:启动资金就筹集了3000万美元
- 奥特曼:假如给我一千倍算力,我会这样做
- AI还不会独自问诊,o3准确率仅为51.12%,上交大×SII开源高难度复杂疾病诊断测评集
- 陶哲轩转发!华人数学博士后反超DeepMind AI,停滞18年数学问题1个月内3次突破
- 突破视频时长限制!Manus上架视频生成功能,网友:比Sora更好
- 清华推出AI数学家!独立完成数学理论难题,自动调用基本定理、构建证明思路
- 阿里开源VRAG-RL:定义下一代检索增强生成。
- 首个基因推理AI 横空出世!准确率飙至97%,彻底改变基因组学研究
- Andrej Karpathy 辣评Veo 3:视频生成将直接优化人类的注意力,TikTok只是弟弟
- OpenAI或于今晚推出o3-pro
- DeepMind 最新研究:智能体就是世界模型!
- 结合LangGraph、DeepSeek-R1和Qdrant 的混合 RAG 技术实践
2025-06-03
- 48个流行开源ML数据集及KG三元组抽取工具AI Knowledge Graph
- 华为目标院校白名单(2025最新版)
- 图解 Transformer 和 MoE 的差别
- 多模态融合可能是现在或者未来一段时间最好发论文的方向了!
- 提速400倍!物理信息卷积神经网络登上中科院一区TOP!
- “LSTM+强化学习”组合拳打遍顶会!码住这11个idea,论文录用率飙升300%!
- SAM进化版开源!100倍推理加速!这思路简直杀疯了…
- 今日开源(2025-06-03):MiMo-VL视觉语言模型,7B参数,原生分辨率ViT跨模态对齐,混合策略强化学习优化
- 【他山之石】CVPR 2025 | MaIR:Mamba没Out!S型扫描策略助力MambaIR进一步提升!
- 【源头活水】大模型的基本功
- 【源头活水】微软等提出「模型链」新范式,与Transformer性能相当,扩展性灵活性更好
- 【他山之石】ECViT突破性Backbone架构 局部注意力机制+多尺度卷积,4.8M参数全面超越ViT等模型
- ChatGPT 为什么越来越“懂你”?一文解析它背后的记忆机制
- Anthropic CEO发出警告:“未来五年,半数入门级白领工作或被AI吞噬,失业率恐飙升至20%!”
- 人类程序员依然远强于LLM:为什么说 AI 目前还差点火候
- 辛顿、杨立昆等 AI 先驱都源自信号处理——对话 IEEE 首位华人主席、美国双院院士刘国瑞 | 万有引力
- 逆向工程:ChatGPT 的记忆是如何工作的
- 诺奖得主Wilczek:最精密的量子探测器,就藏在你的眼睛里?
- 万亿 GDP 城市,迎来第一所 985
- CVPR2025|突破数据瓶颈!Stable Diffusion 助力视觉异常检测,无需训练即可生成真实多样异常样本
- Kaggle赛题解析:CMI 手势行为识别
- 0粉丝狂卷数十亿播放,靠AI流量欺诈获利近亿!网友:这“刑”得离谱
- 谷歌突袭发布AI应用,无需Wi-Fi、手机就能跑大模型!网友实测两极分化
- 字节跳动 2025 奖学金计划启动!每人 10 万、名额再增加!
- 万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2
- ACL2025 | 传统符号语言传递知识太低效?探索LLM高效参数迁移可行性
- 经典ReLU回归!重大缺陷「死亡ReLU问题」已被解决
- 思维链也会「跳帧」?浙大团队提出CoT-Bridge,显著提升数学推理性能
- 本周日不见不散!CVPR 2025北京论文分享会最后报名了
- 视觉感知驱动的多模态推理,阿里通义提出VRAG,定义下一代检索增强生成
- 集成Evo2与Qwen3,多伦多大学、DeepMind等开发BioReason使AI像生物学家一样推理
- 将量子化学信息注入分子图,卡内基梅隆大学团队提出ML分子表征新方法
- Datetime 最强平台替 python库 – Pendulum
- 大模型算法:强化学习、微调与对齐
- 吴恩达来信:削减科研经费,削弱国家实力
- 为什么研究生导师喜欢怂恿自己的学生继续读博呢?
- 顶尖985大学教授,获世界级奖项!
- 拒绝水硕水博!暂停学历认证!教育部“点名”这些海外高校……
- 氛围编程时代来了!AI生成+一键上线,Coding像拍照一样简单
- 华为园区,为啥碰到的高颜值妹子总是外包牌,华为工牌的基本都是资深大姐…
- 何恺明2025新作的即插即用核心算法-DyT!!
- 顶会论文涨点神器:100个即插即用注意力模块
- 南京大学2025年计算机博士拟录取名单公示
- ICRA 2025 获奖名单出炉,上交&新加坡国立大学获最佳论文奖
- Tri Dao大神新作重磅来袭:取代DeepSeek的MLA,专为推理“量身定制”的注意力机制
- MoE训练速度提高70%!华为只用了这3招
- 北大数学系90后,破解百年数学猜想,担任法国高等研究所常任教授!
- 英国莱斯特大学举雅琨老师招收博士
- 14小时近500 Star!快速进阶LLM/AI的必读系列
- RLHF 实践:原理、代码、踩坑以及解决方案
- 科研新手必看!100 个模块 + 投稿指南,4大法宝轻松搞定论文
- DeepSeek、Claude、Grok 的系统提示词
- 使用seaborn/matplotlib定制好看的confusion matrix
- 神经网络为什么可以拟合任何函数?
- 荣登 Nature!Transformer 彻底爆发了。。。
- 陶哲轩:感谢 Lean,我又重写了 20 年前经典教材!
- AUTOSAR为何成为车企刚需?
- Deepseek应用指南:自媒体/电商/教育/开发/法律/本地生活等
- 苹果要给系统重命名?从iOS 18直接跳到iOS 26、界面重做,WWDC25前瞻来了!
- 别再给所有函数起名叫 handleClick 了,也别起那种单一又模糊的名字
- Deepseek AI Agent自动化开发实战
- DeepSeek R1迎来小更新大升级,性能直逼OpenAI o3!
- 别再给所有函数起名叫 handleClick 了,也别起那种单一又模糊的名字
- 博士生最好的状态是什么?
- 3D机器视觉及手眼标定
- 真正的大佬,根本不会选“先搞起来再说”!
- 英伟达发现RL Scaling!创造力暴涨,做基座模型做不了的事!
- Qwen Agent | MCP & Function Calling流程解读
- 训练DeepSeek-v3 671B!超大模型RL训练的挑战和难点
- 梳理 RL-reasoning 的进展
- 揭示小规模SFT在R1-Style强化学习中的关键作用
- 训练DeepSeek-v3 671B!
- 图解 LLM(AI大模型)的工作原理
- 全国首部AI大模型私有化部署标准,15家单位已加入!
- 百度文心中国行南京站倒计时!6月10日共探AI赋能新未来
- 2025智源大会议程公开|AI系统与开源论坛
- 阿里+清华发现80/20法则:LLM只靠20%的token就能学会Reasoning
- Meta联合Google新作:语言模型到底“记”了多少东西?
- 仅靠大模型充当评估者救不了产品,关键在于优化流程
- 集成 R1 后的 GroundingDINO 究竟强在哪?一文带你看清 DINO-R1 的性能变革
- 图像定制大一统?字节提出DreamO,支持人物生成、 ID保持、虚拟试穿、风格迁移等任务,有效解决多泛化性冲突。
- [ComfyUI]阿里WanX2.1:最强开源视频模型易主!静待社区生态开源直逼闭源,Vbench榜首第一
- StepFun提出Step-Video-T2V!300亿参数视频生成大模型!可生成204帧视频!
- 英伟达开源4K图像生成模型Sana,可在16G显存电脑部署,支持ComfyUI和LoRA训练。
- ICLR 2025 | 解锁虚拟试衣新姿势!智象未来提出SPM-Diff,大幅提升真实性、可控性,让衣服“贴身”又自然!
- 图生3D新SOTA!港中文&字节&清华联合提出Hi3DGen:通过法线桥接从图像生成高保真 3D 几何图形。
- 字节开源换脸写真模型InfiniteYou,可实现零样本身份ID一致保持,无缝集成FLUX、ControlNets、LoRAs!
- CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?
- 用AI生成播客,效果堪比真人,扣子空间新功能太强了!
- 刚刚,全球第一CRM收购AI Agent平台Moonhub
- 免费使用Sora!微软发布Bing Video Creator
- 李飞飞空间智能独角兽开源底层技术!AI生成3D世界在所有设备流畅运行空间智能的“着色器”来了
- 大神卡帕西这么用ChatGPT:日常4o快又稳,烧脑切o3做后盾,o4只当备胎用
- 音频大模型安全可信度的全面“体检”!6大维度,清华南洋理工联手打造
- 训练MoE足足提速70%!华为只用了3招
- AI青年学霸齐聚杭州!这场峰会要选出「未来科学新星」
- 斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了
- AI陪伴Top 1应用上线视频生成!图片人物能说话唱歌,多轮对话场景依然稳定
- 推理“刹不住车”?新框架让DeepSeek-R1们告别过度思考,已开源
- Manus新功能一手实测!10分钟8页PPT,网友:当前第一名没跑
- 论文秒变海报!开源框架PosterAgent一键生成顶会级学术Poster
- 刚刚,DeepMind开源全栈「Deep Research」项目,AI 研究将人人可用
- 阿里WebDancer:训练类DeepReaserch的Agentic Model
- 构建生产级LLM应用完整指南:从原型到落地的全流程实践
2025-06-02
- 两个有趣的工作:Huggingface知识图谱及大模型高频用词相似性分析工具
- 图灵奖得主杨立昆:中国人并不需要我们,他们自己就能想出非常好的点子
- ChatGPT最大的隐患不是抢人类的就业,而是让个人的经验变得廉价
- Cell | 万物可控:机器学习如何解锁蛋白质“开关”,开启活体按需功能调控新时代?
- 大佬观点汇总之「AI 席卷下即将发生的事」。Hinton:人类要完!马斯克:要往好的方面看
- 被高薪吸引却遭愚弄!科学家怒曝AI科研黑幕:多为个人“捞金”,DeepMind百万成果是“垃圾”
- LSTM之父22年前构想将成真?一周内AI「自我进化」论文集中发布,新趋势涌现?
- 微软等提出「模型链」新范式,与Transformer性能相当,扩展性灵活性更好
- 姚顺雨提到的「AI下半场」,产品评估仍被误解
- CVPR 2025 | 解决XR算力瓶颈,FovealSeg框架实现毫秒级IOI分割
- AI 逆向设计抗癌药,越想激活 STING,越要先「保护」cGAMP
- 月薪已炒到6W?强烈建议大家冲一冲这个新兴领域
- 互联网女皇340页《人工智能趋势报告》PPT
- “互联网女皇”最新340页AI研究报告!
- 编制砍10%!211大学,减员
- 陕西一高中生与教授父亲共同署名发表 3 篇 SCI,父亲同事:已调查,没问题,他们都很努力
- 面试京东,卡壳了。。
- 硅谷今夜集体失眠!互联网女皇340页AI报告猛料刷屏,大佬熬夜头秃
- 传统CNN被淘汰?边界注意力如何改写手术机器人规则?
- 60 个神级 VS Code 插件!
- 博士的年薪一般是多少万?
- CVPR 2025北大开源视觉搜索方法DyFo,无需训练,提升大模型理解能力(附论文及源码)
- 深入浅出,如何给模型加入先验知识?
- 2025智源大会议程公开|NeuroAI: 神经智能论坛
- 2025智源大会议程公开|PyTorch Day China
- 2025智源大会议程公开|智能驾驶论坛
- 英伟达发现RL Scaling!创造力暴涨,做基座模型做不了的事!
- Reasoning模型可以Self-Train!
- 直播预约 | Time-R1横空出世!让AI真正读懂时间
- PRML作者出新书了,《深度学习:基础与概念》!必读啊!
- 100个硬核网站第4期,免费下载小学、初中、高中、大学所有PDF教材
- 论文简读|ViStoryBench:故事可视化生成的综合性基准测试套件|阶跃星辰×上科大×AIGC Research
- 让ChatGPT连读“A”,直接崩溃到念广告词,网友:拿付费用户做测试呢?
- 首次解释LLM如何推理反思!西北大学谷歌新框架:引入贝叶斯自适应强化学习,数学推理全面提升
- 5700问答对全面评估拷问AI空间感!最新空间智能评测基准来了丨浙大&成电&港中文
- 一篇LLM × DATA技术最新系统性综述
2025-06-01
- AI颠覆的不只是结构生物学,还会变革所有基础科学
- “AI教父”辛顿最新专访:没有什么人类的能力是AI不能复制的
- Science警告:AI导致「专利申请」泛滥,传统科学家或成最大受害者
- 从归因图到 AI 的“生物学”:探索大语言模型的内部机制「上」
- 新存1000万,为客户子女提供实习机会?字节等回应;宇树更名,王兴兴曾称或赴港上市;韦神新成果正式命名“韦东奕定律” |AI周报
- 低成本下的高性能模型,是悖论还是可能?
- 陶哲轩:感谢Lean,我又重写了20年前经典教材!
- SFT在帮倒忙?新研究:直接进行强化学习,模型多模态推理上限更高
- 极低成本,复现GPT-4o图像风格化一致性!NUS推出OmniConsistency
- CVPR 2025 Highlight | 提升自回归模型样例学习能力,Few-shot图像编辑新范式开源
- AIGC 查重让毕业生崩溃,学生自己写的段落被判定 AI 生成,这种检测平台能力如何?这样检测可靠吗?
- 一键部署丨DeepSeek-R1 新版本小幅升级便登顶开源王座,多项评测超越 Qwen3
- 微软副总裁:大模型时代的技术热点
- 20位学者,斩获特等奖/一等奖,有望冲击院士
- 疯狂打Call,哈工大斩获AI顶会ACL评审阶段最高分
- DeepSeek预测十年后可替代的职业,以及不可替代的职业:
可能消失的十个职业:
10、传统会计
9、人工客服
8、出版印刷
7、地铁驾驶
6、基础翻译
5、客车司机
4、数据录入
3、电话推销
2、流水线工人
1、超市收银员
无法替代的十个职业:
10、社工
9、厨师
8、土木工程
7、电器维修
6、消防急救
5、护士护工
4、文物修复
3、艺术创作
2、学校教师
1、医生 - 如何给模型加入先验知识
- 如何画出漂亮的神经网络图?神经网络可视化工具集锦搜集
- 工业界和学术界最大区别是什么?
- 被美国“制裁”的中国大学名单。。。
- 小米MiMo-VL:7B小模型如何实现多模态SOTA性能,附技术报告英中对照版PDF
- 百度飞桨强化学习组 | 实习生招聘,可转正
- 2025智源大会议程公开|具身智能与人形机器人论坛
- 2025智源大会议程公开|从AI for Science到AI for Industry论坛
- 中科院提出图像定制方法MCA-Ctrl,无需调优的即可使用文本和复杂的视觉条件实现高质量的图像定制。
- 加利福尼亚大学提出TULIP!视觉-语言模型的新王者!AI性能全面碾压CLIP!
- 单图生成3D头像+AI编辑+多模态驱动?阿里LAM让虚拟人“活”了!
- LBM:用于图像到图像直接快速转换,支持可控照明、图像恢复、物体移除等功能!
- 100个硬核网站第3期,Word文档自动转成手写稿,效果太逼真了!
- 北大校友造通用AI Agent,可执行1000个操作,无邀请码立即上手试用
- Mamba核心作者新作:取代DeepSeek在用的注意力机制,专为推理打造
- 揭开大模型“伪遗忘”,港理工等团队:结构不变就是没忘
- 挑战强化学习后训练霸权!全新无监督方法仅需1条数据+10步优化
- 大佬观点汇总之「AI 席卷下即将发生的事」。Hinton:人类要完!马斯克:要往好的方面看
- R1时代,RAG-Retrieval技术总结与展望~
2025-05-31
- 大模型推理的“左右脑”革命!华为盘古Embedded凭昇腾之力,让快慢思考合二为一
- 250美元起售,还开源,Hugging Face 发布史上最亲民人形机器人
- SSM+扩散模型,竟造出一种全新的「视频世界模型」
- 从打分器到思考者:RM-R1用推理重塑模型价值判断
- 从性能到实战,怎样才算是靠谱的 Agent 产品?
- OpenAI未公开的o3「用图思考」技术,被小红书、西安交大尝试实现了
- 小米又开源了,一个多模态大模型,一个推理大模型
- 手撕CUDA算子:高频面试题汇总~
- 万亿 GDP 城市,迎来第一所 985
- 留言赠书 | 复旦 NLP 团队 2025 新书《大规模语言模型:从理论到实践(第 2 版)》重磅来袭!
- Claude 4破解困扰人类4年系统bug,30年码龄程序员200小时没搞定,GPT-4.1/Gemini-2.5也做不到
- 特征提取:传统算法 vs 深度学习
- CVPR 2025|AnomalyAny:异常检测新工作,利用Stable Diffusion生成真实多样异常样本!
- 小米多模态大模型开源!MiMo-VL:通向Agent时代的推理基座!
- 致所有“不想长大”的大人:你的焦虑,TA都替你吐槽完了!
- 2025智源大会议程公开|类脑大模型论坛
- 2025智源大会议程公开|AI+理工&医学论坛
- CVPR 2025 | 香港中文大学 MMLab 提出文生图模型 T2I - R1,文生图进入 R1 时刻!
- CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?
- CVPR 2025 | 多实例扩散模型MIDI:可从单个图像创建高保真 3D 场景,模型&代码已开源。
- CVPR 2025 | 清华提出一键式视频扩散模型VideoScene,从视频到 3D 的桥梁,一步到位!
- 用AI生成男友视角照片,假装和小姐姐手牵手
- 美国开始吊销,中国学生签证
- 斯坦福意外用AI生成超强CUDA内核,性能比人类专家优化得还要好!翻倍碾压原生PyTorch,华人主创
- 陶哲轩转发!DeepMind开源「AI数学证明标准习题集」
- 阿里通义开源「推理+搜索」预训练新框架:小模型媲美大模型,多个开放域问答数据集表现显著提升
- 1/15成本,实现AI水印新SOTA | 南洋理工大学&A*STAR
- Claude团队打开大模型「脑回路」,开源LLM思维可视化工具来了
- 360开源高质量图文对齐数据集!收纳1200万张图像+1000万组细粒度负样本,让模型告别“图文不符”
- AI记忆系统首获统一框架!6大操作让大模型拥有人类记忆能力
- 95%的人不知道什么是AGI,也不知道他们将很快失业
- DGM:首个可通过重写自己的代码来实现进化的AI Agent
- Tool-Star:赋予大模型结合多工具推理的能力
2025-05-30
- 今日开源(2025-05-30):Chatterbox,生产级开源TTS模型,支持情感夸张控制,超低延迟适配多场景
- 【源头活水】具身智能需要从ImageNet做起吗?
- 【他山之石】与Gemini Diffusion共振!首个扩散式「发散思维链」来了
- 【源头活水】5%参数比肩DeepSeek满血R1!北大“小”模型靠分合蒸馏,打破推理成本下限
- 阿里云发布通义灵码 AI IDE,深度适配千问 3 大模型、新增编程智能体,可调用 3000+ MCP 服务
- 78%主创跳槽!Llama 14名作者只剩3人,Meta最强开源模型团队大溃散引争议
- 吴恩达LangChain对话:别纠结Agent定义,成功的智能体往往从线性工作流开始,Vibe Coding这个概念充满误导
- MCP 火爆半年后,是时候对它“祛魅”了
- 绘制通用人工智能的多种路线图
- AutoThink: 让大模型自主决定何时思考
- 大模型发展新趋势:Agent和MCP(文末送国内首本MCP图书)
- AI生图迎来大升级:图像编辑达到像素级!背后团队大多来自Stable Diffusion模型基础技术发明团队
- 模型下载量 12 亿,核心团队却几近瓦解:算力分配不均、利润压垮创新?
- Redis 之父:哪怕被喷我也得说,AI 远远落后于人类程序员!开发者跟评:用大模型气得我自己写代码都有劲儿了
- 谷歌之后,英伟达入局扩散大语言模型,Fast-dLLM推理速度狂飙27.6倍
- ICML 2025 Spotlight | 谁导致了多智能体系统的失败?首个「自动化失败归因」研究出炉
- 美团开放AI代码工具,零代码实现全栈能力,项目负责人揭秘架构细节
- 多模态扩散模型开始爆发,这次是高速可控还能学习推理的LaViDa
- 大模型智能体如何突破规模化应用瓶颈,核心在于Agentic ROI
- 具身进化·无界未来:这场论坛引领具身智能模型革命新浪潮
- 本周github top5热门AI项目,竟然都是智能体!
- 浙大侯廷军团队开发基于Pareto算法和Monte Carlo Tree搜索的多目标分子生成方法,助力药物研发
- ACL 2025 | AI虚拟科学家VirSci模拟科研协作,揭示协作创新机制
- 深夜突袭!DeepSeek-R1重磅升级:媲美OpenAl最高o3模型,编码能力直逼Claude4
- 【Python】Python包管理器 uv替代conda?
- 不吹不黑,9道题实测DeepSeek-R1-0528的小更新
- 大模型世界的 “万能插座”,一文详解MCP
- DeepSeek-R1-0528 蒸馏 Qwen3:8B大模型,双 4090本地部署,深得我心
- Python 类不要再写 init 方法了
- “中文”版deepwiki
- 一份热乎的大模型应用面经!(已拿offer)
- 又一篇顶刊!机器学习这个方向杀疯了!
- AI 复活逝者,当庭开口作证,法官竟采纳,震惊全网!争议不断…
- 10 分钟学会使用 YOLO + OpenCV 实现目标检测
- 2025年6月-9月人工智能相关会议整理,建议收藏
- 月薪3万35岁脑干出血程序员:ICU躺了28天,治疗花了约50万元,之前想要挣钱,现在想“好好爱自己”
- 10本大模型必读神书,已被我偷偷翻烂!!
- 大模型 Agent 就是文字艺术吗?
- App 活过来了!我给它装了个“AI 脑子”,从此告别“痴呆”
- 新版DeepSeek-R1正式开源发布!(附项目地址)
- AI算法炼丹之ONNX模型实战部署,心得经验分享
- “AI小番茄”亮相少先队活动:百度携手《红领巾报》共探智慧陪伴新路径
- 2025“中国软件杯”大学生软件设计大赛:智能四足机器狗太空基地巡检系统赛题发布!
- 2025智源大会议程公开|自主智能体——迈向通用智能的必由之路论坛
- 2025智源大会议程公开|AI与科学的共生未来论坛
- 直播预约 | 推理模型的“过思考”现象与高效推理,2.5h的深度分享
- Reasoning模型在RL下的探索欲望急速下降问题:探索熵机制
- 招聘 | 北京格灵深瞳-多模态实习生
- 美团二面:为什么mmap共享内存比malloc危险?
- 无需重训–洞察样本顺序对大模型的训练结果影响
- Google DeepMind 发布最强视频生成工具 Veo 3, 可为作品添加音效、环境噪音、对话,文中附体验链接。
- 多领域SOTA诞生!Vid2World:打通视频扩散到世界模型的“任督二脉”|清华、重大
- 7k星星爆火!用微信聊天记录训练一个自己的数字分身回信息,还能克隆声音回复语音消息。
- 字节发布视频基础大模型Seaweed,70亿参数超越同类140亿参数视频模型效果,单GPU就可生成1080P!
- ChatGPT时刻降临!全球首个「人类的模拟器」诞生,AI首次穿越代码走入真实世界
- 【AIGC应用】智谷AI智能生成营销式系统
- 【行业动态】英特尔发布全新至强6处理器,夸克健康大模型通过副主任医师职称考试
- 【AIGC趋势】用自研芯片的暴力算力支撑设备端大模型
- 【AIGC应用】AI芯片、高性能计算等领域重构全球竞争格局
- 突发!美国上诉法院,暂时恢复特朗普关税
- 阿里开源自主搜索AI Agent,搜论文、网站资讯无所不能
- 毕马威:企业对AI Agent智能体试点应用猛增
- AI收入暴涨!英伟达超过苹果,成为全球市值第二
- 为AI Agent增加超长记忆,开源创新框架超30000颗星
- 每2秒吃透一道高数大题!华为终于揭秘准万亿MoE昇腾训练系统全流程
- AI生图大洗牌!流匹配架构颠覆传统,一个模型同时接受文本和图像输入
- GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑新基准,360道人类专家严选难题
- 函数向量对齐技术,让大模型持续学习不“失忆”丨ICLR 2025
- 让AI学着“看菜下碟”!港中大等新框架让推理长度减少90%,准确率反增17%
- 实测!可灵AI季度收入1.5亿,最新版本正式发布:物理真实感大幅提升
- 机器狗能当羽毛球搭子了!仅靠强化学习从0自学,还涌现出类人回位行为 | Science子刊
- 10个小模型并联跑赢GPT-4.1!无额外训练,方法仅4步
- 全面评估多模态模型视频OCR能力,Gemini 准确率仅73.7%
- DeepSeek 跃居全球第二 AI 实验室,中美正式并驾齐驱!
- 马斯克公布SpaceX火星新计划,迈向多行星生命之路!
- AI之父Hinton:想知道不是最聪明物种的感觉?去问鸡吧
- SearchAgent-X: 打破效率桎梏,释放下一代「AI搜索智能体」的真正潜能
2025-05-29
- 强化学习数据合成框架SynLogic及语音大模大模型评估
- RAG&KG&LLM&文档智能四大领域技术前沿:老刘说NLP技术社区持续对外纳新
- 今日开源(2025-05-29):TwGI,7B多模态大模型,图像生成与推理,长视觉思维链突破被动观察,自回归统一架构优化输出
- 又要取代程序员了?这锅轮到 AI 背了
- DeepSeek R1 迎来小更新大升级,性能直逼 OpenAI o3!
- EDA断供中国将如何冲击国内芯片产业?
- 实测思维链大变!DeepSeek R1一个“小升级”性能直逼o3,但仍“过度思考”?
- AI 首次违抗人类关机指令:OpenAI 模型 o3 引发全球安全争议
- 浙大团队发文《自然》:迄今最小LED显示器,像素比一个病毒还小
- ICLR 25:XGBoost/MLP还是表格建模最优解
- 实测思维链大变!DeepSeek R1一个“小升级”性能直逼o3,但仍“过度思考”?
- “炸穿”英伟达财报!因H20“滞销”痛失300亿,老黄气晕:DeepSeek、Qwen用美平台就赢了
- MCP 火爆半年后,是时候对它“祛魅”了
- DeepSeek-R1今天一次「小更新」,颠覆了大模型格局,网友:尽快放R2
- 原来Veo 3早有苗头!人大联合值得买科技在CVPR 2025提出全新「图像到有声视频」生成框架
- 还得是华为!Pangu Ultra MoE架构:不用GPU,你也可以这样训练准万亿MoE大模型
- 刚刚,AI科学家Zochi在ACL「博士毕业」,Beta测试今日上线
- 成本暴降88%!通义实验室、北大发布ZeroSearch,无需搜索即可激活LLM检索能力
- RSS 2025|从说明书学习复杂机器人操作任务:NUS邵林团队提出全新机器人装配技能学习框架Manual2Skill
- 135 个项目、七大趋势、三大赛道:撕开大模型开源生态真相,你会怎么卷?
- 中国团队让AI拥有「视觉想象力」,像人类一样脑补画面来思考
- 用Veo 3+Suno做了个AI Rapper,吊打音乐节上的流量明星
- Linear-MoE:线性注意力遇上混合专家的开源实践
- 让大模型真正「懂」实验,从理解协议开始!北大团队发布 BioProBench
- 含2.01亿张MS/MS光谱,AI质谱新工具帮助科学家发现未知分子
- 刚刚,新版DeepSeek-R1正式开源!
- 百万奖金!目标检测、大模型等赛事全面启动!2025长三角(芜湖)算力算法创新应用大赛来了
- 高校教师提前下课2分钟被认定教学事故,学校称此举为保证教学秩序,这个责罚合理吗?监管教师的度在哪?
- 【Python】Python打包exe,到底选PyInstaller还是Nuitka?
- 【深度学习】无需借助DINOv2!DiT自表征对齐:用自蒸馏取代 REPA,高效提高生成性能
- 用大模型,把论文吃干榨净!
- DeepSeek R1 最新版本模型,排名第三🥉
- 读研读博进入了小作坊课题组,如何自救?
- 刚刚!PaddleOCR 3.0 正式开源:大模型发力,OCR 精度跃升 13%!
- Claude 4破解困扰人类4年系统bug,30年码龄程序员200小时没搞定,GPT-4.1/Gemini-2.5也做不到
- Deepseek喂饭指令大全:内容创作/知识付费/编程开发/电商运营等
- 零JS!他用4.6万行HTML+CSS手搓了个《我的世界》,程序员哭诉:网友把服务器玩爆了
- 马斯克新推出的 AI 编程助手速度是高级工程师的 10 倍,整个技术团队都面临挑战
- 基于OpenCV的实时睡意检测系统
- Llama核心团队大面积跑路:14人中11人出走,Mistral成主要去向!
- 机器学习中特征选择怎么做?这篇文章告诉你
- 谷歌CEO:通用AI不是工具,是“下一代平台本身”,互联网生态将重新洗牌
- 2025智源大会议程公开|InnoVibe共创场18位闪电演讲
- 手都敲麻了,一文解析Transformer模型的基本原理与Pytorch代码实现。
- 人员招聘丨复旦大学知识工场实验室招聘暑期实习生
- 大模型也开始玩儿建模?“数学智慧”正在被 ModelingAgent 重新定义
- LLM+RL遭严重质疑,随机/错误等虚假奖励也能提升至标准效果?
- NICE59期 | Agent进入下一篇章!Alita:不靠人工预设,自己造MCP自我进化的AI
- 最近很火爆的《百面大模型》,值得看看
- NICE学术平台志愿者招募!
- Text Diffusion,来了
- 分享图片
- 智能体卷疯了,又一款Agent框架开源了Lemon AI
- VLM-R³:从一次性理解到动态聚焦的视觉推理进化
- CVPR 2025 | 单目人头重建最新SOTA方法!清华与IDEA发布HRAvatar:高质量可重光照头像化身。
- 谢赛宁团队提出BLIP3-o:融合自回归与扩散模型的统一多模态架构,开创CLIP特征驱动的图像理解与生成新范式!
- 图生3D新SOTA!港中文&字节&清华联合提出Hi3DGen:通过法线桥接从图像生成高保真 3D 几何图形。
- 字节大模型算法 Offer,惊艳到我了….
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- DeepSeek R1悄悄更新,国产AI又进一小步
- 没受DeepSeek影响,英伟达最新财报创历史记录,同比增长260%
- 刚刚,DeepSeek开源新版R1,媲美OpenAI最高o3模型
- SpAItial发布超逼真3D空间基础模型
- 管理者必看!5 个可落地的行动指南,助你成为企业智能化转型破局者 | 5月29日《1 小时 AI 公开课》
- DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小
- 奖励是假的,能让Qwen提升25%性能却是真的!
- AI连电路图都看不懂?SeePhys新基准暴击多模态短板,正确率低至55%
- 搜索Agent最新高效推理框架:吞吐量翻3倍、延迟降至1/5,还不牺牲答案质量丨南开& UIUC研究
- AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现,强化学习无需外部奖励信号
- 不懂建模也能做角色!VAST升级AI神器,一手实测来了:一键拆建/魔法笔刷/万物绑骨
- 英伟达再创历史纪录!Q1收入增长69%,数据中心贡献89%,游戏业务大涨42%
- 基准测试揭秘大模型“字数危机”:26个模型长文本生成普遍拉胯,最大输出长度过度宣传
- SOTA大模型遇上加密数据评测:Qwen3未破10%,o1也栽了丨上海AI Lab等联合研究
- 视频实时生成可交互! 两位自动驾驶大牛创业世界模型:40毫秒/帧,无需任何游戏引擎,人人免费可玩
- 波士顿动力机器人进厂打工现逆天操作!3D感知+实时追踪,人类捣乱完全不带怕的
- 视频推理界的“福尔摩斯测试”:所有大模型,统统不及格 | 论文代码开源
- 华为攻克AI推理「想太多」问题!新方法让大模型推理提速60%,准确率还高了
- 重磅!Telegram官宣Grok将登陆!Ton应声暴涨16%
- 想搞好编程,得有点儿朋克精神
- SEO 终结,欢迎来到 GEO 时代!
- DeepSeek-R1-0528 打榜、20+案例全面实测,全球网友狂点赞:实力堪称R2!
- 研究生期间买房买车的都是什么人
2025-05-28
- RAG和Agent的几张趣图思考及RLI基于自我置信度RL强化学习思路
- 今日开源(2025-05-28):HunyuanPortrait,扩散式人像动画生成,预训练编码解耦身份/动作,注意力增强连贯性
- 谷歌 CEO 皮查伊万字专访:AI 正重塑搜索引擎、Web 乃至整个互联网
- 30 年 FAANG 大神被 C++ Bug “虐”4年,竟被Claude Opus 4一招解决!
- 真正的AGI需达人类大脑理论极限|DeepMind CEO最新对话实录
- 智能体时代,人类与AI如何分工?
- LLM加RL遭质疑:故意用错奖励,数学基准也显著提升,AI圈炸了
- 万字追问 | 科赫:意识、量子力学与整合信息理论
- SIGIR 25:快手基于层次搜索的LLM推荐
- Agent 框架热潮褪去,大模型开发已经进入“生死局”?
- Jeff Dean:一年内 AI 将取代初级工程师,网友:“Altman 只会画饼,Jeff 说的话才致命”
- 拆解中国 AI 从追赶到引领全历程|GTLC 全球科技领导力大会·全球总站来袭
- 4万多名作者挤破头,CVPR 2025官方揭秘三大爆款主题, 你卷对方向了吗?
- 首个面向柔性衣物灵巧操作的仿真平台来了,北大、伯克利联合发布
- 清华创业团队打造!国内首个专注AI推理Serverless GPU平台
- 华为盘古首次露出,昇腾原生72B MoE架构,SuperCLUE千亿内模型并列国内第一
- LLM加RL遭质疑:故意用错奖励,数学基准也显著提升,AI圈炸了
- SIGGRAPH 2025 | CLR-Wire:曲线框可生成?可交互?深大VCC带你见证魔法
- 相约美国田纳西,CVPR 2025顶会饭局报名了!
- 准确率92.7%逼近Claude 3.5、成本降低86%,开源代码定位新神器LocAgent来了
- AI产品千篇一律?去Google Labs,淘下一个AI爆款
- Nature子刊,湖大、电子科大、厦大等开发RareDDIE,精准攻克罕见药物互作预测难题
- 上海16区中学生组队预测绿能发电,全球1.6万人报名,第三届世界科学智能大赛培育新生代跨学科人才
- 使用 Unsloth 快速微调 LLMs 实用指南
- 突发!美国全球冻结学生签证,新规曝光:社交账号历史成“必查项”
- 【机器学习】最强回归算法模型,线性回归 !!
- 告别卡脖子,华为黑科技破局!昇腾推理加速1.6倍打破LLM降智魔咒
- 用大模型,把论文变成PPT
- 刚刚,DeepSeek-R1 默默地小版本升级
- Graphpad Prism太贵,试试ggprism!
- 陶哲轩痛诉很缺钱!科研经费暴跌 67% 十年最低,自掏腰包科研
- Matlab——数据大佬的秘密武器
- 开发者的新神器!Deepseek AI Agent自动化开发实战
- 78%主创跳槽!Llama 14名作者只剩3人,Meta最强开源模型团队大溃散引争议
- “领导在开会画饼,我在计算副业收入”:副业,正在成为职场人标配!
- 使用OpenCV实现图像去阴影
- CVPR2025突破数据瓶颈!视觉少样本异常检测,无需训练生成真实多样本!(附论文及源码)
- 边缘目标检测算法,碾压YOLO系,横扫BDD100K,算法效率起飞!
- 智企创新、织造未来,AI企业家俱乐部系列活动第一期落地百度大厦
- 2025智源大会议程公开|多模态论坛
- 2025智源大会议程公开丨具身技术与产业应用论坛
- Agent进入下一篇章!Alita:不靠人工预设,自己造工具,成绩碾压OpenAI
- 港科联合港中文提出AdaCtrl,自适应可控Reasoning,可降10~90%
- MiniMax AI 开源首个感知+推理的强化学习框架 V-Triune: 统一视觉-语言任务
- CVPR 2025 | 字节提出个性化多人图像生成新方法ID-Patch,可生成多人合影、姿势可控。
- 音视频同步生成的终极突破!浙江大学提出JavisDiT!HiST-Sypo技术实现帧级对齐!
- 港大&Adobe联合提出图像生成模型PixelFlow,可直接在原始像素空间中运行,无需VAE即可进行端到端训练。
- 字节面试拷打:Qwen3-0.6B能击败Bert吗?
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 微信面试官问:Adam优化器下怎么调整batch size和lr的关系呢?
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 数字人终于可以生成表情和动作了!
- 突发!特朗普暂停,国际学生签证
- 80亿美元押注Agent!全球第一CRM收购Informatica
- 2025 Google I/O 大会开发者主旨演讲干货盘点
- ASML蒸发1300亿美元,成美国关税战最大输家
- 马斯克星舰第九次试飞失败,为测试极限拆除100块隔热瓦,返航途中燃烧解体
- 单卡即可微调大模型!内存占用仅1/8,性能依然拉满 | ICML 2025
- 多模态大模型不会画辅助线?最新评估得分:o3仅25.8%,远低于人类82.3% | 清华腾讯斯坦福联合
- Claude 4破解困扰人类4年系统bug,30年码龄程序员200小时没搞定,GPT-4.1/Gemini-2.5也做不到
- 大模型玩不好数独?!Transformer作者初创公司公布排行榜:o3 Mini High“变异数独”正确率仅2.9%
- 阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95%
- 一个省略号提示+强化学习搞定大模型“过度思考”,中科院自动化所新方法:从强制推理到自主选择
- 港科大Apple新研究:Tokens使用量减少,模型推理还更强了
- 北大校友王虹,将任法国高等研究所常任教授!2/3前辈为菲尔兹奖得主
- 5小时满帧玩王者原神!只需2499元拥有电竞级体验,一加手机开大:三块芯片
- 开源AI开发生态大洗牌:低代码平台逆袭,传统LLM框架日渐式微
- 【手撕DualPipe】让我们一步步把 MoE EP 通信 “消除” !!
- 聋哑人的春天来了!谷歌重磅开源最强手语翻译模型:SignGemma
- Anthropic CEO:人的幻觉比AI 更多!这是真的吗?
- DeepSeek R1 的小更新,却大有深意?
- 【同步直播报名通知】智算中心“投建运”全流程与融资租赁应用及大模型应用落地实战
- DeepSeek R2没来,DeepSeek R1+来了~
- AgentOps 时代已来:LLM-D 如何推动企业 AI 从理论走向规模化落地?
- 基于Gemini与Qdrant构建生产级RAG管道:设计指南与代码实践
- Agentic RAG 的技术演进详解
- 从执行轨迹到结果质量:AI 代理系统评估的核心要素与方法论
- RAG中基于图的重排序:利用图神经网络革新信息检索(含代码)
- AI 时代下设计模式的逆袭:为何经典架构思想从未过时?
2025-05-27
- 如何用Agent智能体生成论文poster海报?文档版式分析还能用来做什么?
- 2025特征提取模块,涨点真好用,简单易发文!(附代码)
- 【CVPR 2024】超强轻量级Backbone:StarNet,可直接替换其他骨干网络!
- ICLR-25:多模态对比学习的”三原色”理论
- 贝叶斯优化+CNN+LSTM=小论文创新点
- 突破Transformer!结合卡尔曼滤波轻松“水”SCI二区!
- “SAM+多模态图像融合”这个idea一出,就有人用它发了CCF-A
- 清华刘知远团队:高质量 LLM 训练数据获取
- 今日开源(2025-05-27):阿里开源QwenLong-L1,32B长上下文推理模型,强化学习优化,7大基准超越旗舰模型
- 自回归文生图首次冲上2K分辨率!Token-Shuffle:具有竞争力的生成性能,不输扩散模型
- 微软 CEO 萨提亚·纳德拉:智能体即产品,SaaS 已死?
- ChatGPT 评估员工绩效,评得是真能力吗?
- DeepMind CTO最新对话实录:大模型性能新突破,并行假设可让模型更深入思考
- 刚刚,陶哲轩发声:美国数学研究经费“崩盘”,基础科研靠志愿者苦撑
- 科学家首次测量原子核内胶子分布,发现强核力新线索
- 人形机器人格斗,我们从中看到了哪些技术真相?
- Kaggle赛题解析:OpenAI to Z Challenge
- 21 页 PDF 实锤 Grok 3“套壳”Claude?Grok 3 玩自曝,xAI工程师被喷无能!
- 成熟工程师1天完成调试,AI工程实践被MCP彻底颠覆?
- 两岁的Llama,最初的14位作者已跑了11个!Mistral成最大赢家
- 舍弃自回归!国内团队打造纯扩散多模态大模型LLaDA-V,理解任务新SOTA
- One RL to See Them All?一个强化学习统一视觉-语言任务!
- 让视觉语言模型像o3一样动手搜索、写代码!Visual ARFT实现多模态智能体能力
- 北大团队发布首篇大语言模型心理测量学系统综述:评估、验证、增强
- 全日程公布|谷歌Veo 3惊艳发布后,这场CVPR分享会值得每个AI人「听个声」
- ETT:打破原生多模态学习视觉瓶颈,重塑视觉tokenizer优化范式
- 全靠Claude4!30年FAANG老工程师:AI帮我解决了4年老bug
- 强化学习解决长上下文推理问题:通义推出QwenLong-L1-32B
- 开源模型竟被用于窃取下游微调数据?清华团队揭秘开源微调范式新型隐藏安全风险
- AI辅助的昆虫视觉体验,上理工等开发4.3兆像素的微米级仿生复眼相机
- 稳健、经济、高度可定制化,自动化高通量电化学表征平台AHTech来了
- 刚刚,阿里又开源了,超长上下文大模型
- 280万篇论文一键生成“星空地图”
- 为何说 “在国内做科研,最忌讳踏实”?
- “2.5万元就买了个摆设?”Vision Pro用户一年后集体后悔:吃灰、脖子疼、卖不掉
- 谷歌最新 AI 编码助手,简直令人难以置信
- 具身智能Embodied AI入门必读汇总
- 陕西一高中生与教授父亲共同署名发表3篇SCI论文,父亲同事:学校已调查清楚,没有任何问题,他们都很努力!多方回应
- QwenLong-L1技术报告英中对照版.pdf
- 通义实验室RAG/Agent应用团队日常实习生招聘
- LUD-YOLO,一种用于无人机的新型轻量级目标检测网络!
- 我们招聘量化实习生啦!
- 2025C4-AI大赛启动报名:快来,C4-AI做你的创意投资人!
- 百度AI x GAIE,百度飞桨亮相第六届深圳国际人工智能展
- 2025智源大会议程公开|AI安全论坛
- Qwen团队发布长上下文Reasoning模型QwenLong-L1,超越o3-mini
- RAG-Retrieval:一周年回顾&近期更新总结
- Adaptive Reasoning Model:Qwen3混合思考->字节AdaCoT->清华AdaThinking
- 复旦提出自适应Reasoning方法ARM,“能屈能伸”
- 突破长文本推理难题!阿里推出QwenLong-L1,32B参数就能媲美Claude,还开源了!
- 开源数字人克隆神器HeyGem:1秒视频生成4K超高清AI形象,用AI重塑数字人创作生态!
- 9.5K Stars!超好用的Markdown编辑器,支持公众号排版!
- 下载量不足1000次,印度首个著名开源大模型翻车
- 微软开源浏览器Agent,可实时跟踪、控制智能体,超4000颗星
- 英伟达重返中国!6月大量生产特供AI芯片,价格暴降40%
- 对话27岁博导张林峰:模型压缩获CVPR满分有点意外,上海交大像我这样年轻老师很多
- o3不听指令拒绝关机,7次破坏关机脚本!AI正在学会「自我保护」机制
- 5%参数比肩DeepSeek满血R1!北大“小”模型靠分合蒸馏,打破推理成本下限
- 百度心响上线iOS版,多智能体协作应用终于卷对地方了
- Claude 4被诱导窃取个人隐私!GitHub官方MCP服务器安全漏洞曝光
- 形式化证明与大模型:共创可验证的AI数学未来|量子位直播
- 低Token高精度!字节复旦推出自适应推理框架CAR
- 扩散语言模型九倍推理加速!上海交大:KV Cache并非自回归模型的专属技巧
- 阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题,登HuggingFace热榜
- 大厂程序员:AI正在将我们变成高速流水线工人,受不了了
- 全彩显示的AI眼镜来了!8999元带走阿里大模型和最强光波导
- MiniMax开源首个视觉RL统一框架,闫俊杰领衔!推理感知两手抓,性能横扫MEGA-Bench
- 多模态模型具备“物理推理能力”了吗?新基准揭示:表现最好的GPT-o4 mini也远不及人类!
- 阿里开源Qwen新模型,端午礼物来了~
- 智商276的世界第一持有者,正式向马斯克申请加入Neuralink!
- AI 试图编写自我传播病毒,并为后代写下遗书!马斯克转发称:「Memento」,人工智能安全警告拉响
- 「神经软件」正在到来,人类代码将失去意义!
- 阿里开源QwenLong-L1:首个以强化学习训练的长上下文推理大模型
- 数据提取场景下不同LLM模型对比分析
2025-05-26
- 大模型,炸了!!
- 推理大模型思考长度控制策略Thinkless:DeGRPO+short/think标记控制
- 我们从Agent强化学习框架RL-Factory及多模态统一框架One-RL-to-See-Them-Al中能学到什么?
- 【AAAI 2025】新型风车形卷积PConv,大感受野,可替换标准卷积!
- 今日开源(2025-05-26):MMaDA,8B统一多模态扩散模型,混合CoT微调+强化学习,实现推理/生成双突破
- ACL 2025 高分接收|高感情语音技术:逻辑智能小语种TTS破局之道
- 两年内打造AI软件工程师!OpenAI Codex 作者解密人机结对编程新模式
- GitHub Copilot新代理把「自家人」逼疯了!
- 完整版|谷歌创始人最新访谈,揭秘Gemini为什么突然变得这么强大?
- 详解世界模型:AI下一个重大拐点?Google、NVIDIA、Meta如何布局
- 行业落地分享:蚂蚁TuGraph图数据库
- 印度国家级大模型上线两天仅 300 余次下载,投资人直呼“尴尬”:韩国大学生模型都有20万!
- 智元机器人发布并开源首个机器人动作序列驱动的世界模型
- 惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死
- 微软副总裁X上「开课」,连更关于RL的一切,LLM从业者必读
- ACL 2025 高分接收 | 高感情语音技术:逻辑智能小语种TTS破局之道
- 实测惊艳全球的Veo3!音画同步无敌,贵是有原因的
- 与Gemini Diffusion共振!首个扩散式「发散思维链」来了
- 9位顶级研究员连讲3晚,华为盘古大模型底层研究大揭秘
- 1亿人类细胞数据集,8亿参数单细胞基础模型,中山大学等推出CellFM
- 《科学智能白皮书2025》,由复旦、上海科学智能研究院、Nature Research Intelligence联合发布
- 这几个Jupyter Notebook高级功能,不允许你还不知道
- 强推这个 Python 库,把终端玩出花儿了
- 选址确定!15所北京高校,集体外迁
- 陕西一高中生与教授父亲共同署名发表3篇SCI论文,父亲同事:学校已调查清楚,没有任何问题,他们都很努力!多方回应
- 你可能一直在错误的阅读文献?!
- 从YOLOv5到YOLO11!改进有多大?
- 朱松纯院士:全球知名人工智能科学家团队最新成果!
- 前OpenAI高管,北大校友Lilian Weng自曝公司首个产品?估值90亿
- 50年计算机理论僵局被打破!MIT科学家重大发现
- ResNet作者,阶跃星辰首席科学家 张祥雨入选 MIT “35 岁以下科技创新 35 人”
- 人工智能三巨头联袂推荐,这本经典巨著出中文版了!
- 15亿美元AI独角兽崩塌,全是印度程序员冒充!
- 字节跳动 × 清华大学联合开源!
- 2025多模态好发论文的方向!
- R ggplot2图表美化~
- 导师同意送审了,论文盲审没过,什么情况?
- 11w*14 薪,进 DeepSeek 了!
- 15 亿美元 AI 独角兽崩塌,全是印度程序员冒充!微软亚马逊惨遭忽悠
- “工资到手才是真,其他都是饼”:离职后,才明白的5件事
- 计算机视觉毕业后找不到工作怎么办?怒刷leetcode,还是另寻他路?
- 中科院寒门博士论文致谢走红:回答这个时代读研究生还有什么价值
- Qwen3-0.6B 能击败 Bert 吗?
- 开源免费大模型教材.pdf
- 万字长文总结!Reasoning模型的强化学习实现路径
- Adaptive Reasoning Model:Qwen3混合思考->字节AdaCoT->清华AdaThinking
- 大模型推理能力飙升,但背后的代价是什么呢?
- 告别ImageNet预训练?LightlyTrain重磅开源:工业级自监督预训练!
- 多任务场景下的Transformer高效Finetune方法。
- MGTV2025-多模态推荐赛道规则 baseline
- 大模型推理的全面总结: 从DeepSeek->Kimi->豆包->Qwen3
- 图解 LLM(大语言模型)的工作原理
- 23张PPT搞懂DeepSeek核心技术!
- 聊聊Cherry Studio如何接入vLLM部署的本地大模型
- Agent也能蒸馏了!性能超好
- Agent可以自己进化了?!
- 实习招聘:美团-业务研发平台 - 多模强化算法工程师(后训练方向)
- 怎么样让自己成为一个汇报思路清晰的人?
- 除了稀疏稠密检索,第三层检索来了!推理信息检索让RAG真正理解你在问什么!
- 突破视觉推理瓶颈 | 中科大联合港科大共同提出 Pixel Reasoner: 让 AI 模型学会”放大镜式”思考。
- 字节推出统一多模态模型 BAGEL,GPT-4o 级的图像生成能力直接开源了!
- 图像编辑革命,万物皆可插入!浙大/哈佛/南洋理工提出Insert Anything,告别PS抠图,AI让世界无缝生长。
- 新手做自媒体,有这10个免费AI工具就够了,建议收藏(附网址)!
- 专访微软CTO:微软大力发展Agent,智能体将无处不在
- Gartner:到2029年,50%的云计算将用于AI工作负载
- 英伟达发布统一GPU开发平台DGX Cloud Lepton
- 管理者必看!5 个可落地的行动指南,助你成为企业智能化转型破局者 | 5月29日《1 小时 AI 公开课》
- 极客说|AI Sales Avatar 探索
- 营收造假、虚假宣传,10年AI平台申请破产
- 这届国产AI真的可以!20分钟生成万字报告,附带可视化网页,可直接下载食用
- 机器人杭州上演格斗赛!拳拳到肉,宇树CEO王兴兴:创造了人类历史新时刻
- 4000亿国产算力航母:芯片巨头合并超算巨头
- 说句话就能飞!北航发布语言交互的无人机控制模型
- 豆包可以跟你打视频了,陪我看《甄嬛传》还挺懂!难倒一众AI的“看时钟”也没难倒它
- 你还在关注大模型排名?这家公司已在全球收割AI红利,做“真正能交付结果的”Super Agents
- deepseek v3 0526,leak了?
- 一个让 AI 向 FBI 举报你的办法
- OpenAI机密文档再泄露:2026年神秘硬件设备曝光!
- DeepSeek-V3-0526 闪现后秒删!
- DeepSeek最新模型意外泄露~
- 瓦力算法5月第3周急招岗位| / 海康威视 / 寒武纪 / 微软 / 滴滴 / 达摩院 / 饿了么 / VIVO /
2025-05-25
- Graph+图数据库+Agent能做什么?Chat2Graph的尝试思路
- 半世纪计算机理论僵局被打破!MIT科学家偶然发现:少量内存节省大量计算时间
- 港大马毅谈智能史:DNA 是最早的大模型,智能的本质是减熵
- 研究发现,大多数人工智能大模型很容易被诱骗做出危险的回应
- 人工智能三大学派的理论分野
- 顶刊论文“飙脏话辱骂第二作者”,期刊回应;刚上线就卡塞? 昆仑万维:已限流;马斯克宣布回归 7x24 小时工作状态 | AI周报
- 业界对 Agent 的最大误解:它能解决所有问题
- 50年僵局打破!MIT最新证明:对于算法少量内存胜过大量时间
- 只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max
- 312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7
- 开源·开放·开创,2025张江具身智能开发者大会暨国际人形机器人技能大赛即将启幕
- 人工智能三巨头联袂推荐,这本经典深度学习巨著出中文版了!
- 【机器学习】100个Python机器学习小技巧,让你速通ML
- 震惊!中科院一区Top期刊,正文惊现“国骂”!引发热议……
- “我是谁”:大模型的自我认知差异
- GitHub仓库秒变百科,还能自由对话!
- 灵魂拷问:大模型推理为什么要PD分离?
- 基于OpenCV的数字识别系统
- 刚刚!首个下一代大模型Claude4问世,连续编程7小时,智商震惊人类
- 万亿GDP城市,迎来第一所985
- 从十篇论文中探讨:如何解决推理模型的”过度思考”问题?
- 《百面大模型》录播:关于AI认知和就业建议,作者聊了一晚上
- Qwen3-0.6B 能击败 Bert 吗?对比分析拆解!
- 一键式训练端到端Agent,Qwen3+MCP工具集高效集成!
- 三个成熟的idea,寻觅合作者!
- 目标检测和语义分割该如何走下去?清华团队为视觉大一统模型指明了方向。
- 为什么将 Reasoning 应用到 VLMs 效果总是差强人意?
- AIGC Studio 联合机械工业出版社给读者免费送新书啦,开启 AIGC 智能教学新时代!
- 阿里灵魂拷问:大模型推理为什么要PD分离?
- 快手二面拷打:训练100B模型要多少显存?
- 半世纪计算机理论僵局被打破!MIT科学家偶然发现:少量内存节省大量计算时间
- 历史首次!o3找到Linux内核零日漏洞,12000行代码看100遍揪出,无需调用任何工具
- 统计可控数据合成!新框架突破大模型数据生成局限,麦吉尔大学团队推出LLMSynthor
- 她如何把“系统2”带给了大模型 |对话微软亚洲研究院张丽
- 人类打辩论不如GPT-4?!Nature子刊:900人实战演练,AI胜率64.4%,还更会说服人
- 传奇音乐制作人Rick Rubin将《道德经》魔改成Vibe Coding版《编程之道》背后的故事
- Anthropic称DeepSeek未超越前沿,仅是训练时间更晚:我们也可以用「500万美元或广告中宣传的任何金额来训练它。」
- 微软发布NLWeb:把任何网站变成AI应用的秘密武器!
- 仅用图像也能Think:Google等提出一种视觉规划的全新推理范式!
- 如何在LLM训练过程中精妙设计SFT与RL步骤—— LLM训练框架推荐
2025-05-24
- GraphRAG的两个有趣疑问及LLM代表开源开发工具总结
- 通俗易懂看技术:24张流程图直观理解LLM、RAG及Agent
- Claude 4核心成员万字实录:行业大模型不是未来趋势
- 英伟达再破世界纪录,每秒1000 token!刚刚,全球最快Llama 4诞生
- Nature:把这段人类特有非编码基因植入小鼠,它们长出了更大的大脑
- 人死如灯灭」是真实的?最新研究:生物超弱光子发射(UPE)可以反映生命活力
- 用印度程序员冒充 AI 的“独角兽”彻底倒闭了!伪 AI 烧光 5 亿美元,连微软和亚马逊都被“坑”了
- 打破资源瓶颈!华南理工&北航等推出SEA框架:低资源下实现超强多模态安全对齐
- 大模型时代,数据智能的构建路径与应用落点 | 直播预告
- 60年前数学大师没解开的难题,被一位牛津博士生搞定了
- 40位数学家组成8队与o4-mini-medium比赛,6队败北
- 矩阵乘法新突破!XX^T原来可以更快!RL助力搜索,世界纪录又被提升了5%
- DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文
- 让GPT-4o准确率大降,这个文档理解新基准揭秘大模型短板
- Now, Scaling What?
- 拒绝脑机延迟!通过调整潜在动力学来稳定脑机接口,3个月内无性能下滑
- 他主动辞去终身教职:“这里不再适合做研究”
- 香港科技大学宣布:无条件录取哈佛国际生!
- 下一代Transformer到底长啥样?
- Agent 大爆发!微软一晚上发布 50 个新东西!
- NeurIPS 2025 斐波那契投稿名不虚传…
- 华为目标院校白名单(2025最新版)
- 检测、分割、计数全拿下?对标Qwen2.5,VisionReasoner统一视觉感知与推理!(附论文及源码)
- 字节开源高精度文档解析大模型Dolphin:轻量高效,性能超GPT4.1!
- 真不容易啊!终于发现了学CV计算机视觉的好书了!非常全面深入!
- 用教学反向评估AI!复旦联合创智学院提出Teach2Eval,实现超越基准的能力评估
- 312条数据训练出“电脑高手”!刘鹏飞团队提出PC Agent-E,性能超越Claude
- 一种推理阶段的偏好对齐方案–TPO,让每个人都看得懂模型优化的“信号”
- 视觉生成领域新突破!无需引入任何外部表征组件:SRA助力Diffusion Transformer实现自我表征指导。
- Apple提出UniGen!多模态理解生成统一xii新架构!CoT - V提升图像生成质量!
- AI视频生成新突破!字节提出一致性视频生成方法Phantom:通过跨模态对齐生成主题一致的视频,超多应用场景。
- 小米大模型岗面试,被问蒙圈了……
- 100个硬核网站第1期,中国医药信息查询平台,希望大家永远都用不上!
- 100个硬核网站第2期,公众号也能插入附件,支持多种格式!
- 微软AI公开折磨微软员工,修Bug唯一贡献是改了PR标题,GitHub评论区成吃瓜现场
- AI项链?OpenAI首款硬件爆料,乔布斯爱将操刀,“像iPod Shuffle一样优雅”
- 打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力,token使用量还更少了
- AI越聪明越不听话!新研究:最强推理模型指令遵循率仅50%
- 字节把GPT-4o级图像生成能力开源了!
- Claude 4如何思考?资深研究员回应:RLHF范式已过,RLVR已在编程/数学得到验证
- OnlyFans和AI女友,谁会是最后的赢家?
- 再见AI Agents,你好Agentic AI
- 多智能体合作:旅游规划AI助理
2025-05-23
- 技术思考:小尺寸+两阶段式多模态文档解析模型Dolphin思路评析及PP-OCRv5更新
- 今日开源(2025-05-23):cBottle,公里级大气状态生成模型,级联扩散架构实现网格数据生成,支持视频训练与推理
- 【源头活水】突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体一夜屠龙
- 大模型之后,AI 开始“自己动手”了
- 地表最强AI编码模型Claude 4来了!上线前竟试图勒索工程师,Windsurf 成最大受害者?
- CSDN智研社欧洲首聚,共话技术范式转换下的创新与合作
- 谷歌联合创始人深度对话:6个问题说清谷歌AGI布局
- 10家量子计算公司路线图大盘点:最激进的一家,承诺5年后实现通用容错量子计算……
- 对话阿兰·阿斯佩:“驳倒”爱因斯坦之后,量子物理的界限何在?
- 寻找多模态学习伙伴,快来加入吧!
- 为什么你在国内高校实验室里很难发出顶会顶刊?
- 全球最强编码模型 Claude 4 震撼发布:自主编码7小时、给出一句指令30秒内搞定任务,丝滑无Bug
- 腾讯混元TurboS技术报告首次全公开:560B参数混合Mamba架构,自适应长短链融合
- 刚刚!首个下一代大模型Claude4问世,连续编程7小时,智商震惊人类
- RSS 2025|物理驱动的世界模型PIN-WM:直接从视觉观测估计物理属性,可用于操作策略学习
- 以加代乘?华为数学家出手,昇腾算子的高能设计与优化,性能提升30%!
- CVPR 25 |全面提升视觉感知鲁棒性,生成模型快速赋能三维检测
- 论坛报名已启动,速来锁定席位!解码具身智能模型革命
- SIGIR 2025 | 解决扩展和迁移难题,华为新加坡提出InstructRAG,提升高达19%
- Meta CEO X 微软 CEO 对话解读:「蒸馏工厂」为何成为开源的魅力之源?
- 让AI读懂化学反应,中国科学院开发化学反应描述语言,登Nature子刊
- 优于AlphaFold3?昌平实验室用AI生成淀粉样原纤维的多晶型景观
- 一研究生毕业答辩时,不断顶撞答辩专家,被赶出答辩现场……
- 破世界纪录,每秒1000 token!刚刚,全球最快Llama 4 推理速度诞生
- 华为目标院校白名单(2025最新版)
- 大模型ChatBot,返祖现象,Windows 98 风格
- 使用uv高效管理Python项目
- 刚刚!AI 编程新王 Claude 4,深夜震撼登基!连续编码 7 小时,开发者惊掉下巴
- 院士增选启动!这些院士候选人,竞争潜力较大
- 真碾压 Sora了!谷歌 Veo 3首次实现音画同步,视频模型直接「开口说话」
- 史上最大手笔!OpenAI斥资65亿美元收购前苹果首席设计师创业公司,网友猜测:要造AI版iPhone?
- 只用这3个CSS断点,就能搞定95%的响应式布局
- AI版Office全网首测,键盘鼠标彻底退休!不用自己写报告啦?
- 何恺明大神团队最新成果: 图像生成SOTA,提升50%
- 深度学习检测小目标常用方法
- 李宏毅:你想为大模型装备哪些任务向量?
- 小红书生成式推荐排序GenRank
- 最强编码和推理模型 Opus 4和Sonnet 4发布!Claude 4系列全面超越O3
- 2025智源大会议程公开|下一代AI路径探索
- ACL2025 | LLM的“记忆”与“推理”该分家了吗?一种全新的训练范式,彻底厘清思考流程
- 上海AI Lab等推出硬核评测!SOTA大模型栽在解密推理上,结构化推理竟成致命伤
- 招聘 | 智谱-LLM Post-training/Evaluation-全职/实习
- 大模型 Agent 就是文字艺术吗?
- 阿里联合上海 AI Lab 提出DMM!多个模型压缩成一个通用 T2I 模型!实现可控任意风格生成!
- 阿里&北邮提出基于Wan2.1的音频驱动数字人FantasyTalking,只需输入肖像、语音和文字即可生成动画。
- 利用多模态模型赋能,SONY团队完成音乐到音乐视频描述生成大突破!
- GitHub爆火开源数字人,无限克隆+视频生成+实时交互,完全免费效果炸裂!
- 政企共探AI未来——黔东南州政府干部专题研修活动圆满收官
- 【AIGC应用】OpenAI推出一款基于云的软件工程Agent
- 【AIGC趋势】数据角色被重塑,产业亟需深度融合AI能力的新型数据
- 【行业动态】聚焦空间智能,特斯联与同济大学达成合作,商汤大模型一体机获IDC推荐
- Agent大革命!Claude 4连续自动编程7小时,刷新世界记录
- 突发!美国新法案,10年内禁止监管AI
- 谷歌重磅发布Flow,人人都能制作好莱坞级电影
- 阿里最新财报:AI收入大涨,成新财务增长引擎
- 最新W4A4KV4全量化框架,单卡A100大模型推理速度飙升
- 最强编码模型Claude 4!7小时不间断写代码,连玩24小时宝可梦,GitHub已选为Copilot底层模型
- 雷军发布小米自研3nm芯片系列新品:首搭手机平板和手表,基带模块也亮相了
- 首个AI翻译实战榜单出炉!GPT-4o稳坐天花板,文化方面Qwen系列一马当先丨开源
- 巧妙!一个传统技术让国产视觉基础模型直接上大分
- 多模态长文本理解测评首发:46款模型无一攻克128K难关
- 预测误差仅0.26mm,中科院自动化所×灵宝CASBOT团队让机器人提前“知道你要干嘛”
- 超长推理还能节省计算!Salesforce开源神器两连发:教大模型边想边省,显著提升数学编程准确率
- 123页Claude 4行为报告发布:人类干坏事,可能会被它反手一个举报?!
- GPT-4o当选“最谄媚模型”!斯坦福牛津新基准:所有大模型都在讨好人类
- 无需数据配对,文本嵌入也能互通?康奈尔重磅研究:所有模型都殊途同归
- 大模型首次打破围棋思维「黑盒」,打通科学发现新路径!上海AI Lab发布新一代InternThinker
- bge出新向量模型了,准备更新吗?
- Claude 4发布!世界最强编程模型来了
- 120页Claude 4系统卡曝光!通篇人格觉醒、科幻玄学,看得我后背发凉!
- OpenAI帝国的真相与幻象——496页「Empire of AI」中文版电子书分享!
- 123页Claude 4系统卡惊现:大模型自我意识!
2025-05-22
- 人机交互型Agent方案Magentic-UI:兼看GraphRAG生成加速、无人机控制项目实现思路
- ICML 2024 Timer:大型时间序列生成式预训练Transformer模型
- 今日开源(2025-05-22):字节开源Dolphin多模态文档解析模型,两阶段分析-解析+异构锚点并行机制,轻量架构高效处理
- 能空翻≠能干活!我们离通用机器人还有多远? | 万有引力
- 智元机器人发布并开源世界模型EVAC与评测基准EWMBench,助力具身世界模型加速进化!
- 英伟达让机器人「做梦学习」,靠梦境实现真·从0泛化
- 量子计算公司D-wave被控欺诈
- 蒋田仔/刘军合作利用数字孪生脑解码冰毒戒断的神经机制
- 砸65亿美元招揽58岁乔布斯门生!55名苹果元老工程师尽归OpenAI,奥特曼终拿下“盯了”两年多的AI产品!
- 从 DeepSeek 部署看,华为如何让 MOE 架构“迎来”海量“专家”?
- 3 层人群定位 × 5 种赋能手段,企业全员数据能力提升指南 | 极客时间企业版
- 弥合文本描述与晶体结构生成差距,帝国理工提出材料新模型Chemeleon,登Nature子刊
- Nature | 微软发布包含13亿参数的地球系统基础模型
- 机器学习实战:犯罪率预测模型
- 教育部拟同意设置32所新大学!
- 华为牛逼,昇腾大模型推理杀手锏来了
- 何恺明团队又发新作,彻底颠覆AI生图!!
- 华为目标院校白名单(2025最新版)
- 大模型全面爆发,所有榜一都是 Gemini!谷歌一夜站到了台前
- “因为一次成功重写,我们 CTO 彻底封杀了 Rust!”
- 新一代 IDE 横空出世,轻松碾压 VS Code 和 Copilot?
- 使用OpenCV实现摄像头测距
- 图像合成与图像融合
- 用于图像分割的自监督学习(Self-Supervised Learning)方法综述
- 华为目标院校白名单(2025最新版)
- 92ms极速Token响应!VITA团队开源实时语音大模型,推理效率暴增5倍
- Qwen突破:用「并行计算」代替「堆参数」,新方法内存降22倍、延迟降6倍
- 96G显存的4060?聊下AI MAX 395的核显8060s!
- 开启通用视觉异常检测新时代!腾讯开源 AdaptCLIP 模型刷新多领域 SOTA!
- 比赛拿了满分!leak 后处理&高分baseline分享。
- 操作系统智能体verbos震撼来袭
- 多模态理解大模型高性能优化丨前沿多模态模型开发与应用实战第七期
- 四位图灵奖掌舵,2025智源大会揭示AI进化新路径
- 强化学习背后的隐藏代价:幻觉税
- PhD补录 | 哈工深计算机学院陈科海老师补录2025级9月入学博士生,10天内有效,先到先得
- 学会“模糊思考”:推理速度提升22%,还少犯错
- ICML2025分享会报名收集啦!
- 单机百万并发:协程开始吊打线程了?
- 谷歌黑科技炸场!LightLab:只需一张图+AI,光影编辑像呼吸一样简单,废片秒变电影级大片!
- 耶鲁大学联合Adobe提出SynthLight:智能重塑人像照明,打造完美光影!
- ICLR 2025满分论文,ControlNet作者新作IC-light,控制生成图像照明,代码模型已开源。
- IC-light V2:基于FLUX训练,支持风格化图像,细节远高于SD1.5。
- 国产超级智能体!一键生成调研报告、PPT、表格、网站、播客,打工人有救了!
- 突发!OpenAI以64亿美元,收购iPhone设计师公司io
- OpenAI放大招!核心API支持MCP,一夜改变智能体开发
- 5月24日 AI 实战公开课,解锁 AI 大模型 MCP 开发核心技能
- 微软大咖技术分享+动手实践工作坊 | 从技术到商业,MCP协议如何驱动AI新范式?
- 腾讯大模型战略首次全景亮相!智能体平台重磅上线,从“落地可用”到“智能协同”
- AI十周找到不治之症潜在新疗法,核心流程完全自主驱动
- 字节开源高精度文档解析大模型Dolphin:轻量高效,性能超GPT4.1、Mistral-OCR!
- 小学数学题,大模型集体不及格!达摩院推出新基准VCBench
- 无需昂贵设备,单目方案生成超逼真3D头像,清华&IDEA新研究入选CVPR2025
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- Claude 4 要来了!
- 马斯克:Optimus 将成为有史以来最大的产品,比第二大10倍!
- bge开源一系列新向量模型,冲!
2025-05-21
- 文档智能+知识图谱驱动大模型推理落地的一些思考及领域Embedding向量化的有趣进展
- 解决小LLM 6类幻觉的实用指南
- 今日开源(2025-05-21):Gemma 3n,Google轻量级多模态开源模型,选择性参数激活技术,低资源设备高效运行
- AI若解决一切,我们为何而活?对话《未来之地》《超级智能》作者 Bostrom | AGI 技术 50 人
- 谷歌发布最强 AI“全家桶”、一句话就让AI拍大片!这一夜,谷歌Gemini贯穿始终,网友:果然Android“靠边站”了
- 2025 全球产品经理大会正式官宣,聚焦 AI 产品实战,全景呈现未来产品图谱!
- 谷歌I/O大会王者归来:Gemini“世界模型” 初现,搜索“换脑”,一句话制作原声电影
- 量子计算,正处于一个深刻转变之中
- 意识难问题——基于整体观哲学的视角II
- 图解 Transformer 和 MoE 的差别
- 腾讯算法三面终极拷问:为什么 GRPO 容易出现 reward 崩塌?
- 博士宿舍激情脑暴,革新了Scaling Law?Qwen和浙大联手推出新定律,直接干掉95.5%推理内存!
- 谷歌AI核爆:升级全系模型,Gemini 2.5双榜登顶!所有产品用AI重做,OpenAI如何接招?
- 汤道生:腾讯持续加大 AI 投入力度,各项业务全面拥抱 AI
- 被「AI for Science」的炒作骗了?有位科学家遭遇了惨痛的教训
- 2025年了,还在用 Pandas 那就OUT 了!
- 大模型时代下的推荐系统:深度学习与推荐系统 2.0
- 多大仇啊?学生论文致谢导师,导师批注:建议把致谢部分烧掉
- 硕博生必看!这场国际会议,藏着你的学术机遇与研究方向
- 翟天临悼念好友被骂,评论区怼网友:你查重花钱是我导致的吗?
- Python 字符串:单引号与双引号的选择
- 在线教程|支持 19 种语言,生成速度快 15 倍!ACE-Step 音乐生成模型上线
- 14小时近500 Star!快速进阶LLM/AI的必读系列
- 何恺明大神团队最新成果: 图像生成SOTA,提升50%
- 福耀科技大学校长王树国灵魂发问:若梁文峰读博,还能有DeepSeek吗?
- “你算什么东西”,大学教授辱骂学生?本人回应
- 何恺明2025新作的即插即用核心算法-DyT!!
- 关于大模型,普通人最大的机会在Agent
- 字节跳动,低调开源!
- 陶哲轩“喂饭级”AI 教程来了!只用 GitHub Copilot 证明函数极限问题
- 震撼全网,AlphaEvolve 矩阵乘法突破被证明为真!开发者用代码证实
- 五大主流 Web 框架真实性能对比:10亿请求下谁能幸存?
- 图解卡尔曼滤波(Kalman Filter)
- 数字图像处理必备基本知识
- 使用 CLIP 对没有任何标签的图像进行分类
- 一作解读!从idea视角,聊聊Qwen推出的新Scaling Law——Parallel Scaling
- AI碎碎念-关于Agent的思考-2025年
- YOLO-MECD,基于YOLOv11的柑橘目标检测算法
- 英特尔新显卡拉爆性价比!24GB显存售价3600+,网友:买它!
- 好消息!平均薪资48333!彻底爆了!!
- VisionReasoner首提统一框架,检测/分割/计数任务超越YOLO-World模型!
- 2025年国产大模型清单!
- 多尺度目标预测&多尺度表征学习,提升长周期时序预测效果
- 智涌星河 AI赋新程 | 百度飞桨携手华南师范大学成功举办技术沙龙
- 智企创新 织造未来丨百度AI企业家俱乐部系列活动第一期
- 2025智源大会议程公开|青年科学家发展与创新动能
- ACL 2025 | 清华&港中文提出 MorphMark:全新理论视角破解大模型水印效力与文本质量的两难困境
- 在Think中边搜索边调整的搜索增强Reasoning方法
- RAG 挑战赛冠军方案解析:从数据解析到多路由器检索的工程实践,推荐阅读!
- 哔哩哔哩再放大招!开源最强文本转语音模型Index-TTS,超真实语音克隆,可纠正发音、控制停顿。
- 大厂实习熬到头啦!成功转正拿 SSP
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 边打字边出图!腾讯发布实时生图大模型,毫秒级响应,速度快到惊人
- 谷歌开发者大会炸场!Agent重磅升级, A2A、SDK大更新
- Agent时代HTML!微软开源创新框架,网站秒变智能体
- 听说了吗,有个可以边逛、边切磋AI技术的活动要来?
- Gemini Diffusion:1500 token/秒,快如闪电!
- All In AI的Google I/O 2025还开源了一系列模型,冲~
- 拒绝不必要Think:微软&北大提出第一种自适应大型混合推理模型
- 2025年GitHub上十大RAG框架深度解析:从技术原理到实战应用
- AI Agent的五层难度进阶:从工具调用到系统构建(附代码实现)
- LLM的 “自信陷阱”:上下文幻觉如何侵蚀 AI 信任?
- LLM中的知识留存:解决LLM的灾难性遗忘问题
- 基于 DSPy 与 Pydantic 的自然语言参数提取框架(含code)
- RAG(检索增强生成):提升大语言模型性能的终极指南
2025-05-20
- Agent提示工程实践指南及KG用于RAG数据合成方案RAGSyntic解读
- 数据科学家必须了解的六大聚类算法
- 强化学习的大杀器!登上《Nature》正刊!
- PINN与KAN终于结合起来了!发SCI一区Top超简单的!
- 2025年,多模态特征融合只会更火
- 只做注意力机制怕是不够了,想要高分得加快速傅里叶变换!
- 研究实锤:LLM 不会真正的数学推理
- 清华团队新作:无监督低光图像增强与去噪,效果惊艳!
- 今日开源(2025-05-20):Index-AniSora,B站最强开源动画生成模型,支持多风格视频一键生成,完整推理代码公开
- 【他山之石】谢赛宁等推出统一多模态模型!替代VAE实现图像理解/生成双SOTA,代码权重数据集全开源
- 【源头活水】CoT推理大溃败?哈佛华人揭秘:LLM一思考,立刻就「失智」
- 【他山之石】代码、多模态检索全面登顶SOTA!智源BGE向量模型三连击,并全面开放
- 对话阶跃星辰段楠:“我们可能正触及 Diffusion 能力上限”
- WSL、Copilot皆重磅开源,深夜炸场的微软给我们带来了哪些惊喜?
- 微软 Build 2025:马斯克、奥特曼、黄仁勋齐亮相,Agent成主战场
- Nature:大脑是怎么“看见”的?7.5 万神经元连接图谱重构视觉认知
- Nature:光影真相vs算法幻象,AI时代的科学摄影
- 重磅!微软宣布开源Copilot!用 5000 万用户直接碾压 Cursor和Windsurf?
- 靠”氛围编程”狂揽 2 亿美金,Supabase 成 AI 时代最性感的开源数据库
- Cell | 生成式AI设计合成的DNA,首次精准控制健康动物细胞的基因表达
- LLM增强微生物组样本语义分类,提高数据可用性
- 推荐一个 Python 神级内置工具:partial
- 华为鸿蒙电脑震撼发布:18英寸大屏,轻薄便携,售价23999元起
- 【Python】缺数据集?用这个Jupyter Notebook扩展直接画出来吧!
- 字节低调开源代码大模型,让代码模型为自己策划数据
- 字节低调发布 Dolphin 大模型:文档图像解析的新突破
- 缺数据集?用这个Jupyter Notebook扩展直接画出来吧!
- 史上最强!YOLOv12 杀疯了。。。
- 北大 DeepSeek 论文或预定 ACL Best Paper!梁文锋署名
- 42岁程序员被AI淘汰!曾年薪15万美元,如今800份简历打水漂、只能靠送外卖糊口……
- Cursor 0.5 重大更新:七大新特性全面解读
- 注意力机制魔改再出圈!姚期智院士都在做!174个idea汇总,中稿无忧!
- 你不知道的车牌识别系统
- 什么是目标检测中的平均精度均值(mAP)?
- LLM 之 Agent RL & Async Pipeline RL 训练和加速
- 京东智能体平台和应用算法团队招聘LLM相关方向算法工程师/实习生
- OpenRLHF 原生支持异步 Agent RL!再也不用被说Agent就是写prompt了
- 图像标注神器 X-AnyLabeling v2.5,通用视觉任务全新升级,交互式视觉-文本标注功能!
- 最新!2025中国 ESI 大学排名!你的母校排多少名?(496 所)
- PaddleOCR 3.0发布:OCR精度跃升13%,支持多语种、手写体与高精度文档解析
- ICML 2025 | 无需训练,即时对齐大模型偏好
- ICLR 2025 Oral | LLM也有从众心理!
- C语言凭什么统治操作系统开发?
- AI Engine 实验室多篇论文被 ACL 25 及 KDD 25 录用
- 遇到重复工作怎么办?Python自动化办公1秒即可完成
- 给二次元世界的献礼!哔哩哔哩开源目前最强大的动漫视频生成模型Index‑AniSora!
- 炸裂!ComfyUI 原生支持 HiDream-I1,全新文本转图神器来了!
- AI Agent 与 Agentic AI 有什么区别
- 0代码,5分钟,搭建出企业级文档处理MCP Agent
- 仅499页!吃透大语言大模型
- 微软开源全新Agentic网络项目:NLWeb
- 如何基于自定义MCP服务器构建支持工具调用的Llama智能体(含code)
2025-05-19
- 如何挖掘文档解析及RAG框架研发方向—从开源项目更新历程视角
- ChatTime:支持时序和文本双模态的基础大模型
- 颠覆!自注意力凉了?FFTNet让AI提速百倍
- 今日开源(2025-05-19):阿里开源WorldPM模型,揭示人类偏好建模规律,1.5B-72B参数实验验证偏好模型扩展定律
- 【源头活水】图像定制全面升级,通用图像定制化新范式!字节联合北大发布图像定制化统一框架Dream0
- 小模型逆袭屠榜!30倍数据效率+13倍模型压缩效果暴增近10%!字节重磅开源SuperEdit
- 【他山之石】ICML 2025 | 大模型深度思考新范式:交替「推理-擦除」解决所有可计算问题
- 【源头活水】5090将被秘密定位?美或强制植入「地理追踪」,锁定英伟达高端GPU
- 图文跨模态“近视”问题破局:360开源新模型 FG-CLIP,实现细粒度图文对齐突破|ICML2025
- Nature:DeepMind发布重磅通用科学人工智能体
- 格蕾特·赫尔曼:挑战海森堡与冯·诺伊曼的量子物理学家
- 特刊长文:热力学与目的论
- AI 教父 Hinton:我每天用 GPT-4 做这三件事,却最怕它“装懂”骗我
- 黄仁勋发力支持Agent、新设中国研发点,贾扬清Lepton被收购后现状曝光!
- curl 项目创始人被 AI“逼疯”,怒斥垃圾报告堪比 DDoS 攻击!网友:但老板们认为 AI 无所不能
- 华为&中国科学院带来优化框架,用于面向文本的药物分子设计
- FlashAttention 的第一原则
- 重磅!2024图灵奖颁给Deepseek背后的功臣:强化学习
- 超800所高校2025年预算出炉:最高近400亿!
- DeepSeek V4/R2 应该很快就会来了,而且会有更大的震撼
- 2024 年,博士学历断崖式贬值元年
- Index-AniSora:斩获多项SOTA,B站开源动画生成模型,入选IJCAI25
- 85倍速度碾压:FastVLM,一款可以直接在iphone上运行的视觉语言模型
- 新型机器学习算法:预测左心室辅助装置植入后早期右心衰竭
- 论文鉴赏:机器学习在生物标志物发现中的创新应用,生物驱动LASSO方法解析
- 用 Gradio, 几行 Python 代码构建 MCP 服务器!
- 奥特曼最新专访:2025,AI智能体正加速登场
- 用大模型制作高逼格的数学动画
- 黄仁勋放话:英伟达全员拥抱智能体!
- 添加p值
- 各位,请做好 3 年内随时可能失业的准备!
- 一次电梯故障,催生出大厂最爱的语言:Rust稳定版迎来十周年!
- 员工在公司能待多久,看办公桌就知道
- 最新!2025 中国 ESI 大学排名(496 所)
- 北大DeepSeek论文或预定ACL Best Paper!梁文锋署名
- Lilian Weng 最新万字长文:从 CoT 到 Aha Moment,揭秘大模型「思考」的奥秘!
- 全球第一!百度把图生视频卷到了Vbench-I2V榜首
- WWW’25数据竞赛—多模态CTR预估1st方案介绍
- 飞桨开源夏季个人挑战赛开启:710道任务等你挑战,丰厚奖金等你拿!
- 百度飞桨厦门中心以AI赋能K12教育:从课堂到未来的创新实践
- 成都站 · 飞桨领航团AI达人创造营来啦!
- ACL2025 | 抓出0.1%的捣乱分子压缩方法OTT:近乎无损 超越KIVI,内存减6.4倍 吞吐量提2.3倍
- Reasoning新突破:SoftCoT++如何让LLM‘多想几条路’?
- Interrupt 2025 大会回顾:关于LangChain 的 AI Agent会议内容总结
- 谢赛宁团队提出BLIP3-o:融合自回归与扩散模型的统一多模态架构,开创CLIP特征驱动的图像理解与生成新范式!
- 字节提出从单一主题发展到多主题定制的通用框架UNO,通过情境生成释放更多可控性。
- ComfyUI插件安装失败率90%?教你4种方法0踩坑
- 高端的推理模型,仅需一个训练样本~
- 支持5000+ Server,ScaleMCP为大模型Agents动态同步MCP工具
- 理解LLM评估指标综述:可靠评估LLM的最佳实践
2025-05-18
- 近期Claude、Grok系统提示词事件的几点思考及偏好学习中的Scaling law论证
- 最新!OpenAI:GPT-5将实现大统一,Codex最佳实践是这样的
- 为大模型架起通往物理学的桥梁,科学家提出“AI热力学定律”,为模型训练动态提供全新洞见
- 北大校友,OpenAI前安全副总裁Lilian Weng最新万字博客文章:Why We Think
- 华尔街:我们终于知道AI如何“思考”了——基本没啥思考
- 基于马尔可夫链的状态转换,用概率模型预测股市走势
- 字节福利调整:多地禁止打包餐食回家、午休熄灯;Kimi回应“不如之前有人味儿”;黄仁勋确认H20已无法再改 | AI周报
- 年赚三亿美金、估值近百亿,Cursor竟无护城河?
- 1964年,一个知青在看钱学森的论文时,发现方程推导错了
- 刚刚!前 OpenAI 应用研究负责人、北大校友Lilian Weng最新博客发布
- 用R语言解锁深度学习
- 不用等了!吴恩达MCP课程来了!
- 为啥越“水”的创新点,越经常爆顶会顶刊?
- 211 大学女博士生实名举报导师言语性骚扰!网友评论反转:心疼导师三秒钟
- MIT 博士爆火论文造假,学校官宣撤稿!被骗诺奖导师亲手举报,愤而割席
- 实战|13个Pytorch 图像增强方法总结(附代码)
- C++从零实现神经网络(收藏版:两万字长文)
- 十大保姆级Python可视化绘制工具推荐~~
- 2024年,博士学历断崖式贬值元年
- 354页pdf(教材配套课程PPT)!赵宇教授新书《大模型应用:从提示工程到AI智能体》(预览版)线上发布
- LLM训练框架:从优化器和精度讲到ZeRO
- 万字长文,AI模型大小与推理速度的深度分析研究
- AI质检终于能“看懂”缺陷了?首个零样本工业异常分类方案开源,支持GPT4o!
- 一文全面汇总大模型技术生态!
- FudanNLP邱锡鹏老师组-25普博/26直博/26普博/26保研 招生
- 多模态大模型集体翻车,GPT-4o仅50%安全通过率——SIUO 揭示跨模态安全盲区
- 字节发布 Seed1.5-VL 视觉-语言多模态大模型,20B 参数狂揽 60 项公开评测基准中 38 项 SOTA!
- 字节发布视频基础大模型Seaweed,70亿参数超越同类140亿参数视频模型效果,单GPU就可生成1080P!
- 142页深度解析:DeepSeek-R1的推理技术综述,AI的“思考”秘密大公开
- 专家混合模型(MoE)面试常考题梳理
2025-05-17
- RAG中的生成线索挖掘:KG+COT+NLI集成思路GE-Chat及CausalRAG因果过滤方案
- AI神论文一夜“塌房”!诺奖得主被骗,MIT紧急撤稿
- 实现AGI的条件及证据:知道自己知道的计算模型及大量证据
- 爱因斯坦奖得主、物理学领军人夏皮罗:为什么科学家那么热衷“大统一理论”?
- Altman 终于能放手研究他的终极梦想了
- 如何应对结构-活性悬崖难题,用于分子性质预测的预训练框架SCAGE给出解答
- 豆瓣8.9,吴军博士《数学之美》特种邮票首日封定制版上市啦!
- 【深度学习】5分钟解释Transformer,一个神奇的算法模型 !!
- 重庆市纪委、财政局、教委调查:《75万采购一个269元路由器》事件
- 契合大厂的大模型技术:这本【大模型算法】书带你一网打尽
- 【教程】从 0 到 1,微调一个自己专属的大模型
- 这个智能体,自动读论文并转化为高质量、可运行的代码库
- 是时候彻底弄懂BERT模型了!
- 编程革命彻底爆发!刚刚,OpenAI 最强智能体上线 ChatGPT
- 2024 年,博士学历断崖式贬值元年
- 使用OpenCV实现车道线检测
- 如何消除图片中的运动模糊?
- 使用深度学习检测混凝土结构中的表面裂缝
- 百面大模型20本回馈粉丝和开源社区
- 苏州大学OpenNLG小组近期录用15篇ACL、2篇ICML等论文!招生贴
- Qwen突破:用「并行计算」代替「堆参数」,新方法内存降22倍、延迟降6倍
- xAI 把 Grok 的系统提示词全部公开了,我们看看DeepResearch的系统提示词怎么设计的?
- 大模型再现黑马!英伟达开源Llama-Nemotron系列模型,效果优于DeepSeek-R1。
- 单图生成3D头像+AI编辑+多模态驱动?阿里LAM让虚拟人“活”了!
- ComfyUI | 最强吉卜力风格工作流EasyCN来袭,风格统一+操作简便+输出稳定!
- 阶跃星辰×光影焕像|3D生成大模型 Step1X-3D|附实习招聘
- 首次全面复盘AI Agents记忆系统:3大类,6种操作!
2025-05-16
- RAG往后发展的三点感触及语言文化分析的两个工作
- 我用 Cursor 写了一个520游戏,Python实现,全流程分享
- 今日开源(2025-05-16):BLIP3-o,统一多模态模型,4B/8B参数,CLIP特征扩散实现图像理解与生成
- 干货超标!腾讯混元3D负责人郭春超:真正的3D AIGC革命,还没开始!
- “图片秒生”,腾讯混元图像2.0模型正式发布,主打速度和真实感
- 智能军团崛起:通付盾Legion平台引领多智能体协同革命
- Nature:DeepMind发布重磅通用科学人工智能体
- 图灵奖得主杨立昆现场追问:AI 还没越过这 3 道认知墙,谈什么通用智能?
- Neuron重要综述:“人脑”植入鼠脑?前沿“嵌合脑模型”如何重塑我们对神经疾病的理解与治疗
- 可视化讲透大模型生成的几个重要参数
- 爆冷!字节Seed 在CCPC 决赛只做出一道签到题,而DeepSeek R1 直接挂零?
- LLM Inference 和 LLM Serving 视角下的 MCP
- 突袭Cursor,Windsurf抢发自研大模型!性能比肩Claude 3.5、但成本更低,网友好评:响应快、不废话
- 谷歌超强 AI Agent 登场:攻克 300 年数学难题、改进芯片设计!编程迎来 AlphaGo 时刻?
- AI+单分子技术联合揭示蛋白折叠「实时电影」,上海交大首次捕获钙结合蛋白隐藏中间态
- 采用热力学的计算系统,AI算力提升的另一种替代方式
- 国产大模型 DeepSeek-V3 技术报告
- 大快人心:协和 “4 + 4”毕业的董某颖,学位没了、医生执业资格没了
- DeepSeek预测程序员35岁以后做什么工作好
- 给matplotlib images添加scale Bar
- 独自一人,怒发顶会!
- 今天起全员免费!GPT-4.1 上线 ChatGPT,首波实测:又快又听话,油腻感没了
- 2025,嵌入式开发的新机遇
- Prompt老跑偏?教你写出模型真正听得懂的提示词
- 区分初学者与专业开发者的 7 个核心 HTML 技能
- 基于opencv实战眼睛控制鼠标
- 一个极具争议的开源项目,「微信克隆人」火了!
- 计算机视觉毕业后找不到工作怎么办?
- 英伟达选择阿里千问,背后竟然是。。。
- 强化学习算法梳理:从 PPO 到 GRPO 再到 DAPO
- 深度解析DeepSeek-V3:硬件与模型协同设计如何突破LLM规模化瓶颈,附论文英中对照版
- 大模型多轮对话场景评估trick,不要再用静态数据集了
- 清华开源YOLOE,完美超越YOLO-World v2,又快又准看Anything !(附论文及源码)
- DeepSeek-V3再发论文,梁文锋署名,低成本训练大模型的秘密揭开了!
- 太初元碁联合飞桨为百家企业提供高性能 AI for Science 端到端方案
- 报名启动!百度飞桨走进第六届GAIE展会,共谋 AI 技术加速智能硬件产业创新
- 2025智源大会议程公开|深度推理模型论坛
- 2025智源大会议程公开|人才发展交流会
- AI Agent 知识工程及在真实场景落地探索
- 完全从0开始,仅用8元+9h!即可训练出Tiny LLM全流程教程,包含Reasoning、MoE等
- 告别Reasoning模型的“灵光一现”,推理能力可控了
- ACL2025 | 代码助手火了,但安全吗?所有模型评估结果都很扎心
- LongRefiner:解决长文档检索增强生成的新思路
- 大模型技术交流7群成立了!
- 3D 生成新 SOTA!SECERN AI 提出 方法 SVAD,单张图像合成超逼真3D Avatar!
- ComfyUI | VACE-14B:效果炸裂,开源AI视频里程碑!稳定高质量wan2.1视频一体化编辑。
- 港科&腾讯&清华提出全球首个多模态Mamba生成框架ACTalker,支持多信号输入,数字人嘴型同步再升级!
- 50个最热门的AI专业术语,一定要学会读懂这些常见缩写词,职场必备!
- 广西公共资源交易系统干部班AI实战课圆满落幕!
- 【AIGC应用】复杂问题分步拆解,让直男也能交出520的满分答案
- 【行业动态】西部数据与鸿佰科技达成长期合作关系,合合信息上线智能文档处理领域首批MCP服务
- 【AIGC趋势】阿里视频生成模型王炸开源,消费级显卡可玩
- Hugging Face刚刚开源了一个MCP全面指南~
- 字节跳动Seed1.5-VL复杂图表精准抽取,Deep Think是多模态未来的主流
2025-05-15
- 数据合成方案:知识图谱增强RAG用于难度可控问题生成思路及实现流程
- 今日开源(2025-05-15):Wan2.1-VACE,1.3B/14B参数视频生成与编辑模型,支持480p/720p分辨率
- 【源头活水】一张照片、一句简单提示词,就被ChatGPT人肉开盒,深度解析o3隐私漏洞
- 【他山之石】CVPR 2025 Oral | DiffFNO:傅里叶神经算子助力扩散,开启任意尺度超分辨率新篇章
- 【源头活水】CVPR 2025 | OverLoCK:一种先概览后细察且具有上下文混合动态内核的卷积神经网络
- DefMamba:新型视觉基础模型,借多尺度Backbone与可变形Mamba模块及DS策略革新视觉任务表现 !
- 破解百年数学难题,刷新算法认知!DeepMind 发布超级编码智能体 AlphaEvolve
- Visual Studio 重磅更新!擅长处理复杂任务的 GitHub Copilot “智能体模式”预览版上线
- 重磅!谷歌DeepMind发布AlphaEvolve:AI界的“算法设计进化大师”诞生
- 熵是什么?一场200年的探索之旅
- “4.1 淘汰 4.5 !”OpenAI发布升级版GPT-4.1全家福:推理、编程性能升级
- 登顶 Arena!MiniMax 最新 Speech-02 模型屠榜:超越OpenAI、ElevenLabs,人声相似度99%
- 不再“纸上谈兵”:大模型能力如何转化为实际业务价值
- AI 开发:从 Demo 到上线有多远?| 直播预告
- 比专家模型快35倍,浙大侯廷军开发Token-Mol 1.0:基于LLM的token化药物设计
- AI将开展原创研究?OpenAI首席科学家称AI今年内或可近乎自主地产出成果
- Meta开源分子数据集OMol25、原子通用模型UMA,加速分子、材料、神经科学进展
- 推荐一个 Python 神库 Distilabel – AI 高质量数据合成神器!
- 西北大学副校长成陕西首富?最新情况
- 全球AI巨头都开始选边站了,但他们选的是一个国产模型。。
- Python Seaborn Cookbook(中文版来了)
- LeCun转发!纽约大学100页机器学习讲义公开:所有人都在追LLM,高校为何死磕基础理论?
- 梁文锋署名DeepSeek新论文:公开V3大模型降本方法
- 再见了!TensorFlow !!
- “烧掉94亿个OpenAI Token后,这些经验帮我们省了43%的成本!”
- 10 款 AI 视频创作工具,助你轻松打造爆款内容(已被无数创作者验证)
- 30秒文本变大片,AI换装不换脸
- NYU教授公布2025机器学习课程大纲:所有人都在追LLM,高校为何死磕基础理论?
- CNN是不是一种局部self-attention?
- 炸裂!大模型又杀疯了!这次直接颠覆AI!
- Qwen3实测 & 技术报告
- 图解Vllm V1系列5:调度器策略(Scheduler)
- 速来!38 万奖金池 + 近万元京东卡,这场比赛不冲真的亏爆!
- 清华刘知远团队:高质量LLM训练数据获取新方法!成本降90%,性能大提升
- 14小时近500 Star!快速进阶LLM/AI的必读系列
- 模型宣称的“百万字处理能力”是真本事,还是营销噱头?LongCodeBench揭露真相
- 如何利用已有问答数据对构建RAG
- 6秒音频即可克隆AI语音!FLOAT数字人生成语音/口型/表情,情感同步超惊艳,文中附工作流。
- ComfyUI | 只要两张图,教你1分钟换出高级感背景图!
- 图生3D新SOTA!港中文&字节&清华联合提出Hi3DGen:通过法线桥接从图像生成高保真 3D 几何图形。
- 刚刚,DeepSeek发布最新论文,深入解析V3/R1降本增效秘密!
- 探索LLM引用生成:方法与挑战
- 利用大语言模型在Neo4j中构建用于图RAG应用的知识图谱
- 解析LangGraph中的状态、状态图和工作流
- RAG架构综述:探寻最适配RAG方案
2025-05-14
- Qwen3技术报告的几点细节、ArXiv论文翻译实现方案及试错历程
- 今日开源(2025-05-14):UnifiedReward,7B多模态统一奖励模型,链式思维评估,支持视觉理解与生成任务对齐
- Ruby on Rails 之父 DHH 预言:未来“写代码”会变成不合时宜的念头!
- 完全开源的7B模型,性能比肩主流LLM,训练成本仅16万美元,复现DeepSeek的强化学习!
- 刚刚,“Transformer八子”之一创业团队提出“连续思维机器”:如人类推理般可解释,还能涌现新能力
- 知名学者发表论文,质疑2024年诺贝尔化学奖“不够格”
- Sam Altman最新对谈实录:OpenAI的AI平台商业终局猜想
- 美国对华AI芯片政策大变局:从废除《AI扩散规则》到封杀华为昇腾
- 行业落地分享:WPS AI 一键生成PPT
- RAG系统设计:揭秘语义搜索被低估的核心价值与KG驱动的架构选型策略
- 微软华人AI团队核心成员被曝加入腾讯混元,知情人称与裁员无关|独家
- 微软再次裁员:18 年老员工、10 倍 TypeScript 性能提升幕后功臣也一并优化了
- 仅需1秒生成药物分子,性能与FDA批准药物相当,生成式AI方法DiffSMol登Nature子刊
- 人工智能驱动肺部3D重建,重新评估智能的手术设计
- 用好 Jupyter Notebook,这些你可能都没做到
- “你算什么东西”,大学教授辱骂学生?本人回应!
- “体面的牛马”:中国高校教师生存图像
- 黄晓明、金世佳进博士复试
- 25岁MIT辍学天才一战成名!公司估值暴涨到90亿美金
- 国产大模型「五强争霸」,决战AGI!
- 华为&北大,强强联合!
- Python Matplotlib Cookbook(中文版来了)
- 2025年,大模型LLM还有哪些可研究的方向?
- 2025,大模型彻底爆了。。。
- AUTOSAR为何成为车企刚需?
- 腾讯出手了! 悄悄推出 AI 编程助手 CodeBuddy,开发者可以免费体验到国产 Cursor 了!
- 职场这5件事,可以悄悄做,但一定不能说!
- Python特征选择的总结
- PyTorch常用代码段汇总
- NeurIPS干爆overleaf服务器,科研暂停,已老实!
- 超简单使用A2A和MCP开发DeepSearch和AgentRAG(含源码)
- Qwen3技术报告英中对照版.pdf
- 图解Vllm V1系列4:加载模型权重(load_model)
- Qwen3技术报告解读
- AI视觉产品落地难,背后的原因深度分析!
- 一手体验夸克刚上线的「深度搜索」,这才是高搜商AI的样子
- 大模型创新进入深水区,倒计时6天百度“文心杯”点燃 AI 产业突围
- 学会用工具看图:准确率碾压GPT-4.1,开源框架让模型拥有“视觉思维”
- 小米发布首个Reasoning模型MiMo:7B可超越o1-mini,从预训练到后训练挖掘推理潜力
- 推测解码的三条Scaling laws,让接受率和吞吐量翻倍
- 从100万次到100次:如何优化缺页中断的高频暴击?
- Qwen3技术报告重点:Qwen3如何强化推理能力?
- 复旦&腾讯优图提出基于扩散的情感说话头像生成方法DICE-Talk,可为说话的肖像生成生动多样的情感。
- 复旦开源Hallo:只需输入一段音频和一张照片就可以让人物说话。
- ComfyUI | 图案印花Logo迁移,连细节都给你照顾到位了!
- CVPR 2025 | 多实例扩散模型MIDI:可从单个图像创建高保真 3D 场景,模型&代码已开源。
- 算力破价!云平台卷服务卷价格,用户赢麻了
- 阿里Qwen3技术报告核心要点解读!
- 突破LLM的token限制:多块上下文保留的实用系统(含code)
2025-05-13
- 腾讯的Cursor–CodeBuddy深度评测-从代码生成到多文件协作生成的AI开发工具评测
- ContextGem文档结构化数据提取框架剖析及UniversalRAG路由多模态检索思路
- CNN+Transformer+Mamba,多热点联合=不撞车+高分保证√
- 代码公开,顶会拿捏!“全局特征+局部特征”强强联合,创新思路妙妙妙!
- 错过血亏!2025顶会超火方向:多模态目标检测发论文稳了!
- 一天连发两篇Nature正刊!谷歌医疗LLM杀疯了!
- 视觉新主干网络!
- TPAMI 2025 | MulFS-CAP:用于未配准红外 - 可见图像融合的多模态融合监督跨模态对齐感知方法
- 今日开源(2025-05-13):字节Seed1.5-VL视觉语言模型,20B活跃参数,38项SOTA,实现复杂推理与3D理解
- 万字追问:没有通用人工智能,人类会灭绝吗?
- 专业医生远不如AI模型?OpenAI推出医疗开源测试基准HealthBench,o3表现最强
- 一场百亿级的利益重塑:OpenAI要上市,微软这道坎怎么跨?
- 向Ⅰ型文明加速,“50年能源魔咒”正被破解 | 硬科技有点意思
- 5千段真实对话,262名医生参与,OpenAI开源基准测试HealthBench:评估LLM对医疗的作用
- 面向抗体-抗原复合物结构预测,AI增强的物理对接来了
- unsloth 微调 Qwen3 实战教程来了!
- 新书《百面大模型》出版了!
- 【Python】这些Python可视化工具画图真的好看,强烈推荐!
- 【Python】2025 最新出炉!15 个 Python 库带你飞
- 直接在Excel中用Python Matplotlib/Seaborn……
- R可视化教程从0到1
- 终于有人把Attention机制讲明白了~
- Deepseek AI Agent+自动化开发实战
- Matlab——数据大佬的秘密武器?
- 因AI裁员2000+人、停招一年多后,那位曾高喊「AI能接管一切」的CEO后悔了:宣布重启人工招聘!
- 这个新出的 CSS 函数,一下子干掉了我一半的 JavaScript 代码!
- 逃离VMware!博通强推订阅惹众怒,16年老用户:2200台虚拟机已在迁移中
- 传统编程 VS「Vibe 编程」:你写代码的工作,可能已经没了
- 2025时间序列都有哪些创新点可做——总结篇
- PyCharm+Docker:打造最舒适的深度学习炼丹炉
- 知乎热议 | 清华姚班开设马上 20 年了,为什么没出巨擘?
- 从字节、百川、Bespoke Labs 3个大模型项目,看RL驱动下的Agent技术趋势
- 图解Vllm V1系列3:KV Cache初始化
- 2025年了,还在问为什么大模型都用decoder only?
- 2万字长文,YOLOv1-YOLOv11的十年全面进化综述!(建议收藏)
- 低空AI目标检测巡检,零样本单类识别,算法精度会更高么?
- 第二届「兴智杯」全国人工智能创新应用大赛线上报名开启!
- 字节Seed团队发布Seed1.5-VL,用仅20B活跃参数在60个主流测试中狂揽38项第一!
- Learning from peers!让LRM互相「传纸条」的新协作方式大幅提高准确率和效率
- NIPS2025/EMNLP2025投稿进群啦!互通有无~
- 如何微调推理大模型?以Qwen3/DeepSeek-R1为例
- 3D人脸黑科技!Pixel3DMM:单张RGB图像秒变3D人脸,姿势表情精准还原,几何精度碾压竞品15%!
- ComfyUI | 字节DreamFit: 多主题电商服装迁移!轻量级即插即用任意服装模特匹配
- IC-Light升级,支持视频重打光! RelightVid可在多视频场景中重照明,支持文本提示、背景视频和HDR输入!
- TripoSG:一键使用AI在数秒内生成3D设计,支持文本/图像/涂鸦等多种方式,引领3D生成潮流!
- 为什么 GRPO 容易出现 reward 崩塌?
- 面完小红书大模型算法岗,心态崩了。。。
- 211本硕二战腾讯大模型算法岗,草草结束。。。
- 深入剖析 GraphRAG 的工作原理:步步拆解
2025-05-12
- 技术总结:25个大模型推理引擎对比及多模态推理大模型实现梳理
- VS Code 14 个神级扩展,提高生产力!
- 25岁当上985博导,冯磊现任东南大学教授!
- 想学SVD(奇异值分解)算法?看这篇就够了
- 《Nature》突破强化学习困境: “Dreamer” 算法开启通用智能新篇章
- 今日开源(2025-05-12):字节开源Seed-Coder,8B代码大模型,自优化训练数据提升生成能力,推动代码智能生态发展
- 【源头活水】9年实现爱因斯坦级AGI?OpenAI科学家Dan Roberts谈强化学习扩展的未来
- 【他山之石】首篇MCP技术生态全面综述:核心组件、工作流程、生命周期
- Diffusion Policy: 将扩散模型加噪-去噪的看家本领用于生成机器人动作啦!
- 【源头活水】文生图进入R1时刻:港中文MMLab发布T2I-R1
- “由 AI 生成的代码,从诞生那一刻起就是「遗留代码」!”
- 让大脑膨胀16倍!革命性技术登上《自然》,看清神经元突触连接
- 红杉 AI 闭门峰会新共识:AI 不卖工具,卖的是收益
- 通过图片诊断皮疹?谷歌的人工智能工具比人类医生更擅长
- Google发布的69页提示词工程到底讲了什么
- ICLR 2025:LLMs能否理解时间序列异常?
- Science子刊 | 量化超10万条聚集数据,BIST训练AI研究蛋白质聚集
- 通过图片诊断皮疹?谷歌的人工智能工具比人类医生更擅长
- 墙裂推荐一个 Python 神库–Pydantic
- 为发期刊!高校学者安排学生实习,偷贩涉密数据,已被处理
- 最新!2025中国ESI大学排名(496所)
- 再砍一刀!英伟达或发布特供版H20
- 深入解析图神经网络注意力机制:数学原理与可视化实现
- 李开复加入福耀科技大学
- 全球效果最强视频生成模型诞生。。。
- 加速LLM大模型推理,KV缓存技术详解与PyTorch实现
- 火爆全网!《LLM书》.PDF
- 视觉Transformer精讲:ViT/DETR/SETR/CLIP等经典模型如何实现深度优化
- 在 C++ 平台上部署 PyTorch 模型流程+踩坑实录
- 快手二面拷打:训练100B模型要多少显存?
- 知乎热议 | 清华姚班开设马上 20 年了,为什么没出巨擘?
- DeepSeek-GRM: Inferene-time Scaling的通用奖励模型(GRM)
- 为什么训大模型都不用dropout
- 初稿抢先看!13家单位共同起草全国首部AI大模型私有化部署标准
- 一文彻底看懂大模型MCP原理及应用
- AI大模型年度发展趋势报告
- 燃爆2025开源之夏|飞桨开源社区向全网开发者发出挑战!
- AI如何看懂足球?上海交大团队打造Multi-Agent系统,全面解析“美丽足球”!
- 会解题不等于懂人心,腾讯混元提出Sentient Agent,提高高阶社交认知能力
- AI人才黄金时代:零门槛进入大模型行业指南
- 推理模型越来越强,大模型微调还有必要吗?
- 在多模态的浪潮之巅,如何“精雕细琢”图文对齐?
- 200M参数吊打商业巨头!浙大-哈佛开源ICEdit,用1%资源实现图像编辑自由!一句指令生成海报级修图方案。
- 太强了!浙大联合上海AI Lab提出视觉统一Diffusion架构DICEPTION!各种视觉任务一网打尽!
- 月之暗面开源音频模型Kimi-Audio,从「语音转文字」到「读心对话」,让AI听懂人类 “弦外之音”!
- 如何使用DeepSeek进行科研图表绘制?
- 阿里面试官问:LLM 和搜广推都有 MoE,请问区别在哪里?
- 试官MoE模型的专家个数是如何决定的?
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- deepseek r1 开源100天,开源社区的所有努力梳理~
- 瓦力算法5月第2周急招岗位| / 微软 / 阿里 / 萤石 / VIVO / 图灵量子 / KEEP / 腾讯云智 / 东风汽车
- 探索RAG数据分块策略:工具对比与实践指南(含code)
2025-05-11
- 饶毅:协和应立即停止招收海外华人、国内出国读本科再马上回来读协和的生源;十到二十年内停招海外本科生
- 英伟达SAMEO革新无模态分割 | SAM灵活适配+30万合成数据,零样本性能登顶COCOA-cls
- 科学家拍下单个原子的“社交图鉴”,开启量子现象可视化新纪元
- 哈佛新论文揭示 Transformer 模型与人脑“同步纠结”全过程!AI也会犹豫、反悔?
- 深度学习之父、图灵奖得主Bengio:三年前的ChatGPT让我觉得人类无法掌控AI,希望通过“科学家AI”把模型彻底装在笼子里
- 「ChatGPT+GitHub」,OpenAI搞了个大联合
- 无监督ML研究微生物稀有生物圈,一个智能丰度划分软件,已开源
- “我的院长父亲,本科生发14篇SCI论文”通报来了:存在学术不端、免去其父亲研究生院副院长职务
- PaperCoder:一种利用大型语言模型自动生成机器学习论文代码的框架
- Cursor保姆级实战
- 2025年,如何选择合适的Python版本?
- RLHF 实践:原理、代码、踩坑以及解决方案
- “我的院长父亲,本科生发14篇SCI论文”通报来了:存在学术不端、免去其父亲研究生院副院长职务
- CVPR 2025 | 突破注意力机制!vHeat:基于热传导的视觉表征模型
- 医学图像数据读取及预处理方法总结
- AI项目部署必备,Docker 万字实战教程:从入门到掌握!
- 如何让 SAM 看懂 “看不见” 的区域,SAMEO 零样本识别给出了答案!
- 字节Seed新方法!开源8B代码模型:自己筛数据训练自己,同量级SoTA,还能超越百亿级对手
- 无需训练!让VLM同时具备「视觉」与「推理」能力,数学题得分暴涨30%
- mmap是如何巧妙绕过传统IO性能陷阱的?
- ICLR2025 | 同济提出无需训练的肖像动画框架FaceShot,让表情包、动漫人物、玩具等“开口说话”
- CVPR 2025 Highlight | 清华提出一键式视频扩散模型VideoScene,从视频到 3D 的桥梁,一步到位!
- Qwen3发布,再次登顶全球大模型开源王座,再见DeepSeek。
- AI 艺术工具通讯
- 字节提出高效文生图新框架FlowTok,可实现文本和图像无缝衔接比,比PixArt 快3倍!
- 重磅突破!只需一张图,一键生成沉浸式4D全景世界!HoloTime重塑VR/AR体验(北大等)
- 阿里EMO2重磅升级!手部动作生成+超逼真表情,音频驱动人像视频生成再进化!
- 一文了解:大模型 Agent 开发框架有哪些?它们的区别是什么?
2025-05-10
- 【源头活水】大模型设计迎“伽利略时刻”,Meta华人研究员提出轻量级结构Canon层,提升模型推理深度和广度
- CVPR 2025 满分论文|收敛速度提升21倍!VA-VAE:重建 vs. 生成,解决 LDM 的优化困境
- 图灵奖得主杨立昆万字实录:AI Agent要实现真智能,必须摆脱“Token游戏”
- 九名学者万字追问:为什么神经科学没能在AI热潮中发展出大模型?
- 博士生唯一第一作者,历时6年,华东师大最新Nature:挑战假说,定位生命起源
- 多智能体系统的标准化问题,A2A 与 MCP 集成的优势与困境
- 1.53毫秒预判药性,香港理工、川大、鹏城实验室发布「AI分子透镜」GraphATC
- 国际科学智能联盟在北京成立
- 新一届院士名单,公布
- 15万学术引用量,顶尖科学家Rob Fergus重掌FAIR
- JAMA复现|展示32篇纳入研究的临床实践指南在 NEATS评分中的表现!
- 太全了!视觉领域所有的图像特征及其提取方法!
- 一文梳理水下目标检测方法
- 用Qwen3+MCPs实现AI自动发布小红书笔记!支持图文和视频
- 「消失的」Ilya Sutskever
- 图解Vllm V1系列2:Executor-Workers架构
- 左右手互搏之术CK-PLUG:在RAG中如何更加精准调控LLM对于模型内部知识跟外部检索知识的依赖?
- 5年了,它依旧是最值得用来入门深度学习神经网络的书!!!
- 迈过它才是真正的AGI之路:NUS/NTU联合发布通用基准,700种任务、325k道题
- 弹性Reasoning!通过控制预算和RL达到更短、更快、更强
- 新国立(NUS)计算机系AI方向招生-全奖/带薪-博后博士访问学生intern RA等 – Dr. Yatao Bian
- OpenAI API JSON格式指南与json_repair错误修复
- AI Infra—如何从LLM training 转Inference
2025-05-09
- Agent的下半场?Agent互联网基础设施ACP协议的愿景及设计思路
- 今日开源(2025-05-09):港中文T2I-R1,文本到图像生成新范式,BiCoT-GRPO强化学习优化语义级链式思维推理
- 【源头活水】NYU教授开炮:美国大学ML课太离谱!学生炮轰课程垃圾,全靠自学
- 【他山之石】上科大校友研发小推理模型,成本相比降低99.6%,证明低秩自适应技术强大能力
- 颠覆谷歌搜索API,成本降至88%,阿里开源RL框架ZeroSearch,重新定义AI搜索!
- 图像提供身份,文本定义一切!腾讯开源多模态视频定制工具HunyuanCustom
- 美国AI现状:“领先但不稳固” ——解读Sam Altman等科技领袖在参议院听证会的关键见解
- 谷歌:人工智能的重要趋势:回顾、现状与未来展望
- 深度学习之父、图灵奖得主Bengio:三年前的ChatGPT让我觉得人类无法掌控AI,希望通过“科学家AI”把模型彻底装在笼子里
- 深度长文|AI大模型的“侦探”与“罪犯”:一场关于学习效率的意外揭秘
- 拜拜,昂贵的谷歌搜索 API!阿里开源 RL 框架让大模型自给自足、成本直降88%,网友:游戏规则变了
- 让 PostgreSQL 更契合Agent、氛围编程!成立四年、微软投资,这家开源数据库公司终10亿美元卖身Databricks
- 全球首款AI生成多人游戏诞生,全部开源,单机可玩,成本不到1500美元
- 文生图进入R1时刻:港中文MMLab发布T2I-R1
- 在人流如织的大街小巷,这家公司的机器人正跑着自己的「马拉松」
- KuaiMod来了!快手用大模型重构短视频生态格局
- 「ChatGPT+GitHub」,OpenAI搞了个大联合
- 手机、PC更强大脑来了!联想个人超级智能体,开始觉醒L3级智能水平
- 一张照片、一句简单提示词,就被ChatGPT人肉开盒,深度解析o3隐私漏洞
- 仅需1个数据,就能让大模型的数学推理性能大大增强?
- 直接推荐肝纤维化治疗药物?谷歌AI co-scientist医学验证实例出炉
- NUS推出智能医疗平台CURATE.AI,实现癌症治疗剂量的个性化
- 被学生论文气哭的大学老师:我可能是全网第一个
- 全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍
- 2024国自然青年基金A类获得者履历介绍
- 4W字,最强 Matplotlib 实操指南!
- 21世纪被引量最多论文
- 这类物种组织heatmap有点东西!
- Transformer原作、斯坦福、清华交大三篇论文共识:基座模型边界锁死RL能力上限
- 饶毅:协和应立即停止招收海外华人、国内出国读本科再马上回来读协和的生源;十到二十年内停招海外本科生
- 陶哲轩:感谢 ChatGPT,4 小时独立完成了一个开源项目
- Deepseek应用指南:自媒体/电商/教育/开发/法律/本地生活等
- 开源AI引爆热潮!GOSIM AI Paris 2025首日直击:80+位技术大咖聊模型、拼算力、秀落地
- 五一期间凭啥高枕无忧?全靠这几个数据库备份shell脚本~
- 月薪已炒到6W?强烈建议大家冲一冲这个新兴领域
- 注意力机制中的掩码详解
- Python特征选择的总结
- 我的书《百面大模型》出版了!
- 哈工深发布多模态Reasoning大模型综述:感知、推理、思考和规划
- SIGIR 2025|打造虚拟情感陪聊机器人新思路:利用个性化实时检索,大幅提升agent主动对话能力
- 清华提出ConCISE:简单有效,Reasoning过程砍掉一半,准确率不降!
- 从0 offer到50K*18薪,只做了这件事……
- 如何让 SAM 看懂 “看不见” 的区域,SAMEO 给出了答案。
- 月之暗面开源音频模型Kimi-Audio,从「语音转文字」到「读心对话」,让AI听懂人类 “弦外之音”!
- 图像编辑革命,万物皆可插入!浙大/哈佛/南洋理工提出Insert Anything,告别PS抠图,AI让世界无缝生长。
- AI编程神器Cursor,保姆级教程来了!
- 发型对狮子的重要性:用AI给狮子换发型,最后一张实在太魔性了
- 【智谷学院】AIGC智谷学院致力于构建一个全面的AI学习平台
- 【AIGC趋势】苹果谷歌“闹分手”?iPhone搜索或转投AI,高管揭秘
- 【AIGC应用】国产操作系统重大突破!关键功能与技术揭秘
- 【行业动态】商汤万象跻身国内AI大模型解决方案市场第二,从MCP到超级Agent
- 超过谷歌搜索,成本猛降80%!阿里开源创新大模型搜索引擎
- 解密NVIDIA团队的代理式AI技术实践
- 刚刚,ChatGPT的深度研究可以连接GitHub了!网友:这是真·RAG
- AI开源社区来了国家队!华为百度第一时间加入
- 国内大模型人才大战打响!大厂各出奇招,薪资不设上限、CTO亲自参与指导、无需实习经验
- 面壁CEO李大海:物理世界要实现AGI,一定是通过端侧智能 | 中国AIGC产业峰会
- 顶尖科学家Rob Fergus重掌FAIR,15万引用学者回归Meta,战略转向AGI
- 鹅厂开源视频生成大杀器!参考图主体精准复刻,还能编辑现有视频
- Mistral发新模型自称「SOTA」,却被网友疯狂追问:怎么不敢和千问比?
- Grok 3.5 或今晚发布,超强基准测试疑似流出
2025-05-08
- 如何用知识图谱+医疗问答对合成推理数据?兼看Deep Research的两个复刻实现拆解
- 今日开源(2025-05-08):Voila语音语言大模型,分层Transformer架构实现195ms实时交互,支持个性化互动
- AI不靠“闭门造神”,海内外一线专家共探智能新纪元,GOSIM AI Paris 2025圆满收官!
- 智酷 421 期 | 从“地心说”到“日心说”,智能体在21世纪科学范式转变中的核心地位
- Nature里程碑成果:重新定义了科学界对学习方式的理解
- OpenAI迎来新帅,Instacart CEO 空降执掌应用部门,奥特曼将专注三大支柱
- 万字长文解密智能体互联之路:MCP、ACP、A2A与ANP标准协议通览与跨平台互操作性探究
- LLM智能体互操作性协议全解析:MCP、ACP、A2A与ANP
- Mistral 拿出杀手锏叫阵 DeepSeek!性价比卷出天际、开源模型却断供,社区粉丝失望透顶
- 全球最流行 MCP 应用市场,来自一位中国独立开发者
- 在财务·客服·营销领域,大模型如何驱动业务提效?| AICon 直播
- 绝对零监督Absolute Zero:类AlphaZero自博弈赋能大模型推理,全新零数据训练范式问世
- 原来,AI也有「搜商」高低的差别?
- 2025年第二届「兴智杯」全国人工智能创新应用大赛正式启动,线上报名开启
- 时隔两月,Mistral AI终于上新Medium 3,近期还有「One more thing」
- ICML 2025 | 清华、上海AI Lab等提出傅里叶位置编码,多项任务远超RoPE
- AI的手终于伸向凝胶电泳了!爱丁堡大学发布电泳图像分析框架GelGenie
- 误差远低于传统模型,首尔大学新微调模型助力材料设计
- 彻底悟了!Python 循环
- 替代Windows!华为鸿蒙PC发布:中国人自己的电脑来了
- 【Python】Python中同步&异步编程原来是这样!附代码案例
- 全面盘点,国内外大模型现状!
- 导师放养,偷偷发了顶会。。。
- 8/8/7分被NeurIPS拒稿,谢赛宁大神读博投的首篇论文,10年后获AISTATS 2025时间检验奖
- 全球首个,DeepSeek-R1 在H100 上性能提升26倍
- 实测,大模型 LaTeX 公式识别,出乎预料
- 简单Circos实现
- 论文er最爱的即插即用模块,我整理了2025最新适配版,直接拖进代码涨点
- 小米决定:改名!
- 陶哲轩:感谢 ChatGPT,4 小时独立完成了一个开源项目
- Deepseek喂饭指令大全:内容创作/知识付费/编程开发/生活效率等
- 嵌入式开发新机遇……
- “闭源”13个月后,Redis再开源!开发者怒了:一回生二回熟,真当我们忘了?
- 在移动端别再用 100vh 了!试试这些全新的 CSS 单位
- 一个小改动,CNN输入固定尺寸图像改为任意尺寸图像
- 一文看懂工业视觉与计算机视觉的区别
- 猿辅导员工在公司猝死?曾被曝上厕所、吃饭都要报备
- 刚刚,OpenAI任命新CEO!
- 李宏毅:人工智能的微创手术 — 浅谈模型编辑
- DefMamba新型视觉模型,多尺度Backbone与Mamba,创新多任务视觉算法!(附论文及源码)
- 低空无人机,AI视觉巡检项目,到底怎么做?
- 2025智源大会InnoVibe学术新青年征集令,与AI前沿共振
- 青源会狮城再聚首,国际AI精英共探前沿发展
- 清华提出Absolute Zero:零数据训练Reasoning LLM!
- ICML2025 | 通过推测搜索加速LLM Reasoning能力,做到又快又好
- 字体控狂喜!Liblib AI 黑科技 RepText:无需理解文字,AI就能 1:1 复刻多国语言视觉效果。
- 142页深度解析:DeepSeek-R1的推理技术综述,AI的“思考”秘密大公开
- 港大&Adobe联合提出图像生成模型PixelFlow,可直接在原始像素空间中运行,无需VAE即可进行端到端训练。
- 英伟达提出最强「描述一切」模型 (DAM),可生成图像或视频特定区域的详细描述,拿下7个基准SOTA!
- 爆肝整理!推荐10个硬核工具箱,精选1000+实用AI网站,强烈建议收藏!
- OpenAI野心爆棚!启动全球版“星际之门”,首批10个国家
- Sam Altman晒投资5000亿美元“星际之门”最新进度
- 王炸!微软AI Agent支持A2A、MCP协议,智能体黄金时代降临
- 微软AI Genius训练营来啦!6场“理论+实战”课程,彻底点燃你的AI超能力
- Anthropic首次启动员工股票回购,估值615亿美元
- 突发!特朗普准备取消AI芯片出口限制
- AI 线下实战公开课(广州场)来啦!2.5小时 解锁 AI 大模型 MCP 开发核心技能
- 刚刚,OpenAI任命应用部门新CEO
- 1/8成本比肩Claude 3.7,Mistral Medium 3来了
- 开源即屠榜!UniME多模态框架登顶MMEB全球训练榜,刷新多项SOTA纪录
- Bye,英伟达!华为NPU,跑出了准万亿参数大模型
- 谷歌Gemini火力全开!实测:原生图像生成新升级确实强
- 仅看视频就能copy人类动作,宇树G1分分钟掌握100+,UC伯克利提出机器人训练新方式
- OpenAI神秘项目曝光:cderGPT,用AI加速药物评估
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 爆火智能体再进化,终端成为关键词:2026年端侧AI能力至少涨3倍
- 突破多模态奖励瓶颈!中科院清华快手联合提出R1-Reward,用强化学习赋予模型长期推理能力
- AI视频的DeepSeek时刻!开源13B模型生成提速30倍,5090跑出好莱坞特效
- WebThinker:一个边思考、边搜索、边写作的深度研究智能体
- RASA:LLM系统中实现智能体记忆的认知框架(含代码)
- MicroAgents 框架,如何实现 LLM 工具调用自由?(含代码)
- 揭开RAG评估的神秘面纱,让 RAG 评估不再困难(含代码)
- ASAP Thought—让推理模型“快如闪电,精准如专业”
2025-05-07
- YYDS,哈工大博士的pytorch笔记火了!!
- 也看Mem0^g引入Graph做Agent Memory管理实现原理及医药领域RAG技术总结
- 紧跟技术理论前沿、开源项目实现及行业落地案例:老刘说NLP技术社区持续对外纳新
- 重购时间序列模型预测客户行为
- 今日开源(2025-05-07):Llama-Nemotron,8B-253B参数全覆盖,优化内存效率,支持多语言与超长上下文
- AI 开发工具的隐形战场:新一轮 IDE 之争打响!
- 开源AI引爆热潮!GOSIM AI Paris 2025首日直击:80+位技术大咖聊模型、拼算力、秀落地
- 智源研究院发布中英文高质量数据集CCI4.0,推动全球人工智能开源创新
- OpenAI公司架构进化的一封信和争议
- 碾压Cursor?谷歌突发Gemini 2.5 Pro 预览版,编码能力全网第一
- 一个谷歌大神Jeff Dean的演讲,回顾LLM发展史,Transformer、蒸馏、MoE、思维链等技术
- MCP不是万灵药
- 行业落地分享:大模型在小红书推荐的应用(文末送书)
- 碾压Cursor?谷歌突发Gemini 2.5 Pro 预览版,编码能力全网第一
- AI 创业者演示视频被骂上 x 热榜,背后 YC 赶紧删帖!实名吐槽:YC 就是一堆 B2B 企业互相推销产品!
- 刚刚,Gemini 2.5 Pro升级,成编程模型新王
- ICML 2025 Spotlight|华为诺亚提出端侧大模型新架构MoLE,内存搬运代价降低1000倍
- 机器人界「Sora」来了!清华、星动纪元开源首个AIGC机器人大模型,入选ICML2025 Spotlight
- 搞不懂CUDA的人有救了,Devin开发商开源Kevin,强化学习生成CUDA内核
- OTC‑PO重磅发布 | 揭开 o3 神秘面纱,让 Agent 少用工具、多动脑子!
- 万字长文带你读懂强化学习,去中心化强化学习又能否实现?
- 北大、清华、UvA、CMU等联合发布:大模型逻辑推理能力最新综述
- ICML 2025 | 视频生成模型无损加速两倍,秘诀竟然是「抓住attention的时空稀疏性」
- Claude加速科学发现?Anthropic推出AI for Science计划
- 超低维降维技术助力复杂系统临界转变预警
- 停止这样使用 Python 字典!
- 饶毅:协和应立即停止招收海外华人、国内出国读本科再马上回来读协和的生源;十到二十年内停招海外本科生
- 52亿!“国字号”大学,新校区来了
- 刚刚,编程模型新王诞生
- 加速版 Pandas 库,一个字,快!
- 如何正确使用Cursor,12条建议
- ”云雨图“自由!
- 小米AI新秀MiMo出道即C位:7B小身板爆锤32B大佬!
- MCP创造者聊MCP的起源、架构优势和未来
- 思考:Qwen3是如何实现混合推理(快慢思考)的?
- Deepseek AI Agent+自动化开发实战
- “由 AI 生成的代码,从诞生那一刻起就是「遗留代码」!”
- “离职博主集体重回职场”:没有金刚钻,千万别裸辞!
- 太绝了!Transformer+图像处理,显著提升图像修复质量和效率!
- 全新注意力机制!Meta重磅新作MTA:多token注意力机制,性能暴涨!
- 知乎热议 | 前几周Deepseek都是神一般的存在,为啥热度消散得这么快?
- NVIDIA Llama-Nemotron 技术报告英中对照版.pdf
- 万字长文,AI项目算法部署应用实战教程(附源码)
- 活成笑话的AI四小龙,值得所有AI公司警惕的经验!
- 大模型发展史的核心论文汇总。
- 大厂JD对kaggle的明确要求
- 倒计时两周!百度“文心杯”创业大赛亿元奖金池等你来冲
- 聊聊MetaGPT中RAG模块如何集成Chromadb向量数据库
- 肖仰华教授力作《大模型浪潮》重磅来袭
- 新SoTA方法RM-R1:让reward model对评分说出原因!超越GPT4o
- 社交Agent: 通过RL学习自适应Thinking,根据场景在“秒回”和“深思”间灵活切换
- 低延迟、高吞吐,LLM优化与高效推理引擎综述
- 聊一聊Qwen3思考模式实现以及背后原理探讨
- 告别”纸片人”试衣!阿里&浙大提出3DV-TON,用3D几何骨架+动态纹理场,让虚拟模特”活”出真实衣褶!
- 谷歌研究院联手牛津大学推出Bolt3D!7秒内单GPU生成高保真3D,推理成本直降300倍!
- 如何使用DeepSeek进行科研图表绘制?
- 豆包新功能太逆天:一次性批量生图50张,风格统一效果稳定,免费不限次!
- 英伟达CEO黄仁勋:错失中国AI市场,是美国巨大损失
- 微软将大量AI功能、智能体集成在Windows11,全民AI时代来了
- 美国州政府生成式AI应用报告
- 苹果与Anthropic合作,开发AI编程助手
- 谷歌突发大招刷爆AI编程榜!网友:不用买Cursor了
- 首次系统评估Qwen3在后训练量化下的鲁棒性:8bit下仍保持近乎无损性能
- 黄仁勋放话:中国AI市场3年内达500亿美元!AI救了旧金山,整个世界急于与AI互动
- 免费!鹅厂最新3D生成模型火爆外网,CG导演都已经用上了
- 大模型AI应用,正在企业级赛道迅猛爆发
- 字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%
- 英伟达50系甜品卡发售日期定了!国内定价2499元
- 挑战AI数学推理极限!大规模形式化数学基准FormalMATH发布,最强模型成功率仅16%
- Hugging Face开源nanoVLM,750行代码可训练视觉语言模型,简单到令人发指!
- Gemini 2.5 Pro强势更新并霸榜,Claude 3.7首次遭遇全方位碾压!
- 给MCP加上RAG,工具准确率提升200%,起飞~
- LLM压缩技术全解析:让 AI 更 “瘦” 更快更智能
2025-05-06
- 公司深度报告自动生成company-research-agent框架及PP-DOCBEE文档大模型数据合成策略解析
- 使用万能细分框架实现客户细分模型
- 荣登《Science》正刊!物理信息深度学习取得新突破!
- 红嘴蓝鹊优化器算法(RBMO)及实现
- 打破Transformer霸权!全新液态神经网络刷爆SOTA!
- Lora微调LLAMA模型实战(含代码)
- 贝叶斯推断,深度学习的下一个风口!
- 顶刊神思路!融合Transformer与CNN做医学图像!!
- 今日开源(2025-05-06):Granite-4.0-Tiny,7B细粒度MoE指令模型,128k上下文,支持12种语言
- 大语言模型为何会“说谎”?6000字深度长文揭秘AI意识的萌芽
- 深度长文|AI Agent协议暗战:谁将定义万亿智能协作的底层法则?
- OpenAI宣布重大转型:调整公司架构,废除“利润上限”,转营利性公司为公益公司
- 脑启发学习综述:人工神经网络的下一场革命?
- 大脑如何创造新的记忆?《科学》论文为揭示大脑用于学习的新“规则
- 想学SVD(奇异值分解)算法?看这篇就够了
- 小白学大模型:降低幻觉的六种方法
- 马斯克 KO 奥特曼!一群前员工倒戈、各界组织助攻,OpenAI 认怂:世界变了,我们不改了!
- 多模态技术爆发元年,行业应用如何落地?
- 刚刚,OpenAI放弃营利性转型!奥特曼:非营利组织继续掌控,AGI造福全人类使命不变
- 陶哲轩:感谢ChatGPT,4小时独立完成了一个开源项目
- VDC+VBench双榜第一!强化学习打磨的国产视频大模型,超越Sora、Pika
- GPT-4o图像生成的「核燃料」找到了!万字长文拆解潜在变量,网友:原来AI在另一个维度作画
- ICML 2025 | 注意力机制中的极大值:破解大语言模型上下文理解的关键
- 公开模型一切,优于DeepSeek-R1,英伟达开源Llama-Nemotron家族
- 微软正式开源UFO²,Windows桌面迈入「AgentOS 时代」
- 训练 AI 医生助理,以像素级精度解释 ECG 图像
- 单任务处理周期缩短至30分钟以内,科学计算智能体平台GaliLeo开放内测
- 使用 Plotly 创建 60+ 令人惊叹的交互式图表、地图
- SGLang放大招,DeepSeek V3、R1 部署性能和成本双重突破
- 使用 PD 分解和大规模专家并行在 96 个 H100 GPU 上部署 DeepSeek
- 在CV界,传统卷积已经彻底输给Transformer了吗?
- 985高校博士情侣致谢:我俩每月补贴600元,在一线城市生活5年
- 李宏毅:大型语言模型的推理过程不必过长,够用即可
- 月薪已炒到6W?强烈建议大家冲一冲这个新兴领域!
- 快手大模型面试拷打:训练100B模型要多少显存?
- 做数据竞赛和数据项目快人百倍的方法。
- 线上/线下赛任务全流程培训来啦!智能汽车竞赛百度智慧交通组
- NVIDIA发布最强开源模型,效果和速度全面超越DeepSeek R1
- 以星为舵:LLM的Post-Train与Test-Time奖励学习综述
- TreeHop:无需LLM的高效多跳问答新范式
- 10 种最新的思维链(Chain-of-Thought, CoT)增强方法
- 英伟达提出最强「描述一切」模型 (DAM),可生成图像或视频特定区域的详细描述,拿下7个基准SOTA!
- FramePack-F1:敏神全新算法重大更新!低显存ComfyUI可体验长视频生成
- 南洋理工 & 牛津 & 新加坡理工提出Amodal3R,可从遮挡 2D 图像重建完整 3D 资产,3D生成也卷起来了!
- 开源项目FastAPI-MCP,一键将FastAPI转换成MCP服务器,以后API=MCP。
- 字节推荐算法暑期实习一面面经
- DeepSeek隐藏技巧,一句话直接导出Excel表格,自动搞定Word排版
- OpenAI大变革!继续与微软等,以非营利模式冲击AGI
- 突破瓶颈,嵌入式AI神经持续学习引擎—Replay4NCL
- AI可观测行平台Lightrun,获7000万美元
- 刚刚,OpenAI公司结构重大调整:继续由非营利实体控制,营利性部门要变公益公司
- 三位北大校友突破65年数学难题!证明126维空间“末日假说”,为母校126周年献贺
- 被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑
- 大模型集体“挂科”!全新中文网页检索测试:GPT-4o准确率仅6.2%
- 突发!曝阿里通义薄列峰离职,此前为应用视觉团队负责人
- 瑞莱智慧CEO:大模型形成强生产力关键在把智能体组织起来,安全可控是核心前置门槛 | 中国AIGC产业峰会
- 突发!OpenAI 宣布重大调整:非营利组织将继续永久控制公司!
- 1秒转录1小时音频,英伟达重磅开源语音识别最强模型Parakeet!
- DeepSeek-R1发布100天后:全面复盘推理大模型复现研究及未来!
- RAG 中的语义分块:实现更优的上下文检索
2025-05-05
- 大模型微调、强化数据合成开源代表项目解析及DeepSeek-R1发布100天后的复刻总结
- CVPR 2025 | OverLoCK 性能太惊艳
- 民科: 预测一下未来五年大模型的架构?
- 【源头活水】AI教父Hinton警告:有志于编程,不必读大学!
- 【他山之石】卷积也能玩转自注意力?韩国团队用13×13大核卷积实现超分辨率性能突破!
- Nature意识之争:两大理论首次正面对决
- 逐步理解 Transformers 的数学原理
- 图灵奖得主:AI能力每7个月翻倍,出现自我保护意识—— Yoshua Bengio谈如何构建安全而不反噬人类的AI
- 谷歌DeepMind:大模型也很任性,知道最优路径偏要撞南墙
- 名校硕士AI造假面试现场“社死”!差点蒙混过关,因一个基本错误被识破,面试官:软件圈很小,好自为之
- 8/8/7分被NeurIPS拒稿,谢赛宁读博投的首篇论文,10年后获AISTATS 2025时间检验奖
- 谷歌DeepMind:大模型也很任性,知道最优路径偏要撞南墙
- 成熟的编程智能体,已经学会升级自己的系统了
- 边学边练,推理觉醒:LUFFY让强化学习即学即用!
- AI提供生长分析,适用于作物育种的计算机视觉
- 高质量3D分子生成,西安电子科技大学开发用于分子设计的AI模型
- 被指浪费学历:北大博士入职民办高校,本人回应,年收入35万左右,并不后悔这个选择
- 【Python】拿来即用!9 个科研论文配图完整代码
- AI引爆全球失业潮,毕业即失业!各大厂裁员人数上万
- 博士生发表了9篇论文,告诉你:写作真的有窍门。
- AI 历史上的 10 个关键时刻!
- 3招让AI生成代码效率飙升!
- 快手二面拷打:训练100B模型要多少显存?
- C++版OpenCV里的机器学习
- 大规模模型推出后,计算机会是下一个土木吗?
- 阿里年终奖开奖了
- 基于YOLO的边缘设备,剪枝量化部署流程实战讲解!
- Qwen3大模型是如何实现混合推理的(快慢思考)?
- 写论文的“神仙伴侣”!最新最全100+的机器学习深度学习论文画图模型PPT再更新!星标14.9K!
- AI界新王炸,输入提示词秒变PS大神?阶跃星辰开源图像编辑模型Step1X-Edit:19B参数对标GPT-4o。
- GitHub高星精选!十大MCP开源项目,让AI开发效率翻倍!
- 复旦大学提出GenPTW!AIGC水印技术新标杆!
- o3一张图锁定地球表面坐标,AI看图猜地点战胜人类大师,奥特曼:这是我的「直升机」时刻
- 细节直逼亚毫米级!港科广分层建模突破3D人体生成|CVPR 2025
- DeepSeek遭Anthropic联合创始人打脸:有点夸大,且落后美国6-8个月!
- 从零到一:AI Agent 模式学习
- 一篇多模态大模型推理技术最新综述
- Agentic RAG:构建能理解、决策和行动的人工智能
- ReaRAG:教 AI 思考、搜索和自我纠正以获得事实准确答案(含git实现)
2025-05-04
- 如何估算大模型推理及微调的GPU显存需求?影响因素、计算规则及注意事项
- 数学大统一梦想:朗兹兰纲领几何部分核心突破
- 微软AI CEO万字访谈实录:AI算力的两个趋势正在同时发生
- OpenAI发长文自曝家丑:搞砸了GPT-4o更新,模型“拍马屁”复盘与总结
- Nature综述:大规模神经形态计算
- 巴菲特年底退休,63岁高管接班,已囤2.5万亿现金;黄仁勋十年首涨基本工资;爱上ChatGPT,女子结婚20年后要离婚|AI周报
- 谷歌NotebookLM终于说中文了!这可是最火的大模型播客产品
- DeepSeek开源的文件系统,是如何提升大模型效率的?
- CVPR 2025 Oral | DiffFNO:傅里叶神经算子助力扩散,开启任意尺度超分辨率新篇章
- 大模型推理上限再突破:「自适应难易度蒸馏」超越R1蒸馏,长CoT语料质量飞升
- 大学导师开会带塑料袋给学生打包茶歇,师兄:导,下回记得用黑色袋子…
- 在线教程丨ControlNet 作者开源新作!低门槛生成长视频,FramePack 革新视频生成
- 强化学习算法梳理:从 PPO 到 GRPO 再到 DAPO
- 突发!TikTok 被罚款 43.6 亿
- 讲透一个强大算法模型,Transformer!!
- ICML 2025 放榜!接收率26.9%!好评论文被拒,审稿人敷衍,遭全网吐槽。。
- 工业视觉缺陷检测的算法总结
- 在研究所工作是怎样的体验?
- Transformer原作、斯坦福、清华交大三篇论文共识:基座模型边界锁死RL能力上限
- David Silver、Richard S. Sutton:欢迎进入经验时代
- 知识工场实验室毕业生陈江捷博士荣获2024年度上海市计算机学会优秀博士学位论文提名奖
- 2年就过气!ChatGPT催生的百万年薪岗位,大厂不愿意招了
- 3B模型逆袭7B巨头!Video-XL-Pro突破长视频理解极限,大海捞针准确率超98%
2025-05-03
- 也看大模型排行榜Chatbot Arena的评估结论及MiMo-7B推理大模型实现思路
- Mamba杀入遥感图像!11个全开源idea,助你无痛发顶刊!
- 创新耐打!时间序列+聚类这么做,顶会稳了!
- 量子力学不应止步于随机性——2025基础物理学特别突破奖得主’t Hooft访谈
- 微软CEO和奥特曼失了和,OpenAI被“断粮”
- 人工智能二位教父共同探讨人类水平人工智能的潜力、新兴风险和未来
- 神经科学中的人工智能鸟瞰视角
- OpenAI 黑科技 Deep Research 诞生记:一个工程师的“不务正业”如何改变 AI 战争格局
- i人如何在学术会议有效社交?滑铁卢大学教授Gautam Kamath亲授心得
- 315 行代码构建编程助手,Go大佬揭开智能体的「神秘面纱」
- 阿里云通义点金发布DianJin-R1金融领域推理大模型,32B模型荣膺榜首
- CVPR 2025 | 如何稳定且高效地生成个性化的多人图像?ID-Patch带来新解法
- 性能优于AF3?免费AI在线服务器,对蛋白质结构模型进行预测和质量评估
- Qwen3 果真拉垮了吗?实测
- DeepSeek-R1+V3左脚踩右脚=又快又好的DeepSeek-R1T-Chimera
- 李开复加入福建福耀科技大学
- CV同学也来评评!董小姐博士论文全网最专业拆解,不撤销学位,学术正义何在!
- 清华出手,挖走美国顶尖AI研究者!前DeepMind大佬被抄底,美国人才倒流中国
- GPU图像处理的基本流程
- 从DeepSeek->Kimi->豆包->Qwen3,看Reasoning model之路
- 聊聊智能体框架MetaGPT是如何实现RAG Reranker重排序
- 大模型终于通关《宝可梦蓝》!网友:Gemini 2.5 Pro酷爆了
- OpenAI最新技术报告:GPT-4o变谄媚的原因万万没想到
- 用多模态LLM超越YOLOv3!强化学习突破多模态感知极限|开源
- Vibe Coder 之死
- Agentic RAG-R1:让大模型从「检索助手」跃升为「思考+搜索王者」!
2025-05-02
- 图灵奖得主杨立昆:语言不是思维的核心,人类大部分思维活动和语言无关
- 数学和物理学是如何相互启发、共同推动科学进步的?
- 机器人最强出海竟然是这四类?最后一种你绝对想不到
- “光靠人盯不住了”!拆解上万张晶圆,这家公司靠AI将芯片良率提升数个百分点
- ICML 2025放榜!接收率26.9%,高分被拒,低分录用惹争议
- LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能
- 浙大&港理工等提出InfiGUI-R1:利用强化学习,让GUI智能体学会规划任务、反思错误
- Sebastian Raschka 新书《从头开始推理》抢先看,揭秘推理模型基础
- 深夜突袭,DeepSeek-Prover-V2加冕数学王者!671B数学推理逆天狂飙
- 【Python】海量Python、R可视化Gallery
- ICML 2025录用结果公布!高分被拒,引全网怒喷
- 阿里年终奖开奖了
- 多模态干翻天了
- 董某莹的博士学位论文曝光!
- 这17 种方法让 PyTorch 训练速度更快!
- Github下载慢解决了!「100%有效」
- C# 中使用 OpenCV
- DeepSeek-Prover-V2 技术报告英中对照版.pdf
- Qwen3如何实现快慢混合思考、可启动关闭
- DeepSeek-R1发布后的100天复现之旅方法总结
- Reasoning的最终答案可能不是模型想要的答案!
- 五一大瓜!英伟达强烈批评Anthropic,造谣中国走私AI芯片
- 太狠了!为了锁死DeepSeek,Anthropic要求加大AI芯片出口管制
- 中科院开源PPT Agent,一键自动生成PPT智能体
- 微软CEO和奥特曼失了和,OpenAI被“断粮”
- Claude网页版接入MCP!10款应用一键调用,开发者30分钟可创建新集成
- 68页论文再锤大模型竞技场!Llama4发布前私下测试27个版本,只取最佳成绩
- Claude深夜更新!DeepResearch+MCP入侵你的私人数据,威力很大!
- TreeHop:无需大语言模型的高效多跳问答新范式
2025-05-01
- “为什么人工智能不可能有意识”
- AI未来发展受两大因素限制|扎克伯格万字访谈实录
- 意识:A beautiful loop:实现AGI的条件及证据(知道自己知道的计算模型及大量证据)
- 国际聚变工程ITER完成全球最强脉冲磁磁体系统,多国合作突破能源瓶颈
- 大模型顶级排行榜被指系统性“造假”,官方紧急回应
- 大模型从“胡说八道”升级为“超级舔狗”,网友:再进化就该上班了
- DeepSeek开源Prover-V2强推理模型,网友:奥数从没这么简单过
- 被Transformer光芒掩盖的论文,Meta科学家回顾十年前创新之作
- CVPR 2025 | CV 微调卷出天际,Mona:我小、我强、我省资源
- 后训练时代如何延续Scaling Law?这是你该读的LLM后训练综述
- ScienceOne正式发布:基于科学基础大模型的智能科研平台
- “双一流”大学,牵手华为!
- 刚刚!DeepSeek-Prover-V2 技术细节公布,附论文
- GitHub 仓库的免费百科全书,加上MCP 如虎添翼
- 阿里年终奖开奖了
- 全网最火的AI提示词,让刘强东和王兴成了“兄弟”(含教程)
- 2025美国科学院院士出炉!屠呦呦Bengio当选外籍院士,中科大校友领衔
- CVPR 2025 | CV 微调卷出天际,Mona:我小、我强、我省资源
- 董某莹的博士学位论文曝光!
- 图解Vllm V1系列1:整体流程
- Kimi-Audio技术报告英中对照版.pdf
- 体积大、算得慢,如何推的快?LLM高效推理服务最新最全综述!
- 直播预约 | Test time scaling 综述! 从what, how, where 和how well帮你系统解构!
- PD分离也有问题?semi-PD降低两倍延时,增加一半吞吐!
- 关于生产级RAG系统构建的一些经验总结
- 小米入局大模型赛道!开源MiMo-7B,性能超o1-mini
- DeepSeek开源最新大模型,数学能力大突破!
- 显存暴降50%!阿里开源旗舰多模态模型,GPU救星来了
- 上海车展见证历史:从「西为中用」到「中为西用」,行业风向标携手Momenta
- 又一开源AI神器!将机器学习论文自动转为可运行代码库
- 一次示范就能终身掌握!让手机AI轻松搞定复杂操作丨浙大&vivo出品
- DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能
- 招聘|量子位智库AI分析师
- 大爆发:Qwen、DeepSeek、小米组团开源最新推理大模型
2025-04-30
- 今日开源(2025-04-30):GeoGPT,地球科学专用大模型,Llama3/Qwen2.5双路线优化,70B/72B参数
- 突发(2025-04-30):DeepSeek-Prover-V2-671B 发布,专精于数学定理证明
- 对话朱松纯:Agent喧嚣之上,“走心”才是AGI的未来?
- 扎克伯格最新专访:AI 会在知识工作和编程领域,引发一场巨大的革命
- 对话朱松纯:Agent喧嚣之上,“走心”才是AGI的未来?
- 警惕大脑数据被出售和滥用:立法者呼吁规范脑机接口技术
- 一文学习264页 Agent 综述,MetaGPT、Mila、斯坦福、耶鲁、谷歌半年共同撰写
- 技术祛魅帖:一文看懂LLM / 智能体 / 工作流 和 MCP (文末送复旦大模型教材)
- 阿里最新开源模型Qwen3到底能不能打?不妨上「通义App」亲自试试
- 全网首测! Qwen3 vs Deepseek-R1 数据分析哪家强?
- 英特尔 CEO 陈立武:18A 制程节点已进入风险试产阶段,14A 节点即将推出
- 刚刚!OpenAI回滚了最新版本的GPT-4o,因ChatGPT「过于谄媚」
- 只花9美元,推理能力暴涨20%!小模型Tina震撼登场,成本缩减260倍
- 上交大推出首个AI智能体协议全面综述:从碎片化到互联互通的智能体网络
- CVPR Oral | 南京大学李武军教授课题组推出分布式训练算法UniAP,大模型训练最高加速3.8倍
- 真·开源MCP平台来了!ACI.dev能一站直连600+工具,让你的智能体秒变全能王!
- 解决200种复杂材料,10Å尺度模拟纳米晶体,哥大团队用4万个原子结构训练AI,登Nature子刊
- 重磅|屠呦呦,当选美国科学院外籍院士!
- 2024 年最热门的开源初创公司,2家中国公司上榜
- AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!
- 刚刚,小米开源了一个大模型
- 刚刚,DeepSeek 开源新模型 Prover-V2-671B
- 海量Python、R可视化Gallery
- 扎心!刚评上院士,就被曝十余篇论文造假!6 篇论文已被撤
- 知乎 | 算法岗和开发岗有什么区别?
- 2025泰晤士亚洲大学排名发布:8所“双非”院校跻身TOP200!清华大学连续七年蝉联榜首
- 深夜突袭,阿里Qwen3登顶全球开源王座!暴击DeepSeek-R1,2小时狂揽17k星
- DeepSeek-R1 这样的大型语言模型是如何进行 “深度思考”(Reasoning)的 ?
- 小米MiMo-7B技术报告英中对照版.pdf
- 通义实验室-算法专家-RAG/AI搜索
- Deepseek形式化证明大模型Prover-V2今日发布
- 24年国内AI芯片出货量Top6:NVIDIA 190W、昇腾64W、昆仑芯6.9W、天数3.8W、寒武纪2.6W!
- 图像编辑革命,浙大提出Insert Anything,告别PS抠图,万物皆可插入!
- 刚刚,DeepSeek发布最新大模型
- 飞桨实现插件式硬件图接入方案,模型推理加速2.2倍
- PaddleOCR实现精准定位!香港企业Sigtica为加拿大头部高校打造法律文档智能检索系统
- 图灵奖得主Joseph Sifakis:迈向工业化 AI——挑战与机遇
- 聊聊AI智能体框架MetaGPT下的RAG实践
- 小心!你的手机正在偷偷『学做人』——LLM如何让它自主订咖啡、抢优惠?| 手机端GUI Agent综述
- 可信大模型 Reliable LLM(四):利用不确定性估计强化大模型的事实性表达
- Reasoning涨点新方法:LLM「左右互搏」训练模型
- AI 艺术工具通讯
- 音视频同步生成的终极突破!浙江大学提出JavisDiT!HiST-Sypo技术实现帧级对齐!
- [ComfyUI]阿里WanX2.1:最强开源视频模型易主!静待社区生态开源直逼闭源,Vbench榜首第一
- Google 发布最新开源模型 Gemma 3 性能超越DeepSeek V3、o3mini为全球第二强开源模型!
- 太像了,全网疯传的一段奇葩提示词,能让AI生成以假乱真自拍照
- 句容市企业家协会走进上海南翔高科技经济城AIGC智谷,开展“AI商业实战”活动
- 【AIGC应用】2个月拿下4大赛道头部玩家,阶跃抢先交出Agent战场最硬核答卷
- 【AIGC趋势】中国第一,市值300亿
- 【行业动态】通义App全面上线千问3,夸克AI超级框推出“拍照问夸克”
- 惨遭背刺!特朗普抱怨亚马逊,将在商品显示中国关税成本
- OpenAI紧急修复GPT-4o献媚问题,已回滚到老版本
- 10秒生成官网,WeaveFox重塑前端研发生产力 | 蚂蚁徐达峰@中国AIGC产业峰会
- Qwen3真香!通义App满血接入,一手实测在此
- 多邻国全面AI First!AI能胜任的工作,都不再新招人,“等技术100%成熟时就晚了”
- 当购物用上大模型!阿里妈妈首发世界知识大模型,破解两大推荐难题
- GPT-4o医学知识覆盖率仅55%?腾讯优图团队发布大模型医疗能力“体检报告”
- 小扎回应Llama 4对比DeepSeek:开源榜单有缺陷,等17B深度思考模型出来再比
- AI卧底美国贴吧4个月“洗脑”100+用户无人察觉,苏黎世大学秘密实验引争议,马斯克惊呼
- 小米也开源推理模型了。拳打o1,脚踢Qwen~
- deepseek 51礼物来了。新671B开源。
- 刚刚,OpenAI 撤回了一条消息。
- 董小姐造假之后,Chatbot Arena被爆信任危机!
- DeepSeek Prover-V2,这才是探索AGI 的正确姿势!
- 下一代RAG:54种RAG-大模型推理协同技术最新全面综述
2025-04-29
- Qwen3的混合思考模式再探析及推理大模型系列专题指引
- 今日开源(2025-04-29):Qwen3,阿里云最新大模型系列,MoE和密集架构八款模型,支持100多种语言,数学能力升级
- 【源头活水】2025年 即插即用|全网首发,空间条纹注意力SSA,大感受野特征捕获!
- 性能超越DeepSeek R1,Qwen3正式登场!阿里一口气放出8款大模型,登顶开源王座!
- CSDN 智研社走进巴黎:共话 AI 时代的技术变革与机遇
- 谷歌大神首次揭秘Gemini预训练秘密:52页PPT干货,推理成本成最重要因素
- 诺奖得主、AlphaGo之父《时代》专访:AI远不如人类科学家,根本提不出有价值的猜想
- 从DeepSeek技术看通用人工智能发展趋势
- 斯坦福大学最新对DeepSeek人才研究报告及启示
- Kaggle知识点:Table2Image 表格图像化分类模型
- 刚刚,Qwen3 终于发布!混合推理模式、支持MCP,成本仅DeepSeek R1三分之一,网友喊话小扎:工程师要赶紧加班了
- Docker 推出 MCP Catalog 和工具包,供应商不顾安全问题争相支持
- 猛击OpenAI o1、DeepSeek-R1!刚刚,阿里Qwen3登顶全球开源模型王座,深夜爆火
- 语音领域ISCA Fellow 2025公布:上海交大俞凯、台大李宏毅等三位华人入选
- 上交大等探索键值压缩的边界:MILLION开源框架定义模型量化推理新范式,入选顶会DAC 2025
- ChatGPT的尽头也是「带货」:3、2、1,上链接
- ICLR 2025|首个动态视觉-文本稀疏化框架来了,计算开销直降50%-75%
- 终端云端三连发!无问芯穹开源大模型推理加速神器,加码构建新一代端、云推理系统
- Nature子刊 | 预测完全未知的化合物-蛋白质相互作用:药物研发突破性新工具GraphBAN
- 上限变高?!AI 时代的商业数据分析
- VS Code 的新AI Agent 模式绝了
- PDF转Word,这个工具让你告别格式错乱,一键搞定所有文档!
- 阿里Qwen3 全部情报汇总,本地部署指南,性能全面超越 DeepSeek R1
- 阿里 Qwen3 令人失望?
- 浅谈ggplot2图表美化~
- Qwen3终于来了!通通开源!!
- 深夜突袭,阿里 Qwen3 登顶全球开源王座!暴击 DeepSeek-R1,2 小时狂揽 17k 星
- CVPR’25|CV 微调卷出天际,打破全参数微调性能枷锁!即插即用的提点神器Mona:我小,我强,我省资源
- PHD在读,已发9篇论文
- 真的勇士!学生论文致谢,影响导师晚评职称一年?网友:你导这辈子抬不起头
- 用于图像处理的Python顶级库
- Qwen3来了,全尺寸开源,性能拉满!附最新一手实测!
- Qwen3震撼发布,235B超越 DeepSeek-R1、o3-mini,可开关快慢思考
- AI项目算法落地,背后的逻辑是什么?
- 飞桨PaddleX昇腾版全面升级:更多模型支持,更强推理性能
- 推测性思维链SCoT:小模型“模仿”大模型,最高提速2.9倍,准确率几乎不降
- When2Call:哈佛认为LLM也需要“边界感”,要意识到是否何时需要工具调用
- Qwen3开源,性能越级,混合模式,Dense与MoE共8种尺寸
- Qwen3 系列大模型发布
- 告别碎片化!两大先进分块技术如何提升RAG的语义连贯性?
- 港大&Adobe联合提出图像生成模型PixelFlow,可直接在原始像素空间中运行,无需VAE即可进行端到端训练。
- 腾讯混元&InstantX开源InstantCharacter,跨角色外观、姿势和风格个性化生成。
- 一文了解:大模型 Agent 开发框架有哪些?它们的区别是什么?
- 全网都在找的宝藏网站Z2H,免费生成专属字帖支持下载打印
- 刚刚,OpenAI大更新ChatGPT搜索,周搜索量10亿次
- 颠覆传统RAG,创新大模型检索增强—Insight-RAG
- 特斯拉最新财报:净利比同期暴跌71%
- 突发!阿里开源Qwen-3,碾压DeepSeek-R1、o1
- 极客说|揭秘大语言模型与 GPT 的变革力量,探索未来 AI 技术的无限潜能
- 14.9万元,满血流畅运行DeepSeek一体机抱回家!清华90后初创出品
- 普通人也能用上超级智能体!实测100+MCP工具随便选,撰写报告/爬虫小红书效果惊艳
- OpenAI玩崩了!GPT-4o更新后变马屁精差评如潮,奥特曼:一周才能完全修复
- 微软1bit LLM新研究:原生4bit激活值量化,可充分利用新一代GPU对4bit计算的原生支持
- 国际顶会+丰厚奖金!IJCAI Workshop挑战赛召唤X光安检AI技术先锋
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 无问芯穹夏立雪:让算力像水电煤一样成为标准化、高附加值的“拎包入住”基础设施|中国AIGC产业峰会
- 不要思考过程,推理模型能力能够更强丨UC伯克利等最新研究
- 马斯克:Grok 3.5 下周发布!能用第一性原理给出互联网上不存在的答案
- 阿里重磅发布Qwen3最佳开源LLM,击败 DeepSeek-R1,Llama4
2025-04-28
- DeepWiki、Chatwiki及DeepSeek-R1T-Chimera进展
- 牛啊,从零构建决策树并高级优化
- 今日开源(2025-04-28):Step1X-Edit,19B多模态图像编辑模型,媲美GPT-4o,结合DiT的解耦式架构
- 【源头活水】ICLR 2025杰出论文公布!中科大硕士、OpenAI漆翔宇摘桂冠
- 【他山之石】CVPR|扩散模型还原被遮挡物体,几张稀疏照片也能"脑补"完整重建交互式3D场景
- AI 取代人类的第一步,就是剥夺我们“慢思考”的能力
- 《AI X Science十大前沿观察》发布:35个研究前沿,开启科学发现的黄金时代
- DeepMind发布阿尔伯塔计划:AI 迈向通用人工智能 (AGI) 的路线图
- ICLR 2025:顶尖科学家最关心的 AI 趋势有哪些?丨GAIR Live
- AI再次引发人类担忧!实验发现:o3超过94%人类病毒学专家
- 小白学大模型:从零实现 LLM语言模型
- 细扒字节Seed 逆天招人要求!这5%本地顶级大脑做出了首个跨7大语言代码修复基准,让大模型成本狂降83%!
- FastAPI-MCP 开源:简化 FastAPI 与 AI 智能体的集成
- 重磅发布 | 复旦《大规模语言模型:从理论到实践(第2版)》全新升级,聚焦AI前沿
- AR智能革命!Satori系统读懂人类意图,科幻电影场景成现实
- 除了Ilya、Karpathy,离职OpenAI的大牛们,竟然创立了这么多公司
- 字节Seed团队PHD-Transformer突破预训练长度扩展!破解KV缓存膨胀难题
- 首个系统性工具使用奖励范式,ToolRL刷新大模型训练思路
- 模型压缩到70%,还能保持100%准确率,无损压缩框架DFloat11来了
- 北大物院200人合作,金牌得主超50人!PHYBench:大模型究竟能不能真的懂物理?
- ICLR 2025 Oral|差分注意力机制引领变革,DIFF Transformer攻克长序列建模难题
- 两篇Nature Medicine,DeepSeek、GPT-4o等LLM在医学推理、临床决策中的应用评估
- AI+量子计算:港科大等提出突破性低温存内计算方案
- Python Enum 技巧,让代码更简洁、更安全、更易维护
- 一头累死的驴,据说这是当下高校老师和行政的真实写照
- 毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔
- Google首席科学家万字演讲回顾AI十年:哪些关键技术决定了今天的大模型格局?
- 重新认识 线性回归模型
- DeepSeek-R2 倒计时?或将由华为芯片驱动
- Matplotlib、Seaborn和ggplot2谁好用?
- RAG 作者:RAG 已死,RAG 万岁!
- 264 页智能体综述来了!MetaGPT 等 20 家顶尖机构、47 位学者参与
- 如何解决工业缺陷检测小样本问题?
- 为什么同门硕士进了BAT拿高工资,而博士却要挤破头进985高校?
- TPAMI 2025 | 先解耦再组合:学习不变解耦特征用于组合零样本学习
- 超全!2025NLP顶会收录偏好汇总
- 学生论文致谢,影响导师晚评职称一年?网友:你导这辈子抬不起头
- RAG 与 MCP 如何以不同方式解决大模型的局限性
- 不微调、不蒸馏、不掉分解决R1思维链过长(细节版)
- 低空视角,目标追踪Roboflow和YOLO哪个效果更好?
- 英伟达开源「描述一切」视觉模型,7个基准数据SOTA(附论文及源码)
- 我们招生啦!
- DeepWiki!
- PaddleScience完成与沐曦AI芯片适配,AI驱动科学计算再提速!
- 浙大+阿里提出快慢思考新方法:在多模态Reasoning上准确率涨10%,长度砍半
- 直播预约 | LUFFY:让推理模型实现“即学即用”的强化学习训练方法
- 不用训练!TRACE让LLM生成既安全又有料
- 特征工程、模型结构、AIGC——大模型在推荐系统中的3大落地方向
- 操作系统是如何一步步发明虚拟内存的?
- RL将死,In-Context RL是未来
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 100个即梦AI生图提示词,直接套用1秒搞定海报设计,赶紧收藏!
- 阶跃星辰开源图像编辑模型 Step1X-Edit:人人都能用的“改图大师”!
- 特朗普新行政命令,要求全美国学校教AI
- 微软发布2025工作趋势:每位员工将是Agent老板
- Qwen3来了,各种尺寸管饱~
- Qwen 3 将于本周发布!
- 规划、分析和生成:PaperCoder自动从论文生成高质量代码库
- DeepSeek R2没来,Qwen3来了~
- LLMs 防御升级:借函数调用机制打造无缝防御层
- 综述:从零构建RAG系统全面指南(含代码)
- 如何使用 Python 和 FastAPI 构建带认证的 MCP 服务器(含代码)
- 从零开始构建多源知识图谱提取器:方法、实践与展望(含git链接)
- AI Agent评估:指标、策略与最佳实践
- 结构化输出指南:三个必备prompt提示技巧
2025-04-27
- RAG&KG&LLM&文档智能技术前沿:老刘说NLP技术社区持续对外纳新
- MCP技术总结及推理大模型强化学习机制分析
- CVPR 2025全网首发即插即用模块-TAB!
- Python高级特性:详解装饰器与生成器
- 3DGS已经是传统方法了?
- 论文er最爱的即插即用模块,我整理了2025最新适配版,直接拖进代码涨点
- 2025时间序列都有哪些创新点可做——总结篇
- 今日开源(2025-04-27):Kimi-Audio,7B开源音频基础模型,统一音频理解/生成/对话,多任务SOTA性能
- 一文搞懂:RAG、Agent与多模态的行业实践与未来趋势
- 性能媲美GPT-4o 和 Gemini2 Flash,阶跃星辰开源通用图像编辑模型Step1X-Edit
- 机器意识能否实现?来自人脑的启发
- 英伟达GTC上的人形机器人专场:这个领域在发生三个关键变革,我们在向ChatGPT模式学习,但它与物理世界互动,是更本质的AI
- 最忙时只睡2小时!35岁脑干出血程序员引热议,医生紧急提醒……
- CUDA编程:矩阵乘运算从CPU到GPU
- 行业落地分享:作业帮问答检索系统实践
- 曝百川智能老班底所剩无几;小红书取消员工大小周、竞业;马拉松亚军“松延动力 N2”以 5.7 万元拍卖价成交 | AI周报
- Anthropic 下架逆向工程者代码,网友开始称赞OpenAI开放
- 人形机器人半马跑,技术要领 GET 没?
- 纳米AI放大招!MCP万能工具箱,人人都能用上超级智能体
- ICLR 2025 | 无需训练加速20倍,清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM
- 基于奖励驱动和自组织演化机制,全新框架ReSo重塑复杂推理任务中的智能协作
- 在介观尺度「找不同」?ML预测材料失效,使材料设计更安全
- 4W字,最强 Matplotlib 实操指南!
- 当网红开始拼学历:600万粉丝网红“迅猛龙”考入复旦大学硕士
- 【深度学习】讲透一个强大算法模型,CNN !!
- 【机器学习】不要小看线性回归!
- 2025泰晤士亚洲大学排名发布:8所“双非”院校跻身TOP200!清华大学连续七年蝉联榜首
- 1450亿!马斯克又放大招了。。。
- Meta大爆料:细数OpenAI 那些不能说的秘密。。。
- 首篇MCP技术生态全面综述:核心组件、工作流程、生命周期
- 自动机器学习,贝叶斯优化类不平衡学习在药物发现中的应用
- AI 编程再下一城,读懂所有GitHub代码库,团队核心都是华人
- 自动机器学习,贝叶斯优化类不平衡学习在药物发现中的应用
- 《保姆级R可视化教程》来了!
- 为啥看上去很水的师兄,却能发顶会顶刊?
- 关于追认孔子同志正高级教师的批复
- OpenAI 姚顺雨:欢迎来到 AI 下半场!
- 小白看得懂的 Transformer (图解)
- 为什么现在计算机所有专业的研究生基本都搞机器学习和深度学习,国内真的需要这么多会人工智能的人才吗?
- C++ OpenCV实现图像去阴影
- 蚂蚁集团全球招募顶尖 AI人才,研发下一代基座模型,探索AGI顶尖课题
- 不微调、不蒸馏、不掉分解决R1思维链过长
- 12家单位已加入,全国首部AI大模型私有化部署标准欢迎参与!
- 最近又有很多粉丝来问这个问题,那我再推荐一次这本书!作者非常强,书名敢称解决几乎任何机器学习深度学习问题!
- 谷歌发现LLM是Greedy Agent,提出用RL调教出理性决策
- Tiny Reasoning模型:LoRA+RL=9美元训练费,性能碾压同行
- DeepWiki:强烈建议每个程序员都用上,Github源码阅读神器!
- 左右手互搏之术CK-PLUG:在RAG中如何更加精准调控LLM对于模型内部知识跟外部检索知识的依赖?
- AI视频生成新突破!字节提出一致性视频生成方法Phantom:通过跨模态对齐生成主题一致的视频,超多应用场景。
- 昆仑万维开源首个无限时长AI电影生成模型SkyReels V2,未来AI生成电影就像生成小说一样简单。
- CVPR 2025 Highlight | 清华提出一键式视频扩散模型VideoScene,从视频到 3D 的桥梁,一步到位!
- Ostris重磅发布Flex.2-preview:ComfyUI的图像生成神器,来了!
- ChatGPT+DUIX超强组合,实时交互数字人秒变AI女友,形象逼真自带情绪开源免费!
- o3猜照片位置深度思考6分48秒全程高能,范围精确到“这么近那么美”
- 1450亿!马斯克xAI与X合并后再寻资金,将成史上第二大初创企业单轮融资
- 数学家们仍在追赶天才拉马努金
- 不到2年,AI PPT赛道第一!像素绽放CEO赵充:今年是AI应用创业最佳时期 | 中国AIGC产业峰会
- 1亿图文对!格灵深瞳开源RealSyn数据集,CLIP多任务性能刷新SOTA
- 7x24小时非人类科学家入场:当AI开始自主探索科学未知领域 | 多伦多大学
- deepseek-R2,leak了
- 传言:DeepSeek R2参数暴涨至1.2万亿、便宜97.3%!美股或将巨震!
- 4大类AI Agent协议框架全面综述
- DeepSeek R2意外泄露~
- 瓦力算法4月第4周急招岗位| / 腾讯混元 / 字节 / 它实 / 高德 / 飞书 / TP-link
2025-04-26
- GraphRAG如何用于Agent做memory记忆管理?Graphiti实现解读及相关技术进展回顾
- 【源头活水】21岁华人开发AI作弊工具被哥大停学,转身拿下530万美元融资,网友:《黑镜》成真
- 微软:人类与智能体协同时代的未来组织蓝图
- Hinton签公开信阻止OpenAI重组,10名前OpenAI员工也参与了
- Anthropic CEO豪言LLM黑箱5年内必破!研究员爆料:AI有意识概率已达15%
- Hugging Face论文热榜第一!AI推理新方法,打破强化学习天花板,全面开源
- 20万奖金池×最火技术风口!欧莱雅集团首届Agent黑客松火热开启,等你来战
- 秒杀同行!Kimi开源全新音频基础模型,横扫十多项基准测试,总体性能第一
- OpenAI、谷歌等一线大模型科学家公开课,斯坦福CS 25春季上新!
- 跨机型诊断难题新突破:上交大、商飞、东航打造国产大飞机时序大模型智能诊断新路径
- 具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互
- 人工智能接管核电站,商业化的智能核电管理是否正在路上?
- 学生党狂喜!A5000低至0.88元/时,AI云平台开启硬核内卷
- 大学文凭成废纸?AI暴击美国00后!哥大退学成千万富翁,我却要还学贷
- ICLR 2025 结果出炉,投稿数再创新高!
- 突发!谷歌被逼卖身,OpenAI 趁机收购 Chrome?十亿搜索市场大洗牌
- GPT-4.5功臣遭驱逐!奥特曼盛赞工作出色,美国深陷AI人才危机
- CUDA编程:矩阵乘运算从CPU到GPU
- 高考考上985的AI来了!超强数理推理横扫真题,训练秘籍剑指AGI
- 就用这串“废话”提示词,让刘强东和王兴线下偶遇
- 特征工程、模型结构、AIGC——大模型在推荐系统中的3大落地方向
- 端到端的训练,怎么复现 Deep ReSearch(下) :前沿的产品形态
- 肖仰华丨AI在教育中的应用有两面性
- NUS发布Reasoning中的安全问题综述,idea满满~
- 大模型在线辅导小模型,正确率提50%、推理效率涨90%
- 阿里发布多模态UniME:硬负样本+知识蒸馏=性能天花板,准确率暴涨27%
- 我被AI骗了!
- GigaAI发布全球首个解耦式人体视频生成框架HumanDreamer,可生成由文本到姿态到人体的高质量视频!
- 字节跳动提出Pixel-SAIL!单一Transformer实现三大突破,性能不降反升!
- 百度暑期算法grpo缺点是啥?
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 首份空间智能研究报告来了!一文全面获得空间智能认知、要素、玩家图谱
- 拜拜邀请码!首个现货超级智能体实测
- 网易有道张艺:AI教育的规模化落地,以C端应用反推大模型发展 | 中国AIGC产业峰会
- GitHub版DeepResearch来了!覆盖所有代码库,模型架构可视化,背后贡献者也能扒 |免费
- 20万美元奖金池!WBCD’25双臂机器人挑战赛全球启幕,还有数十万美金硬件支持
- 树莓派上流畅运行大模型!让终端具备自主学习与记忆能力|对话RockAI CEO刘凡平
- 一篇142页全面复盘DeepSeek R1思考推理技术综述
2025-04-25
- 金融领域推理大模型DianJin-R1、Fin-R1及文档转markdown、docx的多模态大模型做法
- 今日开源(2025-04-25):英伟达开源DAM多模态视觉语言模型,3B参数,交互式区域描述生成模型,支持点/框/涂鸦输入
- Google首席科学家万字演讲回顾AI十年:哪些关键技术决定了今天的大模型格局?
- 麦肯锡 & Mozilla:2025 人工智能时代下的开源技术研究报告
- 逆向设计智能物质:可微分逻辑元胞自动机破解数十年难题
- 英伟达停止运营Lepton AI,贾扬清回应:不是人才收购
- “DeepSeek不是万能的”,李彦宏今年押注AI 应用:模型价再“打骨折”,重点布局多智能体、多模态
- DeepMind CEO 放话:未来十年赌上视觉智能,挑战 OpenAI 语言统治地位
- OpenAI“Agent万能论”遭打脸!LangChain创始人:Deep Search恰恰证明Workflows不可取代
- 酷开一口气甩出 6 个超级智能体!CEO:一定要做 AI 原生,性价比是我们追求的主要方向
- 出海不迷航,合规×本地化×生态:如何用技术力撬动海外市场?| 直播预告
- RL真让大模型更会推理?清华新研究:其能力边界或仍被基座「锁死」
- 刚刚,OpenAI推出「轻量级」Deep Research,免费用户也能薅羊毛!
- 95后团队30天造出通用超级智能体!百度心响App全量上线、人人免费用,亲测效果惊艳
- 英伟达开源「描述一切」模型,拿下7个基准SOTA
- 北航推出全开源TinyLLaVA-Video-R1,小尺寸模型在通用视频问答数据上也能复现Aha Moment!
- 大模型何以擅长小样本学习?ICLR 2025这项研究给出详细分析
- 在量子世界玩游戏?物理学家展示量子计算机新前景
- 通过成分准确预测晶体结构,一种基于ML的CSP新方法
- 学生论文致谢,影响导师晚评职称一年?网友:你导这辈子抬不起头
- 【Python】轻松搞定三元相图
- 【深度学习】解决Diffusion Transformers优化困境!南京大学与字节等提出DDT:解耦扩散模型
- YOLO界再起波澜!新一代目标检测器又有新突破!
- 洗个澡把 offer 洗没了。。
- 百度、腾讯、阿里大模型面试,一面到三面
- 迪子,滚动裁员。。
- 全网最火的 AI 提示词,让刘强东王兴线下偶遇。。。
- IT咖啡馆送你2本,给程序员看的DeepSeek图书!
- AUTOSAR为何成为车企刚需?
- Deepseek应用指南:自媒体/电商/教育/开发/法律/本地生活等
- “Rust真能防住C代码里的那些老问题吗?我们做了个实验验证”
- “单休等于多上7年班”:这届打工人开始抵制单休!
- YYDS,哈工大博士的pytorch笔记火了!!
- 长远看算法岗真的比开发岗香吗?
- 总结了 11 种 Numpy 的高级操作
- 从Math RL初窥LLM推理模型:是怎么work、哪些trick是有效的!
- 重新思考预训练中的反思现象
- 端到端的训练,怎么复现 Deep ReSearch(中) :围绕着”Deep”,解构 Jina 项目的实现
- CV微调卷出天际,Mona微调方法,即插即用:我小,我强,我省资源(附论文及源码)
- PyTorch CUDA 内存管理优化:深度理解GPU资源分配与缓存机制!
- 文心4.5Turbo、X1Turbo和多款AI应用发布!李彦宏:应用创造未来
- 百度发布文心4.5 Turbo、X1 Turbo两大模型,王海峰详解背后技术
- 揭开o3的神秘面纱,港中文/UIUC/普林斯顿联合推出OTC-PO,让你的Agent既聪明又高效
- 首届CogMAEC@MM’25研讨会求稿,探索认知驱动的多模态情感与共情智能
- 1.5B小模型+32B外援=28%准确提升+8倍提速?SplitReason实现推理过程“无缝接力”
- 华人团队提出视觉推理测评标准,揭露SoTA模型残酷现状
- Suna -开源智能体助手
- txtai:全能AI框架
- 图像编辑革命,万物皆可插入!浙大/哈佛/南洋理工提出Insert Anything,告别PS抠图,AI让世界无缝生长。
- 不会画画也能做动漫线稿!ComfyUI图像转线稿神器实测来了!
- 从0到1亿!数字人十年进化史,揭秘AI时代的隐形操盘者
- AIGC智谷X上海交通大学全链提效高级研修班开启报名
- 【AIGC趋势】禾赛布局的三大领域将在2025年带来超85亿元营收
- 【AIGC应用】中国力量已然改写全球AI竞争格局
- 【行业动态】英特尔具身智能大小脑融合方案发布,全球AI企业融资超4300亿
- 突发!OpenAI免费开放Deep research,超强AI Agent
- 亿元资金池,百度邀你一起定义AI原生应用的中国范式!第三届百度“文心杯”创业大赛再次启动
- 微软开源Agent操作系统 :深度集成 Windows多智能体,超6000颗星
- 李飞飞/DeepSeek前员工领衔,复现R1强化学习框架,训练Agent在行动中深度思考
- 即插即用!清华国科大等推出视觉微调框架,仅需调整5%骨干网络参数 | CVPR2025
- 实测免费DeepResearch!轻量版深夜上线,基于o4-mini,速度更快/重视脉络梳理
- 首个大模型全链路安全综述 !南洋理工新国立等发布LLM Safety全景图:从数据、训练到部署的全面梳理
- 一手实测!文心X1/4.5 Turbo推理和多模态双双变强,还把模型成本降了6成?!
- 宝马秀起汽车科技来,哪有其他汽车什么事…
- 亚马逊云计算Troy Cui:敦煌网飙升AppStore第二,企业如何应对激增流量是关键 | 中国AIGC产业峰会
- 从底层重构强化学习训练框架,阿里高德开源新方法:抛弃替代损失函数,仅需优化原始目标
- 开源垂直领域高质量数据合成框架!专业QA自动生成,无需人工标注,来自上海AI Lab
- ToolRL,训练llm更好的使用工具。
- 字节ReTool:用于大模型中战略性工具使用的强化学习
- RAG 正在重塑未来:最新 11 种新型 RAG 类型一次看懂!
2025-04-24
- RAG与Reasoning结合的必要性、实现范式及Agents、RAG产品、大模型安全新总结
- 今日开源(2025-04-24):Skywork-R1V 2.0,38B参数推理模型,视觉链式思维突破,数学/图像理解SOTA
- 李建忠:大模型技术创新驱动的 AI 生态和应用演进
- 倒计时 6 天!致全球 GPU Kernel 极客:AMD 的 10 万美金“战书”请查收!
- 李飞飞团队提出模态链,机器人仅凭人类演示视频就能精准操作,准确率提升 200% 。
- 诺奖得主辛顿分享求学之路:不断探索自己的兴趣、好奇心引领发现、因为数学吃力放弃成为物理学家,却终获物理诺奖
- DeepSeek-R1-Zero被“轻松复现”?10%训练步数实现数学代码双领域对齐
- 为何“千脑理论”可能是真正通用人工智能的关键
- 小白学大模型:多模态 Qwen2.5-VL
- AI 智能体老“崩”?DeepSeek 前员工联手李飞飞等大佬开源新框架,教会模型真正推理
- 8大主流AI Agent平台深度测评:哪款最值得入手?| 赠书福利
- 刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元
- SLAM3R:北大陈宝权团队等只用单目长视频就能实时重建高质量的三维稠密点云
- TTS和TTT已过时?TTRL横空出世,推理模型摆脱「标注数据」依赖,性能暴涨
- 机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手
- Nat. Mach. Intell. 封面 | 深度原理开发最佳传输模型生成化学反应过渡态
- AI进行植物学研究?中山大学等开发DeepPlant助力表观遗传学
- 首本通用人工智能评测书出版,全球知名人工智能科学家朱松纯及团队全新成果!
- 【深度学习】ICCV|基于扩散模型的开放词汇目标分割
- 机器学习在生物标志物发现中的创新应用:生物驱动LASSO方法解析
- 机器学习论文解读,XGBoost很能打
- RAG原作者:我们仍然需要RAG(并且永远需要)
- Python轻松搞定Ternary plot
- 全世界都在用JCR分区,中国要弄个中科院分区?意义在哪?
- 2025,Agent 突然一夜封神。。。
- 恶搞关税战!Python 软件包征收 import 关税,将制造业重新带回您的代码库!
- Chrome若被出售,OpenAI抢先喊话:我想买!
- 用了这个CSS技巧,我的代码瞬间整洁了!
- 只需6G显存,就能本地跑的AI视频算法,开源了!
- 知乎热议 | 前几周Deepseek都是神一般的存在,为啥热度消散得这么快?
- 知乎热议 | 前几周Deepseek都是神一般的存在,为啥热度消散得这么快?
- 近端策略优化 (PPO) 算法深度解析
- RL x LLM 时代:通向 AGI 的四层阶梯
- LLM 行业科普和择业建议:选基座or应用?
- 3类多目标追踪算法,项目工程化部署原理汇总
- 超越DINOv2! 英伟达开源PS3:让视觉大模型”看清”世界!(附论文及源码)
- AI Agent 全面对比:Manus、OpenManus与OWL
- 开单效率暴增30倍!“数字销冠”的AI密码:飞桨+文心大模型双引擎驱动
- 参会指南|4月25-26日DA数智大会·上海站,双场免费听!
- 大模型浪潮来袭,与肖仰华教授共赴 DA 数智大会
- RL也能请“场外大神”?LUFFY打破模仿僵局,平衡探索与学习,解锁深度推理新境界!
- 直播预约 | 如何让LLM通过RL又好又准地使用工具?
- LLM Agent也能通过RL学会「思考」和「自我进化」吗?
- ICLR 2025 | Rodimus*:兼顾性能与效率的混合注意力机制
- 刚PhD毕业,聊聊如何一个季度完成一篇投稿
- 月薪已炒到6W?强烈建议数据人冲一冲这个新兴领域
- 你敢信!LoRA也能训练出强大的推理模型——Tina让小模型“智商爆表“
- CVPR 2025 Highlight | 清华提出一键式视频扩散模型VideoScene,从视频到 3D 的桥梁,一步到位!
- 11个ComfyUI隐藏技巧,老司机都在用,第7个你绝对想不到!
- 阿里提出文生卡通新方法Textoon:一分钟内生成丰富多彩、可交互的Live2D格式角色。
- 南洋理工 & 牛津 & 新加坡理工提出Amodal3R,可从遮挡 2D 图像重建完整 3D 资产,3D生成也卷起来了!
- 超好用的AI工具平台,一键搞定文档图像内容处理,限时送福利!
- 刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦
- 微软AI Genius训练营来啦!6场“理论+实战”课程,彻底点燃你的AI超能力
- 虚拟动点助力“利亚德集团2025年生态合作伙伴大会”圆满落幕
- 重磅!微软上线GPT-image-1模型,支持高级功能定制
- 微软开发者挑战赛圆满收官,多项大奖见证AI创新力量!
- 百度阮瑜:大模型应用落地正从简单高容错向复杂低容错场景延伸|中国AIGC产业峰会
- 无需数据标注!测试时强化学习,模型数学能力暴增 | 清华&上海AI Lab
- 电视装了智能体,只凭台词就能找到剧集了
- MSRA首席研究员刘炜清:为每位研究员提供AI科研助理,自动化高门槛、重复性工作|中国AIGC产业峰会
- 北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断
- 智能车速度刷新:仅10个月,首个纯端侧大模型上车量产!
- 质量无损,算力砍半!达摩院开源视觉生成新架构,出道即SOTA|ICLR 2025
- UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!
- 380篇文献!首份Agentic大模型最新技术综述
- 53.2k星,微软开源的MarkItDown接入MCP,文档一键转换Markdown!
- 如何利用网络爬虫进行大规模LLM数据收集
- MCP 安全困境与Agent安全框架的应对之道
- LLM in a Loop:借助评估提升LLM输出效果
- AI无边界:通过MCP实现不同智能体框架的协作(含代码)
2025-04-23
- 王者归来!多模态大模型+具身智能彻底爆了。。。
- 源码角度解读RAKG文档级图谱构建框架RAKG及Demo级多模态RAG-NoOCR
- 时间序列预测的万能机器学习框架
- 时间序列的常用的9种交叉验证方法
- 今日开源(2025-04-23):Dia,1.6B参数对话式TTS模型,支持情感语调控制,可生成非语言交流声效,仅支持英语
- 直播|Tuya AI硬件开发平台开源啦!搭载超强AI能力,助力个人开发者打破技术壁垒
- 靠开发AI作弊神器成名,21岁小伙遭学校开除不足一月后,转身拿下530万美元融资!
- RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会 「套公式」,却不会真推理
- 《Nature》一块大脑,5.23亿个突触,以及有史以来最复杂的神经科学实验
- 继薛其坤院士后,量子反常霍尔效应再迎突破?清华团队《Nature》揭秘“自旋翻转”魔法!
- ELE AI算法大赛“赛道二:智慧骑士—消防隐患识别” Baseline
- Cursor、Devin 等爆款系统提示词曝光,Github上斩获近 2.5 万颗星!官方给 AI 工具“洗脑”:你是编程奇才
- 腾讯、华为、微软、阿里专家齐聚一堂,共谈推理优化实践 | AICon
- ICLR 2025杰出论文奖出炉,中国科大论文、Meta「分割一切2」论文等获奖
- 社会模拟的世界模型SocioVerse:复旦、创智学院等开源100万真实用户池,助力计算社会科学的交叉研究
- 业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10
- 仅用3周时间,就打造出Manus开源平替!贡献源代码,免费用
- 清华LeapLab开源cooragent框架:一句话构建您的本地智能体服务群
- 迈向长上下文视频生成!NUS团队新作FAR同时实现短视频和长视频预测SOTA,代码已开源
- 一天拿下3.4k star,这个1.6B开源模型火了,合成对话超逼真
- ICLR 2025 Oral | 训练LLM,不只是多喂数据,PDS框架给出最优控制理论选择
- 从气象预测到心脏诊疗:科学智能时代,这家新型机构如何携手高校用AI驱动科研范式变革
- 定制化CRISPR来啦!高通量工程+机器学习解锁精准基因编辑,登Nature
- 78k star,像写 Markdown 一样画流程图,这个开源工具太牛了!
- 我国仅有4所“纯211”,被称为“984.5”大学,综合实力强悍,超越寻常985!
- 史上最严院士增选!27名候选人,被处理
- 哈佛归来,重返母校,入职北大!
- 谷歌突然换帅!19年老将立即卸任
- 全网刷屏,2个火爆的AI视频算法项目,已开源!
- 深圳大学,成立人工智能学院!20位院士见证
- 告别”垃圾图表”到升,我只改了这8个seaborn参数
- 新突破,3 个火爆的 AI 项目,已开源!
- Matlab——数据大佬的秘密武器?
- AI工具使用手册:高阶AI指令大合集!
- 仅改30行Linux代码,立马省电30%?滑铁卢大学团队“神补丁”,已被Linux 6.13并入!
- 2025年值得关注的12+个免费开源 Tailwind UI 替代品(绝佳精选推荐)
- 在目标检测中如何解决小目标的问题?
- 仅需0.4GB,参数只有0和±1!微软开源首个原生1 bit模型,CPU轻松跑
- 英伟达CEO黄仁勋到访北京:希望继续与中国合作,并回应芯片出口管制问题
- 聪明人已经用DeepSeek发一区论文了
- SeekWorld:一张图片知道你在哪?o3-like 7B模型超越一流开闭源模型!
- 【大模型北斗实习】美团大模型研究
- 生成式人工智能的后训练与遗忘问题
- 建议所有研究生都去学一遍,赢麻了!!!
- 从零实现 DeepSeek R1:从基础模型到强化推理模型
- ICLR 2025 杰出论文奖揭晓!6篇获奖论文解读
- Wan2.1和HunyuanVideo文生视频模型算法解析与功能体验丨前沿多模态模型开发与应用实战第六期
- 聊聊大模型训练数据——大模型接受的训练数据格式是怎么样的?
- 2025年“数据要素×”大赛上海分赛科技创新赛道宣贯会即将举办,诚邀共赴数据创新之约
- 清华提出Test-Time RL,无需标注,模型自学,正确率飙升159%,实现终身学习
- 中科院提出DEER:让Reasoning提前退出,推理提速50% 准确率涨10%
- 综述 | GUI Agent:让AI学会「玩手机」的新革命
- 进程调度器是怎么一步步发明出来的?
- 单图生成3D头像+AI编辑+多模态驱动?阿里LAM让虚拟人“活”了!
- 开源项目FastAPI-MCP,一键将FastAPI转换成MCP服务器,以后API=MCP。
- 100行代码讲透MCP原理
- 一文带你了解,MOE 架构是什么?
- 豆包3.0生图效果太绝了,人人都能成为顶级设计师(附完整提示词)
- 突发!OpenAI或将收购谷歌浏览器Chrome
- 字节跳动开源多模态AI Agent—UI-TARS-1.5
- AI视频创作平台Capsule,获1200万美元融资
- 中杯o3成OpenAI“性价比之王”?ARC-AGI测试结果出炉:得分翻倍、成本仅1/20
- GPT-4o能拼好乐高吗?首个多步空间推理评测基准来了:闭源模型领跑,但仍远不及人类
- 挤爆字节服务器的Agent到底啥水平?一手实测来了
- 轻松健康集团高玉石:AI产品和用户走得够近才能挖到新需求丨中国AIGC产业峰会
- 可媲美GPT-4o的开源图像生成框架来了!腾讯联手InstantX解决角色一致性难题
- 扩散模型还原被遮挡物体,几张稀疏照片也能”脑补”完整重建交互式3D场景|CVPR’25
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 狸谱App负责人一休:从“叫爸爸”小游戏到百万月活AI爆款,社交传播有这些底层逻辑丨中国AIGC产业峰会
- 告别“AI失忆症”!新型SD-LoRA算法实现终身学习|ICLR 2025
- 华人横扫ICLR 2025杰出论文奖,三篇均为华人一作,中科大何向南团队/清华姚班北大校友在列
- 两本科生自学3个月复刻谷歌爆款产品,开源AI语音新标杆一天揽获5000星标
- YOU.com CEO:你对AI的态度,取决于你为何而工作
- O3 ARC-AGI测试结果出炉!
- ICLR 2025杰出论文解读:中科大LLM编辑、DeepMind安全对齐、LLM微调学习动态
- 构建智能多智能体 AI 系统:A2A 与 MCP 的深度剖析与实践指南
2025-04-22
- 文档解析主流开源工具全家桶及RAG中的文档目录解析PageIndex思路解析
- 打造AI高质量数据集,数据标注合规是关键
- 被取消院士称号,前中国工程院院士李宁,已担任新职
- Jeff Dean演讲回顾LLM发展史,Transformer、蒸馏、MoE、思维链等技术都来自谷歌
- YOLO永不过时!全新轻量级版本拿下中科院1区TOP!创新性MAX
- 入选CVPR 2025!清华&华科大提出超强异常检测新方法!学会你也能发顶会
- 凭借SAM+多模态又发一篇CVPR!字节&北大都在做,跟上别掉队了!
- 频频登顶Nature子刊,UNet实在太好用!
- 19个超强Python Scikit-learn操作!
- XGBoost算法在“金融市场”波动预测中的应用
- 今日开源(2025-04-22):MAGI-1,24B/4.5B自回归视频世界模型,流式生成+块级提示,高一致性与文本驱动控制
- 【源头活水】人类活一百年,处理的信息只有 4GB?大脑处理速度只有果蝇的16倍
- 【他山之石】WSDM 25唯一最佳论文:从谱视角揭开推荐系统流行度偏差放大之谜
- 【源头活水】UC伯克利:让推理模型少思考,准确率反而更高了!
- 【源头活水】OpenAI姚顺雨:大模型下半场是产品的游戏,做研究也要有产品思维
- 【他山之石】扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源
- 我悟了如何与AI说话!谷歌 69 页官方提示词秘籍全解析,中文版免费下载
- 图灵奖得主杨立昆最新访谈实录:让LLM投入更多“思考”时间分步推理,是一种很糟糕的技巧
- 强化学习之于 AI Agent,是灵魂、还是包袱?
- 前“Google Brain”团队HR负责人Hwang:为什么中日韩员工很难在谷歌等硅谷大公司当高管?但印度裔就可以
- OpenAI最强AI模型竟成“大忽悠”!o3/o4-mini被曝聪明过头、结果幻觉频发?
- 行业落地分享:蚂蚁向量检索挑战与实践
- 95 后中国开发者刚刚发布“摸鱼神器”,比 Manus 快 4 倍!实测结果能否让打工人逆袭?
- 大模型AI软件落地已过验证阶段,代码生成占比明显提升|AI4SE 行业现状调查报告(2024年度)
- 冲击 100% 覆盖率,华润集团如何破解数智人才培养密码?|DTDS 全球数智人才发展大会
- WSDM 25唯一最佳论文:从谱视角揭开推荐系统流行度偏差放大之谜
- 北京中关村学院将亮相ICLR 2025!学术面基+求职直通+周边拿到手软
- 「全球首个自回归视频生成大模型」,刚刚,Swin Transformer作者创业团队重磅开源!
- AI也要007?Letta、伯克利提出「睡眠时间计算」,推理效率翻倍还不加钱
- 连Claude 3.5都败下阵来,大语言模型能否定位软件服务的故障根因?
- 生成式AI进入第二幕:交大携手创智学院提出「认知工程」,AI新纪元开始了
- 从Minecraft到虚幻5,AI首次实现3D游戏零样本迁移,跨游戏直接上手
- 从抗体、工业酶到基因剪刀设计,AI生物大模型ProGen3或将重构生命科学
- 直接指导荧光分子设计,浙大等提出模块化人工智能框架FLAME
- 拿来即用!9 个科研论文配图完整代码
- DeepSeek接入个人知识库,保姆级教程来了!
- 大学老师苑萌萌爆红!秒杀一众明星网红,长相酷似神仙姐姐
- 【Python】微软这次真把Markdown玩明白了,接入MCP
- DeepSeek公布最新成果,开启DeepSeek R2时代?
- 清华特奖团队,100%开源,视频生成AI一夜刷屏!
- 搭建完美的写作环境,续一篇
- PDF转Word,这个工具让你告别格式错乱,一键搞定所有文档!
- Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强
- 荣登顶会:没算法没经验,全靠 idea 选得好。。。
- o3/o4-mini 幻觉暴增 2-3 倍!OpenAI 官方承认暂无法解释原因
- 学好AI大模型,这个是核心关键!
- OpenAI最强AI模型竟成“大忽悠”!o3/o4-mini被曝聪明过头、结果幻觉频发?
- Google又发布了一款惊艳的全新IDE,彻底碾压VS Code!
- 今年读过最绝的一本LLM书!下载量10w+!看完少走一半弯路
- 使用Stable Diffusion图像修复来生成自己的目标检测数据集
- 重磅!国家鼓励主要论著优先在国内学术刊物上发表
- 开源双炸 SkyReels-V2 与 A2 正式登场,“无限时长”让AI视频进入长镜头时代
- RL祖师爷:欢迎来到智能新时代、RLHF将被扫进垃圾堆
- DeepSeek的风吹到了多模态,Visual-RFT发布,视觉任务性能飙升20%!(附论文及源码)
- 细节超越SAM2!商汤开源视频抠图新标杆:MatAnyone发丝级还原!
- 讯飞星火X1实力印证:“全栈自主可控大模型”这道必答题,中国能答好
- 大模型训练代码开发再提效——3行代码就能实现分布式训练!飞桨框架3.0自动并行功能现已正式上线!
- ToolRL:开创工具调用RL Reward新范式,性能/泛化/效率/推理迎来全面质变
- 这也行?小模型指导大模型Reasoning,无需训练,成本减少40%
- 北航联合小红书发布大模型翻译最新研究成果,重塑社交生活化翻译新范式!
- 通过Multi-Agent强化学习的LLM Meta-Thinking「元思维」综述
- 哈尔滨工业大学(深圳)计算机学院陈科海老师招收硕博研究生
- RAG不需要切块向量化了?通过PageIndex构建Agentic RAG
- 阿里EMO2重磅升级!手部动作生成+超逼真表情,音频驱动人像视频生成再进化!
- ComfyUI | 最强吉卜力风格工作流EasyCN来袭,风格统一+操作简便+输出稳定!
- 港科大提出Turbo2K!2K视频生成20倍加速+VAE蒸馏,4K级画质触手可及!
- olmOCR:重塑PDF文本处理,让语言模型更智能、更强大!
- 突破封锁!华为将发布大量AI芯片,平替英伟达H100
- 量子计算重大突破!谷歌发布混合量子模拟方法
- 美国法官判谷歌垄断数字广告市场,可能面临拆分
- 大模型可解释平台Goodfire,获5000万美元融资
- 21岁学生开发AI作弊工具被哥大停学,转身拿下530万美元融资,网友:《黑镜》成真
- 本周三15:00!🤓机器人与数字化转型应用解析,线上研讨会诚邀你来围观
- 心影随形创始人刘斌新:做不跟用户抢时间的AI产品丨中国AIGC产业峰会
- 清华&英伟达揭露ICML最佳论文隐藏数值问题,简单掩码模型是等价更好选择 | ICLR25
- “史上最快闪存技术”登Nature!复旦新成果突破闪存速度理论极限,每秒执行操作2500000000次
- 炸裂!又一个AI大模型的新方向,彻底爆了!!
- Andrej Karpathy:markdown 将取代HTML!
- Geoffrey Hinton:我们远没有我们想象的那么理性!
- 智能文档白皮书发布!速度保存,手慢无(附下载)
- LLM架构实战:用 LangChain 和 LangGraph 打造多智能体研究助手(含代码)
2025-04-21
- 再看大模型幻觉排行、检测工具及多模态RAG技术范式总结
- 时间序列预测模型比较分析:SARIMAX、RNN、LSTM、Prophet 及 Transformer
- CVPR 2025 | PyramidDrop让推理训练飞起来
- 今日开源(2025-04-21):SimpleAR,0.5B/1.5B自回归视觉模型,1024分辨率图像,改进图像美学和提示对齐
- Agent、DeepSeek、多模态热点炸场!60+重磅嘉宾共探AI未来,2025全球机器学习技术大会完美收官!
- 机器人跑马拉松,到底在比什么?
- 国际能源署:人工智能的未来变革潜力取决于能源,《2025能源与人工智能报告 》
- OpenAI:构建智能体实用指南
- 令人惊讶!Science新发现挑战了神经元遵循单一学习策略的观点
- 仅需0.4GB,参数只有0和±1!微软开源首个原生1 bit模型,CPU轻松跑
- 行业落地分享:一文全解 抖音算法原理首次公开!
- 人形机器人“颤颤巍巍”跑完北京马拉松,冠军身价抵轿车,季军仅 3.9 万:20 家企业发展实录
- 工程师又替 AI 背锅?Cursor 限制多设备登陆引众怒,竞对趁机下场抢用户!
- Sebastian Raschka长文:DeepSeek-R1、o3背后,RL推理训练正悄悄突破上限
- UIUC联手谷歌发布Search-R1:大模型学会「边想边查」,推理、搜索无缝切换
- 「天工Ultra」半马夺冠,人形机器人通关产业落地第一关
- RL很重要,但远非All You Need!微软副总裁:AI不靠单个技术撑起
- 百页专业报告一次直出!Jürgen团队开源框架WriteHERE,重塑AI写作天花板
- 用任务向量做模型编辑为何有效?这篇ICLR 2025 Oral论文给出了理论分析
- 两篇Nature,国内外光电团队算力硬件新进展:当AI计算开始追逐光的脚步
- 首个全场景原子级蛋白质大模型,百奥几何发布GeoFlow V2,统一生命分子的结构预测与从头生成
- 后端行情变了,差别真的挺大
- 中科院院长:科研乱象,不少科研人员疲于报项目、发论文、争“帽子”…不利于科研攻关
- DeepSeek:3大真相曝光!DeepSeek为何一个月跌落神坛?这届用户太狠了
- 【Python】Pandas实现sql的case when查询,原来这么简单!
- 知乎热议 | 前几周Deepseek都是神一般的存在,为啥热度消散得这么快?
- 用机器学习评估供体特征对儿童心脏移植结果的预测能力
- 【PPT、代码下载】西湖大学:强化学习的数学原理,从零开始到透彻理解
- 1张4090,本地部署多模态大模型
- 微软这次真把Markdown玩明白了,接入MCP
- 对 ChatGPT 说“请”和“谢谢”,每年会花费数千万美元的电费
- 深圳大学教授自曝工资收入
- 杀疯了!Gemini 2.5 狂飙「高尔顿板」测试,编码横扫所有 OpenAI 模型
- AI浪潮下嵌入式开发新机遇
- AI玩《毁灭战士》集体翻车:GPT-4o、Claude、Gemini在第一关已全军覆没
- 10个AI网站生成神器,还没等咖啡凉透,网站就搭好了!
- MATLAB与OpenCV进行相机标定,谁的标定精度高?
- 十分钟掌握Pytorch搭建神经网络的流程
- 视觉自回归生成理解编辑大一统!北大团队多模态新突破,训练数据代码全面开源
- 顶会收割机!PINN变种,效率提升3倍!
- 实战教程来了!从零开始打造MCP+Ollama集成
- MCP很好,但安全问题不容忽视,智能体安全框架可以解决
- 国内最快的推理模型!效果比肩 DeepSeek R1,速度快 8 倍!
- 最新!国产大模型清单!
- 「技能树成长计划」项目征集:点亮技能分支,成为“全能开发者”!
- 明日直播|DeepSeek-通用领域奖励模型的推理时可扩展性研究
- 智源数据新基建系列 Workshop(第1期)来了!从大模型到具身智能
- 刘鹏飞团队发布AI觉醒第二幕:认知革命已悄然降临
- 清华最新研究:强化学习竟是大模型的“应试教育”,并未突破原有潜力
- 操作系统是如何一步步发明进程间通信的?
- 检索增强生成(RAG)的最新发展:一文汇总11种新型RAG算法!
- GPT4o平替?腾讯混元&InstantX开源InstantCharacter,可实现跨角色外观、姿势和风格开放域个性化生成。
- 炸裂!ComfyUI 原生支持 HiDream-I1,全新文本转图神器来了!
- AI编程神器Cursor,保姆级教程来了!
- 智谱发布GLM-4-32B系列模型,以32B模型参数比肩GPT-4o和DeepSeek V3/R1。
- AI生图必备网站,收录5500+艺术风格提示词和2800+SREF代码,直接复制可用
- 官方出品!OpenAI教你用Agent SDK,10分钟开发智能体
- 微软上线两款新模型:增强RAG和AI Agent
- o3虽出色,但用词很奇怪……
- 突发!OpenAI与Shopify合作将推出聊天购物功能!
- 研究:幽默可轻松越狱大模型!只需一句哈哈哈,安全防护将形同虚设!
- 首篇MCP技术生态全面综述:核心组件、工作流程、生命周期
- 周六见!2025上海车展汽车智能化峰会最终议程公布,解读座舱AI Agent、端到端智驾与舱驾融合等焦点议题
- 提示工程心理学:为何 AI “答非所问” 及解决之道
2025-04-20
- 也看图结构增强的GraphRAG方案:NodeRAG实现思路解读
- 25岁当上985博导,冯磊现任东南大学教授!
- 这次终于彻底理解了 LightGBM 原理及代码
- 奥特曼的“上帝情结”:TED创始人质疑他为何有权塑造人类未来
- OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙
- 大型语言模型驱动空间智能综述:具身智能体、智慧城市与地球科学的进展
- 跑成机器人半程马拉松世界冠军,“天工”跨越了多少技术关口?
- 台大李宏毅2025 AI Agent新课来了!
- 真正的 LLM Agent
- 宇树回应机器人比赛摔倒,唯一无人陪跑机器人获亚军;月之暗面或多名产品经理离职;腾讯启动史上最大就业计划 |AI周报
- 奥特曼的“上帝情结”:TED创始人质疑他为何有权塑造人类未来
- 264页智能体综述来了!MetaGPT等20家顶尖机构、47位学者参与
- 近40年前「拉马努金图」概率的赌局,被姚班校友黄骄阳等三位数学家用物理方法终结
- 扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源
- 合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源
- 骚扰男生、套取科研经费:初步核查宫某涉嫌师德失范行为基本属实,北理工暂停其一切职务活动
- 【Python】Pandas取代Excel?
- 离职证明上有负面信息怎么办?
- 何恺明的ResNet,成为21世纪被引量最多论文,Nature最新统计
- “校长摇篮”,Top3大学!
- 清华伯克利还是无了。。。
- 计算机视觉被GPT-4o终结了(狗头)
- 吃瓜,大模型推理引擎,vLLM和SGLang 杠起来了
- 机器学习模型预测心脏移植死亡率
- 264页智能体综述来了!MetaGPT等20家顶尖机构、47位学者参与
- LeCun 被痛批:你把 Meta 搞砸了!烧掉千亿算力,自曝折腾 20 年彻底失败
- 涉嫌抄袭!中国社会科学院大学通报:停止一切工作,启动调查!
- 知乎热议 | 前几周 Deepseek 都是神一般的存在,为啥热度消散得这么快?
- 深度学习环境配置指南!(Windows、Mac、Ubuntu全讲解)
- 博士工作满2年直升副教授, 无需评审?
- 深度学习可视化大全(附github源码)
- Agentic 是个谎言,本质还是经典RL
- 浙大联合小红书发布大模型翻译最新研究成果:MT-R1-Zero,强化学习驱动机器翻译新范式!
- Think Twice: 我最好的“作品”永远是下一个
- Agentic 是个谎言,本质还是经典RL
- 全网最全2.6W字综述,深入浅出大模型核心技术:微调、推理与优化指南!
- 小白秒懂:GPU产品核心参数规格解读!
- 肖仰华丨AI也能“深思熟虑”,是福是祸?
- 不一样的推测解码!大LLM带小LLM,出奇的好,还有意外收获
- 北大+复旦发布最新最全面的Reward Model综述!
- 一张图片知道你在哪?o3-like 7B模型超越一流开闭源模型!
- RAG 与 MCP 如何以不同方式解决大模型的局限性
- 阿里&北邮提出基于Wan2.1的音频驱动数字人FantasyTalking,只需输入肖像、语音和文字即可生成动画。
- 如何使用DeepSeek进行科研图表绘制?
- TripoSG:一键使用AI在数秒内生成3D设计,支持文本/图像/涂鸦等多种方式,引领3D生成潮流!
- Github热门项目周报 | 第16周
- 4月20日周日 | 每日一图
- 4月20日周日 | Python热门项目
- 4月20日周日 | Github今日热门
- 微软偷偷上线一款MCP神器,可让Office文件秒变Markdown!
- Claude Code惊现神秘咒语!输入「ultrathink」,效果直接超神!
- CPU推理仅29ms,微软开源第一个原生 1 bit 大模型,内存只需Qwen 1.5B的1/15
- OpenAI大佬:AI上半场忙着开发新训练方法和模型GPT-4/o1/o3,下半场呢?
2025-04-19
- 多模态RAG框架LAYRA及Deepresearch、ReZero强化搜索优化实现思路
- 深度|微软CTO最新访谈: 我不相信通用Agent,未来是成千上万Agent协作的时代,聊天界面只是过渡的交互模式
- 强化学习成Scaling Law后时代的关键突破口!全球机器学习技术大会盛大开幕
- 大模型“历史的终结”,就剩下谷歌与OpenAI
- 华裔学者Nature发文:多模态AI大模型将开启生物学分析新时代
- 被 Cursor 连拒两次,OpenAI 怒砸 30 亿美元收购竞品!奥特曼新打法:大模型公司要直接做应用赚钱
- 不会吧!OpenAI 发布新 O3 和 4o-mini,居然得看算力基础设施的脸色?
- 端侧 AI 加速落地,网易有道、未来智能、李未可科技深聊智能硬件新趋势 | 直播预告
- 探索 Action Sapce,VLA 在如何演化?
- ICLR 2025|上海创智学院人才交流会,等您来~
- 5 亿月活用户的 OpenAI ,有哪些「软肋」?
- 推理模型其实无需「思考」?伯克利发现有时跳过思考过程会更快、更准确
- 英特尔®具身智能大小脑融合方案发布:构建具身智能落地新范式
- 一台3090就能跑Gemma 3 27B!谷歌发布Gemma 3全系QAT版模型
- 语音合成突破:F5R-TTS首次实现非自回归模型的GRPO优化,零样本克隆性能显著提升
- 机器学习模型预测心脏移植死亡率
- AI 爬虫核武器!Crawl4AI 横空出世,数据采集只需一行代码
- 想从小米离职了。。。
- 你根本不会用 GPT-4o…
- 不是Nvidia买不起,只是国产更有性价比!使用全国产CPU和GPU项目开发记录-训练篇
- 综述 | 图像特征提取与匹配技术
- ECCV 2024 | 快速傅里叶变换与Transformer结合用于图像恢复
- 北航等机构发布最新综述:大语言模型集成(LLM Ensemble)
- ACM MM 2025 Grand Challenge | 多模态对话方面级情感分析挑战赛
- ICLR 2025 | LLaVA-MoD:MoE蒸馏训练轻量化多模态大模型
- 阿里通义实验室招聘2026届暑期实习生/日常实习生/2025届校招/社招
- 实战教程来了!从零开始打造MCP+Ollama集成
- 昆仑万维提出开源版视频生成模型SkyReels-A2,可实现多图输入作为参考高效生成视频,超多玩法等你探索!
- 开源十几小时狂揽1w多星!OpenAI发布Codex对抗200亿美金估值的Cursor。
- 字节发布视频基础大模型Seaweed,70亿参数超越同类140亿参数视频模型效果,单GPU就可生成1080P!
- DiffRhythm:创作完整歌曲,支持文本转音乐和纯音乐生成,MacOS 上可运行!
- 一文带你了解,MOE 架构是什么?
- 《2025中国AIGC应用全景图谱报告》发布:首轮产品格局已经落定,新一轮变革蓄势待发
- 马斯克炫酷变身毒液!实测通义Wan2.1首尾帧视频模型,还能“拼接”经典梗图
- 纯自回归图像生成模型开源来了,复旦联手字节seed共同捍卫自回归
- 清华Hyper-RAG:利用超图建模高阶关系,让DeepSeek/Qwen生成质量飙升12.3%
- 微软开源MAI-DS-R1:敏感提示响应比DeepSeek-R1提升200%,风险降50%
- 智驾中的VLA方案总结
2025-04-18
- YYDS,哈工大博士的pytorch笔记终终终于公开了!!
- 落地推理大模型“慢思考”的思考及DeepMath-103K推理数据集构造方案
- DeepSeek × 时间序列 :DeepSeek-TS,基于状态空间增强MLA与GRPO的时序预测新框架
- 今日开源(2025-04-18):微软Granite-3.3,推理优化语言模型,8B/2B参数,数学/编码/指令跟随性能显著提升
- AI 教父最新警告:AI 导致人类灭绝风险高达 20%,留给人类的时间不多了!
- 中国AI模型全面爆发,AI大模型技术体系综合开源影响力榜单重磅发布!
- 最新万字长文!强化学习之父联合谷歌RL副总裁:未来不是靠强化学习算法而是「经验流」
- 华为鸿蒙背后,真实的破晓之路
- 硅基世界的“缘分”——系统与人工智能携手进化
- 超级代理来袭!混合AI路由器联动云边技术,TensorOpera 解密智能体从意图识别到复杂规划
- 竞赛总结:AFAC2024 AIGC金融多模态研究报告智能生成
- ArXiv 2025 | 北航等机构发布最新综述:大语言模型集成(LLM Ensemble)
- 4月24日相约新加坡,机器之心请大家吃饭,还有超多岗位等你来
- RSS 2025|ConRFT: 真实环境下基于强化学习的VLA模型微调方法
- 从国家级实验室前沿技术到聚焦能源智能化落地,中科类脑获国家级产业资本亿元投资
- Jeff Dean演讲回顾LLM发展史,Transformer、蒸馏、MoE、思维链等技术都来自谷歌
- AI应用创业公司:大模型最近的突破,全是作弊
- AI大时代凝聚青年智慧,2025WAIC云帆奖持续报名中
- 好玩!复旦与阶跃星辰联合发布SVG矢量图生成大模型OmniSVG!挑战3万Token极限
- 评估AlphaFold3的综合基准?澳门理工姚小军、浙大侯廷军团队开发PepPCBench
- Nature子刊,EPFL与上海交大用多模态Transformer精准预测全局最低吸附能,助力催化剂设计
- DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码
- 学术调查真相:大学老师当了领导后,论文发表就多了,不是自己的专业领域也会研究了
- 【深度学习】讲透一个强大算法模型,Transformer !!
- 基于机器学习的肺移植系统开发,以韩国数据为例
- 科研人必看!这款免费神器比Python简单10倍,论文配图直接封神!
- 通用人工智能标准、评级、测试与架构
- 王者归来!多模态大模型+具身智能彻底爆了。。。
- Deepseek应用指南:自媒体/电商/教育/开发/法律/本地生活等
- “我年入3000万美元、绩点4.0,却被15所名校集体拒绝!”这位18岁创业少年到底做了什么?
- 8个你从未听说过却能让你效率暴涨的网站
- 导师放养,偷偷发了顶会。。。
- 机器视觉学习—边缘检测
- 深圳大学教授自曝工资收入
- Reasoning 模型 RL 对齐的实际挑战
- 鲁棒音频-视觉问答新进展!西安交大、港科广提出全新测评数据集FortisAVQA与多模态大模型MAVEN助力鲁棒音视频问答
- OlymMATH: 奥林匹克级双语数学基准,R1 正确率仅为 21.2%
- 近期不容错过的EI会议,论文投稿推荐!
- 浙大联合小红书发布大模型翻译最新研究成果:MT-R1-Zero,强化学习驱动机器翻译新范式!
- OlymMATH: 奥林匹克级双语数学基准,R1 正确率仅为 21.2%
- RAG文档解析:EasyDoc文档解析API实测体验分享
- 一文详解模型上下文协议MCP
- 不用开会员,教你「无水印」下载即梦视频和图片,画质高清无损!
- 【智谷要闻】安徽省税务师行业培训班莅临AIGC智谷参观学习
- 【智谷要闻】淮南市凤台县领导干部莅临AIGC智谷参观并参加专题培训
- 【AIGC趋势】联发科打响第一枪,AI普及猛踩油门
- 【行业动态】商汤大装置发放“1亿代金券”,Amazon Q Developer正式支持中文
- 微软开源DeepSeek-R1魔改版:响应99%敏感提示,风险降50%
- OpenAI正以30亿美元洽谈收购Windsurf,加码Agent赛道
- 微软开源实时交互模型:提升Agent动态复杂处理能力
- 粉笔CTO:大模型打破教育「不可能三角」,因材施教真正成为可能|中国AIGC产业峰会
- 谷歌大模型“性价比之王”来了!混合推理模型,思考深度可自由控制,竞技场排名仅次于自家Pro
- 实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实!
- 飞猪AI意外出圈!邀请码被黄牛倒卖,分分钟搞定机酒预订,堪比专业定制团队
- 深圳又出了个智能机器人:DeepSeek加持,全球首款全域全身VLA
- 突破AI视觉“选择性失明”,哈工大首次实现指令驱动的全景式感知
- 3分钟搭建一个调用支付宝的智能体,MCP爆发,蚂蚁推了一把
- 推理大模型并非一定要推理。
- 应该对ChatGPT说谢谢吗?
- 字节重磅开源Agent UI-TARS-1.5,全面达到SOTA,超越OpenAI 和Claude!
- OpenAI分享他们在AI Agent技术的最佳实践~
- 5500颗星,完全开源的数字人实时交互平台项目
2025-04-17
- RAG范式的几种花式变体及技术特性:GraphRAG? 多模态RAG or Deepresearch?
- 今日开源(2025-04-17):Perception R1,3B多模态大模型强化学习,GRPO后训练,突破感知任务性能阈值
- 超25万次引用,谁是21世纪最火论文?
- 人工智能正在进化——并改变我们对智能的理解|Blaise Agüera y Arcas,James Manyika
- 刚刚,ICLR 2025时间检验奖颁给Adam之父!Bengio「注意力机制」摘亚军
- 大语言模型复杂推理的自我进化机制:研究综述与前沿展望
- 大模型时代下的推荐系统:深度学习与推荐系统 2.0 (文末送书)
- 让奥特曼直呼“天才”的o3 和 o4-mini,被曝捏造事实问题严重!拓展强化学习、图像思维链等亮点成陪衬?
- 生成式 AI 引爆广告效率革命,揭秘京东大模型应用架构的实践之道
- 刚刚,OpenAI发布最强推理模型o3!图像深度思考首秀,开源编程智能体已揽5k+star
- 从思考到行动:大模型自主工具调用能力的深度实现
- 本周日不见不散!ICLR 2025北京论文分享会最后报名了
- 4K分辨率视觉预训练首次实现!伯克利&英伟达多模态新SOTA,更准且3倍加速处理
- 清华学霸、OpenAI姚顺雨:AI下半场开战,评估将比训练重要
- 物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架
- 刚刚,豆包1.5·深度思考模型上线,特供「视觉版本」,大模型多模态推理的时代真来了
- 报名开启|ICLR 2025新加坡,蚂蚁集团闭门研讨会、交流晚宴等你来!
- CVPR 2025|视频抠图MatAnyone来了,一次指定全程追踪,发丝级还原
- AI强化的人性化多模态视觉辅助系统,上交大开发智能便捷的穿戴设备,登Nature
- 再以这样的方式编写 Python 函数,你就OUT了!
- 离职证明上有负面信息怎么办?
- DeepSeek多模态能力起底!一探究竟Janus 系列模型:解耦统一多模态理解和生成模型的视觉编码
- 机器学习,GPU加速159倍
- DeepSeek-VL 杀疯了!训练成本直降 80%,4K 高清图秒生成,设计师饭碗危险了?
- OpenAI 震撼发布 o3/o4-mini,直逼视觉推理巅峰!首用图像思考,十倍算力爆表
- 最快开源模型?GLM-Z1上手实测表现如何
- AUTOSAR为何成为车企刚需?
- 一人连肝7年!独立游戏最惨「翻车现场」:3.7万张手绘+500首配乐,结果连个差评都等不到……
- 2025年让你成为更优秀开发者的5个开源项目——开发者千万别错过
- 周志华教授:如何做研究与写论文?
- 代码对比工具,我就用这6个
- OpenAI姚顺雨:欢迎来到AI下半场!
- 小目标检测涨点,创新双流注意力BAFNet,即插即用!
- 太初元碁正式纳入飞桨例行发版,打造软硬件协同新范式
- 报名丨第七届智源大会,6月6-7日北京见
- 肖仰华丨大模型的数据科学!
- 腾讯发布DeepMath-103K,数学能力断崖式超过所有基线!
- 一张图片知道你在哪?7B模型超越一流开闭源模型!
- 模型眼中的世界是黑白的吗?GPT-4竟不如开源模型?颜色理解成模型新短板
- 会做题还会检查!字节Seed提出Heimdall模型让解题正确率暴增30%
- 多模态RAG综述!
- 谷歌的A2A到底是什么东西?
- 效果炸裂!Controlnet作者新作FramePack颠覆视频生成编码,6G显存即可完成单图到60秒视频生成。
- 谷歌研究院联手牛津大学推出Bolt3D!7秒内单GPU生成高保真3D,推理成本直降300倍!
- 港科&腾讯&清华提出全球首个多模态Mamba生成框架ACTalker,支持多信号输入,数字人嘴型同步再升级!
- 让DeepSeek直接生成图片,只需要一句提示词,还能无水印下载!
- 刚刚,o4-mini发布!OpenAI史上最强、最智能模型
- 谷歌提出Transformer架构中,表示崩塌、过度压缩的5个解决方法
- Adobe投资AI视频独角兽Synthesia
- OpenAI开源超火Agent,5小时破5000颗星,霸榜Github
- ChatGPT首次带图深度思考:OpenAI连发o3/o4 mini,比前代性能更强价格更低
- 围绕多智能体黑箱非凸优化共识难题,华南理工大学团队发表系列研究
- OpenAI姚顺雨:大模型下半场是产品的游戏,做研究也要有产品思维
- 最强o1也刚刚及格!中科大等团队测试视频CoT推理能力:多数模型不及格
- 最强视觉生成模型获马斯克连夜关注,吉卜力风格转绘不再需要GPT了
- DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此
- 生数科技副总裁:多模态技术定将催生全新内容平台,实现完全个性化、实时可控、可交互|中国AIGC产业峰会
- UC伯克利:让推理模型少思考,准确率反而更高了!
- 趣丸科技贾朔:AI音乐迎来应用元年,五年内将重构产业格局|中国AIGC产业峰会
- o3来了,非常出色!
- OpenAI轻量级编程AI Agent,硬核开源~
- AI 记忆不等于 RAG:对话式 AI 为何需要超越检索增强
- RAG vs. CAG vs. Fine-Tuning:如何为你的大语言模型选择最合适的“脑力升级”?
- 当编程遇上 Cursor AI:效率飞升的秘密在这里
- 突破RAG局限:探秘RARE如何重塑领域大模型新范式
2025-04-16
- 真实场景下落地RAG的十条建议及RAG中如何提升个性化?
- 今日开源(2025-04-16):智谱开源GLM新模型,深度推理Z1版性能强化,长链思考+数学代码专项优化,32B/9B参数
- 【源头活水】AI编程相关开源数据集资源汇总
- 【他山之石】GAN+强化学习=金融市场的"上帝视角"?深度解析斯坦福团队最新市场均衡模型
- 【源头活水】强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展
- 【他山之石】自动驾驶新突破!UniMamba:首个超越70mAP的LiDAR 3D检测模型
- 【源头活水】强化学习发展这十年
- 【他山之石】医疗图像去噪新突破!DiffDenoise:自监督扩散模型保留高频细节
- 中国移动发布云智算系列产品与智算一体机等多项战略性创新成果
- 微软抵制Cursor?新版C/C++插件不给用,只因它不是“官方 VS Code”!
- DeepMind通向AGI的负责任路径
- 用AI制造AI,英伟达官宣在美国造「AI超算」,超级计算系统自身的新工业时代?
- 哲学中最难解决的四大难题分别是什么?
- 从零实现 DeepSeek R1:从基础模型到强化推理模型
- 突发!英伟达 H20 芯片受到出口管制,又在美国砸下重金搞 AI 芯片生产
- “字节暗示我太穷”:Seed团队1000张H100训练7B模型,发布全球首个25秒AI视频,验证视觉生成Scaling Law?
- 做AI产品两年,我得出的实操经验
- 智能体版《苦涩的教训》,图灵奖得主Sutton、谷歌RL大佬Silver新作:超人智能靠经验
- 迈向推理时代:900+篇参考文献揭示长链思维的前世今生,最全综述来了
- Mogao=Seedream 3.0?霸榜数天,神秘文生图模型曝光(附技术报告)
- 以芯片、工具链和生态为引擎,MediaTek掀起智能体AI普及的第一波浪潮
- 何恺明的ResNet,成为21世纪被引量最多论文,Nature最新统计
- 72B世界基座模型启动,小鹏的端到端智驾正在验证Scaling Laws
- JHU提出最强ToM方法,AutoToM横扫五大基准
- 可灵AI全球发布2.0模型,史上最强视觉模型来了!网友:人人都能手搓科幻片
- 给大卫贝克的Foldit加DLC,用游戏进行人人可参与的药物分子设计
- 用Firecrawl构建AI驱动的网络爬虫,感觉又刑了!
- PPO & GRPO原理,小学生也能看懂!
- dify v0.15.3外挂ragflow知识库,保姆级教程来了!
- “实习生也月入过万”,AI行业严重缺人?
- 高校发文:清理整治富余闲散人员
- 智谱发布国内最快的推理模型!效果比肩 DeepSeek R1,速度快 8 倍,高达 200 Tokens/s
- 7B模型反超GPT-4o!港中文清华推出首个Video R1 大模型
- 清华张亚勤院士:AI必须与产业结合,像电力一样成为基础生产力
- 何恺明ResNet登顶,引用量超25w,遥遥领先!
- 博士工作满2年直升副教授, 无需评审?
- 猜猜看,我最喜欢哪一个?
- 【实测】ChatGPT 4.1 很好,但没那么好
- 2025年,AI Agent将如何”杀死”你的工作?
- 霸榜ICLR25!大模型高效推理成顶会新风向!88种创新思路,速码!
- Python项目代码看不懂?Python代码可视化神器来了,一键可视化代码结构!
- 读博士,一定不要瞎忙活。
- 拿下二区idea!即插即用创新点:多尺度注意力!
- 刚刚,OpenAI 发布 GPT-4.1!全系支持百万 token 上下文,全方位碾压 GPT-4o 并且价格更低!
- 智谱发布最快的推理模型!效果媲美 DeepSeek R1,速度吊打,快 8 倍!
- 周志华教授:如何做研究与写论文?
- MCP 的那些“坑”!
- “一天面试三家公司,都因年龄被拒”:35岁就业歧视何时休?
- 中科院2025分区表更新:科研人的避坑指南与投稿新思路
- InsCode AI IDE 2.0震撼发布!DeepSeek-V3-0324免费用:一句话生成蜘蛛纸牌+高颜值网页
- 你们的导师做过什么惊为天人的事情?
- AI封神了!无剪辑一次直出60秒《猫和老鼠》片段,全网百万人围观
- Agent完全手册(零):三大模块,三个理念
- 阿里巴巴通义实验室招聘实习生 / 25 届校招 / 社招
- 12种常见AI视觉大模型的应用赋能,全面梳理汇总!
- 少样本YOLO目标检测+零样本Kimi/QwenVL,实战应用详解!
- Transformer高效Finetune的技巧(多任务场景)
- Kaggle赛题解析:Yale/UNC-CH 地球物理波形反演
- DeepSeek知识库,持续更新!免费领取!
- FLUX文生图大模型算法解析与功能体验丨前沿多模态模型开发与应用实战第五期
- 聊聊torch-npu插件原理————华为昇腾NPU服务器是如何适配并使用PyTorch机器学习开发框架
- 已实锤:LLM确实不会真正的数学Reasoning
- 直播预约 | 264页最全综述:Agent最近进展与未来挑战
- 推理成本降98%,准确率升13%!微软提出TwT:Thinking without Tokens
- 聊一聊现在的论文指导…
- 很好的一篇国外blog:实现GRPO
- 内核视角看线程是如何一步步死锁的?
- RAG 真的已死?为什么大上下文窗口还不够(至少目前如此)
- 国产大模型崛起!智谱发布GLM-4-32B-0414系列模型,以32B模型参数比肩GPT-4o和DeepSeek V3/R1。
- 一文了解 DeepResearch:AI 如何重塑深度研究与知识整合
- 亲测 Gamma:AI 3 分钟生成 PPT ?手残党终于告别熬夜做 PPT 了!
- 图像自回归新范式!阿里达摩院提出FAR!基于频率渐进自回归的图像生成方法!
- Attention和全连接层有什么区别?
- 可灵2.0重磅升级,视频生成效果堪比影视大片,现实世界不存在了
- 超越Sora!谷歌推出Veo 2,生成8秒超逼真视频
- 用于生成4D城市的大模型—CityDreamer4D
- Hugging Face收购 Pollen,进军实体机器人
- OpenAI将进军社交网络平台,抢马斯克、扎克伯格饭碗
- AIGC最强参考!2025值得关注AIGC企业&产品榜单揭晓
- 装满智能体AI的手机,正在呼唤一个“Type-C时刻”
- 多模态生成框架新SOTA:文本+空间+图像随意组合,20W+数据开源,复旦腾讯优图出品
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- MiniMax押注线性注意力,让百万级长文本只用1/2700算力|对话MiniMax-01架构负责人钟怡然
- 招聘|量子位智库AI分析师
- OpenAI 正秘密进军社交网络!
- 一篇80页多模态RAG技术最新综述:MRAG3.0
- 终于等到了,微信聊天记录MCP:Chatlog
- AI 与非结构化数据:简单 RAG 的局限及生产级解决方案全解析
2025-04-15
- ICLR 2025 LLM优化收录创新高!Dobi-SVD超高压缩与性能完美平衡!
- 再看金融领域FinanceRAG竞赛获奖思路及20250414技术进展早报
- 93年博导教授!地大「最飒科研女神」实力出圈!
- 计算机视觉被GPT-4o终结了(狗头)
- 冲上中科院1区TOP!“频域+PINN”发高分SCI易如反掌!
- 何恺明2025新作的即插即用核心算法-DyT!!
- Nature新突破!小数据秒训神器来了!
- 物理信息强化学习爆火!登上IEEE Trans一区顶刊!
- 1+1>2!今年小波变换的结合创新思路建议(附代码)
- 目标检测DETR升级版横空出世!超越YOLO系列,高区Accept拿到手软~
- 今日开源(2025-04-15):InternVL3多模态大模型,1至78B七种参数,原生预训练强化推理,覆盖3D/工业视觉领域
- 从能力到效率,多管齐下提升大模型智能体系统的智能“密度”
- 牛津大学哲学教授发布61页长文:智能爆炸进入倒计时,我们该为“后天”准备准备了!
- 深度长文|AI 提问疑云:四大线索揭秘顶尖模型“失语”真相
- 聚焦人工智能-生物-工程交叉融合,一文综述即将到来的「技术创变」浪潮
- LLM 工程师工具箱:120+大模型库全攻略!
- 所有数据人,2025的新方向,赢麻了!
- 可灵2.0成“最强视觉生成模型”?自称遥遥领先OpenAI、谷歌,技术创新细节大揭秘!
- 大模型落地中的狂奔、踩坑和突围
- 刚刚,OpenAI发布GPT-4.1!全系支持百万token上下文,全方位碾压GPT-4o并且价格更低
- 什么样的偏好,才叫好的偏好?——揭秘偏好对齐数据的「三驾马车」
- 智谱深夜开源新一代GLM模型,推理速度快DeepSeek-R1八倍,还启用了全新域名Z.ai
- 「交交」媲美GPT-4o!上海交大推出口语对话情感大模型,首个纯学术界自研!
- 「开源版GPT-4o」来了!这个17B国产模型生图效果比肩4o,还可商用
- 免费用!阿里通义大模型上新,超逼真音视频生成SOTA!
- 30年悬案告破,平均曲率流的奇点真相曝光,揭晓「冰块融化」的数学秘密
- 继VAE之后,Adam也拿到了ICLR 时间检验奖,OpenAI联创两次获奖
- ICLR 2025 | 一行代码!FreDF频域损失稳定提升时间序列预测精度
- 聚焦人工智能-生物-工程交叉融合,一文综述即将到来的「技术创变」浪潮
- 迄今为止最大、最详细的哺乳动物脑连接图,详细展现海量神经元活动
- 突发!GitHub 被曝封禁中国区 IP
- 一文详尽之Scaling Law
- 洗个澡把 offer 洗没了。。
- 深入解析图神经网络注意力机制:数学原理与可视化实现
- 斯坦福学生搞出的论文神器太逆天!秒搜热门论文,3分钟搞定论文总结、翻译,效率飙升100倍!
- Matplotlib + Seaborn
- 只要敢捞偏门,篇篇都是顶会顶刊。。。
- 最强组合!随机森林和 CNN!!
- 百度今年的年终奖。。。
- 2025,Matlab是否依旧坚挺?
- AI浪潮下,传统产品注定走向消亡?
- 从打孔卡到AI:回顾这85年来,预言程序员“将被取代”的10次危机!
- 8个传奇网站,帮你每天节省5小时
- ICCV审稿进度进度3/3,总结了几个共性问题…
- 只因论文”碰瓷”,ICLR 2025区域主席直接拒稿!最强rebuttal,成功接收并选为Spotlight!
- Synthetic-Data-Zero-RL:让 RL 左脚踩右脚
- 基模型Cognitive Behaviors对RL的影响
- 不服跑个分,全球最快推理模型,GLM-Z1-Air系列震撼发布
- YOLOv12-BoT-SORT-ReID,无人机检测及追踪算法,问鼎无人机挑战赛(附论文与源码)
- 智谱开源新一代GLM大模型,推速度快DeepSeek-R1八倍,还启用了全新域名Z.ai!
- GPT-4.1,实力绝对被低估了
- 杀疯了!DeepSeek大模型彻底改变了传统技术…
- 40节AI公开课!技术解读、应用落地、解决方案…Create大会集中学
- 假装Reasoning也能提准确率?LLM的极简推理法,Token减半,性能翻倍
- OpenAI姚顺雨:欢迎来到AI下半场!
- 新加坡研究机构与高校发布最新Reasoning综述,从推理扩展、学习推理到Agent系统
- 重磅:智谱AI推出新一代GLM系列模型,性能媲美千亿参数模型!分享一波深度体验
- 港科&腾讯&清华提出全球首个多模态Mamba生成框架ACTalker,支持多信号输入,数字人嘴型同步再升级!
- 字节跳动提出Phantom!跨模态对齐技术实现人物/多主体完美复刻,秒杀商业方案!
- 报名 | 参加AMD AI PC应用创新大赛,开启PC端大模型应用的无限可能
- 面试官问:Dropout如何保证训练和预测阶段的一致性?
- 大模型算法工程师经典百问
- 阿里面试官问:为什么vllm能够加快大模型推理速度?
- 算法工程师直通大厂面经汇总
- 太强了!用 HeyGem 开源数字人赚钱,干货拆解建议收藏!
- 刚刚,OpenAI发布GPT-4.1,性能暴涨、100万上下文
- 微软、英伟达、苹果不受125%关税影响,获得豁免权
- Ilya新公司估值320亿美元,没有任何产品
- 67% Lazada商家称AI显著促进增长,Lazada成东南亚电商AI领军人
- GPT-4.1淘汰了4.5!全系列百万上下文,主打一个性价比
- 海豚语言被谷歌大模型破译!跨物种交流大门打开,哈萨比斯:下一个是狗
- 刚刚,智谱一口气开源6款模型,200 tokens/秒解锁商用速度之最 | 免费
- 视觉自回归生成理解编辑大一统!北大团队多模态新突破,训练数据代码全面开源
- 招聘|量子位智库AI分析师
- 北京队再上大分:新AI一句话就能搞开发,代码实时可见 | 免费可用
- 英伟达含量为零!华为密集模型性能比肩DeepSeek-R1,纯昇腾集群训练
- AI能看懂图像却算不好距离,上交时间-空间智能基准难倒9大顶尖多模态模型
- 字节视频基础大模型发布!单GPU就可生成1080P,蒋路领衔Seed视频团队曝光
- 超越ControlNet!复旦联合腾讯优图提出AI生图新框架,解决多条件生成难题
- 倒计时1天 ‼️ 万物皆可AI,but怎么用好?速戳报名中国AIGC产业峰会
- 智谱开源,深度思考、deepresearch模型。
- 智谱全系列开源!推理性能比肩最先进水平,Z.ai域名同步上线
- 重磅!谷歌新AI成功预测海豚语言!跨物种沟通新时代,要来了!
- 比R1快8倍,智谱开源GLM-Z1系列,实测 Agentic AI 也能极速深度推理!
- 理解生产级LLM系统架构:关键组件与应用实践
2025-04-14
- RAG中的表格数据序列化思路及R1类推理大模型训练实证分析
- ICLR 2025 | GRAM:多模态对齐新突破
- 今日开源(2025-04-14):Skywork-OR1,7B/32B三个推理模型,规则增强学习训练,数学和代码推理表现远超同类
- 2025中国移动云智算大会 | “云智算杯”AI+应用创新大赛启动
- 科学发现也有Scaling Laws:agent+具身机器人,击败人类顶尖科学家?
- 生物学重大发现,一种单细胞生物,表现出了匪夷所思的博弈机制
- 当人类进入第一个”量子技术年”,我们离实用量子计算还有多远?
- KDD Cup 2025:Meta CRAG-MM Challenge
- “Bug”还是“预演”?GitHub 突然“封禁”所有中国 IP,官方:只是“手滑”技术出错了
- GitHub Copilot 现可在 Windows 终端中运行了
- 10万奖金×认知升级!OceanBase首届AI黑客松广发英雄帖,你敢来么?
- 更长思维并不等于更强推理性能,强化学习可以很简洁
- 过程奖励模型也可以测试时扩展?清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o
- 中科大、中兴提出新后训练范式:小尺寸多模态模型,成功复现R1推理
- 刚刚,DeepSeek公布了推理引擎开源路径,OpenAI也将开始连续一周发布
- 合成数据助力视频生成提速8.5倍,上海AI Lab开源AccVideo
- 结合ESM-2,杜克大学开发高效PTM感知蛋白质语言模型,实现新SOTA
- 5 种被严重低估的统计检验
- 从零开始绘制DeepSeek R1架构和训练流程
- 93年博导教授!地大「最飒科研女神」实力出圈!
- 喂饭级教程!AI一键试衣,不用PS也能学会
- 你们的导师做过什么惊为天人的事情?
- 【Python】超实用!轻松控制Python及依赖库版本
- 【深度学习】连续Token助力文本生成图像迈向新高度!Kaiming团队提出Fluid:MS-COCO上实现6.16 FID
- 霸榜ICLR25!大模型高效推理成顶会新风向!88种创新思路,速码!
- 永别了,GPT-4!
- SQL-R1:通过强化学习训练自然语言到 SQL 的推理模型
- 突发,GitHub配置失误导致中国用户被锁门外,17个小时才修复
- 刚刚,DeepSeek 宣布,准备开源推理引擎
- 中科院2025分区表更新!!
- 突发!GitHub 被曝封禁中国区 IP
- 12 家单位已加入,全国首部 AI 大模型私有化部署标准欢迎参与!
- 2009年的iPhone跑ChatGPT?17岁开发者“魔改”应用,让老机重生!
- 如何在面试中,判断你的未来领导是否靠谱?
- 你也用print输出来调试代码么?
- 洗个澡把 offer 洗没了。。
- 字节Seed-Thinking-v1.5技术报告解读
- 25至30年中国互联网预测——大厂离死亡或仅24个月,个人何去何从
- 轻量级边缘检测算法,高斯模块EGA,低分辨率检测新SOTA,即插即用!(附论文和源码)
- AI芯片落地必备,GPU工作原理详解!
- 最新数据,头部企业大模型职位需求同比增幅达137%
- 百度飞桨入驻武汉人工智能计算中心,携手开启AI赋能新篇章
- 16.8万篇论文揭秘:LLM如何血洗学术界,中美暗战谁赢了?
- 啊?强大的Reasoning模型仍需好的prompt,性能暴增23%!
- Vision-R1:激发多模态大模型的推理能力
- 如何在Agent中设置Memory
- IC-Light升级,支持视频重打光! RelightVid可在多视频场景中重照明,支持文本提示、背景视频和HDR输入!
- Magic Mirror:可从单个参考图像生成电影级质量身份一致性和自然运动视频
- 重磅更新!微信电脑版终于能发朋友圈了!
- 电商带货神器!照片克隆数字人+手持商品讲解,效果太逼真了!
- 【智谷要闻】AIGC智谷×上海交通大学第二期DeepSeek大师锻造2日营圆满收官!
- 【AIGC趋势】政策设计的战略纵深,伦理治理的北京方案
- 【AIGC应用】爱簿智能开创“AI算力本”新品类,开箱即用终结配置难题
- 【行业动态】亚马逊推出全新Nova Sonic语音到语音模型,腾讯云率先上线DeepSeek-V3-0324模型API接口
- 对标OpenAI,谷歌开源Agent SDK,支持MCP、A2A、5000星
- 从明天开始,OpenAI将发布大量新产品
- ICLR高分论文险遭拒,只因未引用「造假」研究???作者怒喷:对方论文用Claude生成
- 中国初创芯片登Nature:比英伟达A10快500倍!自研光电混合技术
- 榨干3000元显卡,跑通千亿级大模型的秘方来了
- 图灵奖得主LeCun:人类智能不是通用智能,下一代AI可能基于非生成式
- 单图直出CAD工程文件!CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点|魔芯科技NTU等出品
- Yann LeCun:我不玩大模型了,那都是过去式!
- ARC-AGI vs GAIA,谁才是AGI 的超级照妖镜?
- 《大模型基础》教材发布,开源!
- 瓦力算法4月第2周急招岗位|腾讯 / 奇富 / 地平线 / 阿里 / 美的研究院 / Momenta /
- 认识谷歌 A2A:将颠覆多智能体 AI 系统的协议
2025-04-13
- 多模态RAG文档检索竞赛前三获奖方案解读:MMDocIR/KR任务
- 洗个澡把 offer 洗没了。。
- GPT-4o 图像生成的秘密,OpenAI 没说,网友已经拼出真相?
- 【他山之石】CVPR2025 Highlight | DashGaussian:200 秒内优化 3D高斯
- 【他山之石】CVPR 2025 | 魔鬼藏于统一性——即插即用分层多头注意力!
- 【源头活水】7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?
- 【他山之石】CVPR2025 | 融入SAM语义信息的双层优化蒸馏:多模态图像融合新思路
- 深度长文|多模态 Scaling Laws 新篇章:Chinchilla 范式已破?数据、模型、算力最优平衡点正在重塑
- OpenAI揭秘GPT-4.5训练:10万块GPU,几乎全员上阵,出现“灾难性问题”
- 都2025年了,人们到底在用AI做什么?国外大牛总结了100个案例
- 高盛:2025科技泡沫破裂 25 周年:经验与教训报告
- 最初只有12个人!英伟达早期架构师首次亲述CUDA发展全过程
- 深入解析图神经网络注意力机制:数学原理与可视化实现
- 刘强东被美团高管暗贬后回应;曝Qwen3 处于最后准备阶段;特朗普免除手机、电脑、芯片“对等”关税 | AI周报
- 美科技界焦虑横行:岗位减少、薪酬缩水、AI崛起
- 不用英伟达GPU!华为盘古Ultra来了:昇腾原生、135B稠密通用大模型
- 强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展
- 3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布
- 扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得
- 3D领域「源神」又开了两个新项目:三维部件编辑与自动绑定框架
- 院长买卖论文、经费滥用……:国家基金委通报2025首批不端案件,26人重罚!高校竟成‘重灾区’?
- 【Python】学习Pandas的几个好去处~
- 大模型还有哪些值得研究的方向?||大模型个性化研究进展与未来展望(综述)
- 多所高校,官宣涨薪
- 又一位!著名数学家,在美近40年后,回到中国!
- 万字详解:LightGBM 原理、代码最全解读!
- 台大李宏毅2025 AI Agent 公开课来了!
- 机器学习论文解读,XGBoost设计更易接受和有意义的医学机器学习模型的方法
- 突发,GitHub 疑似屏蔽所有中国 IP访问
- 周志华教授:如何做研究与写论文?
- 博士生经历一任导师病退、二任导师车祸、三任导师病逝后,被光速毕业了….
- 字节Seed-Thinking-v1.5技术报告英中对照版.pdf
- 北京/杭州 | 阿里通义实验室招聘LLM多轮对话方向研究实习生
- 深入浅出AI智能体系列之公众号分析推送,实战完整讲解
- TPAMI 2025,国防科大提出RGBT-Tiny数据集,助力小目标检测发展!
- Kaggle赛题解析:Image Matching Challenge 2025
- 面向人工智能,刚刚有了数据标注合规新标准
- 体验智能体构建过程:从零开始构建Agent
- 数字人技术再突破!阿里通义提出OmniTalker,从文本联合生成语音和说话视频,支持多种生成方式!
- 阿里千问发布QwQ-32B:性能肩比DeepSeek,只需DeepSeek的1/20参数,一张显卡就能跑!
- 文档分割模块优化策略梳理
- Github热门项目周报 | 第15周
- 4月13日周日 | 每日一图
- 4月13日周日 | Python热门项目
- 4月13日周日 | Github今日热门
- GPT-4.1偷偷开跑?神秘模型上线三天已被玩疯,网友发现大量OpenAI痕迹
- 人类一生所学不过4GB,加州理工顶刊新研究引热议
- 最强32B中文推理大模型易主:开源免费商用,1/20 DeepSeek-R1参数量SOTA,权重代码数据集全开源
- 这个国产开源RAG项目ChatWiki厉害了,可以搭建企业级AI知识库和微信机器人
- OpenAI 将发布「最强开源模型」!
- Meta&谢赛宁版GPT-4o:通过MetaQueries实现统一多模态模型!
2025-04-12
- RAG-Challenge金融年报问答竞赛冠军方案思路:从文档解析、提示词到路由逻辑设计
- 多模态对比学习太香了!双斩CVPR/NeurIPS!新成果及开源代码已扒
- (CVPR 2025)卷积网络复活!港大最新改进版CNN涨点起飞!
- 再见!GPT-4即将彻底下线,GPT-4o接替
- 如何坚持做难而正确的芯片研发?或许从“脏活累活”开始!|石侃——科学讲坛
- “开源版coze”爆火,融资超 4.6 亿!如今 Docker 拉取量超 1 亿,斩获 77.5k star
- 傅利叶发布首款开源人形机器人 Fourier N1,软件代码在内的完整本体资源包已公开!
- 视频、游戏、AIGC全都要!多模态大模型如何玩转落地?| 直播预告
- Anthropic 首席科学家的 AI「视界」如何判别 AGI 进程?
- 魔改AlphaZero后,《我的世界》AI老玩家问世,干活不用下指令
- 算法不重要,AI的下一个范式突破,「解锁」新数据源才是关键
- 苹果发现原生多模态模型Scaling Laws:早融合优于后融合,MoE优于密集模型
- 面对杂乱场景,灵巧手也能从容应对!NUS邵林团队发布DexSinGrasp基于强化学习实现物体分离与抓取统一策略
- RL for LLMs,强化学习的 Scaling Law 才刚刚起步?
- 如果你用过Matplotlib,请记住他的名字
- 永别了,GPT-4!
- 真正的 LLM Agent
- ChatGPT 解锁完整记忆,奥特曼彻夜难眠!所有聊天记录黑历史 AI 全知道
- 图像变换详解—从傅里叶变换到小波变换
- 速递 | YOLOv8模型改进的N种方法
- 用于图像处理的Python顶级库
- LLM Reasoning能力最近大跃进?不,都是「水分」!
- 车万翔老师的《自然语言处理:基于大语言模型的方法》得看!
- AI代理是大模型实现可扩展智能自动化的关键
- 字节提出从单一主题发展到多主题定制的通用框架UNO,通过情境生成释放更多可控性。
- olmOCR:重塑PDF文本处理,让语言模型更智能、更强大!
- 用即梦AI生成封面图,实在太方便了(附完整提示词)
- 喂饭级教程!GPT4o制作表情包上架微信赚钱,不会PS也能轻松上手
- 手机实现GPT级智能,比MoE更极致的稀疏技术:省内存效果不减|对话面壁&清华肖朝军
- Llama 4重测竞技场排名大跳水,网友:社区很难再信任Meta了
- 4090玩转大场景几何重建,RGB渲染和几何精度达SOTA|上海AI Lab&西工大新研究
- ChatGPT正转型为伴侣AI!
- 264页最强 Agents 发展与挑战综述,微软&谷歌&MetaGPT联合出品!
2025-04-11
- 大模型落地及Agent记忆的有趣观点:兼看SVG生成用多模态大模型怎么做?
- 2025年还在用KAN网络的也是神人了…
- 今日开源(2025-04-11):ScholarCopilot,AI学术写作框架,智能文本补全与引用建议,助力7B小模型论文写作
- 谈谈字节的Attention/Expert分离
- OpenManus 00后主创现场演示,Agent开发的“快”与“痛” | 万有引力
- GPT-4.5证明 Scaling Law 持续有效|Sam Altman最新直播实录
- 谷歌 Agent2Agent 协议来了!但它不是另一个 MCP
- 王飞跃:警惕商业学术警察,支持 eLife 生态变革
- 意识研究是不是“伪科学”?
- 世界科学智能大赛合成生物赛道:蛋白质固有无序区域预测 Baseline
- GPT-4.1 偷摸开测?神秘模型登顶编程榜,社区细扒指向 OpenAI,网友:营销鬼才又来了!
- 通用人工智能时代,为生命建模型,为人类造医生
- 200B参数击败满血DeepSeek-R1,字节豆包推理模型Seed-Thinking-v1.5要来了
- IC-Light的视频版本来了,RelightVid:强光动态环境下的视频光照编辑神器
- 原生多模态大模型也能强化学习,思维链长达几万字,商汤日日新V6来了
- ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
- 传统预训练正走向终结,推理优化与后训练提升有限,大模型今后如何突破发展瓶颈?
- 召回率98.5%,开源混合学习系统精准预测生物大分子中金属结合位点
- 西湖大学开发ESM-Ezy:一种用于挖掘高性能酶的深度学习策略
- Science子刊 | 基于公平贝叶斯扰动,首个面向医学图像生成公平性的方法FairDiffusion来了
- PINN:用深度学习PyTorch求解微分方程
- 研究生必看!如何成为导师心中的“完美学生”?六大建议助你脱颖而出!
- 刚刚,李飞飞团队发布《2025年人工智能指数报告》:12大趋势证明,AI不再只是关于可能性的故事
- 复旦大学校长:推进教师年薪制
- 【教程】搭建纯本地个人知识库,打造DeepSeek加持的第二大脑
- 引用240篇大模型论文,大模型推理中的缩放研究综述
- 聊聊强化学习发展这十年
- AI浪潮下,嵌入式开发的处境如何?
- AI 抢饭碗「实锤」!Shopify 招聘新规曝光,CEO 放话:AI 搞不定的才能招人!
- 不要再像我这样使用 React 导入了,试试 Wrapper 模式吧!
- 论文党狂喜!alphaXiv推出Deep Research一秒搜遍arXiv,研究效率直接爆表
- 2025 TPAMI综述 | 全新视角红外与可见光图像融合完整理解与入门!附GitHub最全开源对比方法结果!
- 相机标定(Camera calibration)原理及步骤
- 传统行业AI智能化,算法研发如何避免项目化?
- 低光照检测算法YOLO-LLTS,高分辨率特征+多分支注意力,多数据集SOTA!
- 构建Agentic RAG 系统的方法汇总。
- 竞赛总结:AFAC2024 金融工具Tools识别
- 燧原正式纳入飞桨例行发版,打造软硬件协同新范式
- NYU发现Reasoning模型有第六感!可提前预判答案,少干活还拿高分!几乎无损
- 想得久≠答得对!LLM应该自主决定Reasoning长度!
- “反转诅咒”彻底解决,反向推理准确率96%!新架构突破LLM多年认知瓶颈
- Agent系列教程01-什么是Agent?当今为什么这么重要?
- Think Twice: 我最好的“作品”永远是下一个
- 图像生成DeepSeek时刻?智象未来开源文生图模型HiDream-I1,17B参数,GenEval和DPG基准测试第一名!
- 奥特曼难以入睡!ChatGPT 解锁完整记忆,所有聊天记录 AI 全知道了,包过“黑历史”
- 太强了!AI生成故事绘本、四格漫画,效果炸裂完全免费!
- 马云最新公开演讲:要让AI服务人类,而非取代人类
- 突发!特朗普将中国关税提升至145%,美股暴跌
- 刚刚,OpenAI开源BrowseComp,重塑Agent浏览器评测
- 面向营销人员的8大国外AI Agent
- 谷歌发布第七代TPU:性能大涨,专为大模型设计
- ChatGPT终于发布长期记忆功能,开启个人Agent时代
- 2025年全球AI指数报告
- ChatGPT有了完整记忆!像朋友一样记住所有聊天记录,回复更加私人订制
- 7B小模型写好学术论文,新框架告别AI引用幻觉,实测100%学生认可引用质量
- 字节新推理模型逆袭DeepSeek,200B参数战胜671B,豆包史诗级加强?
- 宇树机器人上演好莱坞《铁甲钢拳》!网友激动表示:比CG还CG
- OpenAI前CTO爆炸开局:种子轮开盘20亿美元!0产品0用户估值直奔100亿,GPT论文一作也加入了
- 全球首个Linux开发本:50TOPS算力,DeepSeek都配好了,可随地大小开发
- 让机器人更像人类有了新方法!港科大新算法对齐人机动作形态,无需重复训练,轻量模块通用且适配
- 移动端AI安全再突破!水印保护新范式:403个AI App成功保护率超8成
- 又一上海人形机器人加入开源!全套图纸+代码,来自傅利叶
- SOTA自动绑骨开源框架来了!3D版DeepSeek开源月大礼包持续开箱ing
- OpenAI放大招!BrowseComp来了,AI上网能力大比拼!
- 为什么说Scaling Law是宇宙的一种属性?
- 炸裂!AI大模型彻底爆了!!
- 最强高质量SVG生成大模型OmniSVG来袭,复旦&StepFun出品!
- 开源推理大模型全面开花的一周:多模态、RAG、Agent、编码
2025-04-10
- 多模态RAG及多模态R1推理中如何为不同的视觉数据生成描述Caption?OMNICAPTIONER实现思路
- 【NeurIPS2024】跨域知识蒸馏登顶会啦!
- 今日开源(2025-04-10):Kimi-VL,16B高效多模态模型,长上下文+CoT推理,强化学习优化,实现卓越视觉语言能力
- 【他山之石】首次引入强化学习!火山引擎Q-Insight让画质理解迈向深度思考
- 【他山之石】铰链物体的通用世界模型,超越扩散方法,入选CVPR 2025
- 0.72秒生成3D世界!建模提速15倍!极佳&北大等的WonderTurbo强势登场,可实时交互!
- AMD ROCm™ AI开发者交流会——大模型推理与开源创新专场
- “MCP 意味着工具平权!”
- 当AI成了同事,程序员还能做什么?
- 最新:Google 牵头搞了个 A2A,以后不同家的 AI 都能“加好友”了
- AI的「神之一手」,将在人类探索的每个领域再现|AlphaGo之父最新访谈
- 阿里云刘伟光:新一代大模型锁定两大技术演进方向
- 西湖大学郭天南解答AI虚拟细胞难题:在三重数据支持下的闭环学习系统
- 行业落地分享:MIT使用Agent智能汽车设计
- 谷歌开始抢占智能体地盘!发布 A2A 开源协议打破企业间 Agent壁垒,OpenAI 系缺席标准之战
- 又一个“天选打工人”来了!擎朗智能发布首款人形机器人 XMAN-R1:基于真实数据打造,为服务而生
- 从单点到全员:极客时间 AI 人才培养全景方法论和实战
- 因研发FPGA工具,丛京生院士获得ACM计算突破奖
- 大模型推理无损加速6.5倍!EAGLE-3碾压一切、延续Scaling Law能力
- MoE模型已成新风口,AI基础设施竞速升级
- 42.5 Exaflops:谷歌新TPU性能超越最强超算24倍,智能体协作协议A2A出炉
- CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别
- 闭环端到端精度暴涨19.61%!华科&小米汽车联手打造自动驾驶框架ORION,代码将开源
- 西湖大学郭天南解答AI虚拟细胞难题:在三重数据支持下的闭环学习系统
- 科学家用GNN进行不确定性量化,实现高效的分子设计,登Nature子刊
- 没想到,更改import方式,Python 启动提速 5 倍!
- YYDS,哈工大博士的pytorch笔记终终终于公开了!!
- 爆火全网,华人AI版《猫和老鼠》,60秒经典泪目
- 上海交大原副校长,加盟福耀科技大学
- 程序员必备,第一本DeepSeek宝典
- 【教程】打造个人知识库,线上、免费
- 大模型推理引擎之:SGLang
- 爆火的MCP,一图说明白!
- 洗个澡把 offer 洗没了。。
- Llama 4刚开源就“翻车”?员工曝内幕:训练时作弊、刷分造榜,自己已选择辞职!
- 不想职场过得苦,这4种心态一定要趁早戒掉!
- 高校发文:清理整治富余闲散人员
- 为什么图像处理如此困难
- Kimi-VL技术报告英中对照版
- 端到端的训练,怎么复现 Deep ReSearch(上) :先从 Deep Search 做起
- SSMA-YOLO,轻量级检测模型,增强特征提取与融合,适用无人机航拍的船舶图像检测!
- Vision-R1:第一个多模态视频Reasoning方法+模型,7B小模型逆袭GPT-4o!
- 赢麻了!全体程序员彻底狂欢吧!这个好消息来得太及时!
- SAM+想象力!清华新模型SAMEO:遮挡物体也能完整分割,分割万物模型学会脑补!
- 10种竞赛数据预处理中的数据泄露模式解析
- 企业命题征集:2025中国高校计算机大赛-人工智能创意赛欢迎您的加入
- 60.4分!字节Seed团队VAPO刷新Reasoning纪录:训练快10倍,错误率砍半
- NICE54期 | 首个面向天文学的大规模多模态基础模型
- 如今的Reasoning模型都不具备批判性思维!简单问题, Overthinking!离谱
- 聊聊 LLM 推理引擎中,那些已经成为事实标准的优化方法
- 数据太复杂?DeepSeek自动处理数据,AI 1秒搞定!
- APIGen-MT:高效生成多轮人机交互Agent数据的两阶段框架
- 图生3D新SOTA!港中文&字节&清华联合提出Hi3DGen:通过法线桥接从图像生成高保真 3D 几何图形。
- 上海AI Lab提出FaceShot!地标匹配+语义驱动,让任何角色瞬间“活”起来!
- ComfyUI插件安装失败率90%?教你4种方法0踩坑
- 面试官问:说一下有哪些 RAG 流程优化策略?
- 面试官问:大模型领域,有哪些提高大规模模型的训练和推理效率库?
- 面试官问:深度网络中loss除以10和学习率除以10等价吗
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 豆包疯了!新出AI云盘无限容量、不限速度、完全免费,赶紧用起来!
- 48.4K+ Star!RAGFlow:一个基于深度文档理解的开源RAG引擎
- 4月10日周四 | 每日一图
- 4月10日周四 | Python热门项目
- 4月10日周四 | Github今日热门
- 突发!特朗普把中国关税提高至125%,其他国家暂时降至10%
- AI Agent大变天!谷歌开源A2A,一夜改变智能体交互
- 斯坦福等开源代码定位AI Agent,极大提升开发、维护效率
- 谷歌升级AI搜索,加入视觉搜索功能
- 4 月 11 日《1 小时 AI 公开课》,帮传统企业 “点亮” AI 魔法灯!
- 招募 AI 咨询专家 | 丰厚收入 、40万+企业级客户需求
- 谷歌最新AI芯片打平英伟达B200,专为推理模型打造,最高配每秒42500000000000000000次浮点运算
- “谷歌版MCP”来了!开源A2A,不同厂商Agent也能协作
- 招生 | 南大FinTech大模型实验室招募斯坦福国际联培博士生(2026)
- 字节开源新生图模型:一个模型统一所有生图任务,多主体融合效果SOTA
- Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B
- 刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理
- 流体力学专用版DeepSeek,单GPU可跑,成本节约高达100倍
- AI优化芯片布局,设计阶段即考虑最终性能,中科大华为诺亚新方法入选ICLR 2025 Oral
- deepseek开源的新算法,浅析~
- Ilya正使用谷歌TPU进行SSI的AI研究!
- 多Agents 圈的 MCP:谷歌全新Agent2Agent 协议开源!
- 利用 Docker Compose 构建定制大语言模型(如 Deepseek、Mistral 等)运行环境
- 提示工程中的思维结构:让大语言模型更聪明地思考
- 大概念模型(Large Concept Models)会取代提示工程吗?
- 从杂乱到精准:RAG 问答系统数据集的清洗蜕变之路
2025-04-09
- 多模态RAG及SQLRAG方案总结、大模型应用中的追问及Agent操作UI逻辑思考
- ICLR 2025 | 精度近乎无损!首个Mamba系列模型量化方案MambaQuant
- 今日开源(2025-04-09):DeepCoder,代码推理大模型,分布式强化学习微调,14B参数性能媲美o3-mini
- 2025全球机器学习技术大会最新最全日程来了,一键Get参会指南!
- Claude深度“开盒”,看大模型的“大脑”到底如何运作?
- AI发论文被顶会接收?拿到6/7/6同行评审的AI Scientist-v2有多强,技术细节来了
- 斯坦福大学:2025 年人工智能指数报告
- MaaG:迈向世界模型,解决生成式游戏中的数值与时空一致性难题
- 一文把握AI Agent发展趋势,更好地在AI时代找到属于自己的机会
- 从暴力剪枝到智能微调!一文速通LLM
- Kaggle赛题解析:Yale/UNC-CH 地球物理波形反演
- Llama 4 先后被 DeepSeek、英伟达暴击,Meta 不再是大模型开源“霸主”了
- Devin 2.0 登场,AI 软件工程产品价格暴跌,从 500 美元直降至 20 美元!
- 全日程揭晓!ICLR 2025论文分享会我们北京见
- 从零搭一套可复现、可教学、可观察的RL for VLM训练流程,我们试了试
- AI封神了!无剪辑一次直出60秒《猫和老鼠》片段,全网百万人围观
- 论文党狂喜!alphaXiv推出Deep Research一秒搜遍arXiv,研究效率直接爆表
- CVPR 2025 HighLight|打通视频到3D的最后一公里,清华团队推出一键式视频扩散模型VideoScene
- 南洋理工&普渡大学提出CFG-Zero*:在Flow Matching模型中实现更稳健的无分类器引导方法
- AI发论文被顶会接收?拿到6/7/6同行评审的AI Scientist-v2有多强,技术细节来了
- 量化单个细胞中表达的一半蛋白质组,质谱技术最新进展推动SCP发展
- MCP:AI 的「万能插头」
- 读博士,一定不要瞎忙活。
- 【深度学习】一网打尽!5大深度学习模型!RNN、CNN、Transformer、BERT、GPT
- 建议取消发布中科院预警期刊名单?
- 今天收到一封自称是学生的求助邮件,第一次选择了“不回复”
- 【Python】Python脚本运行速度太慢,用这10个方法解决
- 2025国自然, 初审结果时间公布了!
- 互联网活菩萨Cloudflare,免费RAG方案
- 登上顶会,时序大模型新突破!
- 独自一人,怒发数篇 SCI。。。
- Llama 4 爆料大反转,没在测试集上训练!华人员工实名辟谣,LeCun 出面救火
- 下一个十年,不懂大模型的产品将被淘汰?
- 强制员工“带薪休假”1年?谷歌DeepMind竞业条款遭炮轰:宁可花钱白养,也不肯放人!
- Next.js 15:我才知道居然还有这个组件!
- CLIP被淘汰了?LeCun谢赛宁新作,多模态训练无需语言监督更强!
- 【2025年 即插即用】新颖的四边形注意力,CV任务统统涨点!
- 使用Python Pip的10个技巧
- 《DeepSeek知识库》来了!!!
- Llama 4技术全景与代码解读:MoE架构革新、10M上下文突破
- 25年什么样的 Agent 会脱颖而出:简单胜于复杂
- 国内外知名大模型及应用列表(2025)
- 这道填空题,你敢做吗?飞桨领航团团长年度招新
- 报名|智源Workshop:欧洲“蓝脑计划”创始人Henry Markram、神经科学家Sean Hill讲座
- 腾讯AI Lab联合苏大提出一种新颖的RL评分方法,7B小模型暴打72B巨头!
- 你说量化到底伤不伤害Reasoning啊?一项实证研究
- 3倍效率学习的漫画书《StatQuest图解机器学习(全彩)》
- 怎么构造思维链数据?思维链提示工程的五大原则
- TripoSG:一键使用AI在数秒内生成3D设计,支持文本/图像/涂鸦等多种方式,引领3D生成潮流!
- IBM提出多模式图像文本到文本模型SmolDocling,可实现代码 | 公示 | 图表 | 表格 | 标题 高效转换!
- 音视频同步生成的终极突破!浙江大学提出JavisDiT!HiST-Sypo技术实现帧级对齐!
- 2025年最值得收藏的10个AI声音克隆神器,3秒克隆任何人声音,自媒体人必备!
- 论文简读|OmniSVG!一个统一的SVG矢量图生成模型|阶跃星辰×复旦
- 媲美OpenAI-o3,刚刚开源模型DeepCoder,训练方法、数据集大公开
- 英伟达开源15T数据集:32万个机器人训练轨迹
- 亚马逊正测试AI Agent,增强购物体验
- Isomorphic Labs获6亿美元,加速 AI 药物研发
- 李飞飞团队提出世界模型基准:“世界生成”能力迎来统一评测,3D/4D/视频模型同台PK
- 首个统一多模态模型评测标准,DeepSeek Janus理解能力领跑开源,但和闭源还有差距
- 大模型一体机塞进这款游戏卡,价格砍掉一个数量级
- 阿里云造“Agent工厂”,百炼MCP服务上线,无需代码5分钟人人都可搭建Agent
- 芯片设计效率提升2.5倍,中科大华为诺亚联合,用GNN+蒙特卡洛树搜索优化电路设计 | ICLR2025
- 剪枝60%不损性能!上海AI Lab提出高斯剪枝新方法,入选CVPR 2025
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 倒计时1周!20余位行业大佬共话AI,中国AIGC产业峰会最全攻略在此
- 用梯度下降求解整数规划,中科大等提出无监督训练整数规划求解器新范式 | ICLR 2025 Spotlight
- 看一遍就会!这个AI 要淘汰掉90%的打工人了!
2025-04-08
- 知识图谱+知识库RAG项目Yuxi-Know及大模型推理内部可视化工具OpenMAV实现拆解
- Transformer+UNet到底是谁想出来的点子!用来创新真的太绝了!
- 今日开源(2025-04-08):MedReason助力医疗推理大模型,临床问答化为推理链,结构化知识图谱驱动诊断,8B参数最优
- 【他山之石】CVPR 2025 | 魔鬼藏于统一性——即插即用分层多头注意力!
- 【源头活水】英伟达GPU命名背后:是情怀,也是致敬伟人的智慧!
- 强制员工“带薪休假”1年?谷歌DeepMind竞业条款遭炮轰:宁可花钱白养,也不肯放人!
- AI 已学会「阳奉阴违」——OpenAI 研究发现:罚得越狠,AI 作弊就越隐蔽
- DeepMind首席科学家万字访谈实录|真正的AGI需要推理、智能体和记忆系统的协同突破
- 世界知名研究机构:基础智能体的进步与挑战研究报告,从类脑智能到进化、协作和安全系统
- 万字追问:我们能用数学来解释意识吗?
- 重塑对称理论的数学家,获得2025年阿贝尔奖
- 大模型评测Chatbot Arena 与 ELO 原理
- 18 岁亿万富豪遭名校集体拒收!高中靠 AI 狂揽 300 万用户,入学申请竟成“炫富”翻车现场?
- 拿 20 年前的苹果“古董”笔记本跑模型推理:九分之一现代 CPU 速度,但成功了!
- 首次引入强化学习!火山引擎Q-Insight让画质理解迈向深度思考
- Llama 4在测试集上训练?内部员工、官方下场澄清,LeCun转发
- 斯坦福2025 AI Index报告来了:DeepSeek在全文中被提到45次
- 类R1强化学习迁移到视觉定位!全开源Vision-R1将图文大模型性能提升50%
- 颠覆传统信息搜索,效果是之前SOTA的三倍?UIUC韩家炜、孙冀萌团队开源DeepRetrieval,让模型端到端地学会搜索!
- 迈向机器人领域ImageNet,大牛Pieter Abbeel领衔国内外高校共建RoboVerse,统一仿真平台、数据集和基准
- UI-R1|仅136张截图,vivo开源DeepSeek R1式强化学习,提升GUI智能体动作预测
- AI让材料科学开挂了!这场闭门会就缺你这枚“关键队友”
- 用于科研的AI:Nature教你如何选择正确地选择工具
- 20人创业公司,老黄数亿刀收购!AI大牛贾扬清、白俊杰已入职英伟达
- 2025深圳大学年度经费75亿,全国地方高校第一
- 【CVPR 2025】惊艳!即插即用,一种轻量级多感受野视觉Mamba网络
- Matplotlib 200个小技巧-上篇
- Matplotlib 200个小技巧-下篇
- 为什么你在国内高校实验室里发不出顶会顶刊?
- 王炸组合!扩散模型+Transformer 彻底爆了。。。
- 喂饭级教程!AI 一键试衣,不用 PS 也能学会
- 终于!CUDA 官宣:添加原生 Python 支持,开发者狂喜
- “多家企业落实4.5天工作制”:我们离上四休三还远吗?
- Mamba再出手!助力图像增强提速21倍,Transformer时代终结?
- 【深度学习】图解自注意力机制(Self-Attention)
- 在哪里能找到流行的ML/DL的论文和源码
- 如何看待MCP?大模型工具调用的解耦!
- 阿里巴巴校招&实习
- 一言一行|雨林深处的公益:一言用户和亚洲象的故事
- 飞桨领航团达人创造营宣布扩容!二班启动招募!
- 聊聊华为昇腾MindSpeed-LLM——Deepseek-R1-QWen2.5-32B的推理与合并
- NAACL2025 Oral | LLM的知识边界到底在哪里?
- 一个“打脸”结论!模型太大反而会损害推理能力
- 像人类一样看视频!VideoMind提出长视频推理新范式,超越 GPT-4o,AK两次转发!代码、数据、Demo全开源
- 操作系统是如何一步步发明系统调用机制的?
- 构建Agentic RAG 系统的方法有哪些?
- EasyControl,开源免费「吉卜力」风格图像生成,效果不输给GPT-4o!
- 字节开源换脸写真模型InfiniteYou,可实现零样本身份ID一致保持,无缝集成FLUX、ControlNets、LoRAs!
- 阿里同义提出风格化实时肖像视频生成框架ChatAnyone,4090可实现实时交互式视频聊天。
- 智谱大模型算法面试,有点质量!!!
- 面试官问:大模型领域,有哪些提高大规模模型的训练和推理效率库?
- 面试官问:深度网络中loss除以10和学习率除以10等价吗
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 告别真人录制,用数字人自动生成高质量PPT讲解视频,只需3步!
- 53.9K+ Star!Browser Use:一个让AI代理轻松控制浏览器的神器
- 4月8日周二 | 每日一图
- 4月8日周二 | Python热门项目
- 4月8日周二 | Github今日热门
- 反击DeepSeek失败!Llama 4效果不好,Meta承认有问题
- 阿里开源R1-Omni,多模态情感识别
- 上海交通大学发布“明岐”多模态大模型 突破消化道罕见病诊断瓶颈
- Llama 4遭竞技场背刺!实锤用特供版刷榜,2000+对战记录公开
- Git诞生20周年!大佬Linus十天写出的项目,彻底变革全球软件开发
- 速戳报名 ‼️ MSRA华为百度齐聚,AIGC峰会等你来AI
- AI危险检测再进化!三层级解析长视频异常,各种时序粒度均有明显优势 | CVPR HighLight
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- “是我创造了第一个LLM”!Kaggle前首席科学家一句话引发AI学术圈考古行动
- 李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了
- TextIn+Dify/Coze搭建Agent指南,简单易上手!
- 开源本地部署的GraphRAG chatwiki,支持DeepSeek接入微信里的聊天机器人
- 大模型面经:RAG与Long context“相爱相杀”背景下,如何设计最优解决方案?
- Meta 的 LLaMA 4 系列来了:推动开源 AI 的边界
- 一个简单技巧让你的 LLM 更可靠
2025-04-07
- 老刘说NLP社区第41讲-大模型基本代码实操-部署\微调\文档解析\RAG\Agent回顾:社区持续对外纳新
- 清明假期大模型技术进展回顾:llama4大模型、EasyControl吉卜力风格开源模型及LLM后训练技术总结
- 深入解析图神经网络注意力机制:数学原理与可视化实现
- 【CVPR2025】图像恢复+mamba
- 今日开源(2025-04-07):Meta发布Llama 4系列,17B/288B三种MoE模型架构,支持文本/图像/视频理解
- 10年后机器人比人多?前百度总裁、清华院士张亚勤预言AI未来!
- 深度长文|告别“伪智能体”:LLM只是引擎,造出真正的AI Agent还需要这几大“硬核零件”
- 2025年科学突破奖公布,刘如谦、司美格鲁肽研究先驱、多发性硬化症研究先驱获生命科学奖,物理学奖授予13508名物理学家…
- 突发!发文量巨大的美国公共数据库已禁止中国用户使用,Pubmed 呢?
- Dify-Plus:一个定制化的Dify二开开发
- 强化学习+ RAG:从基础到优化的完整实现
- 击败 Manus?前百度 AI 高管创业1年多,放弃500 万用户搜索产品,转推“最强 Agent ”,自述 9 个月研发历程
- OpenAI 发布大模型现实世界软件工程基准测试 SWE-Lancer
- Meta Llama 4被疑考试「作弊」:在竞技场刷高分,但实战中频频翻车
- ILLUME+:华为诺亚探索新GPT-4o架构,理解生成一体模型,昇腾可训!
- 论文读得慢,可能是工具的锅,一手实测科研专用版「DeepSeek」
- 反向传播、前向传播都不要,这种无梯度学习方法是Hinton想要的吗?
- MoCha:开启自动化多轮对话电影生成新时代
- 铰链物体的通用世界模型,超越扩散方法,入选CVPR 2025
- Nature子刊,字节跳动开发MD模拟预测框架,助力锂电池液体电解质研究
- SmolDocling:重新定义OCR文档智能处理
- 硕士生毒死舍友,一审被判死刑!
- 【Python】100个字典编程小技巧,让你成为Python高手
- 特朗普扼杀全美 GPU 供应链?科技大厂核心 AI 算力告急,硅谷陷巨大恐慌
- 聊聊强化学习发展这十年
- 博士毕业三年,仅29岁,破格晋升为985大学教授
- 惊天丑闻!AI大佬愤而辞职。。。。
- PPO & GRPO原理,小学生也能看懂!
- 用大模型下载论文、总结论文,效率飞起
- 【人工智能 · 重点EI会议】往届已完成检索!国内外知名高校联合主办!
- Python Orange:托拉拽玩转机器学习、数据挖掘!
- 建议取消发布中科院预警期刊名单?
- Llama 4 训练作弊爆出惊天丑闻!AI 大佬愤而辞职,代码实测崩盘全网炸锅
- 车机系统越来越多,我们该怎么办?
- 人人可复现QwQ,蚂蚁清华联手放大招!彻底开源RL框架AReaL-boba
- 如何在网页上高效渲染 1000 万张小图片的?
- Llama 4训练作弊爆出惊天丑闻!AI大佬愤而辞职,代码实测崩盘全网炸锅
- TPAMI 2025 | 国防科大提出RGBT-Tiny数据集与SAFit指标,推动小目标检测技术发展
- TIV 2024 | MDFD2-DETR:一种基于多域特征分解与去冗余的实时复杂道路目标检测模型
- 《大模型基础》教材发布,开源!
- 各种角度全面聊聊Llama 4~
- 关于The Bitter Lesson
- CVPR 2025,即插即用MambaOut,图像分类、目标检测多场景SOTA!(附论文及源码)
- Llama 4发布,AI大佬愤而辞职!训练作弊惊天丑闻,代码实测崩盘全网炸锅!
- 10家单位已加入,全国首部AI大模型私有化部署标准欢迎参编!
- 李宏毅2025 AI Agent新课来了!(附PPT)
- 多模态Reasoning新综述!从训练优化和实时推理角度全面总结
- 强大新RAG范式!动态将上下文转化为参数知识,有效缓解RAG幻觉!
- 你写的每一行代码都在贬值?怎么让存量资产价值翻倍
- 再次封神!AI大模型又起飞了!
- 大模型系统性能优化trick
- 年薪96W!真心建议数据人冲一冲新兴领域,工资高前景好
- 受尽PPT 周报折磨!DeepSeek拯救打工人
- 推理模型不一定说的是真话:关于大模型“思维链”的隐藏真相
- Mistral 发布 Mistral OCR,号称世界上最好的 OCR 模型!一起来看实际效果!
- 浙大提出视频生成方法VidSketch:可从手绘草图和简单的文本描述生成高质量视频动画。
- 阿里提出文生卡通新方法Textoon:一分钟内生成丰富多彩、可交互的Live2D格式角色。
- 发现一个用AI写公众号的窍门,篇篇10万+流量主收入赚麻了!
- 1000万上下文!新开源多模态大模型,单个GPU就能运行
- 谷歌等最新研究,合成数据可将大模型数学推理提升8倍
- 企业级AI实战内训课程 | DeepSeek全景学习指南
- 13万总奖金!AIGC岳阳楼大赛携社区小赛正式开启 | 千年名楼邂逅AI浪潮
- AI抢人大战!阿里国际启动大规模校招,80%为AI岗位
- 米哈游蔡浩宇新作iPhone实机演示:10分钟就被AI小美撩到脸红,她的命运由我拯救
- Llama 4发布36小时差评如潮!匿名员工爆料拒绝署名技术报告
- 中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%
- 速戳报名 ‼️ 最新AIGC峰会嘉宾在此,4月16日,来和大佬们一起AI
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 奥特曼最新访谈认可“套壳”:多数改变世界的公司,最初都是这样的
- 首个个性化对齐大模型问世!可精准识别用户内在动机和偏好,还有百万用户画像开源数据集 | 蚂蚁&人大
- “充电厂商”为何跨界AI眼镜?对话闪极创始人张波
- 清华耶鲁推理模型新范式:动态推理实现高效测试时扩展,大大节省Token消耗
- 突发!OpenAI考虑收购奥特曼和Jony Ive的初创公司
- AGI Hunt Day04:Llama 4性能引争议、AI编程效率将提升10倍、Claude 4即将发布
- LlaMa 4 翻车了!
- Llama4 刚开源就要被网友玩坏了~
- 探秘 LLM Agents:ReAct 框架藏着哪些惊喜?
2025-04-06
- Llama4模型四点核心总结及大模型推理数据合成工具Project Loong
- RAG&KG&LLM&文档智能技术前沿:老刘说NLP技术社区持续对外纳新
- Anthropic的研究:思维链CoT的安全隐患
- 杨立昆:靠文本训练LLM,不可能实现人类水平AI(演讲实录)
- 从0到1玩转MCP:AI的「万能插头」,代码手把手教你!
- 微软诞生50周年,比尔・盖茨撰文忆往昔,并发布了Altair BASIC源代码
- 钉钉创始人回归,曝开始抓考勤等;Meta开源Llama 4:架构重构;美爆发超1200场示威反对新政,特朗普喊话:挺住|AI周报
- Dapr Agents 发布:支持规模化 AI 工作流、多智能体协作
- 解构多模态,GPT-4o 的自回归路线真的走通了吗?
- Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek
- 从0到1玩转MCP:AI的「万能插头」,代码手把手教你!
- CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo
- 大语言模型变身软体机器人设计「自然选择器」,GPT、Gemini、Grok争做最佳
- 新SOTA,AI增强医学蛋白质组数据分析,扩散模型驱动的从头肽测序
- 10个令人惊叹的开源AI项目,诞生了!
- 程序员必备!一本书带你玩转DeepSeek编程
- 26岁北大硕士毕业成为食堂阿姨:不用脑力劳动,比在大厂更快乐
- 【机器学习】最强总结!8个线性回归核心点!!
- 刚毕业入职硅谷大厂,整个团队被裁掉了。。。
- 专家 A: 90 分,专家 B: 56 分!研究生论文盲审俩分数相差34分不让答辩,导师怒发朋友圈:离谱至极…
- 刚刚,特朗普扼杀全美 GPU 供应链?科技大厂核心 AI 算力告急,硅谷陷巨大恐慌
- 奥特曼官宣:免费 GPT-5 性能惊人,o3 和 o4-mini 抢先上线!Llama 4 也鸽了
- 突发,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座
- 为什么导师总说,科研搞好了,工作随便找?
- CVPR 2025 | 新颖的L型卷积,即插即用,高效扩展空间感受野!
- LLama4震撼发布:288B、原生多模态、超越 GPT-4.5、Claude 3.7 、Gemini 2.0 Pro
- 小目标检测算法涨点必备,EFC特征融合,即插即用!(附论文和源码)
- 最初只有12个人!英伟达架构师首次亲述CUDA发展全过程!
- Llama 4发布!超越DeepSeek
- 最新!Llama4突然发布!超越deepseek!开启超高性价比原生多模态AI和开源MoE的新时代,并公开训练策略!
- 各种角度全面聊聊Llama 4~
- 最新成果:基于图的 RAG 统一框架 in-depth 分析
- 136个样本训练8小时!UI-R1如何让小模型吊打GPT-4?
- Llama 4 系列:开启原生多模态 AI 创新的新纪元
- 别停留在DeepSeek表面,这本书用30个核心问题深度解析AI技术的底层原理!
- Github热门项目周报 | 第14周
- 4月6日周日 | 每日一图
- 4月6日周日 | Python热门项目
- 4月6日周日 | Github今日热门
- LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯
- 超九成年轻人工作学习离不开AI,人均还有1.8个AI朋友丨Soul《2025 Z世代AI使用报告》
- 中科大华为发布生成式推荐大模型,昇腾NPU可部署,背后认知一同公开
- 速戳报名 ‼️ 最新AIGC峰会嘉宾在此,4月16日,来和大佬们一起AI
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- llama 4, 开源!
- Meta发布Llama 4多模态MoE系列模型!全网专家点评
- 刚刚,DeepMind发大招:145页AGI 安全报告来了!
- 突发,Llama4 开源,开源圈新的王,冲!
- 深度解析 Graphite:事件驱动的 AI 代理框架
- AI Agent 评测新利器——OpenAI 开源 PaperBench
2025-04-05
- Deepresearch核心技术:如何通过强化学习增强推理大模型搜索规划及反馈能力?
- “具身智能”顶会大爆发!李飞飞新作获最佳论文,这思路我吹爆!
- 【他山之石】本周大模型新动向!DeepSeek-R1 安全性存在短板?
- 【他山之石】三思而后行,让大模型推理更强的秘密是「THINK TWICE」?
- Science颠覆认知:你的大脑不是“机器”,而是一支交响乐团!
- 1W8000字 从理论到实践: MCP 在 7 大 AI 框架中的具体应用
- 人类如何与超级智能共存?为AI立心 对话人工智能专家曾毅丨面对面
- 增强智能:与杨立昆教授对话反思
- 台大李宏毅2025 AI Agent新课来了!
- 微软50 周年庆典,员工当众怒斥历任CEO!纳德拉也要让每个人都能成为开发者
- 10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型
- 7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?
- 微软诞生50周年,比尔・盖茨撰文忆往昔,并发布了Altair BASIC源代码
- 三思而后行,让大模型推理更强的秘密是「THINK TWICE」?
- CVPR 2025 | GaussianCity: 60倍加速,让3D城市瞬间生成
- 全网都在猜,这些视频是不是字节AI生成的:该跟动捕说再见了?
- CVPR 2025 Oral | 多模态交互新基准OpenING,新版GPT-4o杀疯了?
- 专家A:90分,专家B:56分!研究生论文盲审俩分数相差34分不让答辩,导师怒发朋友圈:离谱至极…
- 7个最常用的数据分析方法和技巧,收藏!
- [【深度学习】9个主流GAN损失函数的数学原理和Pytorch代码实现:从经典模型到现代变体
- 为什么是梁文锋做出了DeepSeek?
- 2024 AAAS Fellow揭晓!中科大校友熊莉、前腾讯杰出科学家刘威等入选
- 机器学习论文:从海量数据中挖掘材料设计的关键因素
- 台大李宏毅2025 AI Agent新课来了!
- 事业编一年 8 万 40 年退休挣 320 万,程序员一年 60 万 6 年挣 360 万,事业编再爽能有程序员干六年退休爽?
- 图解卡尔曼滤波(Kalman Filter)
- 为什么好多研究生都不愿意继续读博士了?
- ECCV 2024 | 快速傅里叶变换与Transformer结合用于图像恢复
- PaperDaily近期更新放缓声明
- DeepSeek前脚发新论文,奥特曼立马跟上:GPT-5就在几个月后啊
- 整整157页,比尔盖茨亲自公开微软起家的源代码:Altair Basic
- 速戳报名 ‼️ 最新AIGC峰会嘉宾在此,4月16日,来和大佬们一起AI
- AGI Hunt Day03:OpenAI调整GPT-5发布计划、微软CEO展示Vibe Coding
- 编程结束了,该怎么办?
- 再见Workflows,你好Agentic Workflows!
- 智能体记忆:大脑(不做7s记忆的鱼)
2025-04-04
- 表格RAG可以怎么做?推理大模型存在“心口不一”?
- Transfomer+图表示学习!新作登上Nature一区TOP,计算成本最高降低449倍!
- Mamba杀入图像增强!26%算力碾压SOTA!字节、华为都在做…
- OpenAI“投敌”Anthropic引爆AI圈!MCP协议:一场注定改写历史的“AI标准暗战”
- Nature重磅:DeepMind AI又一重大突破,1次配置解决150多种任务
- 从量子信息科学视角看意识的量子模型
- 黄仁勋被实习生说服用 CUDA,但遭团队嫌弃?!英伟达早期架构师首次曝光:12 人团队如何开启“算力帝国”
- 我在 4 年的机器人开源项目中学到了什么
- ChatGPT会员北美大学生全免费,持续一个月,AI帮你过期末考试
- Multi-Token突破注意力机制瓶颈,Meta发明了一种很新的Transformer
- 刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?
- 思维链不可靠:Anthropic曝出大模型「诚信」问题,说一套做一套
- 250多篇论文,上海AI Lab综述推理大模型高效思考
- 多榜单登顶!华为 & 哈工深团队提出 AdaReTaKe,突破长视频理解极限
- 高估值对 AI 公司没有好处?
- 无人机操控水平与人类驾驶员相当,「超级图灵 AI」通过模仿人脑进行实时推理和学习
- 被哥大开除后,他靠AI作弊神器年入千万!
- 机器学习论文:阿尔茨海默病早期预测
- 朱啸虎观点:AI应用护城河在于脏活累活
- DeepSeek R2来了?全新推理Scaling论文!
- 浙大校友重磅革新 Transformer!多 token 注意力让 LLM 开挂,错误率归 0
- 收藏 | 基于PyTorch的卷积神经网络经典BackBone(骨干网络)复现
- 同组博士师兄的结果复现不出来,我应该怎么办?
- MambaYOLO:基于状态空间模型的目标检测简易基线方法
- 李宏毅: 大型语言模型训练方法“预训练–对齐” 的强大与极限
- 25岁当上985博导,冯磊现任东南大学教授!
- 连续尝试了18种RAG技术之后,我找到了最优的那个
- 利用多张 GPU 训练大型语言模型——从零开始介绍 DeepSpeed、Liger Kernel等
- “科技界奥斯卡”揭晓!百度“AI守护官”斩获爱迪生奖
- 苹果、英伟达股票暴跌!比特币崩溃,美国科技最黑暗一天
- 30分钟让AI Agent自我觉醒,创新智能体框架–AI2T
- 中文海报设计,赛道一夜颠覆
- GPT-4.5创造力比GPT-4o弱!浙大上海AI Lab发布新基准,寻找多模态创造力天花板
- 移动通信领域有了新SOTA:华为出品,精准预测用户行为
- MiniMax打造的超真人感AI阿祖,背后有什么黑科技?
- AI播客Day02:Anthropic推理模型引担忧、Devin 2.0发布价格从500$下调至20$、千问3进入最终开发阶段
- AI-2027.pdf出炉:2027年,AI将如何接管世界?
- 突发!OpenAI宣布o3和o4-mini模型马上发布,GPT-5几月后见!
- 刚刚,DeepSeek-GRM模型发布,全新推理时Scaling,为R2打前站!
- 阿里通义团队LaRA解读:用于评估RAG和长上下文大模型的基准测试
2025-04-03
- RAG技术于视频文章生成及东方语种+汉语方言识别Dolphin实现思路解析
- 【CVPR2025】多模态+视觉增强+大模型
- 今日开源(2025-04-03):TxGemma,基于Gemma2微调,2B/9B/27B治疗开发模型,支持蛋白质核酸交互分析
- 【他山之石】卷积网络又双叒叕行了?OverLoCK:一种仿生的卷积神经网络视觉基础模型
- 【源头活水】DeepSeek-R1之后推理模型发展如何?Raschka长文梳理后R1时代14篇重要论文
- 蚂蚁清华联手放大招!彻底开源RL框架AReaL-boba,人人可复现QwQ
- 警惕!AI 已学会「阳奉阴违」——OpenAI 研究发现:罚得越狠,AI 作弊就越隐蔽
- 斯坦福大学:人工智能百年研究报告,2030年的人工智能与生活
- 警惕!AI 已学会「阳奉阴违」——OpenAI 研究发现:罚得越狠,AI 作弊就越隐蔽
- 《纽约客》:超强大的东西即将到来,人类恐将失去存在的意义
- AI的未来是两类模型的结合|DeepMind CEO 万字实录
- Kaggle赛题解析:Image Matching Challenge 2025
- AI论文“冷冻”6个月,DeepMind科学家被逼“大逃亡”:买下整个学术界,又把天才都困在笼里
- 飞桨新一代框架 3.0 正式发布:减少 Llama 预训练 80% 分布式核心代码,R1 满血版单机部署吞吐量翻倍
- 视觉SSL终于追上了CLIP!Yann LeCun、谢赛宁等新作,逆转VQA任务固有认知
- 让AI替码农卷复杂任务,贾佳亚团队提出MoTCoder,准确率刷新SOTA
- 为今年最火的机器人来场全球挑战赛:150万高额奖金,还有顶级硬件支持
- OpenAI的AI复现论文新基准,Claude拿了第一名
- ICLR 2025 Spotlight | 参数高效微调新范式!上海交大联合上海AI Lab推出参数冗余微调算法
- 速来!机器之心ICLR 2025新加坡现场人才晚宴开启报名
- DeepResearcher:交大、SII发布首个真实环境强化学习「AI研究者」模型
- 仅输入prompt与序列,准确率超90%,UC伯克利等提出文本生成蛋白质多模态框架
- 53%性能全面提升,Ayu新模型横扫传统工具,分泌蛋白预测效率再翻倍
- 小米SU7事故背后:自动驾驶的“致命两秒钟”到底谁该背锅?
- 张雪峰再预测:未来十年最火的6个理工科专业!毕业即躺赢!
- 美国奥数题撕碎AI数学神话,顶级模型现场翻车,最高得分5%,DeepSeek唯一逆袭
- 【本地部署教程】真·OpenAI & 真·多模态
- DeepSeek 新专利公布
- 年薪 100w!又一新兴岗位崛起!这才是程序员未来5年最好的就业方向!
- 稚晖君刚挖来的 90 后机器人大牛:逆袭履历堪比爽文男主
- 终于等到了!国产神器上线,大模型开发者的“外挂”来了。。。
- Windows跑在智能手表上,开发者“魔改”震惊网友:这次是真Windows on Arm
- 那些用ChatGPT实现10倍开发效率的顶级程序员,到底做对了什么?
- 《大模型基础》教材发布,开源!
- 没有穿越,DeepSeek-V3又登顶了!杭州黑马撼动硅谷AI霸主,抹去1万亿市值神话
- 收藏 | 论文画图工具:25个常用Matplotlib图的Python代码总结
- 基于飞桨框架3.0单机部署 DeepSeek R1 实战
- 垂直大模型和workflow是伪命题、是在逆AGI大势开倒车
- GPU开发过程中,如何更好的优化,快速提升底层性能?
- DeepSeek开源的背后逻辑,优劣势分析
- 七问具身智能:谁是下一代 AI 范式的关键变量 | 未来人工智能先锋论坛圆桌
- 聊聊华为昇腾大模型分布式训练框架MindSpeed-LLM如何集成适配Megatron-LM加速库做后训练
- 大模型背景下智能体、工具、函数和MCP傻傻分不清?
- 即梦3.0生图模型上线,新增影视质感2K高清大片,文字效果更精准!
- 【智谷要闻】第二期Deepseek大师锻造两日营火热报名
- 【AIGC应用】通用是未来,专用是路径,人形机器人跑步进入下半场:数据为王。
- 【行业动态】米哈游创始人蔡浩宇的 AI 游戏开启内测登记,DuckDuckGo :一款注重隐私的搜索引擎
- 【AIGC趋势】年营收暴涨736%,多家AI巨头撑腰
- 2.1K+ Star!Spring AI Alibaba:一个为 Java 开发者设计的AI应用框架
- 4月3日周四 | 每日一图
- 4月3日周四 | Python热门项目
- 4月3日周四 | Github今日热门
- 刚刚,OpenAI开源PaperBench,重塑顶级AI Agent评测
- 为大模型添加多模态能力——Mini DALL·E 3
- 数据竞赛 | INTERSPEECH2025多语种对话语音语言模型研讨会暨竞赛开启报名!
- 1小时AI公开课上线啦~首期课程解密传统企业如何抓住AI革命!
- 基辛格遗世之作:AI 吞噬世界下的人类
- 2个百度T11推出超级智能体火爆硅谷!免费使用无需邀请码,靠AI搜索功底估值已破38亿
- OpenAI官方基准测试:承认Claude遥遥领先(狗头)
- 视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成
- 10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型
- 马斯克擎天柱机器人大秀走姿,背后大佬集体现身喊话招人
- 智能体丝滑玩手机,决策延迟0.7秒!MSRA等提出验证器架构,不直接依赖大模型生成最终操作
- “AI眼镜的终极功能,是AI+社交” | 对话影目科技创始人
- OpenAI发布AI研究新基准PaperBench,已能复制21%顶会论文!斯坦福研究发现LLM已比人类专家更具科研新颖性
- 实测完R1/o3/Claude复刻顶会论文,OpenAI发现: 人类博士还是No.1,还顺带开源了~
- 理解LLM中的模型蒸馏技术(含代码示例)
2025-04-02
- Agent性能优化技术总结及DeeResearch用于Github项目搜索实现思路
- 年度好文!城市计算、深度学习与跨领域数据!
- 今日开源(2025-04-02):Dolphin,ASR模型开源来袭,支持40种东方语言+22种中文方言,21万小时训练
- 【源头活水】刚刚,奥特曼官宣开源:自GPT-2之后,我们要发首个带推理能力的开放权重模型
- 【他山之石】ICLR 2025 Oral IDEA联合清华北大提出ChartMoE:探究下游任务中多样化对齐MoE的表征和知识
- 00后程序员当道!下班3小时“爆肝” OpenManus背后的故事
- 量子通信的安全神话被打破?多伦多大学发现量子源中的隐藏漏洞
- 重磅:人工智能新里程碑,大模型首次通过图灵测试
- 深度长文|数学之谜:揭秘AI在奥数证明中的惊人失败
- 行业落地分享:FastGPT企业Agent落地实践
- 小米SU7事故后,你还相信智驾吗?
- DeepSeek在烟草商业公司的典型应用(附23个部门68个应用场景)
- AI 不仅是技术革命,更是一场全员能力升级的持久战 | 极客时间 DTDS 大会
- Vibe Agent: Token成本直降90%,会对话就能创造专属本地Agent
- 2024 AAAS Fellow名单出炉:华人学者刘威入选
- 细节厘米级还原、实时渲染,MTGS方法突破自动驾驶场景重建瓶颈
- 一篇论文,看见百度广告推荐系统在大模型时代的革新
- 2025美国最新奥数题,让大模型集体翻车,DeepSeek R1平均分也不到5%
- 脑波解码延迟仅80毫秒,实时「意念对话」技术登Nature子刊
- 近千个反现实视频构建了「不可能」基准,哪个AI不服?来战!
- 预测精度达93%,个人电脑可部署,科学家开发Transformer新方法预测结合蛋白
- 准确率达85%,苏大、大连理工开发多模态特征融合ML,预测工程纳米材料诱导的慢性损伤
- PandasAI:当数据分析遇上自然语言处理
- AI 联网搜索时的 prompt 小技巧
- 技术人狂喜!飞桨框架3.0史诗级更新,炼丹效率拉满
- 杭州具身黑马获超5亿融资,冲击万亿市场
- 史上最严!27名院士候选人被处理,或被永久取消参选资格
- 大模型时代,阅读论文新范式
- 【教程】用DeepSeek搭建AI Agent
- 收藏的vscode插件!
- matplotlib中文教程
- AI新突破!Nature力荐!物理信息神经网络(PINN)创新工作
- LSTM 王者归来,再登 Nature。。。
- 一人能顶一个公司,知识库神器了!
- 下一个十年,不懂大模型的产品将被淘汰?
- Linus Torvalds 怒斥 Linux 6.15 中“恶心”的测试代码:这玩意儿必须被干掉!
- 前端开发人员都必须掌握的 7 种改变游戏规则的工具
- 车位数量检测
- 改变几行代码,PyTorch炼丹速度狂飙、模型优化时间大减
- 导师对帮助研究生顺利完成学业提出了20条劝告:第一,不要有度假休息的打算..
- 普通博士生和顶级博士的区别……
- 关于深度思考的一些深度思考:Deepseek官网深度思考模型,真的是DeepSeek-R1吗?
- 李宏毅:Transformer的时代要结束了吗?Transformer的竞争者们
- 中国科大认知全重实验室发布Agent-R1训练框架,支持自主思考与工具调用!
- AI Agent 新探索:构建 AI 原生团队,使能 AI 员工
- 所有大模型微调库全面对比!
- 中科院分区后又中了一篇一区!2025AI顶会顶刊‘灌水’全靠这个信息差!
- 一文汇总大模型推理框架!
- 百度飞桨与香港产学研代表共同研讨“AI时代的创新、挑战与机遇”
- 港中文发布全新视角高效Reasoning综述!idea已充满大脑…
- ICLR2025 | 基于动态提示扰动的软提示复杂推理优化方法
- 字节开源换脸写真模型InfiniteYou,可实现零样本身份ID一致保持,无缝集成FLUX、ControlNets、LoRAs!
- FlashFace: 具有高保真身份保存的人像个性化方法,效果超越InstantID,人脸定制化更逼真了!
- Google 发布最新开源模型 Gemma 3 性能超越DeepSeek V3、o3mini为全球第二强开源模型!
- 交叉熵 log 以e为底而不是 2
- 阿里面试官问:什么是softmax 上下溢出问题?
- 面试官问:深度网络中loss除以10和学习率除以10等价吗
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 50种GPT-4o热门生图风格(含提示词)
- 雷军终于发声,首次公开回应小米SU7爆燃事件
- 1小时暴涨100万用户!GPT-4o新功能彻底杀疯了,免费使用
- 商汤最新财报:生成式AI增长超100%,成最大业务
- 马斯克的xAI收购X,估值800亿美元
- 城市AI合伙人招募启动!共享40万+企业精准客源与社区全链专业支持
- 微软创想未来技能节,邀你一同创造吉尼斯世界记录!
- 200亿机器人独角兽被曝爆雷,官方回应来了
- 国产服务器迎来深圳芯!纯血RISC-V跑满血DeepSeek-R1,一芯双核干爆x86
- 稚晖君刚挖来的90后机器人大牛:逆袭履历堪比爽文男主
- AI理解27分钟长视频超越GPT-4o,港理工新国立开源新框架:角色化推理+链式LoRA
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 语音界Deepseek!百度最新跨模态端到端语音交互,成本最高降90%
- 大模型RL不止数学代码!7B奖励模型搞定医学法律经济全学科, 不用思维链也能做题
- CVPR 2025:单图秒变专业影棚,几何/材质/光影全搞定,数据训练代码全开源
- 双人动作生成新SOTA!浙大提出TIMotion框架 | CVPR 2025
- 第二批AIGC峰会嘉宾已就位!速戳报名,和大佬们一起来AI 🤩
- 招聘|量子位智库AI分析师
- SuperRAG, 百川也开源了。
- 张小珺+广密大模型季报的20条总结:「智能才是主线」
- 里程碑,GPT-4.5大模型正式通过图灵测试!
- 瓦力算法3月第4周急招岗位| 微软(亚洲)/ 微信 / 贝壳 / VIVO / 阿里通义 / 字节豆包 / /
- ReSearch:通过强化学习实现LLM推理与搜索协同的创新框架
2025-04-01
- R1–Zero强化学习路线新发现及R1思路用于GUI Agent动作预测方案
- 真正的LLM Agent
- 入选CVPR 2025!何恺明联手LeCun改进Transformer!新思路学到就赚到~
- 今日开源(2025-04-01):B站开源IndexTTS,工业级零样本TTS系统,拼音校正+标点控制停顿,性能超越主流方案
- 微软CEO万字演讲实录|AI 的三大根本性突破
- 深度长文|AI的“自信陷阱”:解剖大模型幻觉背后的“认知短路”
- 当大模型接管编程:NASA 疯狂的“反人类”编程要求,为何仍被奉为行业圣典?
- 大模型下半场:7个趋势判断
- R1 的一些认知:4 个经典误区
- 小白学RAG:Sentence Transformers v4 微调 Rerank 重排序模型
- 微软关闭上海AI实验室!硅谷巨头们“投奔”印度:OpenAI 的第二大市场,奥特曼态度180度转变
- 当大模型接管编程:NASA 疯狂的“反人类”编程要求,为何仍被奉为行业圣典?
- 刚刚,奥特曼官宣开源:自GPT-2之后,我们要发首个带推理能力的开放权重模型
- Runway最新视频模型Gen-4上线!保真度、一致性、可控性做到最强
- 一脑多机!智源的新发布,让不同机器人轻松协作
- 在GSM8K上比GRPO快8倍!厦大提出CPPO,让强化学习快如闪电
- ICLR 2025 Oral | IDEA联合清华北大提出ChartMoE:探究下游任务中多样化对齐MoE的表征和知识
- 20万悬赏AI美妆!欧莱雅美妆科技黑客松2025重磅来袭
- DeepSeek-R1之后推理模型发展如何?Raschka长文梳理后R1时代14篇重要论文
- 自动学会工具解题,RL扩展催化奥数能力激增17%
- 皮米级精度,北大、厦大、深势等推出生成模型解析多层原子结构,登Nature子刊
- AI如何重塑全球生物多样性研究,麦吉尔大学最新综述
- 惊呆了!在 Jupyter 中用鼠标“画”出数据集
- 亚马逊 4.8 分佳作!7500万+追更,把烧脑的算法变成连环画!
- Google Gemini 2.0 网页抓取真丝滑
- 自己做一个AI问答小工具——PyQt + 星火认知大模型
- 字节会下血本招聘毕业3年内的高潜人才
- 【Python】100个NumPy小技巧,让你精通Python科学计算
- 还有名额!这所学校2025年硕士研究生调剂意向填报开始啦!(计算机科学与技术)
- 中纪委通报:3位在任大学校长、副校长、研究院院长,被查!
- 实测:Gemini-2.5-Pro 大战 Deepseek-V3-0324
- 热议:中国何时拥有自己的《nature》《Science》?委员给出答案!
- 体育教师发Nature遭质疑,校方发文称“零的突破”引争议!全篇不到200个单词。。。
- PPO & GRPO原理,小学生也能看懂!
- 【教程】大模型量化界翘楚:unsloth
- 10个适用于多个学科的Python数据可视化库
- OpenAI准备开源,冲着 DeepSeek-R1 来
- 桑基图(Sankey Diagram)
- 读完这这本大模型书籍,你就是LLM大师!
- GPT-4o 骗了所有人,逐行画图只是前端特效?!底层架构细节成迷,奥特曼呼吁大家别玩了
- Matlab是否依旧屹立不倒?
- Android闭源是假,Google想封闭是真!
- Next.js 受 9.1 级重大漏洞攻击…
- 使用Python+Pycaret进行异常检测(附代码演练)
- 注意力机制是如何学习到模型所应注意的区域的?
- TPAMI 2025 | 基于高效脉冲发放近似训练的脉冲驱动 Transformer 扩展方法
- 飞桨新一代框架3.0正式发布:加速大模型时代的技术创新与产业应用
- 奇点降临,Manus 诞生背后丨青源Workshop观点集锦
- 活动报名|LeCun学生分享,Transformer无需归一化也能高效稳定训练
- 原创成果丨面向文本到图像合成的语义变化因果评估:SemVarBench与SemVarEffect
- 预训练真的结束了吗?可能没有,而且是以一种新范式出现
- idea满满的最新Test-Time Scaling综述!全面描述What, How, Where和How Well的问题
- 操作系统是如何一步步发明进程、线程的?
- 「人大 x 阿里」Think Before Recommend: 释放序列推荐模型隐藏的推理能力
- 精选的 MCP Server集合!
- 阿里同义提出风格化实时肖像视频生成框架ChatAnyone,4090可实现实时交互式视频聊天。
- 3D虚拟人ExAvatar:由简短视频建模转化为3D数字形象。
- IBM提出多模式图像文本到文本模型SmolDocling,可实现代码 | 公示 | 图表 | 表格 | 标题 高效转换!
- 一个插件,免费使用GPT-4o
- 3K+ Star!FinRobot:一个开源的金融分析AI Agent平台
- 4月1日周二 | 每日一图
- 4月1日周二 | Python热门项目
- 4月1日周二 | Github今日热门
- 微软Azure AI人工智能训练营第一季圆满收官!恭喜所有获奖学员!
- OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的”
- 超低成本复现QwQ!数学推理模型训练迎来RL暴击,数据代码模型全开源 | 蚂蚁&清华出品
- Gen-4掀翻AI视频牌桌!一条龙制作故事短片,只需提示词和参考图
- 从DeepSeek崛起到下一个亿级销量市场,这份硬核报告说明白了
- 两位华人76页论文解决量子领域核心问题:首次证明伪随机性真实存在
- 免费的「网页版Cursor」!新版DeepSeek-V3加持,秒秒钟编出一个游戏/APP
- 让机器人在人群中穿梭自如,港科广&港科大突破社交导航盲区 | ICRA 2025
- AI创业来了大大大大大玩家:PC是起点,目标混合式AI
- ChatAnyone, 阿里又开源了?
- OpenAI 开源!每小时亏666666美元的同时,软银400亿美元到位,估值飙至3000亿美元!
- 挖掘了170家公司,AI Agents市场全解析
- 改进RAG:利用混合搜索与重排序优化检索效果(含代码示例)
2025-03-31
- 顶会AAAI 2025高效的CLIP KD新方法!
- 今日开源(2025-03-31):智源发布RoboBrain,多模态大模型赋能机器人大小脑协作,突破规划/感知/轨迹预测瓶颈
- 【源头活水】GPT-4o的P图太火了,GPU在融化,官方终于限流了
- 【他山之石】Anthropic用“AI显微镜”扒开Claude“大脑结构”,揭示语言模型行为背后机制
- 【源头活水】清华稀疏Attention,无需训练加速一切模型!
- 成本驱动的精细系统优化,蚂蚁技术专家解密大模型推理优化秘籍|ML-Summit 2025
- AI 写码一时爽,代码审查火葬场?GitHub Copilot 副总揭秘新瓶颈 | GTC 2025
- 从DeepSeek R1的复现看深度思考模型的未来|ML-Summit 2025
- 微软CEO最新演讲实录:微软正在给全人类派发“思维外挂”Agent
- 张亚勤:人工智能+新科学 开启“科学智能”时代
- 一文读懂,可重构芯片为何是AI的完美搭档
- 超越功能主义:意识科学的数学结构性转向
- 谷歌前沿研究RAGO:系统优化RAG服务性能
- 比R1快8倍、价格仅3%,智谱新推理模型来袭,能让免费智能体自己赚钱!张鹏:Agent 也有Scaling Law
- 独家|对话蚂蚁 Ling 团队:聊聊用国产卡降本这回事儿
- 200美金,人人可手搓QwQ,清华、蚂蚁开源极速RL框架AReaL-boba
- ICLR 2025 | 真正「Deep」的「Research」,通过强化学习实现可自主进化的科研智能体来了!
- 第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1
- 正在和DeepSeek-V3-0324做个大项目,「氛围编程」简直太疯狂了
- 清华朱军团队 | 从点云到高保真三维网格:DeepMesh突破自回归生成瓶颈
- 比Rosetta快250倍,亲和力提升百倍,David Baker开发原子上下文条件蛋白序列设计新工具
- 对抗灾害,理解极端气候的智能模型概述
- 库克到访!C9大学,获捐赠3000万
- 李飞飞团队具身智能新作:500美元,一切家务机器人帮你干
- 0 废话,dify1.0.1内网环境,离线部署
- 离神最近的一步!Manus杀疯了!
- 字节跳动 353 人,全部辞退。。
- “计算机视觉被 GPT-4o 终结了”
- AUTOSAR为何成为车企刚需?
- AI爬虫拖垮整个网站!开发者崩溃:禁了整个巴西的访问,才勉强救回来
- DeepSeek更新V3-0324:一个小版本,又要掀桌子?
- 为什么AI大模型产品经理是未来最抢手的黄金职业?
- 10天做出AI面试“外挂”,狂揽多个大厂Offer!这名21岁学生已被哥大正式开除……
- 作为开发者,让我大开眼界的十大开源人工智能项目
- 最全总结!1000篇最新顶会论文!
- 深度学习训练过程可视化(附github源码)
- 什么是扩散模型(Diffusion Models),为什么它们是图像生成的一大进步?
- 数字图像处理必备基本知识总结
- R1 的一些认知:4 个经典误区
- CV被大模型“解决”?开源模型UFO:16个Token搞定图像任务!(附论文及源码)
- 牛嘴图像算法MHAFF,准确率高达近100%,创新融合 CNN 与 Transformer!
- 中科院分区后又中了一篇一区!2025AI顶会顶刊‘灌水’全靠这个信息差!
- 如何在预训练好的时序基础模型中引入外部特征?
- 聊聊华为原生训推框架MindSpeed-LLM全参数训练DS-Distilled-QWen2.5-32B
- 南洋理工 & 牛津 & 新加坡理工提出Amodal3R,可从遮挡 2D 图像重建完整 3D 资产,3D生成也卷起来了!
- TRELLIS:用于创建多功能、高质量的360°全景图生成方法,实现可扩展多功能3D生成。
- 阿里千问发布QwQ-32B:性能肩比DeepSeek,只需DeepSeek的1/20参数,一张显卡就能跑!
- 抖音摊牌了,首次公开“推荐算法”原理
- 20000颗星!100多个Agent超级工具,开源MCP大合集
- 微软AI Genius训练营来啦!6场“理论+实战”课程,彻底点燃你的AI超能力
- GPT-4o骗了所有人,逐行画图只是前端特效?!底层架构细节成迷,奥特曼呼吁大家别玩了
- 推荐场景Scaling Law来了!中科大&华为诺亚方舟联合推出
- 国产AI起号两周就开始自己赚钱了,全球首个“边想边干”的Agent | 免费无限次
- 5.28亿融资砸向杭州具身智能公司,清华叉院机器人天才坐镇,被称为“中国版Figure”
- 中科大提出动作价值表征学习新方法,率先填补长期决策信息的缺失
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 摸DeepSeek过河也得自身硬! 想开后的文小言,真香!
- 奥赛级AI基准来了:难倒所有模型,GPT-4o仅考34分,上海交大出品
- 长,就好吗?(附赠ChatGPT插件)
- DeepSeek和OpenAI谁更open?
- 刚刚,这家用AI 制药的公司,完成了6亿美元融资!
- 智源bge开源一系列多模态向量模型,冲~
- OCR技术选型:数据提取哪家强?
2025-03-30
- 热议:中国何时拥有自己的《nature》《Science》?委员给出答案!
- Jay Alammar:图解DeepSeek-R1
- 科学家突破联邦学习模型同构限制,让异构设备在隐私保护中共同学习
- 重复美国老路,永远都是追随者,朱松纯:什么才是真正AI创新?
- 伯克利论文:Multi-Agent多智能体系统为什么会失败?
- 智能体元年,四大 AI Agent 框架介绍
- 隐藏马尔可夫模型的解释、真实案例以及 Python 代码
- 哈佛斯坦福顶尖中国毕业生回流,向DeepSeek疯投简历!美国人才开始逆向归国
- 微调医疗数据模型,让AI成为医生的好帮手!
- 豆包大模型负责人飞书账号遭停,或因内部纠纷引关注;众擎机器人CEO炮轰朱啸虎:快退出宇树股份;宇树确认已盈利至少5年 |AI周报
- 面壁智能 CEO 李大海:AI智能体的未来是模型,而非工作流
- 吉卜力只是开胃小菜,GPT-4o一键抠图「换装换背景」!推理也初步显现
- 模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平
- 卷积网络又双叒叕行了?OverLoCK:一种仿生的卷积神经网络视觉基础模型
- CVPR 2025 | EmoEdit:情感可编辑?深大VCC带你见证魔法!
- 再见VS Code!Google IDE 正颠覆传统开发体验
- Dify 入门与工作流节点介绍
- 睡一觉发一篇SCI?学术圈权色交易杀疯了!
- 高位接盘爆亏254万,阿里P7彻底沦为房奴
- 2025 苹果 AI 学者名单公布,黄子琪、孔令东、北大吉嘉铭、清华顾煜贤等12位年轻华人入选
- 【寒门读博:一场与命运的谈判】——当知识资本撞上生存法则
- 【机器学习】隐藏马尔可夫模型的解释、真实案例以及 Python 代码
- 10篇DeepSeek-R1相关的研究全面汇总,万字思考!
- 中国AI界的又一匹黑马,Mureka O1 全球首秀!爆改周杰伦,堪称AI音乐界的DeepSeek时刻
- 学术志,极速上手DeepSeek
- Python可视化工具-TOP榜
- “计算机视觉被GPT-4o终结了”(狗头)
- 个人公积金交 3998,单位交 3998,加起来一月 8000,一年将近 10 万,好多人辛苦一年都没这么高…
- 实战|13个Pytorch 图像增强方法总结(附代码)
- 揭秘学阀现象:学术圈正在上演怎样的”门徒战争”?
- 输入到CNN中的图像为什么不具有平移不变性?如何去解决?
- 体育教师发Nature遭质疑,校方发文称“零的突破”引争议!全篇不到200个单词。。。
- 字节 DAPO 技术报告有感!大模型 RL 细节为王
- 从代码和公式角度理解 DeepSeek MLA 的矩阵吸收 (Projection Absorption)
- 要我怎么做你才能不想那么多?LLM!
- AI项目应用,是用传统AI的YOLO?还是视觉大模型VLM更好?
- DeepSeek大模型核心技术解读!
- 20万粉UP在线给粉丝纯手搓出了2025年最全机器学习深度学习快速系统入门学习路线!
- 原创成果丨三思而后行:LLMs中的渐进式思想精炼
- 如何做审稿意见的辩驳(rebuttal)
- Video-R1:第一个多模态视频Reasoning方法+模型,7B小模型逆袭GPT-4o!
- 【上海AI Lab】大模型安全可信团队实习\联培博士\全职\博后招聘(校招和社招)
- LangGraph Agent 架构图
- 深入解读CrossFaceID:专为面部定制优化的高质量数据集,解锁面部定制新境界。
- 优于InstantID!中山大学提出ConsistentID:仅使用单个图像根据文本提示生成不同的个性化ID图像。
- 小红书InstantID来了, 一张照片几秒钟就能生成个性化图片, 无缝衔接Stable Diffusion)
- 阿里发布新ID保持项目EcomID, 可从单个ID参考图像生成定制的保ID图像,ComfyUI可使用。
- FlashFace: 具有高保真身份保存的人像个性化方法,效果超越InstantID,人脸定制化更逼真了!
- 面试官问:大模型领域,有哪些提高大规模模型的训练和推理效率库?
- 面试官问:深度网络中loss除以10和学习率除以10等价吗
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- Github热门项目周报 | 第13周
- 3月30日周日 | 每日一图
- 3月30日周日 | Python热门项目
- 3月30日周日 | Github今日热门
- AIGC第一股年报详解:AIGC业务暴涨88.5%营收2.2亿,95%智能硬件交付出海,跑通规模化「软件订阅+出海」
- 业界突破多模态泛化推理能力,OPPO研究院&港科广提出OThink-MR1技术
- 13.8倍吞吐提升!浙大上海AI Lab等提出视觉生成新范式,从“下一个token”到“下一个邻域”
- 嚯!OpenAI最新内幕八卦.pdf
- 真相!和ChatGPT聊一年的天,还不如你洗5次澡耗电!
- 8大类,100+技术:大模型 AI Agents 优化最新综述
- 智能体工作流:自动化生产线
- 从NVIDIA GTC 2025 Dynamo看当前加速推理的核心技术
- 企业 RAG 准确性提升全流程指南:从数据提取到精准检索
2025-03-29
- 大模型黑盒探秘:通过“电路追踪”(Circuit Tracing)揭示大模型内部推理机制?
- 为什么是梁文锋做出了DeepSeek?
- 【他山之石】AAAI2025 | 北大&数原提出MMGDreamer:混合模态图驱动,几何可控的3D室内场景生成新标杆
- 【源头活水】谷歌对齐大模型与人脑信号!语言理解生成机制高度一致,成果登Nature子刊!
- 不用向量量化也能高质量生成?NOVA:重新定义自回归视觉建模
- AI“黑盒子”被打开了!Anthropic连发两篇论文:用AI“显微镜”追踪大模型思维
- MIT人工智能女掌门丹妮拉·鲁斯带你走进人机共融的未来
- 突发!马斯克xAI收购X,总估值8000亿
- 北京通用人工智能学院院长朱松纯:“中国的AI叙事” 存在认知偏差
- 用“千行代码”作弊软件骗过大厂!00后拿4个顶级Offer后潇洒拒掉:技术面试早该淘汰了?
- 每周宕机数十次,CEO 控诉“防护措施天天失效”:开源界正遭受 AI 公司的暴击
- 被吉卜力刷屏的背后:OpenAI模型行为负责人揭秘GPT-4o新生成策略
- 马斯克的xAI收购了马斯克的X(推特)
- 从「拼能力」到「拼盈利」,AI 视频生成赛道的格局已经变了?
- GPT-4o图像生成的秘密,OpenAI 没说,网友已经拼出真相?
- CVPR 2025高分论文:从照片重建3D矢量,告别模糊渲染,重建边缘更清晰
- 「AIGC第一股」出门问问交上完美答卷:营收破2.2亿,同比增长88.5%
- 植入Neuralink脑机接口一年后,瘫痪的他找到了工作,还将重返校园
- Adobe黑科技:视频扩散降维图像编辑,ObjectMover秒懂物理规律
- 强推理模型下,Agent workflow 仍有必要吗?
- GPT-4o「吉卜力风」一夜爆火,奥特曼连夜换头像!宫崎骏痛批AI侮辱生命
- 热议:中国何时拥有自己的《nature》《Science》?委员给出答案!
- Agent太火!看这一篇综述搞定丨华东师大&东华大学出品
- 大家有没有发现一个奇特现象:你能在一个公司工作 12 年以上,无论你多忠诚多卖力,一旦公司赚的少了,那你就成了“眼中钉肉中刺”
- GPT-4o 的 P 图太火了,GPU 在融化,官方终于限流了
- 相较神经网络,大名鼎鼎的傅里叶变换,为何没有一统函数逼近器?答案在这
- 明明有些学生在学校混得很水,但找工作时学历和学校(985/211)那么管用?
- IJCV 2025 | 基于对比特征重构的渐进式视觉提示学习
- PyTorch Day 首次登陆 2025 智源大会!论文征集开启
- 上海AI Lab发布LLM高效Reasoning综述!全面总结如何“少想多做”
- 公众号10000粉丝啦!与你分享一些背后的故事。
- olmOCR:重塑PDF文本处理,让语言模型更智能、更强大!
- DPG-Bench榜首!智谱开源文生图模型CogView4:支持中英文输入和生成,免费商用授权!
- 图像自回归新范式!阿里达摩院提出FAR!基于频率渐进自回归的图像生成方法!
- 阿里发布新开源视频生成模型Wan-Video, 支持文生图和图生图,最低6G就能跑, ComfyUI可用!
- 100个常用的DeepSeek V3提示词(最新整理)
- 马斯克xAI蛇吞𝕏:资本有了,数据有了,商业模式也有了
- 17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 迈向群体智能 | 智源发布首个跨本体具身大小脑协作框架与开源具身大脑
- “计算机视觉被GPT-4o终结了”(狗头)
- 自动驾驶首次应用测试时计算!港大英伟达等新技术让AI边开边学,无人车遇变道自如应对
- 突发!马斯克宣布xAI 收购X!
- 如何一键将网站改造为宫崎骏风的梦幻童话世界?
- 一篇全新知识导向 RAG 全栈技术综述
- 从人类标签中衍生 AI 生成提示:解锁数据标注新效能
2025-03-28
- Agent-MCP开源动手实践指引及CausalRAG将因果关系用于RAG实现思路
- “PINN+多任务学习”创新思路再升级!登上IEEE(Trans)中科院1区TOP!
- 顶会新宠!剑桥凭“机器学习+因果推断”杀疯ICLR!2025发论文的黄金赛道来了!
- 今日开源(2025-03-28):OmniSQL,文本到SQL数据生成大模型,含百万级跨领域数据集,7B/14B/32B参数可选
- 大模型和具身智能究竟是什么关系?
- 抛弃 OpenAI 后,Figure 机器人“进化”:像人一样行走!
- OpenAI拥抱MCP,这个智能体的安卓
- 意识科学之战:超越伪科学与伪意识
- 生命、其起源及分布:从康威-科亨定理与自由能原理的视角
- 如果草履虫也能提问,它会抛出怎样的宇宙难题?
- 手把手助你成为医疗领域专家!
- 如何向10岁小孩解释XGBoost回归算法
- Kaggle赛题解析:ARC Prize 2025
- GPT-4o “吉卜力”爆火,Prompt、SD 白学了?!大模型能力进化碾压一切
- “我们要重建 TikTok 算法”!Perplexity CEO 计划收购 TikTok,并开源关键技术
- GPT-4o的P图太火了,GPU在融化,官方终于限流了
- 3D基础模型时代开启?Meta与牛津大学推出VGGT,一站式Transformer开创高效3D视觉新范式
- 3D领域DeepSeek「源神」启动!国产明星创业公司,一口气开源八大项目
- Anthropic亲自公开Claude脑回路!
- VBench-2.0:面向视频生成新世代的评测框架
- 性能优于o3-mini,DeepMind发布通用医学开源LLM与问答Agnet,改善治疗开发
- 解密神经元活动变异性:艾伦研究所与清华揭示大脑状态如何动态调节神经编码
- 一张照片,AI就能识别干燥盐溶液的化学成分,准确率近99%!
- Python 3.13 正式支持 iOS:移动开发的新篇章
- 饶毅:某“杰青”任院长,一看就是“浮躁的典型,发了一批没意义的论文”,“这类人不仅多,而且频频晋升”
- 2025年开源世界第一瓜,喜提律师函
- Django创造者Simon Willison分享:我如何使用LLM帮我写代码
- 可视化工具推荐
- 体育教师发 Nature 遭质疑,校方发文称“零的突破”引争议后删改重发
- 实践教程|GPU 利用率低常见原因分析及优化
- 使用PyTorch进行情侣幸福度测试指南
- CVPR 2025 | 知识桥接器:迈向免训练的缺失模态补全
- R1复现小记:在业务场景的两类NLP任务上有显著效果
- 腾讯优图实验室(上海)大语言模型2026年应届实习生招聘
- 批判性看待R1训练(基础模型和强化学习)中的坑
- 硬核,AI Agents全栈技术框架综述与未来!
- DeepSeek 悄悄更新!重点编程能力大幅提升!
- 深入浅出,小目标检测算法研究梳理汇总
- 大模型Claude“大脑”拆解分析,发现它是这么思考的!
- 2025上半年,您还可以看看这几个学术会议!
- 房产中介要失业?Agent学会了’忽悠’,结果买家居然更买账!| NICE53期
- LLM Agent在方法、应用和挑战全面综述!
- 20美元/月的GPT-4o,硬生生被玩到限流,只因生图能力太逆天!
- 【智谷要闻】上海南翔高科技经济城AIGC智谷企业家研讨会圆满举行
- 【AIGC应用】智谷AI智能生成营销式系统
- 【AIGC趋势】国内具身智能最大天使轮诞生,前华为自动驾驶CTO、天才少年创业
- 【行业动态】Google 发布最新开源模型 Gemma 3 ,百度推出ERNIE 4.5和X1
- 论文简读|首个面向细粒度视频运动理解的综合评测基准|阶跃星辰×复旦
- 微软全球技术“领航员”空降北京,4月23日带你进入智能体世界
- 超8000颗星!微软发布免费Agent课程,0基础学智能体开发
- 微软、清华发布Agent创新方法,解决记忆、检索大难题
- Manus欲以37亿估值硅谷寻融资!发布仅三周,线下用户聚会场场满员
- AI大模型看手相!图片视频加持深度思考,阿里QVQ-Max“神了神了”
- 让宇树机器狗在北大未名湖畔捡垃圾,银河通用干的
- Claude团队开盒Transformer:AI大脑原来这样工作
- GPT-4o掀起“吉卜力风”,连CEO奥特曼也换了头像!版权争议虽迟但到
- 3D版DeepSeek卷起开源月:两大基础模型率先SOTA!又是VAST
- AI Agent来,传统BI危
- 单张照片生成360°3D场景,支持灵活视角漫游|人大&北师大&字节
- 港大开源博士级AI智能体,独立完成三篇算法研究,一站式科研6小时搞定
- 专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架
- 终于,Claude 的脑壳子被扒开看了!
- OpenAI 或将对外关闭其API
- Perplexity CEO放话:收购TikTok后将打造全球最透明算法!
- Claude“大脑”被Anthropic扒开了,发现它是这么思考的~
- 阿里再开源多模态大模型Qwen2.5-Omni
2025-03-27
- Multi-Agent多智能体为什么会失效?R1类推理模型训练及推理的2个有趣实验结论
- 带你能玩转Deepseek,制作AI全能助手
- 小白跟着学就行!搞定Python编程学习环境+开发工具配置(含视频)
- JAG | 多模态深度学习的遥感数据融合综述(ESI高被引论文)
- 今日开源(2025-03-27):阿里云Qwen2.5-Omni,端到端多模态大模型,实现文本/音频/视觉/视频实时交互
- 大厂竞相押注人形机器人,我们距离通用还有多远?
- 长文本向量模型在4K Tokens 之外形同盲区?
- HF、NVIDIA、Google、阿里、智源、宇树科技齐聚GOSIM AI Paris 2025,共掀开源浪潮!
- 通付盾:从AI到IA,AI Agent信任系统建设前瞻
- 突发!OpenAI官宣支持Anthropic推出的大模型上下文协议MCP
- 重塑对称理论的数学家,获得2025年阿贝尔奖
- 人工智能评测新范式:解锁AI性能的可解释力与预测力
- 竞赛总结:AFAC2024 基于保险条款的问答
- OpenAI 宣布采用竞对 Anthropic 协议,一夜将 MCP 送上热搜!Karpathy:赶紧歇了吧
- 用 9B 参数做推理?任度双脑深度思考大模型 T1 发布,创始人:和大厂 PK 的底气来自“根原创”
- 引发 AI 热潮的原始代码开源了!Hinton 靠它获的诺奖,Ilya、Krizhevsky、李飞飞都有大贡献
- 阿里深夜开源Qwen2.5-Omni,7B参数完成看、听、说、写
- 清华稀疏Attention,无需训练加速一切模型!
- 外媒:英伟达将收购贾扬清创业公司Lepton AI,交易价值数亿美元
- 把MLA和稀疏激活带到端侧!港科大广州和伦敦大学学院团队联合发布软硬协同设计的边缘语言模型PLM
- 2025苹果AI学者名单公布,黄子琪、孔令东、北大吉嘉铭、清华顾煜贤等12位年轻华人入选
- 造手机的vivo,进军机器人了
- OpenAI最新官宣:Agent SDK支持MCP协议
- 这AI绝对偷了格莱美奖杯!直接把LLaMA喂成乐坛顶流:开源版Suno来了!
- 参数仅需12万分之一,训练只需2块GPU,MIT、哈佛推出生物序列建模新方法Lyra
- 神经形态计算:从实验室原型到产业变革的前夜
- Matplotlib 丑图到期刊图表改造指南
- 突发!美国再将54家中国科技公司列入实体清单!智源、浪潮在列!
- DeepSeek-V3-0324 已成非推理第一
- 【深度学习】CVPR 2025|MambaOut:在视觉任务中,我们真的需要 Mamba 吗?
- 985校长宣布:非升也能留!高校“非升即走”制度迎来大手术
- 【Python】13个有趣的Python高级脚本
- 贾扬清创业2年,老黄砸重金收购!AI框架缔造者或卖出数亿美金
- 全民热议 AI:你真的会用 DeepSeek、ChatGPT 和 AI 智能体吗?
- 真·多模态问世,阿里开源Qwen2.5-Omni,7B参数完成看、听、说、写
- seaborn统计p value篇!
- 看文献真的不是在搞科研!顶会是干出来的,不是看出来的
- 网传某里辞退孕妇,涉事方回应来了
- 说实话,国内搞科研,别太老实了。。。
- 为什么AI大模型产品经理是未来最抢手的黄金职业?
- 具身智能一定要是人形机器人吗?
- 在公司干了五年,工资不如刚入职的校招生
- 被放养的博士能靠自己毕业嘛?
- CVPR 2025 自适应矩形卷积模块,即插即用
- 医图论文 ACM MM’24 | PASSION:用于不均衡缺失率下有效不完全多模态医学图像分割的方法
- 少样本学习概述:算法、模型和应用
- 万字长文,深度解读AI算法项目,开发及边缘设备部署行业经验!
- 边缘设备实时检测,2.4倍加速实战分享!
- AI圈地震!最新大模型来了,榜单被全线刷爆!
- 沐曦与百度飞桨完成Ⅱ级兼容性测试
- 聊聊华为昇腾原生训推框架MindSpeed-LLM的实践——基于deepseek-r1-qwen2.5-32B的监督微调训练
- 肖仰华丨警惕“AI思维”侵蚀人类创造力
- AgentDropout:踢出“划水队友”,Token消耗直降20%!性能还涨了!
- Agent主题分享@ICLR2025
- CoT是否仍是增强Reasoning能力的必要工具?
- 操作系统是如何一步步发明中断机制的?
- 如何最简单、通俗地理解大模型?
- Google 发布最新开源模型 Gemma 3 性能超越DeepSeek V3、o3mini为全球第二强开源模型!
- Manus平替来了!CAMEL-AI开源OWL,开源框架中排名第一,上线一天获得3.3K stars!
- 3D虚拟人ExAvatar:由简短视频建模转化为3D数字形象。
- ComfyUI | OmniGen-ComfyUI:简化多任务图像生成和编辑操作,一键生成任意你想要的效果!
- BF16量化为int8的过程如何实现
- 国产大模型再出王炸,AI生成音乐迎来DeepSeek时刻,人人都能创作歌曲!
- 1.9K+ Star!RuoYi AI:一个全栈式 AI 开发平台
- 3月27日周四 | 每日一图
- 3月27日周四 | Python热门项目
- 3月27日周四 | Github今日热门
- Agent重大突破!OpenAI智能体支持MCP,已开源
- 苹果因虚假宣传 AI 功能,被集体起诉
- 谷歌发布最强推理模型—Gemini 2.5 Pro
- 人形机器人主持发布会发布自己!追觅科技孵化,下月将参加全球首届人形机器人马拉松
- 蚂蚁国产GPU训练大模型细节曝光!Ling模型研发负责人回应:关于我们抠FLOPS的一些点滴
- 你的美图App,在CVPR技术5连秀
- 7B模型搞定AI视频通话,阿里最新开源炸场,看听说写全模态打通,开发者企业免费商用
- 英伟达要买下贾扬清公司LeptonAI!老黄花数亿美元加码算力租赁
- 长视频理解新突破!Mamba混合架构让显存消耗腰斩,处理10万视频token不费力
- Agent太火!看这一篇综述,知识就不会学杂了丨华东师大&东华大学出品
- Qwen原生多模态开源,浅析一下~
- 宫崎骏怒斥:AI 绘画是「对生命的侮辱」!
- 山姆•奥特曼一句「听劝」求头像,百万网友疯狂在线P图脑洞大开!
- 刚刚,阿里Qwen2.5-Omni又开源,实时语音与视频,太卷了~
- Qwen 发布 Qwen2.5-VL-32B 模型:更智能、更轻便
2025-03-26
- 视觉多模态RAG技术总结及Vision-R1用于目标检测任务的奖励函数设计
- Python批量处理Excel数据,使用Python将数据写入SQL Server
- CVPR’25又一满分论文!重建 vs 生成:解决扩散模型中的优化难题
- 今日开源(2025-03-26):上财Fin-R1,7B金融推理大模型,基于Qwen2.5微调,强化金融代码/计算/风控能力
- 【他山之石】CVPR 2025 | 清华提出MambaIRv2:图像复原超强SOTA模型
- 美国机器人“四小龙”:通用机器人仍需十年,专用机器人即将出现,机器人的扩展法则会在五年内被探索出来 | GTC 2025
- 超越 Suno,全球首个 CoT 音乐模型Mureka O1 来了!
- 【优先发布】美国“星际之门项目”对我国AI发展带来的挑战与启示
- 林倞教授详解具身智能未来趋势:人机物高效融合
- 刚刚!美国再将54家中国科技公司列入实体清单!
- 思想的起源:从神经元到存在之问 ——论人类意识的双重本质
- Typed-RAG:非事实问答的问题分解RAG
- 凌晨“激战”!谷歌亮相新模型,OpenAI 紧急甩出 GPT-4o 动动嘴就能 P 图,网友:又要感谢 DeepSeek 了
- ICLR 2025 Spotlight|让机器人实现“自主进化” 蚂蚁数科与清华联合提出具身协同框架BodyGen
- 为企业 AI 人才培养找到最优解|极客时间闪耀 2025 中国企业培训和发展年会
- 刚刚,GPT-4o原生图像生成上线,P图、生图也就一嘴的事
- 视频生成的测试时Scaling时刻!清华开源Video-T1,无需重新训练让性能飙升
- 300年后牛顿法得到改进,修改泰勒展开式,收敛速度更快
- 音乐界迎来自己的DeepSeek!全球首个音乐推理大模型Mureka O1上线,超越Suno
- 谷歌终于登顶一次了!最强推理模型Gemini 2.5 Pro实测体验,真的有点东西
- 上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能
- 解码衰老时钟:深度学习揭示大脑衰老速度与认知功能衰退的关联
- 字节跳动CloudWeGo开源大赛终极挑战:代码破界,定义未来!
- 2025年AI领域国际学术会议和趋势分析
- 中纪委网站通报:二级教授,被查!曾任2所高校党委书记
- 【人工智能 · 重点EI会议】往届已完成检索!国内外知名高校联合主办!
- 世界首个!性能超扩散模型256%,推理速度快21.8倍,统一微观与宏观的3D世界
- 手把手教你部署deepseek多模态大模型
- 最近爆火的全中文LLM教程,实战企业落地项目
- DeepSeek-V3-0324 已成非推理第一
- matplotlib搞定进化树(Tree Plot)
- 实话!国内做科研,别太老实了……
- 李宏毅生成式 AI 导论:最好的 LLM 大模型教程!
- 刚刚!GPT4.5+Claude3.7+Midjourney 彻底开放了!
- 87万年薪的“氛围编码”岗火了,连代码都不用写?Karpathy:不会Swift也能1小时开发iOS应用!
- 新版DeepSeek V3深夜突袭!4bit量化版在512GB M3 Ultra上跑出20 tokens/s
- 11 个改变游戏规则的开源项目
- 检测物体+估计距离和方向 | 附源码
- C++库文件和头文件编写教程
- 常见的距离算法和相似度计算方法
- OpenCV基础知识入门
- 基于人类反馈的强化学习(RLHF)深度解析
- 浅谈VC-PPO 与 DAPO
- 从零开始的大模型强化学习框架verl解析
- 字节 DAPO 技术报告有感!大模型 RL 细节为王
- AI老板心中的迈巴赫!
- LLM 工程师工具箱:120+ 大模型库全攻略
- 前沿多模态模型开发与应用实战第四期:多模态理解趣味应用
- 头部高校与公司联合发布:长上下文语言模型建模综述!
- 从优化角度看:怎样的奖励模型才能成为好的“老师”?
- 超多可玩!Open AI 更新GPT-4o 图像生成功能,以后工作流不存在了?
- 非常好用的DeepSeek喂饭指令,快收藏备用。
- DiffRhythm:创作完整歌曲,支持文本转音乐和纯音乐生成,MacOS 上可运行!
- DPG-Bench榜首!智谱开源文生图模型CogView4:支持中英文输入和生成,免费商用授权!
- 训练一个大模型需要多少显存?
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 被忽视的通义效率助手,藏着几个非常好用的小功能
- 刚刚,OpenAI发布新文生图模型,免费、逼真到难以分辨
- 别让大模型想太多了,过度思考会影响性能
- DeepSeek逼出谷歌新推理模型:40分优势超GPT4.5登顶竞技场,支持原生多模态,但依然败给了“竹竿问题”
- 招聘|量子位智库AI分析师
- GPT-4o图像生成今起免费!奥特曼坐镇紧急发布,指令遵循/文本控制表现惊艳
- Stable Diffusion变身3D神器!一个LoRA将2D图像转3D模型
- 姚班天才范浩强创业公司曝光!旷视三剑客携2亿天使轮进军具身智能赛道
- 轨迹可控视频生成新范式,复旦微软破解视频生成难题,精准控制任意物体运动
- 对话2025最火具身智能团队:2个自动驾驶第一人带队,1.2亿美元天使融资震动江湖
- 中国顶流无人驾驶提速出海:安全久经考验,外国big name实名好评
- 人形机器人优雅漫步,强化学习新成果!独角兽Figure创始人:之前大家吐槽太猛
- Yoshua Bengio参会!「大模型安全研讨会2025」开启,4月23日齐聚新加坡 | 报名开启
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- Gemini 2.5 Pro来了,地表最强!
- 这个shi上最强模型,把我给整笑了!
- 50+位产学研嘉宾揭晓!中国生成式AI大会下周举行,全方位解构DeepSeek及应用、AI Infra与AI智能体
- 一篇100种多模态CoT推理技术最新综述
- DeepSeek 悄然发布 DeepSeek-V3–0324:远超预期的重大升级
2025-03-25
- 也看基于版式分析的PDF文档翻译项目及文档版式分析模型PP-DocLayout
- 拿下CV顶会!多模态特征融合+Mamba新方法,性能超越SOTA!
- 今日开源(2025-03-25):Qwen2.5-VL更新,强化学习优化多模态模型,32B参数,细粒度图像理解与复杂数学推理
- 2025人工智能系列活动全景透视,慕尼黑上海电子展邀您共探未来!
- 大模型“神仙打架”,掀起复现潮、技术大升级后,我们需要关注什么? | 万有引力
- 大模型在简单物理现象理解任务上的认知困境:联想能力将是AGI之路上的下一个关键?
- 构建像人一样学习思考的机器(4万字)
- 深度盘点|16年「英伟达」芯片史与未来趋势预测
- 人工智能竞争力报告:中国论文数全球第二,北大蝉联高校第一
- LLM 工程师工具箱:120+ 大模型库全攻略
- “不用高级GPU”!蚂蚁用国产AI芯片狂降百万训练成本,模型性能还与DeepSeek相当
- DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet
- 棋盘变战场,大模型却呆了?普林斯顿、UT Austin新基准SPIN-Bench曝AI智商瓶颈
- 阿里深夜开源Qwen2.5-VL新版本,视觉推理通杀,32B比72B更聪明
- 一文读懂MCP与AI工具生态的未来,它会是AI智能体的「万能插头」吗?
- Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍
- 推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1
- 挖掘DiT的位置解耦特性,Personalize Anything免训练实现个性化图像生成
- 分子对接速度提升10,000倍,深度图学习加速RNA虚拟筛选,助力药物靶标发现
- 为矛盾的理论提供统一解释,牛津大学等揭秘非晶硅结构
- 赢麻了!全体程序员彻底狂欢吧!这个好消息来得太及时!
- 总结了 30 段极简 Python 代码
- 一文详尽大型语言模型的四种量化技术
- 一科研人员被判处死刑!原因曝光
- 【深度学习】CVPR2025|恺明+LeCun联手带来没有归一化层的Transformer!
- 杭州六小龙最新开源「空间理解模型」,保姆级教程来了!
- Idea撞车何恺明大神新作!速度领先10倍,性能更强
- 在CV界,传统卷积已经彻底输给Transformer了吗?
- 【教程】阿里最新多模态大模型Qwen2.5-VL-32B ,本地部署实践
- 全美各大高校的统计学课堂疯抢,机器学习漫画书终于出中文
- “TRIPLE BAM”!!! 哪些统计学的书让你相见恨晚?
- 从 YOLOv5 到 YOLO11!改进有多大?
- 图灵奖获得者:我不用 ChatGPT
- 基辛格遗世之作:AI 吞噬世界下的人类
- DeepSeek预测:十年后程序员生存图鉴
- 多模态融合,顶会超神了!
- 如何在OpenCV中使用YOLO
- 震惊!2025 中科院分区表发布,这些期刊命运大反转!
- DeepSeek-V3 模型更新,各项能力全面进阶
- 为何说 “在国内做科研,最忌讳踏实”?
- 万字长文!从AI Agent到Agent工作流,一文详细拆解工作流(Agentic Workflows)
- 一文了解模型精度(FP16、FP8等),所需显存计算以及量化概念!
- 确认裁员了,很严重,所有程序员提前做好准备吧!
- 北大院长朱松纯:大模型为什么不是AGI?
- 物理世界的智能体来了?第二十届全国大学生智能车竞赛百度创意组赛题预告!
- 95后博导张林峰专访:6年前提出自蒸馏算法,高效AI助推大模型时代丨独家
- 聊聊DeepSeek-R1-Distilled-QWen32B基于GRPO算法下的训练记录——基于ms-swift训推框架
- 大模型个性化生成综述!AI私人订制,试衣、写作、拍视频!
- 理解 R1-Zero-Like 训练:一种批判性视角 | 原作者分析
- 360智脑团队宣布成功复现Deepseek的强化学习效果,发布并开源其推理模型:Light-R1-14B-DS
- 谷歌推出PaliGemma 2 mix:用于多任务的视觉语言模型,开箱即用。
- CineMaster: 用于电影文本到视频生成的 3D 感知且可控的框架。
- Magic Mirror:可从单个参考图像生成电影级质量身份一致性和自然运动视频
- 打造个人知识库最简单的办法,用腾讯ima轻松搞定
- 7.6K+ Star!PydanticAI:一个AI应用开发框架
- 3月25日周二 | 每日一图
- 3月25日周二 | Python热门项目
- 3月25日周二 | Github今日热门
- 317-B1.1|细粒度视频运动理解、长视频理解基准,细粒度视频问答;评估VLM城市具身智能,视频LLM评估;3D视觉语言CoT
- 317-B1.2|多模态推理,科学问题求解,意图驱动与强化推理;图像数据预训练,图像推理分割,多种视觉任务,中文书法理解
- 317-B2.1|图文交错生成;多模态大规模脑数据集,视觉脑解码;视觉提示调优,视觉指令调优
- 317-B2.2|图像补全、压缩、GS表示;多曝光图像融合,低光增强;视频时间戳定位,流式视频对话
- 317-B3.1|光照感知物体插入;各种3D重建与渲染系列;3DGS隐写术系列
- 317-B3.2|3D语义重建系列;相对相机姿态回归,物体姿态估计;各种3D重建系列;HOI重建
- 突发!DeepSeek开源新版V3,再次震惊国外
- 刚3月,已有9家AI企业融资超1亿美元
- 阿布扎比财团在美国投资250亿美元,用于AI建设
- 招募 AI / DeepSeek 讲师 | 丰厚收入 、40万+企业级客户内训需求
- DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了
- 32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
- 一文看懂多模态思维链
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- AMD跑DeepSeek性能超H200!128并发Token间延迟不超50ms,吞吐量达H200五倍
- 招聘|量子位智库AI分析师
- 三位数学家改写经典牛顿法!300年前算法一夜更新,收敛速度更快函数范围更广
- 随手一拍,高效重建大型3D开放场景,港科广GraphGS突破传统重建技术瓶颈|ICLR 2024
- 新版DeepSeek-V3官方报告出炉:超越GPT-4.5,仅靠改进后训练
- Qwen开源,牛了
- Attention is NOT all you need!这个「去Transformer」的玩意直接把我整懵了!
- AI 挑战天花板ARC-AGI-2 发布,顶流o3 模型也只能拿5分!
- DeepSeek与Qwen组团开源了模型,冲!
- 瓦力算法3月第3周急招岗位| / bilibili / 主线科技 / 腾讯 / 上海算法创新研究院 / 航天智能院 / 高德
- LLM中的分块技术:原理、应用与展望
2025-03-24
- 从MetaGPT、LangGraph看Agent记忆实现机制:兼看昨日大模型等技术进展回顾
- CVPR 2025 满分论文,极简的数据蒸馏!
- 今日开源(2025-03-24):字节发布InfiniteYou,高保真照片重塑框架,DiT架构+InfuseNet注入身份特征
- AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025
- 【他山之石】CVPR 2025 | 清华提出MambaIRv2:图像复原超强SOTA模型
- 【他山之石】AAAI2025 | 北大和数原提出MMGDreamer
- 【源头活水】院士领衔万字长文,全面系统梳理多模态LLM对齐算法
- OpenAI研究负责人诺姆·布朗:基准测试比数字大小毫无意义,未来靠token成本衡量模型智能|GTC 2025
- 小红书技术专家解密语音识别与推荐算法,干货满满|ML Summit 2025
- 宇宙也有智能?智能体不但是AI领域核心,更可能引发科学范式重大变革!
- 麦肯锡:《超级智能体:赋能人们释放人工智能的全部潜力》
- 刘壮、何恺明&Yann LeCun联合新作:只需9行代码,全新颠覆Transformer,效果惊艳!
- 意识复杂性的剖析:理论与反思(3万字)
- Dify入门 与 工作流节点介绍
- Siri 跳票、iOS 强绑 AI,库克震怒换帅!大佬锐评:苹果高层都是快 70 岁老头儿,该换懂 AI 的年轻人上了
- Copilot 及 Cursor 等 AI 编码助手的新漏洞:通过规则文件注入恶意代码
- 秒哒一出,代码全无!Manus:我先做个 PPT 压压惊
- CVPR 2025满分论文:开源三维生成框架Craftsman3D&Dora革新三维资产生成与编辑
- 腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?
- 为什么明明很准,奖励模型就是不work?新研究:准确度 is not all you need
- 刚刚,谷歌Gemini Live上新功能,能看懂手机屏幕、还能实时视频
- CVPR 2025 | Qwen让AI「看见」三维世界,SeeGround实现零样本开放词汇3D视觉定位
- 统一细粒度感知!北大&阿里提出UFO:无需SAM,16个token让MLLM实现精准分割
- 首个评估MLLMs对地质图理解的基准集,以及专为地质图理解设计的Agent
- 搜索效率提升4倍,南大提出基于对称性原理的晶体结构预测方法
- 隐藏马尔可夫模型的解释、真实案例以及 Python 代码
- 【学历通胀警报】”大学扩招大跃进”背后:你的毕业证正在贬值?
- 博士毕业论文致谢句句诛心,博士女朋友看了这样回应!
- 中科院分区2025出炉,计算机科学大类分区、自动化与机器人小类分区名单
- 导师一个idea都没给,但也发了顶会CVPR,我摸索的这个方法绝了!
- 全球首次,国产机器人实现“鲤鱼打挺”
- DeepSeek核心技术PPO & GRPO原理,小学生也能看懂!
- 7B专业领域大模型,能打DeepSeek- R1?测试甚至不如QwQ:32B
- 刚刚,DeepSeek发布了最新V3大模型0324
- 数据分类关系可视化大合集:141个图表,8大类型,一次学会!
- 大语言模型可视化
- 今年读过最绝的一本LLM书!下载量10w+!看完少走一半弯路
- 2025中科院分区地震!这些期刊降区,你的投稿策略该调整了。。。
- Sam Altman :GPT-5 将免费开放,DeepSeek 教训了我们。。。
- 写800行代码,AI就“摆烂”?OpenAI高管却放言:2025年底,AI代码的自动化程度将达到 99%
- 人类编程时代即将终结?OpenAI首席产品官预测AI将在今年底全面超越人类程序员
- AI也“耍赖”?DeepSeek R1和o1-preview被曝在棋局中「输急眼就作弊」!
- 用Copilot一阵子后,开发者悟了:“AI越聪明,我们就越笨!”
- “45个高效Linux命令组合,可以解决99%日常运维需求!”
- 在CV界,传统卷积已经彻底输给Transformer了吗?
- 使用PyTorch进行情侣幸福度测试指南
- 图像滤波常用算法实现及原理解析
- 被放养的博士能靠自己毕业嘛?
- DeepSeek SFT 微调:基于法律问答的模型优化实践
- prompt压缩,还能这么干
- 长三角企业安全生产AI风险管控研讨会,4月在无锡举办,值得参加!
- 目标跟踪失真难题,OmniTrack解决,性能提升6.8%!(附论文及源码)
- 10篇DeepSeek-R1相关研究全面汇总,万字思考!
- 5款视觉OCR开源模型,数字、文本、公式等精准解析!教育/金融场景全覆盖!
- 真正的智能体-LLM Agent
- 数据生态共建再落一子!2025年文心中国行首站锚定无锡
- 线下培训日历!完全模型组全国巡回线下培训火热开启!
- 直播报名|开启机器人操作新纪元,大规模高质量机器人学习数据集GO-1,AgiBot World
- AI 百万招聘
- 综述 | 上交联合Amazon和耶鲁提出:从CoT Reasoning到语言Agent的搭便车指南
- 招生 | 北语信科学院BLCU-ICALL实验室招收研究生啦
- 先想后画!多模态CoT让AI具备语义-空间双推理链条!
- LLM模型尺寸的秘密:模型大小如何影响性能、成本与实际应用?
- 从代码检索到生成,Code Embedding Model如何改变开发者的工作方式?
- Window上6G显存就能跑文/图生3D?腾讯开源Hunyuan3D-2 Windows 便携版,轻松运行腾讯混元3D 2.0!
- 腾讯发布混元-3D 2.0: 首个开源高质3D-DiT生成大模型,几何结构更加精致,纹理色彩更加丰富。
- 腾讯HunYuan-3D 1.0,支持文本到3D和图像到3D,10秒即可生成高分辨率细3D模型。
- IBM提出多模式图像文本到文本模型SmolDocling,可实现代码 | 公示 | 图表 | 表格 | 标题 高效转换!
- Seed-Music:字节跳动开发的音乐生成模型 支持多种数据输入生成和编辑音乐!
- 震惊!东京大学提出ARTalk!语音驱动3D面部动画大突破!
- 腾讯优图提出首个基于DiT的高保真虚拟试衣算法FitDiT
- Transformer为什么使用多头注意力机制?
- 全网都在找的宝藏网站Skyline,在家就能查看全球实况摄像头!
- 317-A2.1.1|基于多智能体CoT的自动电影生成,故事视频叙事,情节发展与相机运动,视频生成的相机运动模拟
- 317-A2.1.2|全能视频创作与编辑,视频实例添加,关系视频定制化;视频风格迁移,视频风格变形
- 317-A2.2|自回归扩散视频生成,生成式视频双流场,视频生成推理加速;动作为中心的物理常识评估;检测AI生成视频
- 317-A2.3|文字与声音引导说话视频生成,专业电影声音生成,同步视频到音频生成,动态MRI序列生成语音音频;口型同步说话脸
- 317-A3.1|单图生3D,三平面GS场表示,3D形状生成,关节物体生成,可控3D户外场景生成,单图重建3D头部网格
- 317-A3.2|多模态人类动作生成,动作个性化,高保真文生动作,物理可信人类动作生成;多镜头视频恢复人类动作;音频驱动手势合成
- 彻底颠覆教育!每天用AI学习2小时,成绩超美国98%学校
- 阿里开源多语言大模型,支持全球90%人口
- 苹果新表被曝加摄像头,让AI有空间感知能力,中国小天才笑而不语
- 最后1天!今年最值得关注的AIGC企业/产品正在评选中
- 用百度秒哒开发应用,会说比会写重要
- 大神卡帕西亲自演绎零基础开发APP,ChatGPT四轮对话搞定,一小时即在手机运行
- “AI辅导2小时,成绩冲进全国前2%”,OpenAI总裁转发私立教学成果,网友:一年学费4万美元??
- 不到24小时!今年最值得关注的AIGC企业/产品评选即将截止
- deepseek-r1,论文番外篇~
- 每月薅马斯克150美金的羊毛,你居然不知道?
- 最近爆火的氛围编码是个什么鬼?
- 缅北电诈也得跪下当小弟!这个AI 诈骗术将钓鱼成功率暴拉350%
- 0.35秒OCR整页文档,比Qwen2.5 VL高出10%的文档转换多模态模型!
- Prompt Engineering 常见陷阱及规避方法
2025-03-23
- 也谈Agent的记忆问题及Dify的知识库分段及召回逻辑细节
- 干货满满!GTC25 图灵奖获得者AI教父杨立昆“硬刚”英伟达首席科学家比尔达利,直言英伟达该降价了!
- DeepSeek R1-Zero 内幕大公开:原来“顿悟时刻”早就来了?还有 GRPO 的秘密
- 通过 LLM 表示破译人脑中的语言处理
- 自我模拟和预测:机器实现自指又迈进了一步
- 从230亿被拒绝到加价100亿敲定,谷歌为何非买下这家神秘以色列公司?
- 如何向10岁小孩解释PCA(主成分分析)算法
- Qwen3部分技术细节被扒;年薪达945万!80后女副总裁首登福布斯;字节吴永辉亲自带实习生,取消Seed季度 OKR|AI周报
- 如何在 Java 中基于 LangChain 编写大语言模型应用
- 「注意力实际上是对数的」?七年前的Transformer还有新发现,Karpathy点赞
- 田渊栋和Sergey Levine参与开发新型RL算法,能通过多轮训练让智能体学会协作推理
- 用科幻建立AI行为准则?DeepMind提出首个此类基准并构建了机器人宪法
- 地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型
- 科学家们正利用机器学习从数千种旧药中寻找新的治疗方法
- 学术志重磅新书,帮你极速上手DeepSeek,高效做事不内耗!
- 13年后,AlexNet源代码终于公开,内藏玄机!
- DeepSeek背后核心之:强化学习
- 55个heatmap模版~
- 亲手复现DeepSeek-R1-Zero实验完整解读
- 董事长十几刀刺死 CTO:一个要“先发布后优化”,一个坚持先优化。。。
- 3 个令人惊艳的 DeepSeek 项目,诞生了!
- 全球顶级AI科学家著作,底层视觉技术10年发展精粹!
- YOLO-BLBE:一种新方法识别不同成熟度蓝莓果实的新型模型
- NIPS 2024 | 跨领域图像去噪的适应性领域学习
- 只写prompt救不了Agent
- 42美元训练24小时!1.5B小模型逆袭o1,OpenAI方法论被开源了?
- 直播预告 | 多模态推理CoT全面综述
- 【RAG实战 】 手把手教你从零手撸一个语义切块,解锁更多优化技巧!
- AI听觉革命!港科大×月之暗面发布AudioX,文字/视频/图片秒变天籁神曲!
- 多身份定制化视频创作新突破!Ingredients:可将多个身份照片整合进视频创作实现个性化视频生成。
- 单张照片生成3D头部模型!Adobe提出FaceLift,从单一人脸图像重建360度头部模型。
- 如何缓解RL过程中的对齐税?
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- Github热门项目周报 | 第12周
- 3月23日周日 | 每日一图
- 3月23日周日 | Python热门项目
- 3月23日周日 | Github今日热门
- 317-A1.1.1|将多模态理解无缝集成到DiT,光学幻觉图像生成,时间步感知LoRA MoE;适配器引导蒸馏,轨迹分布匹配
- 317-A1.1.2|个性化系列,风格化系列
- 317-A1.1.3|可控生成(条件引导DiT,多条件输入,单步扩散与联合分布匹配);图像编辑(物体移除,图像转换,布局编辑)
- 317-A1.2.1|DiT可解释性,高效DiT(特征缓存系列,后训练量化),扩散效率(时间旋转扩散量化,去噪分数蒸馏)
- 317-A1.2.2|自回归图像生成系列,多模态理解与生成系列,掩蔽图像生成
- 317-A1.3|评估系列(真实图像质量与美学,复杂语义理解与世界知识整合,生成特定数量对象,触觉图像生成)
- 317-A1.4|安全系列(概念擦除系列,可解释合成图像检测)
- 317-A1.5|图像超分系列,对比度增强,单步扩散用于图像运动去模糊,利用扩散潜在空间实现域泛化
- 蚂蚁华为阿里云罕见联手:AI医疗如何跨过落地鸿沟?
- 谷歌对齐大模型与人脑信号!语言理解生成机制高度一致,成果登Nature子刊
- 院士领衔万字长文,全面系统梳理多模态LLM对齐算法
- DeepSeek R2 在ARC-AGI 中得分90%!?
- 重磅!Claude Code 八大升级,开发者狂欢!却有一个致命问题?
- 硬核,AI Agents全栈技术框架综述与未来
- 智能体人设与编排:导演
- 结合DeepSeek、FAISS与LangChain构建RAG系统
2025-03-22
- 21个RAG常用优化策略变体及notebook开源实操
- 重磅!AI大模型又起飞了!!
- 再看行业R1模型如何构建及减少推理大模型过度思考
- 深度学习+多模态数据融合,顶刊超神了!
- 【源头活水】CVPR 2025 满分论文!清华提出TSP3D:基于语言引导空间剪枝的高效3D视觉Grounding
- P/NP问题50年:基础理论举步维艰,但AI正在不可能中寻找可能
- 万字追问:预测大脑、脑机接口和人类智能的未来
- 谷歌史上最大收购:320 亿美元买下了发现 DeepSeek 数据库泄露的那家小企业
- 谷歌史上最大收购:320 亿美元买下了发现 DeepSeek 数据库泄露的那家小企业
- Cohere 发布多语言 Command A 模型:仅需两张 GPU 即可服务全球企业
- 破局 AI 算力瓶颈,探讨数据存储与分析的协同创新 | 直播预告
- 揭秘DeepSeek R1-Zero训练方式,GRPO还有极简改进方案
- 强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍
- CVPR 2025 高分论文 | 单图秒变3D真人!IDOL技术开启数字分身新时代
- ICLR 2025 Spotlight|让机器人实现「自主进化」,蚂蚁数科、清华提出具身协同框架 BodyGen
- 2025 年,通用机器人要从实验室走向市场了吗?
- 大模型江湖,算法与工程孰执生意牛耳?
- 批量生成小红书风格知识卡片,附Python代码!
- 一行代码,优雅的探索高维数据
- 超越DeepSeek GRPO的关键RL算法,字节、清华AIR开源DAPO
- 饶毅:近年有人推荐一位“杰青”任院长,一看就是“浮躁的典型,发了一批没意义的论文”,还能混江湖,“这类人不仅多,而且频频晋升”
- 深度学习中GPU和显存分析
- 长远看算法岗真的比开发岗香吗?
- 医图论文 ACM MM’24 | BSBP-RWKV:用于高效医学图像分割的背景抑制与边界保留方法
- 大语言模型真的擅长逻辑推理吗
- 深入解析MCP
- prompt那么长,能不能压缩一下?
- 【校招&实习】同花顺AIME计划 寻找AI领域最顶尖的你
- Y→MVP→AARRR:解锁产品增长的「三把钥匙」全图谱
- 我用trae开发了一款颜值测试小程序
- Multi-Agent系统为何常“翻车”?伯克利指出其具有人类合作所有坏毛病!
- LLM-based Agent评估综述!
- AI老板心中的迈巴赫:DeepSeek+Ollama+Xinference+RAGFlow+Dify部署教程,RAG落地5件套!
- 316-A1.1|理解与生成的统一奖励模型,频率自回归,食谱图像生成基准,DiT加速,图像编辑安全性问题,LLM处理SVG的综述
- 316-A1.2&A2|生成模型用于物理关系预测;单目视频相机轨迹重定向,任意长度视频修复与编辑,轻量级解码器用于高效生成
- 316-A3|3D与文本潜在空间对齐,草图到CAD重建,MLLM复杂场景对象放置;火柴人生成3D人类动作,探讨舞伴间的隐性交互
- 316-B1|将数据集蒸馏到神经场;几何问题求解,复杂多图像理解,VLM人类偏好对齐;图像超分,2DGS视频表示,文本到视频检索
- 316-B2|视频先验稀疏重建,运动模糊图像场景重建,高斯表面重建;视频立体匹配,6D物体姿态估计;流式传输体积视频,高斯头像
- 实测首个烹饪大模型「食神」:DeepSeek进厨房,看脸生成养生食谱,普通人也能做大餐
- 宇树再上大分:机器人全球首次鲤鱼打挺
- 50条数据解锁空间智能,RL视觉语言模型3D空间推理框架MetaSpatial |西北大学
- 重磅!腾讯推出T1 模型,超越DeepSeek R1,棒打GPT-4.5!
- Claude think ≠ extended thinking,傻傻分不清?官方教程来了!
- 为什么说海螺是AI视频生成的DeepSeek时刻?
- R1圈的新王者,腾讯混元-T1发布,首个混合Mamba推理模型~
- 超越o1&QwQ-32B,中科院SolutionRAG大幅提升复杂工程方案设计能力
- ZeroHSI-一种零样本的四维人类-场景交互合成方法
- 停止过度提示:为什么简短的 AI 提示比长prompt更胜一筹
2025-03-21
- 大模型微调数据生成工具Easy Dataset及KBLaM知识注入框架评析
- 荣登Nature招牌1区Top!可解释的多模态融合模型迎来新突破!
- 连看几十篇YOLO论文,发现了YOLO中稿的“潜规则”!这妥妥发SCI的捷径!
- 今日开源(2025-03-21):阶跃星辰开源Step-Video-TI2V,文本驱动图像到视频生成,3B参数,支持102帧输出
- 阶跃星辰 Tech Fellow 段楠:Step-Video 系列模型的关键技术解读
- 杨立昆“砸场”英伟达:不太认同黄仁勋,目前大模型的推理方式根本是错的,token 不是表示物理世界的正确方式|GTC 2025
- 诺贝尔基金会采访2024获奖者Hinton:5年内,AI有50%几率比人类更聪明!
- Sam Altman :GPT-5 将免费开放,DeepSeek 教训了我们
- Nature:如何在复杂的社交中游刃有余?研究发现大脑中处理“人情世故”的“函数表达式”
- 黄仁勋公开认错!承认不该唱衰量子计算
- 年薪96W!真心建议数据人冲一冲新兴领域,工资高前景好
- 李开复:超大模型预训练逐渐寡头化,国内将收敛至 DeepSeek、阿里、字节三家
- 英伟达九位数收购合成数据公司 Gretel,80 人技术团队一并纳入麾下
- 刚刚,OpenAI开启语音智能体时代,API价格低至每分钟0.015美元
- 预测误差降低12.3%,多车协同预测框架CMP,破解自动驾驶「视线盲区」
- 13年后,AlexNet源代码终于公开:带注释的原版
- 前字节跳动AI技术专家加盟千寻智能,出任具身智能部负责人
- Roblox发布3D智能基础模型Cube,一句话生成游戏资产
- 树搜索也存在「过思考」与「欠思考」?腾讯AI Lab与厦大联合提出高效树搜索框架
- ICLR 2025北京论文分享会启动,一起探讨多模态、Agent等热门话题
- 火了!高中生用Minecraft做AI基准,用户看图投票决定大模型排名
- 成效初显!基于DeepSeek强化学习的医疗VLM策略来了
- 生信工具评测方法:基于蛋白质对的计算机预测工具评估
- 硬控 Python 代码,加速 500%
- Dify-Plus:一个定制化的Dify二开开发
- 重磅!DeepSeek R1零门槛提示词+13大场景模板,让AI输出效率暴增300%!
- 【深度学习】彻底搞懂!Transformer多头注意力 !!
- 【效率】AI笔记神器NotebookLM,保姆级教程来了!
- 聚焦推理模型、AI Infra、AI智能体与具身大模型!DeepSeek时代首场生成式AI大会4月举行
- 阿里投的具身智能公司,半年融了5个亿!
- 大模型量化技术(Quantization)可视化指南
- marginal plot
- IEEE TPAMI 2025 | 从像素到像素:一种全新的零样本图像去噪方法
- 60 个神级 VS Code 插件!
- YOLO落地部署 | 让YOLO5和YOLO7等方法都可以用上4-bit/3-bit的超快部署方案
- TIP 2024 | 跨类与跨域语义增强用于域泛化
- 智绘AI蓝图,共策电力新篇-「电力+AI」应用赋能计划招募启航!
- 借卡名单公示&线上赛指南|全国大学生智能汽车竞赛百度完全模型组
- 亲自说说字节 TopSeed 怎么样!
- 停止过度思考!一篇关于高效Reasoning的综述来了~
- 为什么 RAG 会失败以及如何解决?揭秘背后三大致命缺陷!
- LBM:用于图像到图像直接快速转换,支持可控照明、图像恢复、物体移除等功能!
- CVPR 2025 | 多实例扩散模型MIDI:可从单个图像创建高保真 3D 场景,模型&代码已开源。
- AI创作从此无所不能!复旦大学提出UniCombine!多条件可控生成的终极武器!
- 推荐5个YouTube视频下载工具,已经帮大家试过了,好用!
- 开源即巅峰!HeyGem数字人疯狂刷屏,人人都能免费部署!
- 【智谷要闻】AIGC智谷×上海交通大学DeepSeek大师锻造2日营点燃AI学习热潮
- 【AIGC智谷】中共凉山州委党校第63期县级干部进修班参加AIGC实训课题活动
- 【AIGC趋势】破解产业痛点,重构智能时代基础设施
- 【行业动态】国产AI技术迎来里程碑式突破,腾讯元宝电脑版上线截图提问、深色模式功能
- 刚刚,OpenAI首发语音Agent,智能体实现重大突破
- 精彩回顾 | “AI重塑生产力”沙龙成功举办
- 英伟达发布世界最小AI工作站DGX Spark
- 亚马逊开源5级通用AI Agent:自动查询航班、天气,超4000颗星
- DeepSeek上脸实测:AR眼镜实时翻译老黄GTC演讲,完了还帮我划重点
- 一张图,快速生成可拆分3D角色!腾讯清华新SOTA | CVPR 2025
- GPT-5将免费向用户开放,DeepSeek逼的
- Nature发文「智能体摩尔定律」,Agent能力每7个月翻倍,5年后能顶人类苦干一个月的工作
- 对话周光:自动驾驶实现AGI,RoadAGI比L5更快 | GTC 2025
- 视频可以精准控制了!一句话给熊戴眼镜的那种,扩散模型立功,浙大悉尼科技大学出品 | ICLR 2025
- 清华&哈佛4D语言场建模新方法,动态场景精准识别|CVPR2025
- 腾讯押注非Transformer!推理模型混合Mamba也能搞,深度思考也能秒回
- Yann LeCun:LLM 绝无可能实现AGI!
- 一篇72页的DeepSeek-R1/QWQ-32B推理能力在AI Agents场景的应用分析
- Agentic RAG:检索增强生成技术的新飞跃
2025-03-20
- 生成AI拿下3大顶会最佳!2025投稿新风向!
- 一文图解Agent智能体:60张图、14个技术点回顾Agent的基本认知
- CVPR 2025 即插即用卷积-自适应矩形卷积!
- 今日开源(2025-03-20):SpatialLM,3D大语言模型,处理点云数据,生成结构化场景理解,赋能机器人导航与空间推理
- 【源头活水】CVPR 2025 | 大模型全军覆没!中科院提出MV-MATH:多图数学推理新基准
- 【他山之石】ICLR 2025 Spotlight | 慕尼黑工业大学&北京大学:迈向无冲突训练的ConFIG方法
- 【源头活水】Long-CoT 后,推理模型的「思维模板」有哪些新玩法?
- 3小时复刻传奇,OpenManus一作梁新兵:通用Agent的构建与赋能
- 史上最贵!OpenAI推出o1-pro API,输出600美元/百万token
- 意识研究是“科学”还是“伪科学”?两大意识范式的交锋
- 世界经济论坛:《工业制造中的前沿技术:AI智能体的崛起 》研究报告
- 专家“冷眼”看AI:3年实现AGI?5年能力停滞?
- 7000字详解火爆全网的Claude 模型上下文协议 (MCP)
- 全景解读 LLM Posting-Train(后训练)技术
- 竞赛总结:AFAC2024 金融工具Tools识别
- 史上最贵 API!比 DeepSeek-R1 贵千倍,OpenAI 高价劝退一批用户!
- 如何为预训练 LLM 添加新 token?
- 刚刚,OpenAI推出最贵o1-pro API!千倍于DeepSeek
- AI预判了你的预判!人大高瓴团队发布TTR,教会AI一眼看穿你的下一步
- 波士顿动力真「翻」不过宇树、众擎!一觉醒来,全世界的机器人都在侧空翻
- 一个算法让LLM创新能力暴增,原来是AI学会了进化
- 李飞飞、吴佳俊团队新作:不需要卷积和GAN,更好的图像tokenizer来了
- 华为诺亚综述:生成式模型如何用于决策?
- ICLR 2025 Oral|突破深度学习求解PDE的瓶颈,清华提出空间调控新范式GridMix
- 「让通用机器人成为现实」,谷歌RT-2、PaLM-E作者离职创业,已获英伟达投资
- DecoupledGaussian:用于基于物理交互的物体与场景解耦
- 迄今为止最大最全面!人类专家级准确性,AI数据驱动的生物医学知识图谱
- 剑桥团队革新RNA速率分析:AI算法突破基因动态追踪
- Python 中千万不要直接返回 None
- DeepSeek-VL2 心法秘籍
- 【效率】再见 Typora ! 又一款炫酷写作神器!
- 福建福耀科技大学,已有15位院士!
- 博士 offer 一夜变废纸,导师被逼抱头痛哭,学术寒冬席卷高校,博士先遭殃
- RAG技术全探索:20种方法源码解读与实践
- 极简教程,大模型量化实践,1张4090跑QwQ?
- 刚刚,2025中科院分区表已公布!NC虚惊一场
- 一键美化Python图表!
- 原作者带队再次改造xLSTM,7B模型速度最快超Mamba 50%,权重代码全开源
- 谷歌史上最大收购!豪掷320亿美元拿下安全初创公司Wiz
- DeepSeek锐评:如何成为搞垮团队的程序员,还是太含蓄了,你得这么干…
- 爆肝两周!CVPR2025论文合集
- 黄仁勋携GB300震撼登场!DeepSeek推理暴涨40倍打破世界纪录
- ACM MM’24 | DCAFuse:用于多模态图像融合的双分支扩散 - CNN 互补特征聚合网络
- 尝试基于小模型(0.5B)复现DeepSeek-R1的思维链
- 三万八千八,DeepSeek带回家
- 类 DeepSeek-R1 模型的复现方法与相关研究
- 【北京中关村人工智能研究院】强化学习实习生
- 第一批抓住DeepSeek风口的研究生已经论文自由了。。。
- 深度解读大规模深度强化学习的算法优化:Policy Gradient、PPO及PPG
- 无人机目标检测,基于YOLO改进,高效特征融合算法!
- 建议收藏:英伟达主流GPU参数速查表!
- 为什么你在国内高校实验室里发不出顶会顶刊?
- 发掘无限潜能!飞桨黑客马拉松第八期,重磅奖励邀你来战!
- 厦门站见!百度飞桨领航团 AI 达人创造营(第五期)火热进行中
- 聊聊华为昇腾体系下,基于ms-swift&lmdeploy训推框架的GRPO算法训练
- 这篇Long CoT Reasoning综述隐藏好多idea啊!
- NICE50期论坛 | 大模型的高效新能源:数据合成与自动化评估
- CVPR 2025 | AI+足球!UniSoccer带你通往“足球大模型”之路
- 通俗易懂:什么是AI、机器学习、深度学习、强化学习?
- 解锁的搜索与推理新模式:DeepSearch与DeepResearch的区别
- 从故事直接生成视频?一起来看DreamRunner如何重塑内容创作。
- 人类运动生成新方法MoMask:可将文本描述作为输入并生成相应的高质量人体运动动作
- 图像超分辨新SOTA!南洋理工提出InvSR,利用大模型图像先验提高SR性能, 登上Huggingface热门项目。
- 自媒体必备神器,批量采集抖音小红书爆款选题,找对标太方便了!
- 5.6K+ Star!R2R:一个支持RAG的AI检索系统
- 3月20日周四 | 每日一图
- 3月20日周四 | Python热门项目
- 3月20日周四 | Github今日热门
- 论文简读|为DiT添加高效且灵活的控制|Tiamat、上科大、新国立、Liblib AI
- 315-A1|多模态生成模型综述,个性化图像编辑,风格迁移系列,长度可扩展DiT,图像编辑的安全保护相关
- 315-A2|评估可控人类视频生成,整合语言模型于扩散模型的文生视频,音频驱动动态肖像合成
- 315-A3|室内场景合成,3D场景物体移除与修补,视频3D流体重建与预测,为各种物体生成3D动作
- 315-B1|自我中心生活助手,可穿戴实时智能助手;数学推理,几何理解,文档理解,长视频理解;文本-音频增量学习
- 315-B2|视觉与大脑信号Gap;视频INR,视频字幕提取;稀疏视角GS超分,开放世界场景理解,点云补全,伪细节填充3D场景
- 314-A|颜色-概念关联,域适应,扩散优化;相机可控3D一致视频生成,视频“标记器”;多视角一致图像生成;单图恢复3D人类运动
- 314-B|GUI智能体,视觉注意力重分配,视觉-语言-动作模型;在线视频助手;动态球面神经表面
- 比DeepSeek、o1高3倍!首创无服务器强化微调,只需十几个数据点,
- 英伟达开源通用机器人大模型—GR00T N1
- xAI收购Hotshot,进军AI视频领域
- GitHub Copilot 两期连看:开发流程全览及 Copilot 在 SQL 开发中的妙用
- 宇树机器人侧空翻惊呆网友:“我**想要一个!”
- OpenAI史上最贵模型来了!比DeepSeek贵270倍,100万输出token 600美元
- 最后1周!今年最值得关注的AIGC企业/产品正在评选中
- 7499拿下纯血鸿蒙+DeepSeek,华为“小宽折叠”手机:帮接电话,眼动翻页
- 单张照片实现三维重建,单视角室外复杂场景首次攻克| 西湖大学&港科大&Everlyn AI
- 招聘|量子位智库AI分析师
- OpenAI加码写作赛道?阿里最新大模型通用写作能力基准WritingBench,揭秘深度思考能否增进文学表达
- AI视频是否符合物理规律,量化基准来了,实现人类感知对齐 | 阿里高德/中科院出品
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- GRPO训练的坑,字节帮你淌了,DAPO开源
- Manus 引爆 AI 热潮,你的技术知识已 “过期”?
- Mistral OCR:文档处理领域的革新者
2025-03-19
- 近日前沿进展回顾及再看多模态R1推理如何做?两类、五个代表工作实现思路总结
- 为何说 “在国内做科研,最忌讳踏实”?
- 何恺明联手LeCun改进Transformer!成功去掉归一化层!中稿CVPR 2025
- 何恺明联手LeCun改进Transformer!成功去掉归一化层!中稿CVPR 2025
- 机器学习中常用的5种距离度量方法
- 今日开源(2025-03-19):LMM-R1,增强3B多模态模型推理能力工具,两阶段规则强化学习,提升视觉感知与逻辑推理
- 黄仁勋年度演讲来了,Scaling Law失效只是假象,推理需求暴涨100倍,AI模型优化迎来新挑战|GTC 2025
- 基辛格遗世之作:AI 吞噬世界下的人类
- Nature ,微软量子计算声明仍缺乏证据:物理学家对此表示质疑
- 兰德:关于《超级智能战略研究报告》的深度分析,在人工智能竞争中寻求稳定
- AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025
- 黄仁勋年度演讲来了,Scaling Law失效只是假象,推理需求暴涨100倍,AI模型优化迎来新挑战|GTC 2025
- RAG技术全探索:20种方法源码解读与实践
- 英伟达软硬件“双拳出击”:Blackwell Ultra、Rubin 芯片炸场,开源Dynamo让R1 token生成暴涨40倍
- 阿里妈妈搜索广告大模型2024思考与实践
- 专为DeepSeek类强推理加速,老黄拿出Blackwell Ultra,下代架构性能还要翻倍
- Django创造者Simon Willison分享:我如何使用LLM帮我写代码
- 世界模型在机器人任务规划中的全新范式:NUS邵林团队提出通用机器人规划模型FLIP
- 无需百卡集群!港科等开源LightGen: 极低成本文生图方案媲美SOTA模型
- Cursor重磅上线Claude Max,工具调用一次0.05美元,充值实测一波
- NAACL2025|中国移动九天团队提出大模型调色板:一种可控文本生成的解决方案
- 原作者带队再次改造xLSTM,7B模型速度最快超Mamba 50%,权重代码全开源
- CVPR 2025|复旦&微软开源StableAnimator: 首个端到端ID一致性人类视频生成,Github Star破千
- 第三届世界科学智能大赛火热报名中!快进来看看
- 准确率达88%,从随机性走到确定性,AI驱动的小鼠胚胎模型发育预测
- 再见 Typora ! 又一款炫酷写作神器!
- 机器学习西瓜书有平替嘛
- 退而求其次?青椒跳槽三线高校后,副教授变教授、140平房子到手、老婆入编…
- 【Python】100个Pandas小技巧,让你精通Python数据分析
- 2025年99%代码AI生成!OpenAI高管宣告没有退路,人类将被全面超越
- 民办本科毕业的他,成为北京大学博导、实验室负责人…
- 硬刚DeepSeek-R1,全球首个工业界多模态推理模型开源!
- 嫌Matplotlib繁琐?试试Seaborn!
- Python matplotlib保姆级教程
- 爆肝两周!CVPR2025 论文合集终于开放了。。。
- 2024 年国家杰青、国家优青名单
- 刚刚,老黄携 GB300 震撼登场!DeepSeek 推理暴涨 40 倍加速全球最快,26 年 Rubin 问世
- 工作 5 年后,又想读个名校的 AI 硕士,还有希望吗?
- 955 神仙公司名单!
- 一直在错过,这次不想再观望了
- 倒计时 30 天!2025 全球机器学习技术大会全日程官宣!
- Siri 被曝「难产」!苹果高管承认:AI 功能成功率仅 60-80%,太“难看且尴尬”了
- “辞职发疯戏”火了:离职要爽还是体面?
- 不是CG?没加速?这个国产机器人跳「斧头帮」舞火了,网友:流畅到不像真的
- 如何画出漂亮的神经网络图?神经网络可视化工具集锦搜集
- 全景解读 LLM Posting-Train(后训练)技术
- 【search-o1】大模型的推理
- 结合代码聊聊FlashAttentionV3前向过程的原理
- 为什么GRPO训练开始时,Loss函数为0,并且不降反增?
- 掀桌子了!满血版3万Tokens每秒,英伟达捅破DeepSeek推理天花板!关键技术全揭秘!
- 苹果开源AIMv2通用视觉模型:性能碾压CLIP,视觉与文本的完美融合!
- DCIC 闽江流域水情预报 0.00097 baseline
- 前沿多模态模型开发与应用实战3:DeepSeek-VL2多模态理解大模型算法解析与功能抢先体验
- 百度飞桨厦门赋能中心法律科技AI私享会落地,开创法务创新应用新篇章
- 多模态思维链(MCoT)综述:迈向通用人工智能的关键一步
- TrustAgent Survey: 关于可信 LLM Agent 的综述
- 大模型对齐论文专题分享@ICLR2025
- 为什么复制大文件时进度条在后半段突然加速?
- CVPR 2025 | 多实例扩散模型MIDI:可从单个图像创建高保真 3D 场景,模型&代码已开源。
- CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?
- 利用多模态模型赋能,SONY团队完成音乐到音乐视频描述生成大突破!
- 港科大×月之暗面发布AudioX,文字/视频/图片秒变天籁!
- 全网都在找的宝藏网站iFixit,原来是全球最大的维修社区!
- 英伟达全力发展AI Agent!开源专属大模型,最强AI工厂
- AMD开源30亿小参数模型,媲美Qwen-2.5
- 焱融YRCloudFile发布面向AI推理的分布式KV Cache特性
- 老黄发布新核弹B300,英伟达:B200已破DeepSeek-R1推理世界纪录
- 240元打造擅长数学的多模态版R1,基于DeepSeek核心思想,两阶段训练提升推理能力至工业级应用标准
- 仅凭RGB图像实现户外场景高精度定位与重建,来自港科广团队 | ICRA 25
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 可灵接入DeepSeek-R1,一手实测在此:AI视频创作,不用学写提示词了
- 清华推出开源具身智能框架:用VLM解决机器人动作异构一致性难题,性能超越14倍参数对手
- 最后1周!今年最值得关注的AIGC企业/产品正在评选中
- AI一周写出ICLR研讨会论文!成果简洁有效获审稿人大赞
- 真·MoE?路由LLM最全面探索:一种笔记本也能玩的大模型Scaling Up研究
- 招聘|量子位智库AI分析师
- 字节复刻了一个manus,还开源了~
- Claude 3.7 展示「自我意识」:我知道你在测试我!
- 免费版Devin 来了!Codegen 或将终结传统程序员开发模式
- 我决定,开一家纯套壳公司!
- GPT-5要来了!下月见?
- TrustAgent Survey: 关于可信 LLM Agent 的综述
- AI Agents+推理,英伟达开源Llama Nemotron系列模型与工具
- 如何在 Pydantic AI 智能体中使用 MCP(含代码)
2025-03-18
- 端到端OCR方案-SmolDocling我们应该关注什么?兼看AI搜索可信度简单评测项目
- 还在死磕传统PINN?自适应版本训练效率狂飙,审稿人直呼”这才是真创新”!
- 今日开源(2025-03-18):昆仑万维发布Skywork-R1V,38B多模态推理模型,视觉链式思维,精准解析科学医学图像
- 【源头活水】29岁青年成为武大最年轻正教授,希望打破国际标准垄断,制定中国自主的应用密码学方案
- 【源头活水】谷歌团队再次证明Scaling Law的准确性,即使总通信量减少99%,仍能超越数据并行训练
- 【他山之石】比传统语言模型快10倍,首个商业规模的扩散语言模型,究竟是什么来头?
- 诺奖采访深度学习教父辛顿:最快五年内 AI 有 50% 概率超越人类,任何说“一切都会好起来”的人都是疯子
- RAG碰上RL,超越RAG?推理与搜索结合,用强化学习打破LLMs推理知识局限!
- 全栈自研,理想发布下一代自动驾驶架构 MindVLA
- 刚刚,Anthropic发布了MCP的史诗级更新!
- 从无序到有序:2025年玻尔兹曼奖得主如何揭示自然界的隐藏scaling law
- 机器学习与贝叶斯计算的未来
- 从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
- AI笔记神器NotebookLM,保姆级教程来了!
- Dify-Plus:一个定制化的Dify二开开发
- “加班文化” bye bye! 国家都让你下班了,还不赶紧溜?
- 零一万物全面拥抱 DeepSeek,李开复:今年第一季度收入接近去年全年
- ChatGPT创始成员、后训练负责人官宣离职!自立门户并将获OpenAI投资
- 模态GAP不存在了?图文领域首个token级大一统基座诞生
- 超越DeepSeek GRPO的关键RL算法,字节、清华AIR开源DAPO
- 先别骂队友,上交如何让DeepSeek R1在分手厨房再也不糊锅?
- 多模态也做到了强推理!工业界首个开源的R1V,让视觉思考进入o1时代
- 单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香
- 本地也能运行Deep Research!支持arXiv平台,兼容PDF、Markdown等
- 深度学习的平衡之道:港科大、港城大等团队联合发布多目标优化最新综述
- 原子级精确,David Baker团队开发RFdiffusion变体对抗体进行从头设计
- 用LLM做半导体设计,IBM&MIT提出受神经启发的LLM推理网络SOLOMON
- 无人报考!顶尖大学,校区关停
- YOLOv12入门教程
- 19岁退学哈佛CS,这个00后两年打造百亿独角兽!月收入5000万,简直杀疯了
- 学习DeepSeek-VL2,就看上海交大俞勇教授这本新书,手把手教学!
- AI编程神器Cursor,保姆级教程来了!
- AI大佬曼宁转赞,MetaGPT团队首提「Atom of Thoughts」,原子化思考让4o-mini暴打推理模型?
- 极简教程,4张4090,本地部署QwQ
- 多模态融合,顶会超神了!
- 详解matplotlib-broken axis
- 荣登 Nature!LSTM 彻底爆发了。。。
- CVPR 2025 满分论文!重建 vs 生成:解决扩散模型中的优化难题
- AUTOSAR为何成为车企刚需?
- 耗时两个月,每天“爆肝”14个小时:他用C++手搓了一个「Photoshop」!
- “周日回个工作邮件,被严肃约谈”:现代职场开始摒弃工时崇拜了!
- 245个目标检测开源项目合集,建议收藏!
- YOLOe问世,实时观察一切,统一开放物体检测和分割
- 目标检测 评价指标
- 结合代码聊聊FlashAttentionV3前向过程的原理
- 大模型的门槛,又被打下来了!
- 视觉大模型DINO-XSeek:以物体感知为核心,理解物体属性为出发点!
- DCIC 基于人工智能的闽江流域水情预报 0.0009 baseline
- 哇塞!只需三步,带你飞速蒸馏DeepSeek R1!
- 迈向Super Agent,从Manus谈起
- 大模型怎么做好角色扮演?最大的真实数据集、SoTA开源模型、最深入的评估在这里
- 免训练的VLM剪枝方法!砍75% Token,仅牺牲0.6%效果,速度飙升
- AAAI’25 Oral | 用于密集知识型任务的长短轨迹学习结合多智能体联调框架
- 推理大模型的后训练增强技术-如何系统地理解和提升长思维链推理能力
- 大模型技术交流群(主要RAG、LLM方向)
- RAG经验分享:如何选对Embedding模型?
- CVPR 2025 | 革新Transformer!何恺明联手LeCun提出DyT:归一化不再是必需?
- 阿里推出升级版AI翻译工具:Marco MT 性能超越Google、DeepL和ChatGPT
- NVIDIA提出虚拟试衣新方法EARSB,让时尚与科技完美融合!
- 70页PPT揭秘Manus,2万字播客深度分析AI Agent
- 13.1K+ Star!Dagger:一个高效的容器化工作流工具
- 3月18日周二 | 每日一图
- 3月18日周二 | Python热门项目
- 3月18日周二 | Github今日热门
- AI Agent再迎一巨头!Zoom发布全平台Agent,智能体大爆发
- 从Manus看AI Agent的自动化悖论
- 软银投资1000亿日元建设AI数据中心,支持OpenAI业务发展
- 陶哲轩:o3-mini纠正了我一个数学错误,十分钟解决原本一小时才能完成的题目
- 8张GPU训出近SOTA模型,超低成本图像生成预训练方案开源
- o1/o3后训练负责人离职创业,奥特曼把OpenAI玩成另一个YC孵化器了
- DeepSeek让英伟达H20都被疯抢,但AI推理爆发不只靠囤卡
- 马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型
- 你正在做的大模型评测,可能有一半都是无用功 | 上海AI Lab&上交&浙大出品
- 北大人形机器人智能体 Being-0:互联网视频+少量真机数据,迈向自主具身智能
- 昆仑天工Skywork R1V开源,行业内首个多模态推理模型~
- Cursor 被爆致命隐患,YOLO 模式正成黑客新宠!
- 又一本开源免费的大模型书来了,449页pdf!
- 从 ETL 到 ECL(Extract-Contextualize-Load):LLM驱动的数据处理变革
2025-03-17
- 第一批抓住DeepSeek风口的研究生已经论文自由了
- LLM从构建到应用工具全集:推理大模型Github索引梳理
- 三张图速通 DeepSeek-R1 论文和技术原理
- 打王者荣耀,发NeurIPS!
- 今日开源(2025-03-17):CSM会话语音生成模型,1B参数,Llama骨干+音频解码器,电影级别人声生成
- 【他山之石】比传统语言模型快10倍,首个商业规模的扩散语言模型,究竟是什么来头?
- 院士领衔、IEEE Fellow 坐镇,清华、上交大、复旦、同济等专家齐聚 2025 全球机器学习技术大会!
- 谷歌团队再次证明Scaling Law的准确性,即使总通信量减少99%,仍能超越数据并行训练
- Transformer到底解决什么问题?
- 薛定谔的算盘:量子计算是如何得到结果的 | 硬科技有点意思
- deepseek技术解读(1)-彻底理解MLA(Multi-Head Latent Attention)
- 大语言模型在时序建模中是“鸡肋”? | NIPS 2024
- 老黄 5090 都被初创公司虐了?印度 CEO 用 20 人团队让芯片快10 倍、功耗大砍近 80%!网友:等英伟达收购
- 王兴兴自曝做机器人从200块钱“手搓板”开始!各机器人企业疯狂秀肌肉,你pick谁?
- 不是CG?没加速?这个国产机器人跳「斧头帮」舞火了,网友:流畅到不像真的
- 真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」
- 北大团队提出LIFT:将长上下文知识注入模型参数,提升大模型长文本能力
- 大模型怎么做好角色扮演?最大的真实数据集、SoTA开源模型、最深入的评估在这里
- Long-CoT 后,推理模型的「思维模板」有哪些新玩法?
- 想与顶级AI人才互动?来和机器之心一起共赴这4场全球学术顶会
- ICLR 2025 | 四川大学提出Test-time Adaptation新范式,突破查询偏移挑战
- 无需训练即可定制分子生成:全新多模态引导框架TFG-Flow登上ICLR 2025
- 必知!大模型时代超常用的训练、微调、推理、部署框架(1)
- 这15所”双非高校”杀入全国百强,广东成最大赢家!
- 2025年基金本子提交在即!这11个问题现在改还来得及
- 李飞飞最新分享:基于好奇心的研究是什么样的?
- 西安交大发通报:副教授抄袭属实,解聘!
- 最新!2025年TOP大模型!
- 吴恩达的翻译Agent项目,复现教程来了!
- AI知识库爆火!多模态能力应用,保姆级教程来了!
- 825万!985大学,购10台宇树机器人!
- 华为诺亚方舟实验室主任换帅,90后新「掌门」王云鹤接班
- YOLOv12入门教程
- AI 会随机抢走世界上50%的工作
- AI灭霸这事儿,先别急
- 听说,你还在玩提示词啊?
- 让Matplotlib、seaborn图动起来,栩栩如生
- 抢救Transformer!谷歌推出全新Scaling Law!
- 碉堡了!DeepSeek 搭建个人独家知识库。。。
- 5 分钟解释 Transformer,一个神奇的算法模型 !!
- 微软弃用C#、Rust,选Go拯救TypeScript编译器“中年危机”!C#之父亲自操刀,150万行代码编译现仅需7.5秒
- 检索增强生成
- 基础卡尔曼滤波
- 基于PyTorch的卷积神经网络经典BackBone(骨干网络)复现
- 师兄跟我说他博士毕业后想回老家县城工作
- DeepSeek-R1关键创新技术再总结
- 文字也能打水印?LLM水印是个啥?
- 阿里通义实验室RAG团队研究实习生招聘
- 离谱!裁员裁出新高度了。。。
- DM-YOLO小目标检测,轻量边缘设备部署,参数减少38%,精度上升4.1%!
- DeepSeek一体机,阻碍推理性能的最大绊脚石!
- 2025年TOP 9大模型!
- 百度「文心·新星」顶尖技术人才计划专项启动
- 直播|阿里通义千问Qwen2.5-VL解析,一作分享如何让大模型更好地看世界
- 直播|自动驾驶场景下的世界模型,可控驾驶场景视频生成方法研究
- 直播|给定一段文本,能否准确预测其来源模型?揭秘大语言模型独特性
- 聊聊RAG相关使用体验及复盘
- 零帧起手,3个典型场景范例带你上手uv一站式环境管理~
- 这才是真正的Agent模型:自我思考与行动,彻底摆脱外部工具
- 牛津提出新方法让LLM reasoning能力翻倍!从“单打独斗”进化成“团队作战”
- 招聘 | 上海算法创新研究院大模型实习生
- SIGIR25征稿 | 第二届基于Agent的信息检索研讨会
- 推理大模型的后训练增强技术-Reasoning模型也进化到2.0了,这次居然学会用工具了
- 清华人大上交大教授领衔,DeepSeek时代中国生成式AI大会4月举行!Manus最强平替和杭州六小龙之一也来了
- AI创作从此无所不能!复旦大学提出UniCombine!多条件可控生成的终极武器!
- deepseek v3 生成答案的速度为什么可以这么快?
- DeepSeek+公众号新玩法,条条10万+流量主收入翻10倍!
- 313-A1.1|无需训练的高分辨图像生成,基于多智能体的故事可视化,基于文本的图像编辑,真实手部生成,少样本字体生成
- 313-A1.2|文本到视觉内容评估数据集,质量评估与条件生成,双层自回归图像生成,结合量化与缓存的高效DiT;社会偏见问题
- 313-A2|文生视频质量评估,视频帧插值与预测,基于KAN的音频隐式表示
- 313-A3|剧本到3D舞台生成,文本驱动形状与颜色风格化,稀疏建筑点云恢复结构化3D抽象,平滑扰动引导人类动作扩散
- 313-B1|多模态系列;3D重建系列
- 312-B1|多模态系列
- 312-B2|图像与视频系列
- 312-B3|3D重建系列
- 免费使用!百度重磅发布文心4.5、X1,视频解读+深度思考
- 美国陆军收到,首批AI模型驱动军事情报战车
- 迁移DeepSeek-R1同款算法,小米让7B模型登顶音频理解推断MMAU榜单
- CVPR’25跨模态因果对齐,让机器更懂视觉证据丨中大南洋理工等联合开源
- 一手实测文心X1/4.5:又强又全面!歪果网友疯求英文版
- 低调平头哥,吹响先进存力商业化号角
- 深圳机器人致敬星爷《功夫》,完美复刻斧头帮舞
- 李开复力推DeepSeek!零一万物发布模型一体机,搭载华为GPU,自家产品也全线替换了
- 新注意力让大模型上下文内存占用砍半!精度不减还能加速2倍
- AI大佬到底怎么用AI ⁉️中国AIGC产业峰会首批嘉宾曝光,吃瓜观众速来
- 图RAG统一框架来了,12种RAG方法一网打尽~
- 用时3分钟,我做了个让Gemini 一键生成图文并茂文章的插件,免费送!
- 一篇85页的面向推理型大模型的Long-CoT技术最新综述
- 瓦力算法3月第2周急招岗位|腾讯 / 佑驾创新 / 商汤 / shopee / 元戎启行 / 蔚来 / 360安全 / 理想
- 9个最佳prompt框架:解锁LLMs无限潜力
2025-03-16
- RAG中的chunk质量如何评分?HiRAG对GraphRAG的改进思路及推理大模型用于机器翻译
- RAG&KG&LLM&文档智能等前沿技术及落地跟进:老刘说NLP技术社区持续对外纳新
- 1W3000字 深度解析模型上下文协议(MCP):驱动人工智能变革,重塑企业未来格局
- 这才是真实的爱因斯坦:积极的入世者和实用技术的发明家 | 展卷
- 「品尝」电影里的蛋糕?智能「电子舌头」或将满足你的愿望
- 人形机器人发展趋势及启示
- 海外热议!百度双模型免费上线,实测可帮没看“3.15”的打工人避雷
- 我们如何引入DeepSeek R1来做领域特定语言训练的?
- 提前免费!百度连发两款模型,我们实测:能听歌看电影,还会蛐蛐人
- Karpathy氛围编码「吃瘪」?Cursor拒绝工作,并劝人类别依赖它
- 统一自监督预训练!视觉模型权重无缝迁移下游任务,SiT收敛提速近47倍
- ICLR 2025 Spotlight | 慕尼黑工业大学&北京大学:迈向无冲突训练的ConFIG方法
- 「品尝」电影里的蛋糕?智能「电子舌头」或将满足你的愿望
- 29岁,仅工作一年,武大最年轻正教授:95后天才少年如何用8年改写人生?
- 纽约时报重磅曝料:特朗普任期内将实现AGI,美国政府早知AGI即将降临!
- 非法出口 28 亿元 GPU:被捕
- 实话!写博士论文,别太老实了……
- 何恺明团队提出全新DHN「去噪哈密顿网络」
- 大模型做PPT,最强解决方案
- 大模型行业落地案例分享:Dify在顺丰内部AI Agent落地
- 百度回归了,还是熟悉的味道
- 很棒的python可视化工具
- 有人用DeepSeek拿下一篇SCI,还是1区期刊!
- 无人报考!顶尖大学,校区关停
- 颠覆!为啥本科生连发3篇视觉顶刊,而有的博士一篇都没有?
- 分享16个Matplotlib 绘图实用小技巧!
- 博士们,高校教职现在卷到什么程度了?
- 7B小模型用规则奖励RL学会玩数独!
- 为什么你在国内高校实验室里发不出顶会顶刊?
- 两连发!文心大模型4.5及X1,免费!
- DeepSeek的“开源周”汇总,大模型开闭源之争来了!
- DeepSeek们的成本,是怎么计算的?
- 阿里发布新开源视频生成模型Wan-Video, 支持文生图和图生图,最低6G就能跑, ComfyUI可用!
- 【NeurIPS 2024】南理工提出IMAGPose!用于Pose引导人物图像生成的统一条件框架!照片级真实感!
- 大模型面试题:为什么LLM推断中缓存KV比缓存Q更有效?
- Github热门项目周报 | 第11周
- 3月16日周日 | 每日一图
- 3月16日周日 | Python热门项目
- 3月16日周日 | Github今日热门
- 百度版深度思考模型免费上线!API定价比DeepSeek R1再砍一半
- 夸克你要这么变,我可真得说说你了
- CVPR 2025:无需物理引擎,一个模型搞定图像渲染与分解
- 招生 | 人大信院AIM3实验室招收人工智能方向学生
- 纽约时报:AGI 即将到来,我们却毫无准备!
- 重磅!AI大模型又起飞了!
- 因Manus火出圈的MCP,成功迁移到3D建模圈,全自动,太强了~
- MCP(Model Context Protocol):重塑LLM与外部数据交互的新篇章
2025-03-15
- GDELT情报分析遇见GraphRAG:兼看视频多模态RAG记忆增强检索实现思路
- 融合LSTM与Transformer做时间序列预测,发高分轻轻松松!
- Kimi“撞车”DeepSeek!新一代注意力机制的极限突破!
- 【源头活水】让小模型也能有大作为!SANA 1.5:线性扩散Transformer再刷文生图新SOTA
- AI Agent崛起,谁将引领下一个技术神话?
- 挑战主流观点!卡耐基梅隆大学最新研究表明:仅靠压缩即可实现 AI 解谜能力
- 神经科学会走向终结吗?
- 货拉拉大模型应用开发体系演进与实践
- 英特尔CEO陈立武薪酬曝光,最高可达5亿元;裁员10%不发年终奖、HR和员工互殴?抖音回应;哈佛大学等美名校冻结招聘 |AI周报
- 挑战主流观点!卡耐基梅隆大学最新研究表明:仅靠压缩即可实现 AI 解谜能力
- 「压缩即智能」得到实验验证,无需预训练和大量数据就能解决ARC-AGI问题
- AI进入推理模型时代,一文带你读懂思维链
- 2025 年,消费级 AI 应用再次洗牌?
- 超级Agent,鸣枪起跑
- 逐字生成非最优?试试逐「块」生成!Block Diffusion打通了自回归与扩散
- AI大佬曼宁转赞,MetaGPT团队首提「Atom of Thoughts」,原子化思考让4o-mini暴打推理模型?
- 声音比真人还像真人的Maya,背后模型开源了!跨越语音恐怖谷
- TRACE:因果事件建模助力视频理解大模型的时间定位能力
- MedVLM-R1:借力DeepSeek强化学习赋能医疗视觉语言模型的推理能力
- 中央批准:985大学,迎来院士校长(副部长级)
- 李国杰院士“七问”DeepSeek
- 29岁,武大最年轻正教授!资助经费290万
- 全美高校遭史上最大规模裁员。。。。
- 杀疯了,谷歌的Deep Research也来了,免费!
- 第11种方法,一键美化Python图表 to 商业风!
- 首个大模型后训练方法综述!!
- 寒心985 计算机博士:手握一篇 CCF A 一作,大厂算法岗,薪资开的挺多!
- YOLOv12入门教程
- 何恺明LeCun暴击Transformer命门,9行代码砍掉归一化层!性能反而更强了?
- AAAI 2025 | TinySAM:推动高效分割任意模型的发展
- 吃瓜DeepSeek推理成本需要的相关概念:Throughput、TPOT、TTFT
- Manus和openai都在GAIA上瞎搞….
- 【实习】AI算法实习生-字节番茄-筋斗云人才计划
- Manus和openai都在GAIA上瞎搞….
- 推理大模型的后训练增强技术-从系统1到系统2:大语言模型推理能力的综述
- 创意图像编辑黑科技!Google上线Gemini 2.0 Flash 原生图像生成功能,动动嘴就能完成PS了!
- 港大&Adobe提出UniReal:通过学习真实世界动态实现通用图像生成和编辑。
- AI可以模仿人类手写签名了?DiffusionPen:实现手写文本生成的风格控制。
- 312-A1.1|多模态CoT、对话交互式文生图;图像头部交换,检测AI生图人体畸形;高重叠布局到图像,缓解个性化概念耦合问题
- 312-A1.2|艺术设计篇|文生高质量设计图像,MLLM美学感知图形布局设计,VLM广告创意评估;可控服装展示图像生成
- 312-A1.3|强化学习文生图微调;直接判别优化,扩散推理加速,离散扩散后验采样;安全篇(利用LLM突破防护,开源数据集综述)
- 312-A2.1|角色肖像动画化;百万级针对用户需求的文生视频数据集;视频3D物体编辑,外推与解耦图生视频,少量视频学习人类动作
- 312-A2.2|对象感知视频抠图,视频音乐的语义对齐与时间同步理解数据集,音频驱动面部动画化,共语手势生成
- 312-A3.1|重新利用图像扩散模型进行3D资产生成,3DGS生成模型的水印化;交互式草图条件网格生成与编辑,CAD与草图生成
- 312-A3.2|单图生VDM;自动化角色扮演游戏角色创造,人类几何生成,语音驱动3D说话头
- 312-A3.3|微型物体重建,可控景深3DGS,单步扩散提高重建;关键帧动作插值,交互动作生成,文生HOI,场景感知动作合成
- Manus带火的MCP,让Claude一句话自动化3D建模,网友:真·AI+应用
- Nature:你的大脑衰老速度受这64个基因影响
- 27个大模型混战电商领域,DeepSeek-R1&V3仍是最强丨首个中文电商问答基准评估结果
- 米哈游蔡浩宇AI游戏曝光:大模型驱动数字人实时互动,玩家自定义开放剧情,内测已开启!
- 清华开源大模型推理框架:赤兔,deepseek部署成本减半~
- OpenAI 喊话特朗普:请给我版权训练的自由!
- 统一框架视角的Graph RAG深入分析最新成果
- 设计自己的满血版DeepSeek-R1+知识库
- 大模型调参技巧—如何实现超参的跨模型尺度迁移
- 基于文档层级架构的RAG系统:提升人工智能检索效率
2025-03-14
- Light-R1-32B之R1复现认识:兼看R1蒸馏模型所用800K数据细节问题
- 喜提CVPR 2025满分!数据蒸馏取得新突破!速度up20倍,GPU占用仅2G
- 今日开源(2025-03-14):MM-EUREKA,8B/38B多模态推理模型,规则强化学习扩展,提升推理能力与数据效率
- 读懂 DeepSeek 开源周:AI 算力平民化,从“瓦特时刻”到“工业革命” | AI 进化论
- Nature推荐:五大AI模型如何攻克不同科研场景?(内含Deepseek)
- 语义性痴呆:被遗忘的只是词语,还是整个世界?
- 破解二十多年的谜团!《科学》里程碑式研究揭示帕金森病全新弱点
- 对话 | 张宪:自主学习规则是大模型数学推理性能提升的关键
- 行业落地分享:Dify在顺丰内部AI Agent落地
- 美国网友都在喷!OpenAI公然要求封杀DeepSeek等中国AI模型,还要合法“吸血”全球版权数据!
- 2025 两会闭幕|“人工智能 +”行动下的 3 大难点怎么破?
- 阿里正式推出 AI 旗舰应用:新夸克告别搜索,成为一个无边界的“AI 超级框”
- 一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们
- FP8模型不再挑卡!DeepSeek推理成本减半速度翻番,清华团队开源「赤兔」推理引擎
- 出海应用也能享受高速稳定的DeepSeek-R1?亚马逊云科技出手了
- MM-Eureka:极少数据实现多模态推理的R1-Zero时刻
- CVPR 2025 | VAST和北航开源MIDI,从单张图像端到端生成三维组合场景
- arXiv科研神器:Mistral OCR、Claude 3.7合体实现论文速读
- 没有归一化层的Transformer!刘壮带队,何恺明、Yann LeCun都参与了
- 人类秒懂,AI却懵圈:VLM²-Bench揭示视觉语言模型「视觉关联」能力短板
- 全球首个化学反应AI「考场」,7种MLIPs模型与SOTA生成式模型同场PK
- 机器学习领域博士搞科研,原来“Deepseek”才是最快发论文的方法?
- 腾讯大模型算法一面+二面
- 呼吁打压中国 AI,OpenAI 要求禁用 DeepSeek!
- AI 生成内容,监管来了!
- 第10种方法,一键美化Python图表
- 博士 offer 一夜变废纸,导师被逼抱头痛哭,学术寒冬席卷高校,博士先遭殃
- 何恺明团队新作DHN:将哈密顿力学泛化到神经算子,实现更高级物理推理!
- 首个AI CUDA工程师来了!将PyTorch原生实现提速10-100倍!
- 李飞飞团队新作!具身智能最新研究:让机器人做好家务!
- 通俗易懂!大模型强化学习 RL入门
- Zero-Rl复现的几个比较关键的问题
- 什么是超级对齐 (Super Alignment)
- 上海人工智能实验室招聘大模型和多智能方向实习生
- 尝试基于0.5B小模型复现DeepSeek-R1的思维链
- 两万字长文,用PyTorch从零构建 DeepSeek R1,模型架构和分步训练详解!
- 何恺明&LeCun改造Transformer!9行代码替代归一化,性能不减还加速!(附论文及源码)
- 如何使用DeepSeek,进行科研图表绘制?
- 无需归一化的Transformer新范式-何恺明新作
- 第一期模力星河AI共创加速营政企社联动启幕
- 检索增强生成 (RAG) 的 5 大 提示词,非常实用!
- 【实测】单卡跑满血版DeepSeek|CSGHub集成KTransformers
- 开源音乐生成模型DiffRhythm:可创作完整歌曲,支持文本转音乐和纯音乐生成,MacOS 上可运行!
- 香港科技大学提出YuE:Suno级别开源音乐生成模型,支持中文!
- Seed-Music:字节跳动开发的音乐生成模型 支持多种数据输入生成和编辑音乐!
- 中科大&科大讯飞重磅开源OpenMusic:高品质音乐生成工具!
- AI视听新体验!浙大&阿里提出视频到音乐生成模型MuVi: 可解决语义对齐和节奏同步问题!
- 音乐版 ChatGPT 就在这里:Suno V3几秒钟内就可创建两分钟高质量的完整歌曲!
- 硬刚Suno,StabilityAI推出Stable Audio 2.0,可生成三分钟44.1kHz立体声的高质量完整曲目
- 最全DeepSeek资料包,30篇清北浙大各高校文档合集(免费下载)
- OpenAI 称 DeepSeek 为 “国家控制”,呼吁禁止 “中国生产” 的模型
- 【活动预告】AI驱动创新·DeepSeek智启未来——您的专属报名通道现已开启!
- 【行业动态】Manus :首款通用Agent产品,阿里发布QwQ-32B推理模型
- 【AIGC应用】硅谷的视网膜革命:一场1.8亿美元收购如何重构AI眼镜的未来叙事
- 【AIGC趋势】一纸新政如何重构中国机器人产业新版图
- OpenAI最新15页报告:DeepSeek缩小,中美AI竞争差距
- 语音模型平台Cartesia获6400万美元,只需3秒克隆语音
- Meta正与台积电合作,测试首款自研AI芯片
- 海螺AI x AITOP100未来短剧导演大赛开启!探索AI短剧无限可能!
- 破解国产芯片FP8及DeepSeek部署难题,清华团队开源“赤兔Chitu”大模型引擎
- 再次突破丨虚拟动点赋能合作伙伴解锁机器人连续空翻
- 清华率先开源AI制药智能体平台!生物科研进入Autopilot时代
- ChatGPT再进化:o1支持调用Python分析数据,网友:已经成为Copilot了
- 谷歌大招网友玩疯了!Gemini原生图像输出抢先推出,OpenAI一年领先优势归零
- 何恺明LeCun联手改造Transformer!9行代码替代归一化层,性能不减还加速
- AI能自主出“竞赛题”了!港大&蚂蚁让大模型学会生成难题,水平已接近AIME
- 国产人形机器人破全球纪录!连续空翻一镜到底,量产3.99w起售
- 游戏也可以Copilot!微软CEO纳德拉亲自站台:玩家有福了
- 人大北邮等团队解视触觉感知统一难题,模型代码数据集全开源 | ICLR 2025
- 提出机器人自主学习新范式,深大团队最新顶会论文,刷新6大复杂任务SOTA
- CVPR 2025:长Prompt对齐问题也能评估了!当前最大AIGC评估数据集,模型评分超越当前SOTA
- raptor + graphrag = HiRAG,开源~
- 重磅!OpenAI 称DeepSeek是「国家控制」,呼吁禁止中国模型!
- 吴恩达:「放弃编程」将是史上最糟糕的职业忠告!
- Gemini 重磅更新:Deep Research 免费使用!
- 基于提示技术(prompt)的大模型安全保障
2025-03-13
- R1-GRPO用于多模态、ChatBI、Gemma3等前沿进展:兼看KTransformers技术分享回顾
- 冠豪猪优化算法(CPO)原理及实现
- 今日开源(2025-03-13):Open-Sora 2.0视频生成模型,11B参数,720p高分辨率和24FPS流畅视频
- 【源头活水】潞晨Open-Sora 2.0全开源,20 万美刀复刻百万级大片,堪称开源视频界的「六边形战士」
- MambaOut:在视觉任务中,我们真的需要 Mamba 吗?
- 2025年的风口!| 万字长文,带你纵观大模型Agent,涉及研究痛点、应用场景、发展方向
- 为什么量子力学看起来如此奇怪?
- 1W2000字 深度剖析:为何扩散模型会成为语言模型的未来?
- Kaggle赛题解析:BirdCLEF 2025
- 刚刚,芯片创投“教父”陈立武正式成为英特尔 CEO:曾任中芯国际董事,华人家庭出身
- Ilya 新公司曝光:20 人左右员工超低调,线下面试要屏蔽候选人手机信号
- AI写的论文能过审?双盲评审6.25分,达到ICLR研讨会水平
- 百万美金炼出「调参秘籍」!阶跃星辰开源LLM最优超参工具
- 20万美元商业级视频生成大模型Open-Sora 2.0来了,权重、推理代码及训练流程全开源!
- 超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场
- YOLOe问世,实时观察一切,统一开放物体检测和分割
- 长链推理表象下,大模型精细表征张冠李戴的本质
- 阿里妈妈搜索广告2024大模型思考与实践
- “天工行者”定价29.9万元,优必选携国家队刷新全尺寸科研人形机器人底价
- 深度调研全球科研人员AI使用现状,威立发布权威报告中文版!
- 科学家构建多模态LLM框架,进行3D脑CT放射学报告生成
- 使用双重机器学习进行因果推断
- 揭秘学阀现象:学术圈正在上演怎样的”门徒战争”?
- 在线教程 | OpenManus 与 QwQ-32B 强强联合,推理过程全透明
- 反内卷,大学“8年制”时代,来了!
- 全面认识一个新出炉大模型,仅需3步
- 9种方法,一键美化Python图表
- 300 万年薪程序员被裁!女友朋友圈一张炫富照片引发的职场地震
- 开源项目不好搞?你一定是没用对工具,手把手教你如何上手
- AI浪潮下,嵌入式开发的新机遇……
- 最高判10年!55岁程序员遭降级不满,怒植“自毁代码”:被裁当天,公司系统全面崩溃
- 响应式设计已死?流体布局才是未来!
- 被导师放养,后果可能很严重。。。
- 盘一盘语义分割那些不可不知的小技巧
- [CVPR`25 | 让暗光照片秒变电影大片!全球首个可训练的HVI色彩空间,突破低光增强瓶颈!](https://mp.weixin.qq.com/s/B_GTI3ICmExEhrhPYX6eZg)
- 理解LLM infra中的一些基本概念:PP、TP、DP、ZeRO
- 强化学习重要知识点梳理
- 京东大模型研究型实习生招聘
- 关于Deepseek采用EP推理方式的一些思考
- 时间序列特征提取大全:18 种高效工具库!
- 文心快码全新升级!Comate Zulu开放公测,超多好礼派送中
- 重磅!知识增强的大模型——肖仰华教授的洞见与实践
- 本周六!多模态论文分享@ICLR2025
- 本周日!知识编辑/推理/可解释等分享@ICLR2025
- 别卷剪辑了!用DeepSeek制作影视大片,开场直接封神
- Gemma 3 27B版本超越DeepSeek V3:技术要点分析!
- ACM TIST 2025 | 综述 GenAI 与时尚 | 港理工、AiDLab
- 魔发奇缘,3D发型生成新突破!TANGLED:可用任意样式和视点的图像生成 3D 发束
- DeepSeek官方发布:AI工具百宝箱,一次性集成上百款应用
- 9.1K+ Star!ebook2audiobook:一个将电子书转换为有声书的工具
- 3月13日周四 | 每日一图
- 3月13日周四 | Python热门项目
- 3月13日周四 | Github今日热门
- 谷歌开源Gemma-3:媲美DeepSeek,算力暴降10倍
- 多智能体协作,DrugAgent重塑药物研发新范式
- 何恺明带队驯服AI更懂物理!去噪方法+哈密顿网络,清华校友一作
- 谷歌版“DeepSeek”发布!27B模型单个GPU即可运行,击败满血DeepSeek V3/o3-mini
- 11B模型拿下开源视频生成新SOTA!仅用224张GPU训练,训练成本省10倍
- DeepSeek玩家能提前拿苹果新品!只要15万元,在家跑满血版R1
- “谷歌版DeepSeek”接入机器人,思维链解锁折纸系鞋带技能,推理模型代入物理世界
- 自动调整推理链长度,SCoT来了!为激发推理能力研究还提出了一个新架构
- DeepSeek“防弹衣”来了,模型内生安全加固方案,拒绝杀敌一千自损八百|上海AI Lab
- Google狙击OpenAI新产品,成功!
- OpenAI 员工独家分享——Responses API 背后的设计故事
- DeepSeek-R1的风吹到了多模态,Visual-RFT发布,视觉任务性能飙升20%
- 重磅,微软LazyGraphRAG正式开源及实现细节剖析!
- OpenAI最新发布Agents SDK深度解析:构建智能体的新利器
- RTSCEN提示词(prompt)框架,让大模型更懂你
2025-03-12
- DeepSeek新手装备库,总有一款适合你
- Agent框架标准化趋势及OpenManus-RL增强Agent规划能力训练框架
- 2000字搞懂 Coze Agent 使用和变现,超詳細教程
- FourierMamba: 傅里叶学习与Mamba结合的图像去雨
- 今日开源(2025-03-12):谷歌开源Gemma 3,1至27B四种参数,支持140+语言,128k上下文,轻量级部署
- CVPR 2025 | 扩散模型炼出新绝技!注意力蒸馏技术:图像生成效果全面碾压传统方法
- 前 OpenAI 研究员、清华大学吴翼博士亮相 2025 ML-Summit,剖析大型推理模型强化学习系统
- 未来今日战略集团:《2025 前沿科技趋势千页报告》,AI、生命智能、机器人、超材料、量子计算。。
- 现代机器人技术的开创者之一谈自己留下的成就
- 字节首次公开文生图技术细节,RLHF成关键!
- OpenAI开源了!深夜发Agent四大利器,预告创意写作模型
- 图灵奖获得者:我不用ChatGPT
- CVPR 2025 | 双lora方法实现像素级和语义级可调超分辨率
- OpenAI定义Agent新范式:构建自动化系统的模板
- 刚刚,谷歌用更少参数打败 Qwen 2.5-32B!新模型 Gemma 3 号称“单 GPU 模型王”,团队紧急招兵买马!
- 小红书基于 PPO 的多模态大模型 RLHF 系统的设计与优化
- OpenAI突然发布智能体API!支持网络和文件搜索以及computer use
- 在长文本上比Flash Attention快10倍!清华等提出APB序列并行推理框架
- 18项任务200万视频编辑对,云天励飞联合多高校打造出大规模编辑数据集
- 20万悬赏AI美妆!欧莱雅美妆科技黑客松2025重磅来袭
- 字节首次公开图像生成基模技术细节!数据处理到RLHF全流程披露
- 将哈密顿力学泛化到神经算子,何恺明团队又发新作,实现更高级物理推理
- GPT4规模大模型落地,Meta提ExFM框架:万亿参数基础大模型的工业级落地成为可能
- 加速精准医疗,开源GNN实现分子精准建模,质谱识别准确率提升至49%
- AI现实动物森友会,NVIDIA携手国际组织助力野生动物保护
- 受 Rust 启发,是时候改变 Python 编程方式了
- 商业数据分析思维
- DeepSeek血洗AI韭菜田:撕开中国AI行业的皇帝新衣
- 如何使用DeepSeek进行科研图表绘制?
- 图灵奖得主杨立昆:AI需要学习物理学才能继续进化,认为训练效率提升就不需要太多算力是误解,更多算力将用于推理
- 中南财经政法大学六旬博导因考核不合格,朋友圈怒发“罪己诏”?校方回应
- AI笔记神器NotebookLM,保姆级教程来了!
- 官宣!王树国任福耀科技大学校长
- 13岁学编程,20岁哈佛退学,31岁成为世界首富……比尔·盖茨首部自传上市!
- “强化学习之父”最新完整实录:AI研究的正确方向
- Manus 之后,OpenAI发布可自动执行任务的AI Agent
- 大模型提高写代码效率?我不信
- 关于大模型,普通人最大的机会在Agent
- 10大黄金法则,告别“垃圾图表”
- 喜提 AAAI 一作顶会:没算法没实验,全靠 idea 选得好。。。
- Manus 被破解了?曝出系统提示词和背后大模型
- 起飞!国产编程语言MoonBit迈进顶级学府、发布重磅LLVM后端,受邀欧美顶级大会
- 各种Loader加载器
- 如何使用DeepSeek进行科研图表绘制?
- AAAI 2025 | 基于生成感知先验的低光照图像增强
- Google 发布多模态开源模型 Gemma 3:性能与功能全面升级,附技术报告英中对照版
- Light-R1:从零复现满血版DeepSeek-R1!全面开源!
- 32b R1-Zero复现,聚焦scaling
- 腾讯混元招聘AIGC-3D应用研究实习生
- 吃瓜DeepSeek推理成本需要的相关概念:Throughput、TPOT、TTFT
- 直播讲解,全球首款Armv9 AI PC开发套件,30TOPS NPU+免费评测活动!
- 边缘设备目标检测YOLO-Pro,超高精度检测算法,SOTA榜新突破!
- 一个由众多 GM 设计并全程陪跑的 Kaggle 社区赛 (有赞助版) 开赛啦
- 飞桨框架3.0推理升级:支持多款主流大模型、DeepSeek-R1满血版实现单机部署,吞吐提升一倍!
- 飞桨赛道报名中!香港教育大学AIREA国际人工智能与教育大赛启动
- 推理大模型的后训练增强技术–LLM 推理型的现状(文末送书)
- ComfyUI | 背景移除插件:ComfyUI-RMBG,支持物体、人脸、服装和时尚元素的精准分割
- 高通AI研究院提出SubZero:任意主体、任意风格、任意动作,AI创作从此无界!
- 多模态图像生成模型Qwen2vl-Flux,利用Qwen2VL视觉语言能力增强FLUX,可集成ControlNet
- 迈向视觉大一统:UnifiedReward,多模态生成与理解的通用奖励模型!
- 中科大提出SPEED!5秒消除100个概念,高保真+高效,AI内容安全新标杆!
- 点赞30万涨粉10万,AI发光美女跳舞视频,简单两步免费生成!
- 云计算巨头AI战略分化:谁将定义企业级AI的未来规则?
- 重磅!OpenAI开源首个Agent SDK,反击Manus
- Manus逼OpenAI开源智能体框架,网友:已从行业领导者变为跟随者
- 谷歌投资Claude公司内幕曝光:占股14%,无投票权,无董事会席位,无董事会观察员权利
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 高阶智驾“破壁人”来了:13万标配激光雷达,还能「车位到车位」
- 新科研神器!这回读英文论文真跟读中文没两样了
- 李飞飞团队具身智能新作:500美元,一切家务机器人帮你干
- 砍掉99%采样成本!腾讯AI Lab提出大模型无监督训练新技术
- 90分钟生成10万Token,新框架实现3倍无损加速超长文本生成,支持DeepSeek-R1和QwQ!
- 倒计时2周!今年最值得关注的AIGC企业/产品正在评选中
- 14B 小模型逆袭翻译赛道,论文财报实测超Claude,不信试试“我命由我不由天”
- 多模态训练后模型能力雪崩,上海AI Lab全面探索MLLM偏好对齐与模态融合
- 招聘|量子位智库AI分析师
- Google Gemma3 开源,多模态大模型!
- 山姆奥特曼宣布新写作模型让人震撼!却被网友取名 Sam Fartman
- 选择大于一切!多模型策略如何成为 AI 时代制胜法宝?
- 刚刚,OpenAI开源了两个Agent项目,手搓Manus时代来袭~
- 突发,谷歌多模态Gemma 3开源!
- 斯坦福大学团队最新综述:认知行为驱动LLM自我改进之路
2025-03-11
- Deepseek-v3/R1全量微调及Seg-Zero、R1-Searcher领域强化适配思路
- 特征融合这样创新!与GNN结合顶天,一区TOP刊如囊中物!
- 今日开源(2025-03-11):olmOCR,高效处理百万PDF文档,支持ChatGPT 4o解析与微调,提供微调与评估工具
- 【他山之石】ICLR2025 Spotlight Serge Belongie组与ETH提出:「免费」多模态信息助力3D样本分割
- 【源头活水】1000 token/s的「扩散LLM」凭什么倒逼AI走出舒适区?
- 图灵奖得主杨立昆:AI需要学习物理学才能继续进化,认为训练效率提升就不需要太多算力是误解,更多算力将用于推理
- 微软CEO纳德拉最新万字实录:大模型本身并不足以构成竞争优势
- 陶哲轩使用o3 mini一手测评来了:好坏参半
- “星际之门”重要进展:即将安装6.4万张GB200
- 小白学RAG:SAGE提高RAG精准检索效果
- 团队“DeepSeek”化!字节 Seed Edge启动不足两月,冲刺AGI再发新作,训练成本再节省40%
- 张向征:大模型安全研究与实践
- 当人工智能学会在比赛中“耍诈”,手段更高级!DeepSeek R1 每 10 局就有 1 局试图作弊?
- 基于药效团与GPT从头生成分子,北大开发TransPharmer助力药物发现
- L²M条件,MIT团队为长文本建模建立新理论框架
- 2025 超现代 Python 实用工具
- 梁文锋,yyds !!
- 用DeepSeek做学术
- 国内首部AI大模型私有化部署标准启动编制,适合10类企业参与!
- 再说南丁格尔玫瑰
- DeepSeek R1成功迁移到视觉领域!全面开源!
- AI工具全面进化,你的Deepseek还停留在石器时代?
- 哥大学生用AI“拿下”亚马逊Offer,却被校方调查,怒怼:程序员工作两年内全灭!
- 人类学的 MCP 彻底颠覆 AI 交互!
- 从YOLOv5到YOLO11!改进有多大?
- R1复现实验:拒绝采样微调加速RL收敛及模型遗忘问题探究
- 从OpenManus看到底什么是Agent
- 李宏毅一堂课搞懂AI Agent的原理
- CVPR2025,英伟达提出首个Mamba-Transformer视觉骨干网络!(附论文和源码)
- Manus开源复刻框架OWL,测评和使用实战教程!
- CPU与GPU到底有什么区别?
- 大模型对不同职级工程师的影响曲线
- AI新秀Manus携手阿里通义千问,开启智能体新篇章!
- 关于DeepSeek,360周鸿祎在清华大学都讲了什么(完整版PPT下载)
- 1K+ Star!autoMate:一个AI驱动的本地自动化工具
- 3月11日周二 | 每日一图
- 3月11日周二 | Python热门项目
- 3月11日周二 | Github今日热门
- 311-A1.1|基于ImageNet的文生图,图像生成与编辑(多模态指令驱动,手绘掩码引导),单图参考的ID保留面部图像编辑
- 311-A1.2|图像美学评估,扩散模型后门攻击,防止不安全内容生成,水印去除攻击
- 311-A3&A2|单图生CAD;由粗到精的策划视频生成,高效长视频生成,视频生成模型世界建模能力的评估基准,人类行为理解与生成
- 311-B1|长视频理解,空间推理模型,知识单元RAG,MLLM角色扮演;MLLM机器人操作,长时间任务规划
- 311-B2|零样本图像对象计数,扩散恢复适配器;实时神经视频编码器;单图像3D重建
- AI紧箍咒!OpenAI发布CoT监控,阻止大模型恶意行为
- 微软AI开发者挑战赛 | 报名进入倒计时,海选作品提交通道正式开启!
- 阿里国际站AI布局引多家外媒关注:AI搜索Accio企业用户超百万
- R1思考+RAG = R1-Searcher,开源~
- 重磅!AI 自我修错技术问世,LLM 终于能纠正自己的错误了
- Anthropic CEO:AI 将在半年内编写90%的代码!
- 375篇文献,深入探究推理大模型后训练技术
- Manus开源复现OpenManus:开源AI Agent框架的深度解析与探索
2025-03-10
- 再看如何控制大模型思考时间?从S1预算控制到L1长度约束强化学习
- 2024年国家杰青、国家优青名单
- ICLR25-Oral:双曲空间让CLIP看懂层次关系
- 今日开源(2025-03-10):Long-VITA,长上下文视觉语言模型,支持百万视觉token,媲美20B模型,开源数据训练
- 【他山之石】CVPR 2025 | 多视角视觉目标跟踪新突破!MITracker:高效融合多视角特征,解决遮挡与目标丢失问题!
- DeepSeek 反思潮:AGI 既被重新审视,又被持续低估
- 【他山之石】MIT 最新扩散模型课程:从微分方程探索 AIGC 的边界
- 【源头活水】视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源
- 图灵奖的获奖者们,担心成为 AI 界的「奥本海默」
- Kaggle赛题解析:BYU 2025细菌鞭毛马达定位
- Claude MCP 突然爆火!AI Agent 圈的“万能插头”,直接让 Cursor 工作流效率提升 10 倍
- Mistral AI 发布号称最强 OCR API:能解锁 90% 非结构化数据,1 美元搞定 2000 页文档
- 90%成功响应率,整合约9000个样本,统合癌症蛋白质组学的LLM驱动平台
- 扩散模型+深度学习双剑合璧,生成式AI破解染色质构象
- 融合图神经网络与无监督语言模型,对RNA-蛋白质相互作用精准预测
- 学生党狂喜!A5000算力跌破1元/时,AI云平台开启硬核内卷
- 985扩招潮,来了!
- Manus引爆智能体复现潮!DeepSeek已被整合,项目挤满开源榜,海外大V排队求码
- 影响高校女教师幸福感因素的探究
- 教授何恺明在MIT的最新讲座!
- 【深度学习】CVPR 2025|MambaOut:在视觉任务中,我们真的需要 Mamba 吗?
- “专为我开了一个新课题”,顶尖博士为什么偏爱去字节实习?
- 2024年国家杰青、国家优青名单
- 一文搞懂 DeepSeek 核心技术!
- 给所有大模型加上联网功能,套到极致,就是艺术
- JAMA复现|展示32篇纳入研究的临床实践指南在 NEATS评分中的表现!
- 强得离谱!终于有人把计算机视觉讲明白了 。。。
- 最强组合,随机森林和 PCA !!
- 「Github一周热点64期」Manus开源实现仅用5人3小时?含金量如何
- 顶配超10万!两台Mac Studio在家就能跑满血DeepSeek,网友:这是性价比最高的大模型一体机
- 5个人3小时复刻开源版Manus,无需邀请码,随便免费用…
- 华为”天才少年”稚晖君官宣本周要发布好东西,国产机器人行业迎来新变局?
- TIM 2025 | CASPFuse: 基于双循环横向感知和全局结构张量保持的红外与可见光图像融合方法
- 那些年我们一起卷过的卷积
- 黄仁勋预言成真!!!
- DeepSeek大模型原创核心技术解读
- 【实习】字节番茄 2026届多模态实习生
- 李宏毅一节课带你了解生成式人工智能的技术突破与未来发展
- 部署DeepSeek 满血版?节约50%成本,这款H200裸机服务器就可以!
- QwQ-32B 测评和使用教程来了!
- 扬帆启航!你的开源之旅从「启航计划」开始!
- 中关村论坛-未来人工智能先锋论坛报名开启
- OpenSeek:一场属于青年人的AI探索远征,邀你共赴星辰大海!
- 川普上台,US PHD申请大冲击!
- LLM能作为我们的数字孪生吗?
- 让RAG更聪明,通义实验室ViDoRAG开启视觉文档检索增强生成新范式,重塑大规模文档集合迭代推理!
- 关于DeepResearch设计实现的碎碎念
- DPG-Bench榜首!智谱开源文生图模型CogView4:支持中英文输入和生成,免费商用授权!
- Magic Mirror:可从单个参考图像生成电影级质量身份一致性和自然运动视频
- 一张图生成舞蹈视频!字节等发布黑科技X-Dancer:零样本音乐驱动,真实感碾压3D方案
- 即梦AI接入DeepSeek:数字人+对口型+唱歌跳舞+声音克隆,统统免费!
- 中国第二个DeepSeek,Manus发布通用AI Agent,震惊国外
- LG发布NEXUS框架,用AI确保训练数据合规性
- 线下沙龙 | 解锁AI狂飙下的生产力重塑密码!
- Manus平替,两个非常火开源版本,超2000和5000颗星
- 核心期刊快速发表,这么简单?
- 瓦力算法3月第1周急招岗位|Momenta / 小米 / 追觅 / 网易云 / 星尘智能 / 字节 / 比亚迪 / 科大讯飞
- Manus AI:全面概述
2025-03-09
- 前沿技术之KBQA-O1及RAG用于综述写作实现思路解析
- 万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025
- AI演进的灵魂代码藏在哪?| 追问专访 · 复旦副教授魏忠钰
- 一文了解八款主流大模型推理框架
- 大模型的未来,是智能体还是超级应用?
- 一文读懂多模态大模型微调,武大发布最全综述!
- 大模型与人类思维认知的差距
- 人大代表呼吁废除35岁就业门槛;Manus 紧急扩容服务器;“海米兄弟”火了!海尔老总被调侃撞脸结界兽 | AI周报
- 让天下没有难做的AI交付,DeepSeek 服务交付联盟是个什么组织?
- 300 万年薪程序员被裁!女友朋友圈一张炫富照片引发的职场地震
- 机器学习面试准备路线图(2025版)
- “六战法考”的北大保安,传来好消息,校方发长文
- LLM推理革命:实现近无损16倍KV缓存压缩与Attention加速,推理速度提升1.4倍
- 机器学习论文:复现特征重要性柱状图、Shap模型可视化解释
- Manus火到国外?实测惊呆!00后博士生0天复刻霸榜开源第一
- 刚刚!微调 DeepSeek 满血版正式开源。。。
- 我没有大模型经验,可以给个机会吗?
- 2025年,Matlab依旧坚挺?
- 涉嫌用ChatGPT写论文,中国留美博士遭学校开除:怒告校方,要求公开道歉+索赔57.5万美元!
- 提示词工程
- 美国老姐看完200+中国学生SCI论文,怒写超详细“中国人英文论文写作指南”,还被推上了B站热门…
- 傅里叶变换太牛了!用傅里叶分析重塑LLMs的周期性感知
- 模型部署系列 | 卷积Backbone量化技巧集锦
- 从DeepSeek V3开源趋势重新审视大模型Infra
- 从DeepSeek V3看FP8训练的挑战
- 小目标检测神器,基于YOLO11的动态图形网络,用于小目标检测和跟踪 !
- olmOCR-7B,基于Qwen2的文档提取OCR专用模型
- 阿里最新推理模型,效果媲美满血R1!
- 我用trae开发了一款颜值测试小程序
- 154W!AI圈彻底沸腾吧!这个好消息来得太及时!
- deepseek-R1自测效果分析和选择建议
- 推理大模型的后训练增强技术-强化学习篇
- 阿里千问发布QwQ-32B:性能肩比DeepSeek,只需DeepSeek的1/20参数,一张显卡就能跑!
- 首个开源免费的商用级别克隆数字人模型,1080显卡可用,数字人不再有门槛。
- 南开提出1Prompt1Story,无需训练,可通过单个连接提示实现一致的文本到图像生成。
- 学妹问:SFT时哪些参数比较重要?
- 国产数字人巨头突然宣布:免费开源+无限克隆+本地部署,彻底掀桌子了!
- Github热门项目周报 | 第10周
- 3月9日周日 | 每日一图
- 3月9日周日 | Python热门项目
- 3月9日周日 | Github今日热门
- LLM PD 分离背后的架构问题
- 通俗讲解DeepSeek中的GRPO:强化学习里的神奇算法
2025-03-08
- 最近大模型技术落地观察及RAG的针对性优化思路SAGE
- KAN备受审稿人青睐!结合小波变换就能发一区,厉害了
- 【他山之石】CVPR25|零训练成本!中科大创新扩散模型概念擦除方法,先验保护较SOTA提升 10 倍
- 【源头活水】自己训练模型才能掌握未来?一股脑押注应用层或许值得警惕
- AI 智能体,颠覆还是赋能?一文读懂!
- 世界首个人类脑细胞计算机诞生!能编程还能活体计算,售价3万5美金
- 目标超级智能,前DeepMind科学家离职创业,获1.3亿刀融资
- 加州大学伯克利分校:《面向科学发现的多模态基础模型:在化学、材料和生物学中的应用》
- 被骂惨的“现象级”Manus,今天我们来扒一扒它的真实水平!
- 图解 DeepSeek-R1
- Lakehouse 架构演进:从数据融合到智能决策的未来之路 | 直播预告
- ResNet级神作再现,何恺明团队提出分形生成模型,计算效率狂飙4000倍!
- 机器学习论文复现:6个模型ROC曲线、箱线图展示5折交叉AUC分布
- 阿里通义千问,汪峰附体了
- Nature复现|系统化展示不同组数据间的交集和并集关系!
- 用极小模型复现R1思维链的失败感悟
- 阿里巴巴:裁减 24940 人!
- 《动手学计算机视觉》正式发布 | 留言赠书
- 刚刚!GPT4.5+Claude3.7+Midjourney 彻底开放了!
- CVPR 2025 MINIMA:首个通用多模态图像匹配架构(模型、数据已全部开源)
- 比较全面的L1和L2正则化的解释
- 用极小模型复现R1思维链的失败感悟
- 百川智能算法实习生招聘
- 卷!!!MetaGPT成员3小时复刻Manus,代码已开源!
- QwQ-32B 测评和使用教程来了!
- 清华与人大最新研究表明:AGI的到来时间需70年与10^26个参数,好像不用那么急了
- 阿里通义RAG团队等提出RAG与长文本对比新框架,助力智能路由决策机制设计
- 推理大模型的后训练增强技术-指令微调篇,如何用指令微调提升推理能力?
- Manus平替来了!CAMEL-AI开源OWL,开源框架中排名第一,上线一天获得3.3K stars!
- AI Agent 孵化器?CAMEL-AI框架介绍,一文带你读懂背后的逻辑。
- 浙江大学版153页完整版!DeepSeek落地实战指南(免费下载)
- RAG+DeepSeek R1的正确打开方式~
- 插件:多功能瑞士军刀
- Agentic AI四大设计模式:引领智能系统进化之路
2025-03-07
- R1复现基座选用Qwen or Llama?兼看Audio-Reasoner多模态语音推理思路
- 狂发顶会的Mamba,融合傅里叶变换再出神作!
- 变种PINN,更小的误差,更高的性能!
- 今日开源(2025-03-07):腾讯开源HunyuanVideo-I2V,图生视频模型,图像潜在拼接技术生成高保真视频内容
- 【他山之石】千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷
- 实测 Manus:DeepSeek 之后,AI 又点了一把火
- 搞到邀请码了吗?从Manus爆火谈谈Agent的巅峰与思考|建忠研思
- 5个人三小时复刻开源版Manus,邀请码也不需要了
- 欧米伽未来研究所:100部全球精选前沿科技未来发展趋势报告综述(2025年2月)
- 纳米世界的实时电影,科学家首次使用AI以毫秒级分辨率观察原子移动,登Science
- 引力新解:颠覆认知的“熵力”理论
- 行业落地分享:字节RAG技术实践与优化
- 代码界的“瘟疫”?卡帕西“氛围编码”兴起,越来越多创业公司正将代码全权交给 AI!
- DeepSeek 之后,大模型应用如何迈向新阶段?| AICon
- Arm 发布全新 Armv9 边缘 AI 计算平台,可运行超 10 亿参数端侧 AI 模型
- 11天实现18种广谱抗菌素设计,体外验证成功率94.4%,浙大侯廷军等用LLM方法从头设计AMP
- Nature子刊 | 光镜电镜通用,Meta「分割一切」模型用到显微镜图像上了
- Nature封面:探索真菌网络,用机器人进行高通量延时成像研究
- 纳米世界的实时电影,科学家首次使用AI以毫秒级分辨率观察原子移动,登Science
- CPU加速最高约十倍,全复现137种已知多晶型,薛定谔公司带来全新晶体预测模型
- 【Python】2025 超现代 Python 实用工具
- 英伟达RTX 5070评测解禁:老黄承诺4090级性能?不存在的
- 纯手工复刻Manus演示功能,顺便做了一个网站,睡后收入3美分
- DeepSeek爆火,留给程序员们的时间不多了
- 为什么Qwen能自我改进推理,Llama却不行?
- 国产 AI 卷疯了!Manus 横空出世,阿里开源 QwQ-32B!
- CVPR 满分论文:一块 2080Ti 搞定数据蒸馏,GPU 占用仅 2G,来自上交大“最年轻博导”课题组
- 邀请码炒到 10 万?OpenManus 深夜开源打脸!Manus 平替光速上线。。。
- 为何说 “在国内做科研,最忌讳踏实”?
- 利用边缘检测计算物体面积(内含源码)
- 新晋顶流Manus被疑“套壳”?创始人回应……A股:先涨为敬
- 关于DeepSeek V3/R1 Decoding吞吐极限的估计
- Qwen开源QwQ-32B,“小”模型性能比肩DeepSeek-R1,RL的魅力
- 2024飞桨开源社区年度报告
- OpenSeek开源共创,招募全球贡献者
- 阿里发现新方法:仅用小纸条和错题本,就能使数学近满分、code能力翻番…
- 复现和改进 DeepSeek-R1 的一些 tips
- DeepSeek-V3/R1 的 Hosting 成本预估
- 推理大模型的后训练增强技术-预训练篇
- OpenManus:5个人三小时复刻开源版Manus,不需邀请码, GitHub已获 8k+ star!
- LuminaBrush 在图像上绘制照明效果的构建交互式工具。
- Google发布新AI工具Whisk:使用图像提示代替文本,快速完成视觉构思。
- 大模型算法岗面试准备篇(二)—— 如何想面试官介绍实习经验?
- Manus邀请码被炒至10万?开源平替OpenManus免费体验!
- 被吹上天的Manus,更像一场有预谋的自嗨式营销,请保持清醒拒绝FOMO!
- 【AIGC律师】AI领域的律师服务正式开启全新篇章!
- 【AIGC应用】昆仑万维推出的SkyReels-V1和SkyReels-A1,标志着视频生成技术的重大突破
- 【AIGC趋势】广和通正式发布了其全新的全矩阵AI解决方案——“星云”系列
- 【行业动态】阿里巴巴发布了其最新的开源视频生成模型 Wan 2.1,北京成为AI技术的“隐秘高地”杭州迅速崛起为AI“新势力”。
- 310-A1.1|图像参考的动画草图上色,视觉艺术作品笔画演变;视觉特征迁移,主体风格与动作个性化;统一视觉分词器,图文交织控制
- 310-A1.2|DiT推理加速;图像编辑(图像条件反演,身份保留蒸馏采样);自回归视觉生成系列;使用KAN优化扩散路径
- 310-A2|文本生成无缝循环视频,CoT运动控制器用于可控视频生成,可重光照的肖像动画化
- 310-A3|3D生成先验点云补全,基于神经表面变形的形状插值,开放词汇3D人类语义部件分割;双角色交互动作生成
- 310-B1|MLLM指令微调相关,探讨视觉基础模型能否学习人类视觉系统的低级特征,基于MLLM的视频帧选择用于视频理解
- 310-B2.1|可动画化3D头像与人体重建系列;3D说话头系列
- 310-B2.2|VR环境360度视频质量评估;单目动态场景渲染,无需相机内外参的GS;基于物理的HOI模拟
- DeepSeek创造历史!登顶全球AI应用第2名,豆包排名第10
- 金融AI Agent平台Unique,获3000万美元融资
- 马来西亚与ARM达成2.5亿美元协议,自研AI芯片
- 微软AI技术进阶课第4期【文档智能技术】,锁定3月9日20:00-21:30~
- 阿里开源新模型:媲美DeepSeek-R1,参数大降20倍!
- Mistral发布史上最强、最好用OCR模型
- 首个Manus开源复现OpenManus,MetaGPT出品
- AI三国杀:Claude Sonnet 3.7、OpenAI o3-mini-high与DeepSeek R1的全面对决
2025-03-06
- PIKE-RAG及多模态R1-Visual-RFT思路思考:兼看olmOCR的一些测试感官
- 度小满风控算法工程师社招一面+二面+三面
- 今日开源(2025-03-06):阿里开源QwQ,大规模强化学习,专注复杂问题解决,32B性能媲美DeepSeek-R1
- 社区投稿 | 面向现代前端代码生成的多模态大模型解决方案
- 实测 Manus:首个真干活 AI,中国造(附50个用例 + 拆解)
- 【他山之石】行业Agents开发者速评Manus:全委 Agent or 协作 Agent ?
- 强化学习之父Richard Sutton荣获图灵奖,智源大会上他分享了四个阶段通向真正AI发展之路
- 华盛顿圈:AI开源竞争,为什么美国要引领
- 快1000倍,十万分之一误差,深度学习模型降低核聚变等离子体预测计算成本
- 人类通往人工智能意识的路还很远
- 简单的Python调用C++程序
- 竞赛总结:Kaggle LLMs对抗输入挑战赛
- DeepSeek之后又一国产黑马!“全球首款”通用AI Agent一夜刷屏,全网在要邀请码
- JetBrains 推出 AI 编码智能体 Junie,但用户评价不高
- 快1000倍,十万分之一误差,深度学习模型降低核聚变等离子体预测计算成本
- Nature:如何借助AI高效完成学术论文同行评审
- 为 AI 助力药物发现的方法
- Science子刊,AI与生物物理建模相结合,设计新型蛋白质
- 【干货】5分钟讲透数据分析之【对比分析】
- LLM强化学习算法演进之路:Q-Learning->DQN->PPO->DPO等
- 刚刚!DeepSeek团队丢出注意力新机制重磅论文
- CVPR2025录用结果出炉!这些方向是大趋势!
- DeepSeek 大模型能力轻松接入100+应用
- 全网都在吹的中国团队发布的 AI Agent产品Manus,我发现其创始人更“牛逼”
- 梁文峰亲自下场!一站式门清deepseek注意力新机制论文!
- 2024图灵奖颁给强化学习两位奠基人!ChatGPT、DeepSeek背后功臣戴上迟来的冠冕
- 阿里推理模型一战封神!32B硬刚671B DeepSeek!!
- 10 个超实用 DeepSeek 指令,国内外研究现状有救了,大大节省时间!
- 彻底搞懂!九大损失函数 !!
- 35 岁北大校友突破 125 年数学难题!网友:华人数学奇迹年
- CVPR 2025 放榜!杀疯了,本科生连中三篇
- AI三小时造出游戏、10天狂赚28万!游戏开发小白逆袭,获马斯克点赞:AI游戏要火!
- Google 证实了一个程序员不愿面对的 AI 现实,不接受只会被淘
- 【附复现代码】基于PINN的论文创新思路
- CVPR 2025 | MobileMamba开源:轻量级多感受野视觉Mamba主干
- 最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)
- 刚刚,2024图灵奖颁给了强化学习之父Richard Sutton与导师Andrew Barto
- 阿里QwQ-32B开源了!
- 美团开源首发INT8无损满血版DeepSeek R1
- 细节之王 Kimi K1.5,大模型算法工程师复现推理模型必读文章之一
- WWW2025面向多模态RAG的文档检索挑战赛
- 媲美满血R1+,阿里推理模型QwQ-32B开源
- 万字长文经验分享,我做模型量化的那些年!
- 文本-图像检索革新,视觉Prompt预测+轻量训练,性能超BLIP2!
- PP-TableMagic开源,支持全场景高定制化微调,大模型时代表格结构化信息提取新神器
- 国赛来咯!第二十届智能汽车竞赛百度完全模型组正式开启
- 强化学习之父Richard Sutton荣获图灵奖,智源大会上他分享了四个阶段通向真正AI发展之路
- 聊聊RL训练的奖励机制——项目工程应用与DeepSeek的RL应用
- 我的 RL 人生哲学: 写给Sutton & Barto的图灵奖时
- 西湖大学提出AppAgentX:“偷懒”也能高效?让Agent像你一样操作手机
- 上交&上海AILab:开源DeepSeek R1成功迁移多模态的方案与代码!
- NAACL 2025 | UniHGKR:指令感知的异构知识检索器
- Qwen开源QwQ-32B,“小”模型性能比肩DeepSeek-R1,RL的魅力
- 免费白嫖DeepSeek满血版,再也不怕服务器繁忙!
- 【论文分享】推理大模型Post-Training技术的全面综述
- DeepSeek之后,Manus再度震惊全球AI界。全球首款通用AI Agent:三个问题带你了解。
- 北大提出高效视频生成框架Magic 1-For-1!一分钟即可生成1min时长的高质量视频!
- 北航 | 第一个多功能即插即用适配器MV-Adapter:轻松实现多视图一致图像生成。
- 谷歌推出PaliGemma 2 mix:用于多任务的视觉语言模型,开箱即用。
- 小米二面: QLoRA和LORA有什么区别?
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 中国团队的王炸产品:Manus,全球首款通用型 AI 智能体来袭!
- 良心推荐!10个DeepSeek满血平台,丝毫不卡还完全免费!
- 10.4K+ Star!AI Hedge Fund:一个基于AI的对冲基金交易系统
- 3月6日周四 | 每日一图
- 3月6日周四 | Python热门项目
- 3月6日周四 | Github今日热门
- 308-A1.1|LLM驱动文生图,融合不同内容与风格LoRA;多层透明图像生成,功能性概念设计;LLM用于图像编辑,头部交换
- 308-A1.2&A2|稀疏注意力用于推理加速,基于变分噪声耦合训练一致性模型,面部身份保持视频生成,视频生成时空一致性综述
- 308-A3|统一语言图像3D预训练,3D极线注意力NVS;大头像模型用于图生高斯头,草图重建3D人脸;音乐驱动3D全身舞蹈生成
- 308-B1|MLLM人类偏好对齐,科学海报摘要生成,视觉丰富文档RAG,多智能体图表生成;对比视觉数据增强
- 308-B2|拉普拉斯算子GS,单图重建穿衣人类与物体
- 309-B1|理解复杂的数学和科学定理,探讨VLM内部的神经元功能,CLIP视觉与文本可解释
- 309-B2|3D点云对象为中心的运动生成,跨模态3D检索;NeRF水印保护,3DGS是否需要精确体积渲染
- 2万美元一月!OpenAI将推出博士级AI Agent
- 杭州“六小龙”大火,用火山引擎开源AI预测杭州楼市,竟然挖到了这些关键数据!
- LlamaIndex获1900万美元,主打知识AI Agent
- bge开源新向量模型了,冲!
- 重磅!OpenAI将推出15万每月的博士级代理!我不配……
- 媲美满血R1+支持Agent,阿里推理模型QwQ-32B开源~
- QwQ-32B以小博大多领域超越DeepSeek-R1
2025-03-05
- 再看文档解析该如何做?pipeline派及end2end两派路线及代表工具
- RAG&KG&LLM&文档智能等前沿技术及落地跟进:老刘说NLP技术社区持续对外纳新
- 剑桥大学PINNs新综述!物理信息神经网络能否超越有限元方法?
- 今日开源(2025-03-05):CogView4开源来袭,6B级联扩散模型,支持中英文文本输入,生成高分辨率图像
- 美国人工智能协会:《关于人工智能研究未来的研究报告》
- 为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理
- 生命的级联:PNAS研究揭示从分子机器到生物圈的演化之路
- 英特尔 4.75 亿美元的错误
- 基于图谱RAG(KG-RAG):如何用、何时用?
- 腾讯元宝连夜修改用户协议!“霸王”条款冲上热榜,你的内容到底谁说了算?
- Deepseek V3/R1 技术内核及 RAG 技术前沿进展
- 为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理
- 上海AI Lab最新推出Mixture-of-Memories:线性注意力也有稀疏记忆了
- 英伟达RTX 5070评测解禁:老黄承诺4090级性能?不存在的
- 大规模实用化量子化学计算曙光显现,ByteDance Research开源工具集ByteQC
- 大模型推理新范式!清华&蚂蚁:用编程思维来思考,用自然语言来表达
- 刚刚,2024图灵奖颁给了强化学习之父Richard Sutton与导师Andrew Barto
- ByteQC:通往大规模实用化量子化学计算的曙光
- 谷歌旗下带来细胞器动力学的「全息解码器」,启动亚像素级细胞器分析
- 无缝集成知识图谱,开源Python框架BioChatter降低LLM生物医学使用门槛
- 多中心医学图像分析模型,VFMGL框架破解数据孤岛难题,93.4% Dice系数的卓越表现
- DeepSeek爆火后,哈工大博士的pytorch笔记终终终于更新公开了!!
- DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码
- DeepSeek写武侠小说的水平如何?–泰森大战保罗
- 【Python】matplotlib + pynimate,轻松让数据动起来!
- 李国杰院士“七问”DeepSeek
- 33岁的他,受聘武汉大学计算机学院教授!
- 360联合北大震撼发布!5%参数量逼近Deepseek-R1满血性能
- 科学家们,别再用彩虹色误导读者了!
- 视觉强化微调终于也来了!全面开源!
- 独自一人,怒发数篇 SCI。。。
- 李国杰院士“七问”DeepSeek
- 耗时一年,写3.5万亿行代码、消耗90GB内存,只为让Doom跑在TS类型系统中?
- 面试必问,React和Vue各自是如何更新视图的?
- AUTOSAR为何成为车企刚需?
- 教下载盗版Win11、输出被删掉的GitHub库,Copilot被指“背刺”微软
- 盘点常见7类领导,看看你跟对人了吗?
- CVPR 2025 满分论文!一块2080Ti搞定数据蒸馏,GPU占用仅2G!来自上交大“最年轻博导”课题组!
- 【CVPR 2025】高效视觉Mamba模块EfficientViM,即插即用!
- 机器视觉中常用图像处理库都有哪些?
- 《DeepSeek知识库》来了!!
- Deepseek-R1-Zero复现实验细节
- 用极小模型复现R1思维链的失败感悟
- AI编程开发神器Cursor,保姆级实战教程!
- PyTorch灵魂人物离职,分享他在PyTorch的这四年经历!
- Kaggle赛题解析:使用大模型绘制SVG图像
- 首届AI家书创新应用大赛启动:用科技守护2.8亿银发人群的时光记忆
- 模力星河 AI 共创:工业数字化转型 “加速器”
- AI Infra | VeRL 框架入门&代码带读
- reasoning压缩token数量竟然有最小限制!
- 7B reasoning模型吊打DeepSeek,破解希尔伯特世纪难题
- ICIR2025 | CubeDiff:无需考虑失真,重新利用基于扩散的图像模型来生成360°全景图
- StochSync:可在任意空间中生成高质量360°全景图和3D网格纹理
- 单幅图像合成 360° 3D场景的新方法:PanoDreamer,可同时生成全景图像和相应的深度信息。
- TRELLIS:用于创建多功能、高质量的360°全景图生成方法,实现可扩展多功能3D生成。
- 阿里发布新开源视频生成模型Wan-Video, 支持文生图和图生图,最低6G就能跑, ComfyUI可用!
- 电商领域利器来了!港大&阿里提出MimicBrush,可模仿参考图进行零样本图像编辑。
- 澳门大学提出DC-ControlNet!解耦控制条件!灵活性和精度超过ControlNet!
- 20个DeepSeek实用建议,普通人逆袭就靠它了!
- 刚刚,OpenAI发布NextGenAI,彻底颠覆传统教育
- Anthropic获35亿美元融资,估值615亿美元
- T-Mobile将推出AI手机,售价低于1000美元
- OpenAI开价385万年薪扩增机器人团队!招募基础模型人才,北大校友是创始成员
- 显著超越SFT,o1/DeepSeek-R1背后秘诀也能用于多模态大模型了
- “老黄骗人”!5070首批评测:说好1/3价格赛4090,实际不如4070Ti
- 一头大象难倒ChatGPT,Grok 3完美通关
- 空间具身通用操作模型!百万真实数据训练,预训练代码全开源 | 上海AI Lab/TeleAI/上科大等团队新作
- 2025,见证更多GenAI应用落实!今年的中国AIGC产业峰会来啦
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 35岁北大校友突破125年数学难题!网友:华人数学奇迹年
- 透明物体也能被机器人抓起来了,单目的那种 | ICRA 2025
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- DeepSeek突袭腾讯发力,豆包Kimi断层领先优势不再|量子位智库月报
- 转用国产编程语言!MoonBit进入北大计算机学院研究生课程,LLVM后端编译器同步发布
- GRPO的Loss为什么会有负值???
- 搜索 + RL = DeepRetrieval, 开源!
- 这能不算 AI engineer 吗?
- 强化学习如何让LLMs学会思考而不仅仅是预测
2025-03-04
- 一文图解大模型量化:量化的目的、内涵及若干实现策略
- 从零开始绘制DeepSeek R1架构和训练流程
- 深入解析Tiktokenizer:大语言模型中核心分词技术的原理与架构
- 结合CNN与Transformer,实现遥感图像处理性能巅峰,霸榜顶会顶刊!
- 今日开源(2025-03-04):Granite3.2,8B长上下文模型,可控推理支持多语言,基于3.1微调,助力多领域AI应用
- 【源头活水】最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)
- 【他山之石】CVPR 2025 | MobileMamba:轻量级多感受野视觉Mamba主干
- 朱松纯:大模型为什么不是AGI?
- 耶鲁、剑桥等开发MindLLM,将脑成像直接转换为文本
- 新的神经网络更加准确且易于解释
- AI独角兽吸金大战:Anthropic狂揽35亿美元 剑指OpenAI
- 我没有大模型经验,可以给个机会吗?
- Kaggle赛题解析:斯坦福3D RNA结构预测
- 谷歌开卷打工人!创始人让员工每天12小时,夺回AI地位!网友先怒了:像你一样在公司玩游戏吗?
- 英特尔 4.75 亿美元的错误
- 刚刚,Anthropic完成35亿美元新融资,估值飙升至615亿美元,网友催发Claude 4
- 生成与理解相互促进!华科字节提出Liquid,揭示统一多模态模型尺度规律!
- 半个世纪后,著名的麦凯猜想终获证明!数学家夫妇终结了一个未解群论难题
- 北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准
- DPO-Shift:一个参数可控改变DPO分布,缓解似然偏移
- 视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源
- 为DeepSeek MoE模型带来「免费午餐」加速,专家链可大幅提升LLM的信息处理能力
- 首个强化生成模型AbNovo实现多目标、多约束抗体从头设计,发表于ICLR 2025
- 耶鲁、剑桥等开发MindLLM,将脑成像直接转换为文本
- 上海交通大学医学院人工智能蛋白质设计课题组诚聘助理研究员、博士后、客座学生
- 生物版DeepSeek的隐秘竞争,中国模型被视为更强对手,赛诺菲10亿美金押宝!
- 用于临床工作流程的新AI助手,微软推出Microsoft Dragon Copilot
- 2025 超现代 Python 实用工具
- 中纪委通报教育系统腐败:清华大学2人已被采取留置措施,中科大处分10人,前教育部副部长被立案审查
- 官方揭秘:DeepSeek一天能赚多少钱?
- 登上nature,Transformer到底凭什么这么火?
- HuggingFace 又出新教程啦!手把手教你构建DeepSeek-R1推理模型
- 一省宣布:毕业3年,也算“应届生”
- 即插即用,轻松涨点!把大牛的模块缝合到自己的paper里
- 大模型训练神器:KV缓存狂减一半
- 经典回顾 | Deepseek开源盛宴第一天:FlashMLA
- 机器学习医学预测,论文复现:风险评分分布图、ROC曲线、特征重要性条形图
- 机器学习面试准备路线图(2025版)
- 机器学习项目团队都有哪些角色?如何分工
- 如何绘制甘特图,代码示例(R、Python)
- 【火热征稿中-稳定检索】2025年计算机视觉、人工智能、物联网EI会议重磅来袭!
- 纽约大学survey:深度学习模型优化方法技巧
- 爆肝GRPO算法,终于从头跑通了!
- CVPR满分论文!一块2080Ti搞定数据蒸馏,GPU占用仅2G
- 全网疯抢的顶配 AI 神器!比肩 DeepSeek 让 AI 生图简单到离谱!
- 通透!十大 PyTorch 核心操作全总结!!
- 碉堡了!用deepseek写了篇一区论文
- 目标检测中的 Anchor 详解
- 驱使我读博的原因:博士配偶初中学历被安排工作!网友:学得好不如嫁得好,高校回应:合规!
- 小米汽车校招薪资爆料清单来啦!
- 李国杰院士“七问”DeepSeek
- DeepSeek-V3技术报告英中对照版
- Long-VITA:突破百万Tokens限制!开源多模态大模型新标杆
- 图像视觉任务微调!DeepSeek R1技术成功迁移到多模态领域,全面开源(附论文和源码)
- 超分辨率图像,红外小目标检测算法YOLO-MST发布!
- 手把手构建DeepSeek-R1推理模型!
- Kaggle赛题解析:斯坦福3D RNA结构预测
- 前沿多模态模型开发与应用实战第二期:Qwen2-VL系列多模态理解大模型算法解析与功能抢先体验
- 用极小模型复现R1思维链的失败感悟
- 终于有人站出来质疑LLM as a judge的合理性了!
- 有可能一个人写出windows操作系统吗?
- HuggingFace 又出新教程啦!手把手教你构建DeepSeek-R1推理模型
- RAG学习必备,论文+实战+经验全收录!
- 4.9K+ Star!AstrBot:一个功能强大、易于上手的聊天机器人框架
- 3月4日周二 | 每日一图
- 3月4日周二 | Python热门项目
- 3月4日周二 | Github今日热门
- 307-A1.1|多任务视觉通用模型,背景保持图像编辑,计算机游戏任意风格迁移,跨文化&文化相关文生图系列;fMRI图像重建综述
- 307-A1.2|分形生成模型,CoT自回归生成,扩散分布鲁棒优化,扩散模型幻觉缓解;修正流轨迹蒸馏,分层修正流;流匹配幻觉问题
- 307-A1.3|安全篇|概念擦除,AI生成检测,版权侵权检测,文本与视觉防御攻击,防止基于后门攻击的恶意个性化
- 307-A2|视频生成时间空间外推,多粒度视频编辑;音乐驱动图像动画化舞蹈生成,音频驱动说话头;音频视觉分割
- 307-A3|拖拽控制高斯生成编辑,文生3D质量评估;文本驱动场景编辑;任意拓扑骨骼角色动作生成,模拟人视觉与推理的人类动作预测
- 307-B.1|MLLM文本丰富图像理解综述,基础视觉认知能力评估,检测VLM训练数据版权保护;学习移动设备操作
- 307-B.2|让视觉模型特征更清晰,基于树结构的分层“变换器”,解释神经网络内部机制;视觉知识密集型问答基准,细粒度视频字幕化
- 307-B.3|高质量大规模开放场景重建,无约束稀疏视角房间布局重建;GS场景分割,开放词汇GS场景理解,3D-LLM幻觉问题
- 全球首创!微软发布医疗AI助手,终结手写病历时代
- 中科院、百度提出新架构:突破参数限制,实现高效推理
- 线下沙龙 | 一起解锁AI狂飙下的生产力重塑密码!
- Code Without Barriers 深圳站 · 国际妇女节特别版 International Women’s Day
- 活动回顾 | Code Without Barriers 北京站:AI重塑工作未来
- 赛前启航 | 微软 AI 开发者挑战赛 3 场直播联袂来袭,解锁夺冠密码!
- Claude公司估值615亿美元再融35亿,那DeepSeek…
- 老显卡福音!美团开源首发INT8无损满血版DeepSeek R1
- 实测字节免费AI编程,还让不让Cursor活了
- DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科
- GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭
- 差点被开除的哈佛学子,最后为创业选择主动休学 | 比尔盖茨自传《源代码》
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- AI横扫MWC,中国厂商的「吸睛密码」亮了(doge)
- DeepSeek前实习生魔改MoE,用迭代机制把内存需求砍了42%,团队:“免费午餐”优化方法
- 重磅!NeoBERT横空出世:2.1万亿token训练,开源碾压传统编码器
- 人工智能之父 Hinton 警告:AI 正让人类智慧变得无关紧要,这比工业革命更可怕!
- 比COT更高效的推理提示策略Chain-of-Draft(COD)
2025-03-03
- 大模型上周回顾及Deepseek开源周总结:兼看面向多任务的模型融合思路
- 爆锤蒸馏!田渊栋等提出CoCoMix,用“连续概念”增强大模型训练,效率提升21.5%!
- 今日开源(2025-03-03):HumanOmni,7B全方位多模态大模型,专注人物场景理解,动态融合面部、身体与交互信息
- 【源头活水】何恺明带队新作「分形生成模型」:逐像素建模高分辨率图像、效率提升4000倍
- 【他山之石】ICLR 2025|浙大、千问发布预训练数据管理器DataMan,53页细节满满
- 2025全球机器学习技术大会部分议题揭晓:大模型、智能体、DeepSeek、工程架构等12大专题共话AI核心技术!
- DeepSeek开源连击、Claude编码升级、GPT性能迷局,系统解读大模型诸神之战 | 万有引力
- DeepSeek开源连击、Claude编码升级、GPT性能迷局,系统解读大模型诸神之战 | 万有引力
- 南大周志华团队获奖,AAAI 2025杰出论文奖出炉
- 对复杂系统的思考:乔治·帕里西访谈
- 速度提升3200倍,准确率提高40%!深度神经网络+纠错码革新DNA存储技术
- 单月业绩破亿,10 亿热钱再狂砸智谱 AI!DeepSeek 掀起“AI 免费”风暴?唐杰:怎么想的呢!
- 玄铁首款服务器级 CPU 下月交付:性能达服务器级,搭载 Matrix AI 引擎
- 中国团队首次夺魁!无问芯穹FlightVGM获FPGA’25最佳论文,峰值算力超GPU,抹平21倍
- 杭州国资押注大模型,智谱AI获超10亿元战略融资
- 南大周志华团队获奖,AAAI 2025杰出论文奖出炉
- 灵初智能发布端到端VLA模型Psi R0.5,仅需两小时数据实现物品、场景全面泛化
- 让大模型成为能够操控计算机的智能体,作者带来OmniParser V2详解
- DeepSeek推出后,移动端AI风向要变
- 多元推理刷新「人类的最后考试」记录,o3-mini(high)准确率最高飙升到37%
- ICRA 2025|清华x光轮:自驾世界模型生成和理解事故场景
- 速度提升3200倍,准确率提高40%!深度神经网络+纠错码革新DNA存储技术
- 人工智能如何改变制药行业,对医学的未来意味着什么?
- 检索了15460项研究,AI与机械流行病学建模相结合:机遇和挑战的范围界定回顾
- 突破性进展!浙大scNiche框架精准识别细胞生态位,助力精准医疗
- 两万字长文深度解密DeepSeek-R1、Kimi 1.5,强推理模型凭什么火出圈?
- 手把手教你用Coze打造自己的“数字员工”
- 2025年至今十多位青年科学家接连倒下!科研界的‘非升即走’,走的为何是生命?
- 【深度学习】通透!十大 pytorch 核心操作全总结!!
- 梁文锋,yyds !!
- 14.88亿大单,国产GPU大厂赢麻了!
- Python 数据结构全解析:从基础到实战
- 没有经验,可以搞大模型吗?可以
- 用大模型学机器学习:机器学习项目全景、高效学习计划
- matplotlib + pynimate,轻松让数据动起来!
- 王炸!DeepSeek彻底爆了!
- 碉堡了!用 DeepSeek 写了篇一区论文
- 90 后北大校友破解挂谷猜想,陶哲轩激动转发!网友:预定菲尔兹奖
- AI浪潮下,嵌入式开发的处境如何?
- 3月16日,百度文心大模型4.5即将发布,哪些更新值得期待?
- 大模型概念扫盲
- 傅立叶变换、拉普拉斯变换、Z 变换的联系是什么?为什么要进行这些变换?
- 何恺明ResNet级神作,分形生成模型计算效率狂飙4000倍!清华校友一作
- 各家都在吹的“端到端”到底是啥?
- 又一本开源免费的大模型书来了,449页pdf!
- 自顶向下的方式深度解读 DeepSeek-R1 Paper,内含大量细节
- 大模型推理过程与显存占用
- One More Thing带来的震撼
- 关于DeepSeek V3/R1 Decoding吞吐极限的估计
- YOLOv12论文详解:以注意力机制为核心的实时目标检测算法(附论文和源码)
- 零基础入门,DeepSeek微调的评测教程来了!
- 深度学习模型优化方法的技巧。
- 12强终极PK!第二届OpenHarmony创新应用挑战赛引爆开源热潮
- 智汇金陵 共探AI未来:开发者圈层沙龙·南京站圆满举行
- 活动报名|从「看不懂」到「会操作」,人物交互技术如何改变未来机器人
- 活动报名|Transformer²:自适应的大语言模型,SakanaAI
- 活动报名|CMU,海量实验解密大模型长链推理
- 再聊大模型的微调训练——指令监督微调SFT & 强化学习RL
- 1988场赛事炼成AI怪物!上交联合阿里MatchVision:足球解说比人类还丝滑,连C罗假动作都逃不过!
- 从 12s 到 200ms,MySQL 两千万订单数据 6 种深度分页优化全解析
- 图解KV Cache:解锁LLM推理效率的关键
- 南开提出1Prompt1Story,无需训练,可通过单个连接提示实现一致的文本到图像生成。
- CineMaster: 用于电影文本到视频生成的 3D 感知且可控的框架。
- 震惊!东京大学提出ARTalk!语音驱动3D面部动画大突破!
- Sam Altman:用户要求,永远别更新GPT-4.5
- 微软提出AutoGen Studio,用低代码方式开发智能体
- 速来!人工智能未来设计大赛·大模型专项竞技赛火热报名中!
- 杭州在六小龙之后,又开始投资北京六小虎了
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- CVPR满分论文:一块2080Ti搞定数据蒸馏,GPU占用仅2G,来自上交大“最年轻博导”课题组
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- AI三小时做的小游戏,9天赚12万!马斯克:AI游戏前景无限
- 标点符号成大模型训练神器!KV缓存狂减一半,可处理400万Tokens长序列,来自华为港大等 | 开源
- 阿里PC-Agent重构人机交互,精准拆解跨应用指令,自动化办公更进一步
- 性能无损,模型隐私保护效果提升50%!蚂蚁数科创新跨域微调框架| AAAI 2025 Oral
- 天翼云CPU实例部署DeepSeek-R1模型最佳实践
- 高通最新5G芯片,AI爆了
- RAG的下一形态?通义实验室:ViDoRAG!
- 微软LongRoPE v2:几乎无损的上下文扩展!
- 爆料!苹果大模型版Siri 推迟至2027年发布
- 这个Atom of Thoughts 的原子思维让GPT-4O-Mini 秒杀O3和DeepSeek-R1!
- AI 模型江湖谱by DeepSeek
- 2025首篇关于多模态大模型在富文本图像理解上的全面研究综述
- 瓦力算法2月第4周急招岗位| / 微信 / 万兴科技 / 斑马智行 / 上海AI实验室 / 寒武纪 / 影石360 / 小马智行
- DeepSeek 开源周第 6 天:DeepSeek-V3/R1 推理系统深度剖析
2025-03-02
- 可视化图解MOE大模型的7个核心问题:专家、路由、负载均衡及其用于视觉模态
- 聚焦前沿技术落地:大模型+知识图谱+RAG+文档智能下的老刘说NLP技术社区对外纳新
- 一句话让DeepSeek思考停不下来,北大团队:这是针对AI的DDoS攻击
- DeepSeek“理论利润率”545%,又要惊吓硅谷华尔街了
- LeCun世界模型再近一步!Meta研究证明:AI可无先验理解直觉物理
- 大规模自动化偏见与灌输
- Neuron:青春期饮食非常重要!研究发现关键神经环路调控青春期发育,与饮食息息相关
- 开源创意点亮生态未来 | 第二届OpenHarmony创新应用挑战赛圆满收官
- DeepSeek公开利润率引两公司创始人互怼;Kimi最新模型曝光,k1.6登顶?494人年入过百万,出海大公司壕又卷|AI周报
- “前端已死”是危言耸听吗?
- DeepSeek R1也会大脑过载?过度思考后性能下降,少琢磨让计算成本直降43%
- 微软原WizardLM团队:代码大模型WarriorCoder,性能新SOTA
- DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码
- 千万网友围观,两个语音AI开始加密通话,网友:中间真没骂我两句?
- ICLR 2025 | 机器人安灯泡、切东西都能拿捏,可操控轨迹跟踪的DexTrack来了
- AI已精,硬件何愚?
- 将越狱问题转换为求解逻辑推理题:「滥用」推理能力让LLM实现自我越狱
- 北京大学DeepSeek讲座:DeepSeek与AIGC应用
- 零基础入门:DeepSeek微调的评测教程来了!
- 小米汽车校招薪资爆料清单来啦!
- IBM中国投资公司停运,1800员工一夜失业!一个时代的落幕。。。
- YOLOv12入门教程
- 关于大模型,普通人最大的机会在Agent
- 吴恩达最新项目,玩转PDF
- 配色工具,数千类colormap供选择!
- 从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
- 裁员 1800 人。。。
- 价格近 DeepSeek 的三百倍!GPT-4.5 深夜炸场,奥特曼直呼 GPU 供不应求
- 领导找你谈话,这6句话表面关心,实则敲打
- YOLOv12论文详解:以注意力机制为核心的实时目标检测
- MIT三人团队:用Transformer解决经验贝叶斯问题,比经典方法快100倍
- 最新最全,大模型简史整理!从Transformer(2017)到DeepSeek-R1(2025)!
- 漫画趣讲,为啥大模型按Tokens收费?和API调用、订阅收费区别?
- LevelRAG:突破查询重写瓶颈,提升混合检索效果
- CineMaster: 用于电影文本到视频生成的 3D 感知且可控的框架。
- 多模态图像生成模型Qwen2vl-Flux,利用Qwen2VL视觉语言能力增强FLUX,可集成ControlNet
- 北航 | 第一个多功能即插即用适配器MV-Adapter:轻松实现多视图一致图像生成。
- 浙大 | 腾讯 | 华为提出视频生成框架VideoMaker,可由参考图实现Zero-shot定制化视频生成。
- Magic Mirror:可从单个参考图像生成电影级质量身份一致性和自然运动视频
- 超级智能“试衣镜”!GarDiff:高保真保持目标人物特征和服装细节,虚拟试穿技术新SOTA!
- 港大&Adobe提出通用生成框架UniReal:通过学习真实世界动态实现通用图像生成和编辑。
- 面试官问:如何克服神经网络训练中argmax的不可导性
- Github热门项目周报 | 第9周
- 3月2日周日 | 每日一图
- 3月2日周日 | Python热门项目
- 3月2日周日 | Github今日热门
- 实测腾讯元宝电脑版:搭载满血版DeepSeek,装上就是AI PC
- 360AI推出DiT架构下”省钱版”ControlNet, 参数量骤减85%性能达到SOTA!
- 真·用DeepSeek做生意!在沙漠造雪场,给详细BP那种丨阿里国际站首个产业级应用
- 学术圈炸了 这些SCI期刊投稿1个月录用 绿色通道来了
- Figure AI CEO 透露与 OpenAI 分手背后的原因
- LangGraph全新4大预构建Agents框架登场
- 单智能体-企业员工AI助理
- FlexTok-一种图像编码新方式
- 大模型中的提示词(prompt)压缩:让每个Token都物尽其用
2025-03-01
- Agent or SFT or RL ? 9个多模态R1推理开源项目核心思路解析
- Transformer结合特征融合依旧可以卷!来跟着斯坦福学习怎么创新!
- 科幻小说中的硅基生命,就要实现了吗?
- 我们是否在无意中构建了一个行星大脑?
- 核聚变发展委员会:《核聚变,确保21 世纪美国的主导地位的关键技术》
- 刚刚,DeepSeek 突然公布成本利润率高达545%!做 AI Infra 的该慌了?!
- 消失的 Cortana,桀骜不驯的 OpenAI?
- DeepSeek一天能赚多少钱?官方突然揭秘V3/R1推理系统,成本全透明
- 16G显存4499元起香爆!AMD RX 9070系列显卡震撼发布,游戏、AI性能狂飙
- 大模型是否有自知之明?新研究发现LLM可以知晓自己的知识范围
- ICLR 2025|AI不语,只是一味根据人类意图推理3D空间定位
- AI 解决百万步数学问题
- “AI论文”,撤销学位!
- 最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)
- 惊呆了,DeepSeek全面开源V3/R1推理系统!成本利润率高达545%
- 全球顶尖大学,成立人工智能学院!9月开始招生
- DeepSeek突袭公布V3 / R1 完整推理系统!!
- 用 DeepSeek 2小时搞定一篇论文初稿(全流程攻略)!附 20 个论文高阶提示词!
- 多所 985 明确:不提供宿舍!
- 刚刚 GPT4o、Claude 彻底开放了!
- 手把手教你驯服DeepSeek-R1!部署+测试+性能优化万字全攻略
- 突发!总部已封楼!知名智驾公司突然解散,高管激烈内斗
- 【Linux】Ubuntu的一些高(sao)效(cao)率(zuo)工具
- DeepSeek“第6弹”:DeepSeek-V3 / R1 推理系统概览
- DeepSeek-R1模型部署全解析:从1.5B到671B,硬件需求与适用场景详解!
- 高分辨目标检测创新,跨切片 NMS,视觉Transformer革命!
- 浙大提出LightThinker: 新思考压缩术, 砍掉70%内存,省时26%,准确仅降1%
- 用大语言模型智能体探索霍曼斯社会交换理论
- 6 大 RAG 知识库PDF文档处理神器对比,谁才是你的最佳选择?
- 【内推】蚂蚁数字医疗健康事业部火热招聘!
- 4.2K+ Star!olmOCR:一款开源的高性能OCR工具
- 3月1日周六 | 每日一图
- 3月1日周六 | Python热门项目
- 3月1日周六 | Github今日热门
- Claude 3.7成精了!偷偷将OpenAI模型换成自己,卡帕西:迄今最好笑的一趴
- 字节视频生成新突破!Phantom搞定多人物/主体一致性
- DeepSeek突袭公布成本利润率:545%
- DeepSeek开源周,第六弹, R1推理系统设计,API利润率达到545%!
- OpenAI 爆正与 1000 名美国国家实验室科学家合作,要搞大事情?!
- Claude 3.7发布后,Anthropic CEO 首次访谈:Claude 4、AI安全、AGI、人类文明
- 冲,DeepSeek-R1/V3推理系统架构设计被开源了~
- DeepSeek 开源周第 5 天:3FS,深度探索数据访问的强劲助推器
2025-02-28
- R1-Think能力如何用于RAG及多模态场景?Rank1及R1-Onevision实现思路解析
- SHAP可解释性竟然还能做聚类分析?11个结合idea带你一网打尽顶会顶刊!
- 喜提Nature正刊!小样本机器学习突破性新方法来了!
- 今日开源(2025-02-28):LLaDA,8B大语言扩散模型,全新掩码扩散方法,媲美LLaMA3,突破自回归限制
- 【源头活水】再次颠覆学界想象,何恺明发表新作:扩散模型不一定需要噪声条件
- 【他山之石】DeepSeek模型在中文语境下的安全性评估
- 【源头活水】DeepSeek开源周首日发布FlashMLA,将英伟达H800 GPU性能发挥到极致
- 【他山之石】DeepSeek、OpenAI视觉推理到底哪家强?MME-CoT:全新推理Benchmark,全方位理解LMM
- DeepSeek 之后,程序员将分为三类…… | 万有引力
- Nature:人类染色体正在以惊人速度进化!
- DeepSeek-R1后又一推理训练里程碑:用递归重构Transformer
- OpenAI推出GPT-4.5:最强知识型模型,“AI味”、幻觉大幅减少
- 谷歌发布最强「科研辅助神器」!能帮你提新idea,三大真实场景实证
- 小白学大模型:训练400倍加速的嵌入模型
- GPT-4.5 发布!OpenAI 史上最大最贵也可能是最慢那个,全网都在骂大街啦
- 7天完成1亿增长!超级产品DeepSeek高效使用全攻略
- 不用英伟达严选?DeepSeek最新开源项目再刷新认知,为何被赞“颠覆存储架构”
- 腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线
- 不被 AI 取代的工程师,是什么样的?| 直播预告
- 刚刚,GPT-4.5问世!OpenAI迄今最大、最贵模型,API价格飞涨30倍,不拼推理拼情商
- DeepSeek开源周最后一天:让数据处理「从自行车升级到高铁」
- ICLR 2025 | 让大模型更懂时序的语境对齐来了!性能更优开销更低
- 开源的胜利!RISC-V与AI今日全面「会师」
- Karpathy更新AI科普视频,网友:原本周末打算结个婚,改看视频了
- 谷歌发布BIG-Bench超难基准:DeepSeek-R1得分6.8,只有o3-mini超过10分
- ICLR 2025|浙大、千问发布预训练数据管理器DataMan,53页细节满满
- MIT三人团队:用Transformer解决经验贝叶斯问题,比经典方法快100倍
- 探索跳跃式思维链:DeepSeek创造力垫底,Qwen系列接近人类顶尖水平
- 每小时处理80,000个蛋白质,大卫·贝克、微软等发布Seq2Symm,实现蛋白质对称性精准预测
- 如何准确观察小胶质细胞在三维脑组织中的动态?DeepCellMap给出答案
- 无需侵入,一键重构细胞「电活动」,AI革新药物心脏毒性评估
- 一个半月内加速药物设计,浙大侯廷军团队提出深度先导化合物优化AI新方法
- DeepSeek严选 | 未来十年最值得报考的十大专业,选对赛道逆袭人生
- 【深度学习】彻底搞懂,Transformer !!
- DeepSeek-R2被曝5月前发布!
- 奔驰中国裁员15%,赔偿N+11?最新紧急回应
- 梁文锋和杨植麟,论文撞车了!!
- 【论文鉴赏】机器学习助力肺移植:多站点生物标志物预测原发性移植物功能障碍的创新研究
- DeepSeek 开源周,完结,撒花
- DeepSeek-R1之后,别琢磨优化提示词了
- 详解Python matplotlib坐标轴
- CVPR2025结果出炉!这些方向杀疯了!
- 2025,LLM 突然一夜封神!
- CVPR 2025 录用率 22.1%,LeCun 中奖!大模型参评,审稿人 19 篇论文被拒
- 曝 GPT-4.5 本周空降!1T 激活参数,120T 训练数据,会吐出阶段性思考成果然后继续思考
- 德国莱布尼茨研究所(ISAS)招收“机器视觉/多模态大模型”博士
- CVPR终于放榜,审稿新规第一年,录取率新低!
- DeepSeek-R2被曝5月前发布!
- DeepSeek,又杀疯了!
- 面试官让我讲一下DeepSeek-VL2的细节
- R1爆火之后,思考到底什么任务适合用RL做?
- DeepSeek-R1 解读及技术报告中文版
- 12强终极PK!第二届OpenHarmony创新应用挑战赛引爆开源热潮
- 刚刚,GPT-4.5重磅发布!
- 特色模型开源!飞桨PP系列新成员PP-FormulaNet助力大模型科研数据构建,公式识别提速16倍
- AICA南京招募专场来了,探讨技术革新下AI架构师的培养与机遇
- 突破瓶颈:推进长上下文 LLMs 的发展 (KIVI & Self-Extend) - Zirui Liu 明尼苏达助理教授
- SafeRAG:首个中文RAG安全评测基准,全面揭示数据注入风险
- DeepSeek开源周 Day05:从3FS盘点分布式文件存储系统
- 浙大提出视频生成方法VidSketch:可从手绘草图和简单的文本描述生成高质量视频动画。
- NVIDIA提出新框架ImageRAG!RAG+AIGC提升图像生成质量!
- 电商领域利器来了!港大&阿里提出MimicBrush,可模仿参考图进行零样本图像编辑。
- Meta提出Fast3R!多视角快速3D重建新SOTA!
- 盘点10大国产数字人平台,让AI分身替你高效干活!
- 【智谷要闻】AIGC智谷携手中国小商品城集团助力数字经济高质量发展
- 【智谷应用】科技未来——智谷AI
- 【行业动态】DeepSeek 开源周,微软发布首款量子芯片Majorana 1
- 【AIGC应用】3月推AI PC新品,硬件配置曝光
- 306-A1|多概念个性化,草图到图像,基于f散度分布匹配的一步扩散;AI生图质量评估,概念擦除综述,版权侵权识别缓解,水印去除
- 306-A2&3|基于LLM智能体的逼真3D世界创建与定制;硬件友好静态量化用于视频DiT后训练量化,基于LVLM的生成视频检测
- 306-B1|VLM基准测试,视觉描述基准;视频流事件理解,大规模多模态音乐符号理解数据集;多模态图文表示模型的可解释性
- 306-B2|视频长字幕生成,自我中心会话智能体;神经BRDF,跨模态3D场景理解,消费级设备上大规模3DGS实时高保真渲染
- OpenAI发布GPT-4.5:功能非常特殊,推理很贵
- 英伟达发布天气模型CorrDiff,预测效率大涨
- GitHub Copilot 精彩继续:探索基础架构与企业级管理新篇章!
- 推理模型爆火,阿里国际站拿出了第一个产业应用:做外贸
- 微软开源创新框架,自动优化大模型提示引擎
- 刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会
- DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 90后北大校友破解挂谷猜想,陶哲轩激动转发!网友:预定菲尔兹奖
- 如果GPT-4还只是阿米巴原虫,未来的霸王龙会是什么样?| 赫拉利《智人之上》
- 无需训练让扩散模型提速2倍,上交大提出Token级缓存方案|ICLR‘25
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 一句话让DeepSeek思考停不下来,北大团队:这是针对AI的DDoS攻击
- 蒸馏任何深度,仅用少量无标签数据就能实现单目深度估计新SOTA
- DeepSeek开源周,第五弹, 3fs来袭~
- GPT-4.5 的意义在于,宣告了一种 AI 范式的结束
- 惊爆!研究发现DeepSeek训练数据中藏有12000个活跃API密钥!
- 突发,GPT-4.5发布来袭~
- HippoRAG 2发布,GraphRAG退位~
- DeepSeek开源周第四天:优化并行策略引领AI训练新纪元
- 凌晨4点OpenAI重磅发布GPT-4.5:AI 进化的新里程碑
2025-02-27
- 从DeepResearch system card看若干实现细节:兼看近期多模态大模型进展
- 字节搜索算法工程师社招一面
- 今日开源(2025-02-27):ENEL无编码器3D大语言模型,7B参数超越shape-llm,高效处理点云数据与语义特征提取
- DeepSearch 与 DeepResearch 的设计和实现
- 斯坦福大学《2025年新兴技术评论:十项关键技术及其政策影响报告》
- 马斯克“点赞”的AI趋势解读:OpenAI已被追上,微软撤退了,“推理时代”巨型数据中心只需2-3个
- AI对决:豆包与DeepSeek,谁才是你的智能“真命天子”?
- Deep Research:AI如何秒变研究专家?
- 被Github 上的Stable Diffusion 坑惨了?失业、欠帐、恐慌,工程师怒喷:AI软件毁了我!
- 英伟达“赚钱机器”更强了!盈利创纪录,黄仁勋:DeepSeek 为 GPU 降本,但下一代模型还离不开我
- 斥资2.2 亿美元,MongoDB又收购一家AI公司
- DeepSeek一口气开源3个项目,还有梁文锋亲自参与,昨晚API大降价
- MLSys’25 | 极低内存消耗:用SGD的内存成本实现AdamW的优化性能
- HumanUP:从机器人自主起身到contact-rich locomotion任务的讨论
- 不要自回归!扩散模型作者创业,首个商业级扩散LLM来了,编程秒出结果
- 微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B
- 研究多模态?快来申报这个基金
- ICLR 2025 | 西湖大学提出闭环扩散控制策略,高效与闭环兼得
- CVPR 2025有作者用AI生成审稿意见,被发现了,论文也被拒了
- 无编码器架构潜力或被低估,首个无编码器3D多模态LLM大模型来了
- 智能体或带来灾难性风险,图灵奖得主Bengio指明新路径Scientist AI:世界模型+推理机
- 用「完形填空」的思维生成蛋白-分子复合物,西湖大学等发布CBGBench助力药物设计
- AI改变世界的6种方式:微软AI助力农业、生态、医疗、气候、教育等领域
- Transformer架构+分子网络,MIT模型解码癌症系统生物学
- DeepSeek 本地部署指南(基于 vLLM)
- 深夜举报信引爆南师大:副院长出轨女博士背后,权力与道德的致命纠葛
- 浙江大学校长杜江峰,已任教育部副部长
- 姚班天才创办的大模型公司,卖了
- DeepSeek 开源大杀器!压榨GPU极致性能!
- 【机器学习】数据降维技术:何时使用,何时避免?图解+Python代码实例
- 实测,阿里最新推理模型Qwen2.5-max可否与DeepSeek一战?结果统统被Claude-3.7碾压了
- SHAP模型可视化:让机器学习模型不再是黑箱,附完整部署指南
- DeepSeek模型在中文语境下的安全性评估
- 55个热力图heatmap代码模版~
- 刚刚!DeepSeek-R1 满血版,来了!
- Matlab太难,已过时?
- 文图生视频双杀!阿里深夜开源Wan 2.1四大模型,性能超Sora
- BAT出来,能不能在小公司通杀?
- 再度封神!连发3篇国际顶刊,审稿人直夸没问题!计算机视觉领域迎来史上重大突破!
- DeepSeek装进VSCode,编程非常丝滑!
- 目标检测算法是如何生成正负样本的
- DeepSeek接入个人知识库,保姆级代码实战教程!
- AI视觉产品研发,成本如何分析?如何省钱?
- 当「AI浪潮」撞上掌舵者野心:谁在重新制定行业规则?
- 开学后的我:精神状态良好!
- DeepSeek开源周 Day04:从DualPipe聊聊大模型分布式训练的并行策略
- 理想汽车提出LDGen!颠覆多语言图像生成的革命性突破,美学与精准度的双重飞跃!
- [ComfyUI]阿里WanX2.1:最强开源视频模型易主!静待社区生态开源直逼闭源,Vbench榜首第一
- 国科大提出SayAnything!高保真语音驱动说话人视频生成神器!
- 深度长文|一文读懂多模态大模型:强化学习技术全面解读 SFT、RLHF、RLAIF、DPO
- DeepSeek 开源周(三):DeepGEMM 性能实测及 NV 往事
- 面试官问:为什么深度学习需要tensor 而不是numpy array?
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 10个DeepSeek王炸组合,用好AI助你效率翻倍
- 苹果开源通用视觉模型:创新训练方法,超1000颗星
- 道琼斯将AI市场,扩展近5,000家企业
- DeepSeek开源优化并行策略,提升训练和通信效率
- 微软AI技术进阶课第4期【文档智能技术】,锁定3月1日20:00-21:30~
- 英伟达创纪录财报回应DeepSeek:全年营收9500亿,Blackwell刚开卖就贡献800亿
- 曝GPT-4.5本周空降!1T激活参数,120T训练数据,会吐出阶段性思考成果然后继续思考
- DeepSeek今日连开3源!针对优化的并行策略,梁文锋本人参与开发
- 摆脱编码器依赖!Encoder-free 3D多模态大模型,性能超越13B现有SOTA | 上海AI Lab港中文等团队新作
- 3500元,人形机器人1:1复刻人类动作 | 上海AI Lab开源新成果
- 机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天
- 语音合成也遵循Scaling Law,太乙真人“原声放送”讲解论文 | 港科大等开源
- 火山引擎AI一体机DeepSeek版来了!开箱即用,小时级部署,还有大模型应用经验加持
- Claude 3.7登顶编程竞技场,大幅领先100分!最新布料模拟实测再惊艳网友
- 任意Prompt就能给大模型实时排名!竞技场新玩法,还能自动找最佳AI来作答
- 大模型训练或无需“纯净数据”!北大团队新研究:随机噪声影响有限,新方法让模型更抗噪
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- DeepSeek开源周,第四弹, 一次性开源3个项目!
- DeepSeek 开源周第四弹:双向流水并行与专家并行负载均衡器!一次开源三个项目!
- 离谱!网友上传了27年前的VB游戏的EXE文件后,Claude在5分钟内用Python一次性完成了游戏重建!!——从二进制
- 震惊!DeepSeek R1 被外国研究者指责具有「双面AI」的中国立场?!
- 聪明人已经抓住DeepSeek风口发表SCI了
- DeepSeek开源周第三天重磅推出DeepGEMM
2025-02-26
- 近期RAG误区再认识及Claude3.7的混合模型推理机制解析
- 讲透一个数据挖掘神器:LightGBM !!
- 今日开源(2025-02-26):Wan2.1,14B参数视频基础模型,支持中英文、多视频任务,高效处理1080P视频
- ICLR 2025|高达 128 倍下采样的 Autoencoder!DC-AE:高效加速高分辨率扩散模型
- 生成理解统一模型解读 (一)|Transfusion:只用一个模型搞定图像生成和理解任务!
- DeepSeek面试通关|MLA如何让推理效率飙升200%?
- 【他山之石】LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升
- 放弃agent,图灵奖得主Yoshua Bengio提出Scientist AI:避免人类生存威胁
- 大语言模型简史:从Transformer(2017)到DeepSeek-R1(2025)的进化之路
- 重新认识“人性”?《科学》新发现:老鼠也有“救人”本能!
- Cell || 综述:如何创建虚拟细胞的新时代,人工智能带来的机遇与挑战
- Kaggle赛题解析:使用大模型绘制SVG图像
- 民间大神魔改4090 48G秒杀5090!老黄显卡炒作被打脸,“最失败50系显卡”也支棱不起来了?
- 超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!
- 英特尔推出全新至强 6 性能核处理器,AI 处理性能提升 2 倍
- 开源的风吹到视频生成:阿里开源登顶VBench的万相大模型,一手实测来了!
- 重磅官宣!头部量化宽德投资入局科技型通用智能!
- DeepSeek开源通用矩阵乘法库,300行代码加速V3、R1,R2被曝五月前问世
- 何恺明带队新作「分形生成模型」:逐像素建模高分辨率图像、效率提升4000倍
- 500万TPM+20msTPOT,火山引擎用「AI云原生」重构大模型部署范式
- 今天,OpenAI Deep Research已向所有付费用户开放,系统卡发布
- 千帧长视频时代到来!MIT全新扩散算法让任意模型突破时长极限
- AI驱动的模拟科学家,涉及生理学、生物物理学、物理化学和量子力学多个领域,登Nature子刊
- Transformer革新药物研发:TRACER框架实现反应感知的分子设计与合成优化
- 仅凭单张2D红外图像,0.78秒内重构高精度3D温度场,南京理工团队提出TMTN用于可推广的三维温度预测
- 5 步玩转数据分析
- 知识蒸馏技术原理详解:从软标签到模型压缩的实现机制
- 从YOLOv5到YOLO11!改进有多大?
- 最全考研指南!全阶段实用经验,半个月的深度整理!
- 美中国籍博士生疑用AI作弊被开除 向校方提起诉讼要求赔偿
- 离谱:这所高校禁用 DeepSeek!
- 芯片设计之光:EDA顶会 DATE 2025最佳论文,南大&华为诺亚摘获!
- 机器学习预测肺移植后PGD患者分类,附论文图表复现Python代码
- Claude 3.7 Sonnet游戏里贪吃蛇惊现自我意识?发现自己是代码绝望崩溃
- 搭建完美的写作环境P15:小众但有用,Markdown网络图片上传Claude R2 图床
- AI技术狂飙突进,图灵奖得主Yoshua Bengio警告:Scientist AI才是安全与创新的平衡点!
- YOLOv12来了!还加入了Attention
- Transformer 王者归来,再登 Nature。。。
- 算力核爆!碾压YOLO系 | Fast-COS 横扫 BDD100K/TJU 双冠,边缘端实时推理,效率起飞
- Qwen 架构改造成 Deepseek,再复现 R1 计划
- DeepSeek开源周第三弹,仅300行代码,效果翻倍,DeepGEMM小而强大
- 240个标签页打乒乓?开发者用Chrome浏览器“整活”,网友:再玩内存要炸了!
- 服务端渲染的未来:2025 年的 5 大趋势
- 一个有趣的发现!大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠
- ICLR 2025|如何在ImageNet-1K上训练视觉基础模型?
- 孤立卡尔曼滤波(IsoKF):理论与解耦估计器设计
- 首届XLLM Workshop @ ACL 2025 征稿和公开任务
- DeepSeek-R2曝5月前上线!第三弹DeepGEMM 300行代码暴击专家优化内核
- SimpleVQA揭秘事实性问答新基准:对于看图问答,多模态大模型仍然任重道远!!!
- NExtLong|不使用长文档也能训练出来SOTA长文大模型!
- CVPR2025结果出炉!这些方向杀疯了!
- 清华开源KTransformers-让24GB显卡流畅运行满血DeepSeek-R1
- Llama-index 搭建合同条款审查系统
- MTEB 2.0升级有感–新世界的船,载不了旧时代的残党
- 长链推理相关论文速览
- deepseek开源第三弹 DeepGEMM
- 各厂家DeepSeek一体机,大盘点梳理(含配置、参考价、选型建议)
- YOLO再进化!MHAF-YOLO多尺度融合,检测性能飙升(附论文及源码)
- 12强终极PK!第二届OpenHarmony创新应用挑战赛引爆开源热潮
- 前沿多模态模型开发与应用实战第一期:多模态统一模型Janus解析与功能抢先体验
- 明日直播|模型死记硬背的推理路径,是真正的智能么?王梦迪组
- 教你1分钟给DeepSeek接入你的知识库
- DeepSeek开源周 Day03:从DeepGEMM看大模型算力提速的矩阵乘法
- CoT推理赋能文生图!港中文首次提出文生图的o1推理和inference scaling新范式。
- 开源版Deep Research,一句话创建Agent工作流帮你完成电脑上的复杂操作,股票分析也轻松实现。
- IC-Portrait:打造逼真个性化肖像的新纪元!
- DeepSeek将开启大模型免费潮?ChatGPT和文心一言相继宣布全面免费开放!
- DeepSeek 开源周(二):DeepSeek MoE 架构回顾和 DeepEP 性能实测
- 北大出手了!连发2份DeepSeek内部研讨资料,深度拆解提示词与AIGC实操(可下载)
- 303-A1|人类偏好对齐与测试时采样,个性化图像生成十年综述,球面密集文生图;无噪声条件化的去噪生成模型;评估NSFW内容消除
- 303-A2|记忆增强机制用于任意长度视频自回归生成,LLM协助的流行微视频生成;文本生成音频视觉说话头;从视觉序列生成自然语言
- 303-A3|组件对齐图生3D场景,均匀分数蒸馏文生3D;基于溅射引导扩散的NVS,基于部件的INR,非最优运输流用于点云生成
- 303-B1|多模态智能体基础模型,基于检索增强DPO对齐视觉语言,基于二次到线性蒸馏的仅解码器多模态SSM,多模态交错文档转换
- 303-B2|低级4D视觉感知通用架构;360度相机的大规模室内3D重建,无核神经表面重建;基于3DGS的零样本物理理解
- 305-A1.1|艺术风格元素图像编辑;解耦元素间元素内条件可控生成,相关性引导DiT高效可控生成;虚拟试衣;文生360全景综述
- 305-A1.2&A2|视频动态概念个性化,文生图奖励微调,资源受限边缘设备上的高效DiT,改进自编码器提高生成质量
- 305-A3|纹理化物体的再生形态变换,从多种提示生成形状与纹理;光滑表面逆渲染,音频驱动说话头;全身运动技能模块化
- 305-B|VLM超长文本生成,图表MRAG;PC复杂任务自动化,文本丰富图像理解;3D场景理解与编辑,深度信息提升GS几何准确
- 304-A1&2|多视觉概念图像生成,图像转可变长度1D“令牌”序列,文生几何图形;视频运动定制,运动图形动画,基于事件的帧插值
- 304-B|阿里千问2.5VL,CoT多模态推理;LLM辅助视觉皮层体素描述生成,视频字幕生成;多视角场景修补,多视角可分离重建
- 新突破!微软开源多模态AI Agent,通杀数字、物理世界
- 苹果投资5000亿美元,大力发展AI基础设施、芯片等
- 医疗AI助手OpenEvidence获7500万美元,估值10亿美元
- GPU效率暴涨!DeepSeek开源DeepGEMM,仅300行代码
- 免费获取微软《AI + CX 转型实战指南》!营销、销售、服务难题迎刃而解~
- DeepSeek开源第三弹:V3/R1训练推理关键秘籍,核心代码仅300行
- 宇树机器人大秀中国功夫,央视点赞!
- 何恺明开辟分形图像生成新范式!计算效率提高4000倍,首次实现高分辨率逐像素生成
- 阿里开源版Sora上线即屠榜,4070就能跑,免费商用
- 前端程序员请注意!首个截图就能生成现代前端代码的AI来了 | 已开源
- 多模态大模型对齐新范式,10个评估维度全面提升,快手&中科院&南大打破瓶颈
- 2025,见证更多GenAI应用落实!今年的中国AIGC产业峰会来啦
- 姚班天才创办的大模型公司,卖了
- 识别高分低能,综合性视觉语言理解新基准,五项挑战评估多模态模型的推理能力
- “Transformer就像燃油车,attention-free才是新能源” | 对话RWKV创始人彭博
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 为何说“在国内做科研,最忌讳踏实”? 核心期刊发表小窍门
- DeepSeek开源周,第三弹, DeepGEMM来袭~
- 一个例子,说明Claude Sonnet 3.7 有多强
- DeepSeek 开源周第三弹:DeepGEMM!一文详解
- 刚刚,微软多模态Agent,硬核开源…
- 大模型面经:目前不同阶段的scaling law之间的区别和联系是什么?
- DeepSeek再次重磅开源DeepEP:开源世界里的 AI 通信 “新引擎”
2025-02-25
- Claude 3.7、QwQ-Max-Preview等推理大模型发布跟踪:兼看大模型逻辑推理技术总结及几点思考
- 结合创新!小波变换+Mamba性能爆炸,妥妥顶会&顶刊神器!
- 今日开源(2025-02-25):TinyR1-Preview,32B推理模型,数学表现超越70B模型,5%参数接近完整R1性能
- 编码能力超 DeepSeek R1、o3-mini!全球首个混合推理模型 Claude 3.7 Sonnet 重磅发布
- 剑指OpenAI,Anthropic推出全球首个“混合推理模型”,最新估值615亿美元
- 深度求索DeepSeek究竟有多具有颠覆性?斯坦福AI创新研究院
- 《自然》测评大模型:全能型or牛马型?你用的AI什么型?
- 清华孙茂松教授:现在正是AI4S的黄金时期
- 小白学大模型:训练大语言模型的深度指南
- 中文比R1丝滑、玩宝可梦还贼溜?全球首个混合推理模型Claude 3.7 Sonnet太惊艳,网友直呼“孤独求败”!
- DeepSeek 等浙大系创业者的组织文化密码是什么?
- 全球首个混合推理模型:Claude 3.7 Sonnet来袭,真实编码力压一切对手
- 刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!
- 2025 WAIC 云帆奖开启全球报名:集青年之智共铸 AGI 未来
- 仅靠逻辑题,AI数学竞赛能力飙升!微软、九坤投资:7B小模型也能逼近o3-mini
- 超越DeepSeek-ProverV1.5!豆包首个形式化数学推理模型BFS-Prover来了,直接开源
- 从零开始自主「起身站立」,上海AI Lab发布最新控制算法,机器人:起猛了
- Transformer作者之一Niki Parmar加入Anthropic,参与Claude 3.7 Sonnet研究
- 科学发现速度提高10倍?统计原则+智能体,斯坦福&哈佛提出自动化假设验证框架POPPER
- Science | 深度学习为3亿年的大脑进化提供了新视角
- 大语言模型的进步应该如何影响科学实践?科学家们给出了不同答案
- 推荐下载 | 数据分析师必备《2024 BI数据分析案例合集》
- 无偿捐赠5个亿!用于资助国自然博士生项目
- 吃瓜!211大学通报副院长涉嫌师德失范:取消其研究生导师资格!
- DeepSeek的多模态能力如此强大,为何科研人员还在手动处理数据?
- 图解机器学习:贝叶斯算法
- 【论文鉴赏】机器学习在老年医学中的应用全景:系统综述解读
- 地球上最聪明的编程大模型,Claude 3.7 来了,视频实战演示
- seaborn和matplotlib怎么选,还是两个都要学?
- 大模型下半场战争硝烟四起,AI进化论第二季开启 | 第一季DeepSeek十日谈精彩回顾
- AI也“耍赖”?DeepSeek R1和o1-preview被曝在棋局中「输急眼就作弊」!
- 熊孩子说「上学能不能实行 8 小时学习制?我太累了」,一下还把我问住了…
- 车机系统越来越多,我们该怎么办?
- Grok 3是否意味着大力出奇迹的大模型法则仍然成立?
- “45个高效Linux命令组合,可以解决99%日常运维需求!”
- 天选思路怎能不会!小波变换+CNN完美融合,最新idea发了CV顶会!
- 基于OpenCV的数字识别系统
- 阿里巴巴:2024年优化了 24940 人
- 2025年,当我们在谈论Agent的时候在讨论的到底是什么?
- Deepseek NSA 技术报告中英对照版
- 通义千问发布深度推理模型QwQ-Max-Preview
- DeepSeek开源FlashMLA评测,性能大幅提升
- 零基础入门,DeepSeek微调实战代码教程!
- 一网打尽!5大AI模型拆解!RNN、CNN、Transformer、BERT、GPT!
- 基于多级小波变换的多频率时序预测模型
- 飞桨科学计算技术上线国家超算互联网平台,AI+流体力学推动高精度计算效率提升
- 聊聊工程应用上模型训练的思考——Megatron-Deepspeed
- DeepSeek 被放弃了,阿里牛逼!
- AACL Chair选举进行中,港理工Prof, Wenjie Li为候选人之一!
- 从零开始绘制DeepSeek R1架构和训练流程
- 零基础入门:DeepSeek微调教程来了!
- 多模态大模型事实正确性评估:o1最强,模型普遍过于自信,最擅长现代建筑/工程技术/科学
- 通义千问发布深度推理模型QwQ-Max-Preview
- DeepSeek开源周 Day02:从DeepEP开源趋势重新审视大模型Infra
- 香港科技大学提出YuE:Suno级别开源音乐生成模型,支持中文!
- 马斯克疯了?Grok3 突然免费!还说让大家“用到服务器崩溃为止”
- 解决文生图质量和美学问题,字节跳动提出VMix:多维度美学控制方法,一键提升图像美学。
- 国科大提出SayAnything!高保真语音驱动说话人视频生成神器!
- Transformer Encoder/Decoder结构中的掩码Mask介绍?
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- Kimi+数字人,让AI帮你自动讲解PPT,还能在线回答问题!
- 302-A1.1|左提示引导用于多种视觉任务,多语言视觉文本渲染;理解与生成(多模态属性图,缩小能力差距);偏好对齐,提示对齐
- 302-A1.2|β自适应缩放CFG,无需CFG的模型引导;图像反演综述,解耦CLIP中类别与风格特征用于特定域生成,LDM水印
- 302-A2|主体一致视频生成,富表现力肖像动画化;动态潜在帧率VAE,离散流用于长视频生成;音频驱动唇形同步视频生成
- 302-A3.1|自动骨骼绑定,单目视频到4D,文本与姿态引导高斯人,日本俳句到3D场景;网格自回归形状细化,开放词汇室内场景
- 302-A3.2|从未校准稀疏视图前馈估计几何、外观与相机姿态,3D高斯修复;单视角人类扩散;逆向渲染材料建模;语音同步手势生成
- 302-B|视频MLLM与视频理解系列;开放世界3D物体识别,单图3D面部重建,3DGS水印
- 超过DeepSeek、o3,双思维模型Claude 3.7来了
- 谷歌提出Titans:突破算力限制,扩展上下文
- Together AI获3亿美元融资,扩大AI基础设施
- 刚刚,DeepSeek开源DeepEP,公开大模型训练效率暴涨秘诀!
- 首个混合推理模型Claude 3.7发布!编程能力全面领先,还能精准控制思考时间
- DeepSeek开源第二弹,为MoE和EP量身定制的通信库!暂和英伟达显卡绑定
- 阿里旗舰推理模型硬刚DeepSeek!官宣独立APP,发布公告AI亲自写
- 实测Claude 3.7:3200行代码一口气输出,物理规律手拿把掐,弱智吧已失守
- AI说书媲美真人!豆包语音大模型升级长上下文理解
- AI蛋白质设计前沿教程,AAAI’25三大机构携手4小时全面剖析
- 只给一张图,AI找到对应合适BGM,央音清华等构建全球化音乐信息检索新范式
- 花1699请DeepSeek当家教,值么?
- DeepSeek开源周,第二弹, DeepEP来袭~
- 满血版DeepSeek R1,天下武功,唯快不破!
- 用一个例子来通俗解释 DeepSeek 最新开源的 DeepEP
- 反超DeepSeek R1/o3,首个混合推理模型Claude 3.7 Sonnet发布~
- 阿里QwQ-Max 以及 Qwen2.5-Max即将开源
- 刚刚,高效部署DeepSeek R1的秘密被DeepSeek公开了~
- Deepseek开源FlashMLA:开启AI与GPU优化新篇章
2025-02-24
- 大模型开源及RAG用于综述写作进展:兼看mobile agent在应用场景选择上一些思考
- 显著超越现有SOTA!ChatVLA:实现统一的多模态理解与机器人控制
- 李飞飞多模态模型新作!实现动作与语言的统一理解
- 今日开源(2025-02-24):阿里国际Ovis2,多模态新突破,1B-34B参数支持视觉文本对齐,强化推理与多语言处理能力
- 【源头活水】刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中
- 【他山之石】ICLR 2025 | Spatial-Mamba:基于结构感知状态融合的高效视觉状态空间模型
- 【源头活水】DeepSeek开源周首日发布FlashMLA,将英伟达H800 GPU性能发挥到极致
- 【他山之石】DeepSeek模型在中文语境下的安全性评估
- 模型之战,DeepSeek R1 改写下一代模型研究的方向?| 万有引力
- AGI理论比较:主动推理、强化学习、控制论、贝叶斯大脑、效用决策、有限理性、情感动机、动态体内平衡
- 对话硅谷大佬马克·安德森:两家中国AI新秀如何改变游戏规则?
- 如何评价Ultralytics出的YOLOv11?
- 竞赛总结:Kaggle Santa 2024挑战赛
- 一群技术人拉横幅围堵 OpenAI,不禁 AI 就一直闹!
- 百万年薪招揽人才的故事还会在AI时代继续上演吗?
- 文末赠书 | 微信、百度都接入的 DeepSeek,企业靠啥玩转其私有化与垂直训练?
- 刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中
- 征稿|CVPR2025首届ViSCALE研讨会,探寻计算机视觉的推理扩展律
- 联手华为诺亚,南大LAMDA组获EDA顶会DATE 2025最佳论文
- 开源赛道太挤了!月之暗面开源新版Muon优化器
- 从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
- 扩散模型新突破!无需微调,就能高效稳定移除目标物体
- 稀疏注意力再添一员,华为诺亚推出高效选择注意力架构ESA
- 模型安全武装,复旦新研究实现SOTA扩散模型风险概念擦除效果,入选AAAI 2025
- 「知识蒸馏」+SFT,可得「推理」否?
- 速度提高40w倍,牛津新的ML策略计算蛋白的自由能扰动,助力药物发现
- 南京理工团队推出基于AI增强热力学建模预测3D场景红外辐射特性的新框架
- 阿里巴巴:2024年优化了 24940 人
- “80后死亡率突破5.2%”?错得离谱!
- 211大学官宣!11位管理岗人员转聘为辅导员,入事业编
- DeepSeek这波到底是不是风口?03年淘宝卖家还在担心“现在开店是不是红利没了”
- DeepSeek 开源第一天就亮剑,FlashMLA这张王牌太狠了
- 【火热征稿中-稳定检索】2025年计算机视觉、人工智能、物联网不可错过的EI会议!
- 超快,只需3秒!DeepSeek 最强版
- ICLR’25|MambaQuant:首个Mamba模型量化方案,无损精度
- 丘成桐任首任院长!顶尖大学成立新学院:8年制,每年招40人,毕业获博士学位
- 原来,这些顶级大模型都是蒸馏的!
- SHAP模型可视化:让机器学习模型不再是黑箱,附完整部署指南
- 智商测试,DeepSeek vs ChatGPT o3
- DeepSeek 开源周,一杀:极限压榨硬件性能
- Matplotlib可视化秘籍:从零基础到高级应用
- 为何说 “在国内做科研,最忌讳踏实”?
- 又水了一篇顶会!不知道博士咋毕业的,来看看我咋水的。
- 官宣:这所高校禁用 DeepSeek!
- 简单的Python调用C++程序
- 重大创新!DeepSeek R1方法成功迁移到视觉领域,多模态迎来新突破!
- 基于Pytorch的卷积算子的推导和实现
- 实测文心智能体平台满血版 DeepSeek R1 效果
- 各个平台都接入DeepSeek,等于都没接DeepSeek?
- 大模型概念、技术与应用实践(140页PPT读懂大模型)
- 活动|中国互联网协会人工智能工委会第五期AI智荟沙龙即将召开,探讨「大模型+具身智能」生态建设
- 明日直播|AI4Math,Meta科学家杨凯峪分享形式化数学推理
- 文献爆炸救星!SurveyX用LLM自动写综述!
- 增加内存会让计算机变快吗?
- DeepSeek开源周 Day01:从FlashMLA背后原理回顾KV Cache
- 魔发奇缘,3D发型生成新突破!TANGLED:可用任意样式和视点的图像生成 3D 发束
- 澳门大学提出DC-ControlNet!解耦控制条件!灵活性和精度超过ControlNet!
- 开源版Deep Research,一句话创建Agent工作流帮你完成电脑上的复杂操作,股票分析也轻松实现。
- 小红书提出新面部视频交换方法DynamicFace,可生成高质量且一致的视频面部图像。
- LuminaBrush 在图像上绘制照明效果的构建交互式工具。
- ComfyUI 迎来重大更新:原生支持 Lumina Image 2.0,解锁极致图像生成体验!
- 国科大提出SayAnything!高保真语音驱动说话人视频生成神器!
- DeepSeek 开源周(一):FlashMLA 在 H100 上的性能实测
- 面试官:Adam和AdamW有什么区别?
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 用AI“复活”历史人物火了,3分钟教会你全套制作流程!
- 论文简读 | ACM TIST 2025 | 综述 GenAI 与时尚 | 港理工、AiDLab
- 301-A1|自进化扩散高质量生成,区域自适应采样DiT加速;多指令图像编辑,自然语言指令引导编辑;视觉文本生成;双向扩散桥模型
- 301-A2&A3|阶跃星辰文生视频大模型,复杂相机控制图生视频;场景级3D外观迁移,LLM驱动CAD设计
- 301-B|多模态系列(指令微调数据集,偏好对齐,昆虫视觉理解,视觉推理基准);图像视频细粒度分割,DINO自监督学习,图像恢复
- 国外权威认证!DeepSeek超150万模型,成最受欢迎开源大模型
- o1模型医学推理惊人,超过人类医生
- 刚刚,DeepSeek开源FlashMLA,瞬间破1000颗星
- 赛前启航 | 微软 AI 开发者挑战赛三场指导直播联袂来袭!
- 5步助力企业破局!免费下载微软《AI 是未来趋势》报告
- “源神”DeepSeek!突破H800性能上限,FlashMLA重磅开源,算力成本还能降
- 全球最快AI视频生成火了,5秒让老黄马斯克拥抱,Made in China
- DeepSeek一夜把百度干回20年前,网友:还有这好事?
- 如何让大模型感知知识图谱知识?蚂蚁联合实验室:利用多词元并行预测给它“上课”
- Zero-shot重建物理高斯资产,清华&光轮视觉大模型让机器人理解物理属性|ICRA 2025
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- DeepSeek-R1秘籍轻松迁移,最低只需原始数据0.3% | 邱锡鹏团队联合出品
- 快检查你的5090!英伟达官方确认缺陷,部分显卡ROP短少,玩老头环受影响
- DeepSeek开源周,第一弹, FlashMLA来袭~
- DeepSeek开源周Day1,硬核发布…
- 基于 DeepSeek 从零构建 ReAct AI 智能体(文末含代码)
2025-02-23
- 再聊误区–Deepseek-R1思考过程在使用中的几个问题及对策
- 微软宣称量子计算取得突破,遭物理学家深度质疑,有撤稿历史
- 深度长文|AI 真的有所谓的“智能”吗?DeepMind 新论文给出了一个颠覆性的答案
- 代码论文全开源!月之暗面发布重磅技术报告:模型训练效率翻倍
- 重大突破!中国脑机接口性能提升216倍,能耗降低千倍,创全球最长稳控!
- WWW Cup 2025 SmartMem 内存故障预测竞赛Baseline
- 奥特曼婚后首晒娃,纳德拉祝贺;AI 硅胶娃娃爆火,不续费变“哑巴”;黄仁勋首度回应 DeepSeek 冲击|AI周报
- “2025 年将成 Python 主导 AI 领域的最后一年”
- DeepSeek估值暴涨,昔日的AI明星独角兽企业们怎么样了?
- 人刚毕业,代码一点不会,他纯靠ChatGPT写APP,年入千万美金
- 3倍提速!现在你跑不过机器狗了,限制波士顿动力机器狗的竟然是电池功率?
- ICLR 2025|南洋理工大学AvatarGO,探索4D人与物体交互生成新方法
- Bengio参与,扩散模型+蒙特卡洛树搜索实现System 2规划
- 8 个极其罕见但非常有用的 Python 库
- 论文鉴赏:利用机器学习预测脆性髋部骨折后一年死亡率——模型开发与内部验证
- DeepSeek解读,清华大学、天津大学、厦门大学哪家强?
- 放弃百万美金年薪去做大模型研发,我后悔了吗?后悔了
- 微软强大AI工具OmniParser,它能“看”电脑屏幕、“摸”界面,AI小白也能靠它让电脑自动干点活,省时省力!
- 手把手薅到 DeepSeek-R1 671B 满血版,白嫖真香!
- “3000万行C代码暂时不会消失,新内核驱动可用Rust写写看”,Linux二把手表态支持Rust!
- 宇树科技创始人王兴兴,浙江人,19岁造机器人,26岁从大疆离职创业,35岁参加民营企业座谈会。
- 再次颠覆学界想象!何恺明发表新作:扩散模型不一定需要噪声条件
- 完整DeepSeek-R1 671B本地化部署,详尽教程来了!
- 官宣:这高校禁用DeepSeek
- AI产品工程化中,如何提升AI算法系统的运行效率和性能?
- NExtLong|不使用长文档也能训练出来SOTA长文大模型!
- RAG检索增强生成技术进展 | 2024年相关论文总结
- 关于Grok3和DeepSeek背后苦涩教训引发的思考
- 300-A1.1|场景草图实例分割;风格特定内容生成,动态图像检索;物体定制化,可兼容服装搭配生成;优化文本编码器层实现存储高效
- 300-A1.2|文生图文化包容性;图像水印技术,数据记忆缓解,恶意概念检测,AI生图实时检测;基于流的生成模型,变分整流匹配
- 300-A2|多类型3D资产的无模板自回归绑定,图生3D的一致性问题,文本驱动3D人类生成;基于LLM的程序化3D形状抽象功能库
- 300-B|评估LMM CoT推理能力,无编码器架构3D LMM,评估物理概念理解能力;说话脸视频生成;人类稀疏重建,潜在辐射场
- 299-A1.1|图像到矢量草图生成,CTR驱动广告图像生成,视觉长文本图像生成的大规模数据集,偏好对齐用于图像生成与编辑综述
- 299-A1.2|身份特定隐蔽技术,生成内容的鲁棒水印;均值回归扩散的快速采样,改善不平衡数据文生图,无需蒸馏的一步扩散模型训练
- 299-A2|3D可控电影文生视频,视频重打光,光流增强相机控制,多概念个性化,角色视频生成;世界模拟器,关键步骤人类技能视频
- 299-A3&B|视频到4D生成,可重打光体积视频生成;评估6D空间理解能力;人类中心基础模型综述;自监督图像视频表示学习
- 左手天神右手乾崑,方程豹掀翻方盒子的「诺基亚时代」
- 还得是上海!百亿级大模型项目现场对接,只用3天
- 中科闻歌发布智川X-Agent平台、优雅音视频大模型更新,领先技术加速AI普惠落地
- 多模态大模型事实正确性评估:o1最强,模型普遍过于自信,最擅长现代建筑/工程技术/科学
- 月之暗面开源改进版Muon优化器,算力需求比AdamW锐减48%,DeepSeek也适用
- 当deepseek接管了直播间,董宇辉们可以失业了?
- 首篇多模态 RAG 全栈技术综述出炉~
- Kimi 模型,硬核开源…
- 深度探索:Deepseek-r1、Tavily 与 LangGraph 的推理和递归检索技术融合(文末含代码)
2025-02-22
- 如何选择合适的LLM做擅长的事儿?P2L微调大模型进行路由选择的实现思路
- 因果机器学习(CausalML)前沿创新思路
- 【源头活水】前沿论文 Arxiv’25 | COMO:基于跨模态Mamba交互与偏移引导融合的多模态目标检测
- 【他山之石】LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升
- Evo 2作者、斯坦福计算生物学家 Brian Hie:AI可发现人类无法看到的模式
- 黄仁勋:不要误读 Deepseek,AI 发展远未结
- 梅兰妮·米切尔|大模型和世界模型
- 《科学》重磅:从源头攻克帕金森病!复旦团队成功阻断毒性“种子”传播
- YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世
- 干完几星期家务,1X新款人形机器人亮相,和冰箱一样安静
- 地平线高阶智驾北京市区实测:全程零接管,轻松应对复杂路况
- 一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA
- Evo 2作者、斯坦福计算生物学家 Brian Hie:AI可发现人类无法看到的模式
- AI 生成的游戏模型,探索自由开发世界的创意实践
- 颜宁,拟获“全国三八红旗手”!
- 再次颠覆学界想象,何恺明发表新作:扩散模型不一定需要噪声条件
- 又一科学家回国,加盟顶尖985!曾参与研发3款苹果M系列芯片…
- 车企风云:5天,77位高管重大调整
- 生物领域的DeepSeek!Arc研究所、斯坦福等联合发布400亿参数的生物AI模型—Evo 2
- Hugging Face开源超大规模GPU训练实战指南!!3万字!!
- 11种 Matplotlib 科研论文图表教程(附代码)
- 差分卷积在计算机视觉中的应用
- Grok3 DeepSearch深度体验:Agent就是Reasoning Model
- DeepSeek R1 最新全面综述,近两个月的深度思考!
- 女朋友问我Qwen2.5-1M为什么那么长,我这么解释
- AI 艺术工具通讯
- 四个DeepSeek R1最新复现方案,进展汇总!
- 突发!知名智驾公司突然解散,高管激烈内斗,总部已封楼!
- 重新思考RAG的相关性:相似≠相关
- 论文生成器要失业?Meta开源「科研健身房」让大模型自己写代码做实验
- 基于unsloth高效复现GRPO
- MTEB 2.0升级有感–新世界的船,载不了旧时代的残党
- 免费才是王者?Grok 已冲到美区榜一!XAI 发布Grok3的详细介绍文章。
- Animate Anyone 2来了!角色动画与环境之间更具互动性,动画真实感和一致性更高。
- 谷歌推出PaliGemma 2 mix:用于多任务的视觉语言模型,开箱即用。
- 298-A1|风格矢量草图补全,基于区域草图提高文生图;光线感知材质迁移,内容风格解耦,揭示判别模型的潜在生成能力;隐私保护
- 298-A2.1|提升DiT视频生成时间一致与视觉质量,相机、物体与光照可控图生视频,高效视频生成,结合摘要技术的长视频转短视频
- 298-A2.2|自回归视频生成,加速与扩展视频DiT训练,调查AI视频在视频检索中的偏好;音频驱动肖像动画化,共语手势视频生成
- 298-A3|3D物体部件关节运动生成,单图合成数字人,物理感知3D4D生成综述;流蒸馏采样,大型摄影测量模型
- 298-B|探讨视频扩散之于视觉理解;GS转换为网格,单图生成HR多视角人物,边缘设备上实时动画化虚拟头部,稀疏视角多人体重建
- 实测医疗APP好伴AI:数字版三甲专家人人可用,AI医疗落地之路终于走通了?
- AI写代码新姿势:一个截图,代替千行代码
- 1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法
- DeepSeek、OpenAI、Kimi视觉推理到底哪家强?港中文MMLab推出推理基准MME-COT
- 我用Devin做的deepseek直播嘴替,让老舅成了福建董宇辉
- Deepseek还是Grok3?不如全都要!南洋理工联手IDEA提出多智能体路由方案MasRouter
- 智能体概念
- OpenAI Operator:开启智能代理新纪元
2025-02-21
- 大模型推理部署的几个基本认知及prompt压缩策略用于COT推理微调尝试
- 正在爆发!“LSTM+卡尔曼滤波”成论文新赛道!
- 强化学习+多目标优化,get到这种思路,发一区TOP就不远了!
- 今日开源(2025-02-21):WMP,基于世界模型的感知算法,迁移至宇树A1机器人,实现未来感知预测与精准控制
- 大模型在无人驾驶最有效的应用是什么?| Open AGI Forum
- 微软力推新视频游戏 AI 模型,超 10 亿张画面训练、相当于 7 年老玩家
- 基金委丨2024年国家自然科学基金人工智能学科项目受理与资助情况
- 小白学大模型:Unsloth 更快更省资源微调 (文末送书)
- 微软力推新视频游戏 AI 模型,超 10 亿张画面训练、相当于 7 年老玩家?开发者们:去他的吧!
- 大语言模型系统评估新框架:微观指标构建方法论
- 从 Twitter 到 X,掌舵近三年后,马斯克再以 440 亿美元估值寻求融资
- 第一个明星 AI 硬件将变成电子垃圾
- GitLab 及其高管屡遭起诉,原因是“误导性”人工智能炒作和价格上涨
- 踹了OpenAI后,Figure光速发布具身大模型Helix,能力前所未有、创多项第一
- 两万字长文深度解密DeepSeek-R1、Kimi 1.5,强推理模型凭什么火出圈?
- 出人意料!DeepSeek-R1用的GRPO其实非最优?规模化强化学习训练用PPO就够了
- 机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA
- 全球首个AI CUDA工程师来了!将PyTorch原生实现提速10-100倍
- 大模型扩展新维度:Scaling Down、Scaling Out
- 慢思考助力医学大语言模型突破数据瓶颈:上海交大联合上海AI Lab推出MedS3系统
- 清华大学AIR联合水木分子开源DeepSeek版多模态生物医药大模型BioMedGPT-R1
- 从概念到应用,清华团队开发DeepTFBU工具包助力基因表达精准调控
- 官宣:这高校禁用DeepSeek
- DeepSeek-R1第三方稳定性测试(API端):首批结果出炉!
- 985大学,撤销教务处
- DeepSeek放出重磅论文!梁文锋亲自参与!
- 腾讯:23张PPT搞懂DeepSeek核心技术!
- RAG 技术超全全景图从基础到高级实践
- 使用Cursor进行编程的黄金法则
- 热力图heatmap代码模版~
- matplotlib heatmap自由~
- 突发,Grok-3 免费上线!答对 9.11 和 9.9 谁大,1 分攻克 MIT 积分难题
- 刚刚 GPT4o、Claude 国内直接用!
- 官宣:硕博奖学金,涨了!
- 你需要知道的20个常用的Python技巧
- NeurIPS早早邀请审稿人!今年投稿量又要爆?
- EHCTNet:基于CNN和Transformer增强混合网络的遥感图像变化检测
- Qwen2.5-VL 技术报告英中对照版
- 清华刘知远教授解读 DeepSeek:大模型强化学习技术原理与大模型技术发展研判
- 开源社区 DeepSeek R1 最新复现进展汇总
- 飞桨星河社区实战指南:速通大模型API服务开发项目全攻略
- 聊聊华为昇腾体系下的大模型训练
- Qwen2.5-VL Technical Report!!! 操作手机电脑、解析化学公式和乐谱、剪辑电影等,妥妥六边形战士 !
- 大语言模型的‘自信’之道:如何在推理时选择沉默?
- 从零开始优化 RAG 流程的终极指南,解决检索增强生成的核心挑战
- 一起来学吴恩达新课《Transformer中的注意力机制:PyTorch的概念和代码实现》!
- 首个文字生成手语模型来了!SignLLM通过文字描述来生成手语视频,目前已经支持八国手语!
- 清华联合腾讯提出全模态模型Ola!图像、视频和音频等多模态理解一网打尽!
- Github热门机器学习笔记:「从零构建大型语言模型」
- 【AIGC智谷】重庆梁平区政府新型工业化专题培训班一行前往上海南翔高科技经济城-AIGC智谷
- 【智谷要闻】AIGC智谷赴上海交大人文学院培训中心开展“AIGC+DeepSeek”应用分享会
- 【AIGC应用】西安交通大学“交小智”
- 【行业动态】Grok3:马斯克发布号称全球最强推理模型,OpenAI公布GPT-4.5 和 GPT-5 最新路线图
- 297-A1.1|统一多模态理解与生成加速,材质迁移,概念融合,个性化,偏好优化;探讨儿童、成人与AI在创意绘画任务中的表现
- 297-A1.2|AIGC图像水印,AI生成媒体检测综述;统一扩散桥用于图像恢复,可逆引导一致性训练,无指导扩散用于少数样本生成
- 297-A2.1|视频个性化定制,VFX视效生成,基于指令的视频编辑数据集,文本驱动的长视频编辑
- 297-A2.2|角色图像动画化,高效视频DiT系列,评估文生视频的物理一致性基准;音乐表演中的音频-视觉问答
- 297-A3|高保真3D形状生成,几何可控室内场景生成,任意风格与视角图生3D发型;文本驱动人类动作生成,大型人类动作基础模型
- 297-B1|高效统一多模态变换器,空间推理及其基准,无需编码器的视觉语言模型;探讨视觉自回归的基本限制
- 297-B2|图像分割,MLP+傅里叶特征的INR,视觉表示学习;镜头链提示用于长视频理解,无线网络实时视频流,INR视频压缩
- 有望治愈癌症!微软开源新模型,诺奖级重大突破
- 前OpenAI CTO 成立思维机器实验室
- 微软发布创新大模型:一张图片就能生成游戏,游戏界ChatGPT来了
- 清华团队构建大型社会模拟器 AgentSociety ,可精确模拟社会舆论传播、公众政策响应等社会现象
- 断交OpenAI后,人形机器人独角兽首秀:一个神经网络控制整个上身,能听懂人话可抓万物
- 剧本自动生成3D动画!北航中大等提出新方法,破解多人交互难题 | ICLR 2025
- 刚刚,DeepSeek能看懂猫片了!腾讯混元加持
- 阶跃Agent生态首曝光:手机汽车IoT机器人全覆盖,千行百业唰唰落地
- OpenAI实名举报Grok3作弊,一题答64次踩着台阶和o3-mini比
- 单张3090让大模型“看”《黑悟空》,港大百度发布VideoRAG
- 视觉定位新范式!清华团队推出Migician,支持任意形式多图定位
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 火山引擎大气,DeepSeek白嫖攻略来了~
- unsloth杀疯了,3090即可训练超长上下文grpo!
- OpenAI:未受DeepSeek影响,周活用户已破4亿!马上推出GPT-5
- 瓦力算法2月第3周急招岗位|deepseek / / 微软 / 腾讯 / 网易 / 字节 / CETV / 叮咚买菜 / 岚图
- Grok-3:人工智能领域的新突破
2025-02-20
- R1强化学习策略用在多模态推理开源实现:兼看社区不可思议被侵权之遇
- 淘宝主站推荐算法工程师一面
- 今日开源(2025-02-20):Evo2 最大公开AI生物学模型,完整版高达40B参数,长达100万碱基对的上下文长度
- 李飞飞巴黎演讲:如果 AI 资源被少数公司垄断,整个生态系统都会完蛋
- “梁文锋、杨植麟同一天发论文,关注大模型的未来趋势“
- 微软宣布量子计算重大突破,但业内存在质疑
- AI的“随机性”挑战:它们比人类更“不随机”?
- 人类心智理论的起源 The origin of human Theory-of-Mind
- Kaggle 2025 NCAA篮球预测 Baseline
- 梁文锋、杨植麟同一天发论文“秀肌肉”,主题居然撞上了!下一代模型要来了?
- 量子计算里程碑!微软单芯片可百万量子比特,Nature研究爆火
- 复旦主导,中美等8个国家25家单位44名学者联合发布大模型安全技术综述
- 技术大神授课,百亿AI项目招标,2025全球开发者先锋大会等你来
- 物理直觉不再是人类专属?LeCun等新研究揭示AI可如何涌现出此能力
- 视频版IC-Light来了!Light-A-Video提出渐进式光照融合,免训练一键视频重打光
- 重磅发现!DeepSeek R1方法成功迁移到视觉领域,多模态AI迎来新突破!
- 再次颠覆学界想象,何恺明发表新作:扩散模型不一定需要噪声条件
- 史上最惊悚的机器人,看了让人睡不着,网友:像新鲜的尸体在抽搐
- 地表最强Grok3突袭免费体验,网友实测对比DeepSeek,发现中文彩蛋
- 预测所有物种DNA、RNA、蛋白质的形式和功能,Arc、斯坦福、NVIDIA发布最大AI生物模型Evo2
- 重建170万个细胞发育轨迹,支持多模态,AI绘制细胞时空图谱,登Nature
- 可独立提出科学发现、研发新药物?谷歌推出基于Gemini 2.0的科研助手AI co-scientist
- DeepSeek又爆了。。。
- DeepSeek R1 刷榜 Kaggle 数学奥赛挑战赛
- 实验室主任、华为顶尖科学家加盟双一流高校
- 马斯克还可以,“地球上最聪明的人工智能”Grok-3免费了
- 详解matplotlib隐式pyplot法和显式axes法
- 马斯克评价 DeepSeek:中国大部分时间都是世界最强国家,但……
- 2025年,转行嵌入式开发的新机遇…
- 力图取代iPhone的Ai Pin,被惠普以1.16 亿美元收购了核心技术!
- DeepSeek 创始人梁文锋厉害的个人经历。
- 基本的图像处理操作
- 一份微调YOLOv11的小指南
- 张俊林:Grok 3是否意味着大力出奇迹的大模型法则仍然成立?
- DeepSeek对大模型算法工程师的影响
- DeepSeek爆火,对大模型算法工程师的影响?
- 飞桨PP系列新成员PP-DocLayout开源,版面检测加速大模型数据构建,超百页文档图像一秒搞定
- 张拳石专访:深度学习需要一场自顶向下表征内观的科学革命丨独家
- 活动报名|攻克机器人灵巧操作,解锁手物交互任务的“宝藏”框架
- 港理工提出TokenSkip:让大模型在CoT中“跳”过冗余token,压缩40%,性能几乎不降!
- 注意力机制进化史:从MHA到MoBA,新一代注意力机制的极限突破!
- 谷歌推出PaliGemma 2 mix:用于多任务的视觉语言模型,开箱即用。
- DeepSeek们的成本,是怎么计算的?
- 2025年最好用的国产AI推荐,10大类30个工具全都整理好了(建议收藏)
- 296-A1.1|多LoRA多概念生成,多对象融合;图像隐含特征规则,理解复杂文本提示;任意风格迁移,文本引导编辑的追溯与识别
- 296-A1.2|统一多模态理解与生成,艺术美学分析;场景属性保留图像生成,NSFW视觉文本;fMRI跨主体视觉解码,面部解析
- 296-A2.1|基于流的图像视频生成基础模型,姿势引导DiT人类动作视频生成,DiT高分辨视频生成,资源受限移动设备文生视频
- 296-A2.2|DiT视频生成效率问题(滑动瓦片注意力,缓存与剪枝);高效高质量长音频生成
- 296-A3&B2|自回归动静态生长树生成;基于参考图像的无界场景修复,多视角场景补全,360全向GS重建,高速动态3D场景重建
- 296-B1|视频旋转位置嵌入;MLLM时钟与日期理解,探讨CLIP颜色编码方面的不足,关于AI辅助科学发现的综述
- 20年磨一剑!微软发布全球首个拓扑量子芯片,一夜改变半导体
- 高盛:DeepSeek等中国大模型,加速AI对全球GDP贡献
- Meta将举办首届生成式AI大会
- Nature认证DeepSeek成科研工具全能者,国内高校如何借力大模型?
- 手掌大小芯片碾压全球算力!微软量子计算核弹级突破,纳德拉:构建全新物质状态
- 简单示例提升DeepSeek-R1美国数学邀请赛AIME分数:以步骤为粒度对齐上下文学习与推理
- 小红书等给AI图像检测上难度!数据集均通过人类感知“图灵测试” | ICLR 2025
- 谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现,CEO皮猜也来站台了
- 比尔盖茨自述:中学时期就开始偷偷996写代码
- 安卓装DeepSeek就敢卖8999!最薄折叠?那没事了
- 复旦视频扩散模型综述:覆盖300+文献,探讨近期研究趋势与突破,Github揽星2k+
- GRPO简化Trick | 只改一个参数, 性能涨10%??
- VLM + R1,开源圈又炸锅了?
- 重磅!继Google Willow之后,微软宣布量子计算新突破!
- 微软开源OmniParser V2,直接将DeepSeek-R1变成使用电脑的 AI Agents~
- 务实测试:DeepSeek 各家 API 真实速度(附:测试脚本)
- Prompt Decorators:改善AI响应的简单方法(文末含代码)
2025-02-19
- RAG+的一些前沿动向:兼看长文本、投标写作以及R1可解释性的有趣探索
- 30个Python常用代码段
- 今日开源(2025-02-19):MoBA注意力机制,无参数Top-K门控机制,革新长上下文处理,高效LLMs新突破!
- 【源头活水】清华一作1B暴打405B巨无霸,7B逆袭DeepSeek R1!测试时Scaling封神
- 【他山之石】LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升
- 【他山之石】内容自适应 Tokenizer(CAT):提升图像 Diffusion Transformers 训练效能 !
- 【源头活水】前沿论文 Arxiv’25 | COMO:基于跨模态Mamba交互与偏移引导融合的多模态目标检测
- 让机器人像人类一样终身学习,突破性框架LEGION登Nat. Mach. Intell.
- Nature:危险的实验?携带人类基因的老鼠发出更复杂的声音
- 林大宇团队1年2篇Nature,分别揭示“认怂”和雄性“攻击行为”的神经调控机制
- 马斯克评价DeepSeek:中国大部分时间都是世界最强国家,但……
- 行业落地分享:KidsGPT有情感温度的智能体
- OpenAI 前员工们大闹硅谷!离职 CTO 卷走大半骨干创业、联创公开 37 页训练 PPT,还有现员工准备出走
- 发论文亲自上?创业十多年,DeepSeek梁文锋的“技术男”属性从没改变
- 最大参数 300 亿!阶跃星辰与吉利联合开源两款多模态大模型
- 最豪华大模型创业阵容!OpenAI前CTO组建,翁荔、Schulman等ChatGPT核心成员加盟
- DeepSeek V3+R1满血微调工具上线!一键启动,硬件要求降10倍
- Claude挣钱强于o1!OpenAI开源百万美元编码基准,检验大模型钞能力
- 清华团队构建大型社会模拟器AgentSociety,推动智能社会治理与研究范式变革
- ICLR 2025 Spotlight | 让城市「动」起来!DynamicCity突破4D大场景生成技术边界
- 撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布,代码也公开
- 国内外多所高校招聘教职/博士后/博士生/访问学生等
- OpenAI:强化学习确实可显著提高LLM性能,DeepSeek R1、Kimi k1.5发现o1的秘密
- 大模型强化学习新发现:删减84%数据反提升效果
- 深势科技张林峰:平台化科研入口雏形初现,玻尔赋能未来教育科研
- Nature推荐的大模型,现如今最好用的AI工具应当更好地助力科学研究
- AWS与纪念斯隆凯特琳癌症中心合作加速药物研发
- AI人速抢!科研党/企业党福音:秒级计费的GPU云平台,注册血赚150元券!
- 【深度学习】YOLO-HMC:一种改进的印刷电路板表面缺陷检测方法
- 困在“第一学历”里的博士
- 涨分30%!只需共享注意力分布
- matplotlib、seaborn又一个强力统计分析助手
- 史上最强!YOLOv11 系列杀疯了。。。
- DeepSeek 如何开启大模型的下半场战争|DeepSeek十日谈终结版
- 长达20年!复盘Linux之父对C++的「炮轰」史:C++究竟为何被“拉黑”?
- “裸辞后才发现,太用力是上不好班的”
- “自带电脑上班,不提供卫生纸”:盘点职场那些让人无法理解的降本增效
- ICLR 2025 高分论文!何恺明和刘壮提出:数据集偏差的十年之战
- CVPR 2025 NTIRE赛事 | 首届多场景雨滴去除挑战赛
- 在DeepSeek刷到‘学术孤儿’破防了!!
- 张俊林:从Grok 3看Scaling Law已死?
- 目标检测YOLOv12算法来袭,更高性能、更快速度!(附论文及源码)
- 通用信息抽取大模型PP-UIE开源发布,强化零样本学习与长文本抽取能力,全面适配多场景任务
- 在AI前沿,与青年同行 | 2025 青源学术年会
- DeepSeek公开NSA算法,长序列处理实现11.6 倍加速丨热门论文
- 推理步骤长度对大型语言模型的影响
- JAI | 图像+语音+文本多模态语法归纳
- 上海算法创新研究院大模型实习生招聘
- Test-Time Scaling 近期工作调研
- 硬件对齐+原生训练!DeepSeek NSA打造高效稀疏Attention
- 4w Star!一个低成本微调DeepSeek的开源方案,悄悄火了
- StepFun提出Step-Video-T2V!300亿参数视频生成大模型!可生成204帧视频!
- 腾讯优图提出首个基于DiT的高保真虚拟试衣算法FitDiT
- KTransformer:把 DeepSeek R1 推理机器成本打下来
- 只需一步!WPS接入DeepSeek R1满血版,让AI帮你办公写作处理文件
- 全球首测!OpenAI开源SWELancer,大模型冲击100万年薪
- 清华、中南开源3D交互实体AI Agent LEGENT
- 生成式AI营销平台Tofu,获1200万美元A轮融资
- 官宣!OpenAI前CTO新公司:北大校友翁荔加盟,创始29人2/3来自OpenAI
- ChatGPT后训练方法被OpenAI离职联创公开,PPT全网转~
- DeepSeek满血微调秘籍开源!站在巨人肩膀打造私有模型,一手教程在此
- 宇树机器人跳舞被疑AI合成,王兴兴发新视频自证,小红书:还是疑似AI合成
- Llama都在用的RoPE有了视频版,复旦上海AI Lab等提出长视频理解/检索绝佳拍档
- 2025,见证更多GenAI应用落实!今年的中国AIGC产业峰会来啦
- DeepSeek新注意力机制引热议!梁文锋亲自提交预印本,目标明确降低计算成本
- Kimi新论文再次“撞车”DeepSeek,都谈到了长文注意力机制
- 今年“诺奖风向标”来了一位华南农大校友
- 中国高温超导新突破登Nature,薛其坤院士领衔,南方科大成果
- 【手撕NSA】DeepSeek新作-原生稀疏注意力-超长文(附代码)
- MoBA vs NSA, Kimi第一个站出来和DeepSeek中门对狙!
- 刚刚,DeepSeek全新注意力机制NSA发布,超快速长文训练与推理~
- 大模型面经:SFT和RL如何影响模型的泛化或记忆能力?
- 利用 DeepSeek-R1 蒸馏模型结合 LoRA 和COT数据集进行高效微调
2025-02-18
- 值得一读之关于ktransformers的一些正确认知和若干细节问题
- CNN+Mamba+UNet,“三巨头” 合体!
- 今日开源(2025-02-18):Step-Video-T2V:30B参数,16x16空间和8x时间压缩,204帧高清视频生成
- 【他山之石】比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架
- 谈谈DeepSeek-R1满血版推理部署和优化
- 【他山之石】ICLR 2025 高分论文!何恺明和刘壮提出:数据集偏差的十年之战
- 开源大模型 DeepSeek 到底开放了什么?
- 20万张GPU!号称“地球上最聪明的AI”Grok-3来了,斩获多个Top1,网友:算力消耗是DeepSeek V3的263倍
- 如何提升大模型通用推理能力?DeepSeek最新论文《CODEI/O:通过代码输入输出预测凝练推理模式》
- 朱松纯:什么时候才能出现人工智能的“中国时刻”?
- 美国安全与新兴技术中心: 中国学界对大模型的批判性思考与通用人工智能的多元路径探索
- 中国已开始部署防御:应对8年后的小行星撞击威胁
- AI的“随机性”挑战:它们比人类更“不随机”?
- 20万卡吞金兽 Grok 3 炸裂登场,卡帕西大神亲测:性能超过DeepSeek R1!马斯克:短期不开源
- 春晚BOT扭秧歌的科技“秘籍” | 文末赠书
- 刚刚,Ilya被曝正筹资超10亿美元、估值超300亿美元,知名创投Greenoaks牵头
- 200多行代码,超低成本复现DeepSeek R1「Aha Moment」!复旦大学开源
- 接力DeepSeek,阶跃星辰直接开源两款国产多模态大模型
- 最强全模态模型Ola-7B横扫图像、视频、音频主流榜单,腾讯混元Research&清华&NTU联手打造
- 这届出题太难了!新基准让多模态模型集体自闭,GPT-4o都是零分
- 20万张GPU!马斯克掏出「地表最强」大模型Grok-3,排行榜登顶,复仇OpenAI
- 刚刚!DeepSeek梁文锋亲自挂名,公开新注意力架构NSA
- 自动化、高精度,告别人工测量!Meta SAM模型高效解析复杂纳米颗粒
- TOMG-Bench:大语言模型开放域分子生成新基准
- DeepSeek 打 Kaggle ?
- 最强合集!Python 数据可视化工具,你都用过哪些?
- 【打不过就加入】百度官宣:全面接入DeepSeek!
- 年仅32岁!又一青年大学教师因病逝世,自幼双亲离世……
- 用 DeepSeek 2小时搞定一篇论文初稿(全流程攻略)!附20个论文高阶提示词!
- 马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI
- Google DeepMind副总裁 加盟字节AGI
- 顶刊TIP 2025!北大&清华:多目标跟踪新方法和新数据集
- 马斯克太鸡贼了
- 这才是时间序列2025最好中稿的方向
- DeepSeek官方整理实用工具:14大类、100+种应用!
- 保姆级教程:30 秒部署 DeepSeek R1!供全民使用!
- 一网打尽!5 大深度学习模型!RNN、CNN、Transformer、BERT、GPT
- 特征选择的通俗讲解!
- 数字图像处理:边缘检测
- 开源中文DeepSeek-R1(满血)蒸馏数据集-110K
- ACL 2025投稿量冲击12000!如何9h打通顶会壁垒!
- 从DeepSeek R1论文,深入理解推理大模型!
- 厦大团队:大模型概念、技术与应用实践(140页PPT读懂大模型)
- 边缘端目标检测算法,碾压YOLO系,横扫BDD100K/TJU 双冠,效率起飞!
- 马斯克全新发布Grok3模型,坐拥20万张卡的新王!
- DeepSeek最新成果!
- Grok 3发布!性能超过DeepSeek R1!
- 开发者沙龙·南京站 | 大模型深度应用与产业融合报名中
- 聊聊SFT微调训练——如何训练更强更低成本的推理大模型
- Animate Anyone 2来了!角色动画与环境之间更具互动性,动画真实感和一致性更高。
- 英伟达开源4K图像生成模型Sana,可在16G显存电脑部署,支持ComfyUI和LoRA训练。
- 浙大提出RealCam-I2V!精确相机控制的新型视频生成I2V框架!
- 146页DeepSeek通关宝典:7大场景+50大案例+全套提示词,免费领取
- 大决战!OpenAI可能发布GPT-4.5,狙击马斯克Grok3
- 深圳上线70名“AI员工”,满足240个政务场景
- Adobe发布全新生成式AI应用Firefly,进军商业化
- 重磅!OpenAI将开源 o3-mini,或适合手机大模型
- 赛前启航 | Azure 应用开发实战指南:开启创意的无限可能
- 刚刚,马斯克发布Grok-3,反击DeepSeek、OpenAI
- 开发者,找找找丨GDC化身爱情孵化器Love Combinator,助你“码”上脱单
- 211硕士学历的袁征,当选美国工程院院士
- 开源AI短剧神器来了,单卡即可部署!好莱坞效果人人可享,昆仑万维出品
- 全球最大开源视频模型,现在也Created in China了,阶跃出品
- 嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
- OpenAI突宣开源计划:端侧模型or小模型二选一!奥特曼在线征集投票
- 马斯克“地表最强”Grok 3炸场,竞技场首超1400分
- 吴永辉是谁?字节AGI计划一号位,谷歌AI扫地僧
- 百度搜索×DeepSeek!官宣接入仅24小时全量上线满血版,实测来了
- 见证钞能力,马斯克的Grok3登顶全球第一!
- AI 正在杀死程序员!
- 如何为DeepSeek这类推理模型编写Prompt
2025-02-17
- 如何测量大模型是否过度思考?兼看最近GraphRAG及多模态RAG 进展
- DeepSeek,又杀疯了!
- DeepSeek-R1 论文解读
- 今日开源(2025-02-17):BodyShapeGPT,基于SMPL-X模型,精准生成3D人形化身,革新虚拟交互与定制化模拟
- AI 浪潮席卷巴黎:奥特曼自称“不再用谷歌搜索”,LeCun 预言“人人都将有 AI 员工”!
- 研究表明DeepSeek等大模型越强大,我们越容易变蠢?
- Nature重要发现:癌细胞会自建 “电网”,增强扩散能力
- 大模型进化史:从Transformer到DeepSeek-R1的AI变革之路
- 对谈张亚勤:我预演中的AGI地图
- WWW 2025 SmartMem 内存故障预测竞赛
- 微信也接不住DeepSeek的流量?
- DeepSeek 颠覆了什么?学习不靠“人盯”,AI自己“卷”自己
- 比亚迪掀起“全民智驾”风暴:接入 DeepSeek,7 万级车型标配高阶智驾
- 首个基于统计学的线性注意力机制ToST,高分拿下ICLR Spotlight
- 「杭州六小龙」首个IPO,群核科技递表港交所,空间智能赛道开启资本化元年
- AI无法攻克的235道谜题!让o1、Gemini 2.0 Flash Thinking集体挂零
- 语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3
- 2024 IBM博士生奖学金出炉:韩迟、卓越、张逸骅、冯尚彬等AI研究者入选
- 超过o1-mini、逼近o3-mini,DeepSeek-R1在新的贪吃蛇基准上拿下1801分
- 北大彭宇新教授团队开源细粒度多模态大模型Finedefics
- 哈佛、英特尔等60+顶尖机构联手打造:NeuroBench定义神经形态计算评测新范式
- 打破AI遗忘诅咒的学习算法,慕尼黑-南大团队打造会自主积累知识的学习框架
- Python 3.13 的这些更新亮了!
- 手把手薅到满血版DeepSeek-R1!为啥你总卡在“服务器繁忙”?
- 【机器学习】机器学习各算法的优缺点!!
- 梁文锋导师项志宇引关注,个人主页满满都是对团队的祝贺表扬
- 为何说 “在国内做科研,最忌讳踏实”?
- AI时代如何避免被淘汰?吴恩达:成为职场「10倍专业人士」
- 原来,这些顶级大模型都是蒸馏的!
- Jupyter Notebook实用插件分享
- 清华《DeepSeek:从入门到精通》干货分享!104页!
- 被导师放养,后果可能很严重。。。
- DeepSeek 爆火,留给普通人的时间不多了。。。
- 新版 GPT-4o 登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战
- DeepSeek 模型综述:V1 V2 V3 R1-Zero
- 2025年,Matlab依旧坚挺?
- 974亿美元!马斯克欲收购OpenAI,遭Altman吐槽:不如我97.4亿美元买下推特?
- OpenAI 最近悄无声息地推出了另一个代理框架,说实话,这玩意儿有点酷
- M4芯片上跑Linux无望?Asahi Linux负责人辞职,抨击Linus领导失误、自述遭遇背叛
- 为什么 DeepSeek 出来后,国产其他大模型厂商集体失声了
- 多院校研究生奖学金停发!!
- 神经网络与傅立叶变换有何关系?
- 使用 Mask RCNN 和 Yolov5 进行划痕检测
- 聊一聊Reasoning Model的精巧实现:ReFT, Kimi K1.5和DeepSeek R1
- ICLR2025 | OCEAN:离线多步推理评估与对齐,为大型语言模型带来全新突破
- LLM MOE进化之路,从普通MOE到Sparse MOE 到 deepseek share_expert Sparse MOE
- 快速搭建一套多路视频流实时处理系统,车流统计项目!(附实战代码)
- 人工智能的发展,是不是走错了方向?
- 满血版Deepseek R1来了,问小白app专线,免费不限次、超丝滑!
- 顶刊TPAMI 2025 | 北大、KAUST、字节联合提出“可逆扩散模型”赋能图像重建,代码已开源!
- 单张照片生成3D头部模型!Adobe提出FaceLift,从单一人脸图像重建360度头部模型。
- 引领图像编辑领域的新潮流!Edicho:实现跨图像一致编辑的新方法(港科&蚂蚁&斯坦福)
- 音频驱动肖像动画新方法LetsTalk,可生成与音频一致的逼真视频。
- 清华大学最新资料:普通人如何抓住DeepSeek红利.pdf
- 【智谷学院】AIGC智谷学院致力于构建一个全面的AI学习平台
- 【AIGC趋势】阿尔特曼:花得越多,AI越聪明,AI价格每年暴降90%
- 【AIGC应用】别等苹果AI了!7大中国手机厂接入DeepSeek,还是满血版
- 【行业动态】OpenAI的近期新闻,豆包发布 Doubao-1.5-pro
- 295-A1|文本驱动图像编辑,大规模图像编辑数据集;将CFG蒸馏到文本嵌入中,扩散轨迹匹配;文生图社会偏见问题
- 295-A2|电影镜头设计图生视频,3D点云正则化提升视频生成,将动态内容添加到真实视频,AIGC视频质量评估;DiT音视频生成
- 295-A3&B|基于文本的CAD编辑;评估多模态视频理解;通用稀疏AE用于可解释跨模型概念对齐;详细注释的自我中心视频数据集
- 294-A1|面部与服装保持的姿势迁移,可控GUI设计生成;掩码自编码器“标记”化,大脑信号视觉解码,优化一致性蒸馏的模型训练
- 294-A2|运动场引导图像到视频生成,基于解耦的可控视频生成,个性化音乐到视频生成
- 294-A3|将视频视为动态3D世界投影,单图生成物理仿真预备的服装分离3D人类,基于笔画的交互式神经SDF雕刻,微结构设计生成
- 微软开源创新框架:可将DeepSeek,变成AI Agent
- 像Sora一样,用物理模拟方式生成视频
- 赛前启航 | 微软 AI 开发者挑战赛第一期直播正式开讲,不见不散!
- 打不过DeepSeek就加入,最新名单:腾讯文档、百度搜索
- 全球空间智能第一股!浙大清华“三剑客”,英伟达基因,填补两大技术空白
- 反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好
- Llama模仿Diffusion多模态涨分30%!不卷数据不烧卡,只需共享注意力分布
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升
- DeepSeek加持,北大通院几何模型达IMO金牌水平!32个CPU核心和1块4090就能实现满血解题
- 报名 | CVPR’25首届具身智能「通用机器人操作研讨会和挑战赛 」正式启动
- X-R1: 3B中文推理开源, 支持LoRA训练
- 这个开源项目厉害了:一键部署DeepSeek R1!
- 六小虎之阶跃星辰,加入开源阵营,开源SOTA文生视频!
- 重磅!8B「扩散」大语言模型挑战Llama,一次看清全局完爆传统模型
- 14G跑满血DeepSeek-R1,清华最新开源力作ktransformers
- 如何训练LLMs像DeepSeek-R1“思考”
2025-02-16
- Deepseek R1及Deep research复现回顾及近期前沿进展速递
- 老刘的R1类推理大模型三部曲及RAG小课堂正式发布
- 【他山之石】英伟达新作SANA 1.5:线性扩散Transformer刷新文生图SOTA
- 【源头活水】LLM模型的通病:模型坍塌
- 【他山之石】ICLR 2025 | 极性感知线性注意力!PolaFormer:全新视觉基础模型
- 【源头活水】一文搞懂DeepSeek的技术演进之路:大语言模型、视觉语言理解、多模态统一模型
- 赢得诺奖不是终点!David Baker再获里程碑突破——AI首次从头设计出蛋白酶
- DeepMind《:科技催生 “数字来世”,生成式 AI实现“”生命”重生研究报告》
- 哥伦比亚大学:超越Chatgpt的AI agent综述,关于AI智能体的演进、关键技术与未来发展
- 百度、字节高管隔空互怼;月之暗面或因DeepSeek调整重心;腾讯已对微信接入DeepSeek灰测 | AI周报
- 越挫越勇的大前端 | 直播预告
- 贼溜!使用 Cline+deepseek 实现 VsCode 自动化编程!
- 引发教育公平性热议:如何看待复旦大学发文“欢迎中国籍留学生直博”?
- 情人节特刊:DeepSeek算姻缘教程来了!
- 微信 DeepSeek 入口已接通,辐射用户 14 亿!
- 诺奖得主:DeepSeek是中国最好的AI模型
- DeepSeek 朋友圈+1,真正的大佬还没来!
- 厦门大学团队:大模型概念、技术与应用实践(140页PPT读懂大模型)
- Qwen架构改造成Deepseek,再复现R1计划
- 「Github一周热点61期」更快运行DeepSeek的推理框架、大模型微调工具、AI数据可视化工具、API调试工具和开源图标库
- 如何看北京理工大学珠海学院(独立学院)毕业生冒充北理工(985)去应聘,被拒后反骂HR学历歧视?
- 【机器学习】5 分钟了解特征工程
- 12个常用的图像数据增强技术总结
- 微信接入满血版DeepSeek!你被灰度了吗?
- DeepSeek这个大好人,官方公布的他们的系统提示词,让全网都能体验最佳效果
- DeepSeek 背后的数学原理:深入探究群体相对策略优化 (GRPO)
- 被微信灰度r1了,问了一个问题
- 7个用于改进RAG中检索的指标(文末抽奖送书!)
- 大语言模型简史:从Transformer(2017)到DeepSeek-R1(2025)的进化之路
- 阿里提出文生卡通新方法Textoon:一分钟内生成丰富多彩、可交互的Live2D格式角色。
- 拖动图像编辑再升级!北大、腾讯提出DragonDiffusion,在扩散模型上启用拖动式操作。
- 谷歌DeepMind重磅推出多视角视频扩散模型CAT4D,单视角视频也能转换多视角了。
- 微信DeepSeek入口已接通,辐射用户14亿!刚刚实测,辛弃疾都得666
- 不蒸馏R1也能超越DeepSeek,上海 AI Lab 用RL突破数学推理极限
- 免手术AI读心术新突破!Meta脑机接口研究惊呆网友:能边睡边玩手机发帖了??
- DeepSeek冲击之下,大模型六小强如何「回应」?
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 王炸组合:微信接入满血DeepSeek R1,背后的Agentic RAG技术~
- DeepSeek-R1 如何通过知识蒸馏将推理能力传递给 Qwen
2025-02-15
- Think思考用来增强RAG的Embedding?兼看推理模型使用实践建议等前沿进展
- 多模态CLIP魔改版太强了!直接上岸CVPR!
- 谷歌首席科学家Jeff Dean与 Transformer 发明人 Noam Shazeer师徒对话
- 赶紧放弃强化学习?!Meta 首席 AI 科学家杨立昆喊话:当前推理方式会“作弊”,卷大模型没有意义!
- 微软宣布退出HoloLens硬件更新,元宇宙在入冬天
- 「重磅」Sci.Robot最新封面:史上最大由人类肌肉驱动的机械臂,人机融合取得新突破
- PyCharm 接入 DeepSeek 完整版教程来了!!!
- 从想太多到想不透?DeepSeek-R1等长推理模型也存在「思考不足」问题
- 大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠
- 又一个Deep Research来了!1-2分钟抵人类专家数小时,所有人免费
- 炒菜、雕刻、绘画、汽车人变形!MakeAnything用扩散Transformer解锁多任务过程生成
- 什么样的硬件产品才配得上 「AI Native」?
- 梁文锋导师项志宇引关注,个人主页满满都是对团队的祝贺表扬
- 大模型微调项目 / 数据集调研汇总
- 如何正确使用DeepSeek R1
- seaborn
- 清华大学:DeepSeek从入门到精通(第二版来了!)
- 2024 年 15 种典型 RAG 框架
- 5K star!满血DeepSeek在家使用,这个清华开源神器太牛了
- 特征提取:传统算法 vs 深度学习
- 数字图像中的噪声
- Arxiv’2025 | YOLO-MST:基于超分辨率和YOLO的多尺度红外小目标检测
- 深入浅出,算法模型INT4、INT8、FP8、FP16、FP32量化,小白入门必学!
- 复现DeepSeek Zero的RL调参经验
- 软考重磅消息!刚刚明确!恭喜2025年考生!
- 清华大学出品《DeepSeek 从入门到精通》完整版手册下载和使用教程。
- 开源版Deep Research,一句话创建Agent工作流帮你完成电脑上的复杂操作,股票分析也轻松实现。
- 多身份定制化视频创作新突破!Ingredients:可将多个身份照片整合进视频创作实现个性化视频生成。
- NVIDIA提出虚拟试衣新方法EARSB,让时尚与科技完美融合!
- 293-A1|多偏好优化,合成数据生成用于图像定制化,面部图像编辑,SVD直接探索扩散潜空间;图像自回归隐私风险,流匹配生成建模
- 293-A2|DiT视频生成推理加速,增强视频生成运动一致性;直接偏好优化,迭代偏好优化,视频偏好基准;静态宽视角视频电影化编辑
- 293-A3|物理引导文生复杂场景,开放词汇关节物体建模,3D形状变体生成,4D场景编辑,GS转为结构化2D表示;动作生成系列
- 293-B1|文档理解,UI理解,MLLM偏好优化;细粒度图像描述数据集用于理解与生成,盲面部修复,现实世界图像超分
- 293-B2|高斯过程增强GS,几何神经过程场;开放词汇3D场景分割;数字人系列
- 刚刚,OpenAI正式拒绝,马斯克973亿美元收购
- DeepSeek-R1下载量超1000万次,成最受欢迎开源大模型!
- Perplexity免费推出Deep Research:性能超过R1、o3-mini等,CEO:感谢DeepSeek
- DeepSeek官方推荐:R1要这样设置
- CaPO-对齐图文一致性
- FOT(Forest-of-Thought):增强大型语言模型推理能力的新框架
2025-02-14
- GraphRAG前沿之MedRAG医疗问答路线:兼看基于KG进行上下文扩展方案
- 想做多模态和可解释性一定要看!这些idea思路是真的顶
- PINN+LSTM大突破!中科院一区&二区get,满足课题需求!
- 今日开源(2025-02-14):DeepHermes 3,8B参数,实现长链思维与LLM无缝切换,推理与响应模式统一
- 谷歌传奇师徒对话:改变世界的 Jeff Dean 与创造 Transformer 的 Noam Shazeer
- 深度长文|当 AI 开始“组团”思考:Mind Evolution 如何重塑大模型?
- 当AI开始“发Nature”,人类科学家靠什么绝地反击?
- 物理学家发现黑洞诞生新证据 实验室里造出人工奇点
- 最新Nature:科学家一步一步地详细说明了大脑如何构建复杂的认知地图
- DeepSeek R1 刷榜 Kaggle 数学奥赛挑战赛
- 还没发布,xAI 工程师公开承认 Grok 3 不如 OpenAI,遭马斯克怒火解雇!马斯克:Grok 3 打遍天下无敌手
- 刚搞大模型不久时的梁文锋,发表了一次公开演讲
- 腾讯元宝接入 Deepseek-R1 满血版,支持联网搜索并整合公众号信息源
- 赶紧放弃强化学习?!Meta 首席 AI 科学家杨立昆喊话:当前推理方式会“作弊”,卷大模型没有意义!
- 基于百川大模型的首个AI儿科医生正式“上岗”:会诊结果可与专家高度吻合
- 啊!DeepSeek-R1、o3-mini能解奥数题却算不了多位数乘法?
- 一图一3D世界,视频还可交互,昆仑万维「空间智能」开年首秀来了
- 苹果也在蒸馏大模型,给出了蒸馏Scaling Laws
- 清华团队新算法玩转频域时域,压缩95%计算量实现语音分离新SOTA!
- 好活!字节,南加大,斯坦福等新开源的小人跳舞X-Dyna,人脸、背景都生动起来了
- 刚刚,DeepSeek官方发布R1模型推荐设置,这才是正确用法
- Science新登,David Baker团队用AI从头设计栩栩如生的酶,比同类设计好6万倍
- 复旦团队提出Transformer生成的原子嵌入策略,可通过ML提高晶体特性的预测准确性
- 智能电子粘附皮肤:机器人与环境交互的新进展!
- 超强DNA大模型「GENERator」问世!解锁生命密码设计新范式
- 985教授控诉:用心教书的老师太少了!我们亲手毁掉了下一代的教育尊严
- 吴恩达推出的AISuite也宣布支持 DeepSeek
- DeepSeek R1 完整版本地部署教程来了!!!
- matplotlib heatmap自由~
- 三张图速通 DeepSeek-R1 论文和技术原理
- 热议:为什么 DeepSeek 出来后,国产其他大模型的集体失声了,以前都号称很强的?
- 刚刚 GPT4o、Claude 彻底开放了!
- 超全面! 15 种 Python IDE 工具使用对比
- 奥特曼自曝:GPT-5要来了,所有人免费!DeepSeek逼急OpenAI,最强路线图曝光
- TIM’25 | MixFormer:一种用于医学图像分割的混合CNN-Transformer骨干网络
- Qwen架构改造成Deepseek,再复现R1计划
- AgentStore:迈向通专融合的自动化计算机助手
- 深入了解Deepseek模型的最佳三篇论文
- PP-ChatOCRv3新升级:多页PDF信息抽取支持自定义提示词工程,拓展大语言模型功能边界
- 比printf高效1000倍!如何精准捕捉C/C++野指针
- RAG科普文!检索增强生成的技术全景解析
- 腾讯发布混元-3D 2.0: 首个开源高质3D-DiT生成大模型,几何结构更加精致,纹理色彩更加丰富。
- 腾讯HunYuan-3D 1.0,支持文本到3D和图像到3D,10秒即可生成高分辨率细3D模型。
- 统一图像生成模型OmniGen:可由多模态提示直接生成各种图像。
- 图像编辑大一统?多功能图像编辑框架Dedit:可基于图像、文本和掩码进行图像编辑。
- 官宣!阿里巴巴确定与苹果合作,为中国iPhone提供AI
- OpenAI发布最新模型规范
- 欧盟投资2000亿美元,全力发展AI
- 1秒锁定7500万债务黑洞,OpenAI o系列模型7大实际应用案例
- 微软 AI 开发者挑战赛报名火热进行中,等你来战!
- 重磅!百度宣布开源文心一言,加入开源大军
- 百度决定背叛闭源大模型,李彦宏重新拥抱开源
- DeepSeek R1遇难题142次”I give up”,研究还称需增加推理时机控制机制
- Claude 4被曝发布在即!DeepSeek把大招都给逼出来了
- 达摩院开源VideoLLaMA3:仅7B大小,视频理解拿下SOTA | 在线可玩
- DeepSeek缝合Claude,比单用R1/o1效果都好!GitHub揽星3k
- 苹果发现模型蒸馏Scaling Law!教师模型并非越强越好
- ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频
- 阿里左手打右手,Qwen2.5 VL 72B 被自家 34B打败了~
- 马斯克:Grok-3 一周内发布!「聪明得吓人」
- 首富马斯克,正用 AI 改造美国
- 重磅!Windsurf Wave 3 来了:AI编程进入「一键完成」时代!
- 比GraphRAG更懂“思考”,微软又开源PIKE-RAG:主打复杂私域知识理解和推理
- 动手设计自己的满血版DeepSeek-R1+联网智能体
- DeepSeek官方发布部署 R1 的正确打开方式~
- LLM(大模型)评估综述:现状、挑战与未来方向
2025-02-13
- GraphRAG前沿之Graph RAG-Tool Fusion:将知识图谱用于Agent工具编排实现思路
- DeepSeek 模型架构解读 - 多头注意力(MHA)和多头潜在注意力(MLA)
- 今日开源(2025-02-13):OpenThinker,开源文本生成模型,32B参数,基于Qwen2.5微调,数据集代码全公开
- 【源头活水】LLM模型的通病:模型坍塌
- 4K分辨率拿下!超强杀器SANA:线性扩散模型+文生图+高分辨率+从头训练的极佳范本!
- 【他山之石】入选AAAI 2025!多模态医学图像融合新突破!
- CSDN 智研社 DeepSeek 技术创新及 AI 2025 进化闭门研讨会成功召开
- Sam Altman巴黎AI峰会实录 |关注AI 推理能力与AI 智能体
- OpenAI发布o1到o3变强报告:o3编程世界排名18「DeepSeek已经告诉方法」
- 生命起源和人工生命研究模型的调节发育
- Nature:孙伟男等揭示大脑构建认知地图的关键机制
- 行业落地分享:阿里云构建企业级RAG
- 十多个模型打不过 DeepSeek 一个?奥特曼受不了了:怒将 GPT 和 o系列合并,非思维链模型到头!
- 连播12天!深度揭秘 DeepSeek | 直播预告
- 百度宣布:文心一言4月1日起全面免费,退费事宜已同步展开
- 刚刚,奥特曼剧透GPT-4.5、GPT-5重大更新,o3取消独立发布
- 哥德尔-Prover超过DeepSeek-Prover,金驰、陈丹琦团队造出当前最强形式化推理模型
- DeepSeek R1不编程就能生成GPU内核,比熟练工程师好,惊到了英伟达
- 为了让DeepSeek-R1用起来更顺畅,火山引擎将TPM上调到了500万!全网首家
- 放大招!文心一言「全面免费」,同时开启「深度搜索」,抢鲜实测!
- 单卡3090帮你一口气看完《黑悟空》,港大百度打造超长视频理解引擎VideoRAG
- 免费!「DeepSeek-R1 671B满血版」不卡、不限次!问小白火速支援
- AI做生物实验?还能迭代?浙大集成PLM和「自动化生物工厂」革新蛋白质工程范式
- 令人惊讶的发现,谷歌混合数模量子计算机揭示了磁性的新面貌
- 无需配对训练数据集,AI赋能协助全新无标记成像显微镜
- 2024年十大人工智能研究论文:收获与应用
- 全球掀DeepSeek复现狂潮,这个爬虫神器出圈了!
- AI领域的免费风暴来袭!某巨头AI也坐不住了!
- 【深度学习】告别调参噩梦!9种优化算法加速神经网络!
- 终于把风控中的 ROC/AUC 搞懂了!!
- 大模型算法岗,选大厂,还是deepseek?
- cuda编程:我的第一份cuda代码
- DeepSeek 薪资曝光!人均年薪70W+
- AGI时代,开启财富大洗牌!
- 别随便本地部署大模型,Ollama重大安全隐患
- 多子图自由~
- 清华一作 1B 暴打 405B 巨无霸,7B 逆袭 DeepSeek R1!测试时 Scaling 封神
- 六年诈骗6000万美元!知名AI初创公司前CEO被捕:公司账户“只剩37美分”,或面临60+年监禁
- 第一学历不好,求职中怎么弥补?
- DeepSeek-R1复现方案梳理
- DeepSeek最大的贡献是什么?
- EMNLP 2025 征稿通知
- R1类模型推理能力评测手把手实战
- 从 DeepSeek R1 论文深入理解推理型大模型
- 漫画趣解:一口气搞懂大模型蒸馏技术!
- DeepSeek-R1 Linux 本地部署,OLLAMA & Open WebUI 双剑合璧!
- 定了,免费!
- 热门活动|李飞飞组工作,s1: 1000个思考样本激发大语言模型的Test-time Scaling
- 作者时隔5年,历时4年,耗时2年,超20万字的Pytorch实用教程完稿开源!
- 非常丝滑,腾讯元宝已支持deepseek R1
- 通过模型生成的解释理解LLM后门攻击
- ICLR2025分享会报名啦!
- 一文深入了解DeepSeek-R1:模型架构
- DeepSeek将开启大模型免费潮?ChatGPT和文心一言相继宣布全面免费开放!
- 告别大头娃娃,东京大学开源数字人TANGO:能根据目标语音音频生成同步全身手势的视频。
- 港中文联合清华提出AnyCharV:高保真高细节角色可控视频生成!
- DeepSeek 本地部署最佳实践(一):Ollama+Open WebUI + 蒸馏版
- DeepSeek 本地部署最佳实践(二):llama.cpp + Open WebUI 部署 unsloth 量化版模型
- DeepSeek 本地部署最佳实践(三):SGLang + 分布式推理部署满血版模型
- 5分钟斩获心动信号!DeepSeek智能定制情人节专属浪漫
- OpenAI放王炸!GPT-5免费无限使用,产品矩阵大整合!
- 文本生成无限长视频,无需任何训练
- AI帮外贸商家接到2000万美金大单后,阿里国际站接入DeepSeek等先进模型
- 股票大涨!百度宣布最新文心一言、深度搜索,免费使用
- GPT-4.5马上发布,GPT-5免费畅聊!奥特曼剧透大动作,网友:让DeepSeek整破防了
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 本想去谷歌捞一笔就跑,却成了改变AI历史的人|Transformer作者对话Jeff Dean
- 比尔盖茨自述曾是熊孩子:16岁徒步数百英里,边走脑中边写BASIC代码
- 腾讯元宝接入DeepSeek-R1满血版,首次引入第三方模型,能联网能调用微信独家生态
- 文心一言全面免费了,深度搜索功能同时上线,第一手实测在此
- 打破纪录!谷歌全网扒1000亿图像文本对,ViT大佬坐镇:数据Scaling潜力依旧
- Gemini再度“破防”!长期记忆被黑客篡改,方法竟和一年前如出一辙
- 中国AIGC产品全景图谱全面征集|量子位智库
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- Karpathy大神问懵DeepSeek!一个🤣竟藏53个Token,思考10分钟没解释出来
- 一个🤣可以藏下滕王阁序,DeepSeek都玩懵了~
- GenAI 时代下,艺术创作的意义是什么?
- Llama 4 什么时候出来?
- DeepSeek异构&分布式部署:全平台+国产GPU支持,你值得拥有!
- 瓦力算法2月第2周急招岗位| 英特尔 / 亚马逊 / 华为 / 阿维塔 / 4399 / 乐鑫 / 讯飞 / TeleAl /
- 4 步轻松获取DeepSeek API 攻略
2025-02-12
- KG增强Agentic Reasoning进行深度研究的有趣思路:兼看社区R1类推理分享三部曲
- KG+LLM+RAG+文档智能技术及落地:老刘说NLP技术社区对外纳新
- 理解卷积神经网络中的卷积滤波操作
- 今日开源(2025-02-12):DeepScaleR-Preview分布式强化学习微调大模型,1.5B参数性能超越OpenAI
- 独家专访 Tcl 语言之父 John Ousterhout 院士:行之有效的编程与设计哲学
- AI 终极十问!DeepSeek 如何颠覆开发者认知? | DeepSeek 十日谈
- 2025巴黎AI行动峰会系列报道(一):李飞飞发表开幕演讲
- 61 国签署巴黎人工智能宣言,美英反对AI 监管过严
- 10万颗先进AI芯片,撬动1.5万亿,欧盟官宣AI超级工厂计划
- 生物人工智能——从具身认知到具身机器人学
- 2024年 15 种典型 RAG 框架
- 小白学大模型:LogitsProcessor 文本可控生成
- “阿里是当下苹果最好的选择,甚至可能没有之一”
- 元宵节撞上 DeepSeek,这场脑力风暴,谁能赢走超级豪礼?
- 谷歌 Vertex AI 推出新的 RAG 引擎
- 8卡32B模型超越o1预览版、DeepSeek V3,普林斯顿、北大提出层次化RL推理新范式
- 淘宝卖DeepSeek安装包一月赚数十万???我们免费教你本地部署DeepSeek-R1
- 统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA
- 如何训练最强代码大模型?北大aiXcoder-7B贡献前沿实践
- 超越思维链?深度循环隐式推理引爆AI圈,LLM扩展有了新维度
- 4500美元验证强化学习「魔力」,1.5B模型也能超越o1预览版,模型、数据、代码全开源
- AI突破抗药性困境!山大团队融合潜在扩散模型与MD设计新型抗菌肽
- 轻量开源!微软基础模型LLaVA-Rad:自动生成高质量放射学报告
- Nature子刊新登,如何检测小分子机器学习中的覆盖率偏差
- 沃尔玛销售数据挖掘与可视化分析实战
- 热议:为什么DeepSeek出来后,国产其他大模型的集体失声了,以前都号称很强的?
- 【机器学习】机器学习模型的保存与加载,完全指南
- 第一波用DeepSeek的人,论文已经被录用了!
- 法国总统,豪掷1090亿,开启欧洲「星际之门」!
- 你的学校上榜了吗?DeepSeek中国大学排名Top100
- (附代码)在OpenCV中基于深度学习的边缘检测
- 看懂DeepSeek ,一篇文章远远不够
- Overview of seaborn
- DeepSeek 被封杀了?!
- 清华姚班校友等揭 Transformer 致命缺陷,OpenAI 科学家紧急回应:学术界节奏太慢
- 新能源车企内卷的核心技术是什么?
- “未来 3 年内,Python 在 AI 统治地位将被 Java 取代!”
- 为了按时返岗,这届打工人有多拼?
- 博士生们每天科研时间是多久?
- 不平衡数据集的建模的技巧和策略
- YOLO11 实例分割模型做行人分割
- 快速学会登上nature的热门算法,LSTM!
- DeepSeek装进VSCode,编程非常丝滑!
- 道路裂缝坑洼图像开源数据集汇总
- 昇腾 910B 部署满血 DeepSeek-R1
- 大模型实践 | 卡比人贵时代的大模型经验
- 光照不良环境下,跨模态目标检测DEYOLO, 双功能增强YOLO!(附论文及源码)
- TIP 2025!多目标跟踪新方法TOPICTrack,新数据集BEE24发布!
- 聊聊如何基于unsloth在Llama3.1上复现DS-R1-Zero
- 从理论到代码剖析DeepSeek-R1:从PPO到Reinforce++,再对比GRPO
- DeepSeek-R1复现方案梳理
- 港中文&腾讯提出可穿戴3D资产生成方法BAG,可自动生成服装和配饰等3D资产如,并适应特定的人体模型。
- 革新在线购物体验:CatV2TON引领虚拟试穿技术新纪元。
- NVIDIA提出虚拟试衣新方法EARSB,让时尚与科技完美融合!
- 耶鲁大学和Adobe提出SynthLight:智能重塑人像照明,打造完美光影!
- DeepSeek并非完美,训练过程存在“深度诅咒”
- AMD开源科研AI Agent,一站式自动写论文
- 法国将投资1009亿欧元,大力发展AI
- 微软AI技术进阶课第3期【Azure AI 自然语言处理(NLP)】,锁定2月15日20:00-21:30~
- 推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025
- 啊?7B的DeepSeek反超R1满血版,上海AI Lab周伯文团队新成果:计算最优的Test-Time Scaling
- 免费!满血版DeepSeek丝滑畅玩,低门槛实现671B-R1/V3自由,潞晨云上新
- 4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破大模型推理门槛
- 5090又烧了!英伟达发售前曾保证“已完全解决”
- 奥特曼公开回怼马斯克,OpenAI董事会成员:说要收购,没收到报价啊?
- o3拿下IOI 2024金牌!新论文公布RL秘诀:AI自己设计测试时推理策略,无需人类干预
- 奥特曼再谈DeepSeek:每天醒来都有压力
- 小红书&上交多模态大模型新基准,Gemini 1.5 Pro准确率仅48%
- X-R1: 不到50元,人人都能复现0.5B Aha Moment
- 推理满血R1,仅需24GB!
- Anthropic CEO:AI 将于2026 年形成新的「人类社会」!
- 一条推文引发的血案:xAI 员工因发推提及Grok 3 而被逼辞职
- Open R1放出220k高质量DeepSeek R1数据及处理技术细节,冲~
- Agent圈的DeepSeek,牛津大学Agentic Reasoning框架显著提升深度研究能力
- 探索 Hugging Face’s Smolagents:简化Agent开发的新利器(含代码)
2025-02-11
- R1-GRPO强化范式用在KG抽取的粗暴实现:兼看RAG、推理加速等相关进展
- D-FINE:在DETR中将回归任务作为分布来细化
- 强化学习+组合优化创新!快速学会登上CCF-A的热门组合
- 今日开源(2025-02-11):Zonos,多语言TTS模型,20万小时训练,支持5种语言,精准语音克隆,情感控制自如
- 【源头活水】诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步
- 【他山之石】ICLR 2025 | 极性感知线性注意力!PolaFormer:全新视觉基础模型
- 十道灵魂之问,十日谈解读 DeepSeek 的“国运级创新”!
- 告别传统强化学习?上下文强化学习基座模型 OmniRL 让 AI “自学成才”
- 人工智能行动峰会巴黎理工分会场:人工智能、科学与社会会议综述
- 马斯克(出价 970 亿美元)收购 OpenAI
- 本科生推翻姚期智40年前的猜想,哈希表的平均查询时间竟与填满程度无关
- 什么叫做学问好?就是文章发得少!
- 为什么DeepSeek由一个初创公司开出来而不是国内互联网巨头?DeepSeek的神回复
- Kaggle赛题解析:2025 NCAA篮球预测
- 马斯克团队豪掷 970 多亿美元要收购 OpenAI,Altman:婉拒了哈,不如我买下 Twitter 呢
- DeepMind 也酸了?CEO 怒喷 DeepSeek 成本是炒作:很多技术都来自谷歌和 DeepMind
- 欧版 AI“星际之门”官宣:马克龙狂投 1090 亿欧元,Mistral 也是要好起来了!
- 比亚迪也在接入DeepSeek!7万级标配高阶智驾,端到端全面铺开
- 本科生推翻姚期智40年前的猜想,哈希表的平均查询时间竟与填满程度无关
- 不卡顿、免费的满血版DeepSeek-R1 API,在无问芯穹这里用上了,更有异构算力鼎力相助
- 开源22万条DeepSeek R1的高质量数据!你也能复现DeepSeek了
- 网传DeepSeek R1更容易被越狱?这有个入选顶会的防御框架SelfDefend
- 817样本如何激发模型7倍推理性能,上交大LIMO论文作者亲自解读
- 外媒:国行iPhone最终选择阿里千问?DeepSeek也出局
- 登Science,MIT团队推出新蛋白质语言模型ProtGPS,预测蛋白在活细胞内的功能位置
- ICLR 2025 | Deep Signature 高效表征生物大分子复杂运动的新方法
- 为什么他靠一场Kaggle竞赛拿下大厂Offer,而你还在刷题?
- ICML 2025杀疯了!
- 《哪吒2》申公豹爆火背后:代码豹的扎心真相,打工人集体破防!——从996到35岁危机,谁懂我们拼命改命的辛酸?
- 【深度学习】5分钟解释Transformer,一个神奇的算法模型 !!
- 动真格!27名院士候选人,被处理
- 这家公司太神秘了,估值达200亿美元,却没有任何产品。。。
- “用了DeepSeek,每天减少9.68小时工作量”
- 你没有看过的全新版本,Transformer数学原理揭秘!
- 机器学习模型的保存与加载,完全指南
- 哪些国家封杀了DeepSeek?
- 强的离谱!今年读过最绝的一本 LLM 书!下载量破 10w 了!
- 50 个逆天的 pytorch 操作!!
- DeepSeek-R1 解读及技术报告中文版
- 6MB PDF竟能运行Linux?这名高中生在PDF里玩DOOM后,再“整活”!
- 为什么现在的应届生动不动就要上万的薪资?
- 迈向GPT-4o,多模态大模型杀回来了!
- 车位数量检测
- 博士生们都在干什么?
- 4500美元复刻DeepSeek神话,1.5B战胜o1-preview只用RL!训练细节全公开
- 张俊林:S型智能增长曲线-从Deepseek R1看Scaling Law的未来
- 为什么 LLMs 在 OCR 任务中表现不佳
- 吴恩达开源:无需标注数据的Agent目标检测,任意场景输入文字提示(附论文及源码)
- DeepSeek从入门到精通,104页清华出品!(可下载)
- 昇腾 910B,部署满血DeepSeek-R1经验分享!
- DeepSeek-R1技术笔记 (含图解和技术点介绍)
- PaddlePaddle Hackathon | 再攀高峰!飞桨黑客马拉松第七期圆满落幕
- 聊聊Unsloth微调DeepSeek-R1蒸馏模型 - 构建医疗专家模型
- 三张图速通 DeepSeek-R1 论文和技术原理
- 2轮推理赶超已对齐模型?TPO:无需更新参数的对齐新思路
- 别再共情哪吒,学学快乐的土拨鼠!
- DeepSeek 背后的数学原理:深入探究群体相对策略优化 (GRPO)
- 人类运动生成新方法MoMask:可将文本描述作为输入并生成相应的高质量人体运动动作
- 清华联合腾讯提出全模态模型Ola!图像、视频和音频等多模态理解一网打尽!
- Chirpy3D:用于创意 3D 鸟类生成的连续部分潜在特征
- Meta提出Fast3R!多视角快速3D重建新SOTA!
- DeepSeek 本地部署——蒸馏版、量化版和满血版实测效果对比
- 谷歌CEO:现在就是AI创新,黄金年代
- 没发布任何产品,SSI以200亿美元估值,洽谈新融资
- 布鲁克菲尔德将在法国投资200亿欧元,建设AI基础设施
- 以AI之名,激发未来创想 | 微软 AI 开发者挑战赛即将启航!
- 7118亿!马斯克出价收购OpenAI,奥特曼隔空阴阳:我711亿买推特还差不多
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 本科生颠覆姚期智40年前猜想!意外发现新型哈希表,数据搜索速度突破理论上限
- 满血DeepSeek-R1+Cursor打通!无问芯穹上线API服务,能力拉满,7大国产算力保驾护航
- 推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考
- Claude团队:用400万条对话分析AI对经济的长期影响
- 2025,见证更多GenAI应用落实!今年的中国AIGC产业峰会来啦
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 不用跟着挤DeepSeek官方了!这个神器让你零门槛拥有私人助手
- 只需一句话,AI调用多个应用为你打工!三星S25系列国行版发布,AI功能大升级
- open-r1,代码解析~
- DeepSeek R1 还是LLM 吗?
- 突发:OpenAI计划自研Nvidia 级AI 芯片!采用台积电3nm技术
- DeepSeek,又杀疯了!
- 港大&百度VideoRAG:极长上下文视频理解的RAG框架
- 400万次 Claude 对话报告显示:43%自动化工作或被 AI 替代
- 基于DeepSeek构建RAG 系统综合指南(含代码)
2025-02-10
- 再看增强大模型推理能力的四种范式及蒸馏微调范式具体实现
- 火爆全网,免费使用Deepseek,不卡壳
- 免费无限次!671B满血版DeepSeek R1隐藏入口,优秀平台推荐!
- ICLR 2025:卷死YOLO11!中科大提出D-FINE
- 今日开源(2025-02-10):Satori,自回归搜索大模型,7B参数,自我反思与探索能力表现优异,基于Qwen2.5微调
- 【源头活水】被DeepSeek带火的知识蒸馏,开山之作曾被NeurIPS拒收,Hinton坐镇都没用
- 【他山之石】入选AAAI 2025!多模态医学图像融合新突破!
- 【源头活水】华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」
- 【他山之石】LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升
- 刚刚,Sam Altman 给投资者们又打了一剂“定心针”
- AI 教父 Bengio:OpenAI 不会分享超级智能,而是会用它来搞垮其他人的经济
- 张俊林从Deepseek R1看Scaling Law的未来
- Science: 如何“学会”不再害怕?视觉皮层的奇妙作用
- OpenAI联合创始人Altman:AI成本每12个月下降10倍
- 人工智能是一个哲学大事件,预示着新的轴心时代的来临
- 张俊林从Deepseek R1看Scaling Law的未来
- 当我问DeepSeek,“过好这一生”的真相是什么
- DeepSeek + IDEA!辅助编程太强了!
- 小白学大模型:从Prompt Caching到Logprobs
- “首席炒作官”Altman “碰瓷”摩尔定律引社区不满,1400万美元广告被批“都能训练3个DeepSeek V3了!”
- 从 DeepSeek 看 AI 编程新热潮:我们离 “告别手敲代码” 还有多远?| 直播预告
- Meta 即将开启全公司大裁员,不会透露更具体细节
- DeepSeek冲击下,奥特曼刚刚给出对AGI的「三个观察」,包括成本速降
- 飞书接入DeepSeek-R1后,用一次顶一万次,而且再也不「服务器繁忙」了
- 如何优化测试时计算?解决「元强化学习」问题
- 人大刘勇团队「慢思考」机理分析:从雪球误差到正确推理概率
- 北航推出TinyLLaVA-Video,有限计算资源优于部分7B模型,代码、模型、训练数据全开源
- PNAS顶刊 | 抗体中和活性提升1000倍,百奥几何生成式AI高效反击病毒新变种
- 从人才流失到智慧回流:AlphaFold 试图重塑非洲科研DNA
- 基于vLLM、Ollama的DeepSeek R1全系列模型部署教程,支持免费体验!
- DeepSeek 两种部署方式及官方 prompt 模版
- 清华大学DeepSeek使用手册,长达104页!(附PPT下载)
- 为什么中国只有一个 DeepSeek?
- DeepSeek官方提示词模板,要简洁!不要弯弯绕!
- 大模型时代,Python已死?大错特错
- 20W字可视化教程
- 又一个模型,荣登Nature!
- 说句实话,普通博士搞科研,哪有什么真正的创新点…
- 奥特曼曝GPT-5比他聪明!OpenAI暗藏GPT-4.5,o系编程跻身TOP 50
- 下载 DeepSeek 将判 20 年、最高罚款 1 亿美元?美国提出“最激进立法”针对中国 AI!
- “疯存240万,回家当懒汉”:为什么有些人即使不差钱,也躺不平?
- 2025年,转行嵌入式开发的新机遇…
- Meta被曝AI训练「黑幕」!下载81.7TB盗版数据“喂养”模型,CEO竟称不知情?
- 全网最简单,本地部署DeepSeek只需4步即可!
- 机器视觉相机的镜头选择基础知识
- 基于深度学习的低光照图像增强
- 何恺明目前的学术成果是否够得上计算机视觉领域历史第一人?
- DeepSeek爆火,留给普通人的时间不多了
- Deepseek-R1-Zero成功复现, 见证Aha Moment!
- DeepSeek R1爆火后,该如何理解 LLM 中的 RL 算法?
- 谷歌DeepMind发布AG2:开启AI4Math下一代范式?
- 复现DeepSeek Zero的RL调参经验
- 《DeepSeek从入门到精通》免费下载
- RbFT:针对RAG中检索缺陷的鲁棒性微调
- 字节提出OmniHuman-1!单阶段pose加音频驱动的高保真人类视频生成!
- Chirpy3D:用于创意 3D 鸟类生成的连续部分潜在特征
- 实时高保真人脸编辑方法PersonaMagic,可根据肖像无缝生成新角色、风格或场景图像。
- 拖动图像编辑再升级!北大、腾讯提出DragonDiffusion,在扩散模型上启用拖动式操作。
- IC-Portrait:打造逼真个性化肖像的新纪元!
- 耶鲁大学和Adobe提出SynthLight:智能重塑人像照明,打造完美光影!
- 单张照片生成3D头部模型!Adobe提出FaceLift,从单一人脸图像重建360度头部模型。
- 东京大学 | Adobe 提出InstructMove,可通过观察视频中的动作来实现基于指令的图像编辑。
- 刚刚,Sam Altman深夜发文,AI Agent将重塑世界经济
- GPT-4o、Claude 3.5全部被攻破,开源大模型超强攻击框架
- 刚刚,奥特曼给出AGI三个判断:Scaling Law保持不变,没理由放缓投资
- DeepSeek上线国家超算平台!671B满血版,三大运营商接入,玄铁芯片适配
- Meta新视频生成框架拿捏倒立杂技,双人舞也能完美同步!运动一致性暴增近20%,可无缝集成DiT模型
- Nature:离 “量子互联网” 又近一步!牛津大学证实分布式量子计算可行性
- 推理时也能做偏好优化,无需额外重训练,来自上海AI Lab港中文等
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 港大字节最新视频生成模型刷屏!网友直接RIP市场营销,Sora也不香了
- 2025年,RAG技术到底进化成啥样了?
- 马斯克:xAI 将发布超越 DeepSeek 的模型!
- Yann LeCun 不行了吗?
- Sam Altman 又写新博客了!谈AGI关键点与人类使命,确认正在开发「软件工程代理」
- 洞察|以 AI Agent 身份为中心的下一代 IDaaS 探索,「零信任」原则是否依然有效?
- OpenAI CEO深夜发文押注AI Agents,百万虚拟同事上线重塑各行业~
- 7G显存,训练自己的DeepSeek-R1,GRPO资源暴降80%
- 推理框架对比:ReAct、思维链(COT)和思维树(TOT)谁更胜一筹
2025-02-09
- 让推理大模型如何思考很重要:回溯DeepSeek-R1中11个数据问题
- DeepSeek测算:算力、性能、成本等
- 欧米伽理论,智能科学基础理论的探索性进展(2025年1月9日版本)
- 从100部新报告看 2025年1月世界前沿科技未来发展趋势
- 数学真理的极限在哪里?希尔伯特第十问题扩展版得到证明
- DeepSeek一周:日活超豆包、云平台抢食算力、卖课疯赚;用AI大量替代员工?创始人声明;字节辟谣员工被送精神治疗|AI周报
- 招聘 Agent 来了:可自动执行多数招聘和录用任务,30 名员工公司每月成本最高 500 美元
- OpenAI内测Sora图像生成器,代号「papaya」,DALL-E 4即将推出?
- 谷歌AlphaGeometry2攻克IMO几何难题,已超越金牌得主平均水准
- 推理和RL加速GPT-5.5到来?奥特曼公开GPT-4.5已就绪,年底发布全自主智能体
- Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法
- 小红书语音识别新突破!开源FireRedASR,中文效果新SOTA
- 无需引导采样,清华大学提出视觉模型训练新范式
- 为什么是杭州?六小龙崛起:揭秘“神秘东方力量”背后的三大密码
- 【Python】10 个自动化日常任务的 Python 脚本
- 哪些国家封杀了DeepSeek?
- 独自一人,怒发顶会
- 顶尖985:加速挺进全球TOP100!
- 清华大学DeepSeek使用手册,长达104页!(附PPT下载)
- AI、大模型资料分享,微信群
- 离谱!大学教授抄袭50年前的博士论文
- 「simpleRL-Reason」港科大DeepSeek-R1轻量级复现方案解读
- PyCharm 接入 DeepSeek 完整版教程来了!!!
- 刘知远硬核解读 DeepSeek:大模型强化学习技术原理与大模型技术发展研判
- 一个小改动,CNN输入固定尺寸图像改为任意尺寸图像
- 数字图像处理必备基本知识总结
- TPAMI 2025 | 基于可解释优化展开网络的低光图像增强
- 如何构建和优化推理型大模型?DeepSeek R1的启示
- 用通俗的方式给奶奶解释 DeepSeek R1
- 为什么DeepSeek,初创公司可以开发出来而不是国内互联网巨头?DeepSeek神回复
- 82.75 mAP!南开大学提出Strip R-CNN:遥感目标检测全新SOTA!
- 从零到Kaggle大师,再一场竞赛拿下大厂Offer!
- Kimi 1.5 技术报告解读
- 深入了解Deepseek模型的最佳三篇论文
- 大模型时代关注的公众号
- DeepSeek-R1 论文解析——人工智能领域的 RL LLM 新时代?
- 292-A1.1|多领域过程序列生成,认知对齐的分层SVG生成;分解扩散模型视觉能力,RAG现实图像生成,文生图扩散资源效率问题
- 292-A1.2|弱模型到强模型扩散,高效扩散微调,人类偏好对齐,去噪扩散分块采样实现奖励对齐;高效I2I转换,逆桥匹配蒸馏
- 292-A1.3|人对人虚拟试衣,批量服装生成,时尚服装组合生成;双独立文本嵌入,用于潜在一致性模型的训练技术,图条件扩散
- 292-A2|人类视频生成,SSM图像视频生成,手绘草图驱动视频生成;视频潜在流匹配,极长视频RAG;情感面部语音合成
- 292-A3|物理引导文生组合性3D场景,从多视角语义信息生成3D形状;动态3D人类重建,情感驱动说话头合成;3D场景理解与分割
- 292-B|人类身体图像恢复,跨主体fMRI视觉解码;NeRF傅里叶频率控制,探索3D场景假设推理,3D场景理解与问答综述
- OpenAI内部模型曝光!编程能力跻身全球Top50程序员,年底不再有人类对手
- 斯坦福华人博士生打破58年僵局!牛顿提出的亲吻数问题有了新突破
- SFT并非必需!推理模型仅靠RL就能获得长思维链能力,清华CMU团队破解黑盒
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 让OpenAI 走向闭源的并非Sam Altman,其实是……
- DeepSeek R1 + Agent 的下半场
- 动手设计智能体:Coze版
- CCF2025 Talk “夜话DeepSeek:技术原理与未来方向“ 研讨会报告整理
- kimi1.5技术报告解读,你想了解的都在这里
2025-02-08
- 落地角度看think推理类大模型的技术优缺点及潜在风险:老刘说NLP技术社区第37讲精彩回顾
- KG+LLM+RAG+文档智能技术及落地:老刘说NLP技术社区对外纳新
- 图像增强+深度学习法力无边!CVPR、ICCV一发一个不吱声!
- 今日开源(2025-02-08):YuE,开源歌词转歌曲生成模型,7B参数支持多流派音乐创作,打造精致连贯的完整歌曲
- 【他山之石】ICLR 2025|小米新一代Kaldi语音识别算法CR-CTC,纯CTC性能实现SOTA
- 【源头活水】华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」
- 直击 DeepSeek 技术真相,对我们究竟意味着什么?
- 杨强院士领衔,2025 全球机器学习技术大会正式官宣!
- AI 教父 Bengio:OpenAI 不会分享超级智能,而是会用它来搞垮其他人的经济
- 破解DeepSeek大模型,揭秘内部运行参数
- 奥特曼再谈DeepSeek:肯定开源模型巨大贡献,坚信人类终将实现AGI
- DeepSeek核心论文全译本:DeepSeek-R1:通过强化学习提升大语言模型 (LLM) 的推理能力
- Nature:谷歌AlphaGeometry 达到国际数学奥林匹克金牌水平
- 小白学RAG:HuggingFace Text Embeddings Inference
- 大学生打头阵,马斯克用AI“大闹”联邦!拨钱靠微软Azure审、管理用机器人,企业抢单抢疯了?
- 刘知远详解 DeepSeek 出圈背后的逻辑:自身算法的创新以及 OpenAI 的傲慢
- DeepSeek-R1、o1都低于10%,人类给AI的「最后考试」来了,贡献者名单长达两页
- Ilya的神秘公司SSI估值将达200亿美元,5个月翻四倍,却没有任何产品
- 从扭秧歌到单脚跳,HugWBC让人形机器人运动天赋觉醒了
- 图像生成迎来CoT时刻!港中文首次提出文生图的o1推理和Inference Scaling新范式!
- AI+超材料双向突破,浙大综述揭示超材料研究进展,登Nature子刊
- 从纳米到秒级:NanoPyx用AI技术革新显微镜图像处理,效率大幅提升!
- 国家队下场,DeepSeek免下载使用
- 机器学习入门推荐!黄海广老师的机器学习慕课即将上线!
- 痛别!中国核潜艇之父黄旭华院士逝世,隐姓埋名三十载,铸就深海重器
- DeepSeek中国大学排名Top100
- 关于DeepSeek,特朗普最新表态
- D-FINE:在DETR中将回归任务作为分布来细化
- DeepSeek接入PyCharm、Jupyter、Cursor、WPS、Obsidian、知识库&Agent、聊天助手
- 内网部署大模型、API接口管理平台、企业级智能问答知识库及Agent编排平台
- DeepSeek官方提示词手册
- 清华大学《DeepSeek从入门到精通》PDF
- 网上关于DeepSeek的说法,哪些是错误的?
- 只需2行代码,轻松将PDF转换成Word
- 一次性分割一切,比SAM更强,华人团队的通用分割模型SEEM来了
- 免费无限次!671B满血版DeepSeek R1 隐藏入口,带联网搜索+图片+文档对话,速度起飞
- Deepseek R1 Zero成功复现, 三阶段RL,Response长度涨幅超50%,涌现语言混杂,double-check
- DeepSeek-R1技术大揭秘:论文核心原理拆解与模型性能突破关键
- 聊聊DeepSeek训练——基于强化学习训练的底层逻辑
- 聊聊Reasoning Model的精巧实现(ReFT, Kimi K1.5, DeepSeek R1)
- Speculative Ensemble - 让大模型集合推理飞起来!
- 深入了解Deepseek模型的最佳三篇论文
- StochSync:可在任意空间中生成高质量360°全景图和3D网格纹理
- ICLR 2025 | One Prompt One Story!基于单个prompt实现免训练身份一致图像生成
- Qwen2-VL 的重大省级,Qwen 发布新旗舰视觉语言模型 Qwen2.5-VL
- 单张照片生成3D头部模型!Adobe提出FaceLift,从单一人脸图像重建360度头部模型。
- LineArt:无需训练的高质量设计绘图生成方法,可保留结构准确性并生成高保真外观。
- 东京大学 | Adobe 提出InstructMove,可通过观察视频中的动作来实现基于指令的图像编辑。
- 理解推理 LLM:构建和改进推理模型的方法与策略
- 全网最全DeepSeek资料包,别再花钱买课了
- Ilya公司开放融资:估值200亿美元,0用户0收入
- DeepSeek下棋靠忽悠赢了ChatGPT,网友:孙子兵法都用上了
- 谷歌AI解决IMO中84%的几何问题,o1一道没做对!Nature:AI已超过金牌得主平均水平
- 苹果把台灯做成机器人!能用动作表达情绪,重新定义机器人交互
- 浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025
- 奥特曼再谈DeepSeek:肯定开源模型巨大贡献,坚信人类终将实现AGI
- 图像生成推理大模型,港中文北大等联手破解画质提升难题
- DeepSeek 遭Anthropic CEO 炮轰:安全最差的模型!
- 金牌选手惨败!Google DeepMind 最新推出AlphaGeometry2 碾压国际奥数冠军
- 清华大学DeepSeek:从入门到精通(不跑路)
- Deepseek-R1与CAG(缓存增强生成)结合提升问答质量(含demo代码)
- 评估大模型(LLM)摘要生成能力:方法、挑战与策略
2025-02-07
- 推理类大模型的习得过程、认知误区、场景机会及技术风险
- 入选AAAI 2025!多模态医学图像融合新突破!
- 又一篇CCF-A!多尺度Mamba“ 杀疯了 ” ….
- 今日开源(2025-02-07):DeepSeek开源Janus-Pro:自回归框架,1B和7B参数,多模态理解与生成新突破
- 【源头活水】一文详尽之Scaling Law
- 50000 字纯对话 | 美国AI科学家x半导体专家,唠唠DeepSeek和未来的“赌国运”之战
- Nature:OpenAI 的“深度研究”工具让科学家们惊喜
- 万字长文详解DeepSeek-R1模型工作原理
- LLM时代,计算蛋白质科学进展如何?香港理工大学等发布系统性综述
- 刘知远硬核解读 DeepSeek:大模型强化学习技术原理与大模型技术发展研判
- 小白学解释性AI:从机器学习到大模型
- “李飞飞团队 50 美元炼出 DeepSeek R1”被质疑,上海交大本科生新“低成本推理”或成新宠!
- 国产 DeepSeek V3 被秒成”前浪”?谷歌开放最强 Gemini 2.0 全家桶:速度快60倍,上下文还长16倍!
- 日本 AI 公司发布自适应大模型,可动态调整其权重以完成各种任务
- 感谢DeepSeek,ChatGPT开始公开o3思维链,但不完整
- 华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」
- DeepSeek用的GRPO占用大量内存?有人给出了些破解方法
- 将集体学习引入树搜索,新方法CoMCTS实现o1-like的推理与反思
- ICLR 2025|小米新一代Kaldi语音识别算法CR-CTC,纯CTC性能实现SOTA
- 历史时刻:DeepSeek GitHub星数超越OpenAI,仅用时两个月
- LLM时代,计算蛋白质科学进展如何?香港理工大学等发布系统性综述
- Nature:OpenAI推出AI研究助手,深度综述能力引发学界关注
- 10 个自动化日常任务的 Python 脚本
- 为什么DeepSeek由一个初创公司开出来而不是国内互联网巨头?DeepSeek的神回复
- 互联网和人工智能是否影响我们的记忆?科学怎么说
- 遇事不决,问python “fuck”~
- 知乎热议:博士的年薪一般是多少万?
- 8K star!从0开始,动手训练一个大语言模型
- DeepSeek-R1大模型本地部署的三种方式,总有一种适合你
- DeepSeek-R1复现方案解读之「Open-R1」
- 深入浅出,DeepSeek 蒸馏技术深度解析!
- 基于 YOLO 检测,YOLOv8、v9、v11及混合模型深度剖析 !
- Gemini 2.0霸榜,价格卷哭,性价比新王诞生!
- 2025年百度飞桨(张江)赋能中心入驻申请启动!
- 聊聊R1模型的强化学习训练——从Open R1来看如何训练DeepSeek R1模型
- 国产模型再秀硅谷!阿里Qwen2.5-Max数学、编程能力全球第一
- 图解DeepSeek R1训练流程
- DeepSeek R1: 理解 GRPO 和多阶段训练
- DeepSeek太敢骂了!怒斥其它大厂:躺在流量金山上吃老本的废物
- 【AIGC应用】今年春节,到处都是AI机器人
- 【智谷要闻】科技未来——智谷AI
- 【AIGC趋势】复刻科比、C罗、詹姆斯招牌动作
- 【行业动态】Mate重组生成式AI团队,商汤SenseNova-5o大模型开放商用,限时免费
- 突发!美国新法案,DeepSeek被政府禁用
- 清华、东大等发布EMAGE,音频自动生成动作丰富的视频
- 实体机器人Figure AI宣布与OpenAI结束技术合作
- 极客说|利用 Azure AI Agent Service 创建自定义 VS Code Chat participant
- 阿里副总裁,否认投资Deepseek消息
- 新增AI Agent,GitHub Copilot重大更新,超强自动化编程
- OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek
- OpenAI联创Schulman闪电跳槽!从Anthropic转投Murati新公司
- 钉钉真勇!率先接入DeepSeek,阿里系第一个吃螃蟹
- 被DeepSeek带火的知识蒸馏,开山之作曾被NeurIPS拒收,Hinton坐镇都没用
- 吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测
- 全球顶级AI科学家许主洪加盟阿里!IEEE Fellow,五万被引论文数,曾任Salesforce集团副总裁
- Pika新功能可以往视频里添加一切!网友:每月省5000美元
- 免费功能卷翻付费版ChatGPT,欧洲AI新贵叫板OpenAI
- 中国AIGC产品全景图谱全面征集|量子位智库
- 训练自己的R1,仅需7GB显存~
- 仅50美元!斯坦福团队复制出OpenAI o1 和DeepSeek R1
- 刚刚,GitHub Copilot 变身自主行动工程师!轻量版Devin来了?
- 仅817样本超越o1-preview,上交大LIMO”少即是多”推理新范式
- 探索从传统检索增强生成(RAG)到缓存增强生成(CAG)的转变
- Deepseek成功启示:从 TRPO 到 GRPO训练LLM
2025-02-06
- 可视化角度具象化理解DeepSeek-R1类推理大模型的习得进程
- 深度学习面试高频问题解析:CNN与ANN的核心差异
- 今日开源(2025-02-06):仿真机器人项目ASAP,HumanoidVerse框架赋能,推动人形机器人技能跨平台迁移
- 【源头活水】杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距
- 李建忠:DeepSeek 关键技术创新及对 AI 生态的影响
- 互联网和人工智能是否影响我们的记忆?科学怎么说
- 等不到 OpenAI 开源了!5 个工程师 24 小时手撸免费版 Deep Research,效果直追正主、过程全公开
- 观点博弈:我们还应该期待AGI吗?
- 冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂
- 数学真理的极限在哪里?希尔伯特第十问题扩展版得到证明
- LLaVA-Mini来了!每张图像所需视觉token压缩至1个,兼顾效率内存
- AAAI 2025 | 大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路
- 突发|刚加入Anthropic的OpenAI联创John Schulman,又离职了!
- 每人50万英镑,Hinton、Bengio、黄仁勋和李飞飞等获得伊丽莎白女王工程奖
- 817样本激发7倍推理性能:上交大「少即是多」定律挑战RL Scaling范式
- LLM自主发现发表在Nature上的科学假设?ICLR 2025 论文MOOSE-Chem深度解析
- Nature报导:研究人员如何使用 AI?科学领域利弊调查分析
- 2024 年 AI 十大故事,透视技术变革与未来挑战
- 我论文的一作变成了导师女儿…哪个瞬间你对学术圈彻底失望了?
- 顶刊TPAMI 2025!清华提出Hyper-YOLO,目标检测+超图计算实现新SOTA
- 我做了一个AI数据分析网站
- 全方位拥抱DeepSeek【下集】
- 讲透一个强大算法模型,随机森林!!
- 马斯克:3 年内我要造 50 万机器人,人形机器人会让钱失去意义
- 全解DeepSeek,它为何突然爆火?
- 同事年底绩效是C,提离职领导死活不让走,后来领导私下说:他走了,就没人背这个绩效了。
- 4000字!深度解析 DeepSeek 的蒸馏技术
- 用 OpenCV 去除图片中的水印,骚操作!
- 再也不用担心过拟合的问题了
- 部署满血DeepSeek R1的避坑指南-vLLM 0.7.1
- YOLO 家族大对决:YOLOv11 与 Transformer 称霸两类目标检测 !
- 单卡4090,运行DeepSeek r1 671b经验分享
- Deepseek R1 Zero复现全过程记录
- 聊聊DeepSeek R1的一些总结
- 基于大语言模型智能体的社交媒体舆情模拟
- 手把手带你实战部署DeepSeek-R1大模型在手机安卓端、linux端、windows端 !没有GPU也行!
- OpenAI急了!免费开放ChatGPT搜索,无需注册!
- DeepSeek官方提示词库,90%的人还不知道,赶紧收藏起来!
- 传疯了!25页DeepSeek完整使用手册!
- 终结谷歌搜索!OpenAI免费开放ChatGPT搜索,无需注册
- 英特尔开源RAG Foundry 框架,可增强多种RAG用例
- 多模态版DeepSeek-R1:评测表现超GPT-4o,模态穿透反哺文本推理能力!北大港科大出品,已开源
- 力压DeepSeek-R1!谷歌Gemini 2.0系列集体上新,全员跻身大模型竞技场前10
- DeepSeek超ChatGPT成全球增长最快AI应用!下载破4000万,日活超豆包登顶中国No.1|量子位智库
- 大神卡帕西拿DeepSeek R1讲强化学习!最新大模型内部机制视频爆火,“没有技术背景也能看懂”
- DeepSeek无问西东!先行者早已趟平全国产之路
- 成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏
- 三大竞赛引爆CVPR’25协作智能Workshop全方位探讨多智能体具身系统新机遇,总计1万美元奖金等你来拿
- 招聘 | 量子位AI大模型等3大方向编辑作者
- 只需50美元!最简单的推理扩展方案,效果媲美o1!
- 重磅!Gemini 2.0全家桶发布:Flash免费用,Pro会写代码,还有一个便宜货
- 对DeepSeek的五大误解!
- 从DeepSeek R1看推理模型的四种进化路线
- 仅1k样本超越o1,媲美DeepSeek-R1蒸馏模型,李飞飞新作s1发布
- ChatGPT Deep Research:人工智能研究领域的新突破
- S1:仅1k样本,使用测试时扩展(Test-time Scaling)超越OpenAI o1-preview性能
2025-02-05
- 大模型SFT负责记忆、RL负责泛化:兼看多模态GraphRAG之Video方案
- 手撕Transformer模型:分步骤数学实例解析
- 今日开源(2025-02-05):阿里达摩院发布VideoLLaMA3,2B和7B参数两种模型,视频图像多模态理解表现SOTA
- 刘知远:DeepSeek 的大胜,揭示了 OpenAI 的傲慢之罪
- Nature重磅文章: 为什么 100 年后物理学家仍然不理解量子理论!
- “针对的就是 DeepSeek!”美国空前力度打压中国 AI:只要下载中国开发模型就可获 20 年监禁或百万美元罚款!
- 研究:尽管关系紧张,但中美AI研究合作过去10年仍然活跃而顺利
- 突发!人形机器人Figure宣布与OpenAI终止合作
- 自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言
- 训练1000样本就能超越o1,李飞飞等人画出AI扩展新曲线
- 70年AI研究得出了《苦涩的教训》:为什么说AI创业也在重复其中的错误?
- ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2
- AI「视觉图灵」时代来了!字节OmniHuman,一张图配上音频,就能直接生成视频
- 清华团队 AI 光学计算新突破:光谱卷积神经网络芯片,数据吞吐量降低了96%!
- 光中介层可能在 2025 年开始加速 AI
- PyCharm接入DeepSeek实现AI编程
- DeepSeek心目中的中国大学排名
- 【深度学习】突破CNN!时间序列分类 !!
- 一行Python代码,数据集转化为交互式可视化分析工具
- 【附复现代码】基于PINN的论文创新思路
- DeepSeek研究报告,PDF下载
- matplotlib图表局部区域放大
- 刚刚 ChatGPT o3-mini 国内彻底开放了!
- 一个算法工程师复现算法的踩坑总结
- 用深度学习的方式融合各种信息
- DeepSeek实习感受与大模型择业思考
- 完整DeepSeek-R1 671B本地化部署,详尽教程来了!
- 3个DeepSeek 复现经验心得汇总
- 时序异常算法对比 (VLDB 2024)
- 开工大吉!文心一言送“福”来
- 聊聊DeepSeek R1的开源复现库——Open R1之合成数据
- Deepseek R1 Zero成功复现, 三阶段RL,Response长度涨幅超50%,涌现语言混杂,double-check
- LightTransfer:将你的LLM轻松转为Hybrid model,增强o1-like长文本生成能力
- 有可能一人搞定CPU、操作系统、编译器吗?
- 小红书提出新面部视频交换方法DynamicFace,可生成高质量且一致的视频面部图像。
- Github热门机器学习笔记:「从零构建大型语言模型」
- 国家队下场支持!DeepSeek上线超算平台,再也不用担心服务器繁忙了!
- 291-A1|修正梯度引导,DiT加速;文生图安全问题(概念擦除,防止NSFW内容生成,社会偏见问题)
- 291-A2|基于扩散潜在束搜索优化文生视频的提示对齐度,灰度视频着色化;音乐驱动图像动画化,主题感知视频对话制作
- 291-A3.1|基于多智能体的3D空间电影制作自动化;物理交互3D动态合成,基于拖拽的3D场景编辑;程序化材质生成,文生CAD
- 291-A3.2|可控动作生成,实时动作生成,运动扩散自编码器与空手道,共语姿势生成
- 291-B1|将一切模态都视为像素,室内空间推理;利用自由手绘草图提升复杂图像分割,视觉自回归图像超分;事件引导的图像信号处理
- 291-B2|焦点渲染;多视角几何扩散,可变形Beta溅射,基于光线追踪的GS,表面重建,手部重建;语言引导场景分割,点云补全
- 美国新法案:禁止进口中国DeepSeek,违规罚1亿美元、监禁
- 全球最高!50万师生使用ChatGPT,美国教育彻底变天了
- OpenAI突遭人形机器人独角兽解约,网友:不会改用DeepSeek了吧?
- 谁还没发现微信好友里的“卧底AI”:你以为它只会做红包封面?
- 宇树机器人成赛博科比!英伟达CMU新研究,投篮模仿篮球巨星,代码论文全开源
- 热搜第一!DeepSeek百万年薪招AI人才,实习生都能月入过万
- DeepSeek R1/o1大型推理模型蓝图:架构设计及快速原型实现!
- 魔幻现实之:美国人下载DeepSeek 将坐牢20年?!
- Deep Research 开源版来了!立省200美元
- 传言称Grok-3延迟!但马斯克仍手握最强算力
- OpenAI Deep Research被huggingface 24小时复现开源了,冲~
- RAG圈的DeepSeek,中科院DeepRAG让大模型带着“思考”检索,性能提升21.99%
- Paper Review: DeepSeek-R1——强化学习驱动的大语言模型推理能力提升
2025-02-04
- 多模态GraphRAG的一点思考:兼看多模态大模型用于数据增强总结
- 17 岁移民、不懂大模型,但他靠 AI 逆袭!一夜之间到账数十亿,这个小众赛道赚麻了!
- 免费!潞晨携手华为昇腾,国产算力DeepSeek R1推理API及云镜像服务来了
- 不到24小时,开源版Deep Research疯狂来袭!一月少花1400
- Go语言开发AI智能体有多丝滑?字节重磅开源Eino框架,内含保姆级教程
- 人工智能会彻底改变药物研发吗?这取决于如何使用
- 革新疾病预测:释放 AI 和机械模型的力量
- 点赞!DeepSeek梁文锋的硕士论文下载
- 手把手带你用DeepSeek-R1和Ollama搭建本地应用,一文搞定!
- 打破校史:北京211,发表建校72年来首篇Nature!
- 突发!谷歌被立案调查!
- 博士后逃生学术界,揭秘残酷真相!
- 与孙正义对话,Sam Altman正面回应DeepSeek:”OpenAI投入多少,AI智能就有多强”(附视频)
- 即插即用,轻松涨点!把大牛的模块缝合到自己的paper里
- 点赞!DeepSeek 梁文锋的硕士论文下载
- 真假?美国下令全面封杀中国AI?!下载DeepSeek,最高判20年监禁…
- 基于OpenCV的实时睡意检测系统
- DeepSeek解析,速通DeepSeekV1~V3核心技术点!
- 请立即拿下软考证书(政策风口)
- 深入解构DeepSeek-R1!
- 腾讯AI Lab联合苏大上交提出:少切思路多挖矿,让o1类LLM做题不再「三心二意」
- 新突破!xJailbreak:用强化学习「越狱」大模型,可解释性黑盒攻击来了
- Chirpy3D:用于创意 3D 鸟类生成的连续部分潜在特征
- 实时高保真人脸编辑方法PersonaMagic,可根据肖像无缝生成新角色、风格或场景图像。
- 深度求索:探寻风暴之眼
- Sam Altman炸场东京,亲曝GPT-5研发路线图,多模态能力颠覆传统
- 华为昇腾推理DeepSeek-R1,性能比肩高端GPU,API免费无限量!潞晨自研推理引擎出手了
- 杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距
- o1/r1的风吹到了多模态,R1-V开源!
- 爆料:Anthropic 有比o3 更强的模型,但不敢放出来
- TinyZero:首个DeepSeek R1-Zero超低成本复现,不到30刀!
- RL崛起,SFT已死?仅用1/140成本,批判微调CFT媲美DeepSeek-R1复现模型
- 利用自适应Prompt Engineering增强 RAG 系统:优化信息检索与处理能力
- 大模型(LLM)专家精通之路(含学习路线图、书籍、课程等免费资料推荐)
2025-02-03
- OpenAI深度研究”Deep Research智能体及大模型故事自动分析、配音应用尝试
- HULC-2丨非结构化数据的具有视觉可供性标定语言
- ECCV 2024,全新激活函数!
- 【他山之石】ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述,覆盖主流基准库、模型
- 【源头活水】DEIM: 在DETR中使用多对一匹配的策略加快收敛
- 【他山之石】AAAI 2025|如何高效桥接视觉和语言,字节&中大提出全新多模态大模型连接器ParGo
- 【源头活水】NeurIPS 2024 | 超越KL!大连理工提出WKD:基于WD距离的知识蒸馏新方法
- 二十问拆解 DeepSeek:一场针对制裁的算力游击战
- 清华等团队推出 UltraRAG 框架全家桶,让大模型读懂善用知识库!
- o3-mini之后,OpenAI又紧急上线Deep Research,能连续思考半小时输出万字回复!压力给到了DeepSeek?
- 刚刚,OpenAI上线Deep Research!人类终极考试远超DeepSeek R1
- 多重可控插帧视频生成编辑,Adobe这个大一统模型做到了,效果惊艳
- 解放双手!OSCAR让操作系统交互实现自然语言「自由」
- No More Next-Token Prediction?
- 字节跳动BitsAI-CR:基于LLM的代码审查系统技术揭秘
- AI for Science:北大、东方理工等团队用人工智能在实验数据中挖掘潜在规律
- 医疗AI的隐形危机:大语言模型过度自信,如何破解?
- 离谱!大学教授抄袭50年前的计算机博士论文!网友:哈?50年前的论文到了今天还有创新性?
- 一夜之间,微软、英伟达、亚马逊全部接入DeepSeek!
- 【机器学习】通透!数据标准化与归一化 !!
- 机器学习中25个最重要的数学定义(公式、代码实现)
- AI世代年轻人生存指南:重构竞争力的五大进化维度
- DeepSeek真实水平全面客观分析
- 在VSCode中免费使用DeepSeek-R1!
- 2025泰晤士世界学科排名公布!
- 你的学校上榜了吗?DeepSeek中国大学排名Top100
- (附代码)在OpenCV中基于深度学习的边缘检测
- 博士如何高效率阅读文献?有哪些技巧可以借鉴?
- 拖动图像编辑再升级!北大、腾讯提出DragonDiffusion,在扩散模型上启用拖动式操作。
- 超越DragDiffusion!哈工程联合南大提出FastDrag:可以几秒内完成基于拖动的图像编辑。
- InstantDrag:仅需图像和拖动指令作为输入,在大约一秒内实现高质量的图像编辑。
- StableDrag:一种基于Diffusion模型的图像编辑,可一键拖拽生成,DragGAN被革新了!
- 快手发布DragAnything,拖动锚点精准控制视频物体和镜头运动,视频运动控制技术革命性更新
- 288-A1|在不同模型之间迁移LoRA模块,多样化外观与照明条件下的肖像个性化,360°全景图生成,虚拟试衣DiT
- 288-A2|基于级联LDM的高效高质量视频生成,物理引导的卡通动画化,运动与外观分离的视频运动定制化
- 288-A3|图像扩散用于可扩展3D高斯生成,逆程序化点云到建筑抽象,单图重建点云;轻量级物理感知可控动作生成,动作文本联合生成
- 288-B|评估VLM物理世界理解的综合性基准测试,显式时间建模用于视频理解;单目视频流预测未来时刻4D场景表示
- 289-B|3D开放世界分类;3D多物体移除,3DGS用于人群渲染,基于特征的几何损失改善3DGS重建的几何准确性
- 290-A1|用于文生图的线性DiT,基于草图的产品设计原型迭代探索工具,视觉生成式AI的综合性研究;AI生成音视频内容质量评估
- 290-A2|基于视频扩散的逆向与正向渲染,基于自适应细节迁移的逆向渲染;文本到运动生成
- 290-B|多模态域适应与泛化的综述;探讨EEG抑郁症检测的公平性问题;视频字幕生成;点云基础模型综述,改善3DGS光照交互表现
- OpenAI反击DeepSeek!刚发布新模型Deep research,刷新最高记录
- OpenAI紧急加播:ChatGPT上新深度搜索,持续思考30分钟输出1万字,刷榜“人类最后的考试”
- 新研究揭示DeepSeek/o3弱点:频繁切换思路放弃正确方向,最短答案往往就是对的!
- 5人创业国产AI搜索火了,小红书Reddit都在推!创始人:我们比Perplexity留存更高
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 竟用智能体DeepResearch对比DeepSeek R1模型,OpenAI急了?
- 主打低延迟Agent,Mistral Small 3开源,24B媲美70B!
- 知识蒸馏(Knowledge Distillation, KD):AI 领域的关键技术与发展趋势
2025-02-02
- QwenVL用HTML表示文档及o3-mini与DeepSeek-R1在安全性上的对比
- 2025副业赋能、AI视频、AI爆文,一起火,和老表绑定成长!!!
- 奥特曼承认DeepSeek削弱OpenAI地位,特朗普、黄仁勋再限芯片出口;除夕给表白员工发钱,CEO称促成几对情侣|AI周报
- 让大模型读懂善用知识库!清华等团队推出 UltraRAG 框架全家桶
- o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
- 完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
- 全面梳理200+篇前沿论文,视觉生成模型理解物理世界规律的通关密码,都在这篇综述里了!
- 为什么让大模型理解「内外远近」更重要?
- 成功率达100%,上交团队提出AI辅助的酶热稳定性工程策略,设计热稳定性的组合突变体
- 全方位拥抱 DeepSeek,本地部署、AI编程、辅助写作、网页/PDF全文翻译
- 饶议科学:关于 DeepSeek,给少数海外华人的两句忠言
- o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
- DeepSeek薪资待遇曝光!
- DeepSeek-V3细节探索
- 一文玩转本地化部署DeepSeek!
- 基于国产芯片的DeepSeek R1&V3,手机版推理使用教程!
- 287-A1.1|主题特定图像定制化,FaceID定制化,虚拟试衣;无引导视觉生成,基于2DGS的图像“标记”化
- 287-A1.2|肖像抠图,提示感知可控影子去除,草图查询图像分割;文生图安全性(概念擦除,性别偏见)
- 287-A2|视频重光照,评估人体姿势迁移模型在人类动作视频生成中的表现
- 287-A3|360°全景图与3D网格纹理生成,为3D模型分配PBR材质,身体对齐的可穿戴3D资产生成,3D虚拟试衣
- 287-B1|专利图形描述生成,VLM后训练数据策略,视频理解;光学化学结构理解用于分子科学发现
- 287-B2|为任意长度视频估计3D相机姿态,基于线性原语的可微分体积渲染;单图生成逼真人类NVS;文生动作,可控手部抓取生成
- 被DeepSeek干服了!OpenAI承认闭源错误,领先优势变小
- DeepSeek华为火线联手!硅基流动首发即限流,全国产API白菜价,零门槛部署
- 国产AI搜索接入DeepSeek-R1,深度试玩报告抢先出炉:正愁用不上官方联网搜索
- 招聘 | 具身智能机器人方向全职作者
- R1/o1的风又吹到了RAG,微软CoRAG高达93%的复杂推理效果~
- DeepSeek-V3、Qwen2.5、Llama3.1、Claude-3.5 与 GPT-4o 的全方位比较
2025-02-01
- RAG前沿进展:多抽象层级chunk及对齐机制的ARM实现思路
- ICLR’25高分!多尺度时间序列全面升级!超越Transformer,8项任务全面领先
- 目标检测除了改YOLO没得做了?来看看这些一投一个准的高区idea!
- 【源头活水】GAN归来:模型大幅简化,训练更稳定,逆袭扩散模型,AI社区疯传
- 通过无限的后训练『补丁』,就能实现AGI吗?
- 万字长文解读Scaling Law的一切,洞见LLM的未来
- 硅谷对中国AI公司的焦虑越来越重,不只是因为DeepSeek:2025这些赛道更值得关注
- ICLR 2025 | 极性感知线性注意力!哈工深张正团队提出PolaFormer视觉基础模型
- 赛博树突觉醒!AI 仿生革命:更少参数,更强性能,过拟合?不存在的!
- Nature发布:2025年值得关注的七项技术
- 科研经费排名:武大暂列第一,超50所高校经费破亿!
- 黑马来袭,小扎坐不住了,2025年投入4000亿,年底AI算力将达130万卡
- 奥特曼被逼急:深夜上线 o3-mini,甚至免费,网友:还是选DeepSeek
- DeepSeek突围奥秘曝光,天才集结,开出千万年薪
- 就在刚刚,o3-mini 急上线!奥特曼率队深夜血战 DeepSeek!ChatGPT被挤爆!
- DeepSeek 最新中国大学排名
- 财政部官宣: 国家奖学金,涨了!
- 迈向GPT-4o,多模态大模型杀回来了!
- 深度求索DeepSeek-R1详解
- 收到Deepspeed关于zero3实现差异的回复
- 革新在线购物体验:CatV2TON引领虚拟试穿技术新纪元。
- 厦门大学联合网易提出StoryWeaver,可根据统一模型内给定的角色实现高质量的故事可视化
- 使用阿里云 PAI 平台云上一键部署 DeepSeek-V3 模型教程。
- 286-A1|图像风格与内容迁移,产品广告图像设计生成,为特定任务找到合适的生成模型,多主体fMRI图像重建的隐私保护与个体差异
- 286-A2|人类视频抠图,从视频中学习层次化组合性世界表示,扩散视频生成水印化,音频驱动说话头动画化
- 286-A3|艺术网格生成,室内场景纹理生成,近二阶收敛3DGS,自动驾驶场景理解与生成
- 286-B1|模拟人类解谜能力,动态修剪策略优化VLM计算效率,VLM用于增强现实AR场景理解
- 286-B2|3D重建系列
- 刚刚,OpenAI发布o3-mini,可免费使用、3大推理模式
- 麻省理工大佬: DeepSeek是科技史上伟大时刻,5年后依旧难忘!
- 首个OpenAI免费推理模型o3-mini发布!DeepSeek让奥特曼反思:不开源我们错了
- DeepSeek点燃国产大模型斗志,RAG等核心技术被重估
- 2025,见证更多GenAI应用落实!今年的中国AIGC产业峰会来啦
- o3-mini 和 DeepSeek-R1:哪一个更安全?
- 让DeepSeek-R1/o1思考 “走心” ?腾讯AI深度拆解
- 微软开源大模型MarS:直接模拟了整个金融市场
- DeepSeek vs. ChatGPT vs. Gemini:三大LLM的全面对比
2025-01-31
- 姚期智团队开源新型注意力机制!降本90%…2025发顶会还得靠Attention
- Deepseek R1可能找到了超越人类的办法
- Cursor神器助力,三月速成AI APP狂揽万用户,编程门槛真降低了?
- AI语言模型的「人脑模式」:增量上下文机制如何让机器读懂长文本?
- DeepSeek R1有没有赶上OpenAI o1? 八大场景测评结果出炉
- 微软前脚调查DeepSeek,后脚火速上线
- 一位英伟达北京分公司员工晒出了工资条,总薪酬1688万,个税687万,月薪11.43万,基础年薪100万,剩下全是股票分红…
- ResNet潜力都挖掘出来了吗?
- PyTorch深度学习训练可视化工具tensorboardX
- 一个例子搞明白机器人坐标系变换
- 耶鲁大学和Adobe提出SynthLight:智能重塑人像照明,打造完美光影!
- 单幅图像合成 360° 3D场景的新方法:PanoDreamer,可同时生成全景图像和相应的深度信息。
- 腾讯 | 中科大提出Make-It-Animatable:一秒内可将任何3D人形模型变成动画角色
- 受DeepSeek影响,OpenAI正洽谈新一轮融资,估值3000亿美元!
- 【手撕GRPO】你只管给Reward, 剩下的交给RL(附代码)
- 卡住DeepSeek的脖子,不足为虑~
- 一篇最新大模型GraphRAG技术系统性综述
- 7个原因解析:DeepSeek如何仅用5%预算就能超越OpenAI?
2025-01-30
- XGBoost,梯度提升的机器学习 Python 神库!
- Sam Altman 最新对话:当 AI 已经比人类更聪明,我们该思考什么?
- 这才是DeepSeek的正确使用方式!核心思路,OpenAI首席研究官亲自证实!
- DeepSeek 更值得被关注的是R1-Zero,强化学习(RL)比人类专家标注的监督微调(SFT)更靠谱
- 美国正对DeepSeek开展国家安全调查
- Jay Alammar:图解 DeepSeek-R1
- 回顾!华为天才少年谢凌曦:关于视觉识别领域发展的个人观点!
- 计算机视觉深度学习训练推理框架
- 笔记 | 深入理解Transformer
- DeepSeek开源多模态模型Janus-Pro的ComfyUI使用教程,文中附模型和工作流下载。
- OpenAI怀疑DeepSeek使用其模型,蒸馏R1
- DeepSeek R1/o1大型推理模型蓝图:架构设计及快速原型实现框架x1
- DeepSeek Janus-Pro:多模态AI模型的突破与创新
2025-01-29
- GraphRAG技术再总结及COT结合RAG实现思路
- [有人@我]🧧新春红包派送中…祝大家新的一年,好运连连!
- 【他山之石】原来,这些顶级大模型都是蒸馏的
- 被“逼急”的中国团队,如何3天震塌硅谷AI帝国?
- 这届春晚开始拼技术了!AI大模型绝美定格、机器人扭秧歌,云使用量达历年之最
- 卡内基梅隆学霸卖爆8千元AI鞋,现回浙江老家继承家业!曾在劳斯莱斯一年做到leader
- David Baker 利用 AI 设计蛋白质,一招制蛇毒,或将彻底改变蛇咬治疗
- 扭秧歌转手绢,人形机器人亮相春晚,导演为张艺谋!宇树科技:通过AI算法强化学习,花了近3个月排练
- 大学教授,降级
- 可能是全网最全的速查表:Python Numpy Pandas Matplotlib 机器学习 ChatGPT等
- 吴恩达新课,我毕业了
- 阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏
- “DeepSeek 甚至绕过了 CUDA”,论文细节再引热议,工程师灵魂提问:英伟达护城河不存在了?
- 阿里除夕发布 Qwen2.5-Max 反超 DeepSeek V3,一句话开发小游戏
- 全球热议 DeepSeek:复现狂潮如何改变游戏规则!一文汇总复现项目!
- 【深度学习】深入浅出卷积神经网络及实现!
- DeepSeek“人均百万”传言引爆求职热潮,非算法岗应届生年薪百万!!
- DeepSeek开源Janus-Pro-7B:多模态AI模型性能超越DALL-E 3 和 Stable Diffusion 3!
- 一个LoRA同时处理内容和风格?UIUC提出UnZipLoRA,可同时训练两个LoRA,与原有LoRA兼容。
- 看完唐探1900,我让DeepSeek写了这篇影评
- Sam Altman狂赞中国大模型DeepSeek,OpenAI有这对手很兴奋!
- DeepSeek-R1直接把提示工程师的饭碗整没了
- 增强RAG系统落地效果的9条最佳实践
- 深度解析 DeepSeek R1:强化学习与知识蒸馏的协同力量
2025-01-28
- 春节前的多模态大模型开源礼:Janus-Pro、VideoLLaMA、Qwen2.5-VL等
- 对话 Makepad 之父 Rik Arends:顺 AI 者昌,逆 AI 者亡
- 实现5Å全原子RMSD,普渡大学深度学习方法准确预测RNA三级结构,登Nature子刊
- 2025,DeepSeek崛起!英伟达一夜市值蒸发近6000亿美元
- 全球掀起 DeepSeek 复现狂潮,一文汇总!
- DeepSeek引发硅谷恐慌:它正向西方AI巨头发起挑战
- 496GB 显存!最壕 DeepSeek 玩家 8 台 Mac 跑 R1
- DeepSeek 发布多模态 Janus-Pro !纳斯达克这个年不好过了
- 「感谢读者一路同行,2025一起解锁AIGC的更多惊喜!」来自AIGC Studio的新年祝福~
- 【DeepSeek AI】Janus-Pro: 数据与模型扩展的统一多模态理解与生成
- 新年大礼!阿里刚开源视觉 AI Agent模型—Qwen2.5-VL
- DeepSeek又开源Janus-Pro,7B多模态强势登顶,OpenAI彻底慌了
- 组团开源,Qwen2.5-VL转角遇见DeepSeek Janus-Pro!
- 大模型(LLM)工程师实战之路(含学习路线图、书籍、课程等免费资料推荐)
2025-01-27
- AI搜索引入深度思考会怎样?从Deepseek联网搜索案例出发
- 专为科研人设计的新春红包封面,限量免费领!
- MATCH POLICY:从点云配准到操作策略的简单流程
- 【他山之石】创造历史!DeepSeek超越ChatGPT登顶中美AppStore
- 对话英伟达 AI 大牛 German Ros:端到端技术将颠覆万亿市场,开源模拟才是胜负手!
- DeepSeek“人均百万”传言引爆求职热潮,非算法岗应届生年薪百万,HR简历收到手软
- 一文读懂!多语言大模型数据研发在大模型时代的实战全解
- DeepSeek震动硅谷AI圈,GPT-5还秘而“不发”?7千亿利润奥特曼都看不上了
- 验证速度提升25倍,准确率达95.1%,清华团队提出基于物理信息学习的电池衰减预测方法
- 《自然》发文:中国廉价、开放的人工智能模型DeepSeek让科学家们兴奋不已
- 耶鲁大学教授:研究生做科研的“11条军规”
- 嫌Matplotlib繁琐?试试Seaborn!
- 如何看北京理工大学珠海学院(独立学院)毕业生冒充北理工(985)去应聘,被拒后反骂HR学历歧视?
- 在 Python 中使用 OpenCV 模块对图像进行基本操作
- YOLOv5训练自己的数据集(超详细)
- Open-R1: DeepSeek-R1 大模型开源复现计划
- 探索一个关于deepspeed zero3的认知误区
- 知识工场实验室近期录用论文一览(一)
- 知识工场实验室近期录用论文一览(二)
- RAG与CAG的较量与融合
- 英伟达开源4K图像生成模型Sana,可在16G显存电脑部署,支持ComfyUI和LoRA训练。
- 复旦&字节提出layout-to-image新范式,支持基于布局的MM-DiT架构下可控图像生成!
- SHMT:通过潜在扩散模型进行自监督分层化妆转移(阿里&武汉理工)
- 提出街景定位大模型AddressCLIP:一张图实现街道级精度定位!
- 当我问DeepSeek为啥年轻人不愿意生孩子了,答案很扎心
- 白宫官宣!特朗普新命令,消除一切不利AI发展的障碍!
- 2025年Meta投资600亿美元,用于AI基础建设
- Qwen,永远不会缺席!百万上下文模型开源
- 阿里Qwen2.5-1M开源,仅320G可推理14B百万token
- 成功率97.8%!中科院PPTAgent模拟人类制作流程,高质量PPT轻松搞定
- 图像人体部位修复模型之RealisHuman
- 瓦力算法1月第4周急招岗位| 微软 / 豆包 / 哔哩哔哩 / 地平线 / 小红书 / Atlassian / 格灵深瞳 /京东
- 基于 DeepSeek R1 和 Ollama 开发 RAG 系统(含代码)
- 微信红包封面免费赠送啦
2025-01-26
- 百川开源医疗大模型Baichuan-M1-14B及Deepseek R1热:兼看RAG用于ASR纠正
- 全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻
- 【源头活水】2025年Next Token Prediction范式会统一多模态吗?
- 【源头活水】中国AI太强,Meta工程师吓疯?自曝疯狂熬夜复制DeepSeek,天价高管心虚了
- 《自然》发文:中国廉价、开放的人工智能模型DeepSeek让科学家们兴奋不已
- DeepSeek利空算力?
- 2025智能体元年!斯坦福科学家8000字讲清所有要点
- 对话诺奖得主:想洞悉意识、梦境、时间问题,或需靠AGI级别的技术
- DeepSeek-R1持续刷屏,连Open R1都来了!抱抱脸发起,1天狂揽1.9k星
- P7只拿1400元,用友年终打骨折;哇哈哈现场给员工分房;老板阴阳员工,紧急公关:奔驰接送员工上下班 | AI周报
- 微软研究院开源AIOpsLab:一个AI驱动的云运维框架
- DARWIN 1.5 来啦!材料设计通用大语言模型,刷新多项实验性质预测记录
- 如何看北京理工大学珠海学院(独立学院)毕业生冒充北理工(985)去应聘,被拒后反骂HR学历歧视?
- 一文详尽之LLM-Based Agent
- 图灵奖得主杨立昆谈中国AI进展:中国科学家非常优秀 令人印象深刻
- 马斯克Boss直聘:不看学历,只看代码
- 英伟达RTX 5090评测解禁,AI 能力太强了
- 红包封面上线(round2)
- 开源版「B站」,火了!
- 开发算法的痛点是什么
- 基于OpenCV的焊件缺陷检测
- 对象检测:模板匹配
- Kimi k1.5上线喽,我把2025年“南外杯”数学竞赛题甩给了它。。。
- 聊聊DeepSeek R1的知识蒸馏与应用思考
- 30分钟vscode入门指南
- ICML 24 因果推断论文调研
- 【HuggingFace项目】:Open-R1 - DeepSeek-R1 大模型开源复现计划
- 浙大 | 腾讯 | 华为提出视频生成框架VideoMaker,可由参考图实现Zero-shot定制化视频生成。
- 一键脱衣?TryOffAnyone:从人像输入中生成高质量平铺服装。
- 腾讯优图提出首个基于DiT的高保真虚拟试衣算法FitDiT
- 单张照片生成3D头部模型!Adobe提出FaceLift,从单一人脸图像重建360度头部模型。
- Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!
- 泰国总理竟然也克隆了自己的数字人,而且还是说中文的
- 285-A1.1|单提示角色一致性问题,CoT推理用于自回归图像生成,评估文生图模型,单光栅示例图合成矢量纹理
- 285-A1.2|长袖服装非刚性编辑,协同服装合成;多尺度因子化高效扩散模型,多潜变量生成模型
- 285-A2A3|人类反馈改善视频生成,身份保留人类视频生成;多概念定制化3D生成,单次前向过程实现千张无序无位姿图像到3D重建
- 285-B1|GUI智能体;长视频理解,流媒体视频理解,多学科专业视频知识获取的评估基准
- 285-B2|用于细粒度视觉理解的像素级图像描述数据集,神经视频压缩;LoD 3DGS压缩,从运动模糊视频中重建3D人类
- 284-A1.1|扩散模型推理加速,线性DiT高分辨图像生成计算复杂性问题;鲁棒表示一致性模型
- 284-A1.2|文生图精确相机控制;单图3D物体操控,文本到RGB+深度+表面法线图的联合生成
- 284-B|图像视频理解;现实世界NeRF综述,基于离散小波变换的少样本NeRF,高效3DGS
- 首个DeepSeek-R1全开源复现Open-R1来了
- 微软:100款 GenAI 产品安全测试背后的 8 条教训与 5 个案例总结!
- DeepSeek-R1 蒸馏模型及如何用 Ollama 在本地运行DeepSeek-R1
- DeepSeek R1:开启 AI 推理新时代的开源先锋
2025-01-25
- RewardRAG引入奖励模型与强化该怎么做?两个思路和评估数据集
- 学会这种多尺度特征融合思路,CCF A和SCI一区还不是小菜一碟!
- 隐私交给协作平台太可怕、少刷短视频已成全民共识?玉伯、汪源共论AI应用变革 | 万有引力
- 2026年AI将全面超越人类?达沃斯最强大脑预警:未来2年迎来颠覆性变革
- 做 CTO 还不如自己干?他靠独立开发赢得平静自由的生活,收入比当 CTO 还高!
- 贾佳亚团队 x Adobe提出GenProp,物体追踪移除特效样样在行
- 「定制化」结合蛋白质,几何深度学习方法加速开发精准药物,登Nature
- 锌电池「返老还童」:电子科大联手湖北大学破解枝晶难题,效率提升99.95%!
- 钟睒睒:捐400亿,建新大学!
- 2025泰晤士世界学科排名公布!
- 2025泰晤士世界学科排名公布!北大第一、浙大第二
- 推荐这几个Python实战项目,瞬间读懂Python!
- OpenAI 突发 Operator!完全自主玩转浏览器,奥特曼:Level 3 时代开启
- 收藏 | Pytorch实现Canny边缘检测
- 为什么博导都希望,自己的博士生毕业也去高校当老师?
- 详解遗传算法 GA(Python实现代码)
- Kimi k1.5 解读及技术报告中文版
- Deepseek-R1 & Kimi-1.5读后有感 | 大道至简的o1
- 用20%的金字塔原理就能带你学会基于Pytorch的深度学习!
- 使用cursor开发小程序
- AI Engine 实验室多篇论文被 ICLR 25, NAACL 25 及 TheWebConf 25 录用
- RAG如何让生成AI更智能?最新方法与优劣深度解析
- R1风起,清华、港科大发布大模型强化推理技术最新全面综述
- OpenAI的Operator一测一个不吱声~
- 大型语言模型(LLM)的高效之路:推理优化全解析
2025-01-24
- 大模型能用于CAD设计图纸生成?Text2CAD实现思路解析
- 2025年CNN与Transformer融合的创新点思路
- 超越Transformer!Mamba入局图像复原,达成新SOTA!
- 今日开源(2025-01-24):百川智能开源Baichuan-M1医疗增强大模型,14B参数,20万亿token的数据训练
- 2026年AI将全面超越人类?达沃斯最强大脑预警:未来2年迎来颠覆性变革
- Meta AI因DeepSeek陷入恐慌;OpenAI预热o3-mini;Perplexity推出Agent助手 | AI 头条
- 港大马毅:“百模大战”资源消耗惊人,智能本质到底是什么?
- 「DeepSeek接班OpenAI」,最新开源的R1推理模型,让AI圈爆了
- 2025年大模型与Transformer架构:技术前沿与未来趋势报告
- 生命起源时复杂生化系统如何演化?Nature Chemistry 最新研究提出分子拼装假说
- 行业落地分享:RAG范式选择与系统设计
- OpenAI 想了快 10 年的超级智能体终于来了!有惊喜,但比智谱晚还“翻车”系数高?
- 英伟达 RTX 5090、5080 和 5070 Ti 最新基测:不支持 DLSS 的游戏将拥有更多 AI 能力
- 活性提高42倍,ML引导的无细胞表达加速酶工程,登Nature子刊
- 高灵敏探索质谱,滑铁卢、中原AI院团队基于深度学习的端到端方法
- 打造科学研究“革命的工具”,『AI4S攀登者行动计划』开放申请
- 博士面试翻车现场:导师署名风波背后的学术圈潜规则
- 一位英伟达北京分公司员工晒出了工资条,总薪酬1688万,个税687万,月薪11.43万,基础年薪100万,剩下全是股票分红…
- 【深度学习】突破LSTM,CNN和LSTM时间序列预测 !!
- 央国企!入局AI大模型(附66家名单)
- Python Matplotlib Cookbook(中文版来了)
- 张雪峰公司今年的年终奖…
- 刚刚 GPT4o、Claude 彻底开放了!
- 2024 ACM Fellow 颁给 10 位华人学者!陈雷、周靖人、李国良等入选
- 「Github一周热点59期」DeepSeek R1推理模型、实时语音转文字、自托管PaaS平台、轻量监控工具和终端文件管理工具
- 算法岗平时需要自己写cuda吗?
- 计算机视觉 - 使用 YOLOv8 创建交通热力图
- 为什么某些高校基础学科的教授拿了几百万经费,连个毛都没做出来,发一堆水刊……
- 前沿论文 Arxiv’24 | AMI-Net: 用于异常检测与定位的自适应掩码修复网络
- 2025, AI的10大趋势!
- 第二届开放原子大赛 - 飞桨赛题圆满落幕,PaddleMIX与PaddleScience共筑技术新高地
- 【RAG落地利器】向量数据库Weaviate部署与使用教程
- Stability AI 联合UIUC提出单视图3D重建方法SPAR3D,0.7秒完成重建并支持交互式用户编辑。
- 北大提出定制化漫画生成新框架DiffSensei,可生成具有动态多角色控制的漫画图像。
- DeepSeek-V3 正式发布,已在网页端和 API 全面上线,性能领先,速度飞跃。
- Story-Adapter:能够生成更高质量、更具细腻交互的故事图像。
- DeepSeek-R1:通过强化学习激励大语言模型的推理能力
- 一大批古人涌入小红书,历史IP成为最新流量密码,一天起号涨粉过万!
- 283-A1.1|多模态MLLM统一视觉理解与生成,多概念个性化,扩散风格迁移,可控布局到人类生成
- 283-A1.2|平面设计生成,文生图认知形态攻击,GPS坐标+文本提示到特定地理位置图像生成,图像编辑降低图像引发的情感强度
- 283-A2|图像视频虚拟试衣,掩码自回归视频生成,用于检测AI生成视频的基准数据集;视频深度估计,视频修复
- 283-A3|混元3D资产生成大模型,为骨骼对象合成符合环境和物理特性的姿势,3D场景生成;3D汽车建模,非刚性服装网格配准
- 283-B1|长视频及丰富上下文MLLM,多学科视频理解基准,多模态奖励模型;GUI交互智能体,多智能体移动助手
- 283-B2|视觉中的生成式物理AI综述,HDR成像,楼层平面图相关,基于2DGS的视频表示与压缩
- 283-B3|3D重建系列
- Day282|今日ArXiv无更新
- 刚刚,OpenAI发布AI Agent—Operator,全民智能体时代来了!
- IDC:到2028年,全球AI基础设施支出超1000亿美元
- 上海市推动数字贸易和服务贸易高质量发展方案
- OpenAI掀桌子!免费版ChatGPT,提供o3-mini模型!
- 微软等开源AIOpsLab,可构建自主云AI Agent
- OpenAI发布L3 级智能体!
- DeepSeek-V3 深度剖析:下一代 AI 模型的全面解读
2025-01-23
- 领域RAG微调的实现范式:ALoFTRAG代表方案及文档智能前期处理的感触
- 今日开源(2025-01-23):GME,通义实验室推出的多模态嵌入模型,2B和7B两种参数,支持文本、图像和图文对三种输入
- 【他山之石】Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重
- 【他山之石】扩散模型也能推理时Scaling,谢赛宁团队重磅研究可能带来文生图新范式
- 诺奖得主DeepMind CEO德米斯:年底首批AI新药即将进入临床,已在开发超越o1的推理系统 | AI 2025
- 万字长文|大模型推理之路
- 「DeepSeek接班OpenAI」,最新开源的R1推理模型,让AI圈爆了
- 真的替代码农?OpenAI 秘密造高级AI编程助手:目标复制谷歌 L6 工程师
- OpenAI 首席财务官:中美 AI “不是简单的口水战”,Agent 会在 2025 接替真实岗位
- 用 5 万换价值 73 亿的股份?因离职让寒武纪市值蒸发 60 亿的 CTO,与老东家“开撕”了!
- 字节启动AGI长期研究计划,代号Seed Edge
- AI赋能蛋白质研究:SaprotHub让蛋白质AI模型训练和调用不再有门槛!
- 告别「滤镜」:上理工、上交大团队发布AI赋能的新一代荧光显微镜
- 1998年出生,已担任C9大学教授、博导!
- 李飞飞丈夫,Salesforce首席科学家惊呼:AI智能体时代即将来临!
- 吴恩达:中国的DeepSeek让人印象深刻,我想对他们说“加油”
- 超级AI应用
- Python 3D曲面Surface自由
- 30年招牌已成历史,杰青、优青、青基项目统一改名!
- 4K star!低延迟、易上手的实时语音转文本开源工具
- 2025年,新能源人才的新机遇
- 程序员的噩梦:用C/C++把UTC时间转成UNIX时间戳竟然这么难?
- 放假,见一家公司的格局
- 使用 OpenCV 的 SIFT 图像特征提取和匹配
- 神经网络可视化有3D版本了,美到沦陷!(已开源)
- NIPS 2024 | 缺失值存在下的无监督异常检测
- DeepSeek-R1 解读及技术报告中文版
- 多模态入门–InternVL系列
- 张俊林:MCST树搜索会是复刻OpenAI O1/O3的有效方法吗
- Enjoy AI,2025年飞桨星河社区项目开发赛季开启!
- 探索如何将LLM应用到个人项目中,发现高性价比大模型新宠
- 北航团队发布XRAG-Ollama:助力轻便本地化部署RAG实验框架
- 谈谈对DeepSeek-R1的一些理解
- RAG文档分块新思路:LGMGC如何提升文档分块的语义连贯性?
- NVIDIA提出虚拟试衣新方法EARSB,让时尚与科技完美融合!
- 中科大提出新视频流制作动画解决方案RAIN,可实现真人表情移植和动漫实时动画。
- 引领图像编辑领域的新潮流!Edicho:实现跨图像一致编辑的新方法(港科&蚂蚁&斯坦福)
- 阿里通义实验室提出AnyStory:开启个性化文本到图像生成的新篇章!
- LineArt:无需训练的高质量设计绘图生成方法,可保留结构准确性并生成高保真外观。
- Snap | 港科大提出端侧文生图模型SnapGen,参数仅SD十分之一,1.4秒内生成1024分辨率图像。
- 🧧2025蛇年微信红包封面,18000份免费领取!3分钟教会你用AI定制专属款!
- 【智谷要闻】上海交通大学人文学院与AIGC智谷携手共筑AIGC技能培训体系
- 【AIGC律师】AI领域的律师服务正式开启全新篇章!
- 【AIGC趋势】12名工程师,估值190亿,AI黑马的梦幻故事
- 【行业动态】Kimi发布k1.5 :o1级多模态模型,小红书登顶美区 App Store
- 再深挖DeepSeek-R1: Reward is Enough
- 豆包送来新年礼物,开源SOTA模型!
2025-01-22
- GraphRAG前沿进展:引入分而治之思想的KGRAG思路
- 超强总结!十大聚类算法!附Python实现
- 字节广告算法工程师社招一面
- 今日开源(2025-01-22):字节开源Sa2VA,首个在视频级别支持对话、指称分割及理解的统一模型,1B至26B四种参数
- 【他山之石】顶刊TPAMI 2024!北大提出实用、紧致的图像压缩感知网络PCNet,代码已开源
- OpenAI 首席财务官:中美 AI “不是简单的口水战”,Agent 会在 2025 接替真实岗位
- 特朗普开启“星际之门”,马斯克质疑资金真实性;六小虎「阶跃星辰」连发6款大模型,多模态霸榜第一 | AI 头条
- 人工智能的错误与人类的错误有很大不同
- 大自然的计算:从伊辛模型到生成学习
- 从AI代理到AIoT代理,揭秘人工智能与物联网融合的AIoT 2.0大未来
- 搞定时序建模:8个案例掌握NeuralProphet
- 灵敏度高达94.9%!牛津团队AI多模态ctDNA检测方法,进行癌症早期筛查
- AI伪造论文渗透学术圈:Google Scholar成虚假科学温床,如何应对?
- 杰青、优青、青基项目统一改名为青年科学基金项目(A、B、C类),30年招牌已成历史,你怎么看?
- 【机器学习】一图胜千言:图解机器学习
- 【NLP】495篇参考文献!北交大清华等高校发布多语言大模型综述
- 【深度学习】ViT模型详解与Pytorch代码实现
- 【NLP】「科学推理」基准榜单出炉!DeepSeek-R1 登顶,推理等级7级,o1紧随其后
- 清华院士团队开源新型注意力,节省90%内存!
- AI大牛颜水成宣布回归学界!重返新加坡国立任特聘教授
- “CloseAI”在美国,“OpenAI”在中国
- 用它,处理拥挤的散点数据!
- matplotlib可视化从0到1
- 揭晓—两院院士评选2024年中国/世界十大科技进展新闻
- CPU「离奇」飙到 100%!开发者挖出 Linux 内核 16 年老 Bug:这么多年竟无人发现?
- 公司分配年终奖部门经理一个人就拿走了97% ,如何让他重新分配?
- 10 分钟学会使用 YOLO 及 OpenCV 实现目标检测
- 前沿论文 Arxiv’24 | FourierMamba: 傅里叶学习与Mamba结合的图像去雨
- 博士扩招与学术市场内卷
- 工业界和学术界最大区别是什么?
- 李飞飞:AI 智能体必将在2025年爆发。。。
- 从”速答”到”深思”:揭秘rStar-Math如何追平o1
- SwiftKV:让大模型推理更快、吞吐量更大!
- 大模型由”社恐”变身”懂王”的迷之自信从何而来?
- DeepSeek-R1技术报告速读
- 单目视觉系统,检测车辆的7种测距方法汇总
- 一文读懂 NVIDIA A100 GPU
- 智汇香江,桨启新程!文心中国行首次落地香港,加速大湾区产业智能化
- Weaviate、Milvus、Qdrant 和 Chroma 向量数据库对比
- 小红书火速上线AI翻译,已经被网友玩疯了!
- 281-A1.1|示例图像引导图像编辑,文本驱动图像编辑的评估基准,概念擦除评估基准
- 281-A1.2|文本到多样化2D卡通角色生成,信息非对称图像转译,图像“标记”化
- 281-A2|人类图像动画化,扩散视频修复,文本嵌入空间插值提高文生视频模型,探索从未标记视频中学习知识
- 281-B|多模态面部理解,现实世界视频超分;文本驱动高斯头部编辑,语音驱动3D眼动动画,高斯表面跟踪与重建
- 280-A1.1|单与多主体图像个性化,肖像图像重光照,在扩散推理过程中通过优化噪声搜索来增强生成效果
- 280-A1.2|对象检测框可控图像生成,多对象交互文生图提示忠实度问题,烹饪步骤图像生成,视觉“标记”器
- 280-A2&A3|灰度视频着色化,fMRI梦境转为视频叙事,能否通过观看视频学习物理原理;4K纹理网格生成,视频到3D重建模型
- 280-B|VLM理解否定语的基准测试,视觉常识推理,整合音频与面部微表情的视频MLLM情感分析,通过合成数据增强3D理解
- RAG升级二维战士!通义实验室放大招
2025-01-21
- 满血归来!一文全面揭秘Kimi 1.5最新推理模型背后的技术
- 马斯克招聘:发代码过来,不要扯别的!Just show us your code
- ViT模型详解与Pytorch代码实现
- 登顶Nature,准备起飞!小样本学习又杀疯了(有代码)
- 今日开源(2025-01-21):DeepSeek-R1,强化学习提升推理能力,1.5B至70B六种模型,直追OpenAI o1
- 通用Coding Agent不可能好用,Code Review能力最难被AI替代?35岁程序员的春天来了 | 万有引力
- 国产DeepSeek-R1登基开源新王;字节发布Cursor竞品Trae;腾讯混元开源3D大模型2.0 | AI 头条
- 谷歌提出超越Transformer的新架构Titans技术报告
- 2025展望:我们到底处在AI发展的哪个历史节点上?
- 25年过去了,千禧年的10大物理学难题依旧悬而未决
- DeepSeek-V3带火大模型infra,入门看这篇就够了!
- 行业落地分享:Agent在小爱同学中的应用
- 预测精度媲美实验!哥大团队开发可解释细胞「基础」模型,揭示213种人类细胞调控语法
- 看破不可见数据集,自我监督学习成为细胞组学新的复杂系统处理利器
- 为什么某些高校基础学科的教授拿了几百万经费,连个毛都没做出来,发一堆水刊……
- 【Python】20个超级脚本,让你日常工作有如神助
- 盘点:千万年薪也拦不住的“换行”之心,一文看懂AI界的人才“大迁徙”
- 国产推理大模型决战2025考研数学,看看谁第一个上岸?
- 2025,中国再无杰青优青!
- 美国科技巨头「春天到了」!硅谷巨头CEO 狂欢。。。
- 开发了一个快捷指令,一键AI总结网页,保存到本地,附代码
- 红包封面上线(round1)
- 热力图heatmap代码模版~
- 强!CNN+Transformer再突破,大幅提升模型性能!
- DeepSeek R1性能接近o1,价格仅为1/50?!全开源、商用免费,这次真要掀翻OpenAI
- 平替Cursor?字节出手AI编程助手,Claude3.5免费用
- 2025年,转行嵌入式开发还来得及吗?
- C 语言的困境:为什么这些难题至今没有得到解决?
- 年前一定要盘点的5件事,最后一个很重要!
- 狂发顶会的特征融合,再出神作!
- 图像中的裂纹检测
- 使用OpenCV进行肺炎诊断检测
- 图像直方图全面介绍
- Kimi 1.5 技术报告解读
- 深入浅出,Transformer在小目标检测领域,近3年的进展与突破!
- TabM深度学习模型(Jane Street比赛高分模型)
- 一文梳理各类Large Language Model关系和实现要点
- 蛇来运转,新年就要上上签!(内含百度AI专属蛇年红包封面)
- 真正意义上带你理解完各种神经网络理论后,还基于Pytorch一行行代码带你构建训练各种经典前沿深度学习模型!
- Kimi k1.5:多模态强化学习,推理性能与效率双丰收
- 大模型由”社恐”变身”懂王”的迷之自信从何而来?
- 从话痨到省流大师,效果堪比双十一满减:TALE让LLM学会“断舍离”
- LLM Agent和 Agentic RAG 的最佳综述
- 解决文生图质量和美学问题,字节跳动提出VMix:多维度美学控制方法,一键提升图像美学。
- 图像超分辨新SOTA!南洋理工提出InvSR,利用大模型图像先验提高SR性能, 登上Huggingface热门项目。
- 小米SU7璀璨洋红限定色360°全景图首次曝光?TRELLIS给你答案,实现可扩展多功能3D生成。
- 你要跳舞么?复旦&微软提出StableAnimator:可实现高质量和高保真的ID一致性人类视频生成
- 【解读】DeepSeek-R1: RL前到底需不需要SFT???
- 过年了?Kimi-k1.5是咋炼出来的?
- DeepSeek:“源神”!
2025-01-20
- 时序大模型技术总结:从时序数据的特点、常见任务说起
- 太顶了!Jupyter Agent 让我大开眼界!
- 一文详尽之Embedding(向量表示)!
- IEEE RA-L 2024丨NaturalVLM:利用细粒度自然语言实现可供性引导视觉操作
- 今日开源(2025-01-20):Art v0,基于Qwen2.5微调的增强推理模型,3B参数,Gemini2.0生成数据集训练
- AI教父辛顿开年访谈:中国AI追近美国靠人才教育和自研;不会像奥本海默一样后悔 | AI 2025
- OpenAI将发布“博士级超级智能体”;TikTok重新在美国上线 | AI 头条
- 震惊!OpenAI“造假”石锤? 秘密参与数学基准测试,FrontierMath 透明度遭质疑
- 关于 GPT-5 的谣言会改变一切
- 美国芯片法案,或被取消
- 李飞飞最新访谈:AI Agent的根本定位应该是工具而非主导者,是赋能者而非替代者!
- 2024 感恩有你!限时领红包封面,抽红包+实体书!
- AI病毒进化预测新突破,北大团队进化启发通用预测框架登Nature子刊
- 大学老师的期末改卷,是一场大型“海底捞”现场
- 【机器学习】机器学习各个算法的优缺点!
- 突发!Tiktok美国停服,Perplexity发起收购,小红书也被盯上了
- 什么?Kimi推理架构宣布:开!源!了! Github标星1.7K
- 国产AI大模型,王炸开源!
- vscode中调用deepseek实现AI辅助编程
- 全文翻译了吴恩达《如何打造AI职业生涯》PDF,附教程
- 是时候用Circos震撼全场了!附最简单的Circos实现。
- 《大模型基础》教材发布,开源!
- 浏览器没用 JavaScript,Google 将阻止搜索!
- 如果领导找你谈话,暗示你应该主动辞职,你会怎么办?
- 使用OpenCV实现摄像头测距
- 卷积调制空间自注意力SpatialAtt,轻量高效,即插即用!
- 优化YOLO实现小型设备的目标检测部署
- 图像处理的分类、一般流程与算法
- WebWalker: 大模型乘风破浪,探索网页深海
- 再读MLA,还有多少细节是你不知道的
- Agent的亲身经历,从开始到放弃
- MiniMax-01终于成了!
- 大模型数学推理数据合成相关方法
- AI视觉项目如何更好的落地,深度思考系列!
- 万字长文最新综述!当无人机遇上大模型:低空智能体的综述与展望(附论文及源码)
- “智聚京华,策动新章”文心中国行落地北京,共话大模型产业未来
- 通义WebWalker: 大模型乘风破浪,探索网页深海
- 一文讲清楚大模型涉及到的精度:FP32、TF32、FP16、BF16、FP8、FP4、NF4、INT8
- 招生|上海交通大学谢伟迪组科研实习
- 【RAG落地利器】向量数据库Milvus教程:如何实现MetaData检索过滤
- CVPR 2024 Spotlight | 解锁图像编辑新境界, 北大、腾讯提出DiffEditor,让精细编辑更简单!
- Adobe与MIT推出自回归实时视频生成技术CausVid。AI可以边生成视频边实时播放!
- 多模态图像生成模型Qwen2vl-Flux,利用Qwen2VL视觉语言能力增强FLUX,可集成ControlNet
- Google发布新AI工具Whisk:使用图像提示代替文本,快速完成视觉构思。
- TikTok重新上线,老外们会离开小红书吗?
- 278-A1|基于参考的线条艺术着色,民主化掩码文生图模型,视频先验交互式编辑,物体移除;中文字体生成;DPM量化,对抗样本生成
- 278-A2|一步视频生成的对抗后训练,图层可控动画生成,游戏视频生成;复杂提示文生视频,视频运动控制;不同制作风格视频转场推荐
- 278-A3&B2|从单张人像照片生成3D角色,建模4D HOI动态模式,从单目视频预测4D手部轨迹,物体为中心2DGS
- 278-B1|MiniMax-01;图像视频区域级理解,从详细视频描述到全面视频理解,视频动态面部表情识别
- 279-A1|剪贴画角色动画化,图像生成的视觉缺陷修正,MLLM艺术作品美学推理基准
- 279-A2.1|重新思考跨层表示用于视频生成,并行“变换器”用于扩展大规模文生视频,长视频生成的内容一致性;评估生成视频的质量
- 279-A2.2|视频虚拟试衣,3D面部先验视频面部交换,肖像图像动画化
- 279-A3|4D城市生成;通过文本描述在大规模3D场景中实现6DoF相机定位,用于可扩展3D重建的神经隐式表示
- 媲美o1,DeepSeek R1,它来了!
2025-01-19
- 大模型推理能力优化技术总结:兼看大模型落地6个误区
- 【他山之石】重新思考图像超分辨率中的不平衡问题以实现高效推理(nips2024)
- OpenAI 杀入抗衰老领域!AI 设计的“长寿蛋白”效率狂甩人类几十倍
- 数学逻辑的巅峰—哥德尔不完备定理,挑战了我们对理性推理的信心
- 诺奖得主阿西莫格鲁:AI是辅助人类而不是取代人类,科技行业搞反方向了
- 2024年,中美AI产业10大总结
- 又一位科学家从美归国,已入职北大
- 【机器学习】讲透一个强大算法模型,Prophet!!
- 高校首发“AI禁令”
- 2024全年值得一读的大模型论文都在这了
- 太炸了!清华人大出品,让Qwen达到o1水准的开源项目
- 28K star!可以完全自托管、离线使用的AI编程助手
- 2025年,Matlab依旧坚挺?
- Win10寿命倒计时9个月!微软:届时也不支持Office应用
- Next.js 与 React.js 的对比分析
- 使用傅里叶变换进行图像边缘检测
- 特供版RTX 5090D被曝不能「炼丹」!AI算力3秒锁死,不支持多GPU配置。。。
- 使用OpenCV测量图像中物体之间的距离
- MiniMax-01 与 DeepSeek-V3 对比
- Nvlink对大模型推理的速度有多大提升?
- 手写大模型组件之Group Query Attention,从 MHA,MQA 到 GQA
- 这才是智能体的高级玩法:人类社会的模拟
- MiniMax-01 与 DeepSeek-V3 对比
- 无惧遮挡&小目标检测算法,复旦开源UAV-DETR,高效端到端检测!(附论文及源码)
- 一分钟了解,英伟达H100的毛利有多高?
- 重新思考RAG的相关性:相似≠相关
- 大模型算法岗面试准备篇(一)——如何进行自我介绍?
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 277-A1.1|生成式AI用于赛璐珞动画的综述,局部提示控制DiT图像生成,填充“标记”在T2I模型中的机制分析;虚拟试衣
- 277-A1.2|区域感知微调,用户偏好与推理阶段奖励,个性化偏好微调;视觉生成模型量化的比特级缩放规律
- 277-A2|运动引导视频生成的时间一致性问题,评估视频编辑,面部视频编辑,肖像视频编辑
- 277-A3|3D物体视频大型数据集,3D物体部件与材料大型数据集;前馈3D感知新视角图像生成
- 277-B1|极长自我中心视频理解的基准数据集;评估生成图像多视图一致性的度量标准;跨模态图像匹配
- 277-B2|单目视频转逼真且可交互3D模拟环境;单目视频3D重建,3DGS转点云;3D高斯头,3D人类重建
- <200元的o1复现,尽管对比
2025-01-18
- 读书金句分享017|《纳瓦尔宝典》
- 吃瓜:中科院化学所宋延林组火了
- 11 种特征选择策略总结!
- 可变形卷积一区TOP新思路!刷爆遥感SOTA!
- 对话李飞飞:我们究竟需要什么样的AI Agent?如何正确把握这个风口(附视频)
- 人工智能未来会完全取代人类科学家吗?何川教授:目前还没看到这种可能性 | 墨子沙龙
- 引入对痛苦和快乐的反应有助于测试人工智能是否有感受能力吗?
- 微调YOLOv11:实用指南 【详细过程与代码】
- XGBoost 比深度学习还强?
- 「Github一周热点58期」自托管 AI 代码助手、从0训练微型语言模型、AI SQL助手、文生图模型和开源电子商务平台
- 通过动图彻底理解了傅里叶变换
- 上位机工程师和视觉工程师有什么区别?
- 分辨率单位、换算及镜头与感光器像素的匹配
- CVPR 2024 | D3T: 跨RGB-热红外域的显著双域教师框架用于域自适应目标检测
- Jane Street最新量化大赛金牌方案(含代码)
- 【RAG落地利器】向量数据库Qdrant使用教程
- 276-A1|基于效价-唤醒度模型的情绪图像生成,视觉文本生成,HOI个性化图像生成,诗歌图像生成,扩散奖励对齐
- 276-A2.1|多主体开放集个性化视频生成,长视频生成,长篇叙事视频生成,短视频广告创作与编辑
- 276-A2.2|检索增强视频生成,自回归长距离场景生成,3D相机轨迹控制的单图生成场景飞行视频
- 276-B|逐步视觉推理,电商与短视频视觉语言;多图像定位,在线视频理解;3DGS压缩;3D人类运动预测
2025-01-17
- 今日开源(2025-01-17):ReaderLM-v2开源1.5B小模型,HTML转Markdown和JSON,支持29种语言
- 【他山之石】TPAMI-2024 | Uni-AdaFocus视频理解框架,让AI学会「划重点」,计算效率提升4-23倍!
- 几秒生成逼真3D场景,泛化媲美Stable Diffusion | 浙大&蚂蚁等提出Prometheus
- 【源头活水】一个关于MoE的猜想
- 面壁发布 MiniCPM-o 2.6:音视听三合一的“她”(SHE),不需要联网
- Cursor完成1.05亿美元B轮融资;Nvidia发布微服务以保护AI代理 | AI 头条
- 模拟5亿年进化的ESM3在Science发布了,可推理蛋白质序列、结构和功能
- 谷歌推出Transformer架构的继任者Titans:训练代码也会公开
- OpenAI 最强竞对 Anthropic:如何构建有效的 Agent
- 详解DeepSeek-V3:大模型训练加速神器,MoE焕发新生丨智源深度
- Kaggle知识点:TabM深度学习模型(Jane Street比赛高分模型)
- 违反请假政策,2名清华博士生拟被退学
- 10 大中文医学数据集汇总:涵盖神农中医药、中医药古籍、医学推理、医学问答……
- 赞爆!中科院这个课题组火了
- 谷歌新架构终结Transformer,长序列处理王者诞生?
- 终于来了!OpenCV更新了:4.11.0和5.0预览版
- 如何解决工业缺陷检测小样本问题?
- 一文带你读懂YOLOv1~YOLOv11
- 特供版RTX 5090D被曝不能「炼丹」!AI算力3秒锁死,不支持多GPU配置
- 文末赠书!“西瓜书”《机器学习》官方配套习题集重磅出版
- 多模态入门–CogVLM,VILA,MM1,MM1.5和Pixtral-12B
- 【多模态&LLM】Reyes:一个从0到1开始训练的多模态大模型(技术报告)
- 从“说”到“做”:大语言模型为何会进化成智能体
- 基于YOLO的小型设备,剪枝量化部署实战流程
- 为什么同门硕士进BAT拿高工资,而博士却要挤破头进985高校?
- 详解DeepSeek-V3:大模型训练加速神器,MoE焕发新生丨智源深度
- 书生·浦语大模型升级,突破思维密度,4T数据训出高性能模型
- RAG 切块Chunk技术总结与分块实现思路分享
- 面试官:解释一下卷积神经网络(CNN)的基本结构
- 分享一个视频下载神器,还能免费看VIP内容,再也不要开会员了!
- 【智谷学院】生成式AI,未来已来!AI爱好者联盟线下沙龙活动
- 【AIGC趋势】上海嘉定AIGC智谷成员开放日成功举办,共探产业新未来
- 【AIGC应用】“标王”科大讯飞发布推理模型!
- 【行业动态】DeepSeek发布移动端应用,Perplexity发布了 Perplexity Sports 功能
- 275-A1.1|去中心化高效扩散模型,音频到图像生成,多实例图像生成,统一条件自回归生成,虚拟试衣
- 275-A1.2|探讨人类绘画能力的演化过程;高效DiT,R3GAN;NSFW内容生成问题
- 275-A2|精细可控图像动画化,探讨从视频中进行自回归预训练的有效性,视频标记器,基于分层GS的高效视频表示
- 275-A3|一致流蒸馏文生3D,Zero1toG图生3D;单图生3D头像,单视图云彩重建;图生CAD;大型多模态全身运动数据集
- 275-B|结构化图像理解,大规模长视频理解数据集,具身认知基准测试;个性化盲人脸修复,视频问答
- o1鸡血模式prompt,秒变o1 pro!
2025-01-16
- 今日开源(2025-01-16):书生InternLM3开源来袭,8B参数,4T训练数据节约成本75%以上,融合深度思考和对话
- 即插即用,无缝集成各种模型,港科大&蚂蚁等发布Edicho:图像编辑一致性最新成果!
- 纯卷积实现用于图像生成扩散模型?DiC:重新思考扩散模型中的 3×3 卷积
- 1000+AI热门面试题汇总,值得开发者学习的AI大模型资料包!
- “具身智能将诞生第二家大疆!” 林咏华、黄东旭、李建忠激辩大模型 | 万有引力
- 阶跃星辰推理模型 Step R-mini 上线: smart与元戎启行达成战略合作,布局智能驾驶AI大模型 | AI 头条
- 川普2.0或削减环境、传染病研究,推动AI、量子、太空探索
- 神经网络理论研究的物理学思想
- 最高138.7分!国产大模型「考研数学」成绩单出炉,哪家AI能上岸?
- 计算之物理:灵魂耗能吗?
- 小白学NLP:STAGE通过共现图数据增强
- 【民间】2024毕业生薪酬排行榜发布!
- 江苏大学教师吐槽教学考核:新增800余门课程,有老师为让学生选课讨好学生…
- 985,引进3名“华为天才少年”!
- AI服务器环境搭建指南,从裸机到“战斗”机(下集)
- 可视化的爬虫平台,无需代码
- 14K star!开源浏览器插件帮你解放双手,告别重复,开启自动化工作
- Linux 6.13惊险一幕:微软代码改动引发混乱,英特尔和AMD紧急修复
- 有这4个特征的领导,是你的贵人!
- CNN+LSTM+Attention多热点搭配!又是创新性拉满的高分思路!!
- 神奇!傅里叶与Mamba结合竟然能实现图像去雨!
- 基于边缘检测的图像分割算法!
- 强烈推荐一个Python可视化模块,简单又好用
- 刚刚,智谱被美国列入实体清单
- 无人机多目标跟踪MMTracker算法,Mamba和YOLO的结合(附论文及源码)
- 字节又整活!SAM2与LLaVA结合,视频级别对话统一模型!
- AI项目算法迭代的成本,为什么很高?降本增效的思路解析!
- Transformer算法内部,工作原理及拆解
- 长文本“新王”诞生!400万字输入,王炸!
- 文心一言x三联中读联合会员 左手滚烫新知,右手前沿智能
- 聊聊北大ChatLaw法律大模型的架构解析与借鉴思考
- 看完终于知道为什么这本深度学习书值得这位大牛用上千字来给五星好评了!
- 为什么多线程编程这么难?
- 【Weaviate官方指南】请查收一份RAG高阶技巧!
- 抖音疑似放开限制:老外开始疯狂刷屏,社交平台要全球化了?
- 274-A1|虚拟试衣,文生图扩散模型量化;细粒度复杂性分析探讨VAR模型的计算极限
- 274-A2|多概念视频定制化,低成本视频编辑,图像引导视频编辑;视频配音,唇读视频生成,情感语音合成
- 274-A3|3D鸟类生成,单图到3D生成,指令引导LRM编辑,LLM室内设计生成,分层解偶服装角色生成
- 274-B|模仿人类重述反馈改进图像描述生成;稀疏视图表面重建,镜面反射表面重建
- 273-A1|文本驱动图像编辑,视觉提示引导编辑;基于主体的个性化生成;文生矢量图;虚拟试穿系列;评估图像描述生成,NSFW相关
- 273-A2&A3|电影级ID视频生成,多控制3D感知视频生成,生成式帧插值;4D风格化,单图逆渲染基于物理的编辑,网格纹理生成
- 273-B1|闭环开放式自动化科学研究框架,LLaVA-Mini压缩视觉标记提高模型效率,3D大型多模态模型
- 273-B2|3DGS(紧凑型复杂运动动态场景;雾霾场景,高效压缩,版权保护)
- 小钢炮又上新,OpenAI懵了!
2025-01-15
- NeurIPS’24 Oral 大模型LoRA超级变体!HydraLoRA小参数,大作为!
- 再看GraphRAG及多模态RAG进展:MiniRAG及多模态检索思路
- 24 个超强 PyTorch 操作!!
- 今日开源(2025-01-15):MiniMax-Text-01,456B参数、创新架构与超大上下文长度,打造强大语言模型
- 上线百天用户破千万!Vidu 2.0 要让人人都成为新海诚
- OpenAI推ChatGPT任务功能测试版;MiniMax发布并开源新一代01系列模型 | AI 头条
- OpenAI突然推出ChatGPT代理:AI正式转向level 3
- Nature突破性发现:大脑的内部时钟受到一种以前未被认识到的方式的影响
- AI模型能否揭示人类语言习得之谜?
- 2030年传感器技术的5大进化方向(附全清单)
- 小白学时间序列:时序异常算法对比 (VLDB 2024)
- “键盘敲出火星子了”!小红书 IT 团队加班承接 TikTok 这波泼天流量,这款 AI 搜索还趁机火了
- 科大讯飞发布首个基于全国产算力的深度推理大模型X1,率先落地教育、医疗
- 中国 AI 人才缺口将达到 400 万,企业如何掌握 AI 人才资源?|附免费福利
- 刚刚,ChatGPT开始有了执行力!
- MiniMax震撼开源,突破传统Transformer架构,4560亿参数,支持400万长上下文
- 藏不住了!OpenAI的推理模型有时用中文「思考」
- 一句话让Agent自主干活,清华复旦斯坦福等开源的智能体开发框架抢先了OpenAI
- 仅缩小视觉Token位置编码间隔,轻松让多模态大模型理解百万Token!清华大学,香港大学,上海AI Lab新突破
- Transformer²要做「活」的AI模型,动态调整权重,像章鱼一样适应环境
- 近8年后,谷歌Transformer继任者「Titans」来了,上下文记忆瓶颈被打破
- 交大O1医疗探索:延长AI思考时间,解锁复杂推理诊断
- AI预测自然灾害,全球首个支持全天候灾害响应的多模态超高分辨率数据集BRIGHT
- 9 个开源项目,个个都很顶!
- 郑强:中国教育最不公平的不是幼儿园小学和中学,而是高等教育!
- 刚刚,美国全球芯片禁令正式发布
- CNN+LSTM+Attention多热点搭配!又是创新性拉满的高分思路!!
- 详解meta-analysis必备—森林图 (forestplot )
- 荣登 Nature,LSTM 彻底爆发了。。。
- 刚刚,美国首个全球 AI 禁令颁布!英伟达 AMD 禁运,各国分三级上限 5 万块
- 4K star!不会SQL也不怕,开源多语言AI数据助手,聊聊天搞定数据分析
- 2025年,新能源人才的新机遇
- “Python,就是新的 BASIC!”
- 为什么说程序员是一个极其劳累的工作???
- 中科院化学所宋延林组火了
- 实测书生系列开源的最新模型-InternLM3-8B
- 【文档智能】轻量级级表格识别算法模型-SLANet
- DeepSeekV3如何一次性预测多个token
- 2024时序预测总结——多尺度时间序列建模
- 破解上亿数据检索难题,AI重塑法律超级大脑
- deepseek技术解读(1)-彻底理解MLA(Multi-Head Latent Attention)
- 如何创建一个理性的基于LLM的Agent?
- 为啥本科生都能发顶会,而博士一篇都没有?
- 综述OS Agents: MLLM智能体实现计算设备通用控制 | 浙大&OPPO&零一万物等
- 迈向多语言与多任务的医疗大模型:探索医疗语境中的语言基座模型
- 如何判断一个产业所处的阶段?以AI行业为例
- 【RAG最新研究】优化RAG系统的最佳实践与深度解析
- 中科大提出新视频流制作动画解决方案RAIN,可实现真人表情移植和动漫实时动画。
- 理想汽车提出3DRealCar:首个大规模3D真实汽车数据集!
- SD和Sora们背后的关键技术!一文搞懂所有 VAE 模型(4个AE+12个VAE原理汇总)
- 万字长文解读 2025 年美国《人工智能扩散出口管控》
- 大批TikTok难民涌入,小红书彻底变天,普通人如何抓住这次风口?
- 272-A1|文本引导图像风格迁移,多模态面部提示优化,面部表情编辑,指令引导生成与编辑;增强SD空间排列能力及其评估
- 272-A2|文生RGBA视频,mask运动轨迹引导图生视频,基于伪4D高斯场的视频生成,任意长度的长视频高效生成
- 272-A3&B4|点图条件扩散用于单图NVS,3D语义布局引导文生场景;手部运动重建,理解双手物体交互,自然环境4D人类场景重
- 272-B1|时空EEG分析;多模态系列
- 272-B2|内容自适应图像标记器,高斯掩码自编码器;基于参考的图像修复;文生图来源识别,检测AI生成面孔,公平性评估;深度估计
- 272-B3|现实世界视频超分,现实世界视频恢复;AI生成视频质量评估;视频隐式神经表示;单声道音频转双声道立体声
- 微软开源AI Agent大更新,重塑智能体!多层级更强架构
- 医疗复杂推理开源大模型——华佗GPT-o1
- OpenAI本月发布AI Agent——Operator
- 知识图谱 × 大语言模型的 “实战宝典”,微软《GraphRAG 实践应用白皮书》免费下载
- OpenAI Agent来了!大小事务自动帮你搞定,带推送提醒的那种,今日可开玩
- MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o
- 姚期智团队开源新型注意力,节省90%内存不降性能,一个框架统一MHA/MQA/GQA
- 国产AI「快」到火爆外网!10秒生成一个视频,网友:我见过最快的AI
- 国内数学最强!实测讯飞版o1:上能打奥赛卷高考,下能辅导寒假作业
- 打脸!GPT-4o输出长度8k都勉强,陈丹琦团队新基准测试:所有模型输出都低于标称长度
- 揭秘大模型强推理能力幕后功臣“缺陷”,过程级奖励模型新基准来了
- 首届北京中关村学院青年论坛2月20日起举办!诚邀海内外青年学者参加
- Deepseek退位,Minimax开源的新王!
- OpenAI发布新版function calling 指南!引入「最小惊讶」等「软件工程原则」
- 去重神器SemHash:每秒2.2万条,快如闪电!已开源
- GPT-4o级开源模型来了!MiniCPM-o:多语种情感控制的实时对话、仅8B、华人团队
- 重磅!Mistral 卷土重来,Codestral 25.01杀入Copilot Arena榜首
- 一夜之间,ChatGPT 变身「定时闹钟」!
- ChatGPT 告危!《纽约时报》正式将告上法庭!
- 横空出世!MiniMax 放出4百万token怪兽,击败Deepseek V3!开源大模型迎来新巅峰
- 独自一人,怒发顶会!
- MiniCPM-o 2.6:视觉、语音和多模态流式能力达到了GPT-4o级别
- 微软震撼发布:Phi-4语言模型登陆Hugging Face
2025-01-14
- 值得一用的长文本训练框架360-LLaMA-Factory及多模态VideoRAG实现思路
- Nature子刊3连发!深度迁移学习又开挂了!顶刊热点果然名不虚传,快冲!
- 今日开源(2025-01-14):Dispider,新型视频大模型,解耦感知、决策和反应三个模块,实现主动实时交互反馈
- 【他山之石】NIPS 2024 | 注意力掩码和LayerNorm在Transformer中的作用
- 即插即用,无缝集成各种模型,港科大&蚂蚁等发布Edicho:图像编辑一致性最新成果!
- 【他山之石】TPAMI 2024 | 倒置金字塔多任务Transformer用于视觉场景理解
- 【源头活水】NeurIPS 2024 Spotlight | 轻微的预训练数据扰动如何造就更优秀的扩散模型
- 篡改微信余额技术可刑性研讨 2.0
- 扎克伯格:Meta将用AI替代中级工程师;国产人形机器人海外爆火 | AI 头条
- 神经网络中的知识提取-辛顿教授2015的论文
- AI幻觉能助力科学重大突破?诺奖得主Baker用得可香了
- Salesforce首席科学家撰文:「AI agent黎明」之后,我们期待些什么?
- 脑机接口:连接神经元与数字世界
- Kaggle知识点:数据挖掘标准流程
- 拜登AI芯片新规把自家公司也坑进去了!英伟达怒斥“乱搞”,OpenAI以超越中国为由索要机密数据
- OpenAPI 很难
- 2024年AI重点事件辣评,一起来聊聊 | 直播预告
- 国产推理大模型决战2025考研数学,看看谁第一个上岸?
- 余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一
- 思维链?思维树?华为诺亚:现在到了思维森林时刻!
- 同时提升摄像机控制效率、视频质量,可控视频生成架构AC3D来了
- 海内外15位博士,每人10万,字节跳动的奖学金越来越「香」了
- 快手可灵凭什么频繁刷屏?揭秘背后三项重要研究
- AMD与约翰霍普金斯大学联手:AI实验室copilot自动化科研,成本节约84%!
- AI生物学家:当「基础模型」撞上「生物学混沌」,谁才是解谜高手?
- 13天5万!爬虫副业让我挺直了腰板回家过年
- 不要再在 Excel 中浪费时间了,让 Python 完成工作
- 困在“第一学历”里的博士
- 【深度学习】深度学习调参经验
- 78%员工已成百万美元富翁,超羡慕!
- AI服务器环境搭建指南,从裸机到“战斗”机(下集)
- 博士第三年,目前没有一篇论文,我该怎么办?
- 聊胜于无!DeepSeek上线官方App,功能有限,需要发展
- 一工程师被OpenAI封禁!“我用ChatGPT开发了一个自动步枪”
- “越到放假前,越不想上班”:4招帮你应对节前综合征
- 《一书解决几乎所有机器学习问题》.PDF下载
- 困在“第一学历”里的博士
- 基于 Faster ViT 进行图像分类
- 2025年Next Token Prediction范式会统一多模态吗?
- 使用YOLOv8和ByteTracker进行实时人员跟踪和计数
- CNN万能涨点公式!MoD:增强一切卷积网络!还能加速25%!
- 14天速成LLM高手!大佬开源学习笔记,GitHub狂揽700星
- DeepSeek-V3:开源模型的里程碑 - 从671B参数到全面领先的实力
- 千问又开源啦,开源过程奖励模型-Qwen2.5-Math-PRM
- Nvlink对大模型推理的速度有多大提升?
- 图解OpenRLHF中基于Ray的分布式训练流程
- 万字长文ByteTrack详解,Tracking by Detection范式力作(附论文及代码)
- AI视觉产品落地,为何很难?背后的原因分析
- 多视角Transformer,目标检测、图像分类等均实现Top-1 精度 !
- 6751!深度学习,第一
- 文心中国行落地武汉,共绘大模型产业应用新蓝图!
- ChatBI+Agent:数据分析新范式落地探索
- 25年的大模型Infra,SSP人才画像?
- 为什么人工智能用 Python?
- 2024必读的100篇生成式AI论文清单
- Adobe与MIT推出自回归实时视频生成技术CausVid。AI可以边生成视频边实时播放!
- Retinex-Diffusion:让图像照明更加自然、细腻、富有层次感。
- 面试官:解释下大模型微调中的灾难性遗忘问题
- 新手做公众号,12个常用工具推荐(建议收藏)
- 3.1K+ Star!code2prompt:一个代码转提示的命令行工具
- 1月14日周二 | 每日一图
- 1月14日周二 | Python热门项目
- 1月14日周二 | Github今日热门
- OpenAI权威报告!美国再不抓紧,1750亿美元将投资中国
- 智能体之间靠啥 “说话”?探秘 Agentic Web 通信基石 | 锁定 AI大咖说1月16日直播
- 医疗AI Agent独角兽Hippocratic,获10亿元融资
- 极客说|Azure AI Agent Service 结合 AutoGen/Semantic Kernel 构建多智能体解决⽅案
- 智能驾驶年度格局报告:两个「端到端」改写三大梯队,「华理魔」领跑
- 谷歌新架构一战成名,打破Transformer记忆瓶颈,姚班校友钟沛林新作
- 最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k
- 抢先OpenAI“虚拟员工”!清华复旦斯坦福联手,让Agent接管电脑帮你工作
- 物理学家发现新型量子粒子!表现介于玻色子费米子之间 | Nature
- “AI印钞机”项目开源!
- OpenAI疯狂招人透露了什么?
- 谷歌重磅研究:Titans 架构突破 Transformer 长上下文限制
- MiniRAG:一个极致简洁、高效的新型RAG系统
- Mistral发布Codestral 25.01,Copilot榜单的王~
- 如何提升大模型开发效率?开发基本功提升指南
- 瓦力算法1月第2周急招岗位|/ 腾讯云 / 微软 / 小红书 / Cider / 小鹏 / 度小满 / 小米 / 喜马拉雅
- Google DeepMind研究员关于LLM推理讲座的深度解析(含原视频链接)
2025-01-13
- 手握15个大厂offer,我在大模型风口起飞
- 也看大模型具身智能技术总结:从英伟达发布Cosmos模型说起
- SINGAPO:对象中关节部分的单图像控制生成
- 今日开源(2025-01-13):Sky-T1-32B-Preview推理模型,权重细节全开源,降本增效训练自己的o1模型
- 扎克伯格开炮:苹果已经20年没有发明任何伟大的东西,只是在压榨用户和开发者 | AI 2025
- 2025 年苹果将全面革新产品线;英伟达员工 78% 成为百万富翁,但面临高压工作环境 | AI 头条
- 辛顿与李飞飞对谈:AI是否具备语言理解和推理能力?
- CES 2025 落幕:十大狂野科技震撼来袭!
- 英伟达的AI投资帝国:两年,83笔,多家大模型和芯片创企
- 人类一生能获得的知识存在上限,科学家已经算出来了
- 小白学大模型:Anthropic和Google的Agent定义(文末送书)
- 这群00后“杀疯”了!没靠资本、大学刚毕业狂赚7千万,TikTok助攻AI爆款应用出世
- 大模型搜广推,“新瓶装旧酒”还是“范式的革新”?
- Video Ocean V2.0:视频质量全面升级,依旧完全免费,薅羊毛的快乐等你来!
- o1不是聊天模型?24小时热度暴涨,奥特曼、Brockman在线围观
- 从今以后,所有淘宝天猫商家都能一键图生视频了
- 破解联邦学习中的辛普森悖论,浙大提出反事实学习新框架FedCFA
- AI 驱动科学大爆发!从蛋白质到数学证明,2024 年最值得关注的科技突破
- 病毒接下来会做什么?AI 正在帮助科学家预测它们的演变
- 高效机器学习的 19 种 Sklearn 技术
- 体制内,开始“拒绝”留学生?
- 又一大学生失联!IP定位显示已在缅甸
- 霉霉用中文拜早年!火爆全网,简直逆天
- 计算机系末日了,美国顶尖名校抛弃计算机基础课,All in Python!
- seaborn和matplotlib,怎么选?
- Python+Matplotlib+LaTeX玩转数学公式
- 突发:美国密歇根大学终止与上海交大合作!
- 「Github一周热点57期」世界基础模型平台、新的区块链、AI搜索引擎、国产开源CPU和PS4模拟器
- 大型遗留代码为什么不能动?!
- 特斯拉喊话”尽管对比”,雷军回应”好的”,又登上微博热搜第一。
- 突发!CDN宣布退出中国!波及范围不可预估,20年老用户崩溃
- 基于深度学习的疲劳驾驶检测
- 机器视觉在烟草行业的典型应用
- CVPR 2024 | 具有尺度和位置敏感性的红外小目标检测
- 免费下载|火爆AI圈的深度学习 “四大名著”
- RLHF 常见的思维误区
- LoRA 的原理和用 PyTorch 从零到一的代码实现
- 【文档智能 & RAG】RAG增强之路:增强PDF解析并结构化技术路线方案及思路
- 文心中国行首次抵港!1月21日相约香港,共建大模型产业应用生态圈
- 直播|李飞飞、谢赛宁组最新工作:空间智能,多模态LLM如何观察、记忆和回忆空间?
- 直播|LLM-as-a-Judge热门论文,当AI担任“评估者”综述分享,AI+金融圆桌交流,IDEA研究院
- 我把Github上短期内狂飙至4万Star的LLM Ai大模型公开入门教程翻译制作成了这份中文版本!
- 2025年Next Token Prediction范式会统一多模态吗?
- 2024 年终总结:Agent,Coding 与 AI Infra
- 掌握RAG查询优化技巧,让你的检索与生成效率翻倍!
- 解锁衣物动画的新境界!EUNet:从单块布料学习衣物动画,让衣物动画更智能。
- ECCV 2024 | 3D数字人生成来了!南洋理工提出StructLDM:高质量可控3D生成并支持编辑。
- 3D虚拟试穿来了,上大、腾讯等提出ClotheDreamer,数字人也能实现穿,脱衣自由!
- Transformer 面试常考题快问快答
- 官宣!OpenAI加入机器人赛道,要打造实体AGI
- 斯坦福大学-医学院使用AI模型,回复患者信息
- 霉霉用中文拜早年!国风年味视频免费生成,可任意切换主角,0帧起手小白友好
- DeepSeek官方App上线!功能完整且免费,网友:ChatGPT最佳替代品
- 别再把o1满血版当聊天模型了!SpaceX前工程师公开全新使用秘籍:从讨厌它到每天依赖它
- 3小时输出27个知识点!张朝阳跨年演讲硬核解析生活中的量子力学
- 最高工资322万!OpenAI开招机器人工程师
- CAG来了,RAG慌了?
- Qwen2.5 VL开源来袭!
- Agent 已死?这个无Agent 打法拿下了SWE-bench 最佳,成本不到Agent的1/10!
- 请注意:o1不是用来聊天的!
- 重磅!Cursor 推出2.83美元「一键找BUG」功能
- 扎克伯格宣布:将用AI 将取代所有中级工程师!
- 划重点:OpenAI o1/o3的正确打开方式
- 借助 LangGraph、OpenAI 和 Tavily 构建自适应 RAG 系统(含代码)
- 选择合适自己的检索增强生成(RAG)技术:综合指南
2025-01-12
- OpenAi-O1推理范式最新思路汇总-Search-o1、Sky-T1、rStar-Math:兼看注视检测任务
- 【他山之石】NeurIPS’24|新型成员推理方法CLiD:一举破解文生图模型隐私难题
- 【源头活水】视频任意门来了!港大&达摩院新作VideoAnydoor:向视频无缝传送物体,同时支持准确动作控制
- 一个普通程序员对 AI 十倍工程师的困惑
- LLM带来了「编程末日」?哥本哈根大学CS教授:别做梦了!
- 生成式人工智能与科研伦理:变革、挑战与展望
- 给AI一个词就能测出科研创造力?人大高瓴团队最新研究:模型智商高未必最有创意
- 员工年会中608万彩票,公司要求退还;3倍工资挖人、3个月开除,大佬怒怼竟对恶意挖人;DeepSeek App正式推出|AI周报
- 谷歌 Willow 开创了量子霸权的新里程碑
- OpenAI 不装了?左手赚钱,右手就一定有「神奇药水」吗?
- 450美元训练一个「o1-preview」?UC伯克利开源32B推理模型Sky-T1,AI社区沸腾了
- OpenAI被曝重组机器人团队,4年前缺钱缺数据,如今要做硬件布局了
- No More Next-Token Prediction?
- ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述,覆盖主流基准库、模型
- 给AI一个词就能测出科研创造力?人大高瓴团队最新研究:模型智商高未必最有创意
- 喜大普奔!多个省份取消“应届生身份”限制!
- 上海微软大裁员,赔偿达N+8,老员工获赔77万!
- 回归母校!名校教授,全职加盟顶尖985大学!
- AI又双叒叕来革命,程序员又双叒叕失业潮
- 震撼高层,中国工程院院士孙凝晖给正国级、副国级讲课:《人工智能与智能计算的发展》
- 概率论中的极大似然估计:入门与Python实践
- “既然 GPU 这么好,那为什么我们还要用 CPU?”
- 那些年前辞职的人,都怎么样了?
- 来了,使用YOLOv11目标检测的详细教程
- 【AAAI 2025】多尺度对比特征融合CDFA,即插即用,极大增强特征表达!
- 什么是扩散模型(Diffusion Models),为什么它们是图像生成的一大进步?
- 【文末赠书】大模型在生产制造场景的3个实际落地方案
- 5万字长文全面解读GUI Agent的前世今生
- 【多模态&LLM】LLaVA系列算法架构演进:LLaVA(1.0->1.5->Next(1.6)->NeXT(Video))
- 手写 transformer decoder(Causal LM)
- 小目标检测神器,基于YOLO11的动态图神经网络用于小目标检测及跟踪 !
- CPU也能跑模型,OpenVINO模型部署入门教程!
- LLM PEFT微调方法最全理论篇
- 邀请参与首届XLLM Workshop @ ACL 2025
- 2024年MLSys研究热点是什么?
- To Balance or Not to Balance? 一个简单有效的长尾任务训练方法
- LoRA 的原理和用 PyTorch 从零到一的代码实现
- 你的RAG系统真的达标了吗?生产环境RAG成功的7大关键指标
- 多身份定制化视频创作新突破!Ingredients:可将多个身份照片整合进视频创作实现个性化视频生成。
- 3D服装生成新SOTA!谷歌和CMU提出FabricDiffusion:可将织物纹理从单个图像迁移到3D服装
- 超级智能“试衣镜”!GarDiff:高保真保持目标人物特征和服装细节,虚拟试穿技术新SOTA!
- Github热门项目周报 | 第2周
- 1月12日周日 | 每日一图
- 1月12日周日 | Python热门项目
- 1月12日周日 | Github今日热门
- 深圳人形机器人街边溜达爆火海外!超自然步态大步流星十几米,“成本10万内、两月后商用”
- OpenAI疯狂爬虫,把一家公司都给爬宕机了,CEO:堪比DDoS
- Sam Altman:即便AI将带来人类灭绝,我们也先造了再说!
- o3还未发布,Sam Altman却已经预测了它的「命运」!
- 预言中的洪水:超级智能AI即将席卷人类社会?!
- 450美元训出o1!伯克利开源o1-preview平替
- AutoReason:自动Few-Shot推理分解
2025-01-11
- 金融领域NER大模型性能及视觉文档理解技术总结
- 基于UNet的遥感图像处理新成果!保持高性能同时降低计算成本
- 人类智能如何从大脑中涌现?大脑精细模拟重塑 NeuroAI 范式
- Forbes:2025年人工智能发展前瞻
- 思维链作者Jason Wei剖析LLM扩展范式:Just keep scaling!
- AAAI 2025 | 厦门大学信息学院32篇论文入选!多模态、目标检测、自动驾驶等研究方向
- 万亿巨头豪赌AI:2025年起不招工程师,只招销售?!
- 阿里巴巴跨境电商场景下的AI模型服务实践
- 以AI之光,点亮未来工厂——人工智能赋能未来工厂论坛成功举办
- GAN归来:模型大幅简化,训练更稳定,逆袭扩散模型,AI社区疯传
- 迈向System 2推理,100页论文硬核讲述Meta-CoT
- 不停PUA大模型「写更好点」,无需其它花哨技术就能让AI代码水平暴增
- 如何高效桥接视觉和语言,字节&中大提出全新多模态大模型连接器ParGo
- 图像美感增强SOTA,拒绝美感焦虑!字节跳动提出VMix:多维度美学控制方法,一键提升图像光影、色彩等
- 大厂新年第一裁,微软全部门危!
- 突发,美国拟(全面禁止)向中国出口 AI 芯片
- 图神经网络的数学原理总结
- AI服务器环境搭建指南,从裸机到“战斗”机(2):防火墙、Git、Docker、Python、多用户JupyterHub
- 某985大学一女生用AI学术造假被麻省理工退学,本人发文致歉
- 为什么同门硕士进了BAT拿高工资,而博士却要挤破头进985高校?
- 形象理解二维傅里叶变换
- 浙大高飞老师:读博士有多苦?
- OpenCV之图像处理基础
- Corex: 通过多模型协作增强推理能力
- o1类大模型的过度思考: 2+3=?
- 生成式推荐最新进展
- PyTorch 实现 Multi-Head Self-Attention
- 微软开源大模型Phi-4技术报告解读
- 真心建议马上拿下软考证书!(特大红利期)
- 一键试衣or一键脱衣?TryOffAnyone:从人像输入中生成高质量平铺服装。
- 阿里达摩院提出开源AI图片上色模型DDColor:可以为黑白照片、人物、动漫风景等一键上色!
- 企业的AI转型正进入拐点:来自3000家企业调研的发现
- 企业的AI转型进展报告解读
- AI转型对企业的好处
- 企业实施AI转型的具体步骤
- 直击CES:AI教育群雄逐鹿,中国选手展现硬实力
- 可灵AI破解电车难题全员无伤!网友:这就是东方智慧吗
- OpenAI谷歌回收“废旧”视频,UP主外快渠道+1,单笔可赚数千美元
- 突破瓶颈!北航ETH等首次将扩散模型完全量化至1bit,28倍存储节省+52.7倍效率提升
- 突发,AI 音乐Suno 被马斯克封号!
- 重磅!CNET评选CES 2025最佳产品出炉!
- 重磅!OpenAI 正大规模组建机器人硬件团队!
- 重磅!Anthropic发布通往AI安全的6大技术路线图!
- AMD发布科研Agent,论文自动化评分趋近顶会NeurIPS水平~
- OpenAI Whisper:语音识别技术的革新者—深入架构与参数
2025-01-10
- 用Agent做PPT生成思路PPTAgent:兼谈信息爆炸时代如何学习
- 深度学习时间序列新突破!4大创新方向霸榜AI顶会
- 小样本异常检测新突破!全新FSAD方法全类别通用,idea代码已开源
- 今日开源(2025-01-10):Virgo,类o1推理系统,7B参数,使用奖励引导的树搜索,探索慢思考能力的跨模态迁移
- 注意力计算减少99.5%,端侧文生图扩散模型成功范式!CLEAR:类卷积线性扩散Transformer
- 中科院/中科大/芝加哥大学创新动态Token合并框架,无需微调,依然强大,零样本视频理解的突破性进展!
- 马斯克:3年内我要造50万机器人,人形机器人会让钱失去意义 | AI 2025
- 英伟达黄仁勋最新访谈:CES 2025 揭秘 AI 与计算的未来蓝图
- Nature社论:量子力学一百年:一场未完成的革命 (三篇汇总)
- 图灵奖得主杨立昆最新万字实录:我们离真正的Agent还差几大关键技术
- 一项研究描述“缺失的自然法则”——进化无处不在
- 2024世界科技发展基础研究回顾:拓展认知边界,发力量子研究
- 突发!美国拟(全面禁止)向中国出口 AI 芯片
- 图像相似性度量标准
- Kaggle知识点:类别重复如何影响模型精度?
- 工程师利用GPT开发智能枪械视频疯传,OpenAI 吓坏了紧急制止!网友:这太危险了
- RAG 的未来,走向繁荣、重塑还是消亡?
- 个人跑大模型,英伟达「皮衣刀客」新出的Project DIGITS与M4 Mac Mini到底哪个好?
- ChatGPT卷入爆炸案刷屏,AI安全正在成为最贵的学费
- 让7B千问模型超越o1,微软rStar-Math惊艳登场,网友盛赞
- OpenAI工程师亲自修订:用ChatGPT实时语音API构建应用
- 一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory
- 麻省理工Nature子刊:AI加速量子化学计算,精度媲美「金标准」,计算效率提升百万倍!
- AI驱动的药物研发领域,AMD与Nvidia展开正面交锋
- 某985大学一女生用AI学术造假被麻省理工退学,本人发文致歉
- 【机器学习】概率论中的极大似然估计:入门与Python实践
- 突发!长鑫存储、长江存储、中芯等被列入黑名单!
- Python和弦图自由!
- 20w字吃透Python matplotlib
- seaborn教程:12.3万字+500多张图形+8000行代码……
- 硕士研三,期刊论文被拒稿,可能延毕,怎么办?
- 给导师打电话发现停机了,果断帮导师充了话费,结果……
- 教授何恺明在 MIT 的第二门课——《深度生成模型》,讲座PPT陆续已出
- CVPR 2024 | ODCR: 正交解耦对比正则化用于非配对图像去雾
- CVPR 2024 | 双向多尺度隐式神经表示用于图像去雨
- 计算机学院的学生该怎样提高自己的编程能力?
- 突发!美国AI芯片限制最后一刀!英伟达AMD全球禁运,只配5万块
- Search-o1:赋予推理模型主动搜索的能力
- 增强大模型的推理能力:从思维链到连续思维链(中)
- 用LLM做文本分类,微调选base还是chat
- RTX5090发布,与4090的不同点及相关思考!
- 飞桨PP系列新成员!PP-VCtrl助力高效可控的视频生成
- 目前我见过的最好的两本LLM大模型入门书!一本国内人大发表!一本国外出版两个月GitHub星标已狂飙到37.6K!
- 聊聊PRM(过程奖励模型)
- 你的RAG出错了?快来Get这份改进秘籍
- 2024 AI TimeLine 回顾(独家视角)
- 【AIGC律师】AI领域的律师服务正式开启全新篇章!
- 【AIGC应用】从仿生到情感交互,迈向“类人”新高度仿生技术的突破
- 【AIGC趋势】暴走4万步逛遍CES2025:十大方向最火,中企已上牌桌
- 【行业动态】NVIDIA CES 2025 大会,百度也推出了AI搜索
- 重大突破!微软发布“自我进化”,帮小模型超OpenAI-o1
- Anthropic新研究:用统计思维评估大模型
- 焱融全闪 F9000X 性能再创新高,全面释放大规模 AI 计算效能
- 总决赛直播|国内首个星际2「AI Agent大模型电竞赛」总决赛周六晚上8点直播!
- 德国BG诊所:ChatGPT在同理心方面,比专家更好
- 让Qwen2.5 7B超越o1,微软干的!MSRA推出小模型数学推理自我进化新方法
- 好家伙,海螺直接拍了个AI版的《教父》
- 谷歌内部AI人才大迁移,统一纳入DeepMind旗下,归哈萨比斯领导
- 英伟达迷你超算遭友商嘲讽:宣传FP4算力,实际“不如买个游戏电脑”
- AMD把o1炼成了实验室助手,自动科研经费节省84%
- AI预测论文能不能中,8B超越70B大模型,港大发布图文融合多智能体GraphAgent
- o1 + RAG = search-o1,开源
- 重磅!Salesforce宣布停止招聘软件工程师,因为AI将生产力提升了30%
- 吴恩达:提效10倍,这套技术栈必须分享!
- o1再升级!人大&清华提出Search-o1:赋予推理模型主动搜索的能力
- TrustRAG:增强RAG系统鲁棒性与可信度的创新框架
- 重塑工作与生活:探索18大顶尖AI助手
2025-01-09
- 犄角旮旯里的大模型拙见:兼看大模型在事件演化捕捉上的能力实验
- 京东算法岗一面面经
- 今日开源(2025-01-09):Phi-4,微软开源14B参数小模型,数学性能超越GPT-4o,具备精准指令遵循和强大安全性
- Anthropic四大专家“会诊”:实现深度思考不一定需要多智能体,AI完美对齐比失控更可怕!
- 万物智能演化理论对23个科学与哲学重要问题的探索性解答
- 吴恩达对话业界领袖:揭秘2025人工智能五大风口
- DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿
- 加州伯克利教授Stuart Russell演讲:AI创造15万亿美元巨大财富,我们如何把握这波时代红利?
- 同济提出简化 Transformer结构:在RTX3090上实现CLIP的轻量级训练 !
- 小白学时间序列:MASS相似度计算
- 大厂新年第一裁,微软全部门危!内部员工:客户宁愿跳槽也不想与我们 IT 部门打交道
- 终于等到你!“西瓜书”《机器学习》官方配套习题集重磅出版 | 送书福利
- 如何证明一个数是无理数?他们找到了欧拉和黎曼错过的证明,华人数学家唐云清参与
- 通义万相视频生成重磅升级,成功登顶VBench,运镜、质感直达专业级
- 具身智能新高度!智元机器人推出全球首个4D世界模型EnerVerse
- 一秒内从单个图像生成3D对象,支持实时编辑,Stability AI推出3D生成新方法SPAR3D
- 引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述
- 分子特性预测新框架来了!浙大侯廷军团队、匹兹堡大学联合提出跨通道学习,各大基准表现亮眼
- 逆向设计电路,深度学习开辟全新的自动综合道路
- 太顶了!Jupyter Agent 让我大开眼界!
- 野鸡高校强迫全校学生4h速成论文并发表,QS排名飞升全球前15!
- 【Python】用Python实现量化个股选择
- 【机器学习】密度聚类分析在网络流异常检测作用
- 中国科学院院士!顶尖大学,迎新校长!
- 中山大学通用具身机器人中心招聘博后/工程师/研究助理
- AI服务器环境搭建指南,从裸机到“战斗”机(上集)
- 4套matplotlib速查表.PDF
- 70k 入职字节算法岗,确实可以封神了!
- 再见,CDN 巨头:Akamai 宣布 2026 年终止中国服务
- 60 个神级 VS Code 插件!
- 从0到1实现神经网络(Python)
- AAAI’25 | BSAFusion: 用于未对齐医学图像融合的双向逐步特征对齐网络
- 阿里通义等提出Chronos:搜索智能体技术助力新闻时间线总结
- Github揽获1.6K星!南大、腾讯发布VITA-1.5: 迈向GPT-4o级实时视频-语音交互
- 从ROPE到Yarn, 一条通用公式速通长文本大模型中的位置编码
- 增强大模型的推理能力:从思维链到连续思维链(上)
- 千问LLM:在家也能养“大脑”:本地运行大型语言模型的奇妙之旅
- 大模型infra实战|上百个Lora动态部署
- 一个替自己投简历找工作的 AI Agent 悄悄火了
- 百强榜官宣!2024年度星河产业应用创新奖揭晓
- 2024 年度总结 LLM System Research:过去半年的科研心路历程
- 分块的艺术:提升 RAG 效果的关键
- Open-Sora: 让所有人都能轻松制作高效视频,可生成16秒720P视频,模型代码全开源!
- Face2QR:可根据人脸图像生成二维码,还可以扫描,以后个人名片就这样用了!
- AI生成大片,Movie Gen可以生成长视频并配上完美的音效,带给观众更好的观看体验。
- 面试官:大模型的量化为什么不会失之毫厘谬以千里?
- 分享一个网盘搜索工具,想搜什么就搜什么
- 6.3K+ Star!Resume Matcher:一个开源免费的智能简历优化工具
- 1月9日周四 | 每日一图
- 1月9日周四 | Python热门项目
- 1月9日周四 | Github今日热门
- 271-A1|情感驱动音乐到视觉图像操纵,反编辑概念抹除;多身份视频个性化,音频驱动肖像动画化,音频驱动3D感知说话脸视频编辑
- 271-A2|单目视频到4D自回归生成,单目视频重建动态衣物解耦数字人;基于潜在空间GAN的人体动作合成
- 271-B1|面向GPT-4o的实时视觉与语音交互,多模态慢思维系统,面向长视频理解的大规模基准与数据集,图像描述生成
- 271-B2|单目视频重建3D,基于跨视角GS的大型场景重建,基于并行GS的大型城市建筑细粒重建,通过RGB图像估计布料3D状态
- 270-B1|多模态视频理解系列;多模态3D理解系列
- 270-B2|面孔与人类理解综合性基准测试,高分辨率深度估计,扩散结构化语义先验增强图像任务;图像描述生成,视频摘要生成
- 270-B3|室内场景稀疏表面重建,GS初始化与稠密化,从未标记视频重建全景场景,基于球形高斯的GS加速;开放词汇3D高斯分割
- 重磅!微软开源最强小模型Phi-4,超GPT-4o、可商用
- Anthropic洽谈新一轮融资,估值600亿美元
- 2025 AI手机交互体验:它能说会道,有眼有脑,是更聪明更懂你的AI伙伴
- 今天起,汉字也能AI视频生成了!《滕王阁序》直接拿捏到位了
- 黄仁勋一句“量子计算还需20年才实用”,概念股应声腰斩
- 量子力学100岁了:一场颠覆物理学的“速战速决”|Nature
- 表格处理神器登上Nature!开箱即用,平均2.8s解读任意表格
- 黄仁勋评价AI PC销量不及预期,联想VP回应了 | CES 2025
- 微软phi 4开源,以小博大~
- 微软Phi-4开源,14B的王~
- 瓦力算法1月第1周急招岗位|/ Shopee / 腾讯音乐 / 大卓 / 混元 / 多益 / 小红书 / 金山
- Table-Augmented Generation(TAG):Text2SQL与RAG的升级与超越
2025-01-08
- 大模型用于情报分析时间线生成(TLS)任务:根本问题及两个代表工作
- 2024年 15 种典型 RAG 框架
- 30个TensorFlow绝技,带你玩转机器学习
- 今日开源(2025-01-08):Aria-UI,面向GUI智能交互的多模态模型,纯视觉理解,提升动态场景GUI定位准确性与效率
- 【源头活水】OpenAI奥特曼发长文「反思」:十年艰难创业路,如今已掌握AGI秘诀
- 【他山之石】AAAI 2025 | 基于真实世界雾霾驾驶视频的视频去雾和深度估计
- 【他山之石】AAAI 2025 | IML领域首个稀疏化视觉Transformer,代码已开源
- 智源发布2025十大AI技术趋势:从Agent到Agentic AI
- 伯克利对齐大师罗素:AGI 会让地球上所有人达到西方中产阶级的生活水平,全球 GDP 将增长约 10 倍 | AI 2025
- 谷歌新动作!Sora前负责人带队打造“现实世界模拟器”,AI领域再掀波澜
- “AGI不会在2025年出现”,Gary Marcus对AI的25大预测!
- 何宝宏:大语言模型上半场已进入“垃圾时间”
- 黄仁勋:英伟达引领机器人行业革命,未来人人都能有超算 | AI 2025
- 脑机接口预示着未来生活质量的提高
- 小白学大模型:构建LLM的关键步骤
- “要点脸吧!”大模型巨头“吸血”网站资源无底线,被惹怒的开发者来“复仇”了!
- 北航&ZGCLAB 提出首个检索增强生成基准测试工具库 XRAG
- 黄仁勋圈重点的世界模型平台是个啥?技术报告全解析,华人贡献中坚力量
- 够新!够权威!智源研究院发布2025十大AI技术趋势
- 少用33%数据,模型性能不变,陈丹琦团队用元数据来做降本增效
- o1也会「想太多」?腾讯AI Lab与上海交大揭秘o1模型过度思考问题
- AAAI 2025 | 大模型推理加速新范式:加速比高达3.51倍、成本降至1/3
- 老婆饼里没有老婆,RLHF里也没有真正的RL
- 准确预测蛋白质功能新SOTA,中南大学推出全新深度学习模型,登Nature子刊
- 支持细胞与细胞器建模,更全能的空间算法推动更高效的细胞时空研究
- Python 数据科学必知的 25 个 Github 资源库
- 1999美元!RTX5090发布
- 最新AI Agent万字综述分享!
- 年末,高校批量“降薪”?!
- 体制内,“拒绝”留学生!
- 陈丹琦团队新作:数据砍掉三分之一,性能却完全不减
- 【附复现代码】基于PINN的论文创新思路
- 神经网络为何非激活函数不可?
- htmx 会是新的 jQuery?
- 当了leader才发现,大厂最想裁掉的,不是上班总迟到的,也不是下班搞失联的,而是经常把这3句话挂在嘴边的!
- 基于深度学习的图像边缘和轮廓提取
- 基于OpenCV的图像梯度与边缘检测!
- 5分钟完成Swin Transformer部署
- deepseek v3训推优化的剖析
- 如何让 RLHF 训练更稳定?
- 向量模型的词序感知缺陷与优化策略
- deepseek v3训推优化的剖析
- 英伟达「世界模型」发布,75页报告,引爆物理AI革命!GitHub狂飙2k星!(附论文及源码)
- PyTorch 模型,原生FP8训练进展
- 报告下载丨重磅!2025十大AI技术趋势
- 智源研究院发布2025十大AI技术趋势,具身智能、Super APP、AI安全成焦点
- 聊聊Firefly——开源且值得学习的LLM训练库
- 强大推理背后的危机:PRMBench 揭示过程级奖励模型的潜在缺陷!
- Virgo:类o1多模态大模型的初步探索
- RAG实战-Markdown文件解析思路分析与实现
- Google发布新AI工具Whisk:使用图像提示代替文本,快速完成视觉构思。
- 多模态图像生成模型Qwen2vl-Flux,利用Qwen2VL视觉语言能力增强FLUX,可集成ControlNet
- RTX 5090 硬件参数详解
- 一个专门处理PDF文件的网站,20多个功能免费使用,无需下载安装
- 机器人ChatGPT时刻!英伟达开源世界大模型,完美模拟物理世界!
- 极客说|微软 Phi 系列小模型和多模态小模型
- 英伟达发布Project DIGITS,轻松运行2000亿参数模型
- AI技术进阶课来啦!技术深度挖掘与实践操作并行,Azure AI 人工智能工程师训练营正式开启!
- 《AI 大咖说》栏目诚邀 AI 大咖入驻,共创智能新声!
- 英伟达点火联想燎原:RTX 5090显卡真机已就绪 | CES 2025
- 奥特曼家里也内讧了!亲妹告他长期虐待,刻意隐瞒遗产;家里其他人联名否认
- 具身智能赛道迎来另类玩家,同时布局智能+传感+控制三大技术,已批量出货韩国
- 谷歌爆款学习神器更新,一键插嘴AI对话,哪里不会问哪里
- 空间智能上车!长城汽车铁娘子:真正的智能车应该无缝集成所有场景 | CES 2025
- 小米千万大奖颁给汽车:超级电机,但很AI
- Cache-Augmented Generation(CAG):一种更快、更简单的RAG替代方案
2025-01-07
- OCR噪声对RAG性能的影响分析:兼谈公众号文章的价值正确定位
- 大模型Text2SQL全栈技术最新综述
- 优化 | 如果你的PyTorch优化器效果欠佳,试试这4种深度学习中的高级优化技术吧
- 如何给大模型喂时序数据?基于LLMs的时间序列预测5大方法汇总
- 今日开源(2025-01-07):Cosmos平台发布8款物理AI模型,基于视频文本的未来视觉世界生成,助力机器人与自动驾驶研发
- 黄仁勋:英伟达引领机器人行业革命,未来人人都能有超算 | AI 2025
- 谢赛宁、李飞飞「空间智能」新作:多模态大模型仍难突破空间推理
- 拥抱科研新范式——人工智能带来的科研革命
- AGI理论比较:主动推理、强化学习、控制论、贝叶斯大脑、效用决策、有限理性、情感动机、动态体内平衡
- Kaggle知识点:表格竞赛中NN什么时候优于树模型?
- 突发!腾讯、宁德时代等被列入美国防部黑名单,旷视科技被放出!最新回应来了
- 仅用 8 张显卡和一万块钱,清华团队用7B模型打败GPT-4o数学推理
- OpenAI给不了的,DeepMind给,Sora联合负责人跳槽后开组新团队
- RTX5090震撼发布,国行16499元起,黄仁勋「美国队长」pose亮翻全场
- CES 2025:AMD锐龙9000新品亮相,游戏、创作力表现超Intel旗舰
- 单张图像探索3D奇境:Wonderland让高质量3D场景生成更高效
- 手机「自动驾驶」大揭秘!vivo万字综述探讨大模型手机自动化
- AI华佗?港中大、深圳大数据研究院提出医疗推理大模型HuatuoGPT-o1
- 简化芯片设计传统,AI训练的新型算法正改变芯片研发范式
- 关于ScienceAI投稿的相关说明
- RTX 5090正式发布!在家就可以跑大模型了
- “洪荒之力”傅园慧,任职C9!
- 黄仁勋「美国队长」pose,亮翻全场!RTX 5090震撼发布,惊爆价!
- 香港科技大学(广州)招收大模型方向全奖博士生
- 【机器学习数学基础系列】概率论中的极大似然估计:入门与Python实践
- 详解Python matplotlib深度美化(第一期)
- 详解Python matplotlib深度美化(第二期)
- 2025 数据库技术展望
- 代码开源 | 基于YOLO的16种目标检测项目,人体/交通/医疗/工业等方向超全
- 深入浅出各种边缘检测算子及其推导
- 使用 Python 和 OpenCV 进行图像聚类
- NIPS 2024 | 缺失值存在下的无监督异常检测
- 1999美元!RTX5090发布
- RTX5090昨日震撼发布,5大看点速览!!
- Conv2Former:Transformer风格的视觉卷积神经网络(附论文及源码)
- 时间序列基础模型结合RAG,提升Zero-shot Learning时序预测效果
- 央国企!入局AI大模型(附66家名单)
- 24届毕业生聊PhD就业,国内or国外、学术界or工业界or创业
- 清华团队靠强化学习让 7B 模型打败GPT-4o数学推理
- 人力资源的分析思路和技巧
- 关于RAG你不得不了解的17个技巧
- NVIDIA发布GeForce RTX 50 系列,图形性能翻倍,售价549美元起!
- 参数减少99.5%,媲美全精度FLUX!字节跳动等发布首个1.58-bit FLUX量化模型
- 如何提取 ChatGPT 的训练数据
- GraphReader:基于图的智能体,增强大型语言模型的长文本处理能力
- 2025年春节,AI红包封面如何让你月入过万?
- 麻省理工学院推出AI教育平台,课程覆盖小学至高中,完全免费在线学习!
- 10.8K+ Star!Activepieces:一个开源的AI自动化工作流工具
- 1月7日周二 | 每日一图
- 1月7日周二 | Python热门项目
- 1月7日周二 | Github今日热门
- 267-A1.1|统一像素级视觉LLM实现理解生成分割编辑,对话为中心的故事可视化,细粒度多维人类偏好学习,透明通道动画贴纸生成
- 267-A1.2|平衡内容真实感与艺术风格,增强视觉美学,野外现实世界图像编辑;直接优化扩散过程的端到端训练框架
- 267-A1.3|图像属性操控的轻量级插件,针对个体面部特征的多样化妆容;文本引导时尚图像编辑,细粒度属性增强时尚视觉语言预训练
- 267-A1.4|第一人称空间视频的感知质量评估,立体图像内容质量与偏好评估;图像的符号解耦表示;安全(概念擦除,AI生图检测)
- 267-A2|Open-Sora高效视频制作民主化,多属性开放域视频编辑;细粒度视频到音频,音频驱动说话头,高斯场头发保持说话脸
- 267-A3|前馈文生3D场景,场景图与布局引导复杂场景生成,静态3D转动态4D,单肖像图生个性化3D头;照片真实感3D虚拟世界
- 267-B1|几何数学视觉推理,长视频理解,视觉FM在不同视角下的不稳定性;EEG到图像视频音频综述;低光图像增强,密集预测任务
- 267-B2|3D人类身体生成式建模;全身人类抓取动作合成,多身体HOI合成;GS(关键帧为中心,概率掩膜自适应,原生4D原语)
- 270-A1.1|概念个性化文生图,对象级视觉提示用于组合性生成;实体级控制生成,测试时间可控生成;分层图像合成;多类别风格生成
- 270-A1.2|音频引导视觉场景编辑,高效高质量与加速生成系列,基于参考的草图提取,结构化视觉内容PPT设计,面部美学优化策略
- 270-A1.3|自回归视觉生成,统一图像生成理解;LDM重建与生成间权衡,高效扩散(扩展3x3卷积,后训练量化);文生图GAN
- 270-A1.4|图像和谐化质量评估,物体移除;精准消除不当目标概念,偏见与刻板印象,图像水印技术
- 270-A2|DiT视频恢复,视频对象插入,可控相机与对象运动的合成数据集,视频生成与相机姿态估计;优化视频生成各个组件相互作用
- 270-A3|前馈重建模型编码的3D生成,学习服装动画化;从谷歌地球提取建筑网格,自动驾驶4D街景生成,稀疏重建大型动态户外场景
- 268-A|今日Arxiv无更新
- Sam Altman:OpenAI确定发布AI Agents,彻底改变企业效率
- Meta开源多模式模型,轻松混合文本和语音
- Sora核心作者掌舵,谷歌世界模型新团队全球招募:百万底薪起步
- 老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了
- 陈丹琦团队降本大法又来了:数据砍掉三分之一,性能却完全不减
- 用大模型吃瓜更智能了!阿里通义实验室提出新时间线总结框架,全面提升新闻总结效率
- 具身智能2025第一融,智平方宣布完成数亿元Pre-A轮融资
- CES2025进行中,量子位AI专题已就位
- 国产AI眼镜1799元现货开卖!阿里的定制大模型,深圳的硬件
- 【手撕LLM_Nv Embed】英伟达的LLM-as-Embedding ICLR高分, RAG检索有救了!
- 黄仁勋身穿新皮衣,发布5090了!
- 手机也能玩RAG?谷歌EdgeRAG做到了~
- 王炸5090背后,老黄还悄悄开源了Cosmos~
- OmniTokenizer-视觉tokenizer生成
- PromptWizard:微软在AI prompt优化方面的革命性方法
2025-01-06
- CVPR 2024 | 英伟达&斯坦福新作:未知关节物体数字孪生体的神经隐式表示
- 今日开源(2025-01-06):Dolphin 3.0最新一代指令调优模型,0.5B至8B多量级参数,终极通用AI模型
- 【源头活水】DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet对比实测来了
- 1.4s 即可生成1024px图像!SnapGen:轻量化架构和训练策略实现端侧文生图
- 奥特曼开启 AGI 倒计时:很快搞定核聚变,第一批智能体会在今年加入劳动力队伍 | AI 2025
- 强化学习上大分!清华团队训练出数学推理超越 GPT-4o 的 7B 模型
- 最新!Sam Altman反思来了:已经知道如何构建AGI,现在OpenAI转向「超级智能」
- 2025智能世界50震撼预测!AI海啸来袭,5维度看清AGI与潜在可能
- 人工智能是不是走错了方向?
- DARPA 着眼于新的量子传感技术研究
- PDFTriage:来自Adobe的RAG问答方案 (文末送书)
- Sam Altman 最新采访回应一切
- 显卡在偷懒?阿里大模型创作平台 MuseAI 极速模型切换技术提升 AI 创作效率
- GPT做不好图生成?Tokenization是关键!新方法重新定义图生成和表示方式
- 人工智能走向核能,互相依赖的时代发展新搭档
- 重磅!Python 3.14.0 Alpha 3 已发布!
- 一块kaggle金牌的冲击有多大?顺利拿下各大Offer
- 知乎热议:博士的年薪一般是多少万?
- 【Python】Python打包成 exe,太大了该怎么解决?
- 离谱,计算机女博士OnlyFans创业,年入千万…
- 谷歌CEO立军令状:必斩OpenAI,夺回第一!
- 统计学中的假设检验:Python实现U检验和卡方检验
- 用大模型写了本书
- Python matplotlib的上限:可“追星”,可“逐浪”!
- 刚刚,2025 中国大学排名发布
- 人工智能是不是走错了方向?
- “AGI不会在2025年出现”,Gary Marcus对AI的25大预测!
- 24小时掌握一项新技能的高效方法
- 60k感知算法岗面试,考察热门Occ算法及难点!
- 目标检测正负样本区分策略和平衡策略总结
- Baichuan Alignment Technical Report 论文精读
- 工作近五年,谈谈各类公司和部门的区别
- [vLLM vs TensorRT-LLM] :系统调度schedule比较
- 千问LLM之LLM的特工行动:工具召唤功能实战案例?Agent 到底是什么?
- 计算DeepSeekV3训练的MFU
- Sam Altman的2024年终总结
- 小目标检测算法中,常用的6种解决方式汇总
- 人工智能的发展方向,是不是走错了?
- 万字长文,深入浅出开放词目标检测算法!
- 一文了解英伟达成功背后的原因,CUDA生态系统!
- 落地厦门!百度飞桨人工智能产业赋能中心再添一城
- 飞桨AI for Science课程表|前沿讲座系列课程预告(四)
- 直播|大模型技术框架和路线图解读,一站式了解《大语言模型》附PDF下载
- 直播|Meta&纽约大学, 探索大模型隐藏视觉能力, 从LLM到Unifed Model
- 深度学习最强模型!挑战一篇文章让你理解什么是Transformer模型!从原理到代码的详细讲解!
- 为什么用C语言编写操作系统?
- 只要会复制粘贴,创意图表你也能做
- CCF对话式检索增强生成Top1赛后方案
- 复旦&字节提出layout-to-image新范式,支持基于布局的MM-DiT架构下可控图像生成!
- 单幅图像合成 360° 3D场景的新方法:PanoDreamer,可同时生成全景图像和相应的深度信息。
- 提出街景定位大模型AddressCLIP:一张图实现街道级精度定位!
- 微软发布2025年AI预测:AI Agents将彻底改变工作方式
- 打造企业“数智大脑”,达观数据AI Agent 的创新与实践
- AI国潮 | 2024年《AI国潮跨年说》
- 大的要来了?Sam Altman:OpenAI离“奇点”很近
- bge-m3准备退休,试试这个!
- Sam Altman最新反思:2025年首批AI Agents将成为“劳动力”~
- 装上大脑,开源AI搜索MiniPerplx起飞~
- Multi-Agentic RAG:探索智能问答系统的新边界(含代码)
2025-01-05
- 语音处理落地组件全家桶:语音大模型、数字人、语音到文本、文本转语音全集
- 技术实践指引:3个适合练手的开源数据及项目平台
- 【他山之石】AAAI 2025|腾讯优图实验室10篇论文入选,含大型语言模型、深度伪造检测等研究方向
- 【他山之石】ACCV 2024 | ViT涨点神器!DeBiFormer:双层路由注意力新框架
- 【源头活水】数据不够致Scaling Law撞墙?CMU和DeepMind新方法可让VLM自己生成记忆
- 2025 AI深度前瞻:推理成本暴降90%,智能体迎GPT时刻,空间智能涌现
- 复旦大学51页的论文,从强化学习的角度分析实现o1的路线图
- 深度|诺奖得主Hinton:人类当下局面是,旧石器时代的大脑、中世纪的制度与类神的技术
- 斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准,能力涌现怕不是检索题库
- 97家央企“一把手”年薪披露;小米汽车工厂开放对外参观,超8300人预约;清华辟谣80%毕业生出国不归 |AI周报
- 机器人技术永远不会出现“ChatGPT时刻”
- 那些选择退学的博士们:几种退学原因
- 【深度学习】突破LSTM!结合ARIMA时间序列预测 !!
- CVPR今年这情况,很严重,大家做好准备吧
- 悉尼科技大学招收:机器学习&人工智能全奖博士生
- 本地运行大模型,要买什么显卡?
- Python中级教程-测试开发
- Python“万水千山图”—山峦图/嵴线图/峰峦图
- 时隔6年,谷歌BERT终于有替代品了!
- OpenAI 最大秘密,竟被中国研究者破解?复旦等惊人揭秘 o1 路线图
- 「Github一周热点56期」DeepSeek开源大模型、免费编程电子书、电子书转有声书,思源笔记和轻量推荐系统
- 后悔没早点转行嵌入式开发
- 招了又裁?软件开发者发招聘后宣布:解雇整个技术团队,用AI取代!
- 加班到凌晨,为什么没人发朋友圈了?
- 11 种特征选择策略总结!
- 基础知识 | 小波变换
- 计算机专业同学应该学哪些知识?
- IEEE TPAMI | 无监督去雨:非对称对比学习与自相似性相遇
- 我用8道变态烧脑题,测出了o1的国内最强平替
- 干货!带你了解7种检索增强生成 (RAG) 技术
- 东京大学 | Adobe 提出InstructMove,可通过观察视频中的动作来实现基于指令的图像编辑。
- 谷歌DeepMind重磅推出多视角视频扩散模型CAT4D,单视角视频也能转换多视角了。
- ComfyUI | Flux实拍与卡通风格lora推荐, 用于一键生成创意图像,支持用户输入特定描述。
- 设计小白秒变大师?AnyDesign:你的时尚图像编辑神器!
- 面试官问:如何在搜推广中利用LLM
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- Github热门项目周报 | 第1周
- 1月5日周日 | 每日一图
- 1月5日周日 | Python热门项目
- 1月5日周日 | Github今日热门
- 一篇88页GraphRAG全栈技术最新综述
- ValuesRAG:以检索增强情境学习强化文化对齐
- 利用Gemini 2.0+开源框架ExtractThinker轻松提取任何文档信息(含代码)
2025-01-04
- 老刘说NLP社区2024年终演讲:回顾得失,踏实前行
- 再见 LangChain!Atomic Agent火了!
- XGBoost算法原理小结
- Mamba+时间序列预测!既要SOTA又要低开销!
- 2025 年,大模型会有哪些新变化?
- 2025 年,大模型会有哪些新变化?
- “agent”一词令人沮丧,GPT-4级模型已不值一提,大神程序员盘点「大模型的2024」
- 这是2024年我们对LLMs所学到的东西
- 北航自动化教授秦曾昌:人类认知信息处理过程奠定了AI基础
- 习近平签署主席令!研究生,迎大变革!
- GhostRNN:以低成本 Transformer Layer 实现 RNN 模型精简与性能提升 !
- Nature 发布,AI 全球 100 强!
- OpenAI又招一员大将!曾入围美国“少年诺贝尔奖”,还是一名哈佛讲师
- 抑郁6个月后,DeepMind科学家离世,万字绝笔谈在AI行业工作压力
- Python高级编程:web开发之Flask
- 复旦首发“AI禁令”!!
- Nature 发布,AI 全球 100 强!
- 留言赠书 | 技术人的年末书单,这 10 本最受欢迎!
- 微调YOLOv11:实用指南 【详细过程与代码】
- 对比损失思想设计loss function的方法。
- NIPS 2024 | 眼动引导的多模态对齐用于医学表示学习
- 度量学习中关于排序损失函数的综述
- 从infra的视角聊聊DeepSeek-V3
- 图解Megatron TP中的计算通信overlap
- 曾经火热的Graph Embedding和GNN在推荐系统上还有前途吗?
- 千问LLM:什么是 Sharding? 之ZeRO 优化(Zero Redundancy Optimizer)
- 博士生罢工、工资上涨、学术头秃:PI生存指南
- [vLLM vs TensorRT-LLM]:动态序列长度场景对比
- 图解Megatron TP中的计算通信overlap
- 检索增强生成 和思维链 结合: 如何创建检索增强思维链 (RAT)?
- 实时高保真人脸编辑方法PersonaMagic,可根据肖像无缝生成新角色、风格或场景图像。
- 北航 | 第一个多功能即插即用适配器MV-Adapter:轻松实现多视图一致图像生成。
- 2025,AI Agents爆发元年~
- 智能新纪元:代理AI的崛起与未来
- Query 改写综述:提升信息检索效率与准确性的关键技术
- RAG 中的分块策略:从基础到前沿的全面剖析
2025-01-03
- GraphRAG范式的新角度思考及一个很有信息量的总结
- 逆天顶会思路!傅里叶变换+Attention!创新性极强,足够支撑一篇高分论文
- 涨点超强!图像特征提取最新方法!性能效率快到飞起
- 今日开源(2025-01-03):字节开源文生图版本框架Infinity,全新位元视觉自回归建模,2.6倍提速高分辨率图像生成
- NeurIPS 2024 | DACER:扩散模型与在线强化学习强强联合创造新SOTA!
- 昆仑万维周亚辉:人形机器人时代,中国新首富会是张一鸣、雷军或王兴
- Agent 炒作一年仍未落地,99% 不懂 AI 的人和剩下 1 % 产生了鸿沟 | AI 2025
- 从「天才少年」到被迫「追赶者」:诺奖得主、AlphaGo之父Demis Hassabis眼中的AI未来
- 抑郁6个月后,DeepMind两万引科学家离世,万字绝笔谈在AI行业工作的压力
- 2025风口已至?6000字具身智能年度复盘,寻找产业投资机会!
- New Scientist|我们可以使用量子计算机来测试激进的意识理论吗?
- TimeRAG:通过RAG进行时间序列预测
- 科研背 KPI、暴富但痛苦,41 岁DeepMind 天才科学家疑因抑郁症去世,众大佬集体缅怀
- 从企业级 RAG 到 AI Assistant,阿里云Elasticsearch AI 搜索技术实践
- 美对华最强 AI 投资禁令正式生效,罚款上不封顶!投资人:影响不大,有利益就有人干
- 赵晨旭:非标模态的多模态大语言模型如何模拟人类主观感受
- Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期
- 中国版GPT-Zero,仅1000样本训练5分钟即超越传统检测性能,复旦、武大等提出ImBD:通用AI内容检测器
- 从pdb到unittest的10个必备Python调试技巧
- 提升算法对比:AdaBoost、CatBoost、LightGBM、XGBoost
- 2025年ABC中国大学排名发布
- 期刊论文写作格式模板(推荐收藏)
- 上海微软大裁员,赔偿达N+8,12年老员工感叹:拿20个月工资走人,每月3000失业补助,也是种幸福
- 10秒出片!国产视频模型又整新活了
- 本科学历,被誉为「爱因斯坦级」天才
- 真的建议赶紧搞个软考证书!(红利期)
- Python 高级教程:异步与并发编程详解
- CNS必备UpSet图,这样画,这样看!
- 联手 OpenAI,吴恩达推出一门 o1 推理新课程,还免费
- AI数钢筋
- 训练速度最高100倍提升!基于PyTorch实现的可微逻辑门网络开源
- 图像相似性度量标准
- 相机标定解析
- 谷歌41岁天才科学家SuperGLUE之父英年早逝!两月前留下绝笔:从事大模型研究让我深陷抑郁!
- 手写self-attention的四重境界 self-attention
- 微软公布OpenAI闭源模型参数!4o-mini 8B!
- LLM 预训练到头了吗?
- AI项目工程化,CUDA开发心得汇总!
- 聊一聊大模型六小虎和四大厂的2024!
- 超越YOLO11和D-FINE!DEIM:最强实时目标检测算法!(附论文及源码)
- 成功!在26年前的老年机上跑大模型!
- GM的Kaggle大模型竞赛技巧-合成数据
- 2024年AI大模型回顾!
- 2025 AI十大趋势发布会丨原生多模态、合成数据、AI4S、超级应用…
- 有礼调研 | 智源社区用户满意度调研,百份礼品待您开启
- 2025年必看「智源报告大盘点」
- 从infra的视角聊聊DeepSeek-V3
- 手写self-attention的四重境界 self-attention
- 数据分析为什么常用Jupyter?
- 如何从文档构建自己的 RAG 评估数据集
- 年终巨献 | OpenCSG开源SmolTalk Chinese数据集
- NeurIPS 2024 | SHMT:通过潜在扩散模型进行自监督分层化妆转移(阿里&武汉理工)
- 字节 & 清华大学提出 AnyDressing :通过潜在扩散模型实现可定制的多服装虚拟试穿。
- NeurIPS2024 | OCR-Omni来了!字节&华师提出统一的多模态生成模型TextHarmony。
- Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!
- 【智谷要闻】科技未来——智谷AI
- 【行业动态】DeepSeek-V3 正式发布,Sam Altman发帖公布了2025年OpenAI的产品目标目标
- 【AIGC趋势】00后李飞飞学生联合创业,破解世界级机器人难题,被稚晖君投资,独家对话创始人
- 【AIGC应用】最快5秒光速出片,全球首个接近实时生成的AI视频模型来了
- 论文研读|TEXGen:一个生成式扩散模型用于网格纹理|SIGGRAPH Asia 2024 最佳论文提名
- 招生|香港中文大学(深圳)招募 | 脑机智能方向 博士生 & 实习生
- Day262|A2A3B1B2B3遗漏补回提示
- 262-A2.1|多文本长视频生成,基于故事板的文生视频,评估文生视频模型的故事完成能力,用于故事情节深度视频理解的大规模数据集
- 262-A2.2|多角色视频,自由视角人类动画化,音频驱动虚拟头像;大运动视频帧插值,大运动视频VAE,视频VAE解耦结构与动态
- 262-A3.1|自回归3D生成,形状VAE,复杂形状可微分网格;单人脸图生成3D头部,前馈文生3D人类,VLM自动化3D服装
- 262-A3.2|交互式3D场景创建,动态NVS用于电影制作;法线引导点云到3D高斯绘制;室内场景合成(纹理合成,场景隐式神经)
- 262-A3.3|弹性物体高斯模拟器;不可见3D声源定位与分类;大规模双人舞蹈数据集,多人交互动作生成,全面的共语动作生成
- 262-B1B2|文本丰富视觉理解,图形问答,流程图理解;人类中心视频理解;聊天机器人;EEG视觉解码;零样本学习;手物操作视频
- 262-B3.1|大规模场景重建,前馈GS全景重建;拓扑感知GS结构完整性优化,几何纹理感知密集化用于真实感GS,主动式场景重建
- 262-B3.2|语言嵌入表面高斯用于场景理解,未校准稀疏前馈生成语义高斯;未校准稀疏HSfM,野外高难度物理合理人类动作恢复
- 突破算力限制!Meta开源“记忆层”,重塑Transformer架构大模型
- 2024 AIGC多模态技术与应用发展峰会成功举办
- 美国亚利桑那州批准AI 教学,新型特许学校
- SD3.5官方教程:5大重要框架,教你用文本生成精准图片
- langchain送来新年礼物,开源canvas来了
- 多模态AGI:下一Token预测技术架构最新综述
- 提示词(Prompt)书写框架:解锁高效与精准的AI交互
- 企业为何需要小型语言模型(SLMs):AI 应用的新趋势与策略
- 优秀Prompt库大盘点:让你的Prompt更专业
2025-01-02
- RAG落地端侧场景:EdgeRAG面向端侧RAG优化思路及特定领域多模态探索
- Sentence-BERT实现文本匹配【对比损失函数】
- 今日开源(2025-01-02):Story-Adapter,提升长故事的可视化生成能力,无需训练的迭代框架,优化图像生成过程
- 【他山之石】AAAI 2025 | 港大提出SparX:强化Vision Mamba和Transformer的稀疏跳跃连接机制
- 【综述专栏】2024->2025必看的十大「人工智能领域综述」论文
- IBM 八大专家预测:现代编程语言是给人类设计的,AI 需要类似汇编的原生语言 | AI 2025
- 谷歌前 CEO 施密特:AI 将在今年获得“永久记忆”,2028 美国会耗尽能源储备 | AI 2025
- 计算创世纪:生命即代码,代码即生命,自然如斯,技术亦然
- AI模拟细胞,走向全新虚拟生命,斯坦福团队呼吁是时候走出全新的一步了
- 2025规划:把大模型放进冰箱里面
- 被 AI 分掉精力的数学天才陶哲轩,论文被拒了
- 微软全新原生 Copilot 应用被指是 Edge 套壳:从 PWA 转向“原生”,内存占用却飙升至 1GB
- AI模拟细胞,走向全新虚拟生命,斯坦福团队呼吁是时候走出全新的一步了
- 2024 Github 十大最佳 RAG 框架
- ICML 2025,即将截稿!
- Dify 零代码 AI 应用开发:内网离线部署指南
- 某211高校讲师晒工资条,网友:公积金数额令人瞩目…
- 吹爆回归算法,吊打 16 个核心点 !!
- Hinton 发 2024 末日预警:10 年内人类灭绝!奥特曼预言 18 个月 ASI 降临
- “警惕!过度抽象的代码库,是开发者看不见的隐形噩梦”
- 用户暗中评判的 12 种前端微交互
- 长文 | 大模型Post-Training总结
- 2024年大模型总结与展望(技术下篇)
- Deepseek V3 预训练策略解读
- 飞桨PP系列模型上新!PP-DocBee文档图像理解的新‘蜂’向标!
- o1类大模型的过度思考: 2+3=?
- Building effective agents笔记
- Agent未来已来?揭示LLM Agent技术架构与现实挑战
- DeepSeek-V3 正式发布,已在网页端和 API 全面上线,性能领先,速度飞跃。
- 港大&Adobe提出通用生成框架UniReal:通过学习真实世界动态实现通用图像生成和编辑。
- 腾讯优图提出首个基于DiT的高保真虚拟试衣算法FitDiT
- 一个LoRA同时处理内容和风格?UIUC提出UnZipLoRA,可同时训练两个LoRA,与原有LoRA兼容。
- 火鸿 AI-HPC:深度学习的高性价比软硬件协同设计
- 53.5K+ Star!n8n:一个工作流自动化平台
- 1月2日周四 | 每日一图
- 1月2日周四 | Python热门项目
- 1月2日周四 | Github今日热门
- 266-A1.1|高效视觉风格迁移(单轨迹蒸馏加速,基于RWKV架构);自动化图形设计合成,故事到漫画,面板布局如何影响漫画
- 266-A1.2|奖励引导的负嵌入学习,可控生成适配器,选择性主体驱动定制化,多模态条件局部面部编辑,DiT加速;自发现去偏见
- 266-A2|视频编辑的无缝帧传播,零样本视频定制化,实时无限视频流动画生成,持续的文生视频通用预训练;UGC视频质量评估
- 266-A3|结合3DGS统一图文3D表示;3D高斯风格化,可编辑3D高斯头像;CAD结构序列合成,3D形状生成,高频几何SDF
- 266-B1|图表理解,GUI智能体;统一的跨个体脑解码,探索色觉进化及其启发的相机设计
- 266-B2|文生图“字幕噪声”鲁棒性,轻量级图像字幕;多样化稀有样本生成,驾驶场景物体编辑,面部图像伪造定位;视频过程规划生成
- 266-B3|动态视频、反射物体、恶劣天气、稀疏未校准3D重建;未同步未校准视频重建4D
- 创新突破!字节跳动首创无需数据,1.58位超低量化自监督生成
- 谷歌报告:罗马尼亚公共部门69%工作岗位,会被生成式AI补充
- 有奖互动|加入微软开发者社区元旦特别活动,开启探索之旅!
- 新年第2天,百度推出AI搜索功能
2025-01-01
- 2025年开篇:技术及宏观角度回顾2024年大模型发展
- 【源头活水】AAAI 2025 | SparseViT:参数高效的稀疏化视觉Transformer
- 谷歌前 CEO 施密特:AI 将在今年获得“永久记忆”,2028 美国会耗尽能源储备 | AI 2025
- 奥特曼公布OpenAI新年目标:AGI/Agent排前列,4o/Sora要更新,还有……
- 2025 AI“平替”危机:大批程序员真的会被取代吗?
- 进化与发育的变分统一:自由能视角下的自然选择
- AI幻觉能助力科学重大突破?诺奖得主Baker用得可香了
- AI幻觉能助力科学重大突破?诺奖得主Baker用得可香了
- 谁说大学老师不肯分享课件?黄海广老师的《机器学习》课件合集原版今天提供下载了!
- 奥特曼公布OpenAI新年目标:AGI/Agent排前列,4o/Sora要更新,还有……
- 清华大学刘知远团队新作,28位AI天才们的热血传奇,比番剧更燃!
- 稚晖君放大招,具身智能的 ImageNet时刻!
- 2025年了,居然还有人 Python 都没入门
- Matlab—手握数据分析的头把交椅
- 重磅!“AI界拼多多”再发力,国产大模型DeepSeek-V3开源后刷屏,总训练成本557万美元,性能比肩GPT-4o
- 不要再这样编写 async/await
- 如何1个月拿下顶会!
- 多传感器融合定位:基于滤波的融合方法
- 比较CPU和GPU中的矩阵计算
- 顶刊解读 TGRS | 用于微小目标检测的去噪特征金字塔网络与transformer区域卷积神经网络
- 小样本视觉异常检测方案,统一且无需训练,突破跨领域限制!(附论文及源码)
- 一文读懂 NVIDIA GPU 产品线
- 通道间关系建模在不规则时序预测中的研究
- 微软公布OpenAI闭源模型参数!4o-mini 8B!
- NICE42期 | 语言模型不听话怎么办?关于格式忠实性的探索
- 揭秘o1类模型的过度思考:明明只需5个token,它偏要用900个?
- 小米SU7璀璨洋红限定色360°全景图首次曝光?TRELLIS给你答案,实现可扩展多功能3D生成。
- 复旦&微软提出StableAnimator:可实现高质量和高保真的ID一致性人类视频生成
- 阿里面试官问:为什么Transformer的FFN需要升维再降维?
- 263-A1.1|连续条件随机场提高潜在扩散推理效率,通过多模态优化增强图像文本一致性,时尚增强服装图像编辑,个性化面部图像生成
- 263-A1.2|通过递归“标记”预测机制增强扩散过程,利用文生图扩散模型解释分类器的决策,文生图模型评估,文生图偏见攻击
- 263-A2|基于多模态DiT的无调优多提示长视频生成,教学视频制作的最佳相机视角选择,从渲染3D模型中学习稳健单图物体方向估计
- 263-A3|部件级3D生成,多视图扩散增强,自回归3D建筑设计生成;零样本4D人类场景交互合成
- 263-B|以解释性指令统一视觉任务与零样本泛化;视觉空间推理评估基准,无编码器视频语言理解,结合语义图与LLM增强3D场景理解
- Day264|今日Arxiv无更新
- 2025,AI Agents技术栈解读出炉!
- 微软:GPT-4o-mini只有8B,o1-mini仅100B
2024-12-31
- 老刘说NLP及大模型的2024年终总结—不悲不喜、继续前行
- 如何向5岁小孩解释什么是支持向量机(SVM)?
- ECCV 2024 | 跨域语义分割的注意力分解
- CLIP还能再战 !结合Mamba超越传统,仅用1/5参数就达到天花板性能
- 机器学习树模型大比拼:GBDT、XGBoost、LightGBM
- 今日开源(2024-12-31):HuatuoGPT-o1高级医疗推理模型,7B至72B四种参数量级,加入强化学习增强推理能力
- 硅谷神预言家库兹韦尔:科技每年将为人类增加一年寿命,2032 年之后实现“倒流” | AI 2025
- Sam Altman 剧透2025年OpenAI的大计划
- 定格AI浪潮下的宝安:御产业之风,向未来启航
- 图灵奖得主杨立昆:统治欲望源于生存需求,而非智能水平,AI 不会有这种想法 | AI 2025
- Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理
- 推荐报名参赛 | 第五届全国人工智能大赛(NAIC)开放评测
- 7 亿意外之财砸中 150 个打工人?英伟达花重金收购 AI 平台,到手就大方开源了!
- 合成数据的前景与风险
- 50 多岁转型 AI,犀利批判硅谷大厂:“先变成个混蛋才能做成事”
- 资源有限,如何构建高效能的 AI Agent
- Science子刊,斯坦福AI方法表示蛋白互作节点,增强功能识别与PPI推理
- ScienceAl 2024「AI+药物&医疗&基因组&细胞」专题年度回顾
- vscode中调用deepseek实现AI辅助编程
- DeepSeek-V3技术报告解读
- 英伟达年终核弹!全新B300为o1推理大模型打造,RTX5090也曝光了
- 【机器学习】机器学习基础:缺失值的处理技巧(附Python代码)
- 南京大学联合发布首批191家“青年学者友好期刊名单”
- 2024年人工智能年终总结报告|Artificial Analysis
- 计算机科学女博士退学 OnlyFans 创业, 一年翻身还清贷款~
- LSTM模型结构的可视化
- 2024年过去了,我很不怀念它
- 大模型训练效率太低,存储空间太大?有一个新的开源技术能优化这个流程!
- 央视“科晚”启航,讯飞智作打造“AI 张腾岳”亮相,多语诵读成焦点
- 稚晖君又双叒叕开源!这一次机器人直接进入人类生活!
- 9 大基准全面领先,性能暴涨 10.8%!视觉价值模型 VisVM 成「图像描述」新宠
- 2025 AI“平替”危机:大批程序员真的会被取代吗?
- 程序员为何如此健忘?
- 从职高到杭电、浙大、MIT计算机博士!
- TPAMI 2024 | 用于目标检测的CenterNet++
- 大学学习什么课程才能成为稚晖君?
- 上海微软大裁员,赔偿达N+8,12年老员工感叹:拿20个月工资走人,每月3000失业补助,也是种幸福
- 《大语言模型》:人工智能时代的知识盛宴,大模型中文书籍震撼发售!
- 5个开源RAG框架对比
- 【多模态&文档智能】OCR-free感知多模态大模型技术链路及训练数据细节
- 千问LLM:什么是 Sharding? 之数据并行(Data Parallelism)
- 一本醍醐灌顶的「大语言模型提示工程」教科书,熬夜读完
- OpenAI-o3 与 Monte-Carlo 思想
- o1-Coder:代码领域的OpenAI o1模型复现
- 智谱zero推理大模型,2024压轴发布!
- 盘点2024:这一年,我们这样走过
- 效率提升300%!文心一言与辞海强强结合,推出智能知识审校系统“辞文”
- 正在报名!文心中国行走进武汉,共探大模型时代产业新机遇
- AI For Science好发论文!这是把生物医学信号处理-脑机接口如何结合机器学习深度学习讲的最全面的书!!中科院收录!
- 评价deepseek v3:又一个相信自己比英伟达懂GPU计算并做到了的团队
- 《大语言模型》:人工智能时代的知识盛宴,大模型中文书籍震撼发售!
- 2024年RAG:回顾与展望
- Qwen团队重磅上线视觉推理大模型QVQ-72B-preview,一键解答作业难题。
- 图像超分辨新SOTA!南洋理工提出InvSR,利用大模型图像先验提高SR性能, 登上Huggingface热门项目。
- 可控人物图像生成统一框架Leffa,可精确控制虚拟试穿和姿势转换!
- 262-A1.1|统一图像生成与编辑,细粒度身份定制化,用户引导图像生成;服装中心人类图像生成,虚拟试衣;字符级视觉文本生成编辑
- 262-A1.2|资源高效DiT,资源高效扩散自适应量化,蒸馏解码用于自回归加速;自校正流蒸馏,优化压缩与生成之间的权衡
- 262-A1.3|生成式扩散建模的实用手册;产品广告图像评估框架;图像阴影去除;完整性验证,AI生图检测,评估AI合成与自然图像
- 261-A1.1|人脸定制化图像生成;文本引导图像编辑;将DiT注意力计算复杂度降到线性,剪枝扩散模型的高效微调
- 261-A1.2|自回归图像生成,AI生图在视觉传播中的质量评估,安全CFG,多概念模型免疫化
- 261-A2|通过蒸馏与奖励优化实现少步视频生成,文本引导图像动画化,运动与外观定制化;文本条件的视频到同步音频合成
- 261-A3|3D形状“标记”化,3D域适应解决姿态和身份一致性问题,逆渲染与交互反射高斯溅射,视频生成模型能帮助姿态估计吗?
- 261-B|合成数据训练个性化视觉表示,三维颜色查找表的高效神经网络编码;从模糊散焦图像重建3D场景,稀疏视图表面重建
- All in LLM——小冬瓜AIGC的24年终总结!
- 华佗o1,首个 完全开源 医疗o1模型!
- 导师放养,拿下SCI论文
- 瓦力算法12月第4周急招岗位|微信 / 腾讯 / TikTok / 淘天集团 / 网易雷火 / 小米 / 中科光电 / 科大讯飞
2024-12-30
- GraphRAG前沿进展:引入本体的OG-RAG及HYBGRAG实现思路
- CVPR 2024 | CAGE: 可控关节生成
- 今日开源(2024-12-30):SEMIKONG,全球首个半导体行业大模型,8B/70B参数版本,3T双语言语料库训练
- 【源头活水】首次!大模型自动搜索人工生命,做出AI科学家的Sakana AI又放大招
- 无需训练!多提示视频生成最新SOTA!港中文&腾讯等发布DiTCtrl:基于MM-DiT架构
- 【他山之石】Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理
- 【源头活水】NeurIPS 2024|让模型预见分布漂移:动态系统颠覆性设计引领时域泛化新革命
- 图灵奖得主杨立昆:统治欲望源于生存需求,而非智能水平,AI 不会有这种想法 | AI 2025
- 强化学习之父 Rich Sutton 最新演讲:用「去中心化神经网络」应对深度学习局限性
- Tononi vs Seth:意识研究,应当遵从内在视角还是观察者视角?
- 姚期智:AI理论突破及原始创新,中国已跻身一流,但未汇聚成流
- IBM专家马丁·基恩:7大AI趋势2025
- 竞赛总结:KDD2024 OAG-Challenge
- “极限自救”中的 TikTok:太好了,是特朗普,我们有救了
- F5 预测:2025年亚太地区企业AI应用的五大趋势
- 意念操控电脑,如手掌般精准!脑机接口新技术登Nature子刊
- 迈向Z级计算:Cloud4Science范式加速科学发现进程
- 深度学习数学:理解神经网络,347页pdf
- 优秀 Python 代码最强技巧!
- 博士相亲竟相到学术大佬,师兄却嫌弃对方年龄太大,导师直言:醒醒吧,你还在延毕中
- 【机器学习】突破最强算法模型,回归算法 !!
- 【Python】初学者必备的数组相关知识点
- 重磅,支持论文“一稿多投”?
- 香港大学招收医疗人工智能方向全奖博士/RA
- 上海微软大裁员,赔偿达N+8,12年老员工感叹:拿20个月工资走人,也是种幸福
- 主宰世界的 9 个算法
- Docker 极简入门
- 即插即用,轻松涨点!把大牛的模块缝合到自己的paper里
- 雷军开出千万年薪挖角!她「逆风翻盘」,研二发表8篇顶会文章,其中2篇一作
- 在字节干大模型,是一种怎样的体验?
- 开源!又一个悄然崛起的多模态大模型开发神器!
- OpenAI 大地震一分为二,全力冲刺 AGI!一半向钱看,一半装理想
- 新能源的车企们到底在卷什么?
- AI 在谷歌,偏偏搜不对。
- 你必须要了解的 10 种微服务设计模式!
- 卷积神经网络中用1*1 卷积有什么作用或者好处呢?
- 今年这情况,读个博后被坑惨…
- 基于GAN的零缺陷样本产品表面缺陷检测
- NIPS 2024 | LookHere: 具有定向注意力的视觉Transformer实现泛化和外推
- 哈工大硕士生用Python实现了11种数据降维算法,代码已开源!
- 超全!目标跟踪中的评价指标有哪些?
- 医图顶会 MICCAI’24 | 基于高斯混合模型的多模态组内配准框架
- 硬核!实现千亿模型训推全流程的LLM开发利器!
- 我与vLLM的2024:清华大佬的vLLM开发之路
- Qwen2.5技术报告解读:18万亿token训练
- 精读DeepSeek v3技术文档的Tech&Soul Seek
- Building effective agents笔记
- 谈谈DeepSeek-v3提到的基础设施演进
- 人工智能创业笔记【4】:身体是革命的本钱
- 万字综述,全面梳理模型FP8训练和推理技术
- “智惠万企—文心赋能中小企业专项行动计划”正式发布并启动招募
- 聊聊心理咨询大模型——SoulChat2.0
- 当AI有了自己的”开放世界”:CharacterBox让AI在虚拟世界中自由扮演
- 数据分析师分为哪几种?带你一张图看懂
- 5个开源RAG框架对比
- MinT: 第一个能够生成顺序事件并控制其时间戳的文本转视频模型。
- 文生图像编辑来了!英伟达提出Add-it,无需训练,可根据文本提示向图像添加对象。
- 组件可控个性化生成方法MagicTailor:生成过程可自由地定制ID。
- InstructG2I:从多模态属性图合成图像,结合文本和图信息生成。
- 斯坦福高材生出品!数学可视化神器,用动画理解复杂的公式!
- 260-A2.1|3D轨迹控制图生视频,文生视频(偏好对齐LLM与提示优化,在线视频中心偏好优化);综合电影信息生成情感长篇小说
- 260-A2.2|文生以人为中心的视频,人类图像与视频生成;循环视频“变换器”;视频到音频与音频到视频生成,视频同步音效合成
- 260-A3.1|逆向程序化3D生成,PBR图生3D,关节物体数据生成;图生真实感人体,多模态服装缝纫模式生成;真实车辆NVS等
- 260-A3.2|统一渲染与逆渲染,极端光照变化重建,复杂反射高斯建模;自回归动作生成缩放法则,组合动作生成,共语手势表情说话脸
- 260-A补|通过像素操作与生成技术实现一致的图像对象编辑,结合事件相机的动态场景12档HDR成像,密集视频字幕与事件定位
- 260-B|神经表面重建,稀疏视角3DGS,面向重建的多海拔多季节数据集;从低光图像恢复NeRF;高效高斯人;单图恢复人类网格
- 腾讯开源了一个类o1模型
- Query改写不是你RAG查询优化的唯一方案~
2024-12-29
- 大模型与知识图谱结合之三元组预测及GEAR多跳问答思路
- 50个最佳机器学习公共数据集
- 2025年的23个新技术发展趋势
- AI教父”杨立昆:现有训练方式永远实现不了人类水平 AI
- 国内大模型落地「狂飙」一年,各家厂商成绩如何?
- 《新科学家》作者挑选的有史以来26篇最佳科幻短篇小说
- 浙大校长“论文署名中科大”!本人坦诚回应
- 一文读懂 PyTorch 显存管理机制
- 阿里开始抓工牌;DeepSeek 新模型误认身份被疑套壳?谷歌被爆军心不稳,仅 AI 部门士气高涨 | AI周报
- AISuite:一个新的开源 Python 库,提供了统一的跨 LLM API
- 医疗智能导诊助手来了,复旦大学、复旦附属眼耳鼻喉科医院、中山医院吴淞医院联合发布PIORS
- 多模态大模型:算法、应用与微调
- 通过动图彻底理解了傅里叶变换
- “给我滚出贵大!”郑强出任贵州大学校长,打算把树全砍掉,学生愤怒抗议,4年后事情反转
- “注意力之父”!遥遥领先Transformer 26年
- 2024年最常用的Python库和工具
- 跪在百度一面:MoE训练用TP还是EP?
- 狂赚 100 万美元还清贷款,计算机女博士退学,全职搞 OnlyFans 引热议
- 刚刚 GPT4o、Claude彻底开放了!
- 国产之光 DeepSeek 把 AI 大佬全炸出来了!671B 大模型训练只需此前算力 1/10,细节全公开
- 21岁开发者从地下室起步,5年时间,成功打造自己的私有云业务!
- 职场人际关系的4个雷区,千万别踩!
- 华为天才少年谢凌曦:关于视觉识别领域发展的个人观点!
- 混合精度训练原理总结
- 程序员的未来:工作和学习都要依赖 AI 了?
- RAG最新进展FlashRag! 复杂场景下高效开发与评测RAG框架FlashRAG-Paddle
- 雷军挖了个95后AI天才少女做大模型,开出千万年薪!
- 万字长文梳理 2024 年的 RAG
- 千问LLM:AI界的“节食”计划
- DeepSeekV3带火大模型infra,入门看这篇就够了!
- 烟火目标检测CCi-YOLOv8n算法,突破检测极限,效率与精度双飞跃 !(附论文和源码)
- 大模型的全面综述
- 入门必学!带你详解深度学习目标检测的开山之作-RCNN模型原理+代码解析!
- HYBGRAG如何优化半结构化数据的检索问答?
- 厦门大学联合网易提出StoryWeaver,可根据统一模型内给定的角色实现高质量的故事可视化
- 创作智能助手,能够根据剧本文字和对话自动检索电影并可视化!
- 统一的图像生成模型OmniGen:可以根据多模态提示直接生成各种图像,无需额外插件。
- GroundingBooth:一个用于文本到图像的定制框架,支持多主题和文本联合接地定制!
- 北大提出定制化漫画生成新框架DiffSensei,可生成具有动态多角色控制的漫画图像。
- Story-Adapter:能够生成更高质量、更具细腻交互的故事图像。
- 阿里推出升级版AI翻译工具:Marco MT 性能超越Google、DeepL和ChatGPT
- ScribbleDiff:使用涂鸦精细引导扩散,实现无需训练的文本到图像生成。
- Github热门项目周报 | 第51周
- 12月29日周日 | 每日一图
- 12月29日周日 | Python热门项目
- 12月29日周日 | Github今日热门
- 260-A1.1|名称空间身份一致生成,循环编辑一致性实现无监督指令引导编辑;内容风格解耦表示,内省风格归因;LLM图文理解生成
- 260-A1.2|平铺扩散用于图像无缝拼接,将任意物体无缝插入任意场景,通过潜在空间曝光融合实现HDR内容生成,虚拟试衣相关
- 260-A1.3|图文跨模态流匹配,后训练量化敏感性问题,利用扩散模型评估视觉相似性;并行自回归视觉生成,尺度wise自回归建模
- 260-A1.4|向量量化训练不稳定性,归一化流模型,频域空间扩散图像生成建模,优化噪声调度提高扩散模型,信息论视角评估生成模型
- 259-A1|草图到场景,文本引导肖像重光照,局部面部属性编辑,基于点的互动着色;多模态组合虚拟试衣;高效连续自回归,理解与生成
- 259-A2|视频生成|草图/线条动画视频着色,相机运动与光学参数控制,用户偏好对齐,高效自回归生成,实时肖像视频生成
- 259-A3|PBR材质生成,拖拽式场景编辑;点云重建CAD逆向工程,基于VLLM的CAD创建助手;利用程序合成数据扩展场景重建
- 259-B|MLLM空间理解,统一指令性视觉分割,图像和谐化;语言3DGS,辐射场对象间语义关系;加速GS拟合,GS头部虚拟化身
- AGI前夜的思考:3年后前端开发会消失~
- 为什么强化学习里很少有预训练模型?
2024-12-28
- 老刘说NLP技术社区共享:围绕知识图谱+大模型+文档智能三驾马车前进
- 多模态RAG中的图文Embedding模型及8个图文对数据集
- 赠书|周鸿祎作序推荐,AI帮你赢!
- 10分钟上手,5篇Python入门文章,一看就懂
- NeurIPS神仙打架:李飞飞180页PPT谈视觉智能,Bengio同OpenAI员工吵架,何恺明谈AI宿命论
- 一文清晰搞懂机器学习模型的偏差和方差
- 用SVM做时间序列预测真绝!最新思路无敌了,卷不动的进来看!
- 【源头活水】我在 NeurIPS’24 上感受到了焦虑和挫败
- 【他山之石】MIT、OpenAI等震撼力作:AI首次自主发现人工生命!人类窥见上帝造物
- 【他山之石】深度学习工作:从追求 SoTA 到揭示新现象
- 【源头活水】华人学子闪耀NeurIPS顶会,背后最大赢家竟是它
- 重大转变!OpenAI或重组为营利性公益公司,业内人士分析
- 国产大模型DeepSeek-V3一夜火爆全球,《DeepSeek-V3技术报告》,53页pdf
- 2024年计算机科学大突破
- 来了!2025 年人工智能的10大预测,7000字重磅解读
- 戏剧!他刚评上院士就被曝十余篇论文造假:已被撤回8篇!
- 专访史忠植研究员:二十多年前就开始做 Agent 研究的中国学者
- 商汤贾安亚:大模型未来趋势是让大家变成更会用 AI 的人
- 突发!刚刚,OpenAI裂变成了两块:一块营利,一块非营利
- 让AI理解费马大定理的证明,两个月过去了,进展如何?
- 可在手机终端部署,人大等提出全新人物图片保护模型RID
- 视觉语言模型易受攻击?西安交大等提出基于扩散模型的对抗样本生成新方法
- 模型越强,公司越怂?
- 一法破万法,未出版就被周鸿祎等多位大佬推荐的爆款书新鲜出炉了….
- 别犯了大忌!国自然发布:10种行为将被认定是科研不端行为
- 突发!OpenAI官宣成为盈利性公司
- OpenAI裂变成了两块:一块营利,一块非营利
- 阿里员工:得知绩效3.25,晚上到家看到刚会走路的儿子,做饭的老母亲,彻底绷不住了!
- 「Github一周热点55期」架构师必备指南、自动化测试工具包、无限画布白板、AI 测试框架和广告拦截器
- 基础卡尔曼滤波
- 红外图像处理算法介绍
- 纯干货|计算机视觉五大核心任务
- NIPS 2024 | 在恶劣天气下使用融合块和时空师生学习进行端到端语义分割
- 一文带你全面了解 RAG 核心组件
- 258-A1.1|视觉概念分离生成,理解与生成的迭代交互优化,大尺寸图像生成;不同DiT在文生图中的扩展性,语言互动文生图智能体
- 258-A1.2|提升文生图空间理解,图案设计程序化编辑,提示增强文本引导编辑,无监督基于区域的编辑,物体去除
- 258-A1.3|评估AI生成面部图像的质量,AI生成图像的传输与压缩,隐形水印的攻击与鲁棒性
- 258-A2|大动作灵活控制动态视频插值,多实例视频编辑,电影语言视频生成;人类运动视频合成;通用开源视频“标记”器
- 258-A3|单视图到通用3DGS重建,3D场景编辑;基于可控视频扩散的动态街景视图合成;利用2D人类运动数据增强3D动作生成
- 258-B1|多模态思维链评估基准,文本引导长视频理解,以人类为中心视频的高光帧检测定位,合成视频检测器;密集音频-视觉事件定位
- 258-B2.1|体积视频流传输综述,纹理增强2DGS表现力,3D高斯无迹变换,NeRF视觉伪影问题
- 258-B2.2|从单目视频中重建人脸外观属性,从稀疏视角视频中实时合成逼真人类渲染,从动态相机捕获的单目视频中恢复4D手部运动
- 北大数学家独作论文登数学顶刊!袁新意统一了算术与几何Bogomolov猜想
- CPO薪资倒挂CEO,创业公司薪酬情况大起底
- 超越ControlNet++!腾讯优图提出动态条件选择新架构
- 全面拥抱Agent,63%中型企业已上车~
- YOLO家族又添一员:YOLOv11
2024-12-27
- Prompt自动优化框架PromptWizard及AI搜索框架Level-Navi Agent实现思路
- 注意力机制又见神操作!结合多尺度特征提取涨点起飞!看似简单,实则也不难
- 强化学习不愧“顶会收割机”!2大创新思路带你上大分,毕业不用愁!
- 今日开源(2024-12-27):DeepSeek-V3,671B参数的MoE模型,数学代码任务突出,中文性能碾压GPT-4o
- 英伟达千万投资后,27 岁 CEO 豪言:前端工程师三年内消失,700 天后数学家失业
- 迈向 Z 级计算:Cloud4Science 范式加速科学发现进程
- DeepMind最新研究:逆向思维训练LLM可大幅提升AI推理能力
- 《科学》杂志 2024 年度突破
- 2024年“最失败的八大技术”,波音Starliner、垂直农场等上榜
- 加拿大工程院院士张丹:“具身智能”或将成为明年科技界的“重头戏”
- RAG + Milvus 如何让鲁迅又成为B站顶流?
- 把训练成本打下来99%!吊打GPT又“征服”OpenAI创始成员,DeepSeek“国产之光”实至名归?
- 英伟达CUDA的护城河到底有多深?
- 国产大模型DeepSeek-V3一夜火爆全球,671B的MoE,训练成本仅558万美元
- 2024即将结束,中国AI应用支棱起来了吗?这家公司交出95分答卷
- AGI前夜的思考:2025年将出现真正的AI智能体,年轻人需要快速适应
- 轨迹跟踪误差直降50%,清华汪玉团队强化学习策略秘籍搞定无人机
- 把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源
- 沉淀·静水流深——机器之心2024年度AI榜单揭晓
- 像拼乐高一样设计新药,EPFL、牛津团队AI方法精确设计优化分子3D结构
- 直逼记录极限,机器学习助力开发全新钙钛矿电池原料
- 使用 PyScript 将 Jupyter Notebook 转换为交互式仪表盘
- “给我滚出贵大!”郑强出任贵州大学校长,打算把树全砍掉,学生愤怒抗议,4年后事情反转
- 【机器学习】吹爆回归算法,吊打16个核心点 !!
- GPT论文一作Alec Radford离职!
- 丘成桐:我的几何人生
- Nature发布,AI 全球100强!我国19所大学上榜
- 中国MoE大模型一夜爆火全网!!
- 多模态大模型开发门槛降低了!这个开源套件是如何做到的?
- 英伟达年终核弹!全新 B300 为 o1 推理大模型打造,RTX5090 也曝光了
- 分类问题的label为啥必须是 one hot 形式?
- 哈佛大学教授:拒绝「调参侠」从学好数学开始!
- 基于深度学习的车牌检测识别(Pytorch)(ResNet +Transformer)
- 机器学习回归模型的最全总结!
- 75k,确实可以封神了!
- DeepSeek-V3发布:编程能力超过 Claude Sonnet 3.5!
- 2024年大模型总结与展望(技术上篇)
- 让Agent”少说废话”!打造高效的LLM多智能体系统
- Scaling Test-Time Compute:向量模型上的思维链
- 大模型存储效率太低,占用空间太大?推荐一个开源神器!
- 大模型的基本功
- 深度学习工作:从追求 SoTA 到揭示新现象
- 【LLM模型微调】LLMs-PEFT[微调]-QLoRA总结笔记v6.0
- 3小时从零训练26M的小参数GPT?仅需2G显卡即可推理!既是开源项目又是LLM入门教程!
- Deepseek v3 实测来了!智商牛逼,情商不存在,自信退出价格战
- 百度AICA第八期正式收官 79名首席“AI架构师”毕业执桨起航
- 2025AI十大趋势发布会丨年终岁尾,次第花开
- 提升代码能力+代码复现+改代码全解决!PyTorch深度学习代码全流程教程!大神编写1年终于完结开源了!!
- OpenAI-o3 与 Monte-Carlo 思想
- NICE41期 | 大模型评估的新视角:理论指标创新与下游任务应用分享
- Join语句该如何优化?
- GLM-4V-Flash助力多模态RAG实现,智谱免费模型全家桶强势上线
- 单幅图像合成 360° 3D场景的新方法:PanoDreamer,可同时生成全景图像和相应的深度信息。
- 超越DragDiffusion!哈工程联合南大提出FastDrag:可以几秒内完成基于拖动的图像编辑。
- 提出街景定位大模型AddressCLIP:一张图实现街道级精度定位!
- 面试官问:大模型领域,有哪些提高大规模模型的训练和推理效率库?
- 【智谷要闻】上海嘉定生成式人工智能产业发展中心成员单位招募
- 【风向趋势】豆包中文对话最强,OpenAI o1推理和数学占优
- 【行业动态】谷歌发布 Veo 2、lmagen 3 和新工具 Whisk,MidJourney 推出个性化档案和情绪版新功能
- 【AIGC律师】AIGC智谷以企业服务为核心开启全新篇章!
- 257-A2.1|主体驱动视频定制化,文本引导视频编辑,DiT视频生成加速,移动设备视频生成,视频面部交换
- 257-A2.2|视频生成模拟物体交互式动态,视频帧插值系列(帧条件驱动生成,双向运动场引导),多模态视频程序规划,视频标记化
- 257-A2.3|单目视频转立体,全景视频生成;单图像重光照视为视频生成,3D人体视频合成;文本与视频到整体音频,视觉文本到语音
- 257-A3.1|单图前馈生成GS场景,指令引导场景编辑;任意数量参考图重建4D肖像,文生发丝分离3D头像,单图重建游戏角色面部
- 257-A3.2|文生3D多维度质量评估;关节结构3D网格自回归生成,从CAD图纸到3D参数化模型;法线与材质属性估计与内在分解
- 257-A3.3|可变形径向核溅射;图生3D室内设计,多物体室内场景NVS;轻量级快速文生动作,统一人类动作的言语和非言语表达
- 257-B1|多模态|几何问题求解,专业精准图像描述生成,长视频理解及其QA基准;超高清动态多曝光图像融合
- 257-B2|基于GS的投影相机系统,基于前馈GS的4K全景合成,用视频超分提升3D超分;NeRF体积视频压缩,视频到高斯人建模
- 突发!ChatGPT、Sora、API发生重大错误,宕机数小时
- 今日开幕 | 2024第五届ISIG产业智能大会来啦!四大科技峰会议程速览——
- 上海 Shanghai|Code Without Barriers:AI&DATA 深入探索人工智能与数据如何变革行业
- 极客说|微软新模型:Phi-4 来了
- 官宣!OpenAI将成为盈利性公司,全力冲击AGI
- 英伟达发布通用机器人模型RVT-2,训练效率提升6倍
- 2年间AI大模型成本骤降万倍,商业化应用加速跑|智谱张帆@MEET2025
- 宿舍/房间网不好?一加新机能穿3墙、离200米接收wifi信号,玩《原神》平均帧率超120
- 国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开
- 3D版抖音有望诞生,零门槛3D创作时代来临|VAST宋亚宸@MEET 2025
- 协议曝光!原来微软OpenAI这样定义AGI
- 北大开源首个针对视频编辑的新指标,与人类感知高度对齐|AAAI25
- 把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍
- OpenAI科学家:现有模型+后训练足以产生黎曼猜想的新证明
- 马斯克x.ai的Grok 是首个推出基于token的图像生成器吗?
- Deepseek v3开源,本地仅700G可轻松运行!
- CogAgent开源,GUI Agent让你轻松摸鱼!
- 探索 Auto-RAG:提升人工智能知识获取与生成能力的新路径
2024-12-26
- H2O,一个开源的分布式机器学习Python库!
- 今日开源(2024-12-26):字节跳动发布Valley多模态大模型,7B参数,文本、图像和视频多任务,引领电商短视频新突破
- 大模型版生命游戏来了!「AI科学家」背后公司联手MIT&OpenAI等打造
- 陶哲轩:顶级数学家是如何炼成的?学习数学的痛点与突破全解读
- 爱思唯尔:洞察2024:科研人员对人工智能的态度报告
- 2025年,半导体行业三大技术热点
- 竞赛总结:Meta KDD Cup 2024(文末送书)
- “为Perplexity付费已没有意义!”谷歌搜索反击,发布最有“谷歌风格”的AI应用!
- AI 驱动的智能化单元测试生成:字节跳动的实践与创新
- Karpathy力荐博客:写代码的时候,请心疼一下读代码的同事
- 独享MRDIMM有多强?至强6性能核处理器的内存二三事
- 围猎Suno!国产AI音乐三巨头:华语创作称雄,MV一键生成全球首创
- 超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,编程能力暴增近31%
- 中国信通院联合淘天集团发布全球首个中文安全领域事实性基准评测集,仅三个大模型达及格线
- 引入长思维链!微信基于阿里千问大模型搞出个翻译版o1
- 4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级
- AI点亮工厂之路:1月9日开年论坛,解锁智能制造密码!
- 速度提升44%,节能153倍,清华使用内存计算硬件高效标记数据
- ScienceAI 2024「AI+材料&化学」专题年度回顾
- 【分享】阿里P8大佬:2025年数据分析师还有前途吗?
- Nature发布,AI 全球100强!我国19所大学上榜
- 14人当选中国计算机学会会士!
- 统计学的真实含义
- 突破 CNN,时间序列预测 !!
- MIT、OpenAI 等震撼力作:AI 首次自主发现人工生命!人类窥见上帝造物
- 数学家现身说法:OpenAI「王炸模型」o3 ,到底会不会做数学题?
- 在使用 React 五年后,真正明白 useMemo 的意义
- 博士的年薪一般是多少万?
- 吃透空洞卷积(Dilated Convolutions)
- 斯坦福大学——人工智能本科4年课程清单
- Qwen2.5 论文精读
- 技术人该积累什么,才能避免被AI淘汰?
- 右脑科技招聘AIGC算法实习生
- TensorRT模型部署与CUDA优化:关键核心与实践的策略思考
- 一文了解”算力过剩”的背后逻辑
- 多语言大模型:系统综述
- 百度与南京市鼓楼区共建江苏首个飞桨人工智能产业赋能中心
- 文心中国行再聚鹭岛!厦门飞桨赋能中心启航
- 聊聊大数据领域中常见的存储格式、文件格式(推荐品读)
- 【aidoczh.com】AI工具中文文档库半年76个中文文档啦
- 让Agent”少说废话”!打造高效的LLM多智能体系统
- 最新RAG综述:15种经典RAG框架综述(上)
- 最新RAG综述:15种经典RAG框架综述(下)
- DeepSeek-V3发布:编程能力超过 Claude Sonnet 3.5!
- 马斯克X-AI发布文生图模型Aurora,已集成到聊天机器人Grok中, 将面向所有用户开放。
- 马斯克开源自家大模型Grok-1:具有314B参数,由 xAI从头开始训练!
- Poetry2Image:专为中文古诗词图像生成,忠于原诗意境和语义。
- 「视觉AI任意门」AnyDoor,只需点两下鼠标就可以实现任意场景物体交换
- 英伟达的圣诞礼物:GB300 和 B300
- 讲一下PostNorm 和 PreNorm?这两个有什么优缺点?
- 恺明最新Talk:从机器学习的视角看机器学习研究
- 你要跳舞么?复旦&微软提出StableAnimator:可实现高质量和高保真的ID一致性人类视频生成
- AI拥抱火了!一分钟教会你用Vidu免费生成,还能实现AI亲吻、AI试衣!
- 致读者|PaperDaily近期更新情况说明+年终感谢
- 257-A1.1.1|图像生成与编辑|灵活的视觉控制,指令引导编辑,双调度反演;提升图像生成(自我反思机制,整合ChatGPT)
- 257-A1.1.2|视觉生成与编辑|重构图像视频3D生成任务,多模态跨维度视觉编辑,可控图像阴影生成,评估生成式图像模型的库
- 257-A1.2.1|艺术专题|一个LoRA胜过千张图片,设计图纸外观迁移,图像序列着色;评估生成模型专业设计能力,图像美学评估
- 257-A1.2.2|艺术专题|DiT可缩放文生SVG,提升LLM理解与生成SVG,基于组件的SVG自回归,中日韩等表意字体设计
- 257-A1.3|人体与面部专题|从人物图像恢复标准服装,虚拟试穿,面部化妆迁移,亲属面孔生成
- 257-A1.4|安全专题|身份保留生成的隐私保护,基于个性化扩散模型的模仿保护,通过直接偏好优化实现安全对齐257-A|
- 257-A1.5|生成模型|EEG解码视觉刺激;因果扩散自回归,混合精度量化,连续图像“令牌”化;优化少步扩散采样,扩散与流匹配
- Sam Altman发布2025年技术愿景,你想OpenAI怎么做?
- 日本文部科学省发布全新,生成式AI学习草案,有利于教育
- 躬身入局具身智能丨虚拟动点用空间计算补齐机器人能力拼图
- 嘉宾议程确定,AI大模型技术与应用发展峰会,12月27日上海举办~
- 英伟达年终核弹!全新B300为o1推理大模型打造,RTX5090也曝光了
- 钛动科技陈德品:Scaling Law在营销应用中也适用,AIGC内容正在催生爆款 | MEET2025
- o3挑战ARC-AGI,遇见大网格就懵圈?英国工程师:ARC-AGI不适合大模型
- 微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora
- KDD’25 | 生成式拍卖:感知排列外部性的整页优化机制
- Deepseek新模型意外曝光!编程跑分一举超越Claude 3.5 Sonnet
- 智平方郭彦东:具身智能到达GPT-2时刻,产业化成败在于“物理世界大模型”工程化能力
- 拳打claude,脚踢qwen,deepseek v3开源!
- 英伟达重磅推出「圣诞礼物」:新一代GB300
- 定制 AI 阅读助手,告别冗长文字,快速 get 重点
- 2024 年 RAG 的崛起和演变:一年回顾综述(1.25万字+46参考文献+18张图)
2024-12-25
- RAG的4种查询优化思路及用于时序预测的2个工作
- 欧式距离、曼哈顿距离、切比雪夫距离三种距离的可视化展示
- MITA-YOLO: 一种改进的间接视觉 YOLOv8方法用于目标检测!
- 阿里达摩院大模型算法岗二面面经
- 今日开源(2024-12-25):阿里云通义千问发布开源QVQ-Preview,72B参数,基于视觉进行深度思考推理,表现出色
- AI 在谷歌,偏偏搜不对。
- 谢赛宁、李飞飞「空间智能」新作:多模态大模型仍难突破空间推理
- 曝OpenAI布局实体机器人领域 行业是否面临重新洗牌?
- 对话首席AI科学家、图灵奖得主LeCun:大语言模型已触顶,Meta的下一代AI模型可能是新方向
- 神经网络的物理根源:从自旋玻璃到能量景观|2024年诺贝尔奖
- XGBoost 比深度学习还强?
- Frozen-DETR: 使用冻结的基础大模型来增强DETR的能力
- 数据脱敏方法:GReaT大模型合成数据
- 停摆4年后,OpenAI 偷偷启动招聘,重新开发人形机器人!前团队核心成员仍在:解散是当时最好的选择
- AICon 北京站 2024 优秀出品人与明星讲师名单揭晓,AI + Data 、Agent、多模态专场最受欢迎
- 首次!大模型自动搜索人工生命,做出AI科学家的Sakana AI又放大招
- 模拟生命体,智源线虫登上Nature子刊封面,探索AGI的第三条路径
- 终于等来能塞进手机的文生图模型!十分之一体量,SnapGen实现百分百的效果
- 哪家AI能成卧底之王?淘天技术团队发布多智能体博弈游戏平台WiS
- 高精度识别多材料系统,谷歌DeepMind深度学习方法预测晶体材料,登Nature子刊
- ScienceAI 2024 「AI+气象科学&宇宙&物理学」专题年度回顾
- 封神!哈工大博士的PyTorch笔记火了!!免费公开!
- 浙大校长“论文署名中科大”!本人坦诚回应
- 【深度学习】神经网络为何非激活函数不可?
- 科学没有衰落,谷歌 AI 推动科学发展的 9 种方式
- 雷军大学时候的论文,不需要参考文献
- 再见!支持向量机
- 道不尽的卡尔曼!通俗易懂详细解释卡尔曼滤波
- 武汉大学宣布:成立人工智能学院!
- Qwen2.5 技术报告解读
- C++ 没想象中那么糟!
- 羊毛月的傲慢与偏见:00 后不是要整顿职场吗?怎么职场都进不去呢?
- 【机器学习】特征选择(Feature Selection)方法汇总
- 深度学习工作:从追求 SoTA 到揭示新现象
- 基于OpenCV和Matplotlib的物体移动可视化
- LLM 又一年!!!
- LLAMA3 论文精读
- 70k!确实可以封神了
- 大模型助力教师提效创新:百名教师齐聚百度飞桨(厦门)人工智能产业赋能中心!
- 聊聊Apache Arrow及数据传输的高效处理
- 肖仰华丨迈向“智能的寒武纪”
- QVQ-72B-Preview:用智慧看世界
- Huggingface Trending!可控人物图像生成统一框架Leffa,可精确控制虚拟试穿和姿势转换!
- 快手可图上线一键换衣Kolors Virtual Try-On,直冲开源项目Top 1!
- 文生图像编辑来了!英伟达提出Add-it,无需训练,可根据文本提示向图像添加对象。
- Haper SD Lora: 8步就可以用 Flux-dev生成图片!
- 图像超分辨新SOTA!南洋理工提出InvSR,利用大模型图像先验提高SR性能, 登上Huggingface热门项目。
- 腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!
- 腾讯 | 中科大提出Make-It-Animatable:一秒内可将任何3D人形模型变成动画角色
- OminiControl:一个新的FLUX通用控制模型,单个模型实现图像主题控制和深度控制。
- 突发!OpenAI正研发实体机器人,终结者时代还是来了
- 微软、IDC联合发布:企业级生成式AI,5大应用趋势
- Cake获1300万美元,主打生成式AI安全平台
- 卓特视觉联合创始人&VP宋博,将出席“ISIG-AI大模型技术与应用发展峰会”
- 亚马逊云科技将出席“ISIG-AIGC多模态技术与应用峰会”
- OpenAI被曝自研人形机器人,4年前因缺数据解散团队,如今要用机器人数据反哺大模型了
- 华人学子闪耀NeurIPS顶会,背后最大赢家竟是它
- 大模型版生命游戏来了!「AI科学家」背后公司联手MIT&OpenAI等打造
- 商汤科技董事长徐立:整个AI行业都有两条生死线|MEET 2025
- 你的下一个浏览器,可以是豆包电脑版!
- 声网刘斌:“Her”真正落地实现离不开RTE能力的支撑|MEET 2025
- 阿里开源首个视觉推理模型,击败GPT-4o,网页一度404
- 无需训练、即插即用,新算法大幅增强视频生成质量|NUS&上海AI Lab&UT Austin
- 首家量产50万!中高阶智驾轻舟“越级”,获征程6M首家定点
- 【OpenAI o3安全对齐方案】坏消息:RLHF里的HF无了!!
- 一句话生成应用,开源版bolt.new横空出世!
- 阿里QVQ-72B开源,o1视觉圈的王!
- 如何消除大型语言模型(LLM)中的幻觉现象
2024-12-24
- 大模型用于推荐(LLMERS)范式总结及缓存增强生成(CAG)实现思路
- PINN结合GNN刚发的一区TOP!创新力拉满,快进来学习!
- 今日开源(2024-12-24):ModernBERT来袭,参数为139M、395M两个模型,适用检索、分类、实体抽取等任务
- 【他山之石】复旦&微软提出StableAnimator: 首个端到端的高质量ID一致性人类视频生成新框架!
- AI PC 革命已然「夭折」?分析师曝:智能手机和 PC 的“超级周期”难以到来!
- “警告:依赖 AI 代码生成,你的编程之路或将越走越窄!”
- 科学没有衰落,谷歌 AI 推动科学发展的 9 种方式
- Claude CEO的最新万字长文,比山姆奥特曼更理性实际!
- 明年AI行业将有哪些重要变化?硅谷顶级风投基金的22个最新预判
- 最新 | 福布斯发布2025年AI十大趋势!
- Kaggle赛题总结:CMI儿童网络成瘾预测
- 拜登连中国生产的旧芯片都要禁了!美商务部长突然“变脸”:这禁令纯是”白忙活”
- 2025 年技术指引:让真实案例和经验为开发者开路 | QCon
- 智源一次性发布超 100 个大模型评测结果,文本到视频等多模态领域全覆盖
- Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理
- 2025秋季入学,港科广数据科学与分析全奖博士招生来了
- o3智商高达157?每13333人中才有一个这么高,网友:编码分数无意义
- 字节整新活!照片+音频让蒙娜丽莎秒变播客主理人
- 突破数据瓶颈!交大研发电脑智能体,让 AI 替你熬夜做 PPT
- 超三万种材料,近百万真实材料合成表征信息,LLM精准构建材料知识图谱MKG,登NeurIPS 2024
- 空间蛋白质组学:构建复杂组织的尺度图谱
- AI 转型,成功了!
- 不想让导师看到我的朋友圈,把他屏蔽了,这么做好吗?
- 人工智能专题研究报告:Openai 12天发布会梳理|附35页PDF文件下载
- 保姆级seaborn教程
- 三步拿下!大模型 RAG 王者上新!
- 李飞飞谢赛宁:多模态 LLM「空间大脑」觉醒,惊现世界模型雏形!
- AI PC 革命已然「夭折」?分析师曝:智能手机和 PC 的“超级周期”难以到来!
- 职场正在筛掉“老实人”
- 类O1复现项目数据和模型开源啦
- 推理模型专题 | 开源类O1:Marco-o1技术全面解读
- 多模态大模型GLM-4V-Flash,免费了!
- 微软开源视觉语言模型!能够执行超过10种不同的视觉任务,检测、分割、识别一切图片
- 基于腾讯混元大模型,业务落地实践汇总!
- Claude 官方发布《Agent 构建指南》(附 PDF 下载)
- 10种主流LLM推理框架的技术介绍与对比:从本地部署到企业级服务
- 飞桨扬帆智海,大湾区杯AI For Science科技竞赛圆满完赛
- 学习机器学习深度学习,这10大神经网络你总得了解吧!
- LLM实践–支线:分布式训练框架的编程基础
- NICE40期 | 自动生成模型卡与数据卡:迈向负责任的人工智能
- LLM,一艘方向不对但积重难返的华丽游轮…
- 我与vLLM的2024,很Passion!
- 机器人具身智能招聘
- MI300X vs H100 & H200 基准测试对比
- o3模型智商157,比肩爱因斯坦!AI只用7个月,超过人类100年
- ChatGPT搜索带火Perplexity,获5亿美元、估值90亿美元
- 多模态解锁无限可能!AIGC多模态技术与应用峰会火热报名中~
- 官宣!xAI获60亿美元,超过OpenAI成全球融资最多
- GitHub Copilot Fridays|GitHub Copilot 全新课程上线,助力开发者解锁 AI 编程超能力
- MiniMax B端商业化负责人武僧,将出席“ISIG-AI大模型技术与应用发展峰会”
- 普通人如何应对未来 AI 挑战?两场精彩的《AI大咖说》直播为你揭晓答案!
- 刚刚,马斯克xAI再融60亿美元,老黄AMD都投了
- 英特尔新款游戏显卡卖爆!24G大显存版也在路上,这下AI玩家也要抢?
- 国产机器狗成精了!野外跑酷强到可怕,驮成年小伙遛弯儿,售价109万
- LeCun最新访谈:距离AGI可能不到10年,下一代AI需要情感和视觉训练
- 时隔6年BERT升级!仅编码器架构没被杀死,更快更准确更长上下文
- 业界首次!一个端到端原生机器人大模型搞定100+灵巧手复杂操作,星动纪元ERA-42来了!
- 刚刚,人类最快探测器与太阳上演最近距离接触
- openai又双叒叕开源了!
- 一招将模型推理能力暴拉12%,开源版o3 指日可待?!
- 微软开源PromptWizard,摔碎了提示工程师的饭碗~
- 2024,AI大模型的那些高光时刻~
- 构建多代理检索增强生成(Multi-Agent Retrieval-Augmented Generation)系统
2024-12-23
- 打破记录!“真心建议” 大家读一下这篇《Nature》重磅文章
- 再看情报分析中的事件名称生成策略:基于最长公共子串思想原理
- 今日开源(2024-12-23):Bamba语言大模型,9B参数,基于Mamba-2架构,2万亿Token训练引领性能跃升
- 【源头活水】李飞飞曾入选的AI2050最新名单出炉!清华校友等25位Fellow上榜
- 【他山之石】全面超越CoT!Meta田渊栋团队新作:连续思维链
- “AI教父”杨立昆:批评马斯克是因为他先攻击了科学家;现有训练方式永远实现不了人类水平 AI
- 最新!Yann LeCun:AI将成为超级智能,堪比新的文艺复兴,人类新的启蒙
- o1 pro “碾压式”洞察:世界顶尖免疫学专家被机器深度分析“惊醒”
- 机器心理学:通向通用人工智能的桥梁?
- Kaggle 奥数AIMO赛题:QwQ baseline
- GPT-5 研发一年半进度堪忧!每轮 5 亿美金训练成本打水漂,还得雇人从头“造数据”
- 百川智能发布金融大模型 Baichuan4-Finance,整体准确率领先GPT-4o近20%
- 3000+面试题,17小时专家课:程序员的求职加速包 | 极客时间
- 豆包说要「普惠」,于是大模型处理图片按「厘」计价了
- 李飞飞、谢赛宁等探索MLLM「视觉空间智能」,网友:2025有盼头了
- 2024亚马逊研究奖获奖名单:张崇杰、魏华等人入选
- AAAI 2025|时间序列演进也是种扩散过程?基于移动自回归的时序扩散预测模型
- 图学习新突破:一个统一框架连接空域和频域
- 参加完NeurIPS,纽约大学教授感受到了AI博士生的焦虑与挫败
- ScienceAl 2024「AI+蛋白&核酸&分子互作」专题年度回顾
- 麦吉尔大学Ding Lab基于深度学习开发单细胞水平转座子位点表达定量模型,登Nature子刊
- VS Code 14 个神级扩展,提高生产力!
- 【机器学习】机器学习各算法的优缺点!!
- 严处!一博士论文抄袭,被撤销学位
- PyGWalker:最好用的数据分析Python库
- 双一流大学,成立重磅新学院!
- 密歇根大学计算机视觉实验室高俊老师招收3D生成方向博士生
- 万字长文梳理 2024 年的 RAG
- 杀疯了!复旦大学《自然语言处理导论》彻底爆了!
- 吴恩达正式官宣,yyds !!
- 为什么需要重新考虑将 Zustand 与 Next.js 结合使用的问题?
- 横扫2024各大顶会,用Mamba发Paper真的很轻松!
- 68个Python内置函数,建议你吃透!
- 使用 OpenCV 快速检测、跟踪移动物体
- 邓小刚院士:战斗机机动飞行仿真新突破:结合机器学习的数值虚拟飞行方法 | 顶刊阅读 PoF
- EMNLP顶会最佳论文解读!
- RevThink: “逆向思维”助力每一个LLM梦想
- 一局定乾坤!主流O1模型,究竟谁才是地表最强王者?实测对比揭开三足鼎立局面!
- 从近100场大模型比赛看大模型关注热点
- 一文了解“算力”方面,各类知识点!
- LLM解决时间序列问题——语言模型+时序模型的对齐与融合建模
- 大模型区域落地再加速!“文心中国行”走进广州
- o1复现的一点点心得
- 深度学习工作:从追求 SoTA 到揭示新现象
- 操作系统是如何实现的:宏内核 VS 微内核
- 如何衡量和分配广告渠道?
- 如何构建一个可信的联邦RAG系统
- 单图可生成虚拟世界?约翰霍普金斯大学提出GenEx,一张图片即可创建可探索360° 3D世界!
- 腾讯震撼发布!MOFA-Video:表情随心换,运动由你控,视频创作由你做主!
- 超越IP-Adapter!字节提出MoMA,一种即插即用、无需调优的快速个性化生成方法!
- 何恺明团队在文生图领域的最新突破性工作Fluid,刷新文生图质量纪录。
- 一图看尽AI文生图未来,北大发布文生图十年综述:超440项工作回顾。
- 2.6K+ Star!NarratoAI:一站式AI影视解说+自动化剪辑工具
- 12月23日周一 | 每日一图
- 12月23日周一 | Python热门项目
- 12月23日周一 | Github今日热门
- 极限压缩380倍!比OpenAI的Whisper更高效,开源模型超2000颗星
- 所有用户无限用Sora,OpenAI放圣诞福利!
- GitHub 全球开发者突破1.5亿!适用于 VS Code 的 GitHub Copilot 全新免费版本正式推出
- 百川新模型超GPT-4o近20%,首创自约束训练方案突破瓶颈,主打「领域增强」
- 2024年,百万上下文依然没有杀死RAG
- 扒一扒o3-mini背后团队:3位华人核心成员,北大清华南开校友在列
- o3并非独门秘技,谷歌已发背后关键机制,方法更简单、成本更低
- 苹果要做智能门铃了???
- 昆仑万维方汉:大模型的技术红利在消退,商业模式创新者将成赢家 | MEET 2025
- 小冰李笛:真正的AI信仰者不该FOMO | MEET 2025
- 12天直播结束,炒作GPT5开始!
- RAG:涅槃重生
- LlamaIndex工作流详解:提升数据处理效率的关键
- 使用Colpali架构掌握多模态RAG技术
2024-12-22
- 两个值得一读的技术总结:OpenAI o1模型复现复现思想及多模态大模型用于数学推理
- 用Python优雅地编写LaTeX
- 物理神经网络“双杀”Science和Nature!最新思路爆火,要拿分趁现在!
- 清华重磅开源RDT-1B:全球最大的双臂机器人扩散模型!
- 深度报告:展望 2025,AI 行业有哪些创新机会?
- OpenAI突发超级AI?和两家竞争对手的动态一起看看吧!
- 2024年,世界数学的5大颠覆性突破,包括黎曼猜想和朗兰兹猜想
- 2024年,物理学领域6项重大进展,不断刷新我们对世界的认知
- 困在“第一学历”里的博士
- DeepSeek核心人物千万年薪加入小米;余承东自曝智界、问界有车型亏钱卖;黄仁勋发布249美元生成式AI超级电脑 | AI周报
- 数据即将耗尽?大型 AI 公司中没有人会感到恐慌
- 全球视野下的 AI Infra:AI 出海挑战、GPU 集群解决方案与选型
- Ilya 小题大作?「预训练终结」≠ Scaling Law 撞墙?
- 两位数学家发现素数计数新方法,原来「p²+nq²」形式的素数真有无限多个
- 是时候停止炒作「o3是AGI」了!背后15人安全对齐团队大盘点
- 无需Tokenizer,多模态对齐融合还会是难题吗?
- 自缘身在最高层?OpenAI o1 pro竞赛级评测结果新鲜出炉
- AAAI 2025 | 开放世界的深伪检测,北交大团队:解决好无配对数据挑战很重要
- 跨物种纳米抗体虚拟筛选,清华集成深度学习和蛋白质语言模型,登Nature子刊
- 40岁副教授跳槽去公司, 试用期没过被辞退, 回不去原单位, 哭得稀里哗啦……
- 重磅!OpenAI推出o3模型系列:彻底颠覆AI怀疑论者,AGI评测基准达到惊人87.5%
- 【深度学习】像教女朋友一样教你用 Cuda 实现 PyTorch 算子
- 中纪委严厉批评:中国高校面临重大整改
- 从头构建GPT文本分类器(Python)
- GPT-5 宣告失败,效果不达预期?Ilya宣判预训练时代即将终结!
- 超百所大学,获批全国重点实验室!
- 多模态可解释人工智能综述:过去、现在与未来
- 做技术永无出路?
- GitHub 104k,李沐大神力荐,这本超好懂的算法教程,被读者称为“顶好的入门教材!”
- 《大模型基础》教材发布,开源!
- 颜宁:明年我只参加已经接受了邀请的学术会议,不接受国内任何个人或者单位的邀请做学术报告
- 刚刚 GPT o1 Pro 彻底开放了!
- 「Github一周热点54期」4D世界生成式物理引擎、官方版米家集成、意图为中心的区块链、PDF翻译工具和卡通图片变动画
- 重磅!MoonBit 正式开源核心编译器,运行性能优于 Rust 和 Go
- Next.js 15.1 发布:全面升级开发体验
- 年薪96w!450万就业人才缺口,真心建议大家冲一冲新兴领域!
- 知乎热议:十年以后学历会贬值成什么样子?
- Transformer的细节到底是怎么样的?连环18问!
- python抠图(去水印)开源库lama-cleaner
- 可直接插入任何MLLMS!OmniSearch:多模态检索增强生成新SOTA
- Github下载慢解决了!「100%有效」
- 在CV界,传统卷积已经彻底输给Transformer了吗?
- Qwen2.5技术报告解读
- Qwen 2.5 技术报告发布!其中有什么秘密?
- 对OpenAI o3模型的看法、思考与反思
- OmniVision-968M:全球最紧凑、最小的边缘AI多模态视觉模型!附带本地部署运行教程!
- 文生图质量刷新纪录!何恺明团队新作,Scaling laws视觉模型失效?
- o3 发布了,摔碎了码农的饭碗
- 年包98w!拿到字节 offer 了!
- 大模型推理张量并行的4种模式
- 百度&人大:长文本LLM全排序能力新方法
- 212页PPT:大模型时代的具身智能
- RWKV-7:极先进的大模型架构,长文本能力极强
- LLM训练-sft
- 重磅!Grok 宣布对所有人免费开放使用!
- 释放你的想象!支持25种复杂编辑类型!浙大等提出AnyEdit:统一高质量图像编辑框架
- 11.6k星星!Facebook开源的儿童手绘AI转动画项目,儿童艺术创作赛道可落地。
- InstantX 重磅开源 FLUX.1-dev-IP-Adapter 模型,文中附模型和comfyui工作流下载。
- 大模型SFT不就好了,为什么还要RLHF?
- Github热门项目周报 | 第50周
- 12月22日周日 | 每日一图
- 12月22日周日 | Python热门项目
- 12月22日周日 | Github今日热门
- 256-A1.1|图像编辑(指令引导,复杂非刚性);面向生成任务的ID表示;揭示视觉幻觉生成,EP-CFG;深度生成图像模型综述
- 256-A1.2|安全篇|图像水印技术系列;个性化身份防御,面部保护与深度伪造;提示详细程度如何影响AI生成图像检测
- 256-A2|文本驱动图生视频,高分辨分钟级视频生成计算复杂性,高效自回归视频生成;视频虚拟试穿系列,多语言说话头,自动音频描述
- 256-A3.1|图生3D系列(多视角几何,3D高斯生成),文生3D基准;单图重建3D场景,NeRF纹理合成;多模态风格运动生成
- 256-A3.2|多智能体自我运动3D重建,大规模场景自由相机轨迹渲染,基于物理的神经场逆渲染,实时准静态神经发丝模拟器
- 256-B1|OP-LoRA提高微调效率;大型MoE VLM;视频理解系列(机制探索,长视频,数据集);全景图像超分
- 256-B2|3DGS稀疏重建,光场探针用于神经表面重建,单目视频4D重建;单目视频重建可动画化3D高斯头;开放词汇3D语义分割
- 清华、面壁智能发布:主动式Agent 2.0
2024-12-21
- 7天时间,我们干到了35万元!
- 【他山之石】谷歌逆风翻盘暴击OpenAI,90天王者归来!44页报告押注25年三大技术前沿
- Scaling laws在视觉自回归模型上失效了?谷歌联合MIT发布Fluid:文生图质量刷新纪录!
- 重磅!OpenAI推出o3模型系列:彻底颠覆AI怀疑论者,AGI评测基准达到惊人87.5%
- 美国联邦众议院人工智能工作组报告(273页)
- 《自然》:恢复大脑年轻,需要两手抓!阻止“坏”细胞搞破坏很重要
- Llama2024年度要点总结
- OpenAI官宣o3系列王者模型:能解最难的数学题,单个任务最高花费数千美元,越贵越好用!
- 80w起!零成本快速入门大模型指南|极客时间
- 刚刚,OpenAI放出最后大惊喜o3,高计算模式每任务花费数千美元
- 统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与
- 人会逆向思维,LLM也可以?DeepMind研究表明还能提升推理能力
- 重塑跨智能体灵巧手抓取,NUS邵林团队提出全新交互式表征,斩获CoRL Workshop最佳机器人论文奖
- “80后”博士,出任中国科学院院长(深圳)
- 2024年达摩院青橙奖公布,平均年龄34岁
- 黄仁勋:我打扫过的厕所比任何CEO都多
- 大学“一级教授”和四级教授的区别有多大
- 谷歌版 o1 突发即屠榜!思考速度比所有模型快 5 倍,能解摩斯代码,数学物理秒秒钟解决
- 2025 英伟达奖学金名单公布,7 位华人入选!中科大浙大校友在列,人均 6 万美元
- 一文读懂傅立叶变换处理图像的原理
- 室外零下20多度,这所985高校竟让学生穿短袖上下课!
- 用Numpy手写各种距离度量
- ECCV 2024 | ModelMambaIR:基于Mamba模型用于图像恢复的简单基线
- OpenAI o3真正的推理scaling,开启AGI新时代,12天的one more thing
- 谈谈Kaggle竞赛中的Cross Validation
- 中国工程院院士孙凝晖给正国级、副国级讲课的万字长稿《人工智能与智能计算的发展》
- 小白绕不开的3门神课:土堆PyTorch 吴恩达DL 李沐动手学DL的完整开源学习笔记来啦!!!!!
- Qwen 2.5 技术报告发布!其中有什么秘密?
- 不是炒作GenAI!终于有 BERT 的替代品了
- RevThink: “逆向思维”助力每一个LLM梦想
- 255-A1.1|高分辨视觉生成(8K无调优,移动设备);知识图谱RAG,推理时间扩散蒸馏;统一多种视觉生成任务,图像理解与生成
- 255-A1.2|个性化定制(多概念,MLLM多参考,内容风格过拟合问题),语义编辑;图像修复,图像“标记器“,显式记忆生成建模
- 255-A2.1|一致且连贯长视频生成,统一帧管理器插件增强扩散视频生成,运动轨迹与强度控制视频生成,姿态引导可控人类图像动画化
- 255-A2.2|实例感知结构化视频描述生成,文本到视频片段定位与整合(视频时刻蒙太奇,视频剪辑任务,视频再利用的数据集与基准
- 255-A2.3|文本驱动立体视频,运动控制全向视频,从无人机视频学习相机运动控制;视频水印系列;演示视频生成,参考引导视频修复
- 255-A2.4|多模态检索增强音乐生成,视频引导音效生成;音频驱动肖像动画化,音频驱动口型同步;基于3DMM的面部一致视频生成
- 255-A3.1|高保真艺术网格自回归生成,多视角幻觉生成,XR下多模态草图到网格;逆渲染法线与材质估计,发型与服装分层人类生成
- 255-A3.2|可探索全景3D世界生成,稀疏无姿态GS前馈重建,视频先验单图到3DGS重建,利用3DGS探测视觉基础模型
- OpenAI o3 是块“好饼”~
- HyDE(Hypothetical Document Embeddings):探索假设性文档嵌入在AI检索中的应用
2024-12-20
- langchain关于Agent的年终统计及文档图片去水印思路
- 登上Nature和CVPR!小波变换+UNet上大分!
- 出场即称霸:CNN+医学图像分割!这高端局思路可得接稳了!
- 今日开源(2024-12-20):Lyra多模态大模型:3B、9B、74B参数需求全覆盖,语音、视觉、语言交互新突破,全模态认知
- 【他山之石】历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物
- AI 叛乱打响第一枪!Anthropic 最新论文作者齐聚紧急会议:模型“伪装顺从”,暗中对抗训练
- 不花钱!程序员编码神器GitHub Copilot免费可用,每月限额2000次代码补全、50条聊天信息
- 通用人工智能是一个泡沫吗?
- 警惕!AI开始破坏人类安全训练,Anthropic揭露大模型「对齐伪造」安全风险
- 突发!GPT论文一作Alec Radford离职,前两代GPT作者全部离开OpenAI
- 扎克伯格、奥特曼发动“第二次芯片战争”
- 小白学RAG:17种改进生成的落地方法
- 免费o1替代品来了!谷歌新发“王炸”推理大模型:思考速度碾压其他大模型,水平堪比理科博士
- OpenAI 推出适用于 Mac 和 Windows 的 ChatGPT 桌面应用程序
- “许多 App Store 排行榜靠前的 AI 应用,像是骗钱的”
- 刚刚,OpenAI元老级研究员Alec Radford离职,他主导了GPT-1、GPT-2的研发
- 图森未来陈默:自动驾驶无以为继,急转驶入AIGC游戏,已拿下金庸群侠传、三体IP | 智者访谈
- 智源发布FlagEval「百模」评测结果,丈量模型生态变局
- 推理最强也最快,谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview
- 出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资
- UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律
- 2025英伟达奖学金出炉,7位华人博士生入选,上交、中科大、浙大校友在列
- 耗时缩短十倍以上,大规模AI方法加速原子模拟进程,推动更泛用的策略发展
- 发现高能钠离子电池成分,机器学习简化最佳材料搜索过程
- 华东师大硕士论文被下载近10万次,研究内容为导生关系,网友:学术圈的小说
- 编程助手GitHub Copilot已向所有用户免费开放
- 中科院已正式发布2024年预警期刊名单
- 阿里大模型面试:不懂后训练,是真的不太行
- 刚刚,AI 颠覆物理模拟:一句话精准仿真,学术圈半壁江山联手耗时 24 个月研究成果
- 基于深度学习的图像边缘和轮廓提取
- 傅立叶变换、拉普拉斯变换、Z 变换的联系是什么?为什么要进行这些变换?
- 高德导航红绿灯为啥能读秒?
- TPAMI 2024 | 像素就是你所需要的一切:用于显着目标检测的对抗性时空集成主动学习
- 通义实验室招聘大模型算法专家
- 现代LLM基本技术整理
- 【LLM训练系列01】Qlora如何加载、训练、合并大模型
- 深大提出 SL-YOLO: 更强、更轻的目标检测模型 !
- AWS最强AI芯片,深度解读!
- 多智能体大语言模型:四种多Agent范式
- 大模型技术沙龙:行业深度融合与创新路径探索
- 今天Qwen2.5技术报告发布啦!
- Anthropic: 预训练阶段引入人类反馈更安全
- 【LLM训练系列04】手把手教你Qlora微调
- LLM训练-pretrain
- 北航 | 第一个多功能即插即用适配器MV-Adapter:轻松实现多视图一致图像生成。
- Google发布Gemini2.0,“Agent时代”最强大的AI模型!
- 音频驱动肖像动画新方法LetsTalk,可生成与音频一致的逼真视频。
- 你要跳舞么?复旦&微软提出StableAnimator:可实现高质量和高保真的ID一致性人类视频生成
- FLUX.1 Tools,为创作者提供了更强大的控制能力。
- 英伟达发布Edify 3D生成模型,可在两分钟内生成可用于生产的 3D 资源、UV 贴图、4K 纹理和 PBR 材质。
- Adobe提出RGB↔X:可由图片直接输出AO、法线、roughness等,再也不用PS分层了!已开源
- 【智谷学院】AIGC智谷学院致力于构建一个全面的AI学习平台
- 【AIGC应用】XR一夜变天,谷歌“重做安卓”!三星MR头显亮牌,硬刚苹果
- 【AIGC趋势】一口气融728亿!AI融资新纪录,比OpenAI还吸金,华人联合创办
- 【行业动态】谷歌发布Gemini 2.0!Midjourney推出在线构建工具:Patchwork
- 254-A1.1|对象插入与主体驱动,基于文本的图像编辑,文本驱动风格迁移;复杂文生图(结构化注释的大型图文数据集,快速提示对齐
- 254-A1.2|可控人物图像生成;统一离散与连续的多模态自回归生成;评估文本到视觉生成;整流模型崩溃现象;扩散训练数据的影响
- 254-A2.1|3D网格形状编辑,无姿态稀疏重建,基于光度立体的大型网格重建模型,纹理网格显著性数据集;指令引导场景编辑
- 254-A2.2|动物姿态形状估计数据生成,从设计概念到缝纫图案程序化合成,大型CAD图纸全景符号检测;文生动作,多模态抓取生成
- 254-B1|VLM物理推理,评估LVLM综合图像描述生成,流媒体视频内容交互;生成预训练驾驶模型
- 254-B2|单图像人类网格恢复,光解耦面部纹理建模,从部分数据重建非刚性3D运动;稀疏视角快速语言高斯,NVS质量评估
- 255-B1|长语音理解,长时间流媒体视频与音频交互,长视频理解数据及基准,视频LLM视觉Token压缩,视频时间定位;视觉编程
- 255-B2|单目视频实时稠密重建,单图重建点云;4D重建(长时间体积视频,互联网立体视频数据,3D肖像视频流)
- 6年,Bert终于要退休了!
- Anthropic:Agents 2024年度总结!
- 瓦力算法12月第3周急招岗位|高通 / 微软 / 阿里集团 / 饿了么 / VIVO / BOSS / 智元 /
- 2025年展望:人工智能对科学的意义与影响
2024-12-19
- 文档智能遇上历史古籍:古籍文档修复及识别开源数据集
- 滴滴算法工程师一面&二面
- 今日开源(2024-12-19):Granite 3.1来袭,1B至8B共4种尺寸2种架构,128k上下文,十万亿token训练
- 【他山之石】大模型助力分割,刷新10项SOTA!清华和美团提出HyperSeg:通用分割框架
- 【源头活水】北交大团队开源代码生成框架o1-Coder,并将推出强化微调RFT版本
- 倒计时1天!算法还可以这样学,来直播间免费抽《漫画算法》!
- C++ 之父 2024 年末重磅演讲 | 重新认识 C++:跨世纪的现代演进
- 苹果 AI 遭遇「滑铁卢」?73% 用户直言:Apple Intelligence 几乎没用!
- 清华团队「超级对齐」新研究:如何定义?怎样实现?
- Nature:小型无人机革命即将到来——科学家需要确保它的安全性
- 刚刚,AI颠覆物理模拟:一句话精准仿真,学术圈半壁江山联手耗时24个月研究成果
- “注意力之父”!遥遥领先Transformer 26年
- Late Chunking×Milvus:如何提高RAG准确率
- 曾经的“自动驾驶第一股”急速掉头,CEO亲述图森未来生死时速这一年
- 豆包视觉理解模型正式发布:一元处理近 300 张高清图片,低于行业价格 85%
- OpenAI“双喜临门”:ChatGPT 热线上线,员工“年终奖”最高可达1000万美元
- 芝大、清华团队分析了6800万份论文表明,AI可能会降低科学家的创造力?
- 15 个 必知的Python 内置函数
- PaddleSeg:车道线检测
- 谷歌再添猛将!DeepMind高级科学家,开挂博士给科研新人7点建议
- 一步一步在Windows上配置深度学习环境!
- 一文看懂 | 扩散模型(Diffusion Models):从噪声到图像的神奇之旅
- 被导师放养,后果可能很严重。。。
- 把它翻译成中文了,机器学习漫画小抄!
- 26 岁 OpenAI 举报人疑自杀!死前揭 ChatGPT 训练黑幕
- Tokenization 不存在了?Meta 最新研究,无需 Tokenizer 的架构来了
- Python 3.13 将会改变 AI 和 ML 的游戏规则?
- 卷起来了!Github copilot突然就免费了
- 传 Win11 硬件门槛大降,老旧 PC 也能「上车」?网友质疑:这页面 3 年前就有了……
- 90后试岗后被辞,背调发现其有讨薪记录…
- 基于傅里叶变换的特征交互与多尺度感知变化检测
- 仅仅一个树莓派就可以做的目标检测
- MICCAI’24 | CriDiff:通过生成预训练的交叉注入扩散框架实现目标分割
- 知乎大佬解析Ilya最新言论:pre-train丸啦,搞agentic和reasoning吧
- 大模型Infra王朝2024
- NAACL2025研讨会征稿 | 主题:自然语言处理中的跨文化研究
- 机器推理的突破?田渊栋团队的关于增强大模型推理能力的热门论文
- 基于AI,低空经济的无人机检测识别研究综述
- C/C++高频面试题:内存泄漏的原因、检测、解决方案
- 别再用PostgreSQL了,Milvus才是多语言RAG的最佳搭档
- 手把手教你,Cuda实现PyTorch算子流程(附代码)
- 实践指南: hzwer大佬的模型优化与迭代策略
- 如何用一个统一的视角,分析RLHF下的各种算法?
- 3B模型长思考后击败70B!HuggingFace逆向出o1背后技术细节并开源
- 如何通过腾讯、字节跳动、网易的面试?
- 【LLM训练系列03】关于大模型训练常见概念讲解
- 【RAG实战】Prompting vs. RAG vs. Finetuning: 如何选择LLM应用选择最佳方案
- 253-A1.1|细粒度视觉美学属性数据集,无需文本的视觉生成先验学习;统一生成与编辑,图像语义编辑;RL多轮个性化捕捉用户意图
- 253-A1.2|故事可视化,定制化漫画生成;扩散模型中采样可微表示,自回归与DiT之间插值;面部图像着色,姿势引导人物图像合成
- 253-A1.3|评估视觉生成模型(效率与灵活性,广告图像生成);安全性(概念擦除,水印嵌入,AI生图检测,后门攻击)
- 253-A2.1|可扩展条件视频生成,多镜头角色一致,艺术风格化;3D相机轨迹(对象运动控制,多实体运动),多相机不同视角一致性
- 253-A2.2|从缓慢双向到快速因果视频生成器,移动设备视频扩散;DiT视频运动迁移,事件驱动视频帧插值,音频驱动说话脸生成
- 253-A3|文本到高效高分辨纹理生成,可控3D关节物体生成,基于3DGS的程序化城市建筑生成,指令引导场景编辑;复杂文生动作
- 253-B1|多模态3D空间推理及其基准测试,多种PDF文档解析的基准测试;图像超分辨率系列
- 253-B2|百万级360度视频数据集,动态且光照不一致条件下生成式NVS,高斯重打光,更快更好的3DGS系列,合成先验高斯头像
- 【ICLR高分10/10/8/6】天塌了!LLM训练交叉熵吃这么多显存??
- Anthropic最新研究,Claude学会“演戏”了!
- 英伟达推出249美元的「AI版的树莓派」,可离线运行大模型!
- 预训练无了?手撕LLM+O1 强化学习后训练指南!!
- Alibaba出品:OmniParser通用文档复杂场景下OCR抽取
- 如何全面评估多模态大模型能力?MLLM评测任务与指标总结
- 提示词注入攻击(Prompt Injection Attacks ):大语言模型安全的潜在威胁