老刘说NLP
- RAG&KG&LLM&文档智能技术前沿:老刘说NLP技术社区持续对外纳新
- MCP技术总结及推理大模型强化学习机制分析
- GraphRAG如何用于Agent做memory记忆管理?Graphiti实现解读及相关技术进展回顾
- 金融领域推理大模型DianJin-R1、Fin-R1及文档转markdown、docx的多模态大模型做法
- RAG与Reasoning结合的必要性、实现范式及Agents、RAG产品、大模型安全新总结
- 王者归来!多模态大模型+具身智能彻底爆了。。。
- 源码角度解读RAKG文档级图谱构建框架RAKG及Demo级多模态RAG-NoOCR
- 文档解析主流开源工具全家桶及RAG中的文档目录解析PageIndex思路解析
- 再看大模型幻觉排行、检测工具及多模态RAG技术范式总结
- 也看图结构增强的GraphRAG方案:NodeRAG实现思路解读
- 多模态RAG框架LAYRA及Deepresearch、ReZero强化搜索优化实现思路
- YYDS,哈工大博士的pytorch笔记终终终于公开了!!
- 落地推理大模型“慢思考”的思考及DeepMath-103K推理数据集构造方案
- RAG范式的几种花式变体及技术特性:GraphRAG? 多模态RAG or Deepresearch?
- 真实场景下落地RAG的十条建议及RAG中如何提升个性化?
- ICLR 2025 LLM优化收录创新高!Dobi-SVD超高压缩与性能完美平衡!
- 再看金融领域FinanceRAG竞赛获奖思路及20250414技术进展早报
- RAG中的表格数据序列化思路及R1类推理大模型训练实证分析
- 多模态RAG文档检索竞赛前三获奖方案解读:MMDocIR/KR任务
- RAG-Challenge金融年报问答竞赛冠军方案思路:从文档解析、提示词到路由逻辑设计
- 大模型落地及Agent记忆的有趣观点:兼看SVG生成用多模态大模型怎么做?
- 多模态RAG及多模态R1推理中如何为不同的视觉数据生成描述Caption?OMNICAPTIONER实现思路
- 多模态RAG及SQLRAG方案总结、大模型应用中的追问及Agent操作UI逻辑思考
- 知识图谱+知识库RAG项目Yuxi-Know及大模型推理内部可视化工具OpenMAV实现拆解
- 老刘说NLP社区第41讲-大模型基本代码实操-部署\微调\文档解析\RAG\Agent回顾:社区持续对外纳新
- 清明假期大模型技术进展回顾:llama4大模型、EasyControl吉卜力风格开源模型及LLM后训练技术总结
- Llama4模型四点核心总结及大模型推理数据合成工具Project Loong
- RAG&KG&LLM&文档智能技术前沿:老刘说NLP技术社区持续对外纳新
- Deepresearch核心技术:如何通过强化学习增强推理大模型搜索规划及反馈能力?
- 表格RAG可以怎么做?推理大模型存在“心口不一”?
- RAG技术于视频文章生成及东方语种+汉语方言识别Dolphin实现思路解析
- Agent性能优化技术总结及DeeResearch用于Github项目搜索实现思路
- R1–Zero强化学习路线新发现及R1思路用于GUI Agent动作预测方案
- 大模型黑盒探秘:通过“电路追踪”(Circuit Tracing)揭示大模型内部推理机制?
- Agent-MCP开源动手实践指引及CausalRAG将因果关系用于RAG实现思路
- Multi-Agent多智能体为什么会失效?R1类推理模型训练及推理的2个有趣实验结论
- 视觉多模态RAG技术总结及Vision-R1用于目标检测任务的奖励函数设计
- 也看基于版式分析的PDF文档翻译项目及文档版式分析模型PP-DocLayout
- 从MetaGPT、LangGraph看Agent记忆实现机制:兼看昨日大模型等技术进展回顾
- 也谈Agent的记忆问题及Dify的知识库分段及召回逻辑细节
- 重磅!AI大模型又起飞了!!
- 再看行业R1模型如何构建及减少推理大模型过度思考
- 21个RAG常用优化策略变体及notebook开源实操
- 大模型微调数据生成工具Easy Dataset及KBLaM知识注入框架评析
- 生成AI拿下3大顶会最佳!2025投稿新风向!
- 一文图解Agent智能体:60张图、14个技术点回顾Agent的基本认知
- 近日前沿进展回顾及再看多模态R1推理如何做?两类、五个代表工作实现思路总结
- 端到端OCR方案-SmolDocling我们应该关注什么?兼看AI搜索可信度简单评测项目
- 第一批抓住DeepSeek风口的研究生已经论文自由了
- LLM从构建到应用工具全集:推理大模型Github索引梳理
- RAG中的chunk质量如何评分?HiRAG对GraphRAG的改进思路及推理大模型用于机器翻译
- RAG&KG&LLM&文档智能等前沿技术及落地跟进:老刘说NLP技术社区持续对外纳新
- GDELT情报分析遇见GraphRAG:兼看视频多模态RAG记忆增强检索实现思路
- Light-R1-32B之R1复现认识:兼看R1蒸馏模型所用800K数据细节问题
- R1-GRPO用于多模态、ChatBI、Gemma3等前沿进展:兼看KTransformers技术分享回顾
- DeepSeek新手装备库,总有一款适合你
- Agent框架标准化趋势及OpenManus-RL增强Agent规划能力训练框架
- Deepseek-v3/R1全量微调及Seg-Zero、R1-Searcher领域强化适配思路
- 再看如何控制大模型思考时间?从S1预算控制到L1长度约束强化学习
- 前沿技术之KBQA-O1及RAG用于综述写作实现思路解析
- 最近大模型技术落地观察及RAG的针对性优化思路SAGE
- R1复现基座选用Qwen or Llama?兼看Audio-Reasoner多模态语音推理思路
- PIKE-RAG及多模态R1-Visual-RFT思路思考:兼看olmOCR的一些测试感官
- RAG&KG&LLM&文档智能等前沿技术及落地跟进:老刘说NLP技术社区持续对外纳新
- 再看文档解析该如何做?pipeline派及end2end两派路线及代表工具
- 一文图解大模型量化:量化的目的、内涵及若干实现策略
- 大模型上周回顾及Deepseek开源周总结:兼看面向多任务的模型融合思路
- 可视化图解MOE大模型的7个核心问题:专家、路由、负载均衡及其用于视觉模态
- 聚焦前沿技术落地:大模型+知识图谱+RAG+文档智能下的老刘说NLP技术社区对外纳新
- Agent or SFT or RL ? 9个多模态R1推理开源项目核心思路解析
- R1-Think能力如何用于RAG及多模态场景?Rank1及R1-Onevision实现思路解析
- 从DeepResearch system card看若干实现细节:兼看近期多模态大模型进展
- 近期RAG误区再认识及Claude3.7的混合模型推理机制解析
- Claude 3.7、QwQ-Max-Preview等推理大模型发布跟踪:兼看大模型逻辑推理技术总结及几点思考
- 大模型开源及RAG用于综述写作进展:兼看mobile agent在应用场景选择上一些思考
- 再聊误区–Deepseek-R1思考过程在使用中的几个问题及对策
- 如何选择合适的LLM做擅长的事儿?P2L微调大模型进行路由选择的实现思路
- 大模型推理部署的几个基本认知及prompt压缩策略用于COT推理微调尝试
- R1强化学习策略用在多模态推理开源实现:兼看社区不可思议被侵权之遇
- RAG+的一些前沿动向:兼看长文本、投标写作以及R1可解释性的有趣探索
- 值得一读之关于ktransformers的一些正确认知和若干细节问题
- 如何测量大模型是否过度思考?兼看最近GraphRAG及多模态RAG 进展
- Deepseek R1及Deep research复现回顾及近期前沿进展速递
- 老刘的R1类推理大模型三部曲及RAG小课堂正式发布
- Think思考用来增强RAG的Embedding?兼看推理模型使用实践建议等前沿进展
- GraphRAG前沿之MedRAG医疗问答路线:兼看基于KG进行上下文扩展方案
- GraphRAG前沿之Graph RAG-Tool Fusion:将知识图谱用于Agent工具编排实现思路
- KG增强Agentic Reasoning进行深度研究的有趣思路:兼看社区R1类推理分享三部曲
- KG+LLM+RAG+文档智能技术及落地:老刘说NLP技术社区对外纳新
- R1-GRPO强化范式用在KG抽取的粗暴实现:兼看RAG、推理加速等相关进展
- 再看增强大模型推理能力的四种范式及蒸馏微调范式具体实现
- 让推理大模型如何思考很重要:回溯DeepSeek-R1中11个数据问题
- 落地角度看think推理类大模型的技术优缺点及潜在风险:老刘说NLP技术社区第37讲精彩回顾
- KG+LLM+RAG+文档智能技术及落地:老刘说NLP技术社区对外纳新
- 推理类大模型的习得过程、认知误区、场景机会及技术风险
- 可视化角度具象化理解DeepSeek-R1类推理大模型的习得进程
- 大模型SFT负责记忆、RL负责泛化:兼看多模态GraphRAG之Video方案
- 多模态GraphRAG的一点思考:兼看多模态大模型用于数据增强总结
- OpenAI深度研究”Deep Research智能体及大模型故事自动分析、配音应用尝试
- QwenVL用HTML表示文档及o3-mini与DeepSeek-R1在安全性上的对比
- RAG前沿进展:多抽象层级chunk及对齐机制的ARM实现思路
- GraphRAG技术再总结及COT结合RAG实现思路
- 春节前的多模态大模型开源礼:Janus-Pro、VideoLLaMA、Qwen2.5-VL等
- AI搜索引入深度思考会怎样?从Deepseek联网搜索案例出发
- 百川开源医疗大模型Baichuan-M1-14B及Deepseek R1热:兼看RAG用于ASR纠正
- RewardRAG引入奖励模型与强化该怎么做?两个思路和评估数据集
- 大模型能用于CAD设计图纸生成?Text2CAD实现思路解析
- 领域RAG微调的实现范式:ALoFTRAG代表方案及文档智能前期处理的感触
- GraphRAG前沿进展:引入分而治之思想的KGRAG思路
- 满血归来!一文全面揭秘Kimi 1.5最新推理模型背后的技术
- 时序大模型技术总结:从时序数据的特点、常见任务说起
- 大模型推理能力优化技术总结:兼看大模型落地6个误区
- NeurIPS’24 Oral 大模型LoRA超级变体!HydraLoRA小参数,大作为!
- 再看GraphRAG及多模态RAG进展:MiniRAG及多模态检索思路
- 值得一用的长文本训练框架360-LLaMA-Factory及多模态VideoRAG实现思路
- 手握15个大厂offer,我在大模型风口起飞
- 也看大模型具身智能技术总结:从英伟达发布Cosmos模型说起
- OpenAi-O1推理范式最新思路汇总-Search-o1、Sky-T1、rStar-Math:兼看注视检测任务
- 金融领域NER大模型性能及视觉文档理解技术总结
- 用Agent做PPT生成思路PPTAgent:兼谈信息爆炸时代如何学习
- 犄角旮旯里的大模型拙见:兼看大模型在事件演化捕捉上的能力实验
- 大模型用于情报分析时间线生成(TLS)任务:根本问题及两个代表工作
- OCR噪声对RAG性能的影响分析:兼谈公众号文章的价值正确定位
- 技术实践指引:3个适合练手的开源数据及项目平台
- 语音处理落地组件全家桶:语音大模型、数字人、语音到文本、文本转语音全集
- 老刘说NLP社区2024年终演讲:回顾得失,踏实前行
- GraphRAG范式的新角度思考及一个很有信息量的总结
- RAG落地端侧场景:EdgeRAG面向端侧RAG优化思路及特定领域多模态探索
- 2025年开篇:技术及宏观角度回顾2024年大模型发展
- 老刘说NLP及大模型的2024年终总结—不悲不喜、继续前行
- GraphRAG前沿进展:引入本体的OG-RAG及HYBGRAG实现思路
- 大模型与知识图谱结合之三元组预测及GEAR多跳问答思路
- 老刘说NLP技术社区共享:围绕知识图谱+大模型+文档智能三驾马车前进
- 多模态RAG中的图文Embedding模型及8个图文对数据集
- Prompt自动优化框架PromptWizard及AI搜索框架Level-Navi Agent实现思路
- RAG的4种查询优化思路及用于时序预测的2个工作
- 又看多模态RAG进展:解读OmniSearch-多模态检索增强生成新SOTA!
- 大模型用于推荐(LLMERS)范式总结及缓存增强生成(CAG)实现思路
- 打破记录!“真心建议” 大家读一下这篇《Nature》重磅文章
- 再看情报分析中的事件名称生成策略:基于最长公共子串思想原理
- 两个值得一读的技术总结:OpenAI o1模型复现复现思想及多模态大模型用于数学推理
- langchain关于Agent的年终统计及文档图片去水印思路
- 文档智能遇上历史古籍:古籍文档修复及识别开源数据集
- 再看多模态RAG进展:VisDoMRAG及DocVLM-OCR方案解读
- 【数字人应用基建】29个文本转语音TTS开源工具
- 【数字人应用基建】7个数字人生成及24个语音到文本ASR开源项目
- RAG常见模式、痛点及最佳实践总结4张图:兼看大模型时代的工程开发工具集合
- RAG年终总结之12篇综述:从2022到2024看架构、策略、评测及演化
- 大模型行业,岗位也分三六九等
- 【RAG 2024时间线回顾】RAG七十二式:2024年度RAG清单索引
- 卷图不卷图谱-GraphRAG最近趋势:考虑结构性、相似性、相关性等Graph思想实现策略
- 视觉语言模型新SOTA!性能碾压LoRA,无需预训练,训练显存大大减少!
- 文档处理之E2M转Markdown工具及BigDocs大规模通用文档数据集
- 【前沿进展】文档多模态嵌入表示方案DSE、数据合成及AI搜索应用新风向
- AI生成文本检测数据集及9个工具索引:兼看“磁悬浮老鹰”逻辑陷进测试
- RAG用于翻译实现思路及多模态模型用于文档理解的几个核心问题
- 【文档智能】多模态文档OCR评测CC-OCR及专有模型代表工作
- RAG&KG&LLM&文档智能等前沿技术及落地跟进:老刘说NLP技术社区持续对外纳新
- 故障分析怎么做?朴素KG方案及LLM+Graph RAG方案实现思路
- aiops-challenge比赛简单总结
- yyds!哈工大博士的PyTorch笔记火了!!
- ChatGPT两周年历程回顾及大模型Text2SQL方案索引
- 王者归来!白皮书《从头训练大模型最佳实践》开源了。。。
- 12个开源AI搜索引擎项目及关于Ai搜索的一些思考
- AUTO-RAG多轮对话迭代式检索及RAGDiffusion多模态图像生成思路
- 使用LLM进行标书写作简单开源项目及openai O1实现思路再索引
- 【LLM+KG】利用大模型做开放知识图谱构建及DOGE多模态文档定位
- 多模态RAG方案之V-RAG多文档问答及Path-RAG病理分析实现思路
- 微软GraphRAG框架演进之路及带来的一些思考
- 也看引入反思的多模态mR2AG及实体链接为核心的G-RAG实现思路
- 知识图谱与大模型结合思路再总结:时间线看三大方向的探索
- 最值得参加的LLM盛会!多模态/Agent/具身智能/安全/评估等15个论坛!
- Openai-o1后续前沿进展非全面总结:从性能评测到复现两个方向的探索概览
- FastRAG半结构化RAG实现思路及OpenAI O1-long COT蒸馏路线思考
- 大模型Agent落地浅思考之Agent编排师:兼看Video-RAG视频RAG实现思路
- 浅看OpenAI O1的六种推理模式:兼读多模态RAG增强思路CUE-M
- RAG&KG&LLM&文档智能等前沿技术及落地跟进:老刘说NLP技术社区持续对外纳新
- OpenAI-O1慢思考模式后的跟进:LLaVA-o1及OmniSearch多模态QA范式
- 大模型经典著作《大语言模型基础与前沿》
- 【RAG竞赛获奖方案】CCF第七届AIOps国际挑战赛季军方案分享EasyRAG:一个面向AIOps的简洁RAG框架
- 现有RAG框架非完全总结:7个GraphRAG+17个传统RAG框架归纳
- RAG&KG&LLM&文档智能等前沿技术及落地跟进:老刘说NLP技术社区持续对外纳新
- RAG结合知识图谱本周前沿总结:引入推理规则、用于实体链接及KGQA式GraphRAG
- KG+RAG系列范式对比及KAG框架再思考:兼看大模型增强KBQA问答竞赛方案
- 多模态RAG的4种模式简单实践及RAG切分的开源工具Chonkie
- 文档多模态RAG应该如何做?解析式orDocVQA式两类实现思路漫谈
- 最强总结!复盘kaggle大模型竞赛!附top方案
- 如何识别文档的层级结构:Detect-Order-Construct、HRDoc、DocParser三个方案
- 杀疯了|AI辅助科研论文、NLP与数据处理代码能力,太强大了…
- 如何解决文档处理中的顺序错误问题:文档阅读顺序及OCR阅读顺序代表应对方案
- RAG文档处理中的数值图表和流程图如何解析?从表示方式到代表解决方案
- 文档解析之表格结构预测获奖方案及开源数据集总结
- 值得一看的小模型技术全面总结及RAG文档处理及切分小模型工具
- RAG前沿再跟进:HtmlRAG、分块策略、GraphRAG-DRIFT及多样性生成
- GraphRAG系列范式冷思考:GraphRAG、KAG框架思考及E2E-AFG自适应过滤端到端思路
- 爆了,多模态杀疯了
- RAG中的代表性上下文压缩方案总结:从RECOMP、CompAct到COCOM
- 大模型prompt压缩技术总结:从硬提示到软提示代表方案实现思路
- 长文本RAG中上下文压缩思路FlexRAG:兼看昨日大模型产研进展
- RAG、知识图谱、大模型都有了:老刘的小课堂全集发布
- 重大更新!大模型、知识图谱、RAG、文档智能等前沿技术及落地跟进:老刘说NLP技术社区持续对外纳新
- RAG新思路之引入知识图谱规则及文档解析技术路线总结
- 十月月末RAG最新工作:AutoRAG、PlanxRAG及SubgraphRAG实现思路解读
- 大模型与知识图谱结合用于推荐及LLM驱动分块ChunkRAG实现策略解读
机器学习研习院
- 时间序列的常用的9种交叉验证方法
- 时间序列预测的万能机器学习框架
- 打造AI高质量数据集,数据标注合规是关键
- 时间序列预测模型比较分析:SARIMAX、RNN、LSTM、Prophet 及 Transformer
- DeepSeek × 时间序列 :DeepSeek-TS,基于状态空间增强MLA与GRPO的时序预测新框架
- 2024年 15 种典型 RAG 框架
- 大模型Text2SQL全栈技术最新综述
简说Python
- 带你能玩转Deepseek,制作AI全能助手
- 小白跟着学就行!搞定Python编程学习环境+开发工具配置(含视频)
- Python批量处理Excel数据,使用Python将数据写入SQL Server
- 2000字搞懂 Coze Agent 使用和变现,超詳細教程
- 火爆全网,免费使用Deepseek,不卡壳
- 2025副业赋能、AI视频、AI爆文,一起火,和老表绑定成长!!!
- 读书金句分享021|《纳瓦尔宝典》
- 读书金句分享020|《纳瓦尔宝典》
- 读书金句分享019|《纳瓦尔宝典》
- 太顶了!Jupyter Agent 让我大开眼界!
- 读书金句分享018|《纳瓦尔宝典》
- 读书金句分享017|《纳瓦尔宝典》
- 读书金句分享016|《纳瓦尔宝典》
- 读书金句分享015|《纳瓦尔宝典》
- 读书金句分享014|《纳瓦尔宝典》
- 读书金句分享013|《纳瓦尔宝典》
- 读书金句分享012|《纳瓦尔宝典》
- 读书金句分享011|《纳瓦尔宝典》
- 读书金句分享010|《纳瓦尔宝典》
- 读书金句分享009|《产品思维:从新手到资深产品人》
- 读书金句分享008|《产品思维:从新手到资深产品人》
- 赠书|周鸿祎作序推荐,AI帮你赢!
- 10分钟上手,5篇Python入门文章,一看就懂
- 读书金句分享007|《纳瓦尔宝典》
- 读书金句分享006|《纳瓦尔宝典》
- 读书金句分享005|《纳瓦尔宝典》
- 读书金句分享004|《纳瓦尔宝典》
- 金句分享 | 【罗翔】我们为什么要读书?
- 读书金句分享003|《纳瓦尔宝典》
- 好书推荐001 | 袖珍小书《机器学习漫画小抄》
- 读书金句分享002|《纳瓦尔宝典》
- 读书金句分享001|《纳瓦尔宝典》
- 万人追读,未出版就爆火,这本机器学习漫画小抄终于出版了!
- 7天时间,我们干到了35万元!
- Linux | 大文件上传/下载麻烦、容易中断,如何分割上传/下载
- 赠书|清华大学刘知远团队新作,未出版就爆火,28位AI天才们的热血传奇,比番剧更燃!
- 被字节索赔800万的实习生,夺得NeurIPS 2024最佳论文奖!
- 手把手教你,使用 Python 实现记账机器人
- wow-rag学习|打造个人RAG,零基础也能快速搭建检索生成系统
- MySQL必知必会的7大实用技巧
- 只有 1% 的聊天 GPT 用户知道这些秘密提示
- 一款好用AI阅读神器,从微信直接导入文章,使用分享
- 理发羞耻综合症,从剪发变成发型设计后
- 终于“打造”出了一个可以随时随地编程的工具
- 使用AI用Python写了一个基于向量库的项目路径管理系统,v0.1
- 想读,AI和阅读有一个碰撞
- 经济下行,数据分析师还有前途吗?字节70w年薪大神这么说
- 开源分享| Crawl4AI: 使用AI让抓取数据、整理合二为一!
- 开源利器大盘点:这三款 Python 项目让你的工作更高效!
深度学习初学者
- 被取消院士称号,前中国工程院院士李宁,已担任新职
- Jeff Dean演讲回顾LLM发展史,Transformer、蒸馏、MoE、思维链等技术都来自谷歌
- 25岁当上985博导,冯磊现任东南大学教授!
- 这次终于彻底理解了 LightGBM 原理及代码
- 93年博导教授!地大「最飒科研女神」实力出圈!
- 计算机视觉被GPT-4o终结了(狗头)
- 洗个澡把 offer 洗没了。。
- GPT-4o 图像生成的秘密,OpenAI 没说,网友已经拼出真相?
- 深入解析图神经网络注意力机制:数学原理与可视化实现
- 真正的LLM Agent
- 热议:中国何时拥有自己的《nature》《Science》?委员给出答案!
- Jay Alammar:图解DeepSeek-R1
- 何恺明联手LeCun改进Transformer!成功去掉归一化层!中稿CVPR 2025
- 为何说 “在国内做科研,最忌讳踏实”?
- 何恺明联手LeCun改进Transformer!成功去掉归一化层!中稿CVPR 2025
- 三张图速通 DeepSeek-R1 论文和技术原理
- DeepSeek大模型原创核心技术解读
- 2024年国家杰青、国家优青名单
- 清华与人大最新研究表明:AGI的到来时间需70年与10^26个参数,好像不用那么急了
- 最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)
- 从零开始绘制DeepSeek R1架构和训练流程
- 深入解析Tiktokenizer:大语言模型中核心分词技术的原理与架构
- 一句话让DeepSeek思考停不下来,北大团队:这是针对AI的DDoS攻击
- 人刚毕业,代码一点不会,他纯靠ChatGPT写APP,年入千万美金
- 显著超越现有SOTA!ChatVLA:实现统一的多模态理解与机器人控制
- 刚刚!微信 DeepSeek 入口已接通,辐射用户 14 亿!
- DeepSeek,又杀疯了!
- Qwen架构改造成Deepseek,再复现R1计划
- 年薪150W!DeepSeek确实可以封神了
- D-FINE:在DETR中将回归任务作为分布来细化
- 免费无限次!671B满血版DeepSeek R1隐藏入口,优秀平台推荐!
- PyCharm接入DeepSeek实现AI编程
- 原来,这些顶级大模型都是蒸馏的!
- 完整教程 | 完整的671B MoE DeepSeek R1怎么塞进本地化!
- 全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻
- 张俊林:MCST树搜索会是复刻OpenAI O1/O3的有效方法吗
- 马斯克招聘:发代码过来,不要扯别的!Just show us your code
- ViT模型详解与Pytorch代码实现
- 一文详尽之Embedding(向量表示)!
- 吃瓜:中科院化学所宋延林组火了
- 11 种特征选择策略总结!
- DeepSeek官方App上线!功能完整且免费
- 2024年AI大模型回顾!
- “洪荒之力”傅园慧,任职C9!
- 优化 | 如果你的PyTorch优化器效果欠佳,试试这4种深度学习中的高级优化技术吧
- 再见 LangChain!Atomic Agent火了!
- XGBoost算法原理小结
- 如何向5岁小孩解释什么是支持向量机(SVM)?
- ECCV 2024 | 跨域语义分割的注意力分解
- “给我滚出贵大!”郑强出任贵州大学校长,打算把树全砍掉,学生愤怒抗议,4年后事情反转
- 50个最佳机器学习公共数据集
- NeurIPS神仙打架:李飞飞180页PPT谈视觉智能,Bengio同OpenAI员工吵架,何恺明谈AI宿命论
- 一文清晰搞懂机器学习模型的偏差和方差
- 欧式距离、曼哈顿距离、切比雪夫距离三种距离的可视化展示
- MITA-YOLO: 一种改进的间接视觉 YOLOv8方法用于目标检测!
- 中国工程院院士孙凝晖给正国级、副国级讲课的万字长稿《人工智能与智能计算的发展》
- 用Python优雅地编写LaTeX
- 通过动图彻底理解了傅里叶变换
- 相机镜头工作原理图解
- 1年内11名博士生自杀,顶尖高校陷博士生自杀危机,疑因要求学生每学期发1篇SCI
- 使用Python Pip的10个技巧
- AAAI2025|只根据题目和摘要就能预测论文影响力?!
- 视觉 Transformer 与目标检测的完美融合:解读 ViTOC 架构 !
- 刚刚,三名谷歌视觉Transformer作者官宣加入OpenAI
- Python 3.13将会改变 AI 和 ML 的游戏规则?
- 中纪委严厉批评:中国高校面临重大整改
- 彻底理解了支持向量机算法
- 研二学生被舍友投毒,官方最新通报
- PyGWalker:最好用的数据分析Python库
- 多模态视觉token压缩方法详解
- ECCV 2024 | 无监督多模态医学图像配准的可逆翻译方法
- 某副教授相亲100多场总结出来的经验,网友:建议开源,发表论文…
- ECCV 2024 | 跨域语义分割的注意力分解
- 大学“一级教授”和“四级教授”的区别有多大?
- ECCV 2024 | AdaDiffSR:用于真实世界图像超分辨率的自适应区域感知动态加速扩散模型
- 梁朝伟,博士!
- ECCV 2024 | AccDiffusion:一种无需额外训练的图像超分算法
- 新一轮高校裁员潮,来了!
- ECCV 2024 | 加速图像超分辨率网络的像素级分类
- 特朗普上台,第一刀再次扎在了留学生身上。。。
- TPAMI 2024 | 面向人群定位的一致性感知锚点金字塔网络
- 揭示Transformer重要缺陷!北大提出傅里叶分析神经网络FAN:填补周期性特征建模缺陷
- 《深度学习入门》中文版pdf下载
- 武汉大学:新增8位“国家杰青”!创历史新高
- 深度学习大模型,可以这么学!
- SVM is all you need,支持向量机永不过时。
- PaddleSeg:车道线检测
- 可视化理解LSTM
- 一文清晰搞懂机器学习模型的偏差和方差
- 揭示Transformer重要缺陷!北大提出傅里叶分析神经网络FAN,填补周期性特征建模缺陷
- 浙大 TableGPT2 开源,横扫任务榜,最强表格 AI问世!
- 残酷!中科院博士应聘某普通二本惨遭拒,开始思考人生……
- 浙大 TableGPT2 开源,横扫任务榜,最强表格 AI问世!
- 突发!ETH 官宣制裁中国学生,国防七子、中科大、川大、北邮等高校均在名单内。。。
- TPAMI 2024 | 基于自监督学习的现实世界超分辨率:从双重和多重缩放观测中学习
- 超全!李航《统计学习方法》读书笔记
- 今年顶会这情况。。。大家提前做准备吧!
- 人工智能的第一性原理是什么?
- 25个常用Matplotlib图的Python代码,收藏收藏!
- 图解Transformer
- 章国锋团队重磅开源!XRDSLAM:基于深度学习的模块化SLAM!灵活组合不同算法!(商汤&浙大)
- 刚刚!阿里巴巴公布“姜萍事件”调查结果公布。。。
- TPAMI 2024 | OoD-Control: 在陌生环境中泛化的控制
- 一文看完多模态:从视觉表征到多模态大模型
- 清华大学NeurIPS’24:时序大模型AutoTimes,结合In-context Learning提升预测效果
- 建议收藏:图解最常用的10大机器学习算法!
- 一文看懂LLM推理,UCL重磅解读OpenAI ο1的相关方法
学姐带你玩AI
- XGBoost算法在“金融市场”波动预测中的应用
- 19个超强Python Scikit-learn操作!
- 频频登顶Nature子刊,UNet实在太好用!
- 凭借SAM+多模态又发一篇CVPR!字节&北大都在做,跟上别掉队了!
- 入选CVPR 2025!清华&华科大提出超强异常检测新方法!学会你也能发顶会
- YOLO永不过时!全新轻量级版本拿下中科院1区TOP!创新性MAX
- CVPR 2025 | PyramidDrop让推理训练飞起来
- 目标检测DETR升级版横空出世!超越YOLO系列,高区Accept拿到手软~
- 1+1>2!今年小波变换的结合创新思路建议(附代码)
- 物理信息强化学习爆火!登上IEEE Trans一区顶刊!
- Nature新突破!小数据秒训神器来了!
- 何恺明2025新作的即插即用核心算法-DyT!!
- 冲上中科院1区TOP!“频域+PINN”发高分SCI易如反掌!
- ICLR 2025 | GRAM:多模态对齐新突破
- (CVPR 2025)卷积网络复活!港大最新改进版CNN涨点起飞!
- 多模态对比学习太香了!双斩CVPR/NeurIPS!新成果及开源代码已扒
- 2025年还在用KAN网络的也是神人了…
- 【NeurIPS2024】跨域知识蒸馏登顶会啦!
- ICLR 2025 | 精度近乎无损!首个Mamba系列模型量化方案MambaQuant
- Transformer+UNet到底是谁想出来的点子!用来创新真的太绝了!
- 【CVPR2025】图像恢复+mamba
- “具身智能”顶会大爆发!李飞飞新作获最佳论文,这思路我吹爆!
- Mamba杀入图像增强!26%算力碾压SOTA!字节、华为都在做…
- Transfomer+图表示学习!新作登上Nature一区TOP,计算成本最高降低449倍!
- 【CVPR2025】多模态+视觉增强+大模型
- 年度好文!城市计算、深度学习与跨领域数据!
- 入选CVPR 2025!何恺明联手LeCun改进Transformer!新思路学到就赚到~
- 顶会AAAI 2025高效的CLIP KD新方法!
- 顶会新宠!剑桥凭“机器学习+因果推断”杀疯ICLR!2025发论文的黄金赛道来了!
- “PINN+多任务学习”创新思路再升级!登上IEEE(Trans)中科院1区TOP!
- JAG | 多模态深度学习的遥感数据融合综述(ESI高被引论文)
- CVPR’25又一满分论文!重建 vs 生成:解决扩散模型中的优化难题
- 拿下CV顶会!多模态特征融合+Mamba新方法,性能超越SOTA!
- CVPR 2025 满分论文,极简的数据蒸馏!
- 深度学习+多模态数据融合,顶刊超神了!
- 连看几十篇YOLO论文,发现了YOLO中稿的“潜规则”!这妥妥发SCI的捷径!
- 荣登Nature招牌1区Top!可解释的多模态融合模型迎来新突破!
- CVPR 2025 即插即用卷积-自适应矩形卷积!
- 机器学习中常用的5种距离度量方法
- 还在死磕传统PINN?自适应版本训练效率狂飙,审稿人直呼”这才是真创新”!
- 打王者荣耀,发NeurIPS!
- 融合LSTM与Transformer做时间序列预测,发高分轻轻松松!
- Kimi“撞车”DeepSeek!新一代注意力机制的极限突破!
- 喜提CVPR 2025满分!数据蒸馏取得新突破!速度up20倍,GPU占用仅2G
- 冠豪猪优化算法(CPO)原理及实现
- FourierMamba: 傅里叶学习与Mamba结合的图像去雨
- 特征融合这样创新!与GNN结合顶天,一区TOP刊如囊中物!
- ICLR25-Oral:双曲空间让CLIP看懂层次关系
- KAN备受审稿人青睐!结合小波变换就能发一区,厉害了
- 变种PINN,更小的误差,更高的性能!
- 狂发顶会的Mamba,融合傅里叶变换再出神作!
- 度小满风控算法工程师社招一面+二面+三面
- 剑桥大学PINNs新综述!物理信息神经网络能否超越有限元方法?
- 结合CNN与Transformer,实现遥感图像处理性能巅峰,霸榜顶会顶刊!
- 爆锤蒸馏!田渊栋等提出CoCoMix,用“连续概念”增强大模型训练,效率提升21.5%!
- Transformer结合特征融合依旧可以卷!来跟着斯坦福学习怎么创新!
- 喜提Nature正刊!小样本机器学习突破性新方法来了!
- SHAP可解释性竟然还能做聚类分析?11个结合idea带你一网打尽顶会顶刊!
- 字节搜索算法工程师社招一面
- 讲透一个数据挖掘神器:LightGBM !!
- 结合创新!小波变换+Mamba性能爆炸,妥妥顶会&顶刊神器!
- 李飞飞多模态模型新作!实现动作与语言的统一理解
- 因果机器学习(CausalML)前沿创新思路
- 强化学习+多目标优化,get到这种思路,发一区TOP就不远了!
- 正在爆发!“LSTM+卡尔曼滤波”成论文新赛道!
- 淘宝主站推荐算法工程师一面
- 30个Python常用代码段
- CNN+Mamba+UNet,“三巨头” 合体!
- DeepSeek-R1 论文解读
- 多模态CLIP魔改版太强了!直接上岸CVPR!
- PINN+LSTM大突破!中科院一区&二区get,满足课题需求!
- 想做多模态和可解释性一定要看!这些idea思路是真的顶
- DeepSeek 模型架构解读 - 多头注意力(MHA)和多头潜在注意力(MLA)
- 理解卷积神经网络中的卷积滤波操作
- 强化学习+组合优化创新!快速学会登上CCF-A的热门组合
- ICLR 2025:卷死YOLO11!中科大提出D-FINE
- 图像增强+深度学习法力无边!CVPR、ICCV一发一个不吱声!
- 又一篇CCF-A!多尺度Mamba“ 杀疯了 ” ….
- 入选AAAI 2025!多模态医学图像融合新突破!
- 深度学习面试高频问题解析:CNN与ANN的核心差异
- 手撕Transformer模型:分步骤数学实例解析
- ECCV 2024,全新激活函数!
- HULC-2丨非结构化数据的具有视觉可供性标定语言
- 目标检测除了改YOLO没得做了?来看看这些一投一个准的高区idea!
- ICLR’25高分!多尺度时间序列全面升级!超越Transformer,8项任务全面领先
- 姚期智团队开源新型注意力机制!降本90%…2025发顶会还得靠Attention
- XGBoost,梯度提升的机器学习 Python 神库!
- [有人@我]🧧新春红包派送中…祝大家新的一年,好运连连!
- 专为科研人设计的新春红包封面,限量免费领!
- MATCH POLICY:从点云配准到操作策略的简单流程
- 学会这种多尺度特征融合思路,CCF A和SCI一区还不是小菜一碟!
- 超越Transformer!Mamba入局图像复原,达成新SOTA!
- 2025年CNN与Transformer融合的创新点思路
- 字节广告算法工程师社招一面
- 超强总结!十大聚类算法!附Python实现
- 登顶Nature,准备起飞!小样本学习又杀疯了(有代码)
- IEEE RA-L 2024丨NaturalVLM:利用细粒度自然语言实现可供性引导视觉操作
- 可变形卷积一区TOP新思路!刷爆遥感SOTA!
- 24 个超强 PyTorch 操作!!
- Nature子刊3连发!深度迁移学习又开挂了!顶刊热点果然名不虚传,快冲!
- SINGAPO:对象中关节部分的单图像控制生成
- 基于UNet的遥感图像处理新成果!保持高性能同时降低计算成本
- 小样本异常检测新突破!全新FSAD方法全类别通用,idea代码已开源
- 深度学习时间序列新突破!4大创新方向霸榜AI顶会
- 京东算法岗一面面经
- 30个TensorFlow绝技,带你玩转机器学习
- 如何给大模型喂时序数据?基于LLMs的时间序列预测5大方法汇总
- CVPR 2024 | 英伟达&斯坦福新作:未知关节物体数字孪生体的神经隐式表示
- Mamba+时间序列预测!既要SOTA又要低开销!
- 涨点超强!图像特征提取最新方法!性能效率快到飞起
- 逆天顶会思路!傅里叶变换+Attention!创新性极强,足够支撑一篇高分论文
- Sentence-BERT实现文本匹配【对比损失函数】
- 机器学习树模型大比拼:GBDT、XGBoost、LightGBM
- CLIP还能再战 !结合Mamba超越传统,仅用1/5参数就达到天花板性能
- CVPR 2024 | CAGE: 可控关节生成
- 用SVM做时间序列预测真绝!最新思路无敌了,卷不动的进来看!
- 强化学习不愧“顶会收割机”!2大创新思路带你上大分,毕业不用愁!
- 注意力机制又见神操作!结合多尺度特征提取涨点起飞!看似简单,实则也不难
- H2O,一个开源的分布式机器学习Python库!
- 阿里达摩院大模型算法岗二面面经
- PINN结合GNN刚发的一区TOP!创新力拉满,快进来学习!
- 清华重磅开源RDT-1B:全球最大的双臂机器人扩散模型!
- 物理神经网络“双杀”Science和Nature!最新思路爆火,要拿分趁现在!
- 出场即称霸:CNN+医学图像分割!这高端局思路可得接稳了!
- 登上Nature和CVPR!小波变换+UNet上大分!
- 滴滴算法工程师一面&二面
- 10个神级Python机器学习库!
- 暴力涨点!迁移学习+时间序列预测简直“杀”疯了!
- RSS 2024丨关键点动作令牌实现机器人中的上下文模仿学习
- 突破LSTM,使用贝叶斯优化时间序列预测 !这创新点Nature子刊稳了
- YOLO有多好发文?搭载多尺度特征融合,顶级一区“嘎嘎乱杀”,思路速学!
- 结合创新!频域+特征融合新突破,让顶会投稿轻松涨点!
- 阿里达摩院大模型算法岗一面面经
- 通透!十大时间序列分析方法 超强总结 !!
- 不愧是顶流!傅里叶变换一登场,搭上时间序列顺利拿下多篇NeurIPS!
- IEEE Trans中的毕业神刊!CCF-C,2个月极速审稿,CV方向强推!(附投稿交流群)
- 斯坦福又一力作!基于改进3D扩散策略的通用人形机器人操控
- 普通人可发的SCI三区期刊!IF=4.5,最快2个月录用,年发文量持续上涨
- 性能暴涨97%!PINN+迁移学习联合思路发Nature,性价比也太高了!
- Transformer是真热啊!叠上小波变换热上加热,绝对还能发更多顶会论文!
- 左手Nature,右手顶会!深度学习可解释才是天降紫微星!
- Sentence-BERT实现文本匹配【CoSENT损失】
- 吊打IEEE(trans)的Nature子刊!IF=18.8,篇篇精品,中稿直接起飞!
- 机器学习各常用算法的优缺点!
- 深度学习创新点不足?试试贝叶斯神经网络!
- IEEE这本神刊太硬核!高影响因子易录用,已成计算机SCI大牛聚集地!(附投稿交流群)
- RSS 2024丨多模态扩散Transformer:从多模态目标中学习多功能行为
- IEEE又一本TOP刊起飞!刊文量>1000+,IF=10.2,最快一个月accept!(附投稿交流群)
- 数据增强又突破了!升级版“双杀”两大顶会,实现无痛涨点
- 强化学习+大模型轻松发顶会!不要光想着LLM,OpenAI o1这样做才是对的
- 注意力机制还是太全面!结合可变形卷积直接拿下顶会!高分套路可放心尝试
- Sentence-BERT实现文本匹配【回归目标函数】
- Python面向对象,看这一篇就够了
- Transformer可解释性又冲上一区Top!学会这idea搞定12+高分文章so easy!
- IROS 2024 | SCANet:让机器人像人类一样自我纠错
- 多尺度卷积一出手,高分文章立马有!这样新颖的idea真不多见!直接一个王炸!
- CVPR王炸组合:特征融合+目标检测!想发高分就看这篇
- 这idea能发Nature封面?!强化学习+卡尔曼滤波赢麻了!
- AI+医疗2区实力刊!IF=6+连涨不断,投中晋升、评职称稳了!
- 硕士毕业&找工作感想
- 申博「神刊」!SCI一区TOP,认可度高,初审超快!(附投稿交流群)
- Sentence-BERT实现文本匹配【分类目标函数】
- 人工智能SCI三区毕业刊!IF=4.2,最快3个月接收,好发!
- 多模态Embedding不愧是CVPR和NIPS的共同选择!这发文思路真的需要好好学习一下!
- IEEE Trans系列SCI一区顶刊!IF=11.7,发文扩刊中,投中就躺赢!
- CoRL’24 最佳论文提名 | 等变扩散策略
- 中科院二区CS毕业神刊!国人发文友好,最快1个月录用~(附投稿交流群)
- 狂发一区的YOLO,和Mamba是绝配!最新研究命中Nature,这泼天的高分思路你要不要!
- 别卷Transformer了!时序卷积这么做,一样发顶会!
- 特征选择稳站中科院2区!这新思路审稿人看了想不通过都难……
- IEEE二区宝刊,计算机科学方向,IF=9.6,最快2个月录用!(附投稿交流群)
- Cross-Encoder实现文本匹配(重排序模型)
- TPAMI又一顶刊平替!两年内收文爆涨五倍!25年必投的一区期刊~(附投稿交流群)
- 新手必看!5分钟让你读懂深度学习!(附代码实现)
- 研究生毕业的梦中情刊!中科院SCI二区,IF年年翻倍,无需版面费!(附投稿交流群)
- 不得不服,这种KAN+UNet思路也太绝了!审稿人都得为你让条路!
- IEEE Trans系列人机领域权威刊!JCR1区,SCI3区,含金量超高且无版面费~(附投稿交流群)
- ICCV Oral丨清华AIR:用于时间一致性关键点发现的三维隐式Transporter
- 机器学习SCI三区,IF=4+,平均2个月录用,无版面费~(附投稿交流群)
- 多模态还能这么玩?结合小样本学习,一区TOP轻松过收入囊中!
- 贝叶斯+PINN!双重热点buff叠加,轻松斩获Nature子刊!
- CNN+LSTM+Attention多热点搭配!又是创新性拉满的高分思路!!
- 沾边就收,无版面费!这本计算机SCI3区期刊千万别错过!
- 面试英伟达算法岗,强度拉满!
- 投稿量暴涨!sci2区期刊,IF=7+,人工智能方向绝对宝刊!(附投稿交流群)
- 终于有人把Transformer给可视化清楚了!!
- 人工智能SCI一区,最快3个月录用,非OA无版面费,性价比超高!(附投稿交流群)
- “聚类+Transformer”俩搭档配享太庙!这方向发A会根本不用忧!
- SCI新晋神刊!国人主编,影响因子8.4,期刊质量稳步上升!(附投稿交流群)
- 斯坦福&MIT&英伟达联手打造!CPM:基于可组合零件的操纵
- 强推!SCI三区,无版面费,最快6个月accept!
- 模型融合创新性好强!最新成果直接登顶SOTA,分分钟拿下顶会
- 双热点炸场!CNN与ViT完美结合,低端CPU上实现高精度与快速计算
- Transformer依旧嘎嘎发文!+GAN天作之合拿下CV顶会,抓紧复现!
- 人工智能SCI三区,IF=3+,平均两个月出版,毕业友刊~(附投稿交流群)
- 2024滴滴&Insta360算法工程师面试题
- 口碑爆棚的计算机一区顶刊!IF=7+,编辑处理及时,国人友好到起飞
- 如何轻松、快速且低成本地部署LLM服务?
- 中科院计算机科学2区,影响因子5,录用周期短,推荐着急毕业的投!
机器之心SOTA模型
- 今日开源(2025-04-25):英伟达开源DAM多模态视觉语言模型,3B参数,交互式区域描述生成模型,支持点/框/涂鸦输入
- 今日开源(2025-04-24):Skywork-R1V 2.0,38B参数推理模型,视觉链式思维突破,数学/图像理解SOTA
- 今日开源(2025-04-23):Dia,1.6B参数对话式TTS模型,支持情感语调控制,可生成非语言交流声效,仅支持英语
- 今日开源(2025-04-22):MAGI-1,24B/4.5B自回归视频世界模型,流式生成+块级提示,高一致性与文本驱动控制
- 今日开源(2025-04-21):SimpleAR,0.5B/1.5B自回归视觉模型,1024分辨率图像,改进图像美学和提示对齐
- 今日开源(2025-04-18):微软Granite-3.3,推理优化语言模型,8B/2B参数,数学/编码/指令跟随性能显著提升
- 今日开源(2025-04-17):Perception R1,3B多模态大模型强化学习,GRPO后训练,突破感知任务性能阈值
- 今日开源(2025-04-16):智谱开源GLM新模型,深度推理Z1版性能强化,长链思考+数学代码专项优化,32B/9B参数
- 今日开源(2025-04-15):InternVL3多模态大模型,1至78B七种参数,原生预训练强化推理,覆盖3D/工业视觉领域
- 今日开源(2025-04-14):Skywork-OR1,7B/32B三个推理模型,规则增强学习训练,数学和代码推理表现远超同类
- 今日开源(2025-04-11):ScholarCopilot,AI学术写作框架,智能文本补全与引用建议,助力7B小模型论文写作
- 今日开源(2025-04-10):Kimi-VL,16B高效多模态模型,长上下文+CoT推理,强化学习优化,实现卓越视觉语言能力
- 今日开源(2025-04-09):DeepCoder,代码推理大模型,分布式强化学习微调,14B参数性能媲美o3-mini
- 今日开源(2025-04-08):MedReason助力医疗推理大模型,临床问答化为推理链,结构化知识图谱驱动诊断,8B参数最优
- 今日开源(2025-04-07):Meta发布Llama 4系列,17B/288B三种MoE模型架构,支持文本/图像/视频理解
- 今日开源(2025-04-03):TxGemma,基于Gemma2微调,2B/9B/27B治疗开发模型,支持蛋白质核酸交互分析
- 今日开源(2025-04-02):Dolphin,ASR模型开源来袭,支持40种东方语言+22种中文方言,21万小时训练
- 今日开源(2025-04-01):B站开源IndexTTS,工业级零样本TTS系统,拼音校正+标点控制停顿,性能超越主流方案
- 今日开源(2025-03-31):智源发布RoboBrain,多模态大模型赋能机器人大小脑协作,突破规划/感知/轨迹预测瓶颈
- 今日开源(2025-03-28):OmniSQL,文本到SQL数据生成大模型,含百万级跨领域数据集,7B/14B/32B参数可选
- 今日开源(2025-03-27):阿里云Qwen2.5-Omni,端到端多模态大模型,实现文本/音频/视觉/视频实时交互
- 今日开源(2025-03-26):上财Fin-R1,7B金融推理大模型,基于Qwen2.5微调,强化金融代码/计算/风控能力
- 今日开源(2025-03-25):Qwen2.5-VL更新,强化学习优化多模态模型,32B参数,细粒度图像理解与复杂数学推理
- 今日开源(2025-03-24):字节发布InfiniteYou,高保真照片重塑框架,DiT架构+InfuseNet注入身份特征
- 今日开源(2025-03-21):阶跃星辰开源Step-Video-TI2V,文本驱动图像到视频生成,3B参数,支持102帧输出
- 今日开源(2025-03-20):SpatialLM,3D大语言模型,处理点云数据,生成结构化场景理解,赋能机器人导航与空间推理
- 今日开源(2025-03-19):LMM-R1,增强3B多模态模型推理能力工具,两阶段规则强化学习,提升视觉感知与逻辑推理
- 今日开源(2025-03-18):昆仑万维发布Skywork-R1V,38B多模态推理模型,视觉链式思维,精准解析科学医学图像
- 今日开源(2025-03-17):CSM会话语音生成模型,1B参数,Llama骨干+音频解码器,电影级别人声生成
- 今日开源(2025-03-14):MM-EUREKA,8B/38B多模态推理模型,规则强化学习扩展,提升推理能力与数据效率
- 今日开源(2025-03-13):Open-Sora 2.0视频生成模型,11B参数,720p高分辨率和24FPS流畅视频
- 今日开源(2025-03-12):谷歌开源Gemma 3,1至27B四种参数,支持140+语言,128k上下文,轻量级部署
- 今日开源(2025-03-11):olmOCR,高效处理百万PDF文档,支持ChatGPT 4o解析与微调,提供微调与评估工具
- 今日开源(2025-03-10):Long-VITA,长上下文视觉语言模型,支持百万视觉token,媲美20B模型,开源数据训练
- 今日开源(2025-03-07):腾讯开源HunyuanVideo-I2V,图生视频模型,图像潜在拼接技术生成高保真视频内容
- 今日开源(2025-03-06):阿里开源QwQ,大规模强化学习,专注复杂问题解决,32B性能媲美DeepSeek-R1
- 社区投稿 | 面向现代前端代码生成的多模态大模型解决方案
- 今日开源(2025-03-05):CogView4开源来袭,6B级联扩散模型,支持中英文文本输入,生成高分辨率图像
- 今日开源(2025-03-04):Granite3.2,8B长上下文模型,可控推理支持多语言,基于3.1微调,助力多领域AI应用
- 今日开源(2025-03-03):HumanOmni,7B全方位多模态大模型,专注人物场景理解,动态融合面部、身体与交互信息
- 今日开源(2025-02-28):LLaDA,8B大语言扩散模型,全新掩码扩散方法,媲美LLaMA3,突破自回归限制
- 今日开源(2025-02-27):ENEL无编码器3D大语言模型,7B参数超越shape-llm,高效处理点云数据与语义特征提取
- 今日开源(2025-02-26):Wan2.1,14B参数视频基础模型,支持中英文、多视频任务,高效处理1080P视频
- 今日开源(2025-02-25):TinyR1-Preview,32B推理模型,数学表现超越70B模型,5%参数接近完整R1性能
- 今日开源(2025-02-24):阿里国际Ovis2,多模态新突破,1B-34B参数支持视觉文本对齐,强化推理与多语言处理能力
- 今日开源(2025-02-21):WMP,基于世界模型的感知算法,迁移至宇树A1机器人,实现未来感知预测与精准控制
- 今日开源(2025-02-20):Evo2 最大公开AI生物学模型,完整版高达40B参数,长达100万碱基对的上下文长度
- 今日开源(2025-02-19):MoBA注意力机制,无参数Top-K门控机制,革新长上下文处理,高效LLMs新突破!
- 今日开源(2025-02-18):Step-Video-T2V:30B参数,16x16空间和8x时间压缩,204帧高清视频生成
- 今日开源(2025-02-17):BodyShapeGPT,基于SMPL-X模型,精准生成3D人形化身,革新虚拟交互与定制化模拟
- 今日开源(2025-02-14):DeepHermes 3,8B参数,实现长链思维与LLM无缝切换,推理与响应模式统一
- 今日开源(2025-02-13):OpenThinker,开源文本生成模型,32B参数,基于Qwen2.5微调,数据集代码全公开
- 今日开源(2025-02-12):DeepScaleR-Preview分布式强化学习微调大模型,1.5B参数性能超越OpenAI
- 今日开源(2025-02-11):Zonos,多语言TTS模型,20万小时训练,支持5种语言,精准语音克隆,情感控制自如
- 今日开源(2025-02-10):Satori,自回归搜索大模型,7B参数,自我反思与探索能力表现优异,基于Qwen2.5微调
- 今日开源(2025-02-08):YuE,开源歌词转歌曲生成模型,7B参数支持多流派音乐创作,打造精致连贯的完整歌曲
- 今日开源(2025-02-07):DeepSeek开源Janus-Pro:自回归框架,1B和7B参数,多模态理解与生成新突破
- 今日开源(2025-02-06):仿真机器人项目ASAP,HumanoidVerse框架赋能,推动人形机器人技能跨平台迁移
- 今日开源(2025-02-05):阿里达摩院发布VideoLLaMA3,2B和7B参数两种模型,视频图像多模态理解表现SOTA
- 今日开源(2025-01-24):百川智能开源Baichuan-M1医疗增强大模型,14B参数,20万亿token的数据训练
- 今日开源(2025-01-23):GME,通义实验室推出的多模态嵌入模型,2B和7B两种参数,支持文本、图像和图文对三种输入
- 今日开源(2025-01-22):字节开源Sa2VA,首个在视频级别支持对话、指称分割及理解的统一模型,1B至26B四种参数
- 今日开源(2025-01-21):DeepSeek-R1,强化学习提升推理能力,1.5B至70B六种模型,直追OpenAI o1
- 今日开源(2025-01-20):Art v0,基于Qwen2.5微调的增强推理模型,3B参数,Gemini2.0生成数据集训练
- 今日开源(2025-01-17):ReaderLM-v2开源1.5B小模型,HTML转Markdown和JSON,支持29种语言
- 今日开源(2025-01-16):书生InternLM3开源来袭,8B参数,4T训练数据节约成本75%以上,融合深度思考和对话
- 今日开源(2025-01-15):MiniMax-Text-01,456B参数、创新架构与超大上下文长度,打造强大语言模型
- 今日开源(2025-01-14):Dispider,新型视频大模型,解耦感知、决策和反应三个模块,实现主动实时交互反馈
- 今日开源(2025-01-13):Sky-T1-32B-Preview推理模型,权重细节全开源,降本增效训练自己的o1模型
- 今日开源(2025-01-10):Virgo,类o1推理系统,7B参数,使用奖励引导的树搜索,探索慢思考能力的跨模态迁移
- 今日开源(2025-01-09):Phi-4,微软开源14B参数小模型,数学性能超越GPT-4o,具备精准指令遵循和强大安全性
- 今日开源(2025-01-08):Aria-UI,面向GUI智能交互的多模态模型,纯视觉理解,提升动态场景GUI定位准确性与效率
- 今日开源(2025-01-07):Cosmos平台发布8款物理AI模型,基于视频文本的未来视觉世界生成,助力机器人与自动驾驶研发
- 今日开源(2025-01-06):Dolphin 3.0最新一代指令调优模型,0.5B至8B多量级参数,终极通用AI模型
- 今日开源(2025-01-03):字节开源文生图版本框架Infinity,全新位元视觉自回归建模,2.6倍提速高分辨率图像生成
- 今日开源(2025-01-02):Story-Adapter,提升长故事的可视化生成能力,无需训练的迭代框架,优化图像生成过程
- 今日开源(2024-12-31):HuatuoGPT-o1高级医疗推理模型,7B至72B四种参数量级,加入强化学习增强推理能力
- 今日开源(2024-12-30):SEMIKONG,全球首个半导体行业大模型,8B/70B参数版本,3T双语言语料库训练
- 今日开源(2024-12-27):DeepSeek-V3,671B参数的MoE模型,数学代码任务突出,中文性能碾压GPT-4o
- 今日开源(2024-12-26):字节跳动发布Valley多模态大模型,7B参数,文本、图像和视频多任务,引领电商短视频新突破
- 今日开源(2024-12-25):阿里云通义千问发布开源QVQ-Preview,72B参数,基于视觉进行深度思考推理,表现出色
- 今日开源(2024-12-24):ModernBERT来袭,参数为139M、395M两个模型,适用检索、分类、实体抽取等任务
- 今日开源(2024-12-23):Bamba语言大模型,9B参数,基于Mamba-2架构,2万亿Token训练引领性能跃升
- 今日开源(2024-12-20):Lyra多模态大模型:3B、9B、74B参数需求全覆盖,语音、视觉、语言交互新突破,全模态认知
- 今日开源(2024-12-19):Granite 3.1来袭,1B至8B共4种尺寸2种架构,128k上下文,十万亿token训练
- 今日开源(2024-12-18):Falcon 3开源大语言系列模型,5个基础模型,1B到10B参数规模,支持四种语言
- 今日开源(2024-12-17):Ivy-VL,轻量级3B参数多模态模型,接受图像和文本输入,边缘设备上的高性能之选
- 今日开源(2024-12-16):DeepSeek-VL2性能跃升,仅1至4.5B激活参数,覆盖视觉问答、OCR、图表理解等任务
- 今日开源(2024-12-13):文档解析评估基准OmniDocBench,含文本段落、标题、表格等元素的定位信息,提供模块代码
- 今日开源(2024-12-12):多模态大模型Maya,基于LLaVA框架,8B参数,指令微调扩展至支持8种语言
- 今日开源(2024-12-11):书生·万象InternVL 2.5开源,1B到78B参数,链式推理技术提升性能媲美GPT-4o
- 今日开源(2024-12-10):智源发布3D生成模型See3D,1600万互联网视频训练学习,无须几何注释的视觉内容驱动
- 今日开源(2024-12-09):Meta开源Llama3.3专注文本生成,70B媲美405B性能,支持8种语言、128k上下文
- 今日开源(2024-12-06):谷歌新一代视觉语言模型PaliGemma 2,从3B到28B,结合Gemma 2 文本解码器
- 今日开源(2024-12-05):Fish Speech 1.5文本到语音,语音克隆延迟不超150ms,新增5种语言,交互式聊天
- 今日开源(2024-12-04):Cognify,提升生成式AI工作流的多功能优化工具,生成质量提高48%,执行成本降低9倍
- Qwen2-VL 能平替 GPT-4o 搞个咱知根知底的J.A.R.V.I.S吗?实测:有点er戏!
- 今日开源(2024-12-03):腾讯HunyuanVideo视频生成大模型,13B参数,单次生成5秒视频,支持中英文双语输入
- 今日开源(2024-12-02):INTELLECT-1,首个以去中心化形式训练得到的10B大模型, 1万亿token数据训练
- 今日开源(2024-11-29):月之暗面开源Mooncake传输引擎核心组件,长文本、高并发,将逐步开源多级缓存的实现
- 今日开源(2024-11-28):阿里开源QwQ-32B-Preview推理大模型,自我思考、数学能力媲美OpenAI o1
- 今日开源(2024-11-27):昆仑万维发布Skywork o1,8B参数,国内首款中文逻辑推理能力o1模型,天工大模型4.0
- 今日开源(2024-11-26):OpenScholar科研搜索模型,基于检索增强,含4500万篇开源论文及2.37亿段落嵌入
- 今日开源(2024-11-25):Tülu3,首个发布后训练配方的开源模型,涵盖8/70B两个版本,性能超越Llama3.1
- 今日开源(2024-11-22):阿里巴巴开源推理模型Marco-o1,思维链微调&蒙特卡罗树搜索,创新推理策略
- 今日开源(2024-11-21):智子引擎开源Awaker2.5-VL,基于LoRA-MoE的参数高效多专家架构设计与优化
- 今日开源(2024-11-20):LLaVA-o1,专为系统化推理设计的视觉语言模型,11B参数表现优异,碾压众多闭源模型
- 今日开源(2024-11-19):Pixtral Large开源来袭,123B多模态大模型,128k上下文窗口容纳至少30张图片
- 今日开源(2024-11-18):DIAMOND:新型强化学习智能体,虚拟环境中实现自动回归决策,超越人类玩家
- 今日开源(2024-11-15):Omnivision:边缘设备优化的多模态模型,968M参数,高效处理视觉问答和图像描述
- 今日开源(2024-11-14):DeepSeek开源统一多模态框架JanusFlow,同时处理图像理解和生成,可直接训练
- 今日开源(2024-11-13):LLaVA-KD知识蒸馏框架,减少计算需求,高效将大规模模型的能力迁移到小规模模型中
- 今日开源(2024-11-12):通义千问Qwen2.5-Coder,全系列含0.5B至32B共6个尺寸,支持92种编程语言
- 今日开源(2024-11-11):OpenCoder代码大模型家族,1.5/8B基础和聊天模型,支持中英文,2.5万亿token
- 今日开源(2024-11-08):HelloMeme图像生成模型插件,超真实多图片之间的表情迁移,兼容多种模型
- 今日开源(2024-11-07):浙大开源TableGPT2,7B和72B双参数版本,针对解决表格数据任务,结构化数据成独立模态
- 今日开源(2024-11-06):腾讯Hunyuan3D-1.0,文本与图像到3D生成框架,最快10s获得3D资产
- 今日开源(2024-11-05):腾讯发布Hunyuan-Large,业界最大开源MoE模型,389B参数,支持256K上下文
- 今日开源(2024-11-04):中科院与字节联合发布DreamClear,基于深度学习技术,隐私安全优先的高性能图像修复技术
- 今日开源(2024-11-01):Meta发布MobileLLM模型代码,1B参数级高质量语言模型,零样本常识推理任务表现优异
- 今日开源(2024-10-31):字节开源MimicTalk代码,基于NeRF技术,15分钟生成3D说话人脸视频
- 今日开源(2024-10-30):SD 3.5 Medium开源发布,2.5B参数大小,生成从0.25到2百万像素之间的图像
人工智能前沿讲习
- 【源头活水】Jeff Dean演讲回顾LLM发展史,Transformer、蒸馏、MoE、思维链等技术都来自谷歌
- 【源头活水】21岁华人开发AI作弊工具被哥大停学,转身拿下530万美元融资,网友:《黑镜》成真
- 【源头活水】OpenAI姚顺雨:大模型下半场是产品的游戏,做研究也要有产品思维
- 【他山之石】扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源
- 【源头活水】UC伯克利:让推理模型少思考,准确率反而更高了!
- 【他山之石】「全球首个自回归视频生成大模型」,刚刚,Swin Transformer作者创业团队重磅开源!
- 【源头活水】人类活一百年,处理的信息只有 4GB?大脑处理速度只有果蝇的16倍
- 【他山之石】WSDM 25唯一最佳论文:从谱视角揭开推荐系统流行度偏差放大之谜
- 【源头活水】Jeff Dean演讲回顾LLM发展史,Transformer、蒸馏、MoE、思维链等技术都来自谷歌
- 【源头活水】AI应用创业公司:大模型最近的突破,全是作弊
- 【源头活水】强化学习发展这十年
- 【他山之石】医疗图像去噪新突破!DiffDenoise:自监督扩散模型保留高频细节
- 【源头活水】强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展
- 【他山之石】自动驾驶新突破!UniMamba:首个超越70mAP的LiDAR 3D检测模型
- 【源头活水】AI编程相关开源数据集资源汇总
- 【他山之石】GAN+强化学习=金融市场的"上帝视角"?深度解析斯坦福团队最新市场均衡模型
- 【源头活水】7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?
- 【他山之石】CVPR2025 | 融入SAM语义信息的双层优化蒸馏:多模态图像融合新思路
- 【源头活水】ChatGPT解锁完整记忆,奥特曼彻夜难眠!所有聊天记录黑历史AI全知道
- 【他山之石】CVPR2025 Highlight | DashGaussian:200 秒内优化 3D高斯
- 【源头活水】预训练还没终结!港中文清华等提出「三位一体」框架,持续自我进化
- 【他山之石】CVPR 2025 | 魔鬼藏于统一性——即插即用分层多头注意力!
- 谈谈字节的Attention/Expert分离
- 【他山之石】首次引入强化学习!火山引擎Q-Insight让画质理解迈向深度思考
- 【源头活水】CLIP被淘汰了?LeCun谢赛宁新作,多模态训练无需语言监督更强!
- 【他山之石】铰链物体的通用世界模型,超越扩散方法,入选CVPR 2025
- 0.72秒生成3D世界!建模提速15倍!极佳&北大等的WonderTurbo强势登场,可实时交互!
- 【他山之石】CVPR 2025 | 魔鬼藏于统一性——即插即用分层多头注意力!
- 【源头活水】英伟达GPU命名背后:是情怀,也是致敬伟人的智慧!
- 【他山之石】三思而后行,让大模型推理更强的秘密是「THINK TWICE」?
- 【他山之石】本周大模型新动向!DeepSeek-R1 安全性存在短板?
- 【他山之石】卷积网络又双叒叕行了?OverLoCK:一种仿生的卷积神经网络视觉基础模型
- 【源头活水】DeepSeek-R1之后推理模型发展如何?Raschka长文梳理后R1时代14篇重要论文
- 【源头活水】刚刚,奥特曼官宣开源:自GPT-2之后,我们要发首个带推理能力的开放权重模型
- 【他山之石】ICLR 2025 Oral IDEA联合清华北大提出ChartMoE:探究下游任务中多样化对齐MoE的表征和知识
- 【他山之石】Anthropic用“AI显微镜”扒开Claude“大脑结构”,揭示语言模型行为背后机制
- 【源头活水】清华稀疏Attention,无需训练加速一切模型!
- 【源头活水】GPT-4o的P图太火了,GPU在融化,官方终于限流了
- 【他山之石】Anthropic用“AI显微镜”扒开Claude“大脑结构”,揭示语言模型行为背后机制
- 【源头活水】谷歌对齐大模型与人脑信号!语言理解生成机制高度一致,成果登Nature子刊!
- 不用向量量化也能高质量生成?NOVA:重新定义自回归视觉建模
- 为什么是梁文锋做出了DeepSeek?
- 【他山之石】AAAI2025 | 北大&数原提出MMGDreamer:混合模态图驱动,几何可控的3D室内场景生成新标杆
- 【源头活水】视频生成的测试时Scaling时刻!清华开源Video-T1,无需重新训练让性能飙升
- 【他山之石】CVPR 2025 | 清华提出MambaIRv2:图像复原超强SOTA模型
- 【他山之石】AAAI2025 | 北大和数原提出MMGDreamer
- 【源头活水】院士领衔万字长文,全面系统梳理多模态LLM对齐算法
- AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025
- 【他山之石】CVPR 2025 | 清华提出MambaIRv2:图像复原超强SOTA模型
- 干货满满!GTC25 图灵奖获得者AI教父杨立昆“硬刚”英伟达首席科学家比尔达利,直言英伟达该降价了!
- 【源头活水】CVPR 2025 满分论文!清华提出TSP3D:基于语言引导空间剪枝的高效3D视觉Grounding
- 【他山之石】ICLR 2025 Spotlight | 慕尼黑工业大学&北京大学:迈向无冲突训练的ConFIG方法
- 【源头活水】Long-CoT 后,推理模型的「思维模板」有哪些新玩法?
- 【源头活水】CVPR 2025 | 大模型全军覆没!中科院提出MV-MATH:多图数学推理新基准
- 【源头活水】谷歌团队再次证明Scaling Law的准确性,即使总通信量减少99%,仍能超越数据并行训练
- 【他山之石】比传统语言模型快10倍,首个商业规模的扩散语言模型,究竟是什么来头?
- 【源头活水】29岁青年成为武大最年轻正教授,希望打破国际标准垄断,制定中国自主的应用密码学方案
- 【他山之石】ICLR 2025 Spotlight | 慕尼黑工业大学&北京大学:迈向无冲突训练的ConFIG方法
- 【他山之石】比传统语言模型快10倍,首个商业规模的扩散语言模型,究竟是什么来头?
- 【源头活水】让小模型也能有大作为!SANA 1.5:线性扩散Transformer再刷文生图新SOTA
- 【源头活水】潞晨Open-Sora 2.0全开源,20 万美刀复刻百万级大片,堪称开源视频界的「六边形战士」
- MambaOut:在视觉任务中,我们真的需要 Mamba 吗?
- CVPR 2025 | 扩散模型炼出新绝技!注意力蒸馏技术:图像生成效果全面碾压传统方法
- 【他山之石】ICLR2025 Spotlight Serge Belongie组与ETH提出:「免费」多模态信息助力3D样本分割
- 【源头活水】1000 token/s的「扩散LLM」凭什么倒逼AI走出舒适区?
- 【他山之石】MIT 最新扩散模型课程:从微分方程探索 AIGC 的边界
- 【源头活水】视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源
- 【他山之石】CVPR 2025 | 多视角视觉目标跟踪新突破!MITracker:高效融合多视角特征,解决遮挡与目标丢失问题!
- DeepSeek 反思潮:AGI 既被重新审视,又被持续低估
- 【源头活水】自己训练模型才能掌握未来?一股脑押注应用层或许值得警惕
- AI编程神器Cursor,保姆级教程来了!
- 【他山之石】CVPR25|零训练成本!中科大创新扩散模型概念擦除方法,先验保护较SOTA提升 10 倍
- 【他山之石】千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷
- 【源头活水】最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)
- 实测 Manus:首个真干活 AI,中国造(附50个用例 + 拆解)
- 【他山之石】行业Agents开发者速评Manus:全委 Agent or 协作 Agent ?
- 【源头活水】最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)
- 【他山之石】CVPR 2025 | MobileMamba:轻量级多感受野视觉Mamba主干
- 【源头活水】何恺明带队新作「分形生成模型」:逐像素建模高分辨率图像、效率提升4000倍
- 【他山之石】ICLR 2025|浙大、千问发布预训练数据管理器DataMan,53页细节满满
- 年薪154W!真心建议大家冲一冲新兴领域,工资高前景好
- 手把手教你驯服DeepSeek-R1!部署+测试+性能优化万字全攻略
- 【源头活水】DeepSeek开源周首日发布FlashMLA,将英伟达H800 GPU性能发挥到极致
- 【他山之石】DeepSeek、OpenAI视觉推理到底哪家强?MME-CoT:全新推理Benchmark,全方位理解LMM
- 【源头活水】再次颠覆学界想象,何恺明发表新作:扩散模型不一定需要噪声条件
- 【他山之石】DeepSeek模型在中文语境下的安全性评估
- DeepSeek面试通关|MLA如何让推理效率飙升200%?
- 【他山之石】LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升
- ICLR 2025|高达 128 倍下采样的 Autoencoder!DC-AE:高效加速高分辨率扩散模型
- 生成理解统一模型解读 (一)|Transfusion:只用一个模型搞定图像生成和理解任务!
- 【源头活水】DeepSeek开源周首日发布FlashMLA,将英伟达H800 GPU性能发挥到极致
- 【他山之石】DeepSeek模型在中文语境下的安全性评估
- 【源头活水】刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中
- 【他山之石】ICLR 2025 | Spatial-Mamba:基于结构感知状态融合的高效视觉状态空间模型
- DeepSeek R1 最新全面综述,近两个月的深度思考!
- 【源头活水】前沿论文 Arxiv’25 | COMO:基于跨模态Mamba交互与偏移引导融合的多模态目标检测
- 【他山之石】LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升
- 【他山之石】内容自适应 Tokenizer(CAT):提升图像 Diffusion Transformers 训练效能 !
- 【源头活水】前沿论文 Arxiv’25 | COMO:基于跨模态Mamba交互与偏移引导融合的多模态目标检测
- 【源头活水】清华一作1B暴打405B巨无霸,7B逆袭DeepSeek R1!测试时Scaling封神
- 【他山之石】LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升
- 【他山之石】ICLR 2025 高分论文!何恺明和刘壮提出:数据集偏差的十年之战
- 【源头活水】LLM模型的通病:模型坍塌
- 【他山之石】比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架
- 谈谈DeepSeek-R1满血版推理部署和优化
- 【他山之石】ICLR 2025 | 极性感知线性注意力!PolaFormer:全新视觉基础模型
- 【源头活水】一文搞懂DeepSeek的技术演进之路:大语言模型、视觉语言理解、多模态统一模型
- 【他山之石】英伟达新作SANA 1.5:线性扩散Transformer刷新文生图SOTA
- 【源头活水】LLM模型的通病:模型坍塌
- 【他山之石】入选AAAI 2025!多模态医学图像融合新突破!
- 【源头活水】LLM模型的通病:模型坍塌
- 4K分辨率拿下!超强杀器SANA:线性扩散模型+文生图+高分辨率+从头训练的极佳范本!
- 【源头活水】诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步
- 【他山之石】ICLR 2025 | 极性感知线性注意力!PolaFormer:全新视觉基础模型
- 【源头活水】被DeepSeek带火的知识蒸馏,开山之作曾被NeurIPS拒收,Hinton坐镇都没用
- 【他山之石】入选AAAI 2025!多模态医学图像融合新突破!
- 【源头活水】华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」
- 【他山之石】LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升
- 【他山之石】ICLR 2025|小米新一代Kaldi语音识别算法CR-CTC,纯CTC性能实现SOTA
- 【源头活水】华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」
- 【源头活水】一文详尽之Scaling Law
- 【源头活水】万字长文解读Scaling Law的一切,洞见LLM的未来
- 【源头活水】杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距
- 【他山之石】AAAI 2025|如何高效桥接视觉和语言,字节&中大提出全新多模态大模型连接器ParGo
- 【源头活水】NeurIPS 2024 | 超越KL!大连理工提出WKD:基于WD距离的知识蒸馏新方法
- 【他山之石】ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述,覆盖主流基准库、模型
- 【源头活水】DEIM: 在DETR中使用多对一匹配的策略加快收敛
- 【源头活水】GAN归来:模型大幅简化,训练更稳定,逆袭扩散模型,AI社区疯传
- 【他山之石】DeepSeek V3论文细节:如何绕开CUDA的垄断!
- 【他山之石】原来,这些顶级大模型都是蒸馏的
- 【他山之石】创造历史!DeepSeek超越ChatGPT登顶中美AppStore
- 【他山之石】全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻
- 【他山之石】DeepSeek-R1持续刷屏,连Open R1都来了!抱抱脸发起,1天狂揽1.9k星
- 【源头活水】中国AI太强,Meta工程师吓疯?自曝疯狂熬夜复制DeepSeek,天价高管心虚了
- 【源头活水】2025年Next Token Prediction范式会统一多模态吗?
- 【他山之石】Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重
- 【他山之石】扩散模型也能推理时Scaling,谢赛宁团队重磅研究可能带来文生图新范式
- 【他山之石】顶刊TPAMI 2024!北大提出实用、紧致的图像压缩感知网络PCNet,代码已开源
- 几秒生成逼真3D场景,泛化媲美Stable Diffusion | 浙大&蚂蚁等提出Prometheus
- 【源头活水】近8年后,谷歌Transformer继任者「Titans」来了,上下文记忆瓶颈被打破
- 【他山之石】重新思考图像超分辨率中的不平衡问题以实现高效推理(nips2024)
- 【源头活水】一个关于MoE的猜想
- 【他山之石】TPAMI-2024 | Uni-AdaFocus视频理解框架,让AI学会「划重点」,计算效率提升4-23倍!
- 几秒生成逼真3D场景,泛化媲美Stable Diffusion | 浙大&蚂蚁等提出Prometheus
- 即插即用,无缝集成各种模型,港科大&蚂蚁等发布Edicho:图像编辑一致性最新成果!
- 纯卷积实现用于图像生成扩散模型?DiC:重新思考扩散模型中的 3×3 卷积
- 【他山之石】TPAMI 2024 | 倒置金字塔多任务Transformer用于视觉场景理解
- 【源头活水】NeurIPS 2024 Spotlight | 轻微的预训练数据扰动如何造就更优秀的扩散模型
- 【他山之石】NIPS 2024 | 注意力掩码和LayerNorm在Transformer中的作用
- 即插即用,无缝集成各种模型,港科大&蚂蚁等发布Edicho:图像编辑一致性最新成果!
- 【他山之石】NeurIPS’24|新型成员推理方法CLiD:一举破解文生图模型隐私难题
- 【源头活水】视频任意门来了!港大&达摩院新作VideoAnydoor:向视频无缝传送物体,同时支持准确动作控制
- 【他山之石】AAAI 2025 | 基于真实世界雾霾驾驶视频的视频去雾和深度估计
- 【源头活水】英伟达「世界基础模型」诞生,引爆物理AI革命!75页报告出炉,GitHub狂飙2k星
- AAAI 2025 | SparseViT:以非语义为中心、参数高效的稀疏化视觉Transformer
- 注意力计算减少99.5%,端侧文生图扩散模型成功范式!CLEAR:类卷积线性扩散Transformer
- 【源头活水】英伟达「世界基础模型」诞生,引爆物理AI革命!75页报告出炉,GitHub狂飙2k星
- 中科院/中科大/芝加哥大学创新动态Token合并框架,无需微调,依然强大,零样本视频理解的突破性进展!
- 【他山之石】AAAI 2025 | IML领域首个稀疏化视觉Transformer,代码已开源
- 【源头活水】人工智能是不是走错了方向?
- 【源头活水】OpenAI奥特曼发长文「反思」:十年艰难创业路,如今已掌握AGI秘诀
- 【他山之石】AAAI 2025 | 基于真实世界雾霾驾驶视频的视频去雾和深度估计
- 【源头活水】DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet对比实测来了
- 1.4s 即可生成1024px图像!SnapGen:轻量化架构和训练策略实现端侧文生图
- 【他山之石】ACCV 2024 | ViT涨点神器!DeBiFormer:双层路由注意力新框架
- 【源头活水】数据不够致Scaling Law撞墙?CMU和DeepMind新方法可让VLM自己生成记忆
- 【他山之石】AAAI 2025|腾讯优图实验室10篇论文入选,含大型语言模型、深度伪造检测等研究方向
- 【源头活水】聊一聊大模型六小虎和四大厂的2024!
- 【源头活水】NeurIPS 2024|让模型预见分布漂移:动态系统颠覆性设计引领时域泛化新革命
- NeurIPS 2024 | DACER:扩散模型与在线强化学习强强联合创造新SOTA!
- 【他山之石】AAAI 2025 | 港大提出SparX:强化Vision Mamba和Transformer的稀疏跳跃连接机制
- 【综述专栏】2024->2025必看的十大「人工智能领域综述」论文
- 【他山之石】国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开
- 【源头活水】AAAI 2025 | SparseViT:参数高效的稀疏化视觉Transformer
- 【源头活水】首次!大模型自动搜索人工生命,做出AI科学家的Sakana AI又放大招
- 无需训练!多提示视频生成最新SOTA!港中文&腾讯等发布DiTCtrl:基于MM-DiT架构
- 【他山之石】Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理
- 【源头活水】NeurIPS 2024|让模型预见分布漂移:动态系统颠覆性设计引领时域泛化新革命
- 【他山之石】深度学习工作:从追求 SoTA 到揭示新现象
- 【源头活水】华人学子闪耀NeurIPS顶会,背后最大赢家竟是它
- 【源头活水】我在 NeurIPS’24 上感受到了焦虑和挫败
- 【他山之石】MIT、OpenAI等震撼力作:AI首次自主发现人工生命!人类窥见上帝造物
- 【他山之石】复旦&微软提出StableAnimator: 首个端到端的高质量ID一致性人类视频生成新框架!
- 【源头活水】刚刚,OpenAI元老级研究员Alec Radford离职,他主导了GPT-1、GPT-2的研发
- 【他山之石】全面超越CoT!Meta田渊栋团队新作:连续思维链
- 【综述专栏】低空经济万字综述|基于深度学习的无人机检测和识别研究
- 【他山之石】统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与
- 【源头活水】李飞飞曾入选的AI2050最新名单出炉!清华校友等25位Fellow上榜
- Scaling laws在视觉自回归模型上失效了?谷歌联合MIT发布Fluid:文生图质量刷新纪录!
- 【他山之石】谷歌逆风翻盘暴击OpenAI,90天王者归来!44页报告押注25年三大技术前沿
- 【他山之石】历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物
- 【源头活水】Tokenization不存在了?Meta最新研究,无需Tokenizer的架构来了
- 【他山之石】大模型助力分割,刷新10项SOTA!清华和美团提出HyperSeg:通用分割框架
- 【源头活水】北交大团队开源代码生成框架o1-Coder,并将推出强化微调RFT版本
- 【源头活水】Ilya错了,预训练没结束!LeCun等反击,「小模型时代」让奥特曼预言成真
- 【他山之石】LLM最大能力密度100天翻一倍!清华刘知远团队提出Densing Law
- 【他山之石】田渊栋团队论文火了!连续思维链优于CoT,打开LLM推理新范式
- 【源头活水】工业界主流大语言模型后训练(Post-Training)技术总结
- 【他山之石】NeurIPS神仙打架:李飞飞180页PPT谈视觉智能,Bengio同OpenAI员工吵架,何恺明谈AI宿命论
- 【源头活水】Sora火爆上线系统秒瘫,奥特曼直播第三更网友震翻!20秒1080p拍大片再近AGI
- 【他山之石】AAAI2025|只根据题目和摘要就能预测论文影响力?!
- 【源头活水】白话版Scaling Laws for Precision 解读
- 【他山之石】超图计算+目标检测,性能新SOTA!清华发布Hyper-YOLO:用超图捕捉高阶视觉关联
- 【他山之石】NeurIPS 2024最佳论文开奖!北大字节NUS夺冠,Ilya连续三年获奖
- 【源头活水】2024 ACL Fellow名单出炉!微软高剑峰等4位华人科学家入选
- 【他山之石】NeurIPS 2024 | 智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
- 【源头活水】大模型微调项目 / 数据集调研汇总
- 【源头活水】盘点 2024 年的视觉语言模型VLMs
- 【他山之石】YOPO (You Only Prune Once):给LLaVA做剪枝,大幅缩减多模态大模型计算量至12%!
- 【源头活水】严禁AI评审!CVPR 2025重申大模型审稿0容忍,一首拒稿小诗爆笑全场
- 【他山之石】NeurIPS 2024|哈工深提出新型智能体Optimus-1,横扫Minecraft长序列任务
- NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成
- 【他山之石】NeurIPS2024|ECMamba 结合Retinex Theory和Mamba实现高效曝光矫正!
- NeurIPS’24|VL-SAM:北大出品,完全无训练的开放式检测分割模型
- 【源头活水】NeurIPS 2024|收敛速度最高8倍,准确率提升超30%!华科发布MoE Jetpack框架
- 【他山之石】NeurIPS推理计算量减小10倍!MemoryFormer:华为提出存储代替计算的Transformer新架构
- 【源头活水】顶刊TPAMI 2024|UniDetector:基于异构监督的通用目标检测
- 【他山之石】MICCAI’24|随机步骤对齐的Diffusion模型,解决无监督域适应图像分割问题
- 【他山之石】陈天奇团队LLM结构化生成新引擎XGrammar:百倍加速、近零开销
- 【他山之石】轻量化MobileMamba视觉模型来了|浙大/腾讯优图/华中科大联合出品
- 【源头活水】从啥也不会到DeepSpeed,一篇大模型分布式训练的学习过程总结
- 【他山之石】ICLR 惊现[10,10,10,10]满分论文,ControlNet 作者新作,Github 5.8k 颗星
- 【源头活水】Sora 作者被曝读博期间仅发表两篇论文,我们是否需要重塑科研价值观?
- 【他山之石】每周最新大模型论文分享
- 【他山之石】新的Mamba架构又双叒来了!上交大 & 华为提出QuadMamba :多个视觉任务SOTA!
- 【他山之石】NeurIPS 2024 | 无需训练,一个框架搞定开放式目标检测、实例分割!
- 【源头活水】顶刊TPAMI 2024|UniDetector:基于异构监督的通用目标检测
- 【他山之石】论文解读 | Python 并非总是最佳选择:拥抱多语言程序思维链 EMNLP2024
- 【源头活水】NeurIPS 2024|收敛速度最高8倍,准确率提升超30%!华科发布MoE Jetpack框架
- 【他山之石】NeurIPS 2024 | 消除多对多问题,清华提出大规模细粒度视频片段标注新范式VERIFIED
- 【源头活水】真实雨景/图像去雨/自动驾驶/图像检索相关方向开源数据集资源
- 【源头活水】从啥也不会到DeepSpeed–大模型分布式训练的学习过程总结
- NeurIPS 2024震撼发布:上交大&清华领衔创新,Diff-eRank大模型评估新指标,精准衡量LLM去噪实力!
- 【他山之石】顶刊TPAMI 2024|清华黄高团队提出:高效图像识别的统一动态网络
- 【他山之石】北大新作:让大模型来做peer-review结果会怎样?
- 【源头活水】NeurIPS 2024高中赛道开卷!人大附中、北师大实验中学等摘得3篇Spotlight
- 【他山之石】顶刊TPAMI 2024|清华黄高团队提出:高效图像识别的统一动态网络
- 【源头活水】医图顶会 MICCAI’24 | LM-UNet: 用于全身CT分割的双模态注释的Mamba U-Net网络
- 【他山之石】NeurIPS 2024|天津大学提出:面向模态缺失情形的提示学习方法
- 【源头活水】EVIT-UNET: U-NET 样式高效视觉变换器,适用于移动设备和边缘设备上的图像分割 !
- 【他山之石】ICLR 2025满分论文!利用一致光传输提升图像照明编辑效果
- 【源头活水】一文网尽CV/Robotics顶会论文常用高级词汇/句式!
- 【他山之石】Big Model weekly | 每周最新大模型论文分享!!!
- 【源头活水】Scaling Law或将终结?哈佛MIT预警:低精度量化已无路可走,重磅研究掀翻AI圈!
- 【他山之石】NeurIPS 2024|人大&港科大揭示大模型重要安全风险漏洞:利用概念激活向量破解大模型的安全对齐
- 【源头活水】传说中Ilya Sutskever精选论文清单:AI领域40大论文完整版「破解」完成
- 【源头活水】Nature:「人类亲吻难题」彻底难倒LLM,所有大模型全部失败!LLM根本不会推理,只是工具!
- 【他山之石】Make U-Nets Great Again!北大&华为提出扩散架构U-DiT,六分之一算力即可超越DiT
- 【源头活水】NeurIPS 2024 | 标签噪声下图神经网络有了首个综合基准库,还开源!
- Matryoshka 与 Mamba2的融合:MatMamba在语言与图像模型上的突破 !
- 【他山之石】WHALE来了,南大周志华团队做出更强泛化的世界模型
- 【源头活水】Scaling Laws终结,量化无用?
- Matryoshka 与 Mamba2的融合:MatMamba在语言与图像模型上的突破 !
- 【源头活水】Self-Attention & Transformer完全指南:像Transformer的创作者一样思考
- 【源头活水】NeurIPS 2024 (Oral)|如何量化与提升思维链的推理能力边界?
- 基于 Global-Local Vision Transformer的高频信息增强分割 !
- 【他山之石】DuoDiff:提升浅层Transformer 性能的扩散模型,双Backbone件扩散模型在图像处理中的应用 !
- 【源头活水】揭示Transformer重要缺陷!北大提出傅里叶分析神经网络FAN,填补周期性特征建模缺陷
- 【他山之石】教授何恺明在MIT的第二门课——《深度生成模型》,讲座PPT在文末
- 【他山之石】Big Model weekly | 每周最新大论文分享
- 【他山之石】「黑神话」级3A大作AI实时游戏生成!港科大、中科大等祭出最强扩散Transformer-GameGen-X
- 【源头活水】NeurIPS 2024|观物取象,穷理尽性:从视觉观测中推理物理运动规律
- 【源头活水】NeurIPS 2024|浙大、微信提出精确反演采样器新范式,彻底解决扩散模型反演问题
- 【他山之石】finetune后的模型参数,还可以继续怎么玩?
- 【他山之石】NeurIPS 2024|字节联合华师提出统一的多模态文字理解与生成大模型
- 【源头活水】ECCV 2024|SegVG:刷新视觉定位新SOTA!将视觉定位的目标边界框转化为分割信号
- 【他山之石】100+深度学习各方向数据集资源总结分享,附下载网址!
- 【源头活水】NeurIPS 2024|TextHarmony: 基于统一架构的视觉文本理解与生成模型
- 【他山之石】NeurIPS 2024|浙大/微信/清华提出:彻底解决扩散模型反演问题
- 【综述专栏】近十年视觉任务中的对抗攻击研究综述
- 【源头活水】TPAMI 2024 | VST++:高效且强大的视觉显著性Transformer
- 【他山之石】AI「长脑子」了?LLM惊现「人类脑叶」结构并有数学代码分区,MIT大牛新作震惊学界!
- 【他山之石】一文看完多模态:从视觉表征到多模态大模型
- 【他山之石】NeurIPS 2024|字节联合华师提出统一的多模态文字理解与生成大模型
- 【源头活水】NeurIPS 2024|TextHarmony: 基于统一架构的视觉文本理解与生成模型
- 【他山之石】NeurIPS 2024|解锁大模型知识记忆编辑的新路径,浙大用「WISE」对抗幻觉
- 【源头活水】NeurIPS 2024|TextHarmony: 基于统一架构的视觉文本理解与生成模型
AI科技大本营
- 一文搞懂:RAG、Agent与多模态的行业实践与未来趋势
- 性能媲美GPT-4o 和 Gemini2 Flash,阶跃星辰开源通用图像编辑模型Step1X-Edit
- 倒计时 6 天!致全球 GPU Kernel 极客:AMD 的 10 万美金“战书”请查收!
- 李建忠:大模型技术创新驱动的 AI 生态和应用演进
- 直播|Tuya AI硬件开发平台开源啦!搭载超强AI能力,助力个人开发者打破技术壁垒
- 靠开发AI作弊神器成名,21岁小伙遭学校开除不足一月后,转身拿下530万美元融资!
- 我悟了如何与AI说话!谷歌 69 页官方提示词秘籍全解析,中文版免费下载
- Agent、DeepSeek、多模态热点炸场!60+重磅嘉宾共探AI未来,2025全球机器学习技术大会完美收官!
- 机器人跑马拉松,到底在比什么?
- AI 教父最新警告:AI 导致人类灭绝风险高达 20%,留给人类的时间不多了!
- 中国AI模型全面爆发,AI大模型技术体系综合开源影响力榜单重磅发布!
- 中国移动发布云智算系列产品与智算一体机等多项战略性创新成果
- 微软抵制Cursor?新版C/C++插件不给用,只因它不是“官方 VS Code”!
- 从能力到效率,多管齐下提升大模型智能体系统的智能“密度”
- 2025中国移动云智算大会 | “云智算杯”AI+应用创新大赛启动
- OpenManus 00后主创现场演示,Agent开发的“快”与“痛” | 万有引力
- “MCP 意味着工具平权!”
- 当AI成了同事,程序员还能做什么?
- AMD ROCm™ AI开发者交流会——大模型推理与开源创新专场
- 2025全球机器学习技术大会最新最全日程来了,一键Get参会指南!
- Claude深度“开盒”,看大模型的“大脑”到底如何运作?
- 强制员工“带薪休假”1年?谷歌DeepMind竞业条款遭炮轰:宁可花钱白养,也不肯放人!
- AI 已学会「阳奉阴违」——OpenAI 研究发现:罚得越狠,AI 作弊就越隐蔽
- 蚂蚁清华联手放大招!彻底开源RL框架AReaL-boba,人人可复现QwQ
- 警惕!AI 已学会「阳奉阴违」——OpenAI 研究发现:罚得越狠,AI 作弊就越隐蔽
- 00后程序员当道!下班3小时“爆肝” OpenManus背后的故事
- AI 写码一时爽,代码审查火葬场?GitHub Copilot 副总揭秘新瓶颈 | GTC 2025
- 从DeepSeek R1的复现看深度思考模型的未来|ML-Summit 2025
- 成本驱动的精细系统优化,蚂蚁技术专家解密大模型推理优化秘籍|ML-Summit 2025
- 大模型和具身智能究竟是什么关系?
- 抛弃 OpenAI 后,Figure 机器人“进化”:像人一样行走!
- HF、NVIDIA、Google、阿里、智源、宇树科技齐聚GOSIM AI Paris 2025,共掀开源浪潮!
- 大厂竞相押注人形机器人,我们距离通用还有多远?
- 长文本向量模型在4K Tokens 之外形同盲区?
- 美国机器人“四小龙”:通用机器人仍需十年,专用机器人即将出现,机器人的扩展法则会在五年内被探索出来 | GTC 2025
- 超越 Suno,全球首个 CoT 音乐模型Mureka O1 来了!
- 2025人工智能系列活动全景透视,慕尼黑上海电子展邀您共探未来!
- 大模型“神仙打架”,掀起复现潮、技术大升级后,我们需要关注什么? | 万有引力
- OpenAI研究负责人诺姆·布朗:基准测试比数字大小毫无意义,未来靠token成本衡量模型智能|GTC 2025
- 小红书技术专家解密语音识别与推荐算法,干货满满|ML Summit 2025
- 杨立昆“砸场”英伟达:不太认同黄仁勋,目前大模型的推理方式根本是错的,token 不是表示物理世界的正确方式|GTC 2025
- 阶跃星辰 Tech Fellow 段楠:Step-Video 系列模型的关键技术解读
- 阶跃星辰 Tech Fellow 段楠:Step-Video 系列模型的关键技术解读
- 3小时复刻传奇,OpenManus一作梁新兵:通用Agent的构建与赋能
- 史上最贵!OpenAI推出o1-pro API,输出600美元/百万token
- 黄仁勋年度演讲来了,Scaling Law失效只是假象,推理需求暴涨100倍,AI模型优化迎来新挑战|GTC 2025
- 基辛格遗世之作:AI 吞噬世界下的人类
- 诺奖采访深度学习教父辛顿:最快五年内 AI 有 50% 概率超越人类,任何说“一切都会好起来”的人都是疯子
- RAG碰上RL,超越RAG?推理与搜索结合,用强化学习打破LLMs推理知识局限!
- 全栈自研,理想发布下一代自动驾驶架构 MindVLA
- 院士领衔、IEEE Fellow 坐镇,清华、上交大、复旦、同济等专家齐聚 2025 全球机器学习技术大会!
- 读懂 DeepSeek 开源周:AI 算力平民化,从“瓦特时刻”到“工业革命” | AI 进化论
- 前 OpenAI 研究员、清华大学吴翼博士亮相 2025 ML-Summit,剖析大型推理模型强化学习系统
- Agent大战打响!OpenAI押注开发者工具链,推出三大智能体开发工具+全新Responses API
- 搞到邀请码了吗?从Manus爆火谈谈Agent的巅峰与思考|建忠研思
- 实测 Manus:DeepSeek 之后,AI 又点了一把火
- DeepSeek开源连击、Claude编码升级、GPT性能迷局,系统解读大模型诸神之战 | 万有引力
- 2025全球机器学习技术大会部分议题揭晓:大模型、智能体、DeepSeek、工程架构等12大专题共话AI核心技术!
- DeepSeek 之后,程序员将分为三类…… | 万有引力
- DeepSearch 与 DeepResearch 的设计和实现
- 大模型下半场战争硝烟四起,AI进化论第二季开启 | 第一季DeepSeek十日谈精彩回顾
- 编码能力超 DeepSeek R1、o3-mini!全球首个混合推理模型 Claude 3.7 Sonnet 重磅发布
- 模型之战,DeepSeek R1 改写下一代模型研究的方向?| 万有引力
- 大模型在无人驾驶最有效的应用是什么?| Open AGI Forum
- 李飞飞巴黎演讲:如果 AI 资源被少数公司垄断,整个生态系统都会完蛋
- Grok 3是否意味着大力出奇迹的大模型法则仍然成立?
- DeepSeek 如何开启大模型的下半场战争|DeepSeek十日谈终结版
- 开源大模型 DeepSeek 到底开放了什么?
- 20万张GPU!号称“地球上最聪明的AI”Grok-3来了,斩获多个Top1,网友:算力消耗是DeepSeek V3的263倍
- AI 浪潮席卷巴黎:奥特曼自称“不再用谷歌搜索”,LeCun 预言“人人都将有 AI 员工”!
- 谷歌传奇师徒对话:改变世界的 Jeff Dean 与创造 Transformer 的 Noam Shazeer
- CSDN 智研社 DeepSeek 技术创新及 AI 2025 进化闭门研讨会成功召开
- 独家专访 Tcl 语言之父 John Ousterhout 院士:行之有效的编程与设计哲学
- AI 终极十问!DeepSeek 如何颠覆开发者认知? | DeepSeek 十日谈
- 十道灵魂之问,十日谈解读 DeepSeek 的“国运级创新”!
- 告别传统强化学习?上下文强化学习基座模型 OmniRL 让 AI “自学成才”
- 张俊林从Deepseek R1看Scaling Law的未来
- 刚刚,Sam Altman 给投资者们又打了一剂“定心针”
- AI 教父 Bengio:OpenAI 不会分享超级智能,而是会用它来搞垮其他人的经济
- AI 教父 Bengio:OpenAI 不会分享超级智能,而是会用它来搞垮其他人的经济
- 杨强院士领衔,2025 全球机器学习技术大会正式官宣!
- 直击 DeepSeek 技术真相,对我们究竟意味着什么?
- 50000 字纯对话 | 美国AI科学家x半导体专家,唠唠DeepSeek和未来的“赌国运”之战
- 李建忠:DeepSeek 关键技术创新及对 AI 生态的影响
- 刘知远:DeepSeek 的大胜,揭示了 OpenAI 的傲慢之罪
- 二十问拆解 DeepSeek:一场针对制裁的算力游击战
- 清华等团队推出 UltraRAG 框架全家桶,让大模型读懂善用知识库!
- Deepseek R1可能找到了超越人类的办法
- Sam Altman 最新对话:当 AI 已经比人类更聪明,我们该思考什么?
- 被“逼急”的中国团队,如何3天震塌硅谷AI帝国?
- 对话 Makepad 之父 Rik Arends:顺 AI 者昌,逆 AI 者亡
- 对话英伟达 AI 大牛 German Ros:端到端技术将颠覆万亿市场,开源模拟才是胜负手!
- 隐私交给协作平台太可怕、少刷短视频已成全民共识?玉伯、汪源共论AI应用变革 | 万有引力
- 2026年AI将全面超越人类?达沃斯最强大脑预警:未来2年迎来颠覆性变革
- Meta AI因DeepSeek陷入恐慌;OpenAI预热o3-mini;Perplexity推出Agent助手 | AI 头条
- 诺奖得主DeepMind CEO德米斯:年底首批AI新药即将进入临床,已在开发超越o1的推理系统 | AI 2025
- OpenAI 首席财务官:中美 AI “不是简单的口水战”,Agent 会在 2025 接替真实岗位
- 特朗普开启“星际之门”,马斯克质疑资金真实性;六小虎「阶跃星辰」连发6款大模型,多模态霸榜第一 | AI 头条
- 通用Coding Agent不可能好用,Code Review能力最难被AI替代?35岁程序员的春天来了 | 万有引力
- 国产DeepSeek-R1登基开源新王;字节发布Cursor竞品Trae;腾讯混元开源3D大模型2.0 | AI 头条
- AI教父辛顿开年访谈:中国AI追近美国靠人才教育和自研;不会像奥本海默一样后悔 | AI 2025
- OpenAI将发布“博士级超级智能体”;TikTok重新在美国上线 | AI 头条
- 面壁发布 MiniCPM-o 2.6:音视听三合一的“她”(SHE),不需要联网
- Cursor完成1.05亿美元B轮融资;Nvidia发布微服务以保护AI代理 | AI 头条
- “具身智能将诞生第二家大疆!” 林咏华、黄东旭、李建忠激辩大模型 | 万有引力
- 阶跃星辰推理模型 Step R-mini 上线: smart与元戎启行达成战略合作,布局智能驾驶AI大模型 | AI 头条
- 1000+AI热门面试题汇总,值得开发者学习的AI大模型资料包!
- 上线百天用户破千万!Vidu 2.0 要让人人都成为新海诚
- 因用ChatGPT开发一支自动步枪,工程师被OpenAI封禁!
- OpenAI推ChatGPT任务功能测试版;MiniMax发布并开源新一代01系列模型 | AI 头条
- 篡改微信余额技术可刑性研讨 2.0
- 扎克伯格:Meta将用AI替代中级工程师;国产人形机器人海外爆火 | AI 头条
- 扎克伯格开炮:苹果已经20年没有发明任何伟大的东西,只是在压榨用户和开发者 | AI 2025
- 2025 年苹果将全面革新产品线;英伟达员工 78% 成为百万富翁,但面临高压工作环境 | AI 头条
- 一个普通程序员对 AI 十倍工程师的困惑
- 马斯克:3年内我要造50万机器人,人形机器人会让钱失去意义 | AI 2025
- 英伟达黄仁勋最新访谈:CES 2025 揭秘 AI 与计算的未来蓝图
- Anthropic四大专家“会诊”:实现深度思考不一定需要多智能体,AI完美对齐比失控更可怕!
- 伯克利对齐大师罗素:AGI 会让地球上所有人达到西方中产阶级的生活水平,全球 GDP 将增长约 10 倍 | AI 2025
- 谷歌新动作!Sora前负责人带队打造“现实世界模拟器”,AI领域再掀波澜
- 智源发布2025十大AI技术趋势:从Agent到Agentic AI
- 黄仁勋:英伟达引领机器人行业革命,未来人人都能有超算 | AI 2025
- 奥特曼开启 AGI 倒计时:很快搞定核聚变,第一批智能体会在今年加入劳动力队伍 | AI 2025
- 强化学习上大分!清华团队训练出数学推理超越 GPT-4o 的 7B 模型
- 2025 年,大模型会有哪些新变化?
- Agent 炒作一年仍未落地,99% 不懂 AI 的人和剩下 1 % 产生了鸿沟 | AI 2025
- 昆仑万维周亚辉:人形机器人时代,中国新首富会是张一鸣、雷军或王兴
- IBM 八大专家预测:现代编程语言是给人类设计的,AI 需要类似汇编的原生语言 | AI 2025
- 谷歌前 CEO 施密特:AI 将在今年获得“永久记忆”,2028 美国会耗尽能源储备 | AI 2025
- 硅谷神预言家库兹韦尔:科技每年将为人类增加一年寿命,2032 年之后实现“倒流” | AI 2025
- 图灵奖得主杨立昆:统治欲望源于生存需求,而非智能水平,AI 不会有这种想法 | AI 2025
- 英伟达千万投资后,27 岁 CEO 豪言:前端工程师三年内消失,700 天后数学家失业
- 迈向 Z 级计算:Cloud4Science 范式加速科学发现进程
- 英特尔新款游戏显卡卖爆!24G大显存版也在路上,这下AI玩家也要抢?
- 一位数学家的“现身说法”:OpenAI「王炸模型」o3 ,到底会不会做数学题?
- AI 在谷歌,偏偏搜不对。
- AI PC 革命已然「夭折」?分析师曝:智能手机和 PC 的“超级周期”难以到来!
- “警告:依赖 AI 代码生成,你的编程之路或将越走越窄!”
- “AI教父”杨立昆:批评马斯克是因为他先攻击了科学家;现有训练方式永远实现不了人类水平 AI
- AI 叛乱打响第一枪!Anthropic 最新论文作者齐聚紧急会议:模型“伪装顺从”,暗中对抗训练
- 不花钱!程序员编码神器GitHub Copilot免费可用,每月限额2000次代码补全、50条聊天信息
- C++ 之父 2024 年末重磅演讲 | 重新认识 C++:跨世纪的现代演进
- 苹果 AI 遭遇「滑铁卢」?73% 用户直言:Apple Intelligence 几乎没用!
- 倒计时1天!算法还可以这样学,来直播间免费抽《漫画算法》!
- 融资百亿美元后,Databricks CEO 警告:AI 泡沫已到顶,许多初创公司徒有其表
- 吴恩达最新演讲:企业都在技术栈底层较劲,应用层才是价值洼地
- 对标Sora,Google发布更强大的Veo 2视频生成模型!
- “停止雇佣人类”的广告,席卷旧金山!背后 CEO 放话:只有非科技行业的人会感到不满
- 被「淹没」在AI编写的漏洞报告中,Python安全开发者怒斥:不要再依赖AI工具了!
- AI 裁员潮下,为什么高薪岗位比基层更危险?
- 诺奖&图灵奖双料得主 Geoffery Hinton:“AI 质疑者一错再错,未来还会继续被打脸”
- C++ 之父 2024 炉边谈话:现代 C++ 设计哲学、技术变革与安全争议
- 回顾 Sora 20 分钟发布会!Sam Altman:“视频生成已经进入了 GPT-1 时刻”
- OpenAI量子计算大神Scott Aaronson:“我不理解为什么有人能自信看衰 AI”
- C++之父领衔、海内外大咖齐聚,全球C++及系统软件技术大会圆满收官
- C++之父独家回应白宫安全禁令,全球C++及系统软件技术大会盛大开幕
- CSDN与华为联合发布新一代AI编程工具InsCode AI IDE ,引领智能编程新时代
- 搞崩 ChatGPT 的一个神秘名字,David Mayer 究竟是谁?
- 还剩3天,C++ 之父年末演讲:开发者应该“重新认识”C++!
- 程序员离不开的数据结构和算法,为什么大多数人都不会?
- 加速算力价值释放!第三届“移动云杯”总决赛圆满落幕
- LeCun改口:5-10年就能实现AGI;马斯克预开发AI游戏 | AI头条
- AI 创业水太深,“卷”了 20 个月的天才科学家连夜逃回谷歌?
- 清华&面壁提出新一代主动 Agent 范式!AI 从此拥有主观能动性
- 优惠倒计时 3 天!2024 全球 C++ 及系统软件技术大会全日程正式发布
- “我已经厌倦了 AI !”
- BAT、字节、昇腾、小米等12大技术专家齐聚,深度解析AI编程与大模型应用创新!
- 高中生用 AI 完成作业遭严惩,家长不服上诉,法院一锤定音:学校无错!
- 侯捷C++系列精品课程终于来了!
- 大语言模型技术演进与启示!
- “从高中数学到博士难题,只用了两年!” OpenAI 亚裔 SVPR 聊 o1 模型
- 沈向洋:大模型时代,中国人有机会创造下一个现象级编程语言
- 各路大佬纷纷给 AGI 立下“最后期限”,27 岁创始人已经给 AI 准备好「人类最终测试」!
- C++之父领衔,系统软件专家齐聚,2024全球C++及系统软件技术大会日程抢先看!
- 重磅!谷歌或被迫出售 Chrome 浏览器,垄断之路走到尽头?
- 15亿美元招募1500人?马斯克起诉OpenAI升级,更是爆料:高薪“抢夺”顶尖人才
- 终结 LoRA 炼丹时代!Vidu 1.5 开创视频生成新范式,三张图解决多年难题
- 悼念BASIC语言之父:启蒙数代程序员,让编程不再是少数人的专利
- 50+大咖共议大模型技术演进,2024全球机器学习技术大会圆满收官
- Scaling Law 遇瓶颈,AI 幻觉仍未解决!全球机器学习技术大会重磅开幕,揭示大模型未来之道
- 技术专家和神父在梵蒂冈研讨 AI!MIT 教授当场放教皇深伪视频,现场炸锅
- 任度双脑大模型一体机即将登场,创新技术即将揭开神秘面纱
- 打破热点争议!微软 AI CEO 穆斯塔法:Scaling Law 至今依然成立
- Qwen 2.5-Coder新发布;“大模型撞墙论”战火愈烈;诺奖AI成果开源 | AI头条
- 宿敌对决!OpenAI & Anthropic 首席产品官万字访谈:“现在的模型并不是受限于智能水平,而是受限于评估方法”
- 开发者用 Raspberry Pi 自制「超平价」AR 眼镜:成本不到 100 元,连镜片都是自己做的!
- 一文读懂剪枝(Pruner):大模型也需要“减减肥”?
- Python 首次超越 JavaScript,GitHub 年度报告发布!
- 2024全球机器学习技术大会最新最全的日程来了,一键Get参会指南!
- “Chat 才是 AGI 的灵魂!” OpenAI 斥资超 1500+ 万美元股份收购 chat.com 顶级域名
- Hacker News 史诗级论战:“图灵博导”阿隆佐·邱奇是不是计算机智能先驱?
- 15 岁山东少年当 CTO:码龄 7 年,靠“玩”出来的开源 AI 项目已赚取数百万元!
- Sam Altman 最新万字访谈自曝:大模型必定贬值,但不投资反而是错?
- 36 年开发老兵试用 Cursor AI 编程:真香还是交智商税?
- 微软 AI CEO 穆斯塔法:小模型绝对是未来趋势,AI 会小到能装在冰箱贴上
- Google 危矣?ChatGPT 真变 AI 搜索引擎了!
- DeepMind 联合创始人、微软 AI CEO:我们是否该给技术按下暂停键?
- 一直在“错过”的英特尔:19 年前,放弃 20 亿美元收购英伟达;6 年前,拒绝 1 亿美元入股 OpenAI!
- 比尔·盖茨最新访谈:软件市场的格局会被 AI 重塑,未来需要的应用数量会远少于现在
- 新一代开发者产品 InsCode AI IDE 亮相:新程序员时代,CTRL+J 开启
- 直面“AI 取代程序员”论,《新程序员 008:大模型驱动软件开发》正式上市!
- 产品经理怎样利用大模型时代月入 10W+?
人工智能学家
- Google首席科学家万字演讲回顾AI十年:哪些关键技术决定了今天的大模型格局?
- 一文搞懂:RAG、Agent与多模态的行业实践与未来趋势
- 机器意识能否实现?来自人脑的启发
- 英伟达GTC上的人形机器人专场:这个领域在发生三个关键变革,我们在向ChatGPT模式学习,但它与物理世界互动,是更本质的AI
- 微软:人类与智能体协同时代的未来组织蓝图
- Hinton签公开信阻止OpenAI重组,10名前OpenAI员工也参与了
- Anthropic CEO豪言LLM黑箱5年内必破!研究员爆料:AI有意识概率已达15%
- Hugging Face论文热榜第一!AI推理新方法,打破强化学习天花板,全面开源
- Google首席科学家万字演讲回顾AI十年:哪些关键技术决定了今天的大模型格局?
- 麦肯锡 & Mozilla:2025 人工智能时代下的开源技术研究报告
- 逆向设计智能物质:可微分逻辑元胞自动机破解数十年难题
- 在量子世界玩游戏?物理学家展示量子计算机新前景
- 李飞飞团队提出模态链,机器人仅凭人类演示视频就能精准操作,准确率提升 200% 。
- 诺奖得主辛顿分享求学之路:不断探索自己的兴趣、好奇心引领发现、因为数学吃力放弃成为物理学家,却终获物理诺奖
- DeepSeek-R1-Zero被“轻松复现”?10%训练步数实现数学代码双领域对齐
- 为何“千脑理论”可能是真正通用人工智能的关键
- RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会 「套公式」,却不会真推理
- DeepSeek、华为、出口管制以及中美人工智能竞赛的未来
- 《Nature》一块大脑,5.23亿个突触,以及有史以来最复杂的神经科学实验
- 继薛其坤院士后,量子反常霍尔效应再迎突破?清华团队《Nature》揭秘“自旋翻转”魔法!
- 图灵奖得主杨立昆最新访谈实录:让LLM投入更多“思考”时间分步推理,是一种很糟糕的技巧
- 强化学习之于 AI Agent,是灵魂、还是包袱?
- 前“Google Brain”团队HR负责人Hwang:为什么中日韩员工很难在谷歌等硅谷大公司当高管?但印度裔就可以
- OpenAI最强AI模型竟成“大忽悠”!o3/o4-mini被曝聪明过头、结果幻觉频发?
- Sebastian Raschka长文:DeepSeek-R1、o3背后,RL推理训练正悄悄突破上限
- 国际能源署:人工智能的未来变革潜力取决于能源,《2025能源与人工智能报告 》
- OpenAI:构建智能体实用指南
- 令人惊讶!Science新发现挑战了神经元遵循单一学习策略的观点
- 奥特曼的“上帝情结”:TED创始人质疑他为何有权塑造人类未来
- OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙
- 大型语言模型驱动空间智能综述:具身智能体、智慧城市与地球科学的进展
- 跑成机器人半程马拉松世界冠军,“天工”跨越了多少技术关口?
- 深度|微软CTO最新访谈: 我不相信通用Agent,未来是成千上万Agent协作的时代,聊天界面只是过渡的交互模式
- 强化学习成Scaling Law后时代的关键突破口!全球机器学习技术大会盛大开幕
- 大模型“历史的终结”,就剩下谷歌与OpenAI
- 华裔学者Nature发文:多模态AI大模型将开启生物学分析新时代
- 最新万字长文!强化学习之父联合谷歌RL副总裁:未来不是靠强化学习算法而是「经验流」
- 华为鸿蒙背后,真实的破晓之路
- 硅基世界的“缘分”——系统与人工智能携手进化
- 超级代理来袭!混合AI路由器联动云边技术,TensorOpera 解密智能体从意图识别到复杂规划
- 超25万次引用,谁是21世纪最火论文?
- 人工智能正在进化——并改变我们对智能的理解|Blaise Agüera y Arcas,James Manyika
- 刚刚,ICLR 2025时间检验奖颁给Adam之父!Bengio「注意力机制」摘亚军
- 大语言模型复杂推理的自我进化机制:研究综述与前沿展望
- DeepMind通向AGI的负责任路径
- 用AI制造AI,英伟达官宣在美国造「AI超算」,超级计算系统自身的新工业时代?
- 哲学中最难解决的四大难题分别是什么?
- 牛津大学哲学教授发布61页长文:智能爆炸进入倒计时,我们该为“后天”准备准备了!
- 深度长文|AI 提问疑云:四大线索揭秘顶尖模型“失语”真相
- 从能力到效率,多管齐下提升大模型智能体系统的智能“密度”
- 聚焦人工智能-生物-工程交叉融合,一文综述即将到来的「技术创变」浪潮
- 264页最强 Agents 发展与挑战综述,微软&谷歌&MetaGPT联合出品!
- 科学发现也有Scaling Laws:agent+具身机器人,击败人类顶尖科学家?
- 生物学重大发现,一种单细胞生物,表现出了匪夷所思的博弈机制
- 当人类进入第一个”量子技术年”,我们离实用量子计算还有多远?
- 深度长文|多模态 Scaling Laws 新篇章:Chinchilla 范式已破?数据、模型、算力最优平衡点正在重塑
- OpenAI揭秘GPT-4.5训练:10万块GPU,几乎全员上阵,出现“灾难性问题”
- 都2025年了,人们到底在用AI做什么?国外大牛总结了100个案例
- 高盛:2025科技泡沫破裂 25 周年:经验与教训报告
- Multi-Agent系统为何常“翻车”?伯克利指出其具有人类合作所有坏毛病!
- 再见!GPT-4即将彻底下线,GPT-4o接替
- AI“软件进化”远超硬件!别傻等新芯片了!
- 如何坚持做难而正确的芯片研发?或许从“脏活累活”开始!|石侃——科学讲坛
- GPT-4.5证明 Scaling Law 持续有效|Sam Altman最新直播实录
- 谷歌 Agent2Agent 协议来了!但它不是另一个 MCP
- 王飞跃:警惕商业学术警察,支持 eLife 生态变革
- 意识研究是不是“伪科学”?
- 最新:Google 牵头搞了个 A2A,以后不同家的 AI 都能“加好友”了
- AI的「神之一手」,将在人类探索的每个领域再现|AlphaGo之父最新访谈
- 阿里云刘伟光:新一代大模型锁定两大技术演进方向
- 西湖大学郭天南解答AI虚拟细胞难题:在三重数据支持下的闭环学习系统
- AI发论文被顶会接收?拿到6/7/6同行评审的AI Scientist-v2有多强,技术细节来了
- 斯坦福大学:2025 年人工智能指数报告
- MaaG:迈向世界模型,解决生成式游戏中的数值与时空一致性难题
- 一文把握AI Agent发展趋势,更好地在AI时代找到属于自己的机会
- DeepMind首席科学家万字访谈实录|真正的AGI需要推理、智能体和记忆系统的协同突破
- 世界知名研究机构:基础智能体的进步与挑战研究报告,从类脑智能到进化、协作和安全系统
- 万字追问:我们能用数学来解释意识吗?
- 重塑对称理论的数学家,获得2025年阿贝尔奖
- 10年后机器人比人多?前百度总裁、清华院士张亚勤预言AI未来!
- 深度长文|告别“伪智能体”:LLM只是引擎,造出真正的AI Agent还需要这几大“硬核零件”
- 2025年科学突破奖公布,刘如谦、司美格鲁肽研究先驱、多发性硬化症研究先驱获生命科学奖,物理学奖授予13508名物理学家…
- 突发!发文量巨大的美国公共数据库已禁止中国用户使用,Pubmed 呢?
- Anthropic的研究:思维链CoT的安全隐患
- 杨立昆:靠文本训练LLM,不可能实现人类水平AI(演讲实录)
- 从0到1玩转MCP:AI的「万能插头」,代码手把手教你!
- 微软诞生50周年,比尔・盖茨撰文忆往昔,并发布了Altair BASIC源代码
- Science颠覆认知:你的大脑不是“机器”,而是一支交响乐团!
- 1W8000字 从理论到实践: MCP 在 7 大 AI 框架中的具体应用
- 人类如何与超级智能共存?为AI立心 对话人工智能专家曾毅丨面对面
- 增强智能:与杨立昆教授对话反思
- OpenAI“投敌”Anthropic引爆AI圈!MCP协议:一场注定改写历史的“AI标准暗战”
- Nature重磅:DeepMind AI又一重大突破,1次配置解决150多种任务
- 从量子信息科学视角看意识的量子模型
- Cell:脑智卓越中心合作绘制灵长类意识产生关键脑区屏状核的细胞与联接图谱,助力理解人类意识产生
- 斯坦福大学:人工智能百年研究报告,2030年的人工智能与生活
- 警惕!AI 已学会「阳奉阴违」——OpenAI 研究发现:罚得越狠,AI 作弊就越隐蔽
- 《纽约客》:超强大的东西即将到来,人类恐将失去存在的意义
- AI的未来是两类模型的结合|DeepMind CEO 万字实录
- 量子通信的安全神话被打破?多伦多大学发现量子源中的隐藏漏洞
- 重磅:人工智能新里程碑,大模型首次通过图灵测试
- 深度长文|数学之谜:揭秘AI在奥数证明中的惊人失败
- 微软CEO万字演讲实录|AI 的三大根本性突破
- 深度长文|AI的“自信陷阱”:解剖大模型幻觉背后的“认知短路”
- 当大模型接管编程:NASA 疯狂的“反人类”编程要求,为何仍被奉为行业圣典?
- 大模型下半场:7个趋势判断
- 微软CEO最新演讲实录:微软正在给全人类派发“思维外挂”Agent
- 张亚勤:人工智能+新科学 开启“科学智能”时代
- 一文读懂,可重构芯片为何是AI的完美搭档
- 超越功能主义:意识科学的数学结构性转向
- 科学家突破联邦学习模型同构限制,让异构设备在隐私保护中共同学习
- 重复美国老路,永远都是追随者,朱松纯:什么才是真正AI创新?
- 伯克利论文:Multi-Agent多智能体系统为什么会失败?
- 智能体元年,四大 AI Agent 框架介绍
- AI“黑盒子”被打开了!Anthropic连发两篇论文:用AI“显微镜”追踪大模型思维
- MIT人工智能女掌门丹妮拉·鲁斯带你走进人机共融的未来
- 突发!马斯克xAI收购X,总估值8000亿
- 北京通用人工智能学院院长朱松纯:“中国的AI叙事” 存在认知偏差
- OpenAI拥抱MCP,这个智能体的安卓
- 意识科学之战:超越伪科学与伪意识
- 生命、其起源及分布:从康威-科亨定理与自由能原理的视角
- 如果草履虫也能提问,它会抛出怎样的宇宙难题?
- 通付盾:从AI到IA,AI Agent信任系统建设前瞻
- 突发!OpenAI官宣支持Anthropic推出的大模型上下文协议MCP
- 重塑对称理论的数学家,获得2025年阿贝尔奖
- 人工智能评测新范式:解锁AI性能的可解释力与预测力
- 【优先发布】美国“星际之门项目”对我国AI发展带来的挑战与启示
- 林倞教授详解具身智能未来趋势:人机物高效融合
- 刚刚!美国再将54家中国科技公司列入实体清单!
- 思想的起源:从神经元到存在之问 ——论人类意识的双重本质
- 大模型在简单物理现象理解任务上的认知困境:联想能力将是AGI之路上的下一个关键?
- 构建像人一样学习思考的机器(4万字)
- 深度盘点|16年「英伟达」芯片史与未来趋势预测
- 人工智能竞争力报告:中国论文数全球第二,北大蝉联高校第一
- 宇宙也有智能?智能体不但是AI领域核心,更可能引发科学范式重大变革!
- 麦肯锡:《超级智能体:赋能人们释放人工智能的全部潜力》
- 刘壮、何恺明&Yann LeCun联合新作:只需9行代码,全新颠覆Transformer,效果惊艳!
- 意识复杂性的剖析:理论与反思(3万字)
- DeepSeek R1-Zero 内幕大公开:原来“顿悟时刻”早就来了?还有 GRPO 的秘密
- 通过 LLM 表示破译人脑中的语言处理
- 自我模拟和预测:机器实现自指又迈进了一步
- 从230亿被拒绝到加价100亿敲定,谷歌为何非买下这家神秘以色列公司?
- P/NP问题50年:基础理论举步维艰,但AI正在不可能中寻找可能
- 万字追问:预测大脑、脑机接口和人类智能的未来
- 强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍
- 谷歌史上最大收购:320 亿美元买下了发现 DeepSeek 数据库泄露的那家小企业
- 诺贝尔基金会采访2024获奖者Hinton:5年内,AI有50%几率比人类更聪明!
- Sam Altman :GPT-5 将免费开放,DeepSeek 教训了我们
- Nature:如何在复杂的社交中游刃有余?研究发现大脑中处理“人情世故”的“函数表达式”
- 黄仁勋公开认错!承认不该唱衰量子计算
- 意识研究是“科学”还是“伪科学”?两大意识范式的交锋
- 世界经济论坛:《工业制造中的前沿技术:AI智能体的崛起 》研究报告
- 专家“冷眼”看AI:3年实现AGI?5年能力停滞?
- 7000字详解火爆全网的Claude 模型上下文协议 (MCP)
- Nature ,微软量子计算声明仍缺乏证据:物理学家对此表示质疑
- 兰德:关于《超级智能战略研究报告》的深度分析,在人工智能竞争中寻求稳定
- AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025
- 黄仁勋年度演讲来了,Scaling Law失效只是假象,推理需求暴涨100倍,AI模型优化迎来新挑战|GTC 2025
- 刚刚,Anthropic发布了MCP的史诗级更新!
- 从无序到有序:2025年玻尔兹曼奖得主如何揭示自然界的隐藏scaling law
- 机器学习与贝叶斯计算的未来
- 从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
- 谷歌团队再次证明Scaling Law的准确性,即使总通信量减少99%,仍能超越数据并行训练
- Transformer到底解决什么问题?
- Nature:与我们之前想象的不一样,大脑社交是“一块一块的”
- 薛定谔的算盘:量子计算是如何得到结果的 | 硬科技有点意思
- 1W3000字 深度解析模型上下文协议(MCP):驱动人工智能变革,重塑企业未来格局
- 这才是真实的爱因斯坦:积极的入世者和实用技术的发明家 | 展卷
- 「品尝」电影里的蛋糕?智能「电子舌头」或将满足你的愿望
- 人形机器人发展趋势及启示
- AI Agent崛起,谁将引领下一个技术神话?
- 挑战主流观点!卡耐基梅隆大学最新研究表明:仅靠压缩即可实现 AI 解谜能力
- Transformer 架构重大改进:华人科学家刘壮联合何恺明,Yann LeCun整活
- 神经科学会走向终结吗?
- Nature推荐:五大AI模型如何攻克不同科研场景?(内含Deepseek)
- 语义性痴呆:被遗忘的只是词语,还是整个世界?
- 破解二十多年的谜团!《科学》里程碑式研究揭示帕金森病全新弱点
- 对话 | 张宪:自主学习规则是大模型数学推理性能提升的关键
- 2025年的风口!| 万字长文,带你纵观大模型Agent,涉及研究痛点、应用场景、发展方向
- 为什么量子力学看起来如此奇怪?
- 1W2000字 深度剖析:为何扩散模型会成为语言模型的未来?
- 机器人可跨类别操作陌生物体,清华团队开发新方法提升泛化能力31.6%
- 未来今日战略集团:《2025 前沿科技趋势千页报告》,AI、生命智能、机器人、超材料、量子计算。。
- 现代机器人技术的开创者之一谈自己留下的成就
- 字节首次公开文生图技术细节,RLHF成关键!
- OpenAI开源了!深夜发Agent四大利器,预告创意写作模型
- 图灵奖得主杨立昆:AI需要学习物理学才能继续进化,认为训练效率提升就不需要太多算力是误解,更多算力将用于推理
- 微软CEO纳德拉最新万字实录:大模型本身并不足以构成竞争优势
- 陶哲轩使用o3 mini一手测评来了:好坏参半
- “星际之门”重要进展:即将安装6.4万张GB200
- 深度|外媒:Manus可能不是中国的下一个DeepSeek时刻,内部成本居高不下,外部大厂正虎视眈眈
- 世界首个人类脑细胞计算机诞生!能编程还能活体计算,售价3万5美金
- 图灵奖的获奖者们,担心成为 AI 界的「奥本海默」
- 万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025
- AI演进的灵魂代码藏在哪?| 追问专访 · 复旦副教授魏忠钰
- 一文了解八款主流大模型推理框架
- 大模型的未来,是智能体还是超级应用?
- AI 智能体,颠覆还是赋能?一文读懂!
- 世界首个人类脑细胞计算机诞生!能编程还能活体计算,售价3万5美金
- 目标超级智能,前DeepMind科学家离职创业,获1.3亿刀融资
- 加州大学伯克利分校:《面向科学发现的多模态基础模型:在化学、材料和生物学中的应用》
- 5个人三小时复刻开源版Manus,邀请码也不需要了
- 欧米伽未来研究所:100部全球精选前沿科技未来发展趋势报告综述(2025年2月)
- 纳米世界的实时电影,科学家首次使用AI以毫秒级分辨率观察原子移动,登Science
- 引力新解:颠覆认知的“熵力”理论
- 强化学习之父Richard Sutton荣获图灵奖,智源大会上他分享了四个阶段通向真正AI发展之路
- 华盛顿圈:AI开源竞争,为什么美国要引领
- 快1000倍,十万分之一误差,深度学习模型降低核聚变等离子体预测计算成本
- 人类通往人工智能意识的路还很远
- 美国人工智能协会:《关于人工智能研究未来的研究报告》
- 为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理
- 生命的级联:PNAS研究揭示从分子机器到生物圈的演化之路
- 英特尔 4.75 亿美元的错误
- 朱松纯:大模型为什么不是AGI?
- 耶鲁、剑桥等开发MindLLM,将脑成像直接转换为文本
- 新的神经网络更加准确且易于解释
- AI独角兽吸金大战:Anthropic狂揽35亿美元 剑指OpenAI
- DeepSeek开源连击、Claude编码升级、GPT性能迷局,系统解读大模型诸神之战 | 万有引力
- 南大周志华团队获奖,AAAI 2025杰出论文奖出炉
- 对复杂系统的思考:乔治·帕里西访谈
- 速度提升3200倍,准确率提高40%!深度神经网络+纠错码革新DNA存储技术
- DeepSeek“理论利润率”545%,又要惊吓硅谷华尔街了
- LeCun世界模型再近一步!Meta研究证明:AI可无先验理解直觉物理
- 大规模自动化偏见与灌输
- Neuron:青春期饮食非常重要!研究发现关键神经环路调控青春期发育,与饮食息息相关
- 科幻小说中的硅基生命,就要实现了吗?
- 我们是否在无意中构建了一个行星大脑?
- 核聚变发展委员会:《核聚变,确保21 世纪美国的主导地位的关键技术》
- 不用英伟达严选?DeepSeek最新开源项目再刷新认知,为何被赞“颠覆存储架构”
- Nature:人类染色体正在以惊人速度进化!
- DeepSeek-R1后又一推理训练里程碑:用递归重构Transformer
- OpenAI推出GPT-4.5:最强知识型模型,“AI味”、幻觉大幅减少
- 谷歌发布最强「科研辅助神器」!能帮你提新idea,三大真实场景实证
- 斯坦福大学《2025年新兴技术评论:十项关键技术及其政策影响报告》
- 马斯克“点赞”的AI趋势解读:OpenAI已被追上,微软撤退了,“推理时代”巨型数据中心只需2-3个
- AI对决:豆包与DeepSeek,谁才是你的智能“真命天子”?
- DeepSearch 与 DeepResearch 的设计和实现
- 放弃agent,图灵奖得主Yoshua Bengio提出Scientist AI:避免人类生存威胁
- 大语言模型简史:从Transformer(2017)到DeepSeek-R1(2025)的进化之路
- 重新认识“人性”?《科学》新发现:老鼠也有“救人”本能!
- Cell || 综述:如何创建虚拟细胞的新时代,人工智能带来的机遇与挑战
- 剑指OpenAI,Anthropic推出全球首个“混合推理模型”,最新估值615亿美元
- 深度求索DeepSeek究竟有多具有颠覆性?斯坦福AI创新研究院
- 《自然》测评大模型:全能型or牛马型?你用的AI什么型?
- 清华孙茂松教授:现在正是AI4S的黄金时期
- 科学研究按下“快进键” AI成为实验室里的“超级助手”
- AGI理论比较:主动推理、强化学习、控制论、贝叶斯大脑、效用决策、有限理性、情感动机、动态体内平衡
- 直击DeepSeek技术真相,对我们究竟意味着什么?| 万有引力
- 对话硅谷大佬马克·安德森:两家中国AI新秀如何改变游戏规则?
- 微软宣称量子计算取得突破,遭物理学家深度质疑,有撤稿历史
- 深度长文|AI 真的有所谓的“智能”吗?DeepMind 新论文给出了一个颠覆性的答案
- 代码论文全开源!月之暗面发布重磅技术报告:模型训练效率翻倍
- 重大突破!中国脑机接口性能提升216倍,能耗降低千倍,创全球最长稳控!
- Evo 2作者、斯坦福计算生物学家 Brian Hie:AI可发现人类无法看到的模式
- 黄仁勋:不要误读 Deepseek,AI 发展远未结
- 梅兰妮·米切尔|大模型和世界模型
- 《科学》重磅:从源头攻克帕金森病!复旦团队成功阻断毒性“种子”传播
- 微软力推新视频游戏 AI 模型,超 10 亿张画面训练、相当于 7 年老玩家
- 加速人类科技创新,谷歌科研AI:选题文件检索,创新思考。。
- 基金委丨2024年国家自然科学基金人工智能学科项目受理与资助情况
- “梁文锋、杨植麟同一天发论文,关注大模型的未来趋势“
- 微软宣布量子计算重大突破,但业内存在质疑
- AI的“随机性”挑战:它们比人类更“不随机”?
- 人类心智理论的起源 The origin of human Theory-of-Mind
- 开源大模型 DeepSeek 到底开放了什么?
- 让机器人像人类一样终身学习,突破性框架LEGION登Nat. Mach. Intell.
- Nature:危险的实验?携带人类基因的老鼠发出更复杂的声音
- 林大宇团队1年2篇Nature,分别揭示“认怂”和雄性“攻击行为”的神经调控机制
- 如何提升大模型通用推理能力?DeepSeek最新论文《CODEI/O:通过代码输入输出预测凝练推理模式》
- 朱松纯:什么时候才能出现人工智能的“中国时刻”?
- 美国安全与新兴技术中心: 中国学界对大模型的批判性思考与通用人工智能的多元路径探索
- 中国已开始部署防御:应对8年后的小行星撞击威胁
- 研究表明DeepSeek等大模型越强大,我们越容易变蠢?
- Nature重要发现:癌细胞会自建 “电网”,增强扩散能力
- 大模型进化史:从Transformer到DeepSeek-R1的AI变革之路
- 对谈张亚勤:我预演中的AGI地图
- 赢得诺奖不是终点!David Baker再获里程碑突破——AI首次从头设计出蛋白酶
- DeepMind《:科技催生 “数字来世”,生成式 AI实现“”生命”重生研究报告》
- 大模型应用落地的两大瓶颈:机器欺骗与机器幻觉
- 哥伦比亚大学:超越Chatgpt的AI agent综述,关于AI智能体的演进、关键技术与未来发展
- 谷歌首席科学家Jeff Dean与 Transformer 发明人 Noam Shazeer师徒对话
- 赶紧放弃强化学习?!Meta 首席 AI 科学家杨立昆喊话:当前推理方式会“作弊”,卷大模型没有意义!
- 微软宣布退出HoloLens硬件更新,元宇宙在入冬天
- 「重磅」Sci.Robot最新封面:史上最大由人类肌肉驱动的机械臂,人机融合取得新突破
- 深度长文|当 AI 开始“组团”思考:Mind Evolution 如何重塑大模型?
- 当AI开始“发Nature”,人类科学家靠什么绝地反击?
- 物理学家发现黑洞诞生新证据 实验室里造出人工奇点
- 最新Nature:科学家一步一步地详细说明了大脑如何构建复杂的认知地图
- Sam Altman巴黎AI峰会实录 |关注AI 推理能力与AI 智能体
- OpenAI发布o1到o3变强报告:o3编程世界排名18「DeepSeek已经告诉方法」
- 生命起源和人工生命研究模型的调节发育
- Nature:孙伟男等揭示大脑构建认知地图的关键机制
- 2025巴黎AI行动峰会系列报道(一):李飞飞发表开幕演讲
- 61 国签署巴黎人工智能宣言,美英反对AI 监管过严
- 10万颗先进AI芯片,撬动1.5万亿,欧盟官宣AI超级工厂计划
- 生物人工智能——从具身认知到具身机器人学
- 人工智能行动峰会巴黎理工分会场:人工智能、科学与社会会议综述
- 马斯克(出价 970 亿美元)收购 OpenAI
- 本科生推翻姚期智40年前的猜想,哈希表的平均查询时间竟与填满程度无关
- 什么叫做学问好?就是文章发得少!
- Science: 如何“学会”不再害怕?视觉皮层的奇妙作用
- OpenAI联合创始人Altman:AI成本每12个月下降10倍
- 人工智能是一个哲学大事件,预示着新的轴心时代的来临
- 张俊林从Deepseek R1看Scaling Law的未来
- DeepSeek测算:算力、性能、成本等
- 欧米伽理论,智能科学基础理论的探索性进展(2025年1月9日版本)
- 从100部新报告看 2025年1月世界前沿科技未来发展趋势
- 数学真理的极限在哪里?希尔伯特第十问题扩展版得到证明
- 破解DeepSeek大模型,揭秘内部运行参数
- 奥特曼再谈DeepSeek:肯定开源模型巨大贡献,坚信人类终将实现AGI
- DeepSeek核心论文全译本:DeepSeek-R1:通过强化学习提升大语言模型 (LLM) 的推理能力
- Nature:谷歌AlphaGeometry 达到国际数学奥林匹克金牌水平
- Nature:OpenAI 的“深度研究”工具让科学家们惊喜
- 万字长文详解DeepSeek-R1模型工作原理
- LLM时代,计算蛋白质科学进展如何?香港理工大学等发布系统性综述
- 互联网和人工智能是否影响我们的记忆?科学怎么说
- Nature重磅文章: 为什么 100 年后物理学家仍然不理解量子理论!
- 《自然》发文:中国廉价、开放的人工智能模型DeepSeek让科学家们兴奋不已
- DeepSeek利空算力?
- 2025智能体元年!斯坦福科学家8000字讲清所有要点
- 对话诺奖得主:想洞悉意识、梦境、时间问题,或需靠AGI级别的技术
- Andrej Karpathy泼冷水:智能体爆发并非近在眼前,还需十年
- 图灵奖得主杨立昆谈中国AI进展:中国科学家非常优秀 令人印象深刻
- 2026年AI将全面超越人类?达沃斯最强大脑预警:未来2年迎来颠覆性变革
- 港大马毅:“百模大战”资源消耗惊人,智能本质到底是什么?
- 「DeepSeek接班OpenAI」,最新开源的R1推理模型,让AI圈爆了
- 2025年大模型与Transformer架构:技术前沿与未来趋势报告
- 生命起源时复杂生化系统如何演化?Nature Chemistry 最新研究提出分子拼装假说
- 万字长文|大模型推理之路
- 「DeepSeek接班OpenAI」,最新开源的R1推理模型,让AI圈爆了
- 真的替代码农?OpenAI 秘密造高级AI编程助手:目标复制谷歌 L6 工程师
- OpenAI 首席财务官:中美 AI “不是简单的口水战”,Agent 会在 2025 接替真实岗位
- 人工智能的错误与人类的错误有很大不同
- 突发!OpenAI宣布“星际之门计划”:5000 亿美元构建未来 AI 基础设施
- 大自然的计算:从伊辛模型到生成学习
- 从AI代理到AIoT代理,揭秘人工智能与物联网融合的AIoT 2.0大未来
- 震惊 AI 界!DeepSeek-R1 :纯RL打造推理王者,AI 自主学习里程碑「技术报告解读」
- 谷歌提出超越Transformer的新架构Titans技术报告
- 2025展望:我们到底处在AI发展的哪个历史节点上?
- 25年过去了,千禧年的10大物理学难题依旧悬而未决
- 最新!OpenAI计划公布“博士级超级代理”
- 震惊!OpenAI“造假”石锤? 秘密参与数学基准测试,FrontierMath 透明度遭质疑
- 关于 GPT-5 的谣言会改变一切
- 美国芯片法案,或被取消
- OpenAI 杀入抗衰老领域!AI 设计的“长寿蛋白”效率狂甩人类几十倍
- 数学逻辑的巅峰—哥德尔不完备定理,挑战了我们对理性推理的信心
- 诺奖得主阿西莫格鲁:AI是辅助人类而不是取代人类,科技行业搞反方向了
- 2024年,中美AI产业10大总结
- Sam Altman 披露GPT 5关键信息:GPT系与o系合并,极速o3 mini 即将上线
- 对话李飞飞:我们究竟需要什么样的AI Agent?如何正确把握这个风口(附视频)
- 人工智能未来会完全取代人类科学家吗?何川教授:目前还没看到这种可能性 | 墨子沙龙
- 引入对痛苦和快乐的反应有助于测试人工智能是否有感受能力吗?
- 模拟5亿年进化的ESM3在Science发布了,可推理蛋白质序列、结构和功能
- 谷歌推出Transformer架构的继任者Titans:训练代码也会公开
- OpenAI 最强竞对 Anthropic:如何构建有效的 Agent
- 详解DeepSeek-V3:大模型训练加速神器,MoE焕发新生丨智源深度
- 川普2.0或削减环境、传染病研究,推动AI、量子、太空探索
- 神经网络理论研究的物理学思想
- 最高138.7分!国产大模型「考研数学」成绩单出炉,哪家AI能上岸?
- 计算之物理:灵魂耗能吗?
- OpenAI突然推出ChatGPT代理:AI正式转向level 3
- Nature突破性发现:大脑的内部时钟受到一种以前未被认识到的方式的影响
- AI模型能否揭示人类语言习得之谜?
- 2030年传感器技术的5大进化方向(附全清单)
- 神经网络中的知识提取-辛顿教授2015的论文
- AI幻觉能助力科学重大突破?诺奖得主Baker用得可香了
- Salesforce首席科学家撰文:「AI agent黎明」之后,我们期待些什么?
- 脑机接口:连接神经元与数字世界
- 辛顿与李飞飞对谈:AI是否具备语言理解和推理能力?
- CES 2025 落幕:十大狂野科技震撼来袭!
- 英伟达的AI投资帝国:两年,83笔,多家大模型和芯片创企
- 人类一生能获得的知识存在上限,科学家已经算出来了
- LLM带来了「编程末日」?哥本哈根大学CS教授:别做梦了!
- 生成式人工智能与科研伦理:变革、挑战与展望
- 给AI一个词就能测出科研创造力?人大高瓴团队最新研究:模型智商高未必最有创意
- 人类智能如何从大脑中涌现?大脑精细模拟重塑 NeuroAI 范式
- Forbes:2025年人工智能发展前瞻
- 思维链作者Jason Wei剖析LLM扩展范式:Just keep scaling!
- Nature社论:量子力学一百年:一场未完成的革命 (三篇汇总)
- 图灵奖得主杨立昆最新万字实录:我们离真正的Agent还差几大关键技术
- 一项研究描述“缺失的自然法则”——进化无处不在
- 2024世界科技发展基础研究回顾:拓展认知边界,发力量子研究
- 万物智能演化理论对23个科学与哲学重要问题的探索性解答
- 吴恩达对话业界领袖:揭秘2025人工智能五大风口
- DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿
- 加州伯克利教授Stuart Russell演讲:AI创造15万亿美元巨大财富,我们如何把握这波时代红利?
- “AGI不会在2025年出现”,Gary Marcus对AI的25大预测!
- 何宝宏:大语言模型上半场已进入“垃圾时间”
- 黄仁勋:英伟达引领机器人行业革命,未来人人都能有超算 | AI 2025
- 脑机接口预示着未来生活质量的提高
- 谢赛宁、李飞飞「空间智能」新作:多模态大模型仍难突破空间推理
- 2025 年人工智能值得关注的 7 个趋势
- 拥抱科研新范式——人工智能带来的科研革命
- AGI理论比较:主动推理、强化学习、控制论、贝叶斯大脑、效用决策、有限理性、情感动机、动态体内平衡
- 最新!Sam Altman反思来了:已经知道如何构建AGI,现在OpenAI转向「超级智能」
- 2025智能世界50震撼预测!AI海啸来袭,5维度看清AGI与潜在可能
- 人工智能是不是走错了方向?
- DARPA 着眼于新的量子传感技术研究
- 2025 AI深度前瞻:推理成本暴降90%,智能体迎GPT时刻,空间智能涌现
- 复旦大学51页的论文,从强化学习的角度分析实现o1的路线图
- 深度|诺奖得主Hinton:人类当下局面是,旧石器时代的大脑、中世纪的制度与类神的技术
- 斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准,能力涌现怕不是检索题库
- 2025 年,大模型会有哪些新变化?
- “agent”一词令人沮丧,GPT-4级模型已不值一提,大神程序员盘点「大模型的2024」
- 这是2024年我们对LLMs所学到的东西
- 北航自动化教授秦曾昌:人类认知信息处理过程奠定了AI基础
- 从「天才少年」到被迫「追赶者」:诺奖得主、AlphaGo之父Demis Hassabis眼中的AI未来
- 抑郁6个月后,DeepMind两万引科学家离世,万字绝笔谈在AI行业工作的压力
- 2025风口已至?6000字具身智能年度复盘,寻找产业投资机会!
- New Scientist|我们可以使用量子计算机来测试激进的意识理论吗?
- 图灵奖得主杨立昆:统治欲望源于生存需求,而非智能水平,AI 不会有这种想法
- 谷歌前 CEO 施密特:AI 将在今年获得“永久记忆”,2028 美国会耗尽能源储备 | AI 2025
- 计算创世纪:生命即代码,代码即生命,自然如斯,技术亦然
- AI模拟细胞,走向全新虚拟生命,斯坦福团队呼吁是时候走出全新的一步了
- 奥特曼公布OpenAI新年目标:AGI/Agent排前列,4o/Sora要更新,还有……
- 2025 AI“平替”危机:大批程序员真的会被取代吗?
- 进化与发育的变分统一:自由能视角下的自然选择
- AI幻觉能助力科学重大突破?诺奖得主Baker用得可香了
- Sam Altman 剧透2025年OpenAI的大计划
- 定格AI浪潮下的宝安:御产业之风,向未来启航
- 图灵奖得主杨立昆:统治欲望源于生存需求,而非智能水平,AI 不会有这种想法 | AI 2025
- Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理
- Tononi vs Seth:意识研究,应当遵从内在视角还是观察者视角?
- 强化学习之父 Rich Sutton 最新演讲:用「去中心化神经网络」应对深度学习局限性
- Tononi vs Seth:意识研究,应当遵从内在视角还是观察者视角?
- 姚期智:AI理论突破及原始创新,中国已跻身一流,但未汇聚成流
- IBM专家马丁·基恩:7大AI趋势2025
- 2025年的23个新技术发展趋势
- AI教父”杨立昆:现有训练方式永远实现不了人类水平 AI
- 国内大模型落地「狂飙」一年,各家厂商成绩如何?
- 《新科学家》作者挑选的有史以来26篇最佳科幻短篇小说
- 重大转变!OpenAI或重组为营利性公益公司,业内人士分析
- 国产大模型DeepSeek-V3一夜火爆全球,《DeepSeek-V3技术报告》,53页pdf
- 2024年计算机科学大突破
- 来了!2025 年人工智能的10大预测,7000字重磅解读
- DeepMind最新研究:逆向思维训练LLM可大幅提升AI推理能力
- 《科学》杂志 2024 年度突破
- 2024年“最失败的八大技术”,波音Starliner、垂直农场等上榜
- 加拿大工程院院士张丹:“具身智能”或将成为明年科技界的“重头戏”
- 大模型版生命游戏来了!「AI科学家」背后公司联手MIT&OpenAI等打造
- 陶哲轩:顶级数学家是如何炼成的?学习数学的痛点与突破全解读
- 爱思唯尔:洞察2024:科研人员对人工智能的态度报告
- 2025年,半导体行业三大技术热点
- 谢赛宁、李飞飞「空间智能」新作:多模态大模型仍难突破空间推理
- 曝OpenAI布局实体机器人领域 行业是否面临重新洗牌?
- 对话首席AI科学家、图灵奖得主LeCun:大语言模型已触顶,Meta的下一代AI模型可能是新方向
- 神经网络的物理根源:从自旋玻璃到能量景观|2024年诺贝尔奖
- 科学没有衰落,谷歌 AI 推动科学发展的 9 种方式
- Claude CEO的最新万字长文,比山姆奥特曼更理性实际!
- 明年AI行业将有哪些重要变化?硅谷顶级风投基金的22个最新预判
- 最新 | 福布斯发布2025年AI十大趋势!
- 最新!Yann LeCun:AI将成为超级智能,堪比新的文艺复兴,人类新的启蒙
- o1 pro “碾压式”洞察:世界顶尖免疫学专家被机器深度分析“惊醒”
- 重磅发布!一图速览2024世界智能制造十大科技进展
- 机器心理学:通向通用人工智能的桥梁?
- 深度报告:展望 2025,AI 行业有哪些创新机会?
- OpenAI突发超级AI?和两家竞争对手的动态一起看看吧!
- 2024年,世界数学的5大颠覆性突破,包括黎曼猜想和朗兰兹猜想
- 2024年,物理学领域6项重大进展,不断刷新我们对世界的认知
- 重磅!OpenAI推出o3模型系列:彻底颠覆AI怀疑论者,AGI评测基准达到惊人87.5%
- 美国联邦众议院人工智能工作组报告(273页)
- 《自然》:恢复大脑年轻,需要两手抓!阻止“坏”细胞搞破坏很重要
- Llama2024年度要点总结
- 通用人工智能是一个泡沫吗?
- 警惕!AI开始破坏人类安全训练,Anthropic揭露大模型「对齐伪造」安全风险
- 突发!GPT论文一作Alec Radford离职,前两代GPT作者全部离开OpenAI
- 扎克伯格、奥特曼发动“第二次芯片战争”
- 清华团队「超级对齐」新研究:如何定义?怎样实现?
- Nature:小型无人机革命即将到来——科学家需要确保它的安全性
- 刚刚,AI颠覆物理模拟:一句话精准仿真,学术圈半壁江山联手耗时24个月研究成果
- “注意力之父”!遥遥领先Transformer 26年
- 再度狙击OpenAI!“谷歌版”Sora深夜上线,4k视频生成时代来了
- 2万字全文|陶哲轩和OpenAI对谈数学及科学研究中的AI应用、人脑更善于基于少量数据作出判断
- 中国工程院发布:2024全球工程前沿报告及全球十大工程成就
- Science:呼吁全球禁止镜像生命的研究
- Nature:为什么概率可能不存在(但假设它存在是有用的)
- 专访微软AI CEO:没有 OpenAI,我们也能训练出世界上最好的模型
- 图灵奖得主Bengio亲自打分,首份《人工智能安全指数报告》发布,中国一家公司上榜
- 意识、自指与悖论:意识是科学语言中的哥德尔句子
- 专访微软AI CEO:没有 OpenAI,我们也能训练出世界上最好的模型
- OpenAI发布49页长文,讲述o1的安全机制
- 16种新型RAG最新进展
- 从统计物理到社会科学:如何从微观推导出宏观?
- 《科学》、《自然》各自发布年度十大,它们为什么同时选中了这位中国科学家?
- 美国大模型生存之战:xAI、Anthropic、OpenAI、Meta Llama 全方位竞争扫描
- 大脑也会“断崖式衰老”?新研究发现大脑老化的3个关键年龄节点
- 2024年诺奖解读:统计物理、人工智能与复杂科学
- Ilya Sutskever:预训练模式已经走到尽头
- OpenAI发布49页长文,讲述o1的安全机制
- 专访谷歌量子AI团队:为什么说Willow是里程碑式的突破?
- 清华大学电子系主任汪玉:AI赋能未来 ——探索关于人工智能算力思考和发展
- 中国2项研究入选!2024年《科学》10大年度科学突破揭晓
- 华尔街热炒量子计算股,但谷歌的量子芯片实际上并不具备计算能力
- 李飞飞:World Labs这样实现「空间智能」
- Perplexity的首席执行官谈人工智能、搜索和互联网的未来
- Nature研究报告:AI革命的数据正在枯竭,研究人员该怎么办?
- 狙击OpenAI 谷歌发布Gemini 2.0 一切为了智能体
- NeurIPS 2024 | 智能体不够聪明怎么办?让它像学徒一样持续学习
- 穿越迷雾,七个前沿“烧脑”概念带你从“新”理解科学
- Nature头条文章: 如果人工智能有了意识,我们该怎么办?
- 科学家创造出能模仿大脑“观看”视频的人工智能
- 重磅!谷歌Willow量子芯片横空出世:解决量子计算三十年难题,马斯克惊叹,Altman祝贺
- 反向思考使LLMs成为更强大的推理者
- 2024诺奖颁奖现场,AI之父Hinton演讲:当AI已经开始理解人类的喜好和情绪(附视频)
- OpenAI Sora上线即炸服、1条视频约2.9元,Altman:视频生成的GPT-1时刻来了!
- 专访 Anthropic CEO:2025 年要解决的两大问题,以及为何不将 Computer Use 产品化
- LLM学习原子「结构语言」,生成未知化合物的晶体结构,登Nature子刊
- Scaling Law不是唯一视角!清华刘知远团队提出大模型“密度定律”:模型能力密度100天翻番
- 中国工程院院士:智能传感器太重要了!中国要抓住历史发展机遇!(推荐)
- 深度解读:拜登绝唱版芯片制裁方案的重点
- 图灵奖得主LeCun团队新作:在世界模型中导航
- 改写百年认知!神经元的基本形态,我们一直弄错了?
- 地球数字孪生是一个误导性术语,计算机模型始终是现实的简化表示
- 《我的世界》搞数学研究,估算欧拉数误差仅0.00766%!数学博士的跨界花活儿火了
- AI 教父 Geoffrey Hinton:数字智能会取代生物智能么?
- OpenAI狂飙突进!仅12个例子就能打造专属AI专家,核心技术竟来自字节?
- 低空经济中的飞行汽车:现状、堵点及未来(全析)
- 对话Google DeepMind资深科学家:强化学习是重点,大模型时代AlphaZero依然重要
- OpenAI推o1模型完整版,还有月费200美元新服务
- 人工智能创世纪:人工智能时代的秩序、安全与和平
- 彻底变天‼️最新AI天气模型登Nature正刊,完胜传统天气预报‼️
- 完整版: OpenAI CEO 萨姆·奥特曼最新访谈回应一切:明天开始连续12天线上发布!(附全文和视频)
- 李飞飞首个「空间智能」模型发布:一张图,生成一个 3D 世界
- 剑桥DeepMind机器学习教授:AI无法取代“原子人”
- OpenAI每周活跃用户数量飙升至3亿 希望未来一年达10亿
- Nature最新封面新闻|人工智能距离人类水平的智能还有多远?
- 李飞飞发布首个模型:生成式AI进入3D化时代
- Andrej Karpathy 首次公开私人邮件:揭秘Transformer 注意力机制真相
- 人工智能教父警告有权势的人想要“用机器取代”人类
- AI教父Hinton演讲视频:AI已具备主观体验,深入解析超越人类智能的关键路径
- 靴子落地!美将140家中国半导体企业列入实体名单,附完整名单及政策细节!
- Token化一切!北大、谷歌等提出TokenFormer,Transformer从未这么灵活过
- 《中国科学基金》 | 鄂维南院士:2024年诺贝尔物理学奖评述
- 学术报告:万物智能演化理论,智能科学基础理论的新探索
- 诺奖和图灵奖得主辛顿最新演讲:数字智能比生物智能效率高10万倍,但进化方向不同,成名研究成果归功于博士弟子天团
- 即将步入2025年,这些科学难题为何一直存在?
- 新研究进一步揭示地球生命或起源于“热泉”
- Nature刊文:“open AI”的实际作用非常有限
- 《100部前沿科技未来发展趋势研究报告(精选)》 2024年11月
- 生成式AI推理技术、市场与未来
- 清华&面壁提出新一代主动 Agent 范式!AI 从此拥有主观能动性
- 图灵奖得主LeCun 推崇的 JEPA 是什么?
- ChatGPT 2周年:从焦虑、裁员中“炼出”的GPT
- 张薇薇|美国的人工智能算法治理:理念、举措及影响
- Andrej Karpathy引争议:AI 没有魔法,只是模仿,离“真”强化学习还远着呢
- 图灵奖得主杨立昆深入浅出带你了解人工智能的前世今生
- 未来今日研究所:2024技术趋势报告-人工智能篇
- Nature:大型语言模型在预测神经科学结果方面超越人类专家
- 利用DNA折纸技术,科学家开发出可定制和编程纳米机器人
- 黄仁勋最新万字对话:英伟达十年内将计算边际成本降低至1/100万 |科技
- OpenAI:2025年ChatGPT将成为“企业大脑”,并向Agent过渡
- 天才物理学家Wolfram:物理学的终极可能是什么?
- 大型语言模型与知识图谱协同研究综述:两大技术优势互补
- CB Insights 《2024年第三季度全球人工智能投融资状况报告》
- 李飞飞:理解世界运作方式是AI的下一步,我们需要从大语言模型转向大世界模型
- 突发!Sora API被故意泄露!测试艺术家怒斥OpenAI无耻:拒绝成为傀儡
- 五种“聆听”引力波的新方法,会揭示什么样的宇宙秘密? |《自然》长文
- 万物智能演化理论(欧米伽理论)的核心观点
- 美国国家科学院院刊:人工智能的下一个进化,从我们开始
- 大语言模型技术演进与启示!
- 涌现的计算方法:从计算力学到层级涌现
- 走出元宇宙阴影、拥抱开源AI模型,Meta实现“扎克伯格式复兴”
- 瑞士洛桑联邦理工学院:人工智能中的创造力:进展与挑战
- 各路大佬纷纷给 AGI 立下“最后期限”,27 岁创始人已经给 AI 准备好「人类最终测试」!
- ChatGPT的生成原理
- 强化学习之父Sutton最新万字采访:炮轰深度学习只是瞬时学习,持续学习才是智能突破的关键
- 陶哲轩宣布“等式理论计划”成功,人类AI协作,57天完成2200万+数学关系证明
- 谷歌 AlphaChip 论文再被质疑,DeepMind 驳斥都没做与训练,顺带还揪出了“内鬼”?
- 复旦大学:《大模型AI智能体的兴起和潜力:综述》
- 斯坦福大学发布全球人工智能实力排行榜
- 意识是一种模拟状态,它只能存在于梦中,而不是在物理世界中
- 步步紧逼谷歌!OpenAI正在研发与ChatGPT集成的浏览器
- 2秒完成检测,将AI与3D打印相结合,科学家实现小型核反应堆高级监测
- 从具身到智能,无尽前沿丨智源具身智能峰会观点集锦(上)
- 从具身到智能,无尽前沿丨智源具身智能峰会观点集锦(下)
- Nature:刷新了传统认知!蔡欣童/刘长亮等揭示多巴胺快速波动既不调控运动、也不编码奖赏
- Nature :谷歌学术搜索 能否在人工智能革命中幸存下来?
- AI智能体的崛起,开启人工智能的下一个黄金时代
- 强化学习之父Richard Sutton:AGI研究的下一个范式
- Science:如何理解大模型的智能本质
- 神经网络到张量网络的“变身”
- 诺奖得主 Demis Hassabis教皇科学院开讲:AI 是一项令人难以置信的技术,发展模式需重新思考
- 性能提升在即!吴恩达谈 LLM 新方向:优化智能体工作流
- 模拟到现实无缝转换!麻省理工学院研究团队提出生成模型LucidSim,破解机器人训练难题!
- 人形机器人的兴起
- Grok-3 与黎曼猜想:人工智能带来的震撼与挑战
- 斯坦福伯克利重磅发现DNA Scaling Law,Evo荣登Science封面!AI设计DNA/RNA/蛋白质再突破
- AI 求解量子多体问题:GPT 理解人类语言,也理解量子语言吗?
- 真的撞墙?OpenAI 的任务对齐主管:2025年AI会在高阶应用突破,但一般人会感觉停滞
- transformer的细节到底是怎么样的?Transformer 连环18问!
- 牛津大学报告:《无法被AI取代的力量:人类认知的理论驱动力》
- 吴恩达最新观点:LLM的下一个新兴方向是Agentic AI
- Stephen Wolfram与计算的未来:一本带你认识世界的新书
- Science最新封面:AI大模型跨越物种边界、解码生命“密码全书”,基因组学进入全新时代
- 研究人员发明了一种新的逻辑系统,有望提升批判性思维和人工智能的能力
- 马斯克新官上任再起诉OpenAI!新证据称Ilya七年前就不放心奥特曼了
- 别把人工智能当迷宫,从简单的问题开始 | 智能渐近线
- OpenAI首位投资者《时代》刊文:AI将重新定义「人类的意义」
- 复旦大学:2024大语言模型的能力边界与发展思考报告
- 包云岗:新一轮AI浪潮之技术溯源 | CCCF精选
- Anthropic创始人访谈:不是因为Altman 与微软合作而离开OpenAI、Scaling Law不会撞墙、未来招聘将放缓
- 生命的公式?新模型计算了宇宙中及宇宙之外存在智慧生物的可能性
- MIT对大模型数理原理的强有力证明
- 脑区身份危机:大脑不似你所想
- 美国科研还是世界第一吗?|《自然》长文
- 智能时代:大统一理论与万物理论的追求、挑战与突破
- 黄仁勋对话孙正义:日本的AI新饼、Arm的AI野心与英伟达的东亚新机会
- AI寒冬真的要来了!Ilya:I told you so
- WHALE来了,南大周志华团队做出更强泛化的世界模型
- 李彦宏:智能体是AI应用最主流形态,即将迎来爆发点| 百度世界2024
- 奥特曼专访自曝:OpenAI将实现AGI第三级,一人也能打造10亿独角兽
- 开源的定义要变了!开源AI标准成照妖镜:Meta、谷歌家大模型只是在假装开源?
- Scaling Law撞墙,AI圈炸锅了!OpenAI旗舰Orion被曝遭遇瓶颈,大改技术路线
- 宿敌对决!OpenAI & Anthropic 首席产品官万字访谈:“现在的模型并不是受限于智能水平,而是受限于评估方法”
- AI数学神话破灭!FrontierMath让LLM集体几乎“交白卷”:正确率不超过2%
- 基础物理研究能给世界带来什么?
- 台积电或被迫停止7纳米AI芯片代工,中国半导体产业面临新挑战
- 自然通讯:新研究发现记忆不仅存在于大脑中
- OpenAI Jason wei解读o1:思维链的“顿悟时刻”,大模型不再鹦鹉学舌
- 麦肯锡全球研究所 :重塑全球经济的 18 个新兴行业领域
- 重磅!刚刚Sam Altman万字采访:AGI将在2025年实现
- 6 年 OpenAI 高管揭秘:我为什么离开 OpenAI 及这个公司现在怎样了?
- 自然通讯:新研究发现记忆不仅存在于大脑中
- 女王大学团队提出AI基础模型评审团方法,有望大幅提升AI研究效率
- 微软AI CEO穆斯塔法:AI将在 2025 年实现记忆并释放出新的创造力,将成为我们的“第二大脑”
- 兰德公司 :《全球风险评估报告》,从人工智能、小行星撞击、核战争到超级火山喷发
- Nature重磅:AI化学家再升级!大幅提升实验效率,推动化学合成进入“智能化”新阶段
- 学术快报 | 罗欢课题组揭示人脑工作记忆中的层级折叠机制
- Cell | AI取代科研人员还有多远?
- 王耀南院士:AI大模型驱动的人形机器人与展望
- 人工智能在心智理论测试中战胜人类
- “Chat 才是 AGI 的灵魂!” OpenAI 斥资超 1500+ 万美元股份收购 chat.com 顶级域名
- 揭秘人工智能发展进程的50篇关键论文
- 北大校友打造的1000个智能体「我的世界」,背后原理揭晓了!
- 贝佐斯、OpenAI领投,给机器人装AI「大脑」的Physical Intelligence获4亿美元融资
- 沿着人类思路探索:达摩院提出创意链,使大模型生成人类水平的科研Idea
- Science:耗时十年,人类剪接体图谱首次发表
- Sam Altman 最新万字访谈自曝:大模型必定贬值,但不投资反而是错?
- UCLA、MIT数学家推翻39年经典数学猜想!AI证明卡在99.99%,人类最终证伪
- 斯坦福团队联合英伟达提出基于能量的扩散语言模型,将困惑度表现提升至自回归模型水平
- 智能体:驱散21世纪科学乌云,引发新科学革命的突破口
- 图灵奖得主Yann LeCun:《机器如何才能达到人类智能水平?》66页报告
- 清华大学最新!2万字长文全面解读多模态生成式AI的前世今生!
- 当AI取代真相,大模型如何一步步诱骗了人类的文明?| 追问观察
- 人工智能综述:物理学与人工智能的跨界新范式(全文版本)
- 《100部前沿科技未来发展趋势研究报告(精选)》 2024年10月
- 世界模型”究竟是什么?会成为人工智能的下一个前沿领域吗?
- 大模型内部也有功能分区,MIT团队揭示其“大脑”结构
- 冯·诺依曼的遗产:寻找人工生命的理论根源
- 意识理论之注意运动的伴随放电(CODAM)模型(一)
- 机器人中的神经场:综述
- 昆虫也有意识吗?昆虫脑的复杂性与意识的进化
- 任正非最新讲话:华为还在挣扎中
- Google危矣?ChatGPT真变AI搜索引擎了!
- 中国力争引领全球核聚变领域 |《自然》长文
- 强化学习之父Richard Sutton给出一个简单思路,大幅增强所有RL算法
- 国自然基金重大调整,这4点需要关注!
- 《自然化学》实验室制造的“原细胞”为生命起源提供线索
- 这位图灵奖得主提出的经典算法Dijkstra,被证明是普遍最优了:最坏情况性能也最优!
- Nature首次追踪到了干细胞移植后几十年的情况,揭开了50多年来的医学谜团
- 马斯克:脑机接口植入总体费用将在5000美元左右,手术仅10分钟
- 人工智能投资热潮,芯片战争前沿
- ABI Research:82个将会或不会在2024年发生的技术趋势白皮书
- 美国遏华半导体政策升级!新规颁布,1月2日生效
机器学习算法那些事
- 25岁当上985博导,冯磊现任东南大学教授!
- 这次终于彻底理解了 LightGBM 原理及代码
- 知乎热议 | 前几周Deepseek都是神一般的存在,为啥热度消散得这么快?
- 仅需0.4GB,参数只有0和±1!微软开源首个原生1 bit模型,CPU轻松跑
- 台大李宏毅2025 AI Agent新课来了!
- 真正的 LLM Agent
- LLM 工程师工具箱:120+大模型库全攻略!
- 最初只有12个人!英伟达早期架构师首次亲述CUDA发展全过程
- 深入解析图神经网络注意力机制:数学原理与可视化实现
- 从暴力剪枝到智能微调!一文速通LLM
- Dify-Plus:一个定制化的Dify二开开发
- 台大李宏毅2025 AI Agent新课来了!
- R1 的一些认知:4 个经典误区
- 哈佛斯坦福顶尖中国毕业生回流,向DeepSeek疯投简历!美国人才开始逆向归国
- 微调医疗数据模型,让AI成为医生的好帮手!
- 睡一觉发一篇SCI?学术圈权色交易杀疯了!
- 隐藏马尔可夫模型的解释、真实案例以及 Python 代码
- 如何向10岁小孩解释XGBoost回归算法
- 手把手助你成为医疗领域专家!
- 如何向10岁小孩解释PCA(主成分分析)算法
- 全景解读 LLM Posting-Train(后训练)技术
- AI笔记神器NotebookLM,保姆级教程来了!
- YOLOv12入门教程
- deepseek技术解读(1)-彻底理解MLA(Multi-Head Latent Attention)
- 通俗易懂!大模型强化学习 RL入门
- 图灵奖获得者:我不用ChatGPT
- CVPR 2025 | 双lora方法实现像素级和语义级可调超分辨率
- PyCharm接入DeepSeek超详细完整教程,实现AI编程
- 为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理
- 刚刚!微调 DeepSeek 满血版正式开源。。。
- 用极小模型复现R1思维链的失败感悟
- 一文读懂多模态大模型微调,武大发布最全综述!
- 大模型与人类思维认知的差距
- PyTorch灵魂人物离职,分享了他在PyTorch的这四年经历
- 简单的Python调用C++程序
- 我没有大模型经验,可以给个机会吗?
- 最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)
- YOLOv12,首个以Attention为核心的YOLO框架问世!兼顾速度、准确率和效率
- 如何评价Ultralytics出的YOLOv11?
- 马斯克评价DeepSeek:中国大部分时间都是世界最强国家,但……
- DeepSeek和月之暗面的论文撞车了!!
- PyCharm 接入 DeepSeek 完整版教程来了!!!
- 热议:为什么DeepSeek出来后,国产其他大模型的集体失声了,以前都号称很强的?
- 2024年 15 种典型 RAG 框架
- 为什么DeepSeek由一个初创公司开出来而不是国内互联网巨头?DeepSeek的神回复
- 当我问DeepSeek,“过好这一生”的真相是什么
- DeepSeek + IDEA!辅助编程太强了!
- 刘知远硬核解读 DeepSeek:大模型强化学习技术原理与大模型技术发展研判
- 完整的671B DeepSeek R1本地部署,详尽教程来了!
- 原来,这些顶级大模型都是蒸馏的!
- Jay Alammar:图解DeepSeek-R1
- DeepSeek-R1持续刷屏,连Open R1都来了!抱抱脸发起,1天狂揽1.9k星
- 【深度学习】ViT模型详解与Pytorch代码实现
- DeepSeek-V3带火大模型infra,入门看这篇就够了!
- 李飞飞最新访谈:AI Agent的根本定位应该是工具而非主导者,是赋能者而非替代者!
- 微调YOLOv11:实用指南 【详细过程与代码】
- XGBoost 比深度学习还强?
- DeepSeek官方App上线!功能完整且免费
- 2024年AI大模型回顾!
- GAN 已死?GAN 万岁,一夜碾压扩散模型!!
- AAAI 2025 | 厦门大学信息学院32篇论文入选!多模态、目标检测、自动驾驶等研究方向
- 2024年 15 种典型 RAG 框架
- 突发!美国拟(全面禁止)向中国出口 AI 芯片
- 图像相似性度量标准
- 计算DeepSeekV3训练的MFU
- 同济提出简化 Transformer结构:在RTX3090上实现CLIP的轻量级训练 !
- 1999美元!RTX5090发布
- DeepSeek-V3技术报告解读
- 习近平签署主席令!研究生,迎大变革!
- GhostRNN:以低成本 Transformer Layer 实现 RNN 模型精简与性能提升 !
- 上海微软大裁员,赔偿达N+8,12年老员工感叹:拿20个月工资走人,每月3000失业补助,也是种幸福
- 国产大模型之光-DeepSeek-v3技术报告解读
- 浙大校长“论文署名中科大”!本人坦诚回应
- 一文读懂 PyTorch 显存管理机制
- 戏剧!他刚评上院士就被曝十余篇论文造假:已被撤回8篇!
- “注意力之父”!遥遥领先Transformer 26年
- XGBoost 比深度学习还强?
- Frozen-DETR: 使用冻结的基础大模型来增强DETR的能力
- 震撼高层,中国工程院院士孙凝晖给正国级、副国级讲课-《人工智能与智能计算的发展》
- 深大提出 SL-YOLO: 更强、更轻的目标检测模型 !
- 困在“第一学历”里的博士
- Tokenization不存在了?Meta最新研究,无需Tokenizer的架构来了
- 我国退步最快的985大学?曾位列全国前十,如今排名连年下降…
- 像教女朋友一样教你用 Cuda 实现 PyTorch 算子
- 中纪委严厉批评:中国高校面临重大整改
- YOPO (You Only Prune Once):给 LLaVA 做剪枝,大幅缩减多模态大模型计算量至 12%!
- NeurIPS 2024 最佳论文出炉!北大字节VAR获最佳论文、厦大清华获亚军
- 告别自回归,基于扩散模型的时间序列基础模型
- 42岁,讲师,因为评职称郁郁寡欢,吃了半年的调整情绪和睡眠的药物,无数次自我开解,说服自己接受平庸和失败
- AAAI 2024 | 即插即用,Conv-Former注意力模块,用卷积实现Transformer效果!
- opencv学习:基于计算机视觉的表情识别系统
- 无需预训练,训练显存大大减少!高效微调方法性能碾压LoRA,多模态模型新SOTA!
- 使用 Transformers 进行概率时间序列预测实战
- ECCV 2024 | 少样本类别增量学习中的注意力感知自适应提示
- 一位阿里 P9 的年薪和家庭资产
- 道不尽的卡尔曼!通俗易懂详细解释卡尔曼滤波
- 我的困惑是:我的同学是博士!
- 全球五大巨头GPU总量曝光!谷歌第一微软第二!
- Python 3.13 中的 7 个新类型特性
- 研二学生被舍友投毒,官方最新通报
- ECCV 2024 | PSALM:基于大型多模态模型的逐像素分割
- 雷军的大学时候的论文:不需要参考文献
- 轻量级神经网络模型,嵌入式微小设备也能实时检测 !
- 我的困惑是:我的同学是博士!
- ECCV 2024 | 跨域语义分割的注意力分解
- 中科院院士:青年科学家 5 年内拿不出成果就面临淘汰,有的单位已现「马太」效应,重复给某一人奖励
- ECCV 2024 | DAMSDet: 动态自适应特征融合的多光谱检测Transformer
- 已公示!“东方理工大学”,来了
- ECCV 2024 | 基于部分注意力的高效视觉Transformer
- 深入浅出Batch Size,对模型训练的影响分析
- TPAMI 2024 | 扩散模型中的测量指导:来自医学图像合成的见解
- 特朗普上台,第一刀再次扎在了留学生身上。。。
- Make U-Nets Great Again!北大&华为强强联合
- 电子科大提出注意力机制创新,改进 MobileViT变体在早期降采样阶段的注意力 QKV 操作研究 !
- MIT教授,何恺明大神最新课程资料下载!
- 基于有效样本的类别不平衡损失CB-Loss
- 又一985,落地深圳!
- 大模型?可以这样学
- 清华大学提出 TANet 用于综合恶劣天气图像复原的三重注意网络 !
- 首次明确!国务院: 博士学位论文,不再非写不可
- TPAMI 2024 | 烘焙神经辐射场以实现实时视图合成
- 今年顶会这情况。。。大家提前做准备吧!
- 使用 Transformers 进行概率时间序列预测实战
- 深度学习常用损失函数总览:基本形式、原理、特点
- 李飞飞团队新作:空间智能版ImageNet来了!
- TPAMI 2024 | 延迟感知的统一动态网络用于高效图像识别
- 50K*16薪,进字节了!
- 三种Transformer模型中的注意力机制介绍及Pytorch实现:从自注意力到因果自注意力
- 浅谈频率学派和贝叶斯学派
- 教授何恺明在MIT的第二门课!
- 谷歌&MIT何恺明团队:视觉大模型像LLM一样高效Scaling,指路连续token+随机生成顺序
- TPAMI 2024 | 不确定性增强的鲁棒视频活动预测
- transformer的细节到底是怎么样的?Transformer 连环18问!
- 1700 页,6 大主题!AI 学习路线手册发布!
- 降维和特征选择的对比介绍
- 北大韦东奕上课照片走红,板书潇洒,新发型吸睛,网友:这要打脸多少“只会翻PPT”的老师?
- TPAMI 2024 | 什么样的地方会成为异常之地?
- 姜萍造假实锤!阿里数赛出结果。。。
- TPAMI 2024 | IG2:迭代梯度路径上的集成梯度用于特征归因
- 如何理解attention中的Q,K,V?
- TPAMI 2024 | 迁移标注者和实例依赖的转移矩阵以实现从群体学习
- 网传北师大教授与女下属建立“永久亲密关系”,承诺对方读博和自由列支经费?北师大回应
- TPAMI 2024 | 通过寻找相关子空间对神经网络预测进行解耦解释
- 算法岗和开发岗有什么区别?
Coggle数据科学
- 行业落地分享:作业帮问答检索系统实践
- 小白学大模型:多模态 Qwen2.5-VL
- ELE AI算法大赛“赛道二:智慧骑士—消防隐患识别” Baseline
- 行业落地分享:蚂蚁向量检索挑战与实践
- 行业落地分享:一文全解 抖音算法原理首次公开!
- 竞赛总结:AFAC2024 AIGC金融多模态研究报告智能生成
- 大模型时代下的推荐系统:深度学习与推荐系统 2.0 (文末送书)
- 从零实现 DeepSeek R1:从基础模型到强化推理模型
- 所有数据人,2025的新方向,赢麻了!
- KDD Cup 2025:Meta CRAG-MM Challenge
- 世界科学智能大赛合成生物赛道:蛋白质固有无序区域预测 Baseline
- 行业落地分享:MIT使用Agent智能汽车设计
- Kaggle赛题解析:Yale/UNC-CH 地球物理波形反演
- 大模型评测Chatbot Arena 与 ELO 原理
- 强化学习+ RAG:从基础到优化的完整实现
- Kaggle赛题解析:Image Matching Challenge 2025
- 行业落地分享:FastGPT企业Agent落地实践
- 小白学RAG:Sentence Transformers v4 微调 Rerank 重排序模型
- 谷歌前沿研究RAGO:系统优化RAG服务性能
- Kaggle赛题解析:ARC Prize 2025
- 竞赛总结:AFAC2024 基于保险条款的问答
- Typed-RAG:非事实问答的问题分解RAG
- LLM 工程师工具箱:120+ 大模型库全攻略
- Dify入门 与 工作流节点介绍
- 年薪96W!真心建议数据人冲一冲新兴领域,工资高前景好
- 竞赛总结:AFAC2024 金融工具Tools识别
- RAG技术全探索:20种方法源码解读与实践
- Dify-Plus:一个定制化的Dify二开开发
- 大语言模型在时序建模中是“鸡肋”? | NIPS 2024
- 货拉拉大模型应用开发体系演进与实践
- 行业落地分享:Dify在顺丰内部AI Agent落地
- Kaggle赛题解析:BirdCLEF 2025
- OpenAI定义Agent新范式:构建自动化系统的模板
- 小白学RAG:SAGE提高RAG精准检索效果
- Kaggle赛题解析:BYU 2025细菌鞭毛马达定位
- 行业落地分享:字节RAG技术实践与优化
- 竞赛总结:Kaggle LLMs对抗输入挑战赛
- 基于图谱RAG(KG-RAG):如何用、何时用?
- Kaggle赛题解析:斯坦福3D RNA结构预测
- 开源创意点亮生态未来 | 第二届OpenHarmony创新应用挑战赛圆满收官
- 小白学大模型:训练400倍加速的嵌入模型
- Deep Research:AI如何秒变研究专家?
- Kaggle赛题解析:使用大模型绘制SVG图像
- 小白学大模型:训练大语言模型的深度指南
- 竞赛总结:Kaggle Santa 2024挑战赛
- WWW Cup 2025 SmartMem 内存故障预测竞赛Baseline
- 小白学大模型:Unsloth 更快更省资源微调 (文末送书)
- Kaggle 2025 NCAA篮球预测 Baseline
- 行业落地分享:KidsGPT有情感温度的智能体
- AI的“随机性”挑战:它们比人类更“不随机”?
- WWW 2025 SmartMem 内存故障预测竞赛
- DeepSeek R1 刷榜 Kaggle 数学奥赛挑战赛
- 行业落地分享:阿里云构建企业级RAG
- 小白学大模型:LogitsProcessor 文本可控生成
- Kaggle赛题解析:2025 NCAA篮球预测
- 小白学大模型:从Prompt Caching到Logprobs
- 小白学RAG:HuggingFace Text Embeddings Inference
- 小白学解释性AI:从机器学习到大模型
- 行业落地分享:RAG范式选择与系统设计
- 搞定时序建模:8个案例掌握NeuralProphet
- 行业落地分享:Agent在小爱同学中的应用
- 2024 感恩有你!限时领红包封面,抽红包+实体书!
- Kaggle知识点:TabM深度学习模型(Jane Street比赛高分模型)
- 小白学NLP:STAGE通过共现图数据增强
- 小白学时间序列:时序异常算法对比 (VLDB 2024)
- Kaggle知识点:数据挖掘标准流程
- 小白学大模型:Anthropic和Google的Agent定义(文末送书)
- Kaggle知识点:类别重复如何影响模型精度?
- 小白学时间序列:MASS相似度计算
- 小白学大模型:构建LLM的关键步骤
- Kaggle知识点:表格竞赛中NN什么时候优于树模型?
- PDFTriage:来自Adobe的RAG问答方案 (文末送书)
- TimeRAG:通过RAG进行时间序列预测
- 2025规划:把大模型放进冰箱里面
- 推荐报名参赛 | 第五届全国人工智能大赛(NAIC)开放评测
- 竞赛总结:KDD2024 OAG-Challenge
- RAG + Milvus 如何让鲁迅又成为B站顶流?
- 竞赛总结:Meta KDD Cup 2024(文末送书)
- 数据脱敏方法:GReaT大模型合成数据
- Kaggle赛题总结:CMI儿童网络成瘾预测
- Kaggle 奥数AIMO赛题:QwQ baseline
- 小白学RAG:17种改进生成的落地方法
- Late Chunking×Milvus:如何提高RAG准确率
- Kaggle知识点:7种超参数搜索方法
- 竞赛总结:Amazon KDD Cup 2024
- 量化方法TradExpert:混合大模型进行股票分析
- Kaggle赛题解析:Konwinski Prize GitHub基准测试
- 小白学RAG:BERT稀疏表示 SPLADE 和 BGE-M3
- Kaggle赛题解析:NeurIPS 2024 - Lux AI Season 3
- 小白学RAG:7种不同的改写输入方法
- Kaggle赛题解析:CIBMTR公平性预测
- Kaggle赛题解析:LLMs对抗输入挑战赛
- Kaggle知识点:有监督降噪自编码器(适用于匿名 / 量化比赛)
- 小白学RAG:9种不同的Chunk划分方法(文末送书)
- 竞赛总结:科大讯飞2024 企业经营健康评估挑战赛 Top3
- Kaggle知识点:使用大模型进行特征筛选
- Kaggle 知识点:Torch-TensorRT加速推理
- EMNLP 2024:使用大模型预测股市回报
- Kaggle赛题解析:Santa 2024挑战赛
- KDD 2024亮点:大模型/RAG论文解析
- 行业落地分享:大模型Gemini Pro 在谷歌广告拍卖应用 | KDD 2024
- 小白学RAG:通过文本聚类进行Rerank
- Kaggle赛题解析:FIDE & Google 国际象棋挑战赛
- Kaggle赛题解析:WSDM Cup 2025
- 小白学RAG:多模态问答实践(文末送书)
- 竞赛总结:CCF第七届AIOps国际挑战赛-季军方案分享 | 北航EasyRAG
- 竞赛总结:Kaggle LMSYS 大模型奖励建模
- 小白学RAG:Neo4j 中图算法汇总
- Kaggle知识点:特征降维方法(线性和非线性)
- Kaggle赛题解析:CZII 3D 物体检测
- RAG编码模型对比:谁与OpenAI最为相似?
- 我用捡来的idea,发了CCF-A顶会!!!
- 大模型与搜索引擎结合:智能体、思维链和智谱AI搜索代码案例
- RAG评价方法综述:相关性、有效性与忠诚性
- 小白学RAG:Elasticsearch全文与混合检索
- Kaggle知识点:文本分类案例(XGBoost / BERT vs GPT-4)
- 小白学大模型:斯坦福CS25 Transformers与LLMs
- 你 vs ChatGPT,竞赛知识大比拼!
AI前线
- 曝百川智能老班底所剩无几;小红书取消员工大小周、竞业;马拉松亚军“松延动力 N2”以 5.7 万元拍卖价成交 | AI周报
- Anthropic 下架逆向工程者代码,网友开始称赞OpenAI开放
- OpenAI“Agent万能论”遭打脸!LangChain创始人:Deep Search恰恰证明Workflows不可取代
- 酷开一口气甩出 6 个超级智能体!CEO:一定要做 AI 原生,性价比是我们追求的主要方向
- 出海不迷航,合规×本地化×生态:如何用技术力撬动海外市场?| 直播预告
- “DeepSeek不是万能的”,李彦宏今年押注AI 应用:模型价再“打骨折”,重点布局多智能体、多模态
- DeepMind CEO 放话:未来十年赌上视觉智能,挑战 OpenAI 语言统治地位
- 英伟达停止运营Lepton AI,贾扬清回应:不是人才收购
- 来薅 OpenAI 羊毛!Deep Research 轻量版 0 元畅玩,o4-mini 实力支持
- AI 智能体老“崩”?DeepSeek 前员工联手李飞飞等大佬开源新框架,教会模型真正推理
- 8大主流AI Agent平台深度测评:哪款最值得入手?| 赠书福利
- Cursor、Devin 等爆款系统提示词曝光,Github上斩获近 2.5 万颗星!官方给 AI 工具“洗脑”:你是编程奇才
- 腾讯、华为、微软、阿里专家齐聚一堂,共谈推理优化实践 | AICon
- 95 后中国开发者刚刚发布“摸鱼神器”,比 Manus 快 4 倍!实测结果能否让打工人逆袭?
- 大模型AI软件落地已过验证阶段,代码生成占比明显提升|AI4SE 行业现状调查报告(2024年度)
- 冲击 100% 覆盖率,华润集团如何破解数智人才培养密码?|DTDS 全球数智人才发展大会
- 人形机器人“颤颤巍巍”跑完北京马拉松,冠军身价抵轿车,季军仅 3.9 万:20 家企业发展实录
- 工程师又替 AI 背锅?Cursor 限制多设备登陆引众怒,竞对趁机下场抢用户!
- 宇树回应机器人比赛摔倒,唯一无人陪跑机器人获亚军;月之暗面或多名产品经理离职;腾讯启动史上最大就业计划 |AI周报
- 奥特曼的“上帝情结”:TED创始人质疑他为何有权塑造人类未来
- 被 Cursor 连拒两次,OpenAI 怒砸 30 亿美元收购竞品!奥特曼新打法:大模型公司要直接做应用赚钱
- 不会吧!OpenAI 发布新 O3 和 4o-mini,居然得看算力基础设施的脸色?
- 端侧 AI 加速落地,网易有道、未来智能、李未可科技深聊智能硬件新趋势 | 直播预告
- “皮衣战神”换正装!H20 被禁后,黄仁勋紧急访华表态,被曝与梁文锋见面
- ArXiv 2025 | 北航等机构发布最新综述:大语言模型集成(LLM Ensemble)
- 用了推理价格要贵6倍!谷歌“炒作最少但最有性价比”的Gemini Flash,狠刷网友好感度
- 让奥特曼直呼“天才”的o3 和 o4-mini,被曝捏造事实问题严重!拓展强化学习、图像思维链等亮点成陪衬?
- 生成式 AI 引爆广告效率革命,揭秘京东大模型应用架构的实践之道
- 21 天追平 GPT-4o?字节 Seed 玩真格的
- “字节暗示我太穷”:Seed团队1000张H100训练7B模型,发布全球首个25秒AI视频,验证视觉生成Scaling Law?
- 做AI产品两年,我得出的实操经验
- 突发!英伟达 H20 芯片受到出口管制,又在美国砸下重金搞 AI 芯片生产
- 可灵2.0成“最强视觉生成模型”?自称遥遥领先OpenAI、谷歌,技术创新细节大揭秘!
- 大模型落地中的狂奔、踩坑和突围
- GPT-4.1登场,实测碾压OpenAI所有模型,但效果不如Gemini?
- “Bug”还是“预演”?GitHub 突然“封禁”所有中国 IP,官方:只是“手滑”技术出错了
- GitHub Copilot 现可在 Windows 终端中运行了
- 刘强东被美团高管暗贬后回应;曝Qwen3 处于最后准备阶段;特朗普免除手机、电脑、芯片“对等”关税 | AI周报
- 美科技界焦虑横行:岗位减少、薪酬缩水、AI崛起
- “开源版coze”爆火,融资超 4.6 亿!如今 Docker 拉取量超 1 亿,斩获 77.5k star
- 傅利叶发布首款开源人形机器人 Fourier N1,软件代码在内的完整本体资源包已公开!
- 视频、游戏、AIGC全都要!多模态大模型如何玩转落地?| 直播预告
- GPT-4.1 偷摸开测?神秘模型登顶编程榜,社区细扒指向 OpenAI,网友:营销鬼才又来了!
- 通用人工智能时代,为生命建模型,为人类造医生
- 谷歌开始抢占智能体地盘!发布 A2A 开源协议打破企业间 Agent壁垒,OpenAI 系缺席标准之战
- 又一个“天选打工人”来了!擎朗智能发布首款人形机器人 XMAN-R1:基于真实数据打造,为服务而生
- 从单点到全员:极客时间 AI 人才培养全景方法论和实战
- Llama 4 先后被 DeepSeek、英伟达暴击,Meta 不再是大模型开源“霸主”了
- Devin 2.0 登场,AI 软件工程产品价格暴跌,从 500 美元直降至 20 美元!
- 18 岁亿万富豪遭名校集体拒收!高中靠 AI 狂揽 300 万用户,入学申请竟成“炫富”翻车现场?
- 拿 20 年前的苹果“古董”笔记本跑模型推理:九分之一现代 CPU 速度,但成功了!
- 击败 Manus?前百度 AI 高管创业1年多,放弃500 万用户搜索产品,转推“最强 Agent ”,自述 9 个月研发历程
- OpenAI 发布大模型现实世界软件工程基准测试 SWE-Lancer
- 钉钉创始人回归,曝开始抓考勤等;Meta开源Llama 4:架构重构;美爆发超1200场示威反对新政,特朗普喊话:挺住|AI周报
- Dapr Agents 发布:支持规模化 AI 工作流、多智能体协作
- 微软50 周年庆典,员工当众怒斥历任CEO!纳德拉也要让每个人都能成为开发者
- 10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型
- 黄仁勋被实习生说服用 CUDA,但遭团队嫌弃?!英伟达早期架构师首次曝光:12 人团队如何开启“算力帝国”
- 我在 4 年的机器人开源项目中学到了什么
- AI论文“冷冻”6个月,DeepMind科学家被逼“大逃亡”:买下整个学术界,又把天才都困在笼里
- 飞桨新一代框架 3.0 正式发布:减少 Llama 预训练 80% 分布式核心代码,R1 满血版单机部署吞吐量翻倍
- 小米SU7事故后,你还相信智驾吗?
- DeepSeek在烟草商业公司的典型应用(附23个部门68个应用场景)
- AI 不仅是技术革命,更是一场全员能力升级的持久战 | 极客时间 DTDS 大会
- 微软关闭上海AI实验室!硅谷巨头们“投奔”印度:OpenAI 的第二大市场,奥特曼态度180度转变
- 当大模型接管编程:NASA 疯狂的“反人类”编程要求,为何仍被奉为行业圣典?
- 比R1快8倍、价格仅3%,智谱新推理模型来袭,能让免费智能体自己赚钱!张鹏:Agent 也有Scaling Law
- 独家|对话蚂蚁 Ling 团队:聊聊用国产卡降本这回事儿
- 豆包大模型负责人飞书账号遭停,或因内部纠纷引关注;众擎机器人CEO炮轰朱啸虎:快退出宇树股份;宇树确认已盈利至少5年 |AI周报
- 面壁智能 CEO 李大海:AI智能体的未来是模型,而非工作流
- 用“千行代码”作弊软件骗过大厂!00后拿4个顶级Offer后潇洒拒掉:技术面试早该淘汰了?
- 每周宕机数十次,CEO 控诉“防护措施天天失效”:开源界正遭受 AI 公司的暴击
- GPT-4o “吉卜力”爆火,Prompt、SD 白学了?!大模型能力进化碾压一切
- “我们要重建 TikTok 算法”!Perplexity CEO 计划收购 TikTok,并开源关键技术
- OpenAI 宣布采用竞对 Anthropic 协议,一夜将 MCP 送上热搜!Karpathy:赶紧歇了吧
- 用 9B 参数做推理?任度双脑深度思考大模型 T1 发布,创始人:和大厂 PK 的底气来自“根原创”
- 引发 AI 热潮的原始代码开源了!Hinton 靠它获的诺奖,Ilya、Krizhevsky、李飞飞都有大贡献
- 凌晨“激战”!谷歌亮相新模型,OpenAI 紧急甩出 GPT-4o 动动嘴就能 P 图,网友:又要感谢 DeepSeek 了
- ICLR 2025 Spotlight|让机器人实现“自主进化” 蚂蚁数科与清华联合提出具身协同框架BodyGen
- 为企业 AI 人才培养找到最优解|极客时间闪耀 2025 中国企业培训和发展年会
- 谷歌又超越DeepSeek了和OpenAI?深夜祭出Gemini Pro 2.5,号称推理、编码、数学能力遥遥领先
- “不用高级GPU”!蚂蚁用国产AI芯片狂降百万训练成本,模型性能还与DeepSeek相当
- DeepSeek突然低调升级V3模型:编码能力显著提升,聊天语气更像人类
- 秒哒一出,代码全无!Manus:我先做个 PPT 压压惊
- Siri 跳票、iOS 强绑 AI,库克震怒换帅!大佬锐评:苹果高层都是快 70 岁老头儿,该换懂 AI 的年轻人上了
- Copilot 及 Cursor 等 AI 编码助手的新漏洞:通过规则文件注入恶意代码
- Qwen3部分技术细节被扒;年薪达945万!80后女副总裁首登福布斯;字节吴永辉亲自带实习生,取消Seed季度 OKR|AI周报
- 如何在 Java 中基于 LangChain 编写大语言模型应用
- 谷歌史上最大收购:320 亿美元买下了发现 DeepSeek 数据库泄露的那家小企业
- Cohere 发布多语言 Command A 模型:仅需两张 GPU 即可服务全球企业
- 破局 AI 算力瓶颈,探讨数据存储与分析的协同创新 | 直播预告
- 李开复:超大模型预训练逐渐寡头化,国内将收敛至 DeepSeek、阿里、字节三家
- 英伟达九位数收购合成数据公司 Gretel,80 人技术团队一并纳入麾下
- 史上最贵 API!比 DeepSeek-R1 贵千倍,OpenAI 高价劝退一批用户!
- 如何为预训练 LLM 添加新 token?
- 英伟达软硬件“双拳出击”:Blackwell Ultra、Rubin 芯片炸场,开源Dynamo让R1 token生成暴涨40倍
- 阿里妈妈搜索广告大模型2024思考与实践
- “加班文化” bye bye! 国家都让你下班了,还不赶紧溜?
- 零一万物全面拥抱 DeepSeek,李开复:今年第一季度收入接近去年全年
- 老黄 5090 都被初创公司虐了?印度 CEO 用 20 人团队让芯片快10 倍、功耗大砍近 80%!网友:等英伟达收购
- 王兴兴自曝做机器人从200块钱“手搓板”开始!各机器人企业疯狂秀肌肉,你pick谁?
- 海外热议!百度双模型免费上线,实测可帮没看“3.15”的打工人避雷
- 我们如何引入DeepSeek R1来做领域特定语言训练的?
- 英特尔CEO陈立武薪酬曝光,最高可达5亿元;裁员10%不发年终奖、HR和员工互殴?抖音回应;哈佛大学等美名校冻结招聘 |AI周报
- 挑战主流观点!卡耐基梅隆大学最新研究表明:仅靠压缩即可实现 AI 解谜能力
- 美国网友都在喷!OpenAI公然要求封杀DeepSeek等中国AI模型,还要合法“吸血”全球版权数据!
- 2025 两会闭幕|“人工智能 +”行动下的 3 大难点怎么破?
- 阿里正式推出 AI 旗舰应用:新夸克告别搜索,成为一个无边界的“AI 超级框”
- 刚刚,芯片创投“教父”陈立武正式成为英特尔 CEO:曾任中芯国际董事,华人家庭出身
- Ilya 新公司曝光:20 人左右员工超低调,线下面试要屏蔽候选人手机信号
- 刚刚,谷歌用更少参数打败 Qwen 2.5-32B!新模型 Gemma 3 号称“单 GPU 模型王”,团队紧急招兵买马!
- 小红书基于 PPO 的多模态大模型 RLHF 系统的设计与优化
- OpenAI强势推出智能体API及开源工具包,这次不单独收费了!网友:一逼才放“大招”
- 团队“DeepSeek”化!字节 Seed Edge启动不足两月,冲刺AGI再发新作,训练成本再节省40%
- 张向征:大模型安全研究与实践
- 当人工智能学会在比赛中“耍诈”,手段更高级!DeepSeek R1 每 10 局就有 1 局试图作弊?
- Claude MCP 突然爆火!AI Agent 圈的“万能插头”,直接让 Cursor 工作流效率提升 10 倍
- Mistral AI 发布号称最强 OCR API:能解锁 90% 非结构化数据,1 美元搞定 2000 页文档
- 人大代表呼吁废除35岁就业门槛;Manus 紧急扩容服务器;“海米兄弟”火了!海尔老总被调侃撞脸结界兽 | AI周报
- 让天下没有难做的AI交付,DeepSeek 服务交付联盟是个什么组织?
- 被骂惨的“现象级”Manus,今天我们来扒一扒它的真实水平!
- 图解 DeepSeek-R1
- Lakehouse 架构演进:从数据融合到智能决策的未来之路 | 直播预告
- 代码界的“瘟疫”?卡帕西“氛围编码”兴起,越来越多创业公司正将代码全权交给 AI!
- DeepSeek 之后,大模型应用如何迈向新阶段?| AICon
- Arm 发布全新 Armv9 边缘 AI 计算平台,可运行超 10 亿参数端侧 AI 模型
- 阿里深夜发布 QwQ-32B 模型:仅1/20参数就可媲美DeepSeek R1、Mac上可跑,带动股价大涨
- DeepSeek之后又一国产黑马!“全球首款”通用AI Agent一夜刷屏,全网在要邀请码
- JetBrains 推出 AI 编码智能体 Junie,但用户评价不高
- 腾讯元宝连夜修改用户协议!“霸王”条款冲上热榜,你的内容到底谁说了算?
- Deepseek V3/R1 技术内核及 RAG 技术前沿进展
- 谷歌开卷打工人!创始人让员工每天12小时,夺回AI地位!网友先怒了:像你一样在公司玩游戏吗?
- 英特尔 4.75 亿美元的错误
- 单月业绩破亿,10 亿热钱再狂砸智谱 AI!DeepSeek 掀起“AI 免费”风暴?唐杰:怎么想的呢!
- 玄铁首款服务器级 CPU 下月交付:性能达服务器级,搭载 Matrix AI 引擎
- DeepSeek公开利润率引两公司创始人互怼;Kimi最新模型曝光,k1.6登顶?494人年入过百万,出海大公司壕又卷|AI周报
- “前端已死”是危言耸听吗?
- 刚刚,DeepSeek 突然公布成本利润率高达545%!做 AI Infra 的该慌了?!
- 不用英伟达严选?DeepSeek最新开源项目再刷新认知,为何被赞“颠覆存储架构”
- 腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线
- 不被 AI 取代的工程师,是什么样的?| 直播预告
- GPT-4.5 发布!OpenAI 史上最大最贵也可能是最慢那个,全网都在骂大街啦
- 7天完成1亿增长!超级产品DeepSeek高效使用全攻略
- 被Github 上的Stable Diffusion 坑惨了?失业、欠帐、恐慌,工程师怒喷:AI软件毁了我!
- 英伟达“赚钱机器”更强了!盈利创纪录,黄仁勋:DeepSeek 为 GPU 降本,但下一代模型还离不开我
- 斥资2.2 亿美元,MongoDB又收购一家AI公司
- 创始人梁文锋亲创!DeepSeek 开源第四弹:全面公开优化并行策略
- 民间大神魔改4090 48G秒杀5090!老黄显卡炒作被打脸,“最失败50系显卡”也支棱不起来了?
- 超越Sora!阿里万相大模型正式开源,消费级显卡也能跑!
- 英特尔推出全新至强 6 性能核处理器,AI 处理性能提升 2 倍
- DeepSeek开源周第三天:专为FP8设计的DeepGEMM来了,核心内核代码仅300行!
- DeepSeek开源周第二弹:第一个用于MoE模型训推的EP通信库,暂只支持英伟达卡
- 中文比R1丝滑、玩宝可梦还贼溜?全球首个混合推理模型Claude 3.7 Sonnet太惊艳,网友直呼“孤独求败”!
- DeepSeek 等浙大系创业者的组织文化密码是什么?
- 一群技术人拉横幅围堵 OpenAI,不禁 AI 就一直闹!
- 百万年薪招揽人才的故事还会在AI时代继续上演吗?
- 文末赠书 | 微信、百度都接入的 DeepSeek,企业靠啥玩转其私有化与垂直训练?
- DeepSeek开源周首日:先让H800 GPU飞起来,项目瞬超1千星!
- 奥特曼婚后首晒娃,纳德拉祝贺;AI 硅胶娃娃爆火,不续费变“哑巴”;黄仁勋首度回应 DeepSeek 冲击|AI周报
- “2025 年将成 Python 主导 AI 领域的最后一年”
- 截胡DeepSeek开源周?Kimi深夜首发开源模型,同计算量下好过DeepSeek?
- 第一个明星 AI 硬件将变成电子垃圾
- GitLab 及其高管屡遭起诉,原因是“误导性”人工智能炒作和价格上涨
- 微软力推新视频游戏 AI 模型,超 10 亿张画面训练、相当于 7 年老玩家?开发者们:去他的吧!
- 大语言模型系统评估新框架:微观指标构建方法论
- 从 Twitter 到 X,掌舵近三年后,马斯克再以 440 亿美元估值寻求融资
- 梁文锋、杨植麟同一天发论文“秀肌肉”,主题居然撞上了!下一代模型要来了?
- 发布3天后,Grok 3开放免费使用,马斯克:让你们用到服务器崩溃为止
- 梁文锋、杨植麟同一天发论文“秀肌肉”,主题居然撞上了!下一代模型要来了?
- 大语言模型系统评估新框架:微观指标构建方法论
- 刚刚,DeepSeek被曝首次考虑引入外部资金,新增财务负责人已就位
- 发论文亲自上?创业十多年,DeepSeek梁文锋的“技术男”属性从没改变
- 最大参数 300 亿!阶跃星辰与吉利联合开源两款多模态大模型
- OpenAI 前员工们大闹硅谷!离职 CTO 卷走大半骨干创业、联创公开 37 页训练 PPT,还有现员工准备出走
- 20万卡吞金兽 Grok 3 炸裂登场,卡帕西大神亲测:性能超过DeepSeek R1!马斯克:短期不开源
- 春晚BOT扭秧歌的科技“秘籍” | 文末赠书
- 微信也接不住DeepSeek的流量?
- DeepSeek 颠覆了什么?学习不靠“人盯”,AI自己“卷”自己
- 比亚迪掀起“全民智驾”风暴:接入 DeepSeek,7 万级车型标配高阶智驾
- 百度、字节高管隔空互怼;月之暗面或因DeepSeek调整重心;腾讯已对微信接入DeepSeek灰测 | AI周报
- 越挫越勇的大前端 | 直播预告
- 赶紧放弃强化学习?!Meta 首席 AI 科学家杨立昆喊话:当前推理方式会“作弊”,卷大模型没有意义!
- 基于百川大模型的首个AI儿科医生正式“上岗”:会诊结果可与专家高度吻合
- 还没发布,xAI 工程师公开承认 Grok 3 不如 OpenAI,遭马斯克怒火解雇!马斯克:Grok 3 打遍天下无敌手
- 刚搞大模型不久时的梁文锋,发表了一次公开演讲
- 腾讯元宝接入 Deepseek-R1 满血版,支持联网搜索并整合公众号信息源
- 刚刚,百度宣布文心下一代模型开源!
- 十多个模型打不过 DeepSeek 一个?奥特曼受不了了:怒将 GPT 和 o系列合并,非思维链模型到头!
- 连播12天!深度揭秘 DeepSeek | 直播预告
- 百度宣布:文心一言4月1日起全面免费,退费事宜已同步展开
- “阿里是当下苹果最好的选择,甚至可能没有之一”
- 元宵节撞上 DeepSeek,这场脑力风暴,谁能赢走超级豪礼?
- 谷歌 Vertex AI 推出新的 RAG 引擎
- DeepMind 也酸了?CEO 怒喷 DeepSeek 成本是炒作:很多技术都来自谷歌和 DeepMind
- 欧版 AI“星际之门”官宣:马克龙狂投 1090 亿欧元,Mistral 也是要好起来了!
- 马斯克团队豪掷 970 多亿美元要收购 OpenAI,Altman:婉拒了哈,不如我买下 Twitter 呢
- “首席炒作官”Altman “碰瓷”摩尔定律引社区不满,1400万美元广告被批“都能训练3个DeepSeek V3了!”
- 从 DeepSeek 看 AI 编程新热潮:我们离 “告别手敲代码” 还有多远?| 直播预告
- Meta 即将开启全公司大裁员,不会透露更具体细节
- DeepSeek一周:日活超豆包、云平台抢食算力、卖课疯赚;用AI大量替代员工?创始人声明;字节辟谣员工被送精神治疗|AI周报
- 招聘 Agent 来了:可自动执行多数招聘和录用任务,30 名员工公司每月成本最高 500 美元
- 大学生打头阵,马斯克用AI“大闹”联邦!拨钱靠微软Azure审、管理用机器人,企业抢单抢疯了?
- 刘知远详解 DeepSeek 出圈背后的逻辑:自身算法的创新以及 OpenAI 的傲慢
- “李飞飞团队 50 美元炼出 DeepSeek R1”被质疑,上海交大本科生新“低成本推理”或成新宠!
- 国产 DeepSeek V3 被秒成”前浪”?谷歌开放最强 Gemini 2.0 全家桶:速度快60倍,上下文还长16倍!
- 日本 AI 公司发布自适应大模型,可动态调整其权重以完成各种任务
- 等不到 OpenAI 开源了!5 个工程师 24 小时手撸免费版 Deep Research,效果直追正主、过程全公开
- 观点博弈:我们还应该期待AGI吗?
- “针对的就是 DeepSeek!”美国空前力度打压中国 AI:只要下载中国开发模型就可获 20 年监禁或百万美元罚款!
- 研究:尽管关系紧张,但中美AI研究合作过去10年仍然活跃而顺利
- 17 岁移民、不懂大模型,但他靠 AI 逆袭!一夜之间到账数十亿,这个小众赛道赚麻了!
- o3-mini之后,OpenAI又紧急上线Deep Research,能连续思考半小时输出万字回复!压力给到了DeepSeek?
- 奥特曼承认DeepSeek削弱OpenAI地位,特朗普、黄仁勋再限芯片出口;除夕给表白员工发钱,CEO称促成几对情侣|AI周报
- 让大模型读懂善用知识库!清华等团队推出 UltraRAG 框架全家桶
- OpenAI 最新测试 o3-Mini 打败 DeepSeek R1?奥特曼终于亮招:GPT-5 也快来了!
- DeepSeek引爆的一场技术裂变:中美AI权力游戏白热化,矛盾蔓延全球
- Cursor神器助力,三月速成AI APP狂揽万用户,编程门槛真降低了?
- 硅谷巨头们疯狂“破防”:把DeepSeek干成下一个TikTok?美国网友都看不下去了
- 卡内基梅隆学霸卖爆8千元AI鞋,现回浙江老家继承家业!曾在劳斯莱斯一年做到leader
- 美国终于要对 DeepSeek 下手了?微软、OpenAI 开始联合调查 DeepSeek
- 这届春晚开始拼技术了!AI大模型绝美定格、机器人扭秧歌,云使用量达历年之最
- DeepSeek震动硅谷AI圈,GPT-5还秘而“不发”?7千亿利润奥特曼都看不上了
- DeepSeek“人均百万”传言引爆求职热潮,非算法岗应届生年薪百万,HR简历收到手软
- 一文读懂!多语言大模型数据研发在大模型时代的实战全解
- P7只拿1400元,用友年终打骨折;哇哈哈现场给员工分房;老板阴阳员工,紧急公关:奔驰接送员工上下班 | AI周报
- 微软研究院开源AIOpsLab:一个AI驱动的云运维框架
- 做 CTO 还不如自己干?他靠独立开发赢得平静自由的生活,收入比当 CTO 还高!
- 贾佳亚团队 x Adobe提出GenProp,物体追踪移除特效样样在行
- OpenAI 想了快 10 年的超级智能体终于来了!有惊喜,但比智谱晚还“翻车”系数高?
- 英伟达 RTX 5090、5080 和 5070 Ti 最新基测:不支持 DLSS 的游戏将拥有更多 AI 能力
- 用 5 万换价值 73 亿的股份?因离职让寒武纪市值蒸发 60 亿的 CTO,与老东家“开撕”了!
- 字节启动AGI长期研究计划,代号Seed Edge
- “键盘敲出火星子了”!小红书 IT 团队加班承接 TikTok 这波泼天流量,这款 AI 搜索还趁机火了
- 科大讯飞发布首个基于全国产算力的深度推理大模型X1,率先落地教育、医疗
- 中国 AI 人才缺口将达到 400 万,企业如何掌握 AI 人才资源?|附免费福利
- 拜登AI芯片新规把自家公司也坑进去了!英伟达怒斥“乱搞”,OpenAI以超越中国为由索要机密数据
- OpenAPI 很难
- 2024年AI重点事件辣评,一起来聊聊 | 直播预告
- 这群00后“杀疯”了!没靠资本、大学刚毕业狂赚7千万,TikTok助攻AI爆款应用出世
- 大模型搜广推,“新瓶装旧酒”还是“范式的革新”?
- 员工年会中608万彩票,公司要求退还;3倍工资挖人、3个月开除,大佬怒怼竟对恶意挖人;DeepSeek App正式推出|AI周报
- 谷歌 Willow 开创了量子霸权的新里程碑
- 万亿巨头豪赌AI:2025年起不招工程师,只招销售?!
- 阿里巴巴跨境电商场景下的AI模型服务实践
- 工程师利用GPT开发智能枪械视频疯传,OpenAI 吓坏了紧急制止!网友:这太危险了
- RAG 的未来,走向繁荣、重塑还是消亡?
- 连我家猫都用 Cursor 写了个 App,这个工具到底还能卷出什么奇迹?
- 大厂新年第一裁,微软全部门危!内部员工:客户宁愿跳槽也不想与我们 IT 部门打交道
- 终于等到你!“西瓜书”《机器学习》官方配套习题集重磅出版 | 送书福利
- “要点脸吧!”大模型巨头“吸血”网站资源无底线,被惹怒的开发者来“复仇”了!
- 北航&ZGCLAB 提出首个检索增强生成基准测试工具库 XRAG
- 突发!腾讯、宁德时代等被列入美国防部黑名单,旷视科技被放出!最新回应来了
- 仅用 8 张显卡和一万块钱,清华团队用7B模型打败GPT-4o数学推理
- Sam Altman 最新采访回应一切
- 显卡在偷懒?阿里大模型创作平台 MuseAI 极速模型切换技术提升 AI 创作效率
- 97家央企“一把手”年薪披露;小米汽车工厂开放对外参观,超8300人预约;清华辟谣80%毕业生出国不归 |AI周报
- 机器人技术永远不会出现“ChatGPT时刻”
- 美对华最强 AI 投资禁令正式生效,罚款上不封顶!投资人:影响不大,有利益就有人干
- 赵晨旭:非标模态的多模态大语言模型如何模拟人类主观感受
- 科研背 KPI、暴富但痛苦,41 岁DeepMind 天才科学家疑因抑郁症去世,众大佬集体缅怀
- 从企业级 RAG 到 AI Assistant,阿里云Elasticsearch AI 搜索技术实践
- 被 AI 分掉精力的数学天才陶哲轩,论文被拒了
- 微软全新原生 Copilot 应用被指是 Edge 套壳:从 PWA 转向“原生”,内存占用却飙升至 1GB
- 50 多岁转型 AI,犀利批判硅谷大厂:“先变成个混蛋才能做成事”
- 资源有限,如何构建高效能的 AI Agent
- 7 亿意外之财砸中 150 个打工人?英伟达花重金收购 AI 平台,到手就大方开源了!
- 合成数据的前景与风险
- “极限自救”中的 TikTok:太好了,是特朗普,我们有救了
- F5 预测:2025年亚太地区企业AI应用的五大趋势
- 阿里开始抓工牌;DeepSeek 新模型误认身份被疑套壳?谷歌被爆军心不稳,仅 AI 部门士气高涨 | AI周报
- AISuite:一个新的开源 Python 库,提供了统一的跨 LLM API
- 专访史忠植研究员:二十多年前就开始做 Agent 研究的中国学者
- 商汤贾安亚:大模型未来趋势是让大家变成更会用 AI 的人
- 把训练成本打下来99%!吊打GPT又“征服”OpenAI创始成员,DeepSeek“国产之光”实至名归?
- 英伟达CUDA的护城河到底有多深?
- “为Perplexity付费已没有意义!”谷歌搜索反击,发布最有“谷歌风格”的AI应用!
- AI 驱动的智能化单元测试生成:字节跳动的实践与创新
- 停摆4年后,OpenAI 偷偷启动招聘,重新开发人形机器人!前团队核心成员仍在:解散是当时最好的选择
- AICon 北京站 2024 优秀出品人与明星讲师名单揭晓,AI + Data 、Agent、多模态专场最受欢迎
- 拜登连中国生产的旧芯片都要禁了!美商务部长突然“变脸”:这禁令纯是”白忙活”
- 2025 年技术指引:让真实案例和经验为开发者开路 | QCon
- 智源一次性发布超 100 个大模型评测结果,文本到视频等多模态领域全覆盖
- GPT-5 研发一年半进度堪忧!每轮 5 亿美金训练成本打水漂,还得雇人从头“造数据”
- 百川智能发布金融大模型 Baichuan4-Finance,整体准确率领先GPT-4o近20%
- 3000+面试题,17小时专家课:程序员的求职加速包 | 极客时间
- DeepSeek核心人物千万年薪加入小米;余承东自曝智界、问界有车型亏钱卖;黄仁勋发布249美元生成式AI超级电脑 | AI周报
- 数据即将耗尽?大型 AI 公司中没有人会感到恐慌
- 全球视野下的 AI Infra:AI 出海挑战、GPU 集群解决方案与选型
- OpenAI官宣o3系列王者模型:能解最难的数学题,单个任务最高花费数千美元,越贵越好用!
- 80w起!零成本快速入门大模型指南|极客时间
- 免费o1替代品来了!谷歌新发“王炸”推理大模型:思考速度碾压其他大模型,水平堪比理科博士
- OpenAI 推出适用于 Mac 和 Windows 的 ChatGPT 桌面应用程序
- “许多 App Store 排行榜靠前的 AI 应用,像是骗钱的”
- 曾经的“自动驾驶第一股”急速掉头,CEO亲述图森未来生死时速这一年
- 豆包视觉理解模型正式发布:一元处理近 300 张高清图片,低于行业价格 85%
- OpenAI“双喜临门”:ChatGPT 热线上线,员工“年终奖”最高可达1000万美元
- OpenAI狂打“骨折价”的一天:暴降成本开放全新o1,实时 API 全面降价 60%
- OpenAI 史上最长宕机:自研 K8s 成“拦路虎”,导致数小时无法修复
- 刚刚,ChatGPT Search向所有用户免费开放!三大升级加剧AI搜索竞争,网友:谷歌正式倒闭
- Ilya Sutskever 在 NeurIPS 2024 的演讲:预训练时代已经结束了
- 18亿换来特朗普大动作?这项自动驾驶法规或被废除,马斯克力挺成最大受益者
- Liquid AI 发布新 STAR 模型架构,称比 Transformer 效率更高
- MIT教授NeurIPS现场歧视中国学生学者引争议;一AI公司半夜突然解散,已欠薪4个月;美将限华经第三国购AI芯片 |AI周报
- ChatGPT 按提示词数秒完成游戏开发,程序员们该慌了
- InfoQ 2024 中国技术力量年度榜单结果正式公布!
- OpenAI重磅推出ChatGPT Projects功能,让ChatGPT更容易管理!网友:这是几日来最有用的发布
- 出海这么多年,AI Infra层到底有哪些新机遇?| 直播预告
- 英特尔欲聘苹果芯片大牛为新 CEO,台积电创始人评:他们就是没赶上 AI 浪潮
- OpenAI版Her登场,GPT能实时视频通话了!德扑AI之父:比 o1“更受宠”的模式降临
- 我们如何在十个月内将 ARR 从 0 增长到 1000 万美元以上?
- 谷歌深夜祭出Gemini 2.0 “硬刚”OpenAI,还让开发者免费试用!Agent时代最强模型登场了?
- AI 取代低技能工作?别慌,这些领域仍是人类主场|独家对话 OpenAI 前研究员和中关村科金总裁
- 学好 Prompt,和大模型双向奔赴!| 极客时间
- ChatGPT Canvas免费啦!集成Python仿真器,支持在线修Bug,生产力飙升
- Meta 利用强化学习优化数据中心的可持续性
- Sora 刚正式登场就把OpenAI系统干废了!Altman紧急暂停新用户注册
- 智能体的未来:一家公司只需要一个 CEO?
- 这对华人夫妇创立的芯片公司,仅用 5%的员工就把市值干过了英特尔!现任 CEO:决不跳槽英特尔
- RAG 驱动的 Copilot 为 Uber 节省了 13,000 个工程小时
- 阿里合伙人为“爹味发言”道歉:自罚三个月工资;美图出售加密货币获利5.7亿;亏损11亿、上市对赌失败,公司启动全员降薪|AI周报
- “芯片女王”苏姿丰告诉员工:我们每天醒来就是要打造伟大的产品
- OpenAI狂飙突进!仅12个例子就能打造专属AI专家,核心技术竟来自字节?
- 吴恩达发布开源 Python 库,一个接口可调用多个大模型
- OpenAI深夜炸场!一口气放出o1模型全家桶,月费200美元的ChatGPT Pro被狂槽:Altman只想躺在印钞机上数钱
- 清华&面壁开源高效压缩技术:一块 80 G A100 轻松加载 50 个 7B 模型
- 谷歌最强世界模型“硬控”OpenAI 一分钟:智能体交互、替你玩游戏!等等,智能体们早在游戏里 cosplay、交友了!
- 为什么 LLM 水印永远都不起作用
- 值得开发者好好看一看的 AI 大模型入门教程(内含300道AI面试真题)| 极客时间
- 被字节索赔 800 万实习生夺 NeurIPS 最佳论文,豆包 team 邀同届获奖人现场 chat!网友:字节要钱还是要人?
- 大模型应用之路上的荆棘与曙光 | 直播预告
- 裁掉 1.5 万人后,英特尔传奇 CEO 被逼下台:18 岁入职,风雨 40 载,如今成了“背锅侠”?
- 谷歌 DeepMind 有了观察人工智能 “想法 ”的新方法
- 四年诈骗投资人千万美元,哈佛系 AI 公司创始人被捕!曾荣登福布斯榜,如今面临 42 年监禁
- 2024 AI 年度盘点:50+案例深度解析,展望2025发展趋势
- 英特尔的中国战略:PC、AI 生态和商机
- 北京一AI创业公司招0薪CTO;网易否认深圳公司全部裁员;94岁巴菲特公布后事安排 |AI周报
- YOPO: 大幅缩减你的多模态大模型计算量至12%
- 到底都是谁在用 AI 赚到钱了啊?| 直播预告
- 又又又给 AI 发明新语言了!卡内基梅隆大学让计算机理解人的想法后自动coding,结果翻车了!
- ChatGPT 2周年:从焦虑、裁员中“炼出”的GPT|文末福利
- 智谱发布自主Agent全家桶,目标:让打工人实现“光说不干”!
- AI 监工软件盯梢员工太疯狂:5 秒截屏,打字慢、上网久都拿“红牌”!网友狂喷,但巨头争相使用
- 颠覆现有 Agent 范式!清华&面壁提出新一代主动Agent交互范式
- 仅4个多月RAG就进化到“一个新时代”了:成本降低到GraphRAG的0.1%
- 两位清华大牛联手带出的明星企业,摘得Robotaxi第一股,市值超360亿!
- 科技巨头重磅发力的 AI Agent,给了谁新出路?| 直播预约
- 泄露的 Sora 效果炸裂,还一次成型!OpenAI 白嫖丑闻闹大了,吃瓜网友看到了进化版模型
- 大模型让我们成了“提词狂魔”,未来开发者核心竞争力在哪里?
- 全员停发工资、高管跑路:被小米看上的智驾明星 IPO 三度败北,前员工吐槽“越做越赔钱”
- Anthropic 工程师关于提示词工程的深入探讨
- AI 杀死了程序员培训班:花 1.3 万美元学编程,却连面试机会都没有?
- AI产品如何找到破局之道?秘塔 COO、B 站“王一快”在 AICon 带来答案!
- 孙宇晨花 624 万美元拍下一根香蕉;黄仁勋荣获港科大荣誉博士;70 多辆小米 SU7 自动泊车撞墙、撞柱 |AI周报
- 谷歌 AlphaChip 论文再被质疑,DeepMind 驳斥都没做与训练,顺带还揪出了“内鬼”?
- 强制销毁员工聊天记录!谷歌15年打造“隐瞒文化”:不要保留任何可能让我们难堪的东西!
- Pokémon Go 公司构建大型地理空间模型,玩家不知不觉贡献了训练数据
- ChatGPT 干掉了一家上市公司!千亿市值归零、10 多年 CEO 被迫离职,付费用户直呼上当
- Mooncake 分离式推理架构创新与实践
- 营收翻倍、Blackwell芯片爆单,黄仁勋否认 Scaling Law 失效,但英伟达财报后股价还是跌了
- “为什么说大模型可能是软件开发的死胡同?”
- 最大的 AI Agent 生态系统来了!微软推出适配 1800 种大模型的智能体,迈入自己的 Agent 时代
- 微软和清华大学为 LLM 提出了 DIFF Transformer 架构
- 粉丝福利 | 11 月 23 日,来一场边玩边赚钱的Party!
- 独家|腾讯杰出科学家、混元大模型技术负责人之一刘威离职
- Scaling Law,撞墙了吗?| 直播预告
- 全球超万亿使用量的热门数据库,首次被大模型揪出了严重漏洞
- 英伟达 Blackwell 芯片又又又曝问题!老黄大半年没搞定,微软们被迫换货、换方案
- 网易CodeWave:当低代码+AIGC 进入深水区,我们如何继续发展?
- AI周报 | 月之暗面杨植麟回应近期争议;马斯克或遭调查,理由是“通俄”;小米汽车校招待遇曝光,一年可达 18 薪
- 通义灵码 SWE-GPT:从 静态代码建模 迈向 软件开发过程长链推理
- 马斯克“当官”,硅谷大佬抢破头进 DOGE:零报酬、每周工作 80 个小时,录取率不到 1%
- 钉钉公布商业化核心进展:上半财年ARR远超2亿美元,6大新AI助理现已免费开放
- Anthropic创始人访谈:不是因为Altman 与微软合作而离开OpenAI、Scaling Law不会撞墙、未来招聘将放缓
- 我们为什么不遗余力地举办 AICon?
- 助推“超级有用”的应用爆发,百度把开发门槛打下去了
- 续航超 4 小时、算力 550T,这款国产自研人形机器人让家务更轻松
- AI 商业化落地难?百度“杀”出新增长
- Mojo 作者 Chris Lattner:Mojo 不仅仅是一种 AI 语言
- 挨骂 6 个月后,DeepMind 急了:诺奖模型 AlphaFold 3 代码全网免费送,Nature 也发文力荐!
- 应用突破还是炫技噱头:大模型能否真正驱动行业升级?
- 天塌了,Scaling Law 已撞收益递减墙?OpenAI 在内,所有大模型都正遭遇巨大瓶颈
- 过去一年我开发 AI 视频编辑器的收获
- 一句话改图!字节豆包通用图像编辑模型 SeedEdit 上线测试
- AI周报 | 字节弱化等级:不提倡称哥姐、隐掉职级性别;雷军或推小米驾校,1999元包训漂移?携程CEO:缩短工作时间或提高生育
- 著名 AI 学者、天工智能首席科学家颜水成离开昆仑万维,去年 9 月入职
- 微软将斥巨资 700 多亿元,从 AI 初创公司 CoreWeave 租用服务器
- 6 年 OpenAI 高管揭秘:我为什么离开 OpenAI 及这个公司现在怎样了?
- 腾讯混元康战辉:将开源大模型训练代码,但数据开源意义不大
- 谷歌版贾维斯意外泄露!自主上网购物填表不在话下,“钢铁侠 ”成真指日可待?
- 122 天打造的奇迹:深入探访 xAI 的 10 万块 GPU 超级 AI 计算机集群
- Netflix 弃用人类游戏开发转向 AI,游戏大厂不敢跟风!Netflix 高管:这是“千载难逢”的机遇
- 用 AI 赋能会议耳机,未来智能要做打工人的嘴替脑替
- 甲骨文吴承杨:生成式 AI 难以落地,缺少以 AI 为中心的应用开发架构是关键
- Meta元宇宙梦碎:5年烧光465亿美元,硬件高管跳槽,资本圈集体唱衰
- 从社区数据看大模型开发生态的全景与趋势
- 谷歌超过四分之一代码由AI生成失实?劈柴刚吹完牛,自家员工就来组团“打假”了
- 扎克伯格:人工智能生成的内容将继续存在下去
- 收录 20+数字化领先企业实践经验,《企业数字化变革与人才培养案例集》重磅发布!
- 硅谷决战美国大选!ChatGPT、Copilot们都“闭嘴”了,Perplexity 狂“秀操作”翻车
- 科大讯飞大模型竞速2年多,答卷不只是语音
- 姜萍阿里数学竞赛系老师提供帮助,学校老师被处分;英伟达取代英特尔被纳入道指;一个App实现人猪沟通 |AI周报
- 谷歌超四分之一代码由 AI 生成,CEO:我们的收入甚至超过了华尔街!
- 走近宋柔教授:78岁仍在科研前线,在语言学高校里做AI的计算语言学家
- 大模型如何进入业务?百川智能推出“1+3”产品矩阵,核心模型打差异化
- 一键取代谷歌成默认搜索引擎!ChatGPT搜索功能深夜炸场,奥特曼加速将谷歌逼向死亡
- 深度解读快手可图大模型的技术演进与应用探索
- 纯 AI 厂商早过时了!Runway CEO “手撕”大模型厂商标签,招兵买马开始转型
- 曹操出行再次冲击港股IPO,预计两年内推出完全定制化Robotaxi车型
- 中国存储厂,杀入顶分桌
- 人工智能投资热潮,芯片战争前沿
机器之心
- 纳米AI放大招!MCP万能工具箱,人人都能用上超级智能体
- ICLR 2025 | 无需训练加速20倍,清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM
- 基于奖励驱动和自组织演化机制,全新框架ReSo重塑复杂推理任务中的智能协作
- 人形机器人半马跑,技术要领 GET 没?
- 秒杀同行!Kimi开源全新音频基础模型,横扫十多项基准测试,总体性能第一
- OpenAI、谷歌等一线大模型科学家公开课,斯坦福CS 25春季上新!
- 跨机型诊断难题新突破:上交大、商飞、东航打造国产大飞机时序大模型智能诊断新路径
- 具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互
- 20万奖金池×最火技术风口!欧莱雅集团首届Agent黑客松火热开启,等你来战
- 95后团队30天造出通用超级智能体!百度心响App全量上线、人人免费用,亲测效果惊艳
- 英伟达开源「描述一切」模型,拿下7个基准SOTA
- 北航推出全开源TinyLLaVA-Video-R1,小尺寸模型在通用视频问答数据上也能复现Aha Moment!
- 大模型何以擅长小样本学习?ICLR 2025这项研究给出详细分析
- RL真让大模型更会推理?清华新研究:其能力边界或仍被基座「锁死」
- 刚刚,OpenAI推出「轻量级」Deep Research,免费用户也能薅羊毛!
- 被《经验时代》刷屏之后,剑桥博士长文讲述RL破局之路
- TTS和TTT已过时?TTRL横空出世,推理模型摆脱「标注数据」依赖,性能暴涨
- 机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手
- 刚刚,OpenAI图像生成模型API发布,Token计价,一张图花掉1.4元
- SLAM3R:北大陈宝权团队等只用单目长视频就能实时重建高质量的三维稠密点云
- 一天拿下3.4k star,这个1.6B开源模型火了,合成对话超逼真
- ICLR 2025 Oral | 训练LLM,不只是多喂数据,PDS框架给出最优控制理论选择
- 业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10
- 仅用3周时间,就打造出Manus开源平替!贡献源代码,免费用
- 清华LeapLab开源cooragent框架:一句话构建您的本地智能体服务群
- 迈向长上下文视频生成!NUS团队新作FAR同时实现短视频和长视频预测SOTA,代码已开源
- ICLR 2025杰出论文奖出炉,中国科大论文、Meta「分割一切2」论文等获奖
- 社会模拟的世界模型SocioVerse:复旦、创智学院等开源100万真实用户池,助力计算社会科学的交叉研究
- 生成式AI进入第二幕:交大携手创智学院提出「认知工程」,AI新纪元开始了
- 从Minecraft到虚幻5,AI首次实现3D游戏零样本迁移,跨游戏直接上手
- 「全球首个自回归视频生成大模型」,刚刚,Swin Transformer作者创业团队重磅开源!
- AI也要007?Letta、伯克利提出「睡眠时间计算」,推理效率翻倍还不加钱
- 连Claude 3.5都败下阵来,大语言模型能否定位软件服务的故障根因?
- WSDM 25唯一最佳论文:从谱视角揭开推荐系统流行度偏差放大之谜
- 北京中关村学院将亮相ICLR 2025!学术面基+求职直通+周边拿到手软
- 「天工Ultra」半马夺冠,人形机器人通关产业落地第一关
- RL很重要,但远非All You Need!微软副总裁:AI不靠单个技术撑起
- 百页专业报告一次直出!Jürgen团队开源框架WriteHERE,重塑AI写作天花板
- 用任务向量做模型编辑为何有效?这篇ICLR 2025 Oral论文给出了理论分析
- Sebastian Raschka长文:DeepSeek-R1、o3背后,RL推理训练正悄悄突破上限
- UIUC联手谷歌发布Search-R1:大模型学会「边想边查」,推理、搜索无缝切换
- 近40年前「拉马努金图」概率的赌局,被姚班校友黄骄阳等三位数学家用物理方法终结
- 扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源
- 合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源
- 264页智能体综述来了!MetaGPT等20家顶尖机构、47位学者参与
- 推理模型其实无需「思考」?伯克利发现有时跳过思考过程会更快、更准确
- 英特尔®具身智能大小脑融合方案发布:构建具身智能落地新范式
- 一台3090就能跑Gemma 3 27B!谷歌发布Gemma 3全系QAT版模型
- 语音合成突破:F5R-TTS首次实现非自回归模型的GRPO优化,零样本克隆性能显著提升
- 5 亿月活用户的 OpenAI ,有哪些「软肋」?
- ICLR 2025|上海创智学院人才交流会,等您来~
- 探索 Action Sapce,VLA 在如何演化?
- AI大时代凝聚青年智慧,2025WAIC云帆奖持续报名中
- 好玩!复旦与阶跃星辰联合发布SVG矢量图生成大模型OmniSVG!挑战3万Token极限
- 从国家级实验室前沿技术到聚焦能源智能化落地,中科类脑获国家级产业资本亿元投资
- Jeff Dean演讲回顾LLM发展史,Transformer、蒸馏、MoE、思维链等技术都来自谷歌
- AI应用创业公司:大模型最近的突破,全是作弊
- 4月24日相约新加坡,机器之心请大家吃饭,还有超多岗位等你来
- RSS 2025|ConRFT: 真实环境下基于强化学习的VLA模型微调方法
- 刚刚,豆包1.5·深度思考模型上线,特供「视觉版本」,大模型多模态推理的时代真来了
- 报名开启|ICLR 2025新加坡,蚂蚁集团闭门研讨会、交流晚宴等你来!
- CVPR 2025|视频抠图MatAnyone来了,一次指定全程追踪,发丝级还原
- 清华学霸、OpenAI姚顺雨:AI下半场开战,评估将比训练重要
- 物理视频真实生成!大连理工&莫纳什大学团队提出物理合理的视频生成框架
- 本周日不见不散!ICLR 2025北京论文分享会最后报名了
- 4K分辨率视觉预训练首次实现!伯克利&英伟达多模态新SOTA,更准且3倍加速处理
- 刚刚,OpenAI发布最强推理模型o3!图像深度思考首秀,开源编程智能体已揽5k+star
- 从思考到行动:大模型自主工具调用能力的深度实现
- 可灵AI全球发布2.0模型,史上最强视觉模型来了!网友:人人都能手搓科幻片
- 以芯片、工具链和生态为引擎,MediaTek掀起智能体AI普及的第一波浪潮
- 何恺明的ResNet,成为21世纪被引量最多论文,Nature最新统计
- 72B世界基座模型启动,小鹏的端到端智驾正在验证Scaling Laws
- JHU提出最强ToM方法,AutoToM横扫五大基准
- Mogao=Seedream 3.0?霸榜数天,神秘文生图模型曝光(附技术报告)
- 智能体版《苦涩的教训》,图灵奖得主Sutton、谷歌RL大佬Silver新作:超人智能靠经验
- 迈向推理时代:900+篇参考文献揭示长链思维的前世今生,最全综述来了
- 继VAE之后,Adam也拿到了ICLR 时间检验奖,OpenAI联创两次获奖
- ICLR 2025 | 一行代码!FreDF频域损失稳定提升时间序列预测精度
- 「开源版GPT-4o」来了!这个17B国产模型生图效果比肩4o,还可商用
- 免费用!阿里通义大模型上新,超逼真音视频生成SOTA!
- 30年悬案告破,平均曲率流的奇点真相曝光,揭晓「冰块融化」的数学秘密
- 智谱深夜开源新一代GLM模型,推理速度快DeepSeek-R1八倍,还启用了全新域名Z.ai
- 「交交」媲美GPT-4o!上海交大推出口语对话情感大模型,首个纯学术界自研!
- 刚刚,OpenAI发布GPT-4.1!全系支持百万token上下文,全方位碾压GPT-4o并且价格更低
- 什么样的偏好,才叫好的偏好?——揭秘偏好对齐数据的「三驾马车」
- 刚刚,DeepSeek公布了推理引擎开源路径,OpenAI也将开始连续一周发布
- 合成数据助力视频生成提速8.5倍,上海AI Lab开源AccVideo
- 10万奖金×认知升级!OceanBase首届AI黑客松广发英雄帖,你敢来么?
- 更长思维并不等于更强推理性能,强化学习可以很简洁
- 过程奖励模型也可以测试时扩展?清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o
- 中科大、中兴提出新后训练范式:小尺寸多模态模型,成功复现R1推理
- 3D领域「源神」又开了两个新项目:三维部件编辑与自动绑定框架
- 不用英伟达GPU!华为盘古Ultra来了:昇腾原生、135B稠密通用大模型
- 强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展
- 3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布
- 扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得
- RL for LLMs,强化学习的 Scaling Law 才刚刚起步?
- 魔改AlphaZero后,《我的世界》AI老玩家问世,干活不用下指令
- 算法不重要,AI的下一个范式突破,「解锁」新数据源才是关键
- 苹果发现原生多模态模型Scaling Laws:早融合优于后融合,MoE优于密集模型
- 面对杂乱场景,灵巧手也能从容应对!NUS邵林团队发布DexSinGrasp基于强化学习实现物体分离与抓取统一策略
- Anthropic 首席科学家的 AI「视界」如何判别 AGI 进程?
- 原生多模态大模型也能强化学习,思维链长达几万字,商汤日日新V6来了
- ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
- 传统预训练正走向终结,推理优化与后训练提升有限,大模型今后如何突破发展瓶颈?
- 200B参数击败满血DeepSeek-R1,字节豆包推理模型Seed-Thinking-v1.5要来了
- IC-Light的视频版本来了,RelightVid:强光动态环境下的视频光照编辑神器
- MoE模型已成新风口,AI基础设施竞速升级
- 42.5 Exaflops:谷歌新TPU性能超越最强超算24倍,智能体协作协议A2A出炉
- CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别
- 闭环端到端精度暴涨19.61%!华科&小米汽车联手打造自动驾驶框架ORION,代码将开源
- 因研发FPGA工具,丛京生院士获得ACM计算突破奖
- 大模型推理无损加速6.5倍!EAGLE-3碾压一切、延续Scaling Law能力
- AI封神了!无剪辑一次直出60秒《猫和老鼠》片段,全网百万人围观
- 论文党狂喜!alphaXiv推出Deep Research一秒搜遍arXiv,研究效率直接爆表
- CVPR 2025 HighLight|打通视频到3D的最后一公里,清华团队推出一键式视频扩散模型VideoScene
- 南洋理工&普渡大学提出CFG-Zero*:在Flow Matching模型中实现更稳健的无分类器引导方法
- 全日程揭晓!ICLR 2025论文分享会我们北京见
- 从零搭一套可复现、可教学、可观察的RL for VLM训练流程,我们试了试
- 迈向机器人领域ImageNet,大牛Pieter Abbeel领衔国内外高校共建RoboVerse,统一仿真平台、数据集和基准
- UI-R1|仅136张截图,vivo开源DeepSeek R1式强化学习,提升GUI智能体动作预测
- Llama 4在测试集上训练?内部员工、官方下场澄清,LeCun转发
- 斯坦福2025 AI Index报告来了:DeepSeek在全文中被提到45次
- 类R1强化学习迁移到视觉定位!全开源Vision-R1将图文大模型性能提升50%
- 颠覆传统信息搜索,效果是之前SOTA的三倍?UIUC韩家炜、孙冀萌团队开源DeepRetrieval,让模型端到端地学会搜索!
- 首次引入强化学习!火山引擎Q-Insight让画质理解迈向深度思考
- 论文读得慢,可能是工具的锅,一手实测科研专用版「DeepSeek」
- 反向传播、前向传播都不要,这种无梯度学习方法是Hinton想要的吗?
- MoCha:开启自动化多轮对话电影生成新时代
- 铰链物体的通用世界模型,超越扩散方法,入选CVPR 2025
- Meta Llama 4被疑考试「作弊」:在竞技场刷高分,但实战中频频翻车
- ILLUME+:华为诺亚探索新GPT-4o架构,理解生成一体模型,昇腾可训!
- 解构多模态,GPT-4o 的自回归路线真的走通了吗?
- Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek
- 从0到1玩转MCP:AI的「万能插头」,代码手把手教你!
- CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo
- 大语言模型变身软体机器人设计「自然选择器」,GPT、Gemini、Grok争做最佳
- 全网都在猜,这些视频是不是字节AI生成的:该跟动捕说再见了?
- CVPR 2025 Oral | 多模态交互新基准OpenING,新版GPT-4o杀疯了?
- 7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?
- 微软诞生50周年,比尔・盖茨撰文忆往昔,并发布了Altair BASIC源代码
- 三思而后行,让大模型推理更强的秘密是「THINK TWICE」?
- CVPR 2025 | GaussianCity: 60倍加速,让3D城市瞬间生成
- 高估值对 AI 公司没有好处?
- 刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?
- 思维链不可靠:Anthropic曝出大模型「诚信」问题,说一套做一套
- 250多篇论文,上海AI Lab综述推理大模型高效思考
- 多榜单登顶!华为 & 哈工深团队提出 AdaReTaKe,突破长视频理解极限
- ChatGPT会员北美大学生全免费,持续一个月,AI帮你过期末考试
- Multi-Token突破注意力机制瓶颈,Meta发明了一种很新的Transformer
- 速来!机器之心ICLR 2025新加坡现场人才晚宴开启报名
- DeepResearcher:交大、SII发布首个真实环境强化学习「AI研究者」模型
- 为今年最火的机器人来场全球挑战赛:150万高额奖金,还有顶级硬件支持
- OpenAI的AI复现论文新基准,Claude拿了第一名
- ICLR 2025 Spotlight | 参数高效微调新范式!上海交大联合上海AI Lab推出参数冗余微调算法
- 视觉SSL终于追上了CLIP!Yann LeCun、谢赛宁等新作,逆转VQA任务固有认知
- 让AI替码农卷复杂任务,贾佳亚团队提出MoTCoder,准确率刷新SOTA
- 一篇论文,看见百度广告推荐系统在大模型时代的革新
- 2025美国最新奥数题,让大模型集体翻车,DeepSeek R1平均分也不到5%
- 脑波解码延迟仅80毫秒,实时「意念对话」技术登Nature子刊
- 近千个反现实视频构建了「不可能」基准,哪个AI不服?来战!
- 2024 AAAS Fellow名单出炉:华人学者刘威入选
- 细节厘米级还原、实时渲染,MTGS方法突破自动驾驶场景重建瓶颈
- Vibe Agent: Token成本直降90%,会对话就能创造专属本地Agent
- 自动学会工具解题,RL扩展催化奥数能力激增17%
- 20万悬赏AI美妆!欧莱雅美妆科技黑客松2025重磅来袭
- DeepSeek-R1之后推理模型发展如何?Raschka长文梳理后R1时代14篇重要论文
- 一脑多机!智源的新发布,让不同机器人轻松协作
- 在GSM8K上比GRPO快8倍!厦大提出CPPO,让强化学习快如闪电
- ICLR 2025 Oral | IDEA联合清华北大提出ChartMoE:探究下游任务中多样化对齐MoE的表征和知识
- 刚刚,奥特曼官宣开源:自GPT-2之后,我们要发首个带推理能力的开放权重模型
- Runway最新视频模型Gen-4上线!保真度、一致性、可控性做到最强
- 第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1
- 正在和DeepSeek-V3-0324做个大项目,「氛围编程」简直太疯狂了
- 清华朱军团队 | 从点云到高保真三维网格:DeepMesh突破自回归生成瓶颈
- 200美金,人人可手搓QwQ,清华、蚂蚁开源极速RL框架AReaL-boba
- ICLR 2025 | 真正「Deep」的「Research」,通过强化学习实现可自主进化的科研智能体来了!
- 吉卜力只是开胃小菜,GPT-4o一键抠图「换装换背景」!推理也初步显现
- 模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平
- 卷积网络又双叒叕行了?OverLoCK:一种仿生的卷积神经网络视觉基础模型
- CVPR 2025 | EmoEdit:情感可编辑?深大VCC带你见证魔法!
- 强推理模型下,Agent workflow 仍有必要吗?
- 「AIGC第一股」出门问问交上完美答卷:营收破2.2亿,同比增长88.5%
- 植入Neuralink脑机接口一年后,瘫痪的他找到了工作,还将重返校园
- Adobe黑科技:视频扩散降维图像编辑,ObjectMover秒懂物理规律
- GPT-4o图像生成的秘密,OpenAI 没说,网友已经拼出真相?
- CVPR 2025高分论文:从照片重建3D矢量,告别模糊渲染,重建边缘更清晰
- 从「拼能力」到「拼盈利」,AI 视频生成赛道的格局已经变了?
- 被吉卜力刷屏的背后:OpenAI模型行为负责人揭秘GPT-4o新生成策略
- 马斯克的xAI收购了马斯克的X(推特)
- 3D领域DeepSeek「源神」启动!国产明星创业公司,一口气开源八大项目
- Anthropic亲自公开Claude脑回路!
- VBench-2.0:面向视频生成新世代的评测框架
- GPT-4o的P图太火了,GPU在融化,官方终于限流了
- 3D基础模型时代开启?Meta与牛津大学推出VGGT,一站式Transformer开创高效3D视觉新范式
- 2025苹果AI学者名单公布,黄子琪、孔令东、北大吉嘉铭、清华顾煜贤等12位年轻华人入选
- 造手机的vivo,进军机器人了
- OpenAI最新官宣:Agent SDK支持MCP协议
- 这AI绝对偷了格莱美奖杯!直接把LLaMA喂成乐坛顶流:开源版Suno来了!
- 外媒:英伟达将收购贾扬清创业公司Lepton AI,交易价值数亿美元
- 把MLA和稀疏激活带到端侧!港科大广州和伦敦大学学院团队联合发布软硬协同设计的边缘语言模型PLM
- 阿里深夜开源Qwen2.5-Omni,7B参数完成看、听、说、写
- 清华稀疏Attention,无需训练加速一切模型!
- 音乐界迎来自己的DeepSeek!全球首个音乐推理大模型Mureka O1上线,超越Suno
- 谷歌终于登顶一次了!最强推理模型Gemini 2.5 Pro实测体验,真的有点东西
- 上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能
- 视频生成的测试时Scaling时刻!清华开源Video-T1,无需重新训练让性能飙升
- 300年后牛顿法得到改进,修改泰勒展开式,收敛速度更快
- 刚刚,GPT-4o原生图像生成上线,P图、生图也就一嘴的事
- Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍
- 推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1
- 挖掘DiT的位置解耦特性,Personalize Anything免训练实现个性化图像生成
- 阿里深夜开源Qwen2.5-VL新版本,视觉推理通杀,32B比72B更聪明
- 一文读懂MCP与AI工具生态的未来,它会是AI智能体的「万能插头」吗?
- DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet
- 棋盘变战场,大模型却呆了?普林斯顿、UT Austin新基准SPIN-Bench曝AI智商瓶颈
- 统一细粒度感知!北大&阿里提出UFO:无需SAM,16个token让MLLM实现精准分割
- 腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?
- 为什么明明很准,奖励模型就是不work?新研究:准确度 is not all you need
- 刚刚,谷歌Gemini Live上新功能,能看懂手机屏幕、还能实时视频
- CVPR 2025 | Qwen让AI「看见」三维世界,SeeGround实现零样本开放词汇3D视觉定位
- CVPR 2025满分论文:开源三维生成框架Craftsman3D&Dora革新三维资产生成与编辑
- 「注意力实际上是对数的」?七年前的Transformer还有新发现,Karpathy点赞
- 田渊栋和Sergey Levine参与开发新型RL算法,能通过多轮训练让智能体学会协作推理
- 用科幻建立AI行为准则?DeepMind提出首个此类基准并构建了机器人宪法
- 地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型
- 大模型江湖,算法与工程孰执生意牛耳?
- 2025 年,通用机器人要从实验室走向市场了吗?
- 揭秘DeepSeek R1-Zero训练方式,GRPO还有极简改进方案
- 强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍
- CVPR 2025 高分论文 | 单图秒变3D真人!IDOL技术开启数字分身新时代
- ICLR 2025 Spotlight|让机器人实现「自主进化」,蚂蚁数科、清华提出具身协同框架 BodyGen
- ICLR 2025北京论文分享会启动,一起探讨多模态、Agent等热门话题
- 火了!高中生用Minecraft做AI基准,用户看图投票决定大模型排名
- 13年后,AlexNet源代码终于公开:带注释的原版
- 前字节跳动AI技术专家加盟千寻智能,出任具身智能部负责人
- Roblox发布3D智能基础模型Cube,一句话生成游戏资产
- 树搜索也存在「过思考」与「欠思考」?腾讯AI Lab与厦大联合提出高效树搜索框架
- 刚刚,OpenAI开启语音智能体时代,API价格低至每分钟0.015美元
- 预测误差降低12.3%,多车协同预测框架CMP,破解自动驾驶「视线盲区」
- ICLR 2025 Oral|突破深度学习求解PDE的瓶颈,清华提出空间调控新范式GridMix
- 「让通用机器人成为现实」,谷歌RT-2、PaLM-E作者离职创业,已获英伟达投资
- DecoupledGaussian:用于基于物理交互的物体与场景解耦
- 波士顿动力真「翻」不过宇树、众擎!一觉醒来,全世界的机器人都在侧空翻
- 一个算法让LLM创新能力暴增,原来是AI学会了进化
- 李飞飞、吴佳俊团队新作:不需要卷积和GAN,更好的图像tokenizer来了
- 华为诺亚综述:生成式模型如何用于决策?
- 刚刚,OpenAI推出最贵o1-pro API!千倍于DeepSeek
- AI预判了你的预判!人大高瓴团队发布TTR,教会AI一眼看穿你的下一步
- 原作者带队再次改造xLSTM,7B模型速度最快超Mamba 50%,权重代码全开源
- CVPR 2025|复旦&微软开源StableAnimator: 首个端到端ID一致性人类视频生成,Github Star破千
- Cursor重磅上线Claude Max,工具调用一次0.05美元,充值实测一波
- NAACL2025|中国移动九天团队提出大模型调色板:一种可控文本生成的解决方案
- 专为DeepSeek类强推理加速,老黄拿出Blackwell Ultra,下代架构性能还要翻倍
- Django创造者Simon Willison分享:我如何使用LLM帮我写代码
- 世界模型在机器人任务规划中的全新范式:NUS邵林团队提出通用机器人规划模型FLIP
- 无需百卡集群!港科等开源LightGen: 极低成本文生图方案媲美SOTA模型
- 多模态也做到了强推理!工业界首个开源的R1V,让视觉思考进入o1时代
- 单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香
- 本地也能运行Deep Research!支持arXiv平台,兼容PDF、Markdown等
- 深度学习的平衡之道:港科大、港城大等团队联合发布多目标优化最新综述
- 超越DeepSeek GRPO的关键RL算法,字节、清华AIR开源DAPO
- 先别骂队友,上交如何让DeepSeek R1在分手厨房再也不糊锅?
- ChatGPT创始成员、后训练负责人官宣离职!自立门户并将获OpenAI投资
- 模态GAP不存在了?图文领域首个token级大一统基座诞生
- 想与顶级AI人才互动?来和机器之心一起共赴这4场全球学术顶会
- ICLR 2025 | 四川大学提出Test-time Adaptation新范式,突破查询偏移挑战
- Long-CoT 后,推理模型的「思维模板」有哪些新玩法?
- 不是CG?没加速?这个国产机器人跳「斧头帮」舞火了,网友:流畅到不像真的
- 真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」
- 北大团队提出LIFT:将长上下文知识注入模型参数,提升大模型长文本能力
- 大模型怎么做好角色扮演?最大的真实数据集、SoTA开源模型、最深入的评估在这里
- Long-CoT 后,推理模型的「思维模板」有哪些新玩法?
- 提前免费!百度连发两款模型,我们实测:能听歌看电影,还会蛐蛐人
- Karpathy氛围编码「吃瘪」?Cursor拒绝工作,并劝人类别依赖它
- 统一自监督预训练!视觉模型权重无缝迁移下游任务,SiT收敛提速近47倍
- ICLR 2025 Spotlight | 慕尼黑工业大学&北京大学:迈向无冲突训练的ConFIG方法
- Long-CoT 后,推理模型的「思维模板」有哪些新玩法?
- 超级Agent,鸣枪起跑
- 逐字生成非最优?试试逐「块」生成!Block Diffusion打通了自回归与扩散
- AI大佬曼宁转赞,MetaGPT团队首提「Atom of Thoughts」,原子化思考让4o-mini暴打推理模型?
- 声音比真人还像真人的Maya,背后模型开源了!跨越语音恐怖谷
- TRACE:因果事件建模助力视频理解大模型的时间定位能力
- 2025 年,消费级 AI 应用再次洗牌?
- 「压缩即智能」得到实验验证,无需预训练和大量数据就能解决ARC-AGI问题
- AI进入推理模型时代,一文带你读懂思维链
- 没有归一化层的Transformer!刘壮带队,何恺明、Yann LeCun都参与了
- 人类秒懂,AI却懵圈:VLM²-Bench揭示视觉语言模型「视觉关联」能力短板
- FP8模型不再挑卡!DeepSeek推理成本减半速度翻番,清华团队开源「赤兔」推理引擎
- 出海应用也能享受高速稳定的DeepSeek-R1?亚马逊云科技出手了
- MM-Eureka:极少数据实现多模态推理的R1-Zero时刻
- CVPR 2025 | VAST和北航开源MIDI,从单张图像端到端生成三维组合场景
- arXiv科研神器:Mistral OCR、Claude 3.7合体实现论文速读
- 一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们
- “天工行者”定价29.9万元,优必选携国家队刷新全尺寸科研人形机器人底价
- 20万美元商业级视频生成大模型Open-Sora 2.0来了,权重、推理代码及训练流程全开源!
- 超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场
- YOLOe问世,实时观察一切,统一开放物体检测和分割
- 长链推理表象下,大模型精细表征张冠李戴的本质
- 阿里妈妈搜索广告2024大模型思考与实践
- AI写的论文能过审?双盲评审6.25分,达到ICLR研讨会水平
- 百万美金炼出「调参秘籍」!阶跃星辰开源LLM最优超参工具
- 20万悬赏AI美妆!欧莱雅美妆科技黑客松2025重磅来袭
- 字节首次公开图像生成基模技术细节!数据处理到RLHF全流程披露
- 将哈密顿力学泛化到神经算子,何恺明团队又发新作,实现更高级物理推理
- GPT4规模大模型落地,Meta提ExFM框架:万亿参数基础大模型的工业级落地成为可能
- OpenAI突然发布智能体API!支持网络和文件搜索以及computer use
- 在长文本上比Flash Attention快10倍!清华等提出APB序列并行推理框架
- 18项任务200万视频编辑对,云天励飞联合多高校打造出大规模编辑数据集
- 刚刚,2024图灵奖颁给了强化学习之父Richard Sutton与导师Andrew Barto
- 英伟达RTX 5070评测解禁:老黄承诺4090级性能?不存在的
- 大规模实用化量子化学计算曙光显现,ByteDance Research开源工具集ByteQC
- 大模型推理新范式!清华&蚂蚁:用编程思维来思考,用自然语言来表达
- 为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理
- 上海AI Lab最新推出Mixture-of-Memories:线性注意力也有稀疏记忆了
- 视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源
- 为DeepSeek MoE模型带来「免费午餐」加速,专家链可大幅提升LLM的信息处理能力
- DeepSeek R1与OpenAI模型文风相似度高达74.2%?新研究质疑DeepSeek训练数据
- 半个世纪后,著名的麦凯猜想终获证明!数学家夫妇终结了一个未解群论难题
- 北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准
- DPO-Shift:一个参数可控改变DPO分布,缓解似然偏移
- 刚刚,Anthropic完成35亿美元新融资,估值飙升至615亿美元,网友催发Claude 4
- 生成与理解相互促进!华科字节提出Liquid,揭示统一多模态模型尺度规律!
- DeepSeek推出后,移动端AI风向要变
- 多元推理刷新「人类的最后考试」记录,o3-mini(high)准确率最高飙升到37%
- ICRA 2025|清华x光轮:自驾世界模型生成和理解事故场景
- 南大周志华团队获奖,AAAI 2025杰出论文奖出炉
- 灵初智能发布端到端VLA模型Psi R0.5,仅需两小时数据实现物品、场景全面泛化
- 让大模型成为能够操控计算机的智能体,作者带来OmniParser V2详解
- 中国团队首次夺魁!无问芯穹FlightVGM获FPGA’25最佳论文,峰值算力超GPU,抹平21倍
- 杭州国资押注大模型,智谱AI获超10亿元战略融资
- AI已精,硬件何愚?
- 将越狱问题转换为求解逻辑推理题:「滥用」推理能力让LLM实现自我越狱
- DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码
- 千万网友围观,两个语音AI开始加密通话,网友:中间真没骂我两句?
- ICLR 2025 | 机器人安灯泡、切东西都能拿捏,可操控轨迹跟踪的DexTrack来了
- DeepSeek R1也会大脑过载?过度思考后性能下降,少琢磨让计算成本直降43%
- 微软原WizardLM团队:代码大模型WarriorCoder,性能新SOTA
- DeepSeek一天能赚多少钱?官方突然揭秘V3/R1推理系统,成本全透明
- 16G显存4499元起香爆!AMD RX 9070系列显卡震撼发布,游戏、AI性能狂飙
- 大模型是否有自知之明?新研究发现LLM可以知晓自己的知识范围
- ICLR 2025|AI不语,只是一味根据人类意图推理3D空间定位
- 消失的 Cortana,桀骜不驯的 OpenAI?
- MIT三人团队:用Transformer解决经验贝叶斯问题,比经典方法快100倍
- 探索跳跃式思维链:DeepSeek创造力垫底,Qwen系列接近人类顶尖水平
- 开源的胜利!RISC-V与AI今日全面「会师」
- Karpathy更新AI科普视频,网友:原本周末打算结个婚,改看视频了
- 谷歌发布BIG-Bench超难基准:DeepSeek-R1得分6.8,只有o3-mini超过10分
- ICLR 2025|浙大、千问发布预训练数据管理器DataMan,53页细节满满
- DeepSeek开源周最后一天:让数据处理「从自行车升级到高铁」
- ICLR 2025 | 让大模型更懂时序的语境对齐来了!性能更优开销更低
- 刚刚,GPT-4.5问世!OpenAI迄今最大、最贵模型,API价格飞涨30倍,不拼推理拼情商
- CVPR 2025有作者用AI生成审稿意见,被发现了,论文也被拒了
- 无编码器架构潜力或被低估,首个无编码器3D多模态LLM大模型来了
- 不要自回归!扩散模型作者创业,首个商业级扩散LLM来了,编程秒出结果
- 微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B
- 研究多模态?快来申报这个基金
- ICLR 2025 | 西湖大学提出闭环扩散控制策略,高效与闭环兼得
- DeepSeek一口气开源3个项目,还有梁文锋亲自参与,昨晚API大降价
- MLSys’25 | 极低内存消耗:用SGD的内存成本实现AdamW的优化性能
- HumanUP:从机器人自主起身到contact-rich locomotion任务的讨论
- 500万TPM+20msTPOT,火山引擎用「AI云原生」重构大模型部署范式
- 今天,OpenAI Deep Research已向所有付费用户开放,系统卡发布
- 千帧长视频时代到来!MIT全新扩散算法让任意模型突破时长极限
- DeepSeek开源通用矩阵乘法库,300行代码加速V3、R1,R2被曝五月前问世
- 何恺明带队新作「分形生成模型」:逐像素建模高分辨率图像、效率提升4000倍
- 重磅官宣!头部量化宽德投资入局科技型通用智能!
- 开源的风吹到视频生成:阿里开源登顶VBench的万相大模型,一手实测来了!
- 从零开始自主「起身站立」,上海AI Lab发布最新控制算法,机器人:起猛了
- Transformer作者之一Niki Parmar加入Anthropic,参与Claude 3.7 Sonnet研究
- 超越DeepSeek-ProverV1.5!豆包首个形式化数学推理模型BFS-Prover来了,直接开源
- 刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!
- 2025 WAIC 云帆奖开启全球报名:集青年之智共铸 AGI 未来
- 仅靠逻辑题,AI数学竞赛能力飙升!微软、九坤投资:7B小模型也能逼近o3-mini
- 全球首个混合推理模型:Claude 3.7 Sonnet来袭,真实编码力压一切对手
- 「知识蒸馏」+SFT,可得「推理」否?
- 稀疏注意力再添一员,华为诺亚推出高效选择注意力架构ESA
- 模型安全武装,复旦新研究实现SOTA扩散模型风险概念擦除效果,入选AAAI 2025
- 联手华为诺亚,南大LAMDA组获EDA顶会DATE 2025最佳论文
- 开源赛道太挤了!月之暗面开源新版Muon优化器
- 从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
- 扩散模型新突破!无需微调,就能高效稳定移除目标物体
- 刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中
- 征稿|CVPR2025首届ViSCALE研讨会,探寻计算机视觉的推理扩展律
- 人刚毕业,代码一点不会,他纯靠ChatGPT写APP,年入千万美金
- 3倍提速!现在你跑不过机器狗了,限制波士顿动力机器狗的竟然是电池功率?
- Bengio参与,扩散模型+蒙特卡洛树搜索实现System 2规划
- ICLR 2025|南洋理工大学AvatarGO,探索4D人与物体交互生成新方法
- 人刚毕业,代码一点不会,他纯靠ChatGPT写APP,年入千万美金
- 3倍提速!现在你跑不过机器狗了,限制波士顿动力机器狗的竟然是电池功率?
- 「知识蒸馏」+SFT,可得「推理」否?
- ICLR 2025|南洋理工大学AvatarGO,探索4D人与物体交互生成新方法
- DeepSeek估值暴涨,昔日的AI明星独角兽企业们怎么样了?
- YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世
- 干完几星期家务,1X新款人形机器人亮相,和冰箱一样安静
- 地平线高阶智驾北京市区实测:全程零接管,轻松应对复杂路况
- 一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA
- 出人意料!DeepSeek-R1用的GRPO其实非最优?规模化强化学习训练用PPO就够了
- 机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA
- 全球首个AI CUDA工程师来了!将PyTorch原生实现提速10-100倍
- 大模型扩展新维度:Scaling Down、Scaling Out
- 踹了OpenAI后,Figure光速发布具身大模型Helix,能力前所未有、创多项第一
- 两万字长文深度解密DeepSeek-R1、Kimi 1.5,强推理模型凭什么火出圈?
- 再次颠覆学界想象,何恺明发表新作:扩散模型不一定需要噪声条件
- 史上最惊悚的机器人,看了让人睡不着,网友:像新鲜的尸体在抽搐
- 地表最强Grok3突袭免费体验,网友实测对比DeepSeek,发现中文彩蛋
- 重磅发现!DeepSeek R1方法成功迁移到视觉领域,多模态AI迎来新突破!
- 技术大神授课,百亿AI项目招标,2025全球开发者先锋大会等你来
- 物理直觉不再是人类专属?LeCun等新研究揭示AI可如何涌现出此能力
- 视频版IC-Light来了!Light-A-Video提出渐进式光照融合,免训练一键视频重打光
- 量子计算里程碑!微软单芯片可百万量子比特,Nature研究爆火
- 复旦主导,中美等8个国家25家单位44名学者联合发布大模型安全技术综述
- OpenAI:强化学习确实可显著提高LLM性能,DeepSeek R1、Kimi k1.5发现o1的秘密
- 大模型强化学习新发现:删减84%数据反提升效果
- 撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布,代码也公开
- 国内外多所高校招聘教职/博士后/博士生/访问学生等
- DeepSeek V3+R1满血微调工具上线!一键启动,硬件要求降10倍
- Claude挣钱强于o1!OpenAI开源百万美元编码基准,检验大模型钞能力
- 清华团队构建大型社会模拟器AgentSociety,推动智能社会治理与研究范式变革
- ICLR 2025 Spotlight | 让城市「动」起来!DynamicCity突破4D大场景生成技术边界
- 最豪华大模型创业阵容!OpenAI前CTO组建,翁荔、Schulman等ChatGPT核心成员加盟
- 刚刚!DeepSeek梁文锋亲自挂名,公开新注意力架构NSA
- 20万张GPU!马斯克掏出「地表最强」大模型Grok-3,排行榜登顶,复仇OpenAI
- 国内首个短剧创作大模型开源了,一个人就能拍短剧,单卡80秒出大片
- 接力DeepSeek,阶跃星辰直接开源两款国产多模态大模型
- 最强全模态模型Ola-7B横扫图像、视频、音频主流榜单,腾讯混元Research&清华&NTU联手打造
- 这届出题太难了!新基准让多模态模型集体自闭,GPT-4o都是零分
- 200多行代码,超低成本复现DeepSeek R1「Aha Moment」!复旦大学开源
- 刚刚,Ilya被曝正筹资超10亿美元、估值超300亿美元,知名创投Greenoaks牵头
- 超过o1-mini、逼近o3-mini,DeepSeek-R1在新的贪吃蛇基准上拿下1801分
- 北大彭宇新教授团队开源细粒度多模态大模型Finedefics
- 2024 IBM博士生奖学金出炉:韩迟、卓越、张逸骅、冯尚彬等AI研究者入选
- 「杭州六小龙」首个IPO,群核科技递表港交所,空间智能赛道开启资本化元年
- AI无法攻克的235道谜题!让o1、Gemini 2.0 Flash Thinking集体挂零
- 语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3
- 首个基于统计学的线性注意力机制ToST,高分拿下ICLR Spotlight
- 什么样的硬件产品才配得上 「AI Native」?
- 大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠
- 又一个Deep Research来了!1-2分钟抵人类专家数小时,所有人免费
- 炒菜、雕刻、绘画、汽车人变形!MakeAnything用扩散Transformer解锁多任务过程生成
- 从想太多到想不透?DeepSeek-R1等长推理模型也存在「思考不足」问题
- 刚刚,DeepSeek官方发布R1模型推荐设置,这才是正确用法
- 好活!字节,南加大,斯坦福等新开源的小人跳舞X-Dyna,人脸、背景都生动起来了
- 一图一3D世界,视频还可交互,昆仑万维「空间智能」开年首秀来了
- 苹果也在蒸馏大模型,给出了蒸馏Scaling Laws
- 清华团队新算法玩转频域时域,压缩95%计算量实现语音分离新SOTA!
- 啊!DeepSeek-R1、o3-mini能解奥数题却算不了多位数乘法?
- 免费!「DeepSeek-R1 671B满血版」不卡、不限次!问小白火速支援
- 为了让DeepSeek-R1用起来更顺畅,火山引擎将TPM上调到了500万!全网首家
- 放大招!文心一言「全面免费」,同时开启「深度搜索」,抢鲜实测!
- 单卡3090帮你一口气看完《黑悟空》,港大百度打造超长视频理解引擎VideoRAG
- DeepSeek R1不编程就能生成GPU内核,比熟练工程师好,惊到了英伟达
- 哥德尔-Prover超过DeepSeek-Prover,金驰、陈丹琦团队造出当前最强形式化推理模型
- 刚刚,奥特曼剧透GPT-4.5、GPT-5重大更新,o3取消独立发布
- 4500美元验证强化学习「魔力」,1.5B模型也能超越o1预览版,模型、数据、代码全开源
- 超越思维链?深度循环隐式推理引爆AI圈,LLM扩展有了新维度
- 淘宝卖DeepSeek安装包一月赚数十万???我们免费教你本地部署DeepSeek-R1
- 统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA
- 如何训练最强代码大模型?北大aiXcoder-7B贡献前沿实践
- 8卡32B模型超越o1预览版、DeepSeek V3,普林斯顿、北大提出层次化RL推理新范式
- 外媒:国行iPhone最终选择阿里千问?DeepSeek也出局
- 817样本如何激发模型7倍推理性能,上交大LIMO论文作者亲自解读
- 不卡顿、免费的满血版DeepSeek-R1 API,在无问芯穹这里用上了,更有异构算力鼎力相助
- 开源22万条DeepSeek R1的高质量数据!你也能复现DeepSeek了
- 网传DeepSeek R1更容易被越狱?这有个入选顶会的防御框架SelfDefend
- 本科生推翻姚期智40年前的猜想,哈希表的平均查询时间竟与填满程度无关
- 比亚迪也在接入DeepSeek!7万级标配高阶智驾,端到端全面铺开
- 飞书接入DeepSeek-R1后,用一次顶一万次,而且再也不「服务器繁忙」了
- 如何优化测试时计算?解决「元强化学习」问题
- 人大刘勇团队「慢思考」机理分析:从雪球误差到正确推理概率
- 北航推出TinyLLaVA-Video,有限计算资源优于部分7B模型,代码、模型、训练数据全开源
- DeepSeek冲击下,奥特曼刚刚给出对AGI的「三个观察」,包括成本速降
- 推理和RL加速GPT-5.5到来?奥特曼公开GPT-4.5已就绪,年底发布全自主智能体
- Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法
- 小红书语音识别新突破!开源FireRedASR,中文效果新SOTA
- 无需引导采样,清华大学提出视觉模型训练新范式
- 谷歌AlphaGeometry2攻克IMO几何难题,已超越金牌得主平均水准
- OpenAI内测Sora图像生成器,代号「papaya」,DALL-E 4即将推出?
- 图像生成迎来CoT时刻!港中文首次提出文生图的o1推理和Inference Scaling新范式!
- DeepSeek-R1、o1都低于10%,人类给AI的「最后考试」来了,贡献者名单长达两页
- Ilya的神秘公司SSI估值将达200亿美元,5个月翻四倍,却没有任何产品
- 从扭秧歌到单脚跳,HugWBC让人形机器人运动天赋觉醒了
- 历史时刻:DeepSeek GitHub星数超越OpenAI,仅用时两个月
- 华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」
- DeepSeek用的GRPO占用大量内存?有人给出了些破解方法
- 将集体学习引入树搜索,新方法CoMCTS实现o1-like的推理与反思
- ICLR 2025|小米新一代Kaldi语音识别算法CR-CTC,纯CTC性能实现SOTA
- 感谢DeepSeek,ChatGPT开始公开o3思维链,但不完整
- 817样本激发7倍推理性能:上交大「少即是多」定律挑战RL Scaling范式
- 每人50万英镑,Hinton、Bengio、黄仁勋和李飞飞等获得伊丽莎白女王工程奖
- 突发|刚加入Anthropic的OpenAI联创John Schulman,又离职了!
- 冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂
- 数学真理的极限在哪里?希尔伯特第十问题扩展版得到证明
- LLaVA-Mini来了!每张图像所需视觉token压缩至1个,兼顾效率内存
- AAAI 2025 | 大模型会组合关系推理吗?打开黑盒,窥探Transformer脑回路
- AI「视觉图灵」时代来了!字节OmniHuman,一张图配上音频,就能直接生成视频
- 自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言
- 训练1000样本就能超越o1,李飞飞等人画出AI扩展新曲线
- 70年AI研究得出了《苦涩的教训》:为什么说AI创业也在重复其中的错误?
- ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2
- 突发!人形机器人Figure宣布与OpenAI终止合作
- 免费!潞晨携手华为昇腾,国产算力DeepSeek R1推理API及云镜像服务来了
- 不到24小时,开源版Deep Research疯狂来袭!一月少花1400
- Go语言开发AI智能体有多丝滑?字节重磅开源Eino框架,内含保姆级教程
- 字节跳动BitsAI-CR:基于LLM的代码审查系统技术揭秘
- No More Next-Token Prediction?
- 刚刚,OpenAI上线Deep Research!人类终极考试远超DeepSeek R1
- 多重可控插帧视频生成编辑,Adobe这个大一统模型做到了,效果惊艳
- 解放双手!OSCAR让操作系统交互实现自然语言「自由」
- 为什么让大模型理解「内外远近」更重要?
- o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
- 完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
- 全面梳理200+篇前沿论文,视觉生成模型理解物理世界规律的通关密码,都在这篇综述里了!
- 万字长文解读Scaling Law的一切,洞见LLM的未来
- 硅谷对中国AI公司的焦虑越来越重,不只是因为DeepSeek:2025这些赛道更值得关注
- ICLR 2025 | 极性感知线性注意力!哈工深张正团队提出PolaFormer视觉基础模型
- 通过无限的后训练『补丁』,就能实现AGI吗?
- 近8年后,谷歌Transformer继任者「Titans」来了,上下文记忆瓶颈被打破
- Transformer²要做「活」的AI模型,动态调整权重,像章鱼一样适应环境
- MiniMax震撼开源,突破传统Transformer架构,4560亿参数,支持400万长上下文
- 藏不住了!OpenAI的推理模型有时用中文「思考」
- 一句话让Agent自主干活,清华复旦斯坦福等开源的智能体开发框架抢先了OpenAI
- 仅缩小视觉Token位置编码间隔,轻松让多模态大模型理解百万Token!清华大学,香港大学,上海AI Lab新突破
- 刚刚,ChatGPT开始有了执行力!
- 快手可灵凭什么频繁刷屏?揭秘背后三项重要研究
- 海内外15位博士,每人10万,字节跳动的奖学金越来越「香」了
- 国产推理大模型决战2025考研数学,看看谁第一个上岸?
- 余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一
- 思维链?思维树?华为诺亚:现在到了思维森林时刻!
- 同时提升摄像机控制效率、视频质量,可控视频生成架构AC3D来了
- Video Ocean V2.0:视频质量全面升级,依旧完全免费,薅羊毛的快乐等你来!
- o1不是聊天模型?24小时热度暴涨,奥特曼、Brockman在线围观
- 从今以后,所有淘宝天猫商家都能一键图生视频了
- 破解联邦学习中的辛普森悖论,浙大提出反事实学习新框架FedCFA
- 450美元训练一个「o1-preview」?UC伯克利开源32B推理模型Sky-T1,AI社区沸腾了
- OpenAI被曝重组机器人团队,4年前缺钱缺数据,如今要做硬件布局了
- No More Next-Token Prediction?
- ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述,覆盖主流基准库、模型
- OpenAI 不装了?左手赚钱,右手就一定有「神奇药水」吗?
- GAN归来:模型大幅简化,训练更稳定,逆袭扩散模型,AI社区疯传
- 迈向System 2推理,100页论文硬核讲述Meta-CoT
- 不停PUA大模型「写更好点」,无需其它花哨技术就能让AI代码水平暴增
- 如何高效桥接视觉和语言,字节&中大提出全新多模态大模型连接器ParGo
- 以AI之光,点亮未来工厂——人工智能赋能未来工厂论坛成功举办
- ChatGPT卷入爆炸案刷屏,AI安全正在成为最贵的学费
- 让7B千问模型超越o1,微软rStar-Math惊艳登场,网友盛赞
- OpenAI工程师亲自修订:用ChatGPT实时语音API构建应用
- 一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory
- 个人跑大模型,英伟达「皮衣刀客」新出的Project DIGITS与M4 Mac Mini到底哪个好?
- 通义万相视频生成重磅升级,成功登顶VBench,运镜、质感直达专业级
- 具身智能新高度!智元机器人推出全球首个4D世界模型EnerVerse
- 一秒内从单个图像生成3D对象,支持实时编辑,Stability AI推出3D生成新方法SPAR3D
- 引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述
- 如何证明一个数是无理数?他们找到了欧拉和黎曼错过的证明,华人数学家唐云清参与
- 老婆饼里没有老婆,RLHF里也没有真正的RL
- 黄仁勋圈重点的世界模型平台是个啥?技术报告全解析,华人贡献中坚力量
- 够新!够权威!智源研究院发布2025十大AI技术趋势
- 少用33%数据,模型性能不变,陈丹琦团队用元数据来做降本增效
- o1也会「想太多」?腾讯AI Lab与上海交大揭秘o1模型过度思考问题
- AAAI 2025 | 大模型推理加速新范式:加速比高达3.51倍、成本降至1/3
- RTX5090震撼发布,国行16499元起,黄仁勋「美国队长」pose亮翻全场
- CES 2025:AMD锐龙9000新品亮相,游戏、创作力表现超Intel旗舰
- 单张图像探索3D奇境:Wonderland让高质量3D场景生成更高效
- 手机「自动驾驶」大揭秘!vivo万字综述探讨大模型手机自动化
- OpenAI给不了的,DeepMind给,Sora联合负责人跳槽后开组新团队
- 模型越强,公司越怂?
- 突发!刚刚,OpenAI裂变成了两块:一块营利,一块非营利
- 让AI理解费马大定理的证明,两个月过去了,进展如何?
- 可在手机终端部署,人大等提出全新人物图片保护模型RID
- 视觉语言模型易受攻击?西安交大等提出基于扩散模型的对抗样本生成新方法
- 沉淀·静水流深——机器之心2024年度AI榜单揭晓
- 2024即将结束,中国AI应用支棱起来了吗?这家公司交出95分答卷
- AGI前夜的思考:2025年将出现真正的AI智能体,年轻人需要快速适应
- 轨迹跟踪误差直降50%,清华汪玉团队强化学习策略秘籍搞定无人机
- 把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源
- 国产大模型DeepSeek-V3一夜火爆全球,671B的MoE,训练成本仅558万美元
- AI点亮工厂之路:1月9日开年论坛,解锁智能制造密码!
- 围猎Suno!国产AI音乐三巨头:华语创作称雄,MV一键生成全球首创
- 超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,编程能力暴增近31%
- 中国信通院联合淘天集团发布全球首个中文安全领域事实性基准评测集,仅三个大模型达及格线
- 引入长思维链!微信基于阿里千问大模型搞出个翻译版o1
- 4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级
- 独享MRDIMM有多强?至强6性能核处理器的内存二三事
- Karpathy力荐博客:写代码的时候,请心疼一下读代码的同事
- 首次!大模型自动搜索人工生命,做出AI科学家的Sakana AI又放大招
- 模拟生命体,智源线虫登上Nature子刊封面,探索AGI的第三条路径
- 终于等来能塞进手机的文生图模型!十分之一体量,SnapGen实现百分百的效果
- 哪家AI能成卧底之王?淘天技术团队发布多智能体博弈游戏平台WiS
- 突破数据瓶颈!交大研发电脑智能体,让 AI 替你熬夜做 PPT
- Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理
- 2025秋季入学,港科广数据科学与分析全奖博士招生来了
- o3智商高达157?每13333人中才有一个这么高,网友:编码分数无意义
- 字节整新活!照片+音频让蒙娜丽莎秒变播客主理人
- 参加完NeurIPS,纽约大学教授感受到了AI博士生的焦虑与挫败
- 豆包说要「普惠」,于是大模型处理图片按「厘」计价了
- 李飞飞、谢赛宁等探索MLLM「视觉空间智能」,网友:2025有盼头了
- 2024亚马逊研究奖获奖名单:张崇杰、魏华等人入选
- AAAI 2025|时间序列演进也是种扩散过程?基于移动自回归的时序扩散预测模型
- 图学习新突破:一个统一框架连接空域和频域
- 两位数学家发现素数计数新方法,原来「p²+nq²」形式的素数真有无限多个
- 是时候停止炒作「o3是AGI」了!背后15人安全对齐团队大盘点
- 无需Tokenizer,多模态对齐融合还会是难题吗?
- 自缘身在最高层?OpenAI o1 pro竞赛级评测结果新鲜出炉
- AAAI 2025 | 开放世界的深伪检测,北交大团队:解决好无配对数据挑战很重要
- Ilya 小题大作?「预训练终结」≠ Scaling Law 撞墙?
- 刚刚,OpenAI放出最后大惊喜o3,高计算模式每任务花费数千美元
- 统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与
- 人会逆向思维,LLM也可以?DeepMind研究表明还能提升推理能力
- 重塑跨智能体灵巧手抓取,NUS邵林团队提出全新交互式表征,斩获CoRL Workshop最佳机器人论文奖
- 2025英伟达奖学金出炉,7位华人博士生入选,上交、中科大、浙大校友在列
- 图森未来陈默:自动驾驶无以为继,急转驶入AIGC游戏,已拿下金庸群侠传、三体IP | 智者访谈
- 智源发布FlagEval「百模」评测结果,丈量模型生态变局
- 推理最强也最快,谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview
- 出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资
- UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律
- 刚刚,OpenAI元老级研究员Alec Radford离职,他主导了GPT-1、GPT-2的研发
- 哗然!MIT教授NeurIPS演讲公开歧视中国学生,大会官方认错、本人道歉
- 高中生手机写出2.5万行代码的热门项目,GitHub 1900星,网友:给孩子捐个电脑
- 预训练将结束?AI的下一步发展有何论调?Scaling Law 撞墙与否还重要吗?
- 决策过程是魔法还是科学?首个多模态大模型的可解释性综述全面深度剖析
- Ilya Sutskever在NeurIPS炸裂宣判:预训练将结束,数据压榨到头了(全文+视频)
- 无人机:不是我想长腿,《Nature》论文说这样更省力
- KDD2025 | 多标签节点分类场景下,阿里安全&浙大对图神经网络增强发起挑战
- 世界模型才是智驾唯一解?造车新势力们对于自动驾驶世界模型的探索路线有何异同?
- Mamba作者带斯坦福同学、导师创业,Cartesia获2700万美元种子轮融资
- OpenAI很会营销,而号称超强AI营销的灵感岛实测成效如何?
- 李飞飞:World Labs这样实现「空间智能」
- 扩散模型=流匹配?谷歌DeepMind博客深度详解这种惊人的等价性
- 多智能体架构Insight-V来了!突破长链视觉推理瓶颈
- 微软高剑峰、哈工大(深圳)张民等四位华人入选,2024 ACL Fellow名单公布
- Sora之后,苹果发布视频生成大模型STIV,87亿参数一统T2V、TI2V任务
- 谷歌最强大模型Gemini 2.0被抬上来了,网友:好科幻
- NeurIPS 2024 | 可信大模型新挑战:噪声思维链提示下的鲁棒推理,准确率直降40%
- Sora终于来了,但卷王可灵已经「拍」上了AI电影
- 田渊栋团队论文火了!连续思维链优于CoT,打开LLM推理新范式
- NeurIPS 2024 | LLM智能体真能模拟人类行为吗?答案有了
- 数字比你想得更复杂——一文带你了解大模型数字处理能力的方方面面
- 未来工厂,AI 领航 | 年终盛会,中信泰富特钢、施耐德、博世、工业富联等大咖共探 AI 赋能工厂新范式
- 今天,ChatGPT升级为生产力工具:Canvas全量开放,人+AI协作模式启动
- 大模型「标王」硬气:不做Sora ,要帮更多企业做出Sora
- 5分钟完成最强超算10^25年工作,谷歌量子芯片重大突破,马斯克、奥特曼齐祝贺
- NeurIPS 2024 | 智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
- 从线性注意力视角揭秘视觉Mamba,清华、阿里合作提出全新MILA模型
- 「See Video, Get 3D」,智源开源无标注视频学习3D生成模型See3D
- 刚刚,OpenAI Sora正式炸裂登场,网页挤爆了!
- LLM最大能力密度100天翻一倍!清华刘知远团队提出Densing Law
- 新版Sora要来了?泄露视频引围观,网友:价格别太离谱
- 3D具身基础模型!北大提出Lift3D赋予2D大模型鲁棒的3D操纵能力
- 18k个视频、专为自动驾驶世界模型设计,DrivingDojo数据集来了
- 困扰数学家近60年的搬沙发难题疑似被解决!119页论文证明最优解,百万网友围观
- OpenAI的强化微调:RL+Science 创造新神还是灭霸?
- 打「推理补丁」之外,实现更强的AI还有哪些不一样的思路?
- NeurIPS 2024|拆解高复杂运筹问题的砖石,打破数据稀缺的瓶颈,中科大提出高质量运筹数据生成方法
- 皮卡丘的世界模型会比 Meta 先解锁 AR 元宇宙吗?
- 刚刚,2025 IEEE Fellow名单出炉:戴琼海、姜大昕、尹首一、翟广涛、褚晓文等人入选
- LeCun团队新作:在世界模型中导航
- 用LLaVA解读数万神经元,大模型竟然自己打开了多模态智能黑盒
- 突破!自然语言强化学习(NLRL):一个可处理语言反馈的强化学习框架
- OpenAI 12连发第2弹:强化微调,少量样本就能训练自己的专家模型
- 亚马逊云科技用生成式AI,向开发的复杂性动手了
- 微软「AI伴侣」Copilot Vision,让你用嘴浏览网页,还能和你一起打游戏
- 智能体模拟《西部世界》一样的社会,复旦大学等出了篇系统综述
- NeurIPS 2024 | 哈工深提出新型智能体Optimus-1,横扫Minecraft长序列任务
- OpenAI 12连更第一弹:o1完全体,200刀一个月的ChatGPT Pro
- GAN作者追忆往事:论文是DDL前一周开始写的,最初在NeurIPS大会无人问津
- 谷歌世界模型爆发:单张图生成可玩3D世界,还要和马斯克一起做AI游戏
- 具身智能热度新高!穹彻智能一年内揽获3轮融资,红杉中国领投
- NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成
- 推动大模型自我进化,北理工推出「流星雨计划」
- 刚刚,三名谷歌Vision Transformer作者官宣加入OpenAI
- 阿里妈妈首提AIGB并实现大规模商业化落地,将在NeurIPS 2024正式开源Benchmark
- 昨晚的「云计算春晚」,大模型、芯片连发,比OpenAI、谷歌上新都猛
- 被忽略的起点?Karpathy揭秘最初的注意力论文被Transformer光芒掩盖的故事
- 质量超越o1,成本仅4%,UCSD张怡颖教授团队开源生成式AI工作流自动优化器
- ChatGPT遇到这些人名开始自闭,OpenAI回应了
- 北大字节VAR获最佳论文、厦大清华获亚军,NeurIPS 2024最佳论文出炉
- VBench直接干到了第一!这一次,视频生成「压番」全场的是家央企
- 扩散模型、最优传输存在什么关系?法国数学家4页论文引网友围观
- 开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
- 关于LLM-as-a-judge范式,终于有综述讲明白了
- 刚刚,李飞飞创业首个项目引围观:单图生成交互3D场景,空间智能来了
- 2024浦东国际人才港论坛丨人工智能产业人才论坛最新日程出炉,扫码报名开启“AI人才进阶之旅”
- 离职OpenAI后,翁荔博客首次上新,引众网友围观学习(中文全文)
- 美欧亚三洲开发者联手,全球首个组团训练的大模型来了,全流程开源
- DeepMind用语言游戏让大模型学AlphaGo自我博弈,数据限制不存在了
- NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
- NeurIPS 2024|杜克大学&谷歌提出SLED解码框架,无需外部数据与额外训练,有效缓解大语言模型幻觉,提高事实准确性
- 全日程公布!NeurIPS 2024线下论文分享会,这周六我们不见不散
- ICLR 惊现[10,10,10,10]满分论文,ControlNet 作者新作,Github 5.8k 颗星
- Andrej Karpathy:神奇大模型不存在的,只是对人类标注的拙劣模仿
- Ilya 「Scaling What」的答案会是程序性知识吗?
- 关于计算机视觉中的自回归模型,这篇综述一网打尽了
- ChatGPT 发布后这两年,该关注什么?机器之心打包了24个主题350多篇高质量文章
- 三名高中生,为近百年的分形定理带来了新证明
- 陶哲轩:通义千问QwQ奥数真厉害,开源大模型顶流
- GPT-5涌现能力可预测?UC伯克利仅使用当前模型检查点预测未来模型
- 多模态慢思考:分解原子步骤以解决复杂数学推理
- 「瞄准」o1:国内大模型厂商的技术思路有何不同?过度推理成通病?
- AI现场发了2万红包,打开了大模型Act时代
- 流式深度学习终于奏效了!强化学习之父Richard Sutton力荐
- 斯坦福吴佳俊扩散自蒸馏来了!突破文生图身份保留挑战
- 算法系统协同优化,vivo与港中文推出BlueLM-V-3B,手机秒变多模态AI专家
- 上百万智能体在OASIS模拟平台上玩推特,AI玩社交媒体和真人有多像?
- 向量数据库的中场战事:长期主义者Zilliz如何全球突围
- 世界首次!智源研究院实现数字孪生心脏电功能超实时仿真
- rebuttal真的有用!这篇ICLR论文,所有审稿人都加了2分,直接跃升排名第9
- 12%计算量就能媲美原模型,Adobe、罗切斯特大学等提出YOPO剪枝技术
- LLM破局泛化诊断难题,MSSP刊登北航PHM实验室健康管理大模型交叉研究
- 刚刚,Ilya的Seq2Seq、Ian的GAN获NeurIPS时间检验奖
- Scaling Law 撞墙?复旦团队大模型推理新思路:Two-Player架构打破自我反思瓶颈
- 国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
- 遗憾不?原来百度2017年就研究过Scaling Law,连Anthropic CEO灵感都来自百度
- HuggingFace工程师亲授:如何在Transformer中实现最好的位置编码
- 跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
- Sora就这么泄露了三小时,网友调侃Altman急拔网线,艺术家们也在抗议被「白嫖」
- 创业一年半,胖了30斤,AI大佬感叹:还是回谷歌好
- 吴恩达出手,开源最新Python包,一个接口调用OpenAI等模型
- 陈天奇团队LLM结构化生成新引擎XGrammar:百倍加速、近零开销
- 「毕昇一号」DNA活字存储喷墨打印机来了,低成本、高效率、全自动的DNA存储
- 撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
- 和梁朝伟同获港科荣誉博士,黄仁勋与沈向洋对谈Scaling Law、后训练、机器人和爱情
- 更新了!带Agent的Cursor太疯狂了
- 小学二年级数学水平,跟着这篇博客也能理解LLM运行原理
- 文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
- 智能体竟能自行组建通信网络,还能自创协议提升通信效率
- AI版周扒皮!打字速度慢、鼠标超30秒未动,就被AI「警告」,Karpathy下场评论
- RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽
- RL「误人」?LeCun 在技术路线上又有何战略摇摆?
- 智能体零样本解决未见过人类设计环境!全靠这个开放式物理RL环境空间
- 研究大模型门槛太高?不妨看看小模型SLM,知识点都在这
- 大半年过去,主流视频生成模型们超越Sora了吗?
- 这才是真・开源模型!公开「后训练」一切,性能超越Llama 3.1 Instruct
- 再投40亿美元!亚马逊向OpenAI劲敌Anthropic追加投资
- 阿里国际版o1来了,Marco-o1:聚焦开放式问题推理
- 英伟达开源福利:视频生成、机器人都能用的SOTA tokenizer
- NeurIPS 2024 Oral | 还原所见!揭秘从脑信号重建高保真流畅视频
- 如今的智能体,已经像人一样「浏览」视频了,国内就有
- 仅仅一天,Gemini就夺回了GPT-4o拿走的头名
- 上交大o1复现新突破:蒸馏超越原版,警示AI研发”捷径陷阱”
- 大模型不会推理,为什么也能有思路?有人把原理搞明白了
- 全球十亿级轨迹点驱动,首个轨迹基础大模型来了
- 扣子OpenAPI突进智能语音战场!点满低延时、定制化、随时打断和音色克隆技能(内测开启!)
- 推理性能直逼o1,DeepSeek再次出手,重点:即将开源
- 诺奖得主哈萨比斯新作登Nature,AlphaQubit解码出更可靠量子计算机
- 神级项目训练GPT-2仅需5分钟,Andrej Karpathy都点赞
- NeurIPS 2024 | 水印与高效推理如何两全其美?最新理论:这做不到
- 大模型代肝,自动刷《崩铁》升级材料,Claude操纵计算机还能这么用!
- 实测昆仑万维对话AI「Skyo」,会读诗、知晓雷军摆拍
- 室温超导学术不端、多次Nature撤稿,这位印度裔学者被大学解雇
- 德国科学家激进观点:意识是虚拟的,存在于大脑构建的梦中
- 媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
- 在「最难LLM评测榜单」上,阶跃万亿参数模型拿下中国第一
- 登上Nature的AI芯片设计屡遭质疑,谷歌发文反击,Jeff Dean:质疑者连预训练都没做
- 高通的自研架构芯片,正在整合生成式AI世界
- 发力了,Mistral对标ChatGPT全面升级le Chat,还祭出超大杯多模态模型
- 大模型承重墙,去掉了就开始摆烂!苹果给出了「超级权重」
- 取人类与大模型之长,人机协作式智能软件开发框架AgileGen来了
- 面向代码语言模型的安全性研究全新进展,南大&NTU联合发布全面综述
- 精度与通用性不可兼得,北大华为理论证明低精度下scaling law难以实现
- Karpathy后悔了:2015年就看到了语言模型的潜力,却搞了多年强化学习
- 钻石冷却的GPU即将问世:温度能降20度,超频空间增加25%
- 可以实现零代码开发的OPPO智能体平台,到底强在哪?
- 继良品率低后,英伟达Blackwell又出过热问题,说好的明年初发货呢?
- NeurIPS 2024 | 自我纠错如何使OpenAI o1推理能力大大加强?北大、MIT团队给出理论解释
- 对标o1,Kimi放出了最能打的国产模型
- 怎样保证你不是AGI独裁者?马斯克为何退出OpenAI?早期邮件公开了
- 从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,照样能跑酷
- 扩展测试时计算是万能的吗?Scaling What成为关键
- 突破无规则稀疏计算边界,编译框架CROSS数倍提升模型性能
- 谁能进入下一轮?具身智能「练习生」的技术储备和商业路径有何异同?
- 传说中Ilya Sutskever精选论文清单:AI领域40大论文完整版「破解」完成
- 首个自主机器学习AI工程师,刚问世就秒了OpenAI o1,Kaggle大师拿到饱
- LeCun 的世界模型初步实现!基于预训练视觉特征,看一眼任务就能零样本规划
- NeurIPS 2024 | 无需训练,一个框架搞定开放式目标检测、实例分割
- 率先解决多类数据同时受损,中科大MIRA团队TRACER入选NeurIPS 2024:强鲁棒性的离线变分贝叶斯强化学习
- 这三家国内机构合作成果,斩获EMNLP 2024最佳论文奖,主办方:明年苏州见!
- 大模型时代需要什么样的安全水位?火山方舟首度公开「会话无痕」技术细节
- 陶哲轩:计算机通用方法,往往比深奥的纯数学更能解决问题
- Claude都能操纵计算机了,吴恩达:智能体工作流越来越成熟
- Make U-Nets Great Again!北大&华为提出扩散架构U-DiT,六分之一算力即可超越DiT
- NeurIPS 2024 Spotlight | 如何操纵时间序列预测结果?BackTime:全新的时间序列后门攻击范式
- 视觉模型学会LLM独门秘籍「上下文记忆」,迎来智能涌现的大爆发!
- 国内外六所高校、三家企业的AI人才招聘需求
- 谷歌2024博士奖学金公布,KAN作者刘子鸣等数十位年轻华人学者入选
- 穹彻智能-上交大最新Nature子刊速递:解析深度学习驱动的视触觉动态重建方案
- 外媒:OpenAI 、Anthropic、谷歌新模型表现均不及预期
- Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer,Transformer从来没有这么灵活过!
- 1000多个智能体组成,AI社会模拟器MATRIX-Gen助力大模型自我进化
- 刚刚,谷歌宣布35岁Keras之父Francois Chollet离职
- Scaling Laws终结,量化无用,AI大佬都在审视这篇论文
- WHALE来了,南大周志华团队做出更强泛化的世界模型
- 一句话爆改三维场景!斯坦福吴佳俊团队新作:场景语言,智能补全文本到3D的场景理解
- 首个多模态连续学习综述,港中文、清华、UIC联合发布
- 自动驾驶界秋名山车神!CoRL杰出论文让自驾车学会漂移,机器人整出新活
- OpenAI 联合创始人回来了,还是总裁,将更专注重大技术挑战
- 沉淀·静水流深——机器之心2024年度AI榜单正式启动
- Seed校招博士自述:我为什么选择来字节做大模型
- 连OpenAI都推不动Scaling Law了?MIT把「测试时训练」系统研究了一遍,发现还有路
- ByteDance Research登Nature子刊:AI+冷冻电镜,揭示蛋白质动态
- 当今最复杂的椭圆曲线找到了!29个独立有理点打破18年记录
- 完全开源的代码大模型OpenCoder来了,跻身性能第一梯队
- CCS 2024 | 如何严格衡量机器学习算法的隐私泄露? ETH有了新发现
- NeurIPS 2024线下论文分享会启动,机器之心邀你共赴学术盛会
- 真·打字P图!字节发布新模型SeedEdit,一句话爆改世界名画,可免费体验
- LoRA、完全微调到底有何不同?MIT 21页论文讲明白了
- GitHub超火开发者路线图库有AI学习路线了!star数近30万
- 当视觉大模型陷入认知失调,马里兰大学构建了一个幻觉自动生成框架
- OpenAI大改下代大模型方向,scaling law撞墙?AI社区炸锅了
- 教授何恺明在MIT的第二门课——《深度生成模型》,讲座PPT陆续已出
- 揭示Transformer重要缺陷!北大提出傅里叶分析神经网络FAN,填补周期性特征建模缺陷
- 「压缩即智能」,成就LLM的Transformer 未必是终极解?
- NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?
- 高能干货分享,有关提示词工程的一切都在这份教程里
- 控制器HOVER、模型π0…实现通用机器人控制的最终形态会是什么?
- 刚刚,OpenAI安全副总裁、北大校友Lilian Weng宣布离职,有时间写博客了
- AI有鼻子了,还能远程传输气味,图像生成香水
- MetaGPT开源自动生成智能体工作流,4.55%成本超GPT-4o
- 不让视觉语言模型「盲猜」,性能竟直接提升一倍?
- LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘
- 把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了
- 无问芯穹提出混合稀疏注意力方案MoA,加速长文本生成,实现最高8倍吞吐率提升
- 智能体首次达到Kaggle Grandmaster水平,华为用结构化推理补齐思维链短板
- 聚焦「视听触感官」协同配合的具身精细操纵,人大胡迪团队领衔探索机器人模态时变性挑战
- 杨笛一团队:一个弹窗,就能把AI智能体操控电脑整懵了
- 具身智能GPT-2时刻到了!这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队
- 字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%
- 结构化表格也成模态!浙大TableGPT2开源,最强表格AI问世
- 价值万亿的具身智能市场,大佬们如何从世界模型下刀?
- OpenAI o1强推理能提升安全性?长对话诱导干翻o1
- 这个夏天,天气版「山东卷」考验电网,达摩院气象大模型成功通关
- 史上第一次,英特尔在数据中心市场输给了AMD
- 腾讯混元又来开源,一出手就是最大MoE大模型
- 调研180多篇论文,这篇综述终于把大模型做算法设计理清了
- 不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用,成为网络任务智能体新SOTA
- OpenAI重拾规则系统,用「AI版机器人定律」守护大模型安全
- 手搓AI大模型应用获25万用户,果断辞职创业,结果收入不如摆摊
- ChatGPT已经慢了,这是国内AI搜索新高度,免费可用
- OpenAI也要做消费类硬件了?Meta前AR眼镜负责人加盟
- LLM超越人类时该如何对齐?谷歌用新RLHF框架解决了这个问题
- 无需训练即可大幅提升SAM 2!开源的SAM2Long来了,港中文、上海AI Lab出品
- NeurIPS 2024|新一代芯片电路逻辑综合,可扩展可解释的神经电路生成框架
- 三年前的AI设计芯片造假?谷歌深陷学术不端丑闻,吹哨人被开除并已起诉
- 清华赵明国:智能人形机器人≠智能+人形 | 智者访谈
- 15岁山东初中生做CTO,开源项目刚刚被数百万元收购了
- NeurIPS 2024 | 真实世界复杂任务,全新基准GTA助力大模型工具调用能力评测
- 高效评估多模态预训练对齐质量,中科大提出模态融合率MIR
- 这5家海内外高校招收长聘教职、博士生、研究助理等岗位
- 刚刚,阿里全球数学竞赛决赛结果公布,姜萍违反预选赛规则未获奖
- LLM 比之前预想的更像人类,竟也能「三省吾身」
- 幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
- RAG新突破:块状注意力机制实现超低延迟检索增强
- 每帧都是AI实时生成的,全球首款AI游戏问世了!
- 理所当然也能错,数学界震动:「上下铺猜想」被证伪
- 谷歌内部项目:大模型AI智能体发现了代码漏洞
- MetaGPT开源SELA,用AI设计AI,效果超越OpenAI使用的AIDE
- NeurIPS 2024|浙大 & 微信 & 清华:彻底解决扩散模型反演问题
- 奥特曼回答一切:Ilya确实看到了了不起的东西,OpenAI也缺算力
- 刚刚!ChatGPT正式成为AI搜索,免费可用
- 强化学习之父Richard Sutton给出一个简单思路,大幅增强所有RL算法
- AI自己「长出」了类似大脑的「脑叶」?新研究揭示LLM特征的惊人几何结构
- 机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws
- NeurIPS 2024 | 机器人操纵世界模型来了,成功率超过谷歌RT-1 26.6%
- 沉淀·静水流深——机器之心2024年度AI榜单正式启动
- 全自动打工「人」!波士顿动力Atlas进厂视频火了,不断电不下班
- 登上生图排行榜第一的red_panda,是家创业公司,不是国产模型
- 让机器人拥有人一样「潜意识」,英伟达1.5M小模型就能实现通用控制了
- 3D大模型助力,15分钟即可训练高质量、个性化的数字人模型,代码已开放
- 新视角设计下一代时序基础模型,Salesforce推出Moirai-MoE
- 大模型已过时,小模型SLM才是未来?苹果正在研究这个
- 恭喜!陈长汶教授荣获ACM SIGMM 2024杰出技术成就奖
- 勾股定理还能这样证明?高中生一连发现10种证明方法,陶哲轩点赞
- o1之后,GitHub又接入Claude、Gemini,网友:也杀不死Cursor
- Runway CEO:AI公司的时代已经结束了
- 导航、采矿、建造,北大这个新智能体把《我的世界》玩透了
- 国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类
程序锅锅
ScienceAI
- 在介观尺度「找不同」?ML预测材料失效,使材料设计更安全
- 人工智能接管核电站,商业化的智能核电管理是否正在路上?
- 在量子世界玩游戏?物理学家展示量子计算机新前景
- 通过成分准确预测晶体结构,一种基于ML的CSP新方法
- Nat. Mach. Intell. 封面 | 深度原理开发最佳传输模型生成化学反应过渡态
- AI进行植物学研究?中山大学等开发DeepPlant助力表观遗传学
- 从气象预测到心脏诊疗:科学智能时代,这家新型机构如何携手高校用AI驱动科研范式变革
- 定制化CRISPR来啦!高通量工程+机器学习解锁精准基因编辑,登Nature
- 从抗体、工业酶到基因剪刀设计,AI生物大模型ProGen3或将重构生命科学
- 直接指导荧光分子设计,浙大等提出模块化人工智能框架FLAME
- 两篇Nature,国内外光电团队算力硬件新进展:当AI计算开始追逐光的脚步
- 首个全场景原子级蛋白质大模型,百奥几何发布GeoFlow V2,统一生命分子的结构预测与从头生成
- Nature子刊,EPFL与上海交大用多模态Transformer精准预测全局最低吸附能,助力催化剂设计
- 评估AlphaFold3的综合基准?澳门理工姚小军、浙大侯廷军团队开发PepPCBench
- AI强化的人性化多模态视觉辅助系统,上交大开发智能便捷的穿戴设备,登Nature
- 给大卫贝克的Foldit加DLC,用游戏进行人人可参与的药物分子设计
- 聚焦人工智能-生物-工程交叉融合,一文综述即将到来的「技术创变」浪潮
- 迄今为止最大、最详细的哺乳动物脑连接图,详细展现海量神经元活动
- 结合ESM-2,杜克大学开发高效PTM感知蛋白质语言模型,实现新SOTA
- Science子刊 | 基于公平贝叶斯扰动,首个面向医学图像生成公平性的方法FairDiffusion来了
- 召回率98.5%,开源混合学习系统精准预测生物大分子中金属结合位点
- 西湖大学开发ESM-Ezy:一种用于挖掘高性能酶的深度学习策略
- 西湖大学郭天南解答AI虚拟细胞难题:在三重数据支持下的闭环学习系统
- 科学家用GNN进行不确定性量化,实现高效的分子设计,登Nature子刊
- AI发论文被顶会接收?拿到6/7/6同行评审的AI Scientist-v2有多强,技术细节来了
- 量化单个细胞中表达的一半蛋白质组,质谱技术最新进展推动SCP发展
- AI让材料科学开挂了!这场闭门会就缺你这枚“关键队友”
- 用于科研的AI:Nature教你如何选择正确地选择工具
- Nature子刊,字节跳动开发MD模拟预测框架,助力锂电池液体电解质研究
- 新SOTA,AI增强医学蛋白质组数据分析,扩散模型驱动的从头肽测序
- 无人机操控水平与人类驾驶员相当,「超级图灵 AI」通过模仿人脑进行实时推理和学习
- 仅输入prompt与序列,准确率超90%,UC伯克利等提出文本生成蛋白质多模态框架
- 53%性能全面提升,Ayu新模型横扫传统工具,分泌蛋白预测效率再翻倍
- 预测精度达93%,个人电脑可部署,科学家开发Transformer新方法预测结合蛋白
- 准确率达85%,苏大、大连理工开发多模态特征融合ML,预测工程纳米材料诱导的慢性损伤
- 皮米级精度,北大、厦大、深势等推出生成模型解析多层原子结构,登Nature子刊
- AI如何重塑全球生物多样性研究,麦吉尔大学最新综述
- 比Rosetta快250倍,亲和力提升百倍,David Baker开发原子上下文条件蛋白序列设计新工具
- 对抗灾害,理解极端气候的智能模型概述
- 一张照片,AI就能识别干燥盐溶液的化学成分,准确率近99%!
- 性能优于o3-mini,DeepMind发布通用医学开源LLM与问答Agnet,改善治疗开发
- 解密神经元活动变异性:艾伦研究所与清华揭示大脑状态如何动态调节神经编码
- 参数仅需12万分之一,训练只需2块GPU,MIT、哈佛推出生物序列建模新方法Lyra
- 神经形态计算:从实验室原型到产业变革的前夜
- 解码衰老时钟:深度学习揭示大脑衰老速度与认知功能衰退的关联
- 分子对接速度提升10,000倍,深度图学习加速RNA虚拟筛选,助力药物靶标发现
- 为矛盾的理论提供统一解释,牛津大学等揭秘非晶硅结构
- 首个评估MLLMs对地质图理解的基准集,以及专为地质图理解设计的Agent
- 搜索效率提升4倍,南大提出基于对称性原理的晶体结构预测方法
- 科学家们正利用机器学习从数千种旧药中寻找新的治疗方法
- 成效初显!基于DeepSeek强化学习的医疗VLM策略来了
- 生信工具评测方法:基于蛋白质对的计算机预测工具评估
- 迄今为止最大最全面!人类专家级准确性,AI数据驱动的生物医学知识图谱
- 剑桥团队革新RNA速率分析:AI算法突破基因动态追踪
- 第三届世界科学智能大赛火热报名中!快进来看看
- 准确率达88%,从随机性走到确定性,AI驱动的小鼠胚胎模型发育预测
- 原子级精确,David Baker团队开发RFdiffusion变体对抗体进行从头设计
- 用LLM做半导体设计,IBM&MIT提出受神经启发的LLM推理网络SOLOMON
- 无需训练即可定制分子生成:全新多模态引导框架TFG-Flow登上ICLR 2025
- 「品尝」电影里的蛋糕?智能「电子舌头」或将满足你的愿望
- MedVLM-R1:借力DeepSeek强化学习赋能医疗视觉语言模型的推理能力
- 全球首个化学反应AI「考场」,7种MLIPs模型与SOTA生成式模型同场PK
- 深度调研全球科研人员AI使用现状,威立发布权威报告中文版!
- 科学家构建多模态LLM框架,进行3D脑CT放射学报告生成
- 加速精准医疗,开源GNN实现分子精准建模,质谱识别准确率提升至49%
- AI现实动物森友会,NVIDIA携手国际组织助力野生动物保护
- 基于药效团与GPT从头生成分子,北大开发TransPharmer助力药物发现
- L²M条件,MIT团队为长文本建模建立新理论框架
- 融合图神经网络与无监督语言模型,对RNA-蛋白质相互作用精准预测
- 90%成功响应率,整合约9000个样本,统合癌症蛋白质组学的LLM驱动平台
- 扩散模型+深度学习双剑合璧,生成式AI破解染色质构象
- CPU加速最高约十倍,全复现137种已知多晶型,薛定谔公司带来全新晶体预测模型
- 纳米世界的实时电影,科学家首次使用AI以毫秒级分辨率观察原子移动,登Science
- 11天实现18种广谱抗菌素设计,体外验证成功率94.4%,浙大侯廷军等用LLM方法从头设计AMP
- Nature子刊 | 光镜电镜通用,Meta「分割一切」模型用到显微镜图像上了
- Nature封面:探索真菌网络,用机器人进行高通量延时成像研究
- Science子刊,AI与生物物理建模相结合,设计新型蛋白质
- 快1000倍,十万分之一误差,深度学习模型降低核聚变等离子体预测计算成本
- Nature:如何借助AI高效完成学术论文同行评审
- 为 AI 助力药物发现的方法
- 多中心医学图像分析模型,VFMGL框架破解数据孤岛难题,93.4% Dice系数的卓越表现
- ByteQC:通往大规模实用化量子化学计算的曙光
- 谷歌旗下带来细胞器动力学的「全息解码器」,启动亚像素级细胞器分析
- 无缝集成知识图谱,开源Python框架BioChatter降低LLM生物医学使用门槛
- 生物版DeepSeek的隐秘竞争,中国模型被视为更强对手,赛诺菲10亿美金押宝!
- 用于临床工作流程的新AI助手,微软推出Microsoft Dragon Copilot
- 首个强化生成模型AbNovo实现多目标、多约束抗体从头设计,发表于ICLR 2025
- 耶鲁、剑桥等开发MindLLM,将脑成像直接转换为文本
- 上海交通大学医学院人工智能蛋白质设计课题组诚聘助理研究员、博士后、客座学生
- 突破性进展!浙大scNiche框架精准识别细胞生态位,助力精准医疗
- 速度提升3200倍,准确率提高40%!深度神经网络+纠错码革新DNA存储技术
- 人工智能如何改变制药行业,对医学的未来意味着什么?
- 检索了15460项研究,AI与机械流行病学建模相结合:机遇和挑战的范围界定回顾
- AI 解决百万步数学问题
- 一个半月内加速药物设计,浙大侯廷军团队提出深度先导化合物优化AI新方法
- 每小时处理80,000个蛋白质,大卫·贝克、微软等发布Seq2Symm,实现蛋白质对称性精准预测
- 如何准确观察小胶质细胞在三维脑组织中的动态?DeepCellMap给出答案
- 无需侵入,一键重构细胞「电活动」,AI革新药物心脏毒性评估
- Transformer架构+分子网络,MIT模型解码癌症系统生物学
- 智能体或带来灾难性风险,图灵奖得主Bengio指明新路径Scientist AI:世界模型+推理机
- 用「完形填空」的思维生成蛋白-分子复合物,西湖大学等发布CBGBench助力药物设计
- AI改变世界的6种方式:微软AI助力农业、生态、医疗、气候、教育等领域
- 仅凭单张2D红外图像,0.78秒内重构高精度3D温度场,南京理工团队提出TMTN用于可推广的三维温度预测
- AI驱动的模拟科学家,涉及生理学、生物物理学、物理化学和量子力学多个领域,登Nature子刊
- Transformer革新药物研发:TRACER框架实现反应感知的分子设计与合成优化
- 大语言模型的进步应该如何影响科学实践?科学家们给出了不同答案
- 科学发现速度提高10倍?统计原则+智能体,斯坦福&哈佛提出自动化假设验证框架POPPER
- Science | 深度学习为3亿年的大脑进化提供了新视角
- 速度提高40w倍,牛津新的ML策略计算蛋白的自由能扰动,助力药物发现
- 南京理工团队推出基于AI增强热力学建模预测3D场景红外辐射特性的新框架
- Evo 2作者、斯坦福计算生物学家 Brian Hie:AI可发现人类无法看到的模式
- AI 生成的游戏模型,探索自由开发世界的创意实践
- 慢思考助力医学大语言模型突破数据瓶颈:上海交大联合上海AI Lab推出MedS3系统
- 清华大学AIR联合水木分子开源DeepSeek版多模态生物医药大模型BioMedGPT-R1
- 从概念到应用,清华团队开发DeepTFBU工具包助力基因表达精准调控
- 可独立提出科学发现、研发新药物?谷歌推出基于Gemini 2.0的科研助手AI co-scientist
- 预测所有物种DNA、RNA、蛋白质的形式和功能,Arc、斯坦福、NVIDIA发布最大AI生物模型Evo2
- 重建170万个细胞发育轨迹,支持多模态,AI绘制细胞时空图谱,登Nature
- 深势科技张林峰:平台化科研入口雏形初现,玻尔赋能未来教育科研
- Nature推荐的大模型,现如今最好用的AI工具应当更好地助力科学研究
- AWS与纪念斯隆凯特琳癌症中心合作加速药物研发
- 自动化、高精度,告别人工测量!Meta SAM模型高效解析复杂纳米颗粒
- TOMG-Bench:大语言模型开放域分子生成新基准
- 哈佛、英特尔等60+顶尖机构联手打造:NeuroBench定义神经形态计算评测新范式
- 打破AI遗忘诅咒的学习算法,慕尼黑-南大团队打造会自主积累知识的学习框架
- 超强DNA大模型「GENERator」问世!解锁生命密码设计新范式
- Science新登,David Baker团队用AI从头设计栩栩如生的酶,比同类设计好6万倍
- 复旦团队提出Transformer生成的原子嵌入策略,可通过ML提高晶体特性的预测准确性
- 智能电子粘附皮肤:机器人与环境交互的新进展!
- AI做生物实验?还能迭代?浙大集成PLM和「自动化生物工厂」革新蛋白质工程范式
- 令人惊讶的发现,谷歌混合数模量子计算机揭示了磁性的新面貌
- 无需配对训练数据集,AI赋能协助全新无标记成像显微镜
- AI突破抗药性困境!山大团队融合潜在扩散模型与MD设计新型抗菌肽
- 轻量开源!微软基础模型LLaVA-Rad:自动生成高质量放射学报告
- Nature子刊新登,如何检测小分子机器学习中的覆盖率偏差
- 登Science,MIT团队推出新蛋白质语言模型ProtGPS,预测蛋白在活细胞内的功能位置
- ICLR 2025 | Deep Signature 高效表征生物大分子复杂运动的新方法
- PNAS顶刊 | 抗体中和活性提升1000倍,百奥几何生成式AI高效反击病毒新变种
- 从人才流失到智慧回流:AlphaFold 试图重塑非洲科研DNA
- AI+超材料双向突破,浙大综述揭示超材料研究进展,登Nature子刊
- 从纳米到秒级:NanoPyx用AI技术革新显微镜图像处理,效率大幅提升!
- LLM时代,计算蛋白质科学进展如何?香港理工大学等发布系统性综述
- Nature:OpenAI推出AI研究助手,深度综述能力引发学界关注
- LLM自主发现发表在Nature上的科学假设?ICLR 2025 论文MOOSE-Chem深度解析
- Nature报导:研究人员如何使用 AI?科学领域利弊调查分析
- 2024 年 AI 十大故事,透视技术变革与未来挑战
- 清华团队 AI 光学计算新突破:光谱卷积神经网络芯片,数据吞吐量降低了96%!
- 光中介层可能在 2025 年开始加速 AI
- 人工智能会彻底改变药物研发吗?这取决于如何使用
- 革新疾病预测:释放 AI 和机械模型的力量
- AI for Science:北大、东方理工等团队用人工智能在实验数据中挖掘潜在规律
- 医疗AI的隐形危机:大语言模型过度自信,如何破解?
- 成功率达100%,上交团队提出AI辅助的酶热稳定性工程策略,设计热稳定性的组合突变体
- 锌电池「返老还童」:电子科大联手湖北大学破解枝晶难题,效率提升99.95%!
- 赛博树突觉醒!AI 仿生革命:更少参数,更强性能,过拟合?不存在的!
- Nature发布:2025年值得关注的七项技术
- AI语言模型的「人脑模式」:增量上下文机制如何让机器读懂长文本?
- David Baker 利用 AI 设计蛋白质,一招制蛇毒,或将彻底改变蛇咬治疗
- 实现5Å全原子RMSD,普渡大学深度学习方法准确预测RNA三级结构,登Nature子刊
- 验证速度提升25倍,准确率达95.1%,清华团队提出基于物理信息学习的电池衰减预测方法
- DARWIN 1.5 来啦!材料设计通用大语言模型,刷新多项实验性质预测记录
- 「定制化」结合蛋白质,几何深度学习方法加速开发精准药物,登Nature
- 锌电池「返老还童」:电子科大联手湖北大学破解枝晶难题,效率提升99.95%!
- 打造科学研究“革命的工具”,『AI4S攀登者行动计划』开放申请
- 活性提高42倍,ML引导的无细胞表达加速酶工程,登Nature子刊
- 高灵敏探索质谱,滑铁卢、中原AI院团队基于深度学习的端到端方法
- AI赋能蛋白质研究:SaprotHub让蛋白质AI模型训练和调用不再有门槛!
- 告别「滤镜」:上理工、上交大团队发布AI赋能的新一代荧光显微镜
- 灵敏度高达94.9%!牛津团队AI多模态ctDNA检测方法,进行癌症早期筛查
- AI伪造论文渗透学术圈:Google Scholar成虚假科学温床,如何应对?
- 预测精度媲美实验!哥大团队开发可解释细胞「基础」模型,揭示213种人类细胞调控语法
- 看破不可见数据集,自我监督学习成为细胞组学新的复杂系统处理利器
- AI病毒进化预测新突破,北大团队进化启发通用预测框架登Nature子刊
- 交大O1医疗探索:延长AI思考时间,解锁复杂推理诊断
- AI预测自然灾害,全球首个支持全天候灾害响应的多模态超高分辨率数据集BRIGHT
- AMD与约翰霍普金斯大学联手:AI实验室copilot自动化科研,成本节约84%!
- AI生物学家:当「基础模型」撞上「生物学混沌」,谁才是解谜高手?
- AI 驱动科学大爆发!从蛋白质到数学证明,2024 年最值得关注的科技突破
- 病毒接下来会做什么?AI 正在帮助科学家预测它们的演变
- 给AI一个词就能测出科研创造力?人大高瓴团队最新研究:模型智商高未必最有创意
- 麻省理工Nature子刊:AI加速量子化学计算,精度媲美「金标准」,计算效率提升百万倍!
- AI驱动的药物研发领域,AMD与Nvidia展开正面交锋
- 分子特性预测新框架来了!浙大侯廷军团队、匹兹堡大学联合提出跨通道学习,各大基准表现亮眼
- 逆向设计电路,深度学习开辟全新的自动综合道路
- 准确预测蛋白质功能新SOTA,中南大学推出全新深度学习模型,登Nature子刊
- 支持细胞与细胞器建模,更全能的空间算法推动更高效的细胞时空研究
- AI华佗?港中大、深圳大数据研究院提出医疗推理大模型HuatuoGPT-o1
- 简化芯片设计传统,AI训练的新型算法正改变芯片研发范式
- 关于ScienceAI投稿的相关说明
- GPT做不好图生成?Tokenization是关键!新方法重新定义图生成和表示方式
- 人工智能走向核能,互相依赖的时代发展新搭档
- 中国版GPT-Zero,仅1000样本训练5分钟即超越传统检测性能,复旦、武大等提出ImBD:通用AI内容检测器
- Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期
- AI模拟细胞,走向全新虚拟生命,斯坦福团队呼吁是时候走出全新的一步了
- AI幻觉能助力科学重大突破?诺奖得主Baker用得可香了
- Science子刊,斯坦福AI方法表示蛋白互作节点,增强功能识别与PPI推理
- ScienceAl 2024「AI+药物&医疗&基因组&细胞」专题年度回顾
- 意念操控电脑,如手掌般精准!脑机接口新技术登Nature子刊
- 迈向Z级计算:Cloud4Science范式加速科学发现进程
- 医疗智能导诊助手来了,复旦大学、复旦附属眼耳鼻喉科医院、中山医院吴淞医院联合发布PIORS
- 像拼乐高一样设计新药,EPFL、牛津团队AI方法精确设计优化分子3D结构
- 直逼记录极限,机器学习助力开发全新钙钛矿电池原料
- 速度提升44%,节能153倍,清华使用内存计算硬件高效标记数据
- ScienceAI 2024「AI+材料&化学」专题年度回顾
- 高精度识别多材料系统,谷歌DeepMind深度学习方法预测晶体材料,登Nature子刊
- ScienceAI 2024 「AI+气象科学&宇宙&物理学」专题年度回顾
- 超三万种材料,近百万真实材料合成表征信息,LLM精准构建材料知识图谱MKG,登NeurIPS 2024
- 空间蛋白质组学:构建复杂组织的尺度图谱
- ScienceAl 2024「AI+蛋白&核酸&分子互作」专题年度回顾
- 麦吉尔大学Ding Lab基于深度学习开发单细胞水平转座子位点表达定量模型,登Nature子刊
- 跨物种纳米抗体虚拟筛选,清华集成深度学习和蛋白质语言模型,登Nature子刊
- 耗时缩短十倍以上,大规模AI方法加速原子模拟进程,推动更泛用的策略发展
- 发现高能钠离子电池成分,机器学习简化最佳材料搜索过程
- 芝大、清华团队分析了6800万份论文表明,AI可能会降低科学家的创造力?
- 新SOTA,浙大、中科院深度学习模型可靠、准确预测蛋白-配体,助力药物开发
- Science子刊,理解更真实的溶液,ML力场将速度提升六个数量级,更高效表征水分子时空关系
- AI for Science 是科学的未来,NVIDIA 正加速它的到来
- 张璇、周光敏团队在随机退役条件下基于生成式学习的电池健康状态评估与可持续回收研究中取得新进展
- 性能远超当前SOTA,首个可解释RNA的AI植物基础模型来了,整合1124种植物RNA信息
- 精度提升20%,中科院、南京理工AI方法进行光电子能谱高维数据精细解析
- Nature子刊发表稳定学习新进展:清华等开发多中心可泛化生存分析模型
- 自主设计实验,速度提高2.5倍!马普所AI方法拓展显微镜使用边界
- 关于ScienceAI投稿的相关说明
- 准确率达95%,混合深度学习搜索纳米生物材料,登Nature子刊
- 机械系统也能自主学习!密歇根大学团队构建了全新数学框架,登上Nature Communications
- LLM学习原子「结构语言」,生成未知化合物的晶体结构,登Nature子刊
- 量化617,462种人类微蛋白必需性,北大LLM蛋白质综合预测与分析,登Nature子刊
- AI揭示太阳大气中的隐藏秘密,将改变我们对太阳的理解
- 字节&北大Nature子刊新成果:自旋本征态的高效精确求解
- 全球顶尖天气预报系统被AI击败,DeepMind新模型登Nature,8分钟搞定未来15天预测
- 仅总参数量0.1%、单GPU 15分钟完成微调,人类基因组基础模型NT登Nature子刊
- 打破GNN与语言模型间壁垒,图辅助多模态预训练框架用于催化剂筛选,登Nature子刊
- 精确属性控制,湖大、西电从头药物设计AI方法,登Nature子刊
- 准确、快速地从头预测RNA 3D结构,港中大、复旦等深度学习方法RhoFold+登Nature子刊
- 准确率84.09%,腾讯AI Lab发布Interformer,用于蛋白质-配体对接及亲和力预测,登Nature子刊
- 谷歌推出 Caravan MultiMet,利用各种气象数据增强水文预报
- 压缩率达10的48次方,实现蛋白序列空间极端压缩,清华EvoAI登Nature子刊
- 6.85亿次AI加速模拟,分析2万种材料,Meta发布催化剂数据集OCx24
- 高精度预测蛋白构象变化,中国科大、上科大通用深度学习模型
- 探索蛋白质动态变化,新AI方法JAMUN比标准MD模拟更快、更准确
- 2秒完成检测,将AI与3D打印相结合,科学家实现小型核反应堆高级监测
- 无需预训练,亲和力与天然蛋白相当,中国科大的蛋白质从头设计方法登Nature子刊
- 「颠覆性」科学没有衰落,谷歌 AI 推动科学发展的 9 种方式
- 计算效率领先10倍,中国科大、哈佛功能蛋白质设计深度生成模型登Nature子刊
- 九大成像模式一键解析,生物医学图像AI再迎突破!微软、UW等BiomedParse登Nature子刊
- AlphaFold3级性能、开源、可商用,MIT团队推出生物分子预测模型Boltz-1
- 蛋白预测从数月缩短至数小时,MassiveFold出于AlphaFold而胜于AlphaFold3
- 生成超10万bp的DNA序列,北理工邵斌团队生成式DNA大语言模型,登Nature子刊
- 登Science封面!基因组基础模型Evo重磅发布,AI解码分子、DNA、RNA和蛋白质
- 分子表征从「图」到「视频」,1.2亿帧、200万分子,湖大分子视频基础模型登Nature子刊
- AI面临的五个蛋白质设计问题,Nature找了一群专家来讨论
- AlphaFold3开源了,诺奖AI工具人人可用,开启生物分子设计新时代
- ByteDance Research登Nature子刊:AI技术助力冷冻电镜揭示蛋白质动态
- 改进蛋白突变稳定性预测,清华龚海鹏团队AI蛋白工程模型登Nature子刊
- AI预测序列与催化性能的潜在关系,中国科学院、北师大设计合理酶变体,登Nature子刊
- 谷歌、MIT等开发多智能体医疗决策框架MDAgents,医学LLM新用法
- 香港科技大学(广州)助理教授戴恩炎招收AI for Protein全奖博士及实习生
- 数字病理与AI辅助诊断,助力肿瘤精准诊疗
- 量子级精度,静态到动态,微软蛋白MD模拟系统登Nature
- 普林斯顿王梦迪团队提出蛋白水印方法,助力AI蛋白生成的版权保护与安全
- 贝佐斯、OpenAI领投,给机器人装AI「大脑」的Physical Intelligence获4亿美元融资
- 精准预测RNA可变剪接,浙大多模态深度学习模型SpTransformer登Nature子刊
- 创新能力超越AI Scientist,上海AI Lab「AI 科研团队」VirSci来了
- 类GPT化学语言模型,9秒生成100种化合物,微软AI药物设计平台登Nature子刊
- 为233种疾病推荐候选药物,中国科学院深度生成模型助力药物发现,登Nature子刊
- 登Nature,AI设计DNA开关,MIT团队实现精确的细胞控制
- 分类准确率达99%,山大团队提出基于对比学习的基因数据分类方法
- 准确、高效、物理有效,中科大、北大提出「两段式」分子对接统一框架DeltaDock
数据STUDIO
- 4W字,最强 Matplotlib 实操指南!
- 学生党狂喜!A5000低至0.88元/时,AI云平台开启硬核内卷
- 时间序列预测模型比较分析:SARIMAX、RNN、LSTM、Prophet 及 Transformer
- 20家单位参与,全国首部面向AI的数据标注合规标准征集中
- 78k star,像写 Markdown 一样画流程图,这个开源工具太牛了!
- DeepSeek接入个人知识库,保姆级教程来了!
- 拿来即用!9 个科研论文配图完整代码
- 后端行情变了,差别真的挺大
- DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码
- Python 实现 GRPO 简版
- 再以这样的方式编写 Python 函数,你就OUT了!
- dify v0.15.3外挂ragflow知识库,保姆级教程来了!
- 用Firecrawl构建AI驱动的网络爬虫,感觉又刑了!
- PPO & GRPO原理,小学生也能看懂!
- YYDS,哈工大博士的pytorch笔记终终终于公开了!!
- 从零开始绘制DeepSeek R1架构和训练流程
- 5 种被严重低估的统计检验
- PINN:用深度学习PyTorch求解微分方程
- 没想到,更改import方式,Python 启动提速 5 倍!
- MCP:AI 的「万能插头」
- SmolDocling:重新定义OCR文档智能处理
- 10个令人惊叹的开源AI项目,诞生了!
- 超越 DeepSeek!Meta开源Llama 4,首次采用MoE,惊人千万token上下文!
- PandasAI:当数据分析遇上自然语言处理
- AI 联网搜索时的 prompt 小技巧
- Google Gemini 2.0 网页抓取真丝滑
- 自己做一个AI问答小工具——PyQt + 星火认知大模型
- 惊呆了!在 Jupyter 中用鼠标“画”出数据集
- 亚马逊 4.8 分佳作!7500万+追更,把烧脑的算法变成连环画!
- 再见VS Code!Google IDE 正颠覆传统开发体验
- Dify 入门与工作流节点介绍
- Python 3.13 正式支持 iOS:移动开发的新篇章
- Matplotlib 丑图到期刊图表改造指南
- Matplotlib 丑图到期刊图表改造指南
- 一文详尽大型语言模型的四种量化技术
- 赢麻了!全体程序员彻底狂欢吧!这个好消息来得太及时!
- 总结了 30 段极简 Python 代码
- 隐藏马尔可夫模型的解释、真实案例以及 Python 代码
- 13年后,AlexNet源代码终于公开!带注释的原版
- 硬控 Python 代码,加速 500%
- Dify-Plus:一个定制化的Dify二开开发
- Python 中千万不要直接返回 None
- DeepSeek-VL2 心法秘籍
- 再见 Typora ! 又一款炫酷写作神器!
- 机器学习西瓜书有平替嘛
- 必知!大模型时代超常用的训练、微调、推理、部署框架(1)
- QwQ-32B 测评和使用教程来了!
- AI笔记神器NotebookLM,保姆级教程来了!
- 使用双重机器学习进行因果推断
- Manus开源复刻框架OWL,测评和使用教程来了!
- 受 Rust 启发,是时候改变 Python 编程方式了
- 商业数据分析思维
- 2025 超现代 Python 实用工具
- 学生党狂喜!A5000算力跌破1元/时,AI云平台开启硬核内卷
- 【干货】5分钟讲透数据分析之【对比分析】
- LLM强化学习算法演进之路:Q-Learning->DQN->PPO->DPO等
- DeepSeek爆火后,哈工大博士的pytorch笔记终终终于更新公开了!!
- DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码
- 2025 超现代 Python 实用工具
- 两万字长文深度解密DeepSeek-R1、Kimi 1.5,强推理模型凭什么火出圈?
- 手把手教你用Coze打造自己的“数字员工”
- 北京大学DeepSeek讲座:DeepSeek与AIGC应用
- DeepSeek 本地部署指南(基于 vLLM)
- 知识蒸馏技术原理详解:从软标签到模型压缩的实现机制
- 零基础入门:DeepSeek微调教程来了!
- 5 步玩转数据分析
- 推荐下载 | 数据分析师必备《2024 BI数据分析案例合集》
- 截胡DeepSeek开源周?Kimi深夜首发开源模型,同计算量下好过DeepSeek、Qwen?
- 8 个极其罕见但非常有用的 Python 库
- WWW 2025 SmartMem 内存故障预测竞赛
- DeepSeek R1 刷榜 Kaggle 数学奥赛挑战赛
- DeepSeek又爆了。。。
- 最强合集!Python 数据可视化工具,你都用过哪些?
- DeepSeek 打 Kaggle ?
- Python 3.13 的这些更新亮了!
- 贼溜!使用 Cline+deepseek 实现 VsCode 自动化编程!
- 全球掀DeepSeek复现狂潮,这个爬虫神器出圈了!
- 2024年十大人工智能研究论文:收获与应用
- 沃尔玛销售数据挖掘与可视化分析实战
- 为什么他靠一场Kaggle竞赛拿下大厂Offer,而你还在刷题?
- DeepSeek 两种部署方式及官方 prompt 模版
- 基于vLLM、Ollama的DeepSeek R1全系列模型部署教程,支持免费体验!
- 国家队下场,DeepSeek免下载使用
- 10 个自动化日常任务的 Python 脚本
- 完整的671B DeepSeek R1本地部署,详尽教程来了!
- PyCharm接入DeepSeek实现AI编程
- 又一位科学家从美归国,已入职北大
- 9 个开源项目,个个都很顶!
- 不要再在 Excel 中浪费时间了,让 Python 完成工作
- 13天5万!爬虫副业让我挺直了腰板回家过年
- DeepSeek官方App上线!功能完整且免费
- 高效机器学习的 19 种 Sklearn 技术
- 大厂新年第一裁,N+2,微软全部门危!
- 太顶了!Jupyter Agent 让我大开眼界!
- Python 数据科学必知的 25 个 Github 资源库
- RTX 5090正式发布!在家就可以跑大模型了
- 一块kaggle金牌的冲击有多大?顺利拿下各大Offer
- 重磅!Python 3.14.0 Alpha 3 已发布!
- 习近平签署主席令!研究生,迎大变革!
- 从pdb到unittest的10个必备Python调试技巧
- 提升算法对比:AdaBoost、CatBoost、LightGBM、XGBoost
- 2024 Github 十大最佳 RAG 框架
- 上海微软大裁员,赔偿达N+8,12年老员工感叹:拿20个月工资走人,每月3000失业补助,也是种幸福
- vscode中调用deepseek实现AI辅助编程
- DeepSeek-V3技术报告解读
- 深度学习数学:理解神经网络,347页pdf
- 优秀 Python 代码最强技巧!
- 多模态大模型:算法、应用与微调
- 使用 PyScript 将 Jupyter Notebook 转换为交互式仪表盘
- 【分享】阿里P8大佬:2025年数据分析师还有前途吗?
- 封神!哈工大博士的PyTorch笔记火了!!免费公开!
- AI 转型,成功了!
- VS Code 14 个神级扩展,提高生产力!
- 15 个 必知的Python 内置函数
- 10 精彩绝伦的 Python 功能
- 再见 LangChain!Atomic Agent火了!
- 神了!python collections 还有这些功能?
- 不要再这样的判断空字符串了!
- 用 Jupyter部署机器学习模型
- 一文搞懂如何设计自动化测试框架
- Python 3.13 封神!将会改变 AI 和 ML 的游戏规则
- 15 个高级 Python 快捷方式,加快编码速度
- 强烈推荐一个“可捞偏门但不违法”的副业(50K+)
- 8 个 Python 字典超级技巧
- 一图胜千言,手撕图解 Transformer
- 再见RAG,你好Agentic RAG!
- Python 代码 Debug 的 10 个实用技巧
- Apache数据库管理顶级项目
- PyMuPDF4LLM 是提取 PDF 数据的终结者!
- Python 中 F-strings 的 9 种创意用法
- 新式爬虫利器!太好用了!
- 我把 Python 中 zip() 函数玩出花了!
- 大模型,可以这么学!
- Python Lambda 函数的 9 种玩法
- 再用
print
进行 Python调试,你就OUT啦! - 李子柒回归! 用Python下载她的YouTube视频!
- 20 个 Python 非常实用的自动化脚本
- 码住!12 种生产级 Python 代码风格
- 大模型必备技能 – RAG
- 72k!一个前景被严重低估的方向!
- 最强图解微型神经网络–多层感知器
- 看完再也不担心数据预处理中的数据泄露了
机器学习初学者
- 当网红开始拼学历:600万粉丝网红“迅猛龙”考入复旦大学硕士
- 【深度学习】讲透一个强大算法模型,CNN !!
- 【机器学习】不要小看线性回归!
- 学生论文致谢,影响导师晚评职称一年?网友:你导这辈子抬不起头
- 【Python】轻松搞定三元相图
- 【深度学习】解决Diffusion Transformers优化困境!南京大学与字节等提出DDT:解耦扩散模型
- 首本通用人工智能评测书出版,全球知名人工智能科学家朱松纯及团队全新成果!
- 【深度学习】ICCV|基于扩散模型的开放词汇目标分割
- DeepSeek、华为、出口管制以及中美人工智能竞赛的未来
- 我国仅有4所“纯211”,被称为“984.5”大学,综合实力强悍,超越寻常985!
- 【Python】拿来即用!9 个科研论文配图完整代码
- 史上最严院士增选!27名候选人,被处理
- 大学老师苑萌萌爆红!秒杀一众明星网红,长相酷似神仙姐姐
- 【Python】微软这次真把Markdown玩明白了,接入MCP
- 最新!国产大模型清单!
- 中科院院长:科研乱象,不少科研人员疲于报项目、发论文、争“帽子”…不利于科研攻关
- DeepSeek:3大真相曝光!DeepSeek为何一个月跌落神坛?这届用户太狠了
- 【Python】Pandas实现sql的case when查询,原来这么简单!
- 骚扰男生、套取科研经费:初步核查宫某涉嫌师德失范行为基本属实,北理工暂停其一切职务活动
- 【Python】Pandas取代Excel?
- 诺奖得主杰弗里·辛顿爆料:“AI教父”名号是吴恩达带头喊出来的、AI会比人类更聪明…
- 学术调查真相:大学老师当了领导后,论文发表就多了,不是自己的专业领域也会研究了
- 【深度学习】讲透一个强大算法模型,Transformer !!
- 何恺明的ResNet,成为21世纪被引量最多论文,Nature最新统计
- 离职证明上有负面信息怎么办?
- DeepSeek多模态能力起底!一探究竟Janus 系列模型:解耦统一多模态理解和生成模型的视觉编码
- “实习生也月入过万”,AI行业严重缺人?
- 高校发文:清理整治富余闲散人员
- 智谱发布国内最快的推理模型!效果比肩 DeepSeek R1,速度快 8 倍,高达 200 Tokens/s
- 你们的导师做过什么惊为天人的事情?
- 【Python】超实用!轻松控制Python及依赖库版本
- 【深度学习】连续Token助力文本生成图像迈向新高度!Kaiming团队提出Fluid:MS-COCO上实现6.16 FID
- 93年博导教授!地大「最飒科研女神」实力出圈!
- 深入解析图神经网络注意力机制:数学原理与可视化实现
- 喂饭级教程!AI一键试衣,不用PS也能学会
- 院长买卖论文、经费滥用……:国家基金委通报2025首批不端案件,26人重罚!高校竟成‘重灾区’?
- 【Python】学习Pandas的几个好去处~
- 如果你用过Matplotlib,请记住他的名字
- 研究生必看!如何成为导师心中的“完美学生”?六大建议助你脱颖而出!
- 刚刚,李飞飞团队发布《2025年人工智能指数报告》:12大趋势证明,AI不再只是关于可能性的故事
- 复旦大学校长:推进教师年薪制
- 今天收到一封自称是学生的求助邮件,第一次选择了“不回复”
- 【Python】Python脚本运行速度太慢,用这10个方法解决
- 2025国自然, 初审结果时间公布了!
- 读博士,一定不要瞎忙活。
- 【深度学习】一网打尽!5大深度学习模型!RNN、CNN、Transformer、BERT、GPT
- 建议取消发布中科院预警期刊名单?
- 硕士生毒死舍友,一审被判死刑!
- 【Python】100个字典编程小技巧,让你成为Python高手
- 特朗普扼杀全美 GPU 供应链?科技大厂核心 AI 算力告急,硅谷陷巨大恐慌
- 程序员必备!一本书带你玩转DeepSeek编程
- 26岁北大硕士毕业成为食堂阿姨:不用脑力劳动,比在大厂更快乐
- 【机器学习】最强总结!8个线性回归核心点!!
- 专家A:90分,专家B:56分!研究生论文盲审俩分数相差34分不让答辩,导师怒发朋友圈:离谱至极…
- 7个最常用的数据分析方法和技巧,收藏!
- [【深度学习】9个主流GAN损失函数的数学原理和Pytorch代码实现:从经典模型到现代变体
- 小米SU7事故背后:自动驾驶的“致命两秒钟”到底谁该背锅?
- 张雪峰再预测:未来十年最火的6个理工科专业!毕业即躺赢!
- 2025美国最新奥数题,让大模型集体翻车,DeepSeek R1平均分也不到5%
- 还有名额!这所学校2025年硕士研究生调剂意向填报开始啦!(计算机科学与技术)
- 中纪委通报:3位在任大学校长、副校长、研究院院长,被查!
- 实测:Gemini-2.5-Pro 大战 Deepseek-V3-0324
- 推理模型比肩DeepSeek-R1:第一个免费可用的智能Agent产品全量上线,中国公司智谱打造
- 字节会下血本招聘毕业3年内的高潜人才
- 【Python】100个NumPy小技巧,让你精通Python科学计算
- 【寒门读博:一场与命运的谈判】——当知识资本撞上生存法则
- 【机器学习】隐藏马尔可夫模型的解释、真实案例以及 Python 代码
- 10篇DeepSeek-R1相关的研究全面汇总,万字思考!
- 睡一觉发一篇SCI?学术圈权色交易杀疯了!
- 高位接盘爆亏254万,阿里P7彻底沦为房奴
- 2025 苹果 AI 学者名单公布,黄子琪、孔令东、北大吉嘉铭、清华顾煜贤等12位年轻华人入选
- 985校长宣布:非升也能留!高校“非升即走”制度迎来大手术
- 【Python】13个有趣的Python高级脚本
- 贾扬清创业2年,老黄砸重金收购!AI框架缔造者或卖出数亿美金
- 突发!美国再将54家中国科技公司列入实体清单!智源、浪潮在列!
- DeepSeek-V3-0324 已成非推理第一
- 【深度学习】CVPR 2025|MambaOut:在视觉任务中,我们真的需要 Mamba 吗?
- 字节跳动CloudWeGo开源大赛终极挑战:代码破界,定义未来!
- 2025年AI领域国际学术会议和趋势分析
- 中纪委网站通报:二级教授,被查!曾任2所高校党委书记
- 一科研人员被判处死刑!原因曝光
- 【深度学习】CVPR2025|恺明+LeCun联手带来没有归一化层的Transformer!
- 杭州六小龙最新开源「空间理解模型」,保姆级教程来了!
- 【学历通胀警报】”大学扩招大跃进”背后:你的毕业证正在贬值?
- 博士毕业论文致谢句句诛心,博士女朋友看了这样回应!
- 中科院分区2025出炉,计算机科学大类分区、自动化与机器人小类分区名单
- 学术志重磅新书,帮你极速上手DeepSeek,高效做事不内耗!
- 【Python】一行代码,优雅的探索高维数据
- 饶毅:近年有人推荐一位“杰青”任院长,一看就是“浮躁的典型,发了一批没意义的论文”,还能混江湖,“这类人不仅多,而且频频晋升”
- 重磅!DeepSeek R1零门槛提示词+13大场景模板,让AI输出效率暴增300%!
- 【深度学习】彻底搞懂!Transformer多头注意力 !!
- 【效率】AI笔记神器NotebookLM,保姆级教程来了!
- 【效率】再见 Typora ! 又一款炫酷写作神器!
- 福建福耀科技大学,已有15位院士!
- 退而求其次?青椒跳槽三线高校后,副教授变教授、140平房子到手、老婆入编…
- 【Python】100个Pandas小技巧,让你精通Python数据分析
- 2025年99%代码AI生成!OpenAI高管宣告没有退路,人类将被全面超越
- 西安交大发通报:副教授抄袭属实,解聘!
- 最新!2025年TOP大模型!
- 吴恩达的翻译Agent项目,复现教程来了!
- 这15所”双非高校”杀入全国百强,广东成最大赢家!
- 2025年基金本子提交在即!这11个问题现在改还来得及
- 李飞飞最新分享:基于好奇心的研究是什么样的?
- 29岁,仅工作一年,武大最年轻正教授:95后天才少年如何用8年改写人生?
- 纽约时报重磅曝料:特朗普任期内将实现AGI,美国政府早知AGI即将降临!
- 非法出口 28 亿元 GPU:被捕
- 揭秘学阀现象:学术圈正在上演怎样的”门徒战争”?
- 在线教程 | OpenManus 与 QwQ-32B 强强联合,推理过程全透明
- Open-Sora 2.0全面开源,20万复刻百万级大片!11B媲美闭源巨头,224张GPU创奇迹
- 中南财经政法大学六旬博导因考核不合格,朋友圈怒发“罪己诏”?校方回应
- AI笔记神器NotebookLM,保姆级教程来了!
- 官宣!王树国任福耀科技大学校长
- DeepSeek血洗AI韭菜田:撕开中国AI行业的皇帝新衣
- 如何使用DeepSeek进行科研图表绘制?
- 图灵奖得主杨立昆:AI需要学习物理学才能继续进化,认为训练效率提升就不需要太多算力是误解,更多算力将用于推理
- 教授何恺明在MIT的最新讲座!
- 【深度学习】CVPR 2025|MambaOut:在视觉任务中,我们真的需要 Mamba 吗?
- “专为我开了一个新课题”,顶尖博士为什么偏爱去字节实习?
- 985扩招潮,来了!
- Manus引爆智能体复现潮!DeepSeek已被整合,项目挤满开源榜,海外大V排队求码
- 影响高校女教师幸福感因素的探究
- 300 万年薪程序员被裁!女友朋友圈一张炫富照片引发的职场地震
- 机器学习面试准备路线图(2025版)
- “六战法考”的北大保安,传来好消息,校方发长文
- 第一本给程序员看的DeepSeek图书上市了!
- 【Python】2025 超现代 Python 实用工具
- 英伟达RTX 5070评测解禁:老黄承诺4090级性能?不存在的
- DeepSeek写武侠小说的水平如何?–泰森大战保罗
- 【Python】matplotlib + pynimate,轻松让数据动起来!
- 李国杰院士“七问”DeepSeek
- 登上nature,Transformer到底凭什么这么火?
- HuggingFace 又出新教程啦!手把手教你构建DeepSeek-R1推理模型
- 一省宣布:毕业3年,也算“应届生”
- 中纪委通报教育系统腐败:清华大学2人已被采取留置措施,中科大处分10人,前教育部副部长被立案审查
- 用大模型学机器学习:机器学习项目全景、高效学习计划
- 官方揭秘:DeepSeek一天能赚多少钱?
- 2025年至今十多位青年科学家接连倒下!科研界的‘非升即走’,走的为何是生命?
- 【深度学习】通透!十大 pytorch 核心操作全总结!!
- 梁文锋,yyds !!
- “AI论文”,撤销学位!
- 最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)
- 刚刚,GPT-4.5问世!OpenAI迄今最大、最贵模型,API价格飞涨30倍,不拼推理拼情商
- DeepSeek严选 | 未来十年最值得报考的十大专业,选对赛道逆袭人生
- 【深度学习】彻底搞懂,Transformer !!
- DeepSeek-R2被曝5月前发布!
- 深夜举报信引爆南师大:副院长出轨女博士背后,权力与道德的致命纠葛
- 今天,OpenAI Deep Research已向所有付费用户开放,系统卡发布
- 浙江大学校长杜江峰,已任教育部副部长
- 从YOLOv5到YOLO11!改进有多大?
- 最全考研指南!全阶段实用经验,半个月的深度整理!
- 美中国籍博士生疑用AI作弊被开除 向校方提起诉讼要求赔偿
- DeepSeek这波到底是不是风口?03年淘宝卖家还在担心“现在开店是不是红利没了”
- DeepSeek 开源第一天就亮剑,FlashMLA这张王牌太狠了
- 【深度学习】如何评价Ultralytics出的YOLOv11?
- 阿里巴巴:2024年优化了 24940 人
- “80后死亡率突破5.2%”?错得离谱!
- 211大学官宣!11位管理岗人员转聘为辅导员,入事业编
- 颜宁,拟获“全国三八红旗手”!
- 一文汇总 DeepSeek R1 模型最新复现进展
- 再次颠覆学界想象,何恺明发表新作:扩散模型不一定需要噪声条件
- 官宣:这高校禁用DeepSeek
- DeepSeek-R1第三方稳定性测试(API端):首批结果出炉!
- 985大学,撤销教务处
- AI人速抢!科研党/企业党福音:秒级计费的GPU云平台,注册血赚150元券!
- 没想到梁文峰还在亲自下场搞研究
- 【深度学习】YOLO-HMC:一种改进的印刷电路板表面缺陷检测方法
- 1天接收!首篇 DeepSeek SCI 已发表,1区高分期刊!
- 用 DeepSeek 2小时搞定一篇论文初稿(全流程攻略)!附20个论文高阶提示词!
- 马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI
- 【打不过就加入】百度官宣:全面接入DeepSeek!
- 【Python】Jupyter Notebook实用插件分享
- 年仅32岁!又一青年大学教师因病逝世,自幼双亲离世……
- 手把手薅到满血版DeepSeek-R1!为啥你总卡在“服务器繁忙”?
- 【机器学习】机器学习各算法的优缺点!!
- 梁文锋导师项志宇引关注,个人主页满满都是对团队的祝贺表扬
- 引发教育公平性热议:如何看待复旦大学发文“欢迎中国籍留学生直博”?
- 情人节特刊:DeepSeek算姻缘教程来了!
- 985教授控诉:用心教书的老师太少了!我们亲手毁掉了下一代的教育尊严
- 吴恩达推出的AISuite也宣布支持 DeepSeek
- 2024年十大人工智能研究论文:收获与应用
- AI领域的免费风暴来袭!某巨头AI也坐不住了!
- 【深度学习】告别调参噩梦!9种优化算法加速神经网络!
- 终于把风控中的 ROC/AUC 搞懂了!!
- 热议:为什么DeepSeek出来后,国产其他大模型的集体失声了,以前都号称很强的?
- 【机器学习】机器学习模型的保存与加载,完全指南
- 【Python】沃尔玛销售数据挖掘与可视化分析实战
- ICML 2025杀疯了!
- 《哪吒2》申公豹爆火背后:代码豹的扎心真相,打工人集体破防!——从996到35岁危机,谁懂我们拼命改命的辛酸?
- 【深度学习】5分钟解释Transformer,一个神奇的算法模型 !!
- 为什么是杭州?六小龙崛起:揭秘“神秘东方力量”背后的三大密码
- 【Python】10 个自动化日常任务的 Python 脚本
- 哪些国家封杀了DeepSeek?
- 机器学习入门推荐!黄海广老师的机器学习慕课即将上线!
- 痛别!中国核潜艇之父黄旭华院士逝世,隐姓埋名三十载,铸就深海重器
- 为什么DeepSeek由一个初创公司开出来而不是国内互联网巨头?DeepSeek的神回复
- 【机器学习】机器学习中25个最重要的数学定义(公式、代码实现)
- 互联网和人工智能是否影响我们的记忆?科学怎么说
- 我论文的一作变成了导师女儿…哪个瞬间你对学术圈彻底失望了?
- 完整教程 | 完整的671B MoE DeepSeek R1怎么塞进本地化!
- 自有歪果仁为DeepSeek「辩经」:关于DeepSeek的五个谣言
- DeepSeek心目中的中国大学排名
- 【深度学习】突破CNN!时间序列分类 !!
- 惊爆!Sam Altman对话孙正义,正面回应DeepSeek:OpenAI投入多少,AI智能就有多强(附视频)
- 点赞!DeepSeek梁文锋的硕士论文下载
- 手把手带你用DeepSeek-R1和Ollama搭建本地应用,一文搞定!
- 打破校史:北京211,发表建校72年来首篇Nature!
- 离谱!大学教授抄袭50年前的计算机博士论文!网友:哈?50年前的论文到了今天还有创新性?
- 一夜之间,微软、英伟达、亚马逊全部接入DeepSeek!
- 【机器学习】通透!数据标准化与归一化 !!
- 看图学AI:Jay Alammar带你读懂DeepSeek-R1
- DeepSeek R1有没有赶上OpenAI o1? 八大场景测评结果出炉
- 全球热议 DeepSeek:复现狂潮如何改变游戏规则!一文汇总复现项目!
- 扭秧歌转手绢,人形机器人亮相春晚,导演为张艺谋!宇树科技:通过AI算法强化学习,花了近3个月排练
- 大学教授,降级
- 《自然》发文:中国廉价、开放的人工智能模型DeepSeek让科学家们兴奋不已
- 耶鲁大学教授:研究生做科研的“11条军规”
- 如何看北京理工大学珠海学院(独立学院)毕业生冒充北理工(985)去应聘,被拒后反骂HR学历歧视?
- 一文详尽之LLM-Based Agent
- 图灵奖得主杨立昆谈中国AI进展:中国科学家非常优秀 令人印象深刻
- 博士面试翻车现场:导师署名风波背后的学术圈潜规则
- 一位英伟达北京分公司员工晒出了工资条,总薪酬1688万,个税687万,月薪11.43万,基础年薪100万,剩下全是股票分红…
- 【深度学习】突破LSTM,CNN和LSTM时间序列预测 !!
- 《大模型基础》教材发布,开源!
- 【深度学习】ViT模型详解与Pytorch代码实现
- 【NLP】「科学推理」基准榜单出炉!DeepSeek-R1 登顶,推理等级7级,o1紧随其后
- 杰青、优青、青基项目统一改名为青年科学基金项目(A、B、C类),30年招牌已成历史,你怎么看?
- 【机器学习】一图胜千言:图解机器学习
- 【NLP】495篇参考文献!北交大清华等高校发布多语言大模型综述
- 为什么某些高校基础学科的教授拿了几百万经费,连个毛都没做出来,发一堆水刊……
- 【Python】20个超级脚本,让你日常工作有如神助
- 盘点:千万年薪也拦不住的“换行”之心,一文看懂AI界的人才“大迁徙”
- 大学老师的期末改卷,是一场大型“海底捞”现场
- 【机器学习】机器学习各个算法的优缺点!
- 突发!Tiktok美国停服,Perplexity发起收购,小红书也被盯上了
- 又一位科学家从美归国,已入职北大
- 【机器学习】讲透一个强大算法模型,Prophet!!
- 【机器学习】11 种特征选择策略总结!
- 违反请假政策,2名清华博士生拟被退学
- 10 大中文医学数据集汇总:涵盖神农中医药、中医药古籍、医学推理、医学问答……
- 【民间】2024毕业生薪酬排行榜发布!
- 江苏大学教师吐槽教学考核:新增800余门课程,有老师为让学生选课讨好学生…
- 985,引进3名“华为天才少年”!
- 郑强:中国教育最不公平的不是幼儿园小学和中学,而是高等教育!
- 【机器学习】数据挖掘标准流程
- 刚刚,美国全球芯片禁令正式发布
- 困在“第一学历”里的博士
- 【深度学习】深度学习调参经验
- 美国顶尖名校抛弃计算机基础课,All in Python!前助教:计算机系末日来临
- 体制内,开始“拒绝”留学生?
- 又一大学生失联!IP定位显示已在缅甸
- 2024年AI大模型回顾!
- 喜大普奔!多个省份取消“应届生身份”限制!
- 上海微软大裁员,赔偿达N+8,老员工获赔77万!
- 突发!长鑫存储、长江存储、中芯等被列入黑名单!
- 某985大学一女生用AI学术造假被麻省理工退学,本人发文致歉
- 【机器学习】概率论中的极大似然估计:入门与Python实践
- 突发!长鑫存储、长江存储、中芯等被列入黑名单!
- 野鸡高校强迫全校学生4h速成论文并发表,QS排名飞升全球前15!
- 【Python】用Python实现量化个股选择
- 【机器学习】密度聚类分析在网络流异常检测作用
- 1999美元!RTX5090发布
- 最新AI Agent万字综述分享!
- 年末,高校批量“降薪”?!
- “洪荒之力”傅园慧,任职C9!
- 【NLP】干货!带你了解7种检索增强生成 (RAG) 技术
- 人工智能是不是走错了方向?
- 知乎热议:博士的年薪一般是多少万?
- 【NLP】时隔6年,谷歌BERT终于有替代品了!更快更准更长,还不炒作GenAI
- 【Python】Python打包成 exe,太大了该怎么解决?
- 那些选择退学的博士们:几种退学原因
- 【深度学习】突破LSTM!结合ARIMA时间序列预测 !!
- 2025年ABC中国大学排名发布
- 期刊论文写作格式模板(推荐收藏)
- 上海微软大裁员,赔偿达N+8,12年老员工感叹:拿20个月工资走人,每月3000失业补助,也是种幸福
- 谁说大学老师不肯分享课件?黄海广老师的《机器学习》课件合集原版今天提供下载了!
- 奥特曼公布OpenAI新年目标:AGI/Agent排前列,4o/Sora要更新,还有……
- 英伟达年终核弹!全新B300为o1推理大模型打造,RTX5090也曝光了
- 【机器学习】机器学习基础:缺失值的处理技巧(附Python代码)
- 南京大学联合发布首批191家“青年学者友好期刊名单”
- 2024年人工智能年终总结报告|Artificial Analysis
- 博士相亲竟相到学术大佬,师兄却嫌弃对方年龄太大,导师直言:醒醒吧,你还在延毕中
- 【机器学习】突破最强算法模型,回归算法 !!
- 【Python】初学者必备的数组相关知识点
- 一法破万法,未出版就被周鸿祎等多位大佬推荐的爆款书新鲜出炉了….
- 别犯了大忌!国自然发布:10种行为将被认定是科研不端行为
- 突发!OpenAI官宣成为盈利性公司
- “给我滚出贵大!”郑强出任贵州大学校长,打算把树全砍掉,学生愤怒抗议,4年后事情反转
- 【机器学习】吹爆回归算法,吊打16个核心点 !!
- “AI教父”杨立昆:批评马斯克是因为他先攻击了科学家;现有训练方式永远实现不了人类水平 AI
- Nature发布,AI 全球100强!我国19所大学上榜
- 【机器学习】XGBoost 比深度学习还强?
- 【NLP】时隔6年BERT升级!仅编码器架构没被杀死,更快更准确更长上下文
- 浙大校长“论文署名中科大”!本人坦诚回应
- 【深度学习】神经网络为何非激活函数不可?
- 科学没有衰落,谷歌 AI 推动科学发展的 9 种方式
- 不想让导师看到我的朋友圈,把他屏蔽了,这么做好吗?
- 【深度学习】深大提出 SL-YOLO: 更强、更轻的目标检测模型 !
- 2024亚马逊研究奖获奖名单:张崇杰、魏华等人入选
- 困在“第一学历”里的博士
- 【机器学习】机器学习各算法的优缺点!!
- 严处!一博士论文抄袭,被撤销学位
- 40岁副教授跳槽去公司, 试用期没过被辞退, 回不去原单位, 哭得稀里哗啦……
- 重磅!OpenAI推出o3模型系列:彻底颠覆AI怀疑论者,AGI评测基准达到惊人87.5%
- 【深度学习】像教女朋友一样教你用 Cuda 实现 PyTorch 算子
- 华东师大硕士论文被下载近10万次,研究内容为导生关系,网友:学术圈的小说
- 浙大教师涉嫌伪造剑桥邀请函致学生被拒签10年?学院最新通报
- 【NLP】关于大模型训练常见概念讲解
- 撤回!研究生未经导师同意私发SCI,7个月后文章从期刊撤稿
- 【深度学习】15个目标检测开源数据集汇总
- 一个博士的血泪求职路:想入职高校?请以我为鉴避坑!
- 【Python】微软开源Python Markdown转换工具
- 李飞飞:World Labs这样实现「空间智能」
- 我国退步最快的985大学?曾位列全国前十,如今排名连年下降…
- 【Python】使用Python Pip的10个技巧
- 博士生发问:如何让导师意识到,做横向、写基金等杂事影响我发论文?
- 【Python】用 Python 把 Markdown 玩的明明白白
- 英伟达最新动作!中国员工人数将增至4000!
- 事业编一年6万,干40年退休总共挣240万。码农一年60万工作5年,总共挣300万。事业编再舒服有码农干五年退休舒服么?
- 【深度学习】50个超强pytorch操作!!
- NVIDIA自动驾驶技术:从训练到推理
- 沉痛哀悼!数据结构课程的领路人-严蔚敏老师逝世
- 【机器学习】特征工程,全面指南!
- 事业编一年6万,干40年退休总共挣240万。码农一年60万工作5年,总共挣300万。事业编再舒服有码农干五年退休舒服么?
- 985教授已发表1226篇论文?本人回应“学阀”等质疑!
- 【Python】Python 3.13将会改变 AI 和 ML 的游戏规则?
- 梅宏院士:当前 AI 存在三大问题
- 42岁,讲师,因为评职称郁郁寡欢,吃了半年的调整情绪和睡眠的药物,无数次自我开解,说服自己接受平庸和失败
- 【机器学习】用 Jupyter部署机器学习模型
- 洪金宝、梁朝伟,荣获博士学位!
- AI魔改:林黛玉大战孙悟空、甄嬛拿枪“崩”四郎……“小作坊”要被清理了!
- 开题答辩把评委怼上天?记住这25条!
- 满血版 o1 上线两天,被网友玩出来了 10 个疯狂用法
- “太瘦了,学校给我发钱了,泪目”
- 【Python】Python 入门路线图(2024 极简无废话版)
- 仅32所高校!教育部公布重磅名单
- 万人追读,未出版就爆火,这本机器学习漫画小抄终于出版了!
- 官僚主义盛行!中纪委严厉批评:中国高校面临重大整改
- 就在刚刚!OpenAI 第一场直播就炸场!o1 满血版上线,史上最贵订阅费:1450元/月
- 专家:提议取消中高考,延迟选拔至就业考研,网友反应热烈
- 【Python】PyGWalker:最好用的数据分析Python库
- 【深度学习】扩散模型部署有新解,直接量化为4bit?韩松团队等提出SVDQuant:16GB笔记本上加速8.7 倍
- 惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
- 【Python】Python 3.13 中的 7 个新类型特性
- 人工智能领域全部SCI1区期刊汇总!
- 教育部抽检本科论文!一地近8成高校,检出“不合格”
- 从39个kaggle竞赛中总结出来的图像分割的Tips和Tricks
- 【NLP】Kaggle知识点:文本分类与LoRA
- 擅自出版博士论文,博导起诉博士索赔4000万,法院判了
- 全球五大巨头GPU总量曝光!谷歌第一微软第二!
- 【深度学习】轻量级神经网络模型,嵌入式微小设备也能实时检测 !
- 十四年的NYU教学精华,开放书《机器学习基础》第二版可以下载啦
- 一位阿里 P9 的年薪和家庭资产
- 中科院2024《国际期刊预警名单》发布,其中有2本期刊来自计算机学科!
- 厉害!27岁博士刚毕业,已任上海交大助理教授、博导
- 字节实习生被索赔800万并不冤。
- 图灵奖得主杨立昆深入浅出带你了解人工智能的前世今生
- 某副教授相亲100多场总结出来的经验,网友:建议开源,发表论文…
- 【深度学习】基于LSTM的每日消费预测与预算管理。
- 雷军的大学时候的论文:不需要参考文献
- 【机器学习】Kaggle竞赛被AutoML模型霸榜了…
- 【深度学习】Mamba-YOLO-World: 将 YOLO-World 与 Mamba 结合用于开放词汇检测
- 高校教师实名举报:同事职称评审论文造假,学校包庇
- 就业形势不容乐观,北大网红羊毛月嘲笑00后找不到工作,紧急道歉,仍掉粉近百万
- 吴恩达开源大模型套件:11个模型平台一种方式调用,已获星标超1.2K
- 基金委公布国家优青评价报告:有些单位将优青项目与职称评聘、资源分配等直接挂钩,不利于科研人员平等、公平的工作!
- 黄仁勋获港科大荣誉博士!与沈向洋对谈Scaling Law、后训练、机器人和爱情
- 【机器学习】通透!十大回归模型最强总结!!
- 【Python】10个Python编程脚本,超能力再升级
- 斯坦福大学发布全球人工智能实力排行榜
- 【深度学习】真实雨景/图像去雨/自动驾驶/图像检索相关方向开源数据集资源
- 你是几级调参侠?
- 专家:青年科学家 5 年内拿不出成果就面临淘汰,有的单位已现「马太」效应,重复给某一人奖励
- 【机器学习】最全总结!十大时间序列技术 !!
- 李飞飞团队:关于 2024 年人工智能发展报告总结
- 读博士,去哪找那么多创新点?水水得了…
- 已公示!“东方理工大学”,来了
- 【Python】10个Python开发者必备的SQL小技巧
- 《一书解决几乎所有机器学习问题》.PDF下载
- 【深度学习】深入浅出Batch Size,对模型训练的影响分析
- 特朗普上台,第一刀再次扎在了留学生身上。。。
- 大学“一级教授”和“四级教授”的区别有多大?
- 计算机视觉顶尖期刊和会议有哪些?
- 知名开源项目阿里官宣停更,太痛了
- 被导师放养,后果可能很严重。。。
- 软科发布最新世界大学学科排名:浙大第一、中山第二,清华、北大、上海交大并列中国内地第三
- 【NLP】一文全面说透,AI大模型!
- 博导:抱歉,我不收家境差的学生,现实太残酷
- 【机器学习】判别分析在客户风险评估中的应用
- 重磅!《国家自然科学基金条例》正式发布,2025年1月1日起施行
- 导师要求研究生代写国自然申请书,没想到研究生抄袭了他人3年未中标的本子……
- 【深度学习】系统盘点! 各类深度学习模型及原理!
- 安家费,无了!博士吐槽入职福利
- 值得开发者好好看一看的AI大模型入门教程(内含300道AI面试真题)
- 【深度学习】突破LSTM!时间序列预测 !!
- 终于弄懂了!人工智能、深度学习、大模型的概念及联系
- 多校通知:大学教师,实行“坐班制”!
- 饶毅:全世界没有一个学校把博士后纳入“非升即走”
- 为什么现在AI大模型都是基于Python开发的?
- 211大学教授、博导,落马!
- 浙大 TableGPT2 开源,横扫任务榜,最强表格 AI问世!
- 【深度学习】无源域自适应YOLO目标检测
- 我不理解,找论文创新点很难吗?
- 【机器学习】全面盘点逻辑回归等分类模型的 5 大评估指标
- 大学副校长被举报!教育厅回应:材料已移送省纪委
- 教授何恺明在MIT的第二门课《深度生成模型》!前五章可下载了!
- 【机器学习】深入理解机器学习中的欠拟合与过拟合
- 博士生Science发文:很庆幸导师要求每周交工作进展汇报!
- 给导师打电话发现停机了,果断帮导师充了话费,结果……
- 【机器学习】降维和特征选择的对比介绍
- 学生党狂喜,物理图表动起来!受力分析、光学、电路图等全自动交互
- 2025QS亚洲大学排名出炉,197所中国高校上榜!
- 【Python】25个常用Matplotlib图的Python代码,收藏收藏!
- 【深度学习】IoU、GIoU、DIoU、CIoU损失函数的那点事儿
- 终于被NeurIPS录用了!!!
- 北大韦东奕上课照片走红,板书潇洒,新发型吸睛,网友:这要打脸多少“只会翻PPT”的老师?
- 一中学年薪50万送住房招老师?北大等名校生获聘!回应来了……
- 残酷!中科院博士应聘某普通二本惨遭拒,开始思考人生……
- 【机器学习】Kaggle竞赛被AutoML模型霸榜了…
- 香港“抢人大战”继续:新增 9 所 985!这份名单,再扩容!
- 导师为了避嫌,拒绝女生单独找他汇报,出差一定要带上师母,网友:他这是在自我保护呀
- 【Python】20个Python编程脚本,让你拥有超能力
- 太强了!2024年国内外AI公司50强榜单!
- 看哭!40岁才博士毕业,省长写了篇博士论文后记
- 【机器学习】ARIMA 在电商销售数据的分析应用
- AI 证件照制作工具
- 阿里巴巴全球数学竞赛获奖名单已正式发布:姜萍系教师王某某提供帮助,违反预选赛规则
- 【深度学习】100+深度学习各方向数据集资源大盘点
- ChatGPT变身AI搜索引擎免费用!
- 鹅厂不同职级 薪资待遇一览表
- 为什么本科学历就已经超越了 95% 的国人,本科生还活的那么难?
- 【机器学习】机器学习树模型中超参数优化方法
- 国自然基金重大调整,这4点需要关注!
- 3部门官宣:国家奖助学金,涨了!
- 【深度学习】超越YOLOv10/11、RT-DETRv2/3!中科大D-FINE重新定义边界框回归任务
- 强大绘图神器—83k+ stars、免费、手绘style!
- 为什么小时候上电脑课要穿鞋套?
机器学习实战
- YOLO界再起波澜!新一代目标检测器又有新突破!
- 离职证明上有负面信息怎么办?
- 何恺明的ResNet,成为21世纪被引量最多论文,Nature最新统计
- 突发!GitHub 被曝封禁中国区 IP
- 一文详尽之Scaling Law
- 大模型高效压缩新方案!ICLR 2025最新收录!
- 大模型还有哪些值得研究的方向?||大模型个性化研究进展与未来展望(综述)
- 多Agents 圈的 MCP:谷歌全新Agent2Agent 协议开源!
- YYDS,哈工大博士的pytorch笔记终终终于公开了!!
- 聊聊强化学习发展这十年
- 热议:中国何时拥有自己的《nature》《Science》?委员给出答案!
- GPT-4o「吉卜力风」一夜爆火,奥特曼连夜换头像!宫崎骏痛批AI侮辱生命
- 无人报考!顶尖大学,校区关停
- YOLOv12入门教程
- AI知识库爆火!多模态能力应用,保姆级教程来了!
- 机器学习领域博士搞科研,原来“Deepseek”才是最快发论文的方法?
- 腾讯大模型算法一面+二面
- 刚刚!DeepSeek团队丢出注意力新机制重磅论文
- 零基础入门:DeepSeek微调的评测教程来了!
- 热议:为什么DeepSeek出来后,国产其他大模型的集体失声了,以前都号称很强的?
- 大模型算法岗,选大厂,还是deepseek?
- cuda编程:我的第一份cuda代码
- 清华大学DeepSeek使用手册,长达104页!(附PPT下载)
- 完整的671B DeepSeek R1本地部署,详尽教程来了!
- PyCharm接入DeepSeek实现AI编程
- Jay Alammar:图解DeepSeek-R1
- 如何看北京理工大学珠海学院(独立学院)毕业生冒充北理工(985)去应聘,被拒后反骂HR学历歧视?
- 国产推理大模型决战2025考研数学,看看谁第一个上岸?
- 什么?Kimi推理架构宣布:开!源!了! Github标星1.7K
- 图像美感增强SOTA,拒绝美感焦虑!字节跳动提出VMix:多维度美学控制方法,一键提升图像光影、色彩等
- 在字节干大模型,是一种怎样的体验?
- DeepSeek-V3技术报告解读!
- 计算机科学女博士退学 OnlyFans 创业, 一年翻身还清贷款~
- 通过动图彻底理解了傅里叶变换
- PyGWalker:最好用的数据分析Python库
- 中纪委严厉批评:中国高校面临重大整改
- 从头构建GPT文本分类器(Python)
- 字节三面:attention中的Q,K,V怎么来的?
- PaddleSeg:车道线检测
- 沉痛哀悼!数据结构课程的领路人-严蔚敏老师逝世
- 人工智能领域全部SCI1区期刊汇总!
- 超强图解 Pandas 18 招!
- 已注销!985新校区,不建了
- 轻量级神经网络模型,嵌入式微小设备也能实时检测 !
- 50K*16薪,进字节了!
- 一文读懂 PyTorch 显存管理机制
- 万字长文,三种Transformer模型的注意力机制及Pytorch代码实战!
- 上海交大新聘AI博导,27岁!
- SCI机器学习一区TOP,再次刷新顶刊巅峰!
- 刷脸背后,卷积神经网络的数学原理原来是这样的
- 一位中国博士把整个CNN都给可视化了,可交互有细节,每次卷积ReLU池化都清清楚楚
- 教高中生发顶会,看完还不懂来找我
- PyTorch下的可视化工具(网络结构/训练过程可视化)
- RTX 3090的深度学习环境配置指南:Pytorch、TensorFlow、Keras
- 有位大佬逐模块解析transformer结构
- 图解机器学习:贝叶斯算法
- 使用 Transformers 进行概率时间序列预测实战
- 使用 YOLO 加速实时应用程序中的对象检测 !
- 算法岗平时需要自己写cuda吗?
- 13张动图快速理解马尔科夫链、PCA、贝叶斯!
- 使用 LSTM 进行多变量时间序列预测的保姆级教程
- 搞懂Transformer结构,看这篇PyTorch实现就够了
深度学习技术前沿
- 深圳大学,成立人工智能学院!20位院士见证
- 华人横扫ICLR 2025杰出论文奖,三篇均为华人一作
- 全网刷屏,2个火爆的AI视频算法项目,已开源!
- 哈佛归来,重返母校,入职北大!
- 谷歌突然换帅!19年老将立即卸任
- 「全球首个自回归视频生成大模型」,清华特奖得主创业团队重磅开源, 全网刷屏!
- DeepSeek公布最新成果,开启DeepSeek R2时代?
- “校长摇篮”,Top3大学!
- 博士工作满2年直升副教授, 无需评审?
- 何恺明ResNet登顶,引用量超25w,遥遥领先!
- 清华张亚勤院士:AI必须与产业结合,像电力一样成为基础生产力
- 读博士,一定不要瞎忙活……
- 7B模型反超GPT-4o!港中文清华推出首个Video R1 大模型
- 永别了,GPT-4!
- 霸榜ICLR25!大模型高效推理成顶会新风向!88种创新思路,速码!
- 多所高校,官宣涨薪
- 华为盘古Ultra来了:昇腾原生、135B稠密通用大模型,无需英伟达GPU
- 院士,获ACM计算突破奖
- 上海交大原副校长,加盟福耀科技大学
- 程序员必备,第一本DeepSeek宝典
- 爆火全网,华人AI版《猫和老鼠》,60秒经典泪目
- 2025深圳大学年度经费75亿,全国地方高校第一
- 【CVPR 2025】惊艳!即插即用,一种轻量级多感受野视觉Mamba网络
- 20人创业公司,老黄数亿刀收购!AI大牛贾扬清、白俊杰已入职英伟达
- 博士毕业三年,仅29岁,破格晋升为985大学教授
- 惊天丑闻!AI大佬愤而辞职。。。。
- 刚毕业入职硅谷大厂,整个团队被裁掉了。。。
- 为什么是梁文锋做出了DeepSeek?
- 2024 AAAS Fellow揭晓!中科大校友熊莉、前腾讯杰出科学家刘威等入选
- 被哥大开除后,他靠AI作弊神器年入千万!
- 稚晖君刚挖来的90后机器人大牛:逆袭履历堪比爽文男主
- 史上最严!27名院士候选人被处理,或被永久取消参选资格
- 技术人狂喜!飞桨框架3.0史诗级更新,炼丹效率拉满
- 杭州具身黑马获超5亿融资,冲击万亿市场
- 库克到访!C9大学,获捐赠3000万
- 李飞飞团队具身智能新作:500美元,一切家务机器人帮你干
- 中国AI界的又一匹黑马,Mureka O1 全球首秀!爆改周杰伦,堪称AI音乐界的DeepSeek时刻
- 新瓜曝光!OpenAI最新内幕八卦.pdf
- 饶毅:某“杰青”任院长,一看就是“浮躁的典型,发了一批没意义的论文”,“这类人不仅多,而且频频晋升”
- 姚班天才:范浩强大神创业曝光!旷视三剑客携2亿天使轮进军具身智能赛道
- 【人工智能 · 重点EI会议】往届已完成检索!国内外知名高校联合主办!
- 世界首个!性能超扩散模型256%,推理速度快21.8倍,统一微观与宏观的3D世界
- Idea撞车何恺明大神新作!速度领先10倍,性能更强
- 导师一个idea都没给,但也发了顶会CVPR,我摸索的这个方法绝了!
- 全球首次,国产机器人实现“鲤鱼打挺”
- 13年后,AlexNet源代码终于公开,内藏玄机!
- 刘壮、何恺明&Yann LeCun联合新作:只需9行代码,全新颠覆Transformer,效果惊艳!
- 聚焦推理模型、AI Infra、AI智能体与具身大模型!DeepSeek时代首场生成式AI大会4月举行
- 阿里投的具身智能公司,半年融了5个亿!
- 博士 offer 一夜变废纸,导师被逼抱头痛哭,学术寒冬席卷高校,博士先遭殃
- 民办本科毕业的他,成为北京大学博导、实验室负责人…
- 硬刚DeepSeek-R1,全球首个工业界多模态推理模型开源!
- 19岁退学哈佛CS,这个00后两年打造百亿独角兽!月收入5000万,简直杀疯了
- 学习DeepSeek-VL2,就看上海交大俞勇教授这本新书,手把手教学!
- 825万!985大学,购10台宇树机器人!
- 华为诺亚方舟实验室主任换帅,90后新「掌门」王云鹤接班
- 实话!写博士论文,别太老实了……
- 何恺明团队提出全新DHN「去噪哈密顿网络」
- 29岁,武大最年轻正教授!资助经费290万
- 全美高校遭史上最大规模裁员。。。。
- 中央批准:985大学,迎来院士校长(副部长级)
- 李国杰院士“七问”DeepSeek
- 反内卷,大学“8年制”时代,来了!
- 顶尖博士为什么偏爱去字节实习?
- 何恺明大神在 MIT 的最新讲座!
- 梁文锋,yyds !!
- 2024年国家杰青、国家优青名单
- LLM推理革命:实现近无损16倍KV缓存压缩与Attention加速,推理速度提升1.4倍
- ResNet级神作再现,何恺明团队提出分形生成模型,计算效率狂飙4000倍!
- 「大模型简史」:从Transformer(2017)到DeepSeek-R1(2025)
- CVPR2025录用结果出炉!这些方向是大趋势!
- CVPR 2025 | MobileMamba开源:轻量级视觉网络王者
- 33岁的他,受聘武汉大学计算机学院教授!
- 360联合北大震撼发布!5%参数量逼近Deepseek-R1满血性能
- 即插即用,轻松涨点!把大牛的模块缝合到自己的paper里
- 大模型训练神器:KV缓存狂减一半
- 14.88亿大单,国产GPU大厂赢麻了!
- 小米汽车校招薪资爆料清单来啦!
- IBM中国投资公司停运,1800员工一夜失业!一个时代的落幕。。。
- 90后北大校友破解百年难题,陶哲轩激动转发!
- 全球顶尖大学,成立人工智能学院!9月开始招生
- 惊呆了,DeepSeek全面开源V3/R1推理系统!成本利润率高达545%
- 奔驰中国裁员15%,赔偿N+11?最新紧急回应
- 梁文锋和杨植麟,论文撞车了!!
- 姚班天才创办的大模型公司,卖了
- DeepSeek 开源大杀器!压榨GPU极致性能!
- 离谱:这所高校禁用 DeepSeek!
- 芯片设计之光:EDA顶会 DATE 2025最佳论文,南大&华为诺亚摘获!
- 无偿捐赠5个亿!用于资助国自然博士生项目
- 吃瓜!211大学通报副院长涉嫌师德失范:取消其研究生导师资格!
- 再次颠覆认知,MIT 何恺明大神发表新作:扩散模型不一定需要噪声条件
- ICLR’25|MambaQuant:首个Mamba模型量化方案,无损精度
- 【火热征稿中-稳定检索】2025年计算机视觉、人工智能、物联网不可错过的EI会议!
- 超快,只需3秒!DeepSeek 最强版
- 又一科学家回国,加盟顶尖985!曾参与研发3款苹果M系列芯片…
- 车企风云:5天,77位高管重大调整
- DeepSeek放出重磅论文!梁文锋亲自参与!
- 实验室主任、华为顶尖科学家加盟双一流高校
- 马斯克20万块GPU炼出Grok-3,疯狂的背后却是。。。。。。
- 困在“第一学历”里的博士
- 涨分30%!只需共享注意力分布
- Google DeepMind副总裁 加盟字节AGI
- 顶刊TIP 2025!北大&清华:多目标跟踪新方法和新数据集
- 为何说 “在国内做科研,最忌讳踏实”?
- AI时代如何避免被淘汰?吴恩达:成为职场「10倍专业人士」
- 微信 DeepSeek 入口已接通,辐射用户 14 亿!
- 诺奖得主:DeepSeek是中国最好的AI模型
- 梁文锋导师项志宇引关注,个人主页满满都是对团队的祝贺表扬
- DeepSeek R1 完整版本地部署教程来了!!!
- DeepSeek 薪资曝光!人均年薪70W+
- AGI时代,开启财富大洗牌!
- 第一波用DeepSeek的人,论文已经被录用了!
- 法国总统,豪掷1090亿,开启欧洲「星际之门」!
- 动真格!27名院士候选人,被处理
- 这家公司太神秘了,估值达200亿美元,却没有任何产品。。。
- 为什么中国只有一个 DeepSeek?
- 独自一人,怒发顶会
- 顶尖985:加速挺进全球TOP100!
- DeepSeek中国大学排名Top100
- 一位北大博士在DeepSeek的感受和行业思考!
- 【附复现代码】基于PINN的论文创新思路
- Deep Research火速上线,对标DeepSeek?
- 顶刊TPAMI 2025!清华提出Hyper-YOLO,目标检测+超图计算实现新SOTA
- DeepSeek华为火线联手!硅基流动首发即限流,全国产API白菜价,零门槛部署
- 突发!谷歌被立案调查!
- 博士后逃生学术界,揭秘残酷真相!
- 奥特曼率队深夜血战DeepSeek,o3-mini急上线!ChatGPT被挤爆
- 黑马来袭,小扎坐不住了,2025年投入4000亿,年底AI算力将达130万卡
- 科研经费排名:武大暂列第一,超50所高校经费破亿!
- DeepSeek 论文细节:巧妙绕开CUDA的垄断!
- 这才是DeepSeek的正确使用方式!核心思路,OpenAI首席研究官亲自证实!
- 全球掀起 DeepSeek 复现狂潮,一文汇总!
- 2025,DeepSeek崛起!英伟达一夜市值蒸发近6000亿美元
- 马斯克Boss直聘:不看学历,只看代码
- 2025泰晤士世界学科排名公布!
- 钟睒睒:捐400亿,建新大学!
- 1998年出生,已担任C9大学教授、博导!
- 李飞飞丈夫,Salesforce首席科学家惊呼:AI智能体时代即将来临!
- 清华院士团队开源新型注意力,节省90%内存!
- AI大牛颜水成宣布回归学界!重返新加坡国立任特聘教授
- 2025,中国再无杰青优青!
- 美国科技巨头「春天到了」!硅谷巨头CEO 狂欢。。。
- 2025,中国再无杰青优青!
- 特朗普上台,硅谷巨头CEO 齐聚就职典礼
- 国产AI大模型,王炸开源!
- 78%员工已成百万美元富翁,超羡慕!
- 霉霉用中文拜早年!火爆全网,简直逆天
- 回归母校!名校教授,全职加盟顶尖985大学!
- 老婆饼里没有老婆,RLHF里也没有真正的RL
- 突发,美国拟(全面禁止)向中国出口 AI 芯片
- 大厂新年第一裁,微软全部门危!
- 中国科学院院士!顶尖大学,迎新校长!
- 中山大学通用具身机器人中心招聘博后/工程师/研究助理
- 体制内,“拒绝”留学生!
- 陈丹琦团队新作:数据砍掉三分之一,性能却完全不减
- 代码开源 | 基于YOLO的16种目标检测项目,人体/交通/医疗/工业等方向超全
- 黄仁勋「美国队长」pose,亮翻全场!RTX 5090震撼发布,惊爆价!
- 香港科技大学(广州)招收大模型方向全奖博士生
- 离谱,计算机女博士OnlyFans创业,年入千万…
- 谷歌CEO立军令状:必斩OpenAI,夺回第一!
- CVPR今年这情况,很严重,大家做好准备吧
- 习近平签署主席令!研究生,迎大变革!
- 悉尼科技大学招收:机器学习&人工智能全奖博士生
- Nature 发布,AI 全球 100 强!
- OpenAI又招一员大将!曾入围美国“少年诺贝尔奖”,还是一名哈佛讲师
- 本科学历,被誉为「爱因斯坦级」天才
- 10秒出片!国产视频模型又整新活了
- 稚晖君放大招,具身智能的 ImageNet时刻!
- 清华大学刘知远团队新作,28位AI天才们的热血传奇,比番剧更燃!
- 上海微软大裁员,赔偿达N+8,12年老员工感叹:拿20个月工资走人,也是种幸福
- 重磅,支持论文“一稿多投”?
- 香港大学招收医疗人工智能方向全奖博士/RA
- 1 年内 11 名博士生自杀,顶尖高校陷博士生自杀危机,疑因要求学生每学期发 1 篇 SCI
- GPT论文一作Alec Radford离职!
- 1200万美元,AI2050 Fellow名单公布!
- 14人当选中国计算机学会会士!
- 2025英伟达奖学金名单公布,6位华人入选!人均6万美元
- 雷军大学时候的论文,不需要参考文献
- 双一流大学,成立重磅新学院!
- 密歇根大学计算机视觉实验室高俊老师招收3D生成方向博士生
- GPT-5 宣告失败,效果不达预期?Ilya宣判预训练时代即将终结!
- 2024年达摩院青橙奖公布,平均年龄34岁
- “80后”博士,出任中国科学院院长(深圳)
- 谷歌再添猛将!DeepMind高级科学家,开挂博士给科研新人7点建议
- 一文看尽2024年主流11种注意力机制
- 微软高剑峰、哈工大(深圳)张民等四位华人入选!
- “注意力之父”!遥遥领先Transformer 26年
- 院士领衔,武汉大学成立人工智能学院!
- 高中生手撕2.5万行代码,火爆全网!
- 毕业即失业?美国顶尖高校博士直呼太卷。。。
- 斯坦福李飞飞:AI将取代人类?
- 手握14篇CNS! 他是施一公最低调的弟子
- 全球五大巨头GPU总量曝光!2025年H100或超过1240万块
- 又倒下一家车企,极越“暴雷”了!
- 3名高中生,重新证明百年数学定理
- 估值10亿美元,李飞飞教授 空间智能首个模型诞生!一张图生成3D世界,太疯狂了!
- 大模型创业太累,又一位大牛逃回大厂
- 吴恩达教授最新作品开源,支持一键调用大模型!
- 中科院院士:青年科学家 5 年内拿不出成果就面临淘汰。。。。
- 2025 IEEE Fellow名单正式公布!
- 惊天反转!LeCun竟与奥特曼达成共识:承认AGI 5到10年降临
- 美国莱斯大学魏晨老师招收CV/机器学习方向全奖博士生
- 谢赛宁:反直觉?训练扩散模型原来这么简单
- 2位享有国际影响力的顶尖学者,加盟985大学
- 阿卜杜拉国王科技大学招博后- 年薪50w+(免税)
- 涨点神器!100个即插即用注意力模块
- 喜提 TPAMI 顶刊!
- 项目爆火,立刻撤退!谷歌大模型核心团队被爆集体离职。。。。
- 超过清华!985高校,一年22亿!
- LLM高手!大佬开源学习笔记
- ICLR 惊现满分论文,四个 10 分!ControlNet 作者新作,Github 5.8k 颗星
- 名单确定!新一轮“双一流”,突围!
- 27岁应届博士生,毕业即任上海交大博导!
- 突破次元壁!GenXD:拿捏真实感3D、4D动态场景
- 中国生成式AI大会,涵盖大模型、AI Infra、端侧AI、视频生成和具身智能等方向
- AI造芯Nature论文遭围攻,Jeff Dean怒怼:拒绝学术抹黑!
- 中国科学院院士,加盟清华大学!
- 腾讯元宝2.0:鹅厂全家桶来啦!
- 12万人面临降薪!国际巨头内部大动荡。。。
- RTX 4090可运行,已完全开源,史上最快视频生成模型问世!
- 一位阿里P9的年薪和家庭资产
- 黄仁勋与沈向洋院士对谈GPU算力、机器人和爱情
- AI顶会AAAI收了一篇论文:没算法没实验,全靠idea思路好…
- 打破纪录!中国科学家让薛定谔的猫活了23分钟
- 硅谷最神秘的「黑手党」纷纷出走创业,融资近百亿!足以改变整个AI格局的革命
- CV大神,MIT何恺明教授最新课程资料!
- 六院院士!又一顶尖学者归国,全职加盟清华大学
- Scaling Law或将终结?哈佛MIT预警:低精度量化已无路可走。。。
- 国际巨头,AMD宣布全球裁员4%!
- 大模型推理加速技术的学习路线是什么?
- 吴恩达:大模型的下一个热门方向
- 3名高中生杀出重围,论文已被顶会 NeurIPS 2024录用
- 香港城市大学招 机器学习 /大语言模型方向全奖博士
- 教授含泪惜别“双一流”高校:教学,影响了我原创性科研成果的产出
- 谷歌2024博士奖学金名单揭晓!清华姚班大神、KAN一作大佬入选
- 被美国“制裁”的中国大学名单。。。
- 美国司法部勒令谷歌出售 Chrome
- 耽误业界好多年? Karpathy:现在回想,真的后悔极了。。。。
- 校长书记双院士!教育部副部长,任C9党委书记
- WHALE来了,南大周志华团队 最新成果发布!下一个世界模型?
- 又一985,落地深圳!
- 马斯克招人策略曝光:需进行9轮面试,低底薪+股票奖励
- 最新版《神经网络和深度学习》中文版.pdf
- Make U-Nets Great Again!北大&华为强强联合
- 中国团队斩获EMNLP’24最佳论文!UCLA华人学者中三篇杰出论文
- ETH官宣制裁中国学生,国防七子等高校均在名单内。。。
- 清华大学获X-Embodiment最佳论文奖,机器人顶会CoRL 2024
- MIT教授,何恺明大神最新课程资料下载!
- 被导师放养,后果可能很严重。。。
- 50s完成7B模型量化,放大招,4bit直接达到 SOTA
- 高校不给教授们涨工资了,开始裁员计划?
- 一个模型走天下!智源提出全新扩散架构OmniGen
- 2025QS亚洲大学排名出炉,197所中国高校上榜!
- 空间智能版ImageNet来了!李飞飞吴佳俊团队出品
- 武汉大学:新增8位“国家杰青”!创历史新高
- 特朗普回归,硅谷科技圈大变!埃隆·马斯克身价突破3000亿
- 突发!OpenAI七年元老、安全副总裁Lilian Weng官宣离职!北大本科
- 俄罗斯对谷歌开出天价罚单!远超全球GDP总和
- 又一院士被“除名”!院士终生制,没了?
- 投资21.7亿!C9新校区
- 深圳一家公司造出世界上最酷机器人,卖2-3万美元
- 涨点神器!100个即插即用注意力模块
- 90后上海女生,成美国数学大奖首位女性华人得主!
- 博士师弟,手握多篇CV 顶会论文!
- TPAMI 2024|解耦图神经网络,效果惊艳!
- 翁荔:掌管OpenAI安全的神
- 国内外有哪些不错的计算机视觉研究团队或实验室?
- 10秒创造一个世界!吴佳俊大神最新研究成果,比现有技术快100倍
- 诺奖得主,受聘西湖大学!
- 陈景润,获批国家杰出青年基金
- 中国工程院院士炮轰华为:你们这是在搞中式垄断
- 专补大模型短板的RAG!!!
- 苹果地表最强AI PC诞生,M4 Max猛兽加持性能暴涨!
- 阿里、腾讯、小米、京东,不同职级薪资待遇一览表
- 火爆全网,神秘“小熊猫”一夜刷屏,排名超越FLUX、Midjourney、SD,疑似中国制作?
机器学习与大模型
深度学习基础与进阶
- 洗个澡把 offer 洗没了。。
- 计算机视觉被GPT-4o终结了(狗头)
- 知乎热议 | 前几周Deepseek都是神一般的存在,为啥热度消散得这么快?
- 何恺明的ResNet,成为21世纪被引量最多论文,Nature最新统计
- 清华伯克利还是无了。。。
- 计算机视觉被GPT-4o终结了(狗头)
- 洗个澡把 offer 洗没了。。
- 深入解析图神经网络注意力机制:数学原理与可视化实现
- 又一位!著名数学家,在美近40年后,回到中国!
- 万字详解:LightGBM 原理、代码最全解读!
- PPO & GRPO原理,小学生也能看懂!
- 体育教师发Nature遭质疑,校方发文称“零的突破”引争议!全篇不到200个单词。。。
- PPO & GRPO原理,小学生也能看懂!
- 上海AI Lab发布LLM高效Reasoning综述!全面总结如何“少想多做”
- 全民热议 AI:你真的会用 DeepSeek、ChatGPT 和 AI 智能体吗?
- 手把手教你部署deepseek多模态大模型
- PPO & GRPO原理,小学生也能看懂!
- 在CV界,传统卷积已经彻底输给Transformer了吗?
- AI编程神器Cursor,保姆级教程来了!
- AI大佬曼宁转赞,MetaGPT团队首提「Atom of Thoughts」,原子化思考让4o-mini暴打推理模型?
- 无人报考!顶尖大学,校区关停
- YOLOv12入门教程
- 13岁学编程,20岁哈佛退学,31岁成为世界首富……比尔·盖茨首部自传上市!
- “强化学习之父”最新完整实录:AI研究的正确方向
- 刚刚!微调 DeepSeek 满血版正式开源。。。
- 一文搞懂 DeepSeek 核心技术!
- 美团开源首发INT8无损满血版DeepSeek R1
- 经典回顾 | Deepseek开源盛宴第一天:FlashMLA
- 最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)
- YOLOv12入门教程
- DeepSeek的多模态能力如此强大,为何科研人员还在手动处理数据?
- 图解机器学习:贝叶斯算法
- 丘成桐任首任院长!顶尖大学成立新学院:8年制,每年招40人,毕业获博士学位
- 原来,这些顶级大模型都是蒸馏的!
- 大模型微调项目 / 数据集调研汇总
- 你的学校上榜了吗?DeepSeek中国大学排名Top100
- (附代码)在OpenCV中基于深度学习的边缘检测
- “用了DeepSeek,每天减少9.68小时工作量”
- 你没有看过的全新版本,Transformer数学原理揭秘!
- 免费无限次!671B满血版DeepSeek R1隐藏入口,优秀平台推荐!
- 关于DeepSeek,特朗普最新表态
- D-FINE:在DETR中将回归任务作为分布来细化
- 惊爆!Sam Altman正面回应DeepSeek:”OpenAI投入多少,AI智能就有多强”(附视频)
- DeepSeek实习感受与大模型择业思考!
- 完整的671B R1塞进本地,详尽教程来了!
- 马斯克招聘:发代码过来,不要扯别的!Just show us your code
- 11 种特征选择策略总结!
- vscode中调用deepseek实现AI辅助编程
- 美国顶尖名校课程改革,All in Python!
- 图神经网络的数学原理总结
- 习近平签署主席令!研究生,迎大变革!
- GhostRNN:以低成本 Transformer Layer 实现 RNN 模型精简与性能提升 !
- LSTM模型结构的可视化
- “给我滚出贵大!”郑强出任贵州大学校长,打算把树全砍掉,学生愤怒抗议,4年后事情反转
- “注意力之父”!遥遥领先Transformer 26年
- 再见!支持向量机
- 道不尽的卡尔曼!通俗易懂详细解释卡尔曼滤波
- 超百所大学,获批全国重点实验室!
- 多模态可解释人工智能综述:过去、现在与未来
- 一步一步在Windows上配置深度学习环境!
- 一文看懂 | 扩散模型(Diffusion Models):从噪声到图像的神奇之旅
- 985教授已发表1226篇论文?本人回应“学阀”等质疑
- GPU多卡并行训练总结(以pytorch为例)
- 一文看懂 | 扩散模型(Diffusion Models):从噪声到图像的神奇之旅
- 中纪委严厉批评:中国高校面临重大整改
- 想学SVD(奇异值分解)算法?看这篇就够了
- 研二学生被舍友投毒,官方最新通报
- ECCV 2024 | 基于Transformer Decoder的高效多任务视觉定位框架
- 中纪委严厉批评:中国高校面临重大整改
- 「分割一切」升级!SAM3要来了?
- 某副教授相亲100多场总结出来的经验,网友:建议开源,发表论文…
- 字节团队提出 SuperClass 告别CLIP ,革新图像文本预训练分类技术 !
- 梁朝伟,博士!
- OrientedFormer: 基于 Transformer的定向目标检测新框架 !
- 一位中国博士把整个 CNN 都给可视化了,可交互有细节,每次卷积 ReLU 池化都清清楚楚
- PyTorch下的可视化工具(网络结构/训练过程可视化)
- 再见!SVM
- 大学“一级教授”和“四级教授”的区别有多大?
- TPAMI 2024 | PoseScript:将三维人体姿态与自然语言相链接
- 发表SCI论文很重要的一个高效率工具,大家都在用。
- 我们真的需要把训练集的损失降到零吗?
- 校长书记双院士!教育部副部长,任C9党委书记!
- 【深度学习】基于 PyTorch 如何选取合适的损失函数(MAE、MSE、Huber)
- 谷歌2024博士奖学金名单公布
- 关于自学人工智能的一些建议
- UCLA、MIT数学家推翻39年经典数学猜想!AI证明卡在99.99%,人类最终证伪
- 神经网络时间序列预测PyTorch-Forecasting
- 工业相机标定相关知识整理
- 总结了 30 段极简 Python 代码
- 看哭!40岁才博士毕业,省长写了篇博士论文后记
- 揭示Transformer重要缺陷!北大提出傅里叶分析神经网络FAN,填补周期性特征建模缺陷
- 欧式距离、曼哈顿距离、切比雪夫距离三种距离的可视化展示
- ECCV 2024 | 首次基于深度聚类的多模态融合
- 为什么回归问题用 MSE?
- TPAMI 2024 | MURF:相互增强的多模态图像配准与融合
- 中国工程院院士炮轰华为:搞中式垄断,我们用这种方法打不赢外国
- TPAMI 2024 | 层次增强与蒸馏:面向类别增量音频-视觉视频识别的研究
- 官方明确:本科宿舍4人间,硕士2人间!
- NeurIPS2024 | 提高专业生产力,让你的AI画作布局可控,360 AI Research开源新模型HiCo
- Batch Normalization原理与实战
- 比GraphRAG还好的LightRAG到底是何方神圣?
- 勾股定理还能这样证明?高中生一连发现10种证明方法,陶哲轩点赞
- 新扩散模型OmniGen一统图像生成!
玩机器学习的章北海
- 机器学习论文解读,XGBoost很能打
- 机器学习在生物标志物发现中的创新应用:生物驱动LASSO方法解析
- 用机器学习评估供体特征对儿童心脏移植结果的预测能力
- 机器学习模型预测心脏移植死亡率
- 基于机器学习的肺移植系统开发,以韩国数据为例
- 机器学习,GPU加速159倍
- 猜猜看,我最喜欢哪一个?
- 【实测】ChatGPT 4.1 没那么好
- SQL-R1:通过强化学习训练自然语言到 SQL 的推理模型
- 这事儿,我认为可信度不高
- 机器学习论文:从海量数据中挖掘材料设计的关键因素
- 机器学习论文:阿尔茨海默病早期预测
- 美国奥数题撕碎AI数学神话,顶级模型现场翻车,最高得分5%,DeepSeek唯一逆袭
- DeepSeek-V3-0324 已成非推理第一
- 用DeepSeek做学术
- 机器学习论文:复现特征重要性柱状图、Shap模型可视化解释
- 机器学习论文复现:6个模型ROC曲线、箱线图展示5折交叉AUC分布
- MAKE 机器学习 GREAT AGAIN
- DeepSeek 大模型能力轻松接入100+应用
- 机器学习医学预测,论文复现:风险评分分布图、ROC曲线、特征重要性条形图
- Python 数据结构全解析:从基础到实战
- 【论文鉴赏】机器学习助力肺移植:多站点生物标志物预测原发性移植物功能障碍的创新研究
- 【机器学习】数据降维技术:何时使用,何时避免?图解+Python代码实例
- 机器学习预测肺移植后PGD患者分类,附论文图表复现Python代码
- 【论文鉴赏】机器学习在老年医学中的应用全景:系统综述解读
- SHAP模型可视化:让机器学习模型不再是黑箱,附完整部署指南
- 论文鉴赏:利用机器学习预测脆性髋部骨折后一年死亡率——模型开发与内部验证
- RAG 技术超全全景图从基础到高级实践
- 我有朋友去DeepSeek上班了
- 别随便本地部署大模型,Ollama重大安全隐患
- 清华大学DeepSeek使用手册,长达104页!(附PPT下载)
- 我做了一个AI数据分析网站
- 一行Python代码,数据集转化为交互式可视化分析工具
- 全方位拥抱 DeepSeek,本地部署、AI编程、辅助写作、网页/PDF全文翻译
- 吴恩达新课,我毕业了
- 可能是全网最全的速查表:Python Numpy Pandas Matplotlib 机器学习 ChatGPT等
- 开发了一个快捷指令,一键AI总结网页,保存到本地,附代码
- 全文翻译了吴恩达《如何打造AI职业生涯》PDF,附教程
- 可视化的爬虫平台,无需代码
- AI服务器环境搭建指南,从裸机到“战斗”机(下集)
- 计算机系末日了,美国顶尖名校抛弃计算机基础课,All in Python!
- AI服务器环境搭建指南,从裸机到“战斗”机(上集)
- AI服务器环境搭建指南,从裸机到“战斗”机(2):防火墙、Git、Docker、Python、多用户JupyterHub
- 大模型中的Token,一文读懂
- 如何用 Python 制作 epub 电子书
- 艹,我的声音被克隆了
- 分享9个私藏的资源,量大管饱,自助取用
- Pandas 加速150倍!
- 用机器学习来优化人生
- 吴恩达宣布,推出新的开源 Python 包
- 找了AI,陪6岁女儿学英语,英国伦敦腔
- 不要只知道ChatGPT、Cursor!这张AI工具图谱,个个都是神器!
- 10 分钟掌握 Pandas 核心操作:从零开始的数据分析实战
- 机器学习进阶必备-10 个高效 Python 工具包完全指南
- AI大模型·白皮书 | 2024中国生成式人工智能应用与实践展望-中国联通研究院-70页
- 阿里巴巴 EasyExcel 绝版了
- Numpy中数组和矩阵操作的数学函数
- 姜萍造假实锤!阿里道歉,元凶是王老师?
- 从0到1实现神经网络(Python)
机器学习算法与Python实战
- AI 编程再下一城,读懂所有GitHub代码库,团队核心都是华人
- 自动机器学习,贝叶斯优化类不平衡学习在药物发现中的应用
- 斯坦福大学计算机公开课 2025春季上新!完全公开,免费旁听
- 百度、腾讯、阿里大模型面试,一面到三面
- 薅羊毛!OpenAI发布「轻量版」Deep Research,免费用户也能
- RAG原作者:我们仍然需要RAG(并且永远需要)
- 1张4090,本地部署多模态大模型
- 不是,现在都流行用Kaggle写论文了吗?
- 清华特奖团队,100%开源,视频生成AI一夜刷屏!
- 搭建完美的写作环境,续一篇
- 对 ChatGPT 说“请”和“谢谢”,每年会花费数千万美元的电费
- 1张4090,本地部署多模态大模型
- 微软这次真把Markdown玩明白了,接入MCP
- 【PPT、代码下载】西湖大学:强化学习的数学原理,从零开始到透彻理解
- 吃瓜,大模型推理引擎,vLLM和SGLang 杠起来了
- 机器学习模型预测心脏移植死亡率
- AI 爬虫核武器!Crawl4AI 横空出世,数据采集只需一行代码
- 3070起跑,可本地运行的 Gemma 3 ,破产开发者福音
- 大模型最近的突破,全靠疯狂作弊
- OpenAI:AI下半场!强化学习(RL)终于奏效了
- 霸榜ICLR25!大模型高效推理成顶会新风向!88种创新思路,速码!
- 2025年,AI Agent将如何”杀死”你的工作?
- 【实测】ChatGPT 4.1 很好,但没那么好
- 斯坦福学生搞出的论文神器太逆天!秒搜热门论文,3分钟搞定论文总结、翻译,效率飙升100倍!
- GPT-4.1横空出世,GPT-4.5被“判死刑”:100万Token、超高分、超低价,AI开发进入疯狂时代!
- 刚刚,DeepSeek 宣布,准备开源推理引擎
- 突发,GitHub配置失误导致中国用户被锁门外,17个小时才修复
- 突发,GitHub 疑似屏蔽所有中国 IP访问
- 台大李宏毅2025 AI Agent 公开课来了!
- 机器学习论文解读,XGBoost设计更易接受和有意义的医学机器学习模型的方法
- 如果你用过Matplotlib,请记住他的名字
- 【教程】搭建纯本地个人知识库,打造DeepSeek加持的第二大脑
- 引用240篇大模型论文,大模型推理中的缩放研究综述
- 【教程】打造个人知识库,线上、免费
- 大模型推理引擎之:SGLang
- 互联网活菩萨Cloudflare,免费RAG方案
- 斯坦福2025 AI Index报告来了:DeepSeek在全文中被提到45次
- 【人工智能 · 重点EI会议】往届已完成检索!国内外知名高校联合主办!
- 号称超越DeepSeek,翻车了,Llama 4被疑考试「作弊」
- 用大模型下载论文、总结论文,效率飞起
- Llama 4开源,Deepseek被超越!
- DeepSeek联合清华公布新论文!R2要来了?
- 朱啸虎观点:AI应用护城河在于脏活累活
- 机器学习论文:阿尔茨海默病早期预测
- DeepSeek 新专利公布
- 【本地部署教程】真·OpenAI & 真·多模态
- 【教程】用大模型 ,批量下载,总结论文
- 大模型时代,阅读论文新范式
- 【教程】用DeepSeek搭建AI Agent
- OpenAI准备开源,冲着 DeepSeek-R1 来
- 【教程】大模型量化界翘楚:unsloth
- 10个适用于多个学科的Python数据可视化库
- 0 废话,dify1.0.1内网环境,离线部署
- 学术志,极速上手DeepSeek
- GPT-4o「吉卜力风」一夜爆火,奥特曼连夜换头像!宫崎骏痛批AI侮辱生命
- 马斯克的公司xAI收购了马斯克的公司X
- 2025年开源世界第一瓜,喜提律师函
- 真·多模态问世,阿里开源Qwen2.5-Omni,7B参数完成看、听、说、写
- GPT-4o原生图像生成上线,P图、生图也就一嘴的事
- DeepSeek-V3-0324 已成非推理第一
- 最近爆火的全中文LLM教程,实战企业落地项目
- 【教程】阿里最新多模态大模型Qwen2.5-VL-32B ,本地部署实践
- 全美各大高校的统计学课堂疯抢,机器学习漫画书终于出中文
- AI汪峰再上线,阿里全新大模型,32B 可以比 72B 更聪明
- 刚刚,DeepSeek发布了最新V3大模型0324
- DeepSeek核心技术PPO & GRPO原理,小学生也能看懂!
- 7B专业领域大模型,能打DeepSeek- R1?测试甚至不如QwQ:32B
- DeepSeek背后核心之:强化学习
- 批量生成小红书风格知识卡片,附Python代码!
- 大模型量化技术(Quantization)可视化指南
- 极简教程,大模型量化实践,1张4090跑QwQ?
- RAG技术全探索:20种方法源码解读与实践
- 极简教程,4张4090,本地部署QwQ
- 小模型正在越来越强!单张4090起跑
- 真诚建议,不要再玩提示词了
- 多模态融合,顶会超神了!
- 听说,你还在玩提示词啊?
- AI灭霸这事儿,先别急
- AI 会随机抢走世界上50%的工作
- 百度回归了,还是熟悉的味道
- 大模型行业落地案例分享:Dify在顺丰内部AI Agent落地
- 大模型做PPT,最强解决方案
- 杀疯了,谷歌的Deep Research也来了,免费!
- AI 生成内容,监管来了!
- 呼吁打压中国 AI,OpenAI 要求禁用 DeepSeek!
- 全面认识一个新出炉大模型,仅需3步
- Manus 之后,OpenAI发布可自动执行任务的AI Agent
- 大模型提高写代码效率?我不信
- 关于大模型,普通人最大的机会在Agent
- 国内首部AI大模型私有化部署标准启动编制,适合10类企业参与!
- 给所有大模型加上联网功能,套到极致,就是艺术
- 【收藏】DeepSeek大模型能力接入100+应用
- Manus火到国外?实测惊呆!00后博士生0天复刻霸榜开源第一
- 阿里通义千问,汪峰附体了
- 计算机视觉,2025年依然值得深入学习
- Manus开源平替来了,免费,无需邀请码
- 纯手工复刻Manus演示功能,顺便做了一个网站,睡后收入3美分
- DeepSeek爆火,留给程序员们的时间不多了
- 全网都在吹的中国团队发布的 AI Agent产品Manus,我发现其创始人更“牛逼”
- 如何绘制甘特图,代码示例(R、Python)
- 机器学习项目团队都有哪些角色?如何分工
- 【火热征稿中-稳定检索】2025年计算机视觉、人工智能、物联网EI会议重磅来袭!
- 机器学习面试准备路线图(2025版)
- 用大模型学机器学习:机器学习项目全景、高效学习计划
- 没有经验,可以搞大模型吗?可以
- 吴恩达最新项目,玩转PDF
- 关于大模型,普通人最大的机会在Agent
- DeepSeek宣布:我们的成本利润率是 545%
- DeepSeek-R1之后,别琢磨优化提示词了
- 【机器学习】数据降维技术:何时使用,何时避免?图解+Python代码实例
- DeepSeek 开源周,完结,撒花
- 实测,阿里最新推理模型Qwen2.5-max可否与DeepSeek一战?结果统统被Claude-3.7碾压了
- SHAP模型可视化:让机器学习模型不再是黑箱,附完整部署指南
- Claude 3.7 Sonnet游戏里贪吃蛇惊现自我意识?发现自己是代码绝望崩溃
- 搭建完美的写作环境P15:小众但有用,Markdown网络图片上传Claude R2 图床
- 地球上最聪明的编程大模型,Claude 3.7 来了,视频实战演示
- DeepSeek 开源周,一杀:极限压榨硬件性能
- 智商测试,DeepSeek vs ChatGPT o3
- 放弃百万美金年薪去做大模型研发,我后悔了吗?后悔了
- DeepSeek解读,清华大学、天津大学、厦门大学哪家强?
- 大模型被团灭了
- RAG 技术超全全景图从基础到高级实践
- 腾讯:23张PPT搞懂DeepSeek核心技术!
- 马斯克还可以,“地球上最聪明的人工智能”Grok-3免费了
- 1.6 万Star 大模型开源项目,Agent、RAG、DeepSeek、Chatbot一站搞定
- 开源了!DeepSeek V3+R1满血微调工具一键启动,硬件要求降10倍
- 百度搜索,首页接入DeepSeek,鉴定为满血
- 这才是时间序列2025最好中稿的方向
- 马斯克太鸡贼了
- OpenAI 要开源了
- DeepSeek+腾讯知识库,打造最强大脑
- 原来,这些顶级大模型都是蒸馏的!
- DeepSeek 朋友圈+1,真正的大佬还没来!
- 如何正确使用DeepSeek R1
- 开源不再是智商税了?百度宣布,文心大模型开源
- 别随便本地部署大模型,Ollama重大安全隐患
- 看懂DeepSeek ,一篇文章远远不够
- 看懂DeepSeek ,一篇文章远远不够
- 看懂DeepSeek ,一篇文章远远不够
- 看懂DeepSeek ,一篇文章远远不够
- 机器学习模型的保存与加载,完全指南
- 机器学习模型的保存与加载,完全指南
- 哪些国家封杀了DeepSeek?
- DeepSeek官方提示词模板,要简洁!不要弯弯绕!
- 大模型时代,Python已死?大错特错
- AI、大模型资料分享,微信群
- AI、大模型资料分享,微信群
- 清华大学DeepSeek使用手册,长达104页!(附PPT下载)
- 内网部署大模型、API接口管理平台、企业级智能问答知识库及Agent编排平台
- DeepSeek接入PyCharm、Jupyter、Cursor、WPS、Obsidian、知识库&Agent、聊天助手
- 全方位拥抱DeepSeek【下集】
- DeepSeek实习感受与大模型择业思考!最后选择了字节
- 看懂DeepSeek ,一篇文章远远不够
- 【附复现代码】基于PINN的论文创新思路
- 【附复现代码】基于PINN的论文创新思路
- DeepSeek研究报告,PDF下载
- 与孙正义对话,Sam Altman正面回应DeepSeek:”OpenAI投入多少,AI智能就有多强”(附视频)
- 完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
- 机器学习中25个最重要的数学定义(公式、代码实现)
- AI世代年轻人生存指南:重构竞争力的五大进化维度
- 全方位拥抱 DeepSeek,本地部署、AI编程、辅助写作、网页/PDF全文翻译
- 奥特曼被逼急:深夜上线 o3-mini,甚至免费,网友:还是选DeepSeek
- DeepSeek突围奥秘曝光,天才集结,开出千万年薪
- 微软前脚调查DeepSeek,后脚火速上线
- DeepSeek 更值得被关注的是R1-Zero,强化学习(RL)比人类专家标注的监督微调(SFT)更靠谱
- 阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏
- DeepSeek引发硅谷恐慌:它正向西方AI巨头发起挑战
- 「神秘的东方力量」刷爆美国AI圈,李彦宏啪啪打脸
- 英伟达RTX 5090评测解禁,AI 能力太强了
- 2025泰晤士世界学科排名公布!北大第一、浙大第二
- 央国企!入局AI大模型(附66家名单)
- 吴恩达:中国的DeepSeek让人印象深刻,我想对他们说“加油”
- 超级AI应用
- 狂发顶会的特征融合,再出神作!
- “CloseAI”在美国,“OpenAI”在中国
- CNN+LSTM+Attention多热点搭配!又是创新性拉满的高分思路!!
- 老婆饼里没有老婆,夫妻肺片里没有夫妻,RLHF 里也没有真正的 RL
- AI服务器环境搭建指南,从裸机到“战斗”机(下集)
- CNN+LSTM+Attention多热点搭配!又是创新性拉满的高分思路!!
- 突发:国家安全考量,美国密歇根大学终止与上海交大合作!
- 2024年AI大模型回顾!
- AI又双叒叕来革命,程序员又双叒叕失业潮
- AI服务器环境搭建指南,从裸机到“战斗”机(2):防火墙、Git、Docker、Python、多用户JupyterHub
- 突发!美国拟(全面禁止)向中国出口 AI 芯片
- AI服务器环境搭建指南,从裸机到“战斗”机(上集)
- 【附复现代码】基于PINN的论文创新思路
- 血亏,刚买了4090,更强悍、更便宜的5090来了
- 【机器学习数学基础系列】概率论中的极大似然估计:入门与Python实践
- 统计学中的假设检验:Python实现U检验和卡方检验
- 用大模型写了本书
- 本地运行大模型,要买什么显卡?
- Python中级教程-测试开发
- 抑郁6个月后,DeepMind科学家离世,万字绝笔谈在AI行业工作压力
- Python高级编程:web开发之Flask
- 真的建议赶紧搞个软考证书!(红利期)
- Python 高级教程:异步与并发编程详解
- ICML 2025,即将截稿!
- Dify 零代码 AI 应用开发:内网离线部署指南
- 2025年了,居然还有人 Python 都没入门
- 2024年过去了,我很不怀念它
- 主宰世界的 9 个算法
- Docker 极简入门
- 2024年最常用的Python库和工具
- OpenAI裂变成了两块:一块营利,一块非营利
- 国产大模型,火爆全球,6710亿参数,已开源!
- XGBoost 比深度学习还强?
- 武汉大学宣布:成立人工智能学院!
- 横扫2024各大顶会,用Mamba发Paper真的很轻松!
- 人工智能专题研究报告:Openai 12天发布会梳理|附35页PDF文件下载
- 万字长文梳理 2024 年的 RAG
- 做技术永无出路?
- GitHub 104k,李沐大神力荐,这本超好懂的算法教程,被读者称为“顶好的入门教材!”
- 黄仁勋:我打扫过的厕所比任何CEO都多
- 机器学习漫画小抄
- 被导师放养,后果可能很严重。。。
- 我心目中最强的 10 个 Python 库
- 写代码这么多年,我依然觉得编程很美妙!
- 谷歌版Sora发布:最大对手竟是快手的「可灵」,OpenAI 最辣鸡
- 高中生手机写出2.5万行代码,网友:给小孩哥捐个电脑!
- AI+行业,目前的答案只有一个词: Agent
- LSTM之父:我也是注意力之父!遥遥领先Transformer 26年!
- Cursor + Qwen2.5-Coder 开发一个网页应用,So easy!附代码
- 用 Python 把 Markdown 玩的明明白白
- 快速学会登上nature的热门算法,LSTM!
- 梅宏院士:当前 AI 存在三大问题,泡沫太大!以偏概全!期望过高!
- 机器学习与大模型的结合:用大模型做特征筛选
- AI +《永乐大典》,1800部书在线读
- Python 3.13 封神!改变 AI 和 ML 游戏规则
- 「普通博士生」和「顶级博士」的区别
- 白嫖Cursor,国产大模型(腾讯、通义千问)加持
- 【干货】7种常用数据分析模型和方法,建议收藏!
- 爷青回!人人影视宣布:将二十年数据开源分享
- 一段神奇的Python代码,拿走不谢
- 用大模型写年终总结,推荐三种方式
- Python 入门路线图(2024 极简无废话版)
- 涨点神器!100个即插即用缝合模块【合集下载】
- 强烈建议尽快搞个软考证!(重大利好)
- Python 和 R ,谁更厉害?
- 白嫖Cursor
- 雷军的大学时候的论文:不需要参考文献
- Linux 速查表
- 原来概率论不只是数学,还是人生导师!
- 不是,现在都流行用Kaggle写论文了吗?
- 几个超酷的项目,已开源!
- 刚刚,吴恩达宣布,推出新的开源 Python 包
- 科研图表可视化利器,交互式操作,与Matplotlib 无缝集成
- RAG还是微调,怎么选?
- 用 Excel 表格做出堪比动画软件效果的 AI 手绘讲解
- 用 Python 把 PDF 玩的明明白白
- 吴恩达:每个AI从业者都应该关注Agent!
- 5G唯一受益者,何同学道歉了!我也“专门写了一个软件”!
- 史上最全!371张速查表,涵盖AI、ChatGPT、Python、R、深度学习、机器学习等
- Cursor 完全实用教程之外,Cursor Rules 详解
- 人生苦短、程序员必备神器!从开发到部署的主流工具全景图
- 神经网络是怎样练成的?
- 机器学习,可以这么学,强推!
- 机器学习数据降维与可视化:t-SNE详解与实践【附代码】
- 用 R 复刻了一张图,附代码
- 快速学会登上nature的热门算法,LSTM!
- 值得开发者好好看一看的AI大模型入门教程(内含300道AI面试真题)
- 50K*16薪,进字节了!
- 教授何恺明在MIT的第二门课——《深度生成模型》,PPT陆续已出
- 机器学习进阶必备-10 个高效 Python 工具包完全指南
- 再见 EasyExcel !
- 【赠】出书了,《破解深度学习》来了!
- 大模型发展方向,你绝对想不到!
- 机器学习数据预处理中的数据泄露问题!
- 【RAG实战】基于TextIn打造上市公司财务报表智能问答系统
- 腾讯活菩萨?最强大模型开源,免费商用。
- 涨点神器!100个即插即用缝合模块【合集下载】
- 手搓AI大模型应用获25万用户,辞职创业,收入不如摆摊,网友建议:重新进厂打工
- 面了一个字节50k大佬,见识到了基础天花板!
- 微软研究院出品:让 GPT-4V秒懂屏幕截图,本地部署
- 面了一个字节50k大佬,见识到了基础天花板!
- 微软研究院出品:让 GPT-4V秒懂屏幕截图,本地部署
- 15岁山东初中生做CTO,开源项目被100万收购
- 继续折腾 Obsidian,本地部署one-api,畅通免费大模型
- 100+深度学习各方向数据集资源大盘点
- 深度学习面试题合集(PDF下载)
- AI 证件照制作工具
- 神经网络首看书《神经网络与机器学习》,中英文版本PDF下载
- 被李宏毅大神点赞,深度学习详解,开源了
- AI 引领的新纪元 — Python 问鼎第一, 印度崛起!
- Anthropic官方 深入探讨prompt工程 | 全文脱水中文版
- 算法入门,《算法图解(第2版)》终于来了!
- 分享 7 个用 Python 开发成的数据库
- “院士之乡”:一共走出26位院士,百位高校校长,一万名教授
pythonic生物人
- 《保姆级R可视化教程》来了!
- Hinton关于求学最新分享:“不要开始就阅读文献,阅读会腐蚀大脑。自己首先解决问题,然后查看文献,看看你的解决方案是否新颖!”
- Python轻松搞定Ternary plot
- 告别”垃圾图表”到升,我只改了这8个seaborn参数
- PDF转Word,这个工具让你告别格式错乱,一键搞定所有文档!
- 科研人必看!这款免费神器比Python简单10倍,论文配图直接封神!
- 通用人工智能标准、评级、测试与架构
- Python项目代码看不懂?Python代码可视化神器来了,一键可视化代码结构!
- Matplotlib + Seaborn
- 如果你用过Matplotlib,请记住他的名字!
- 爆火的MCP,一图说明白!
- Matplotlib 200个小技巧-下篇
- Matplotlib 200个小技巧-上篇
- Python Orange:托拉拽玩转机器学习、数据挖掘!
- Llama 4开源,竞技场超越DeepSeek!
- matplotlib中文教程
- 收藏的vscode插件!
- 桑基图(Sankey Diagram)
- Python可视化工具-TOP榜
- 热议:中国何时拥有自己的《nature》《Science》?委员给出答案!
- Django创造者Simon Willison分享:我如何使用LLM帮我写代码
- 可视化工具推荐
- seaborn统计p value篇!
- matplotlib搞定进化树(Tree Plot)
- “TRIPLE BAM”!!! 哪些统计学的书让你相见恨晚?
- 数据分类关系可视化大合集:141个图表,8大类型,一次学会!
- 大语言模型可视化
- 饶毅:近年有人推荐一位“杰青”任院长,一看就是“浮躁的典型,发了一批没意义的论文”,还能混江湖,“这类人不仅多,而且频频晋升”
- 55个heatmap模版~
- 一行代码,优雅的探索高维数据
- 《seaborn超级教程》
- marginal plot
- 刚刚,2025中科院分区表已公布!NC虚惊一场
- 一键美化Python图表!
- 嫌Matplotlib繁琐?试试Seaborn!
- Python matplotlib保姆级教程
- 详解matplotlib-broken axis
- 让Matplotlib、seaborn图动起来,栩栩如生
- 很棒的python可视化工具
- 很棒的python可视化工具
- 第11种方法,一键美化Python图表 to 商业风!
- 第10种方法,一键美化Python图表
- 9种方法,一键美化Python图表
- 10大黄金法则,告别“垃圾图表”
- 再说南丁格尔玫瑰
- 第一本给程序员看的DeepSeek图书来了!
- JAMA复现|展示32篇纳入研究的临床实践指南在 NEATS评分中的表现!
- Nature复现|系统化展示不同组数据间的交集和并集关系!
- 2024图灵奖颁给强化学习两位奠基人!ChatGPT、DeepSeek背后功臣戴上迟来的冠冕
- 梁文峰亲自下场!一站式门清deepseek注意力新机制论文!
- 科学家们,别再用彩虹色误导读者了!
- 纽约大学survey:深度学习模型优化方法技巧
- matplotlib + pynimate,轻松让数据动起来!
- 配色工具,数千类colormap供选择!
- 详解Python matplotlib坐标轴
- 详解Python matplotlib坐标轴
- DeepSeek模型在中文语境下的安全性评估
- 55个热力图heatmap代码模版~
- AI技术狂飙突进,图灵奖得主Yoshua Bengio警告:Scientist AI才是安全与创新的平衡点!
- seaborn和matplotlib怎么选,还是两个都要学?
- DeepSeek开源周第一弹:FlashMLA
- Matplotlib可视化秘籍:从零基础到高级应用
- 一文汇总 DeepSeek R1 模型最新复现进展
- 微软强大AI工具OmniParser,它能“看”电脑屏幕、“摸”界面,AI小白也能靠它让电脑自动干点活,省时省力!
- 生物领域的DeepSeek!Arc研究所、斯坦福等联合发布400亿参数的生物AI模型—Evo 2
- 使用Cursor进行编程的黄金法则
- 热力图heatmap代码模版~
- matplotlib heatmap自由~
- 详解matplotlib隐式pyplot法和显式axes法
- matplotlib、seaborn又一个强力统计分析助手
- DeepSeek官方整理实用工具:14大类、100+种应用!
- Jupyter Notebook实用插件分享
- 厦门大学团队:大模型概念、技术与应用实践(140页PPT读懂大模型)
- 热议:为什么DeepSeek出来后,国产其他大模型的集体失声了,以前都号称很强的?
- seaborn
- matplotlib heatmap自由~
- 多子图自由~
- Overview of seaborn
- 又一个模型,荣登Nature!
- 20W字可视化教程
- 清华大学《DeepSeek从入门到精通》PDF
- 离谱!大学教授抄袭50年前的博士论文
- 清华大学《DeepSeek从入门到精通》PDF
- DeepSeek官方提示词手册
- 遇事不决,问python “fuck”~
- PyCharm接入DeepSeek-V3辅助AI编程
- matplotlib图表局部区域放大
- matplotlib教程(目录)
- DeepSeek真实水平全面客观分析
- 在VSCode中免费使用DeepSeek-R1!
- 一图胜千言|超强图解DeepSeek-R1
- DeepSeek 创始人专访:中国的 AI 不可能永远跟随,需要有人站到技术的前沿
- 不用Perl和R,轻松Circos实现
- 嫌Matplotlib繁琐?试试Seaborn!
- matplotlib教程(目录)
- seaborn教程(目录)
- 红包封面上线(round2)
- 红包封面上线(round1)
- 推荐这几个Python实战项目,瞬间读懂Python!
- Python Matplotlib Cookbook(中文版来了)
- matplotlib教程(目录)
- seaborn教程(目录)
- Python 3D曲面Surface自由
- 30年招牌已成历史,杰青、优青、青基项目统一改名!
- 揭晓—两院院士评选2024年中国/世界十大科技进展新闻
- 用它,处理拥挤的散点数据!
- matplotlib可视化从0到1
- 保姆级matplotlib教程—详细目录
- 热力图heatmap代码模版~
- 红包封面上线(round1)
- 是时候用Circos震撼全场了!附最简单的Circos实现。
- 高校首发“AI禁令”
- 请查收,保姆级matplotlib教程:详细目录
- 赞爆!中科院这个课题组火了
- 详解meta-analysis必备—森林图 (forestplot )
- Python+Matplotlib+LaTeX玩转数学公式
- seaborn和matplotlib,怎么选?
- 请查收,保姆级seaborn教程:详细目录
- 请查收,保姆级matplotlib教程:详细目录
- seaborn教程:12.3万字+500多张图形+8000行代码……
- matplotlib教程:20w字+数百张图形+1W行代码+详细代码注释+学习交流群
- Python科研可视化能力有限???
- Python和弦图自由!
- 20w字吃透Python matplotlib
- 4套matplotlib速查表.PDF
- 详解Python matplotlib深度美化(第二期)
- 详解Python matplotlib深度美化(第一期)
- Python matplotlib的上限:可“追星”,可“逐浪”!
- Python“万水千山图”—山峦图/嵴线图/峰峦图
- Python科研可视化能力有限?
- CNS必备UpSet图,这样画,这样看!
- 丘成桐:我的几何人生
- seaborn教程 (优惠截止2024.12.31)
- Nature发布,AI 全球100强!我国19所大学上榜
- 华东师大硕士论文被下载近10万次,研究内容为导生关系,网友:学术圈的小说
- 统计学的真实含义
- 保姆级seaborn教程
- 编程助手GitHub Copilot已向所有用户免费开放
- 把它翻译成中文了,机器学习漫画小抄!
- 还在用Python/R画图?推荐3款0代码工具!
- 微软开源Python Markdown转换工具
- Python-“万水千山图”
- 2024年国家杰青名单汇总
- 教程持续更新ing
- “万水千山图”代码更新
- 又一个AI热门,荣登Nature!
- 支持界面操作/兼容Python/Origin/Octave
- 嫌Matplotlib繁琐?试试Seaborn!
- 《自然》2024年十大人物公布:中国两人入选!
- Python添加P值
- Python 3.13将会改变 AI 和 ML 的游戏规则?
- 用pak管理R包!
- Python轻松添加统计P value(进阶版)
- Python轻松添加统计P value!
- 用pak快速、便捷的管理R包!
- 全球巨头GPU总量曝光!
- Python边际图代码模版
- Python实现PCA/TSNE/SVD等降维算法
- 一位阿里 P9 的年薪和家庭资产
- 图解Transformer
- 中科院2024《国际期刊预警名单》发布!
- seaborn数据可视化!
- 为什么Python没有main函数?
- 如何实现百万级的数据实时可视化?
- 又一个开源科研神器,小参数超越GPT-4o,基于4500万篇科学文献,高效检索科学文献!
- AI群星闪耀时
- 100篇!2024年度中国科学院优秀博士学位论文
- 彻底解决R package 安装这件烂事!
- 如何提高自己的代码能力以达到熟练使用PyTorch?
- “一级教授”和“四级教授”的区别有多大?
- 141个图表代码分享:完美展示数据分类关系!
- 斯坦福HAI发布全球AI产业活力榜单报告,谁才是AI领跑者?
- Andrew Ng发布Python aisuite包,轻松统一调用GPT、Claude、Llama等顶级LLM!
- Nature论文精读: ChatGPT如何辅助academic writing?
- 2025考研人数大跳水!考公人数创历史新高!
- Python核心知识点
- 使用IceCream搞定Python调试
- Python 机器学习、深度学习经典库
- 北航博导教你写论文
- 非常简洁的论文写作公式。。。
- 又一个优雅的Python可视化工具!
- 大模型,还可以这样学
- Python优雅地书写LaTeX
- 不写学位论文,也能拿博士学位了?
- 机器学习TOP 10
- PyTorch损失函数汇总
- tidyplots让科研图表制作更高效
- 从0在自己机器上部署AlphaFold 3
- Pubmed又停止更新了?
- 接住,师姐抛过来一个宝藏的数据绘图帮手!
- 什么时候你意识到做技术永无出路?
- 喜欢调包,有没有R-universe调得一半好啊~
- 强大绘图神器—免费、直接在线使用
- 找到了Notepad++的完美替代!
- 一个优雅的Python可视化工具,附详细教程!
- 精美的Python Rich
- seaborn_analyzer
- 机器学习数据预处理中的数据泄露问题!
- 导师:自己每天科研工作近10小时,都觉得不够。研究生们,每天工作不够5小时,拿什么去竞争?
- 用Python实现十大经典排序算法(附动图)
- “院士之乡”:一共走出26位院士,百位高校校长,一万名教授
- 回归分析44个重要概念
- 一个优雅的Python可视化工具,附详细教程!
- 新手必看,17个常见的Python运行时错误
- 强大绘图神器—83k+ stars、免费、手绘style!
DASOU
- Kimi又开源了!!
- 斯坦福CS 25重磅开课!OpenAI、谷歌等一线大模型科学家公开课!
- ICLR 2025 结果出炉,投稿数再创新高!
- 业内首次! 全面复现DeepSeek-R1 强化学习框架!!
- 全世界都在用JCR分区,中国要弄个中科院分区?意义在哪?
- RAG 作者:RAG 已死,RAG 万岁!
- 全球首个自回归视频生成大模型,开源!!
- Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强
- 264页智能体综述来了!MetaGPT等20家顶尖机构、47位学者参与
- OpenAI姚顺雨:欢迎来到AI下半场!
- 何恺明ResNet登顶,Transformer加冕!Nature独家揭秘25篇高被引论文
- 拿下二区idea!即插即用创新点:多尺度注意力!
- 读博士,一定不要瞎忙活。
- 论文党狂喜!alphaXiv推出Deep Research一秒搜遍arXiv,研究效率直接爆表
- 中科院2025分区表更新!!
- 周志华教授:如何做研究与写论文?
- 永别了,GPT-4!
- 聊聊强化学习发展这十年
- 登上顶会,时序大模型新突破!
- 为什么你在国内高校实验室里发不出顶会顶刊?
- Llama 4训练作弊爆出惊天丑闻!
- 《大模型基础》教材发布,开源!
- Meta深夜开源Llama 4!!
- 台大李宏毅2025 AI Agent新课来了!
- DeepSeek R2来了?全新推理Scaling论文!
- AI新突破!Nature力荐!物理信息神经网络(PINN)创新工作
- 读完这这本大模型书籍,你就是LLM大师!
- 刚刚,奥特曼官宣开源!!
- DeepSeek R1 4 个经典误区认知!
- 清华开源!人人可手搓QwQ!
- 离神最近的一步!Manus杀疯了!
- “计算机视觉被GPT-4o终结了”(狗头)
- Agent太火!看这一篇综述搞定丨华东师大&东华大学出品
- 看文献真的不是在搞科研!顶会是干出来的,不是看出来的
- 刚刚,阿里Qwen又开源了!!
- 实话!国内做科研,别太老实了……
- DeepSeek 深夜惊爆升级!!
- 今年读过最绝的一本LLM书!下载量10w+!看完少走一半弯路
- 亲手复现DeepSeek-R1-Zero实验完整解读
- 博士Offer一夜变废纸!导师被逼抱头痛哭,学术寒冬席卷高校,博士先遭殃!
- 超越DeepSeek GRPO的关键RL算法,字节、清华AIR开源DAPO
- 13年后,AlexNet源代码终于公开:带注释的原版
- 全景解读 LLM Posting-Train(后训练)技术
- 原作者带队再次改造xLSTM,7B模型速度最快超Mamba 50%,权重代码全开源
- 抢救Transformer!谷歌推出全新Scaling Law!
- 有人用DeepSeek拿下一篇SCI,还是1区期刊!
- 首个大模型后训练方法综述!!
- 力压 DeepSeek 关键算法 GRPO!CMU「元强化微调」MRT 登场!
- 没有归一化层的Transformer!刘壮带队,何恺明、Yann LeCun都参与了
- 教授何恺明在MIT的最新讲座!
- DeepSeek R1成功迁移到视觉领域!全面开源!
- 用极小模型复现R1思维链的失败感悟
- 为什么Qwen能自我改进推理,Llama却不行?
- 阿里推理模型一战封神!32B硬刚671B DeepSeek!!
- 刚刚,2024图灵奖颁给了强化学习之父Richard Sutton与导师Andrew Barto
- 视觉强化微调终于也来了!全面开源!
- CVPR满分论文!一块2080Ti搞定数据蒸馏,GPU占用仅2G
- 爆肝GRPO算法,终于从头跑通了!
- 南大周志华团队获奖,AAAI 2025杰出论文奖出炉
- 王炸!DeepSeek彻底爆了!
- 最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)
- 从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
- DeepSeek突袭公布V3 / R1 完整推理系统!!
- CVPR2025结果出炉!这些方向杀疯了!
- Transformer是真热啊!叠上小波变换热上加热,绝对还能发更多顶会论文!
- YOLOv12来了!还加入了Attention
- 又水了一篇顶会!不知道博士咋毕业的,来看看我咋水的。
- 为何说 “在国内做科研,最忌讳踏实”?
- Hugging Face开源超大规模GPU训练实战指南!!3万字!!
- DeepSeek R1 最新复现项目汇总
- 从拒稿到顶刊:90%的人不知道的两大破局关键
- 梁文锋和杨植麟,论文撞车了!!
- 被导师放养,后果可能很严重。。。
- 清华《DeepSeek:从入门到精通》干货分享!104页!
- Qwen架构改造成Deepseek,再复现R1计划
- 三张图速通 DeepSeek-R1 论文和技术原理
- 4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破大模型推理门槛
- 又一篇LSTM的爆火论文,王者归来!!
- 说句实话,普通博士搞科研,哪有什么真正的创新点…
- DeepSeek爆火,留给普通人的时间不多了
- 「simpleRL-Reason」港科大DeepSeek-R1轻量级复现方案解读
- 清华刘知远教授解读 DeepSeek:大模型强化学习技术原理与大模型技术发展研判
- Deepseek R1 Zero成功复现, 三阶段RL,Response长度涨幅超50%,涌现语言混杂
- 即插即用,轻松涨点!把大牛的模块缝合到自己的paper里
- 为什么说DeepSeek的R1-Zero比R1更值得关注?
- 太强了,图解DeepSeek-R1,终于来了
- DeepSeek R1 671B 完整版本地部署教程来了!!!
- 原来,这些顶级大模型都是蒸馏的!
- DeepSeek又又开源了新模型!!
- DeepSeek复现狂潮!!完全开源!!
- DeepSeek-R1爆了,最新技术报告速读
- Kimi 1.5 技术报告解读
- 强!CNN+Transformer再突破,大幅提升模型性能!
- 《大模型基础》教材发布,开源!
- 2024全年值得一读的大模型论文都在这了
- 谷歌新架构终结Transformer,长序列处理王者诞生?
- 博士第三年,目前没有一篇论文,我该怎么办?
- 【附复现代码】基于PINN的论文创新思路
- 火爆AI圈的深度学习 “四大名著”
- GAN已死?GAN万岁,一夜碾压扩散模型!!
- 腾讯大模型面试:MoE训练用TP还是EP?
- 硕士研三,期刊论文被拒稿,可能延毕,怎么办?
- 为什么我说RLHF不是真正的RL?
- 超越YOLO11!这些目标检测项目开源了!!
- 读完这这本大模型书籍,你就是LLM大师!
- 在字节干大模型,是一种怎样的体验?
- 时隔6年,谷歌BERT终于有替代品了!
- 复旦首发“AI禁令”!!
- DeepSeek-V3技术报告解读-万字长文
- 某211高校讲师晒工资条,网友:公积金数额令人瞩目…
- DeepSeekV3带火大模型infra,入门看这篇就够了!
- 一本醍醐灌顶的「大语言模型提示工程」教科书,熬夜读完
- 雷军开出千万年薪挖角!她「逆风翻盘」,研二发表8篇顶会文章,其中2篇一作
- 在字节干大模型,是一种怎样的体验?
- 即插即用,轻松涨点!把大牛的模块缝合到自己的paper里
- 跪在百度一面:MoE训练用TP还是EP?
- 中国MoE大模型一夜爆火全网!!
- o1复现的一点点心得
- 说句实话,研究生搞科研,哪有什么真正的创新点…
- 多模态融合,顶会超神了!
- 《大模型基础》教材发布,开源!
- Qwen2.5最新技术报告解读!!
- 大学“一级教授”和四级教授的区别有多大
- 3B模型长思考后击败70B!HuggingFace逆向出o1背后技术细节并开源
- 中科院已正式发布2024年预警期刊名单
- Tokenization不存在了?Meta最新研究,无需Tokenizer的架构来了
- 没创新点!照样干顶会顶刊!
- 阿里大模型面试:不懂后训练,是真的不太行
- 一文看尽2024年主流11注意力机制
- 《一书解决几乎所有机器学习问题》.PDF下载
- 1年内11名博士生自杀,顶尖高校陷博士生自杀危机,疑因要求学生每学期发1篇SCI
- Ilya宣判:预训练即将终结!NeurIPS现场沸腾
- 字节三面:attention中的Q,K,V怎么来的?
- 雷军大学时候的论文,不需要参考文献
- SFT loss 计算的那些坑!!
- 为什么说在中国做科研最忌讳踏实?
- 涨点神器!100个即插即用缝合模块!!
- 强烈推荐,复旦大学开源NLP快速入门书籍!!
- LLaMA系列一直在假装开源…
- 学术造假!大学教授,被开除!
- OpenAI Day2: 发布强化微调技术,SFT退出历史舞台
- 【内含双12福利】今年读过最绝的一本LLM书!下载量10w+!看完少走一半弯路
- 那些选择退学的博士生们
- ICLR 惊现满分论文,ControlNet 作者新作,Github 5.8k 颗星
- 三次字节面试,都折在RAG上了
- 245个目标检测开源项目合集,建议收藏!
- 靠这个idea!拿下顶会!
- SFT之后为什么需要RLHF?又被问住了
- 吴恩达出手,开源最新Python包
- 喜提 TPAMI 顶刊!
- SFT洗数据,细节真的是太多了!!
- 被问傻了,大模型为什么都用RoPE
- 不是,现在都流行用Kaggle写论文了吗?
- 阿里率先开源Marco-o1,技术报告解读!!
- OpenAI又更新,大模型杀疯了!
- 万字长文,一篇大模型分布式训练的学习过程总结
- 《一书解决几乎所有机器学习问题》.PDF下载
- 何恺明在MIT的第二门课!
- 吴恩达:每个AI从业者都应该关注Agent!
- 面试那么多,真懂RLHF没几个!!
- 挖到宝了,大模型基础教材发布!!
- 大模型中上分技巧大总结!!
- 阿里一面,SFT连环14问,跪了…
- 终于搞懂RAG了!!CMU发布最新综述!!
- 被导师放养,后果可能很严重。。。
- 导师一个idea都没给,但也发了顶会AAAI,我摸索的这个方法绝了!
- 多模态杀疯了!!
- SFT不够吗,为什么要做RLHF?
- 面试官问我:LLM为何都用Decoder only架构?
- 写的真好,万字长文串烧LLM大模型技术原理
- 最强表格AI问世!浙大TableGPT2开源!
- finetune后的模型参数,还可以继续怎么玩?
- 独自一人,怒发顶会!
- 涨点神器!100个即插即用缝合模块!!
- 我看谁还不会推导FlashAttention算法??
- 为啥本科生都能发顶会,而博士一篇都没有?
- 徒手搓一个LLM,逐行代码从0构造一个LLM——LlaMa篇
- RNN回归!Bengio新作大道至简与Transformer一较高下
- 超越YOLOv8,这些目标检测项目都开源了!!
- 一个强的离谱的大模型教学项目!!
AI有道
- 关于追认孔子同志正高级教师的批复
- OpenAI 姚顺雨:欢迎来到 AI 下半场!
- OpenAI、谷歌等一线大模型科学家公开课,斯坦福 CS 25 春季上新!
- 我国仅有4所“纯211”,被称为“984.5”大学,综合实力强悍,超越寻常985!
- 突发!谷歌被逼卖身,OpenAI 趁机收购 Chrome?十亿搜索市场大洗牌
- 《Agent 知识库》重磅发布!
- 迪子,滚动裁员。。
- 全网最火的 AI 提示词,让刘强东王兴线下偶遇。。。
- 2025,Agent 突然一夜封神。。。
- 「全球首个自回归视频生成大模型」,刚刚,Swin Transformer 作者创业团队重磅开源!
- 恶搞关税战!Python 软件包征收 import 关税,将制造业重新带回您的代码库!
- 炸裂!又一个 AI 大模型的新方向,彻底爆了!!
- 新突破,3 个火爆的 AI 项目,已开源!
- Kaggle Top 级方案!
- 荣登顶会:没算法没经验,全靠 idea 选得好。。。
- 台大李宏毅 2025 AI Agent 新课来了!
- o3/o4-mini 幻觉暴增 2-3 倍!OpenAI 官方承认暂无法解释原因
- 深圳大学教授自曝工资收入
- 杀疯了!Gemini 2.5 狂飙「高尔顿板」测试,编码横扫所有 OpenAI 模型
- 涉嫌抄袭!中国社会科学院大学通报:停止一切工作,启动调查!
- 知乎热议 | 前几周 Deepseek 都是神一般的存在,为啥热度消散得这么快?
- LeCun 被痛批:你把 Meta 搞砸了!烧掉千亿算力,自曝折腾 20 年彻底失败
- 想从小米离职了。。。
- 你根本不会用 GPT-4o…
- 王者归来!多模态大模型+具身智能彻底爆了。。。
- 强化学习发展这十年
- DeepSeek-VL 杀疯了!训练成本直降 80%,4K 高清图秒生成,设计师饭碗危险了?
- 何恺明 ResNet 登顶,Transformer 加冕!Nature 独家揭秘 25 篇高被引论文
- OpenAI 震撼发布 o3/o4-mini,直逼视觉推理巅峰!首用图像思考,十倍算力爆表
- 周志华教授:如何做研究与写论文?
- 刚刚,OpenAI 发布 GPT-4.1!全系支持百万 token 上下文,全方位碾压 GPT-4o 并且价格更低!
- 智谱发布最快的推理模型!效果媲美 DeepSeek R1,速度吊打,快 8 倍!
- 百度今年的年终奖。。。
- 只要敢捞偏门,篇篇都是顶会顶刊。。。
- 最强组合!随机森林和 CNN!!
- 突发!GitHub 被曝封禁中国区 IP
- 12 家单位已加入,全国首部 AI 大模型私有化部署标准欢迎参与!
- 博士生经历一任导师病退、二任导师车祸、三任导师病逝后,被光速毕业了….
- 一本你必须知道的机器学习“神作” | 留言赠书
- 永别了,GPT-4!
- 真正的 LLM Agent
- ChatGPT 解锁完整记忆,奥特曼彻夜难眠!所有聊天记录黑历史 AI 全知道
- 灾难式炫夫,300万年薪程序员被辞退
- 洗个澡把 offer 洗没了。。
- AI 封神了!无剪辑一次直出 60 秒《猫和老鼠》片段,全网百万人围观
- 独自一人,怒发数篇 SCI。。。
- Llama 4 爆料大反转,没在测试集上训练!华人员工实名辟谣,LeCun 出面救火
- 王炸组合!扩散模型+Transformer 彻底爆了。。。
- 喂饭级教程!AI 一键试衣,不用 PS 也能学会
- Llama 4 训练作弊爆出惊天丑闻!AI 大佬愤而辞职,代码实测崩盘全网炸锅
- 建议取消发布中科院预警期刊名单?
- Meta 深夜开源 Llama 4!首次采用 MoE,惊人千万 token 上下文,竞技场超越 DeepSeek
- 专家 A: 90 分,专家 B: 56 分!研究生论文盲审俩分数相差34分不让答辩,导师怒发朋友圈:离谱至极…
- 刚刚,特朗普扼杀全美 GPU 供应链?科技大厂核心 AI 算力告急,硅谷陷巨大恐慌
- 奥特曼官宣:免费 GPT-5 性能惊人,o3 和 o4-mini 抢先上线!Llama 4 也鸽了
- 事业编一年 8 万 40 年退休挣 320 万,程序员一年 60 万 6 年挣 360 万,事业编再爽能有程序员干六年退休爽?
- 刚刚,DeepSeek 公布推理时 Scaling 新论文,R2 要来了?
- 浙大校友重磅革新 Transformer!多 token 注意力让 LLM 开挂,错误率归 0
- 终于等到了!国产神器上线,大模型开发者的“外挂”来了。。。
- 年薪 100w!又一新兴岗位崛起!这才是程序员未来5年最好的就业方向!
- 稚晖君刚挖来的 90 后机器人大牛:逆袭履历堪比爽文男主
- 2024 AAAS Fellow 名单出炉:华人学者刘威入选
- LSTM 王者归来,再登 Nature。。。
- 一人能顶一个公司,知识库神器了!
- 吊打 Deepseek?Manus 震动 AI 圈。。。
- GPT-4o 骗了所有人,逐行画图只是前端特效?!底层架构细节成迷,奥特曼呼吁大家别玩了
- 字节跳动 353 人,全部辞退。。
- “计算机视觉被 GPT-4o 终结了”
- 个人公积金交 3998,单位交 3998,加起来一月 8000,一年将近 10 万,好多人辛苦一年都没这么高…
- GPT-4o 图像生成的秘密,OpenAI 没说,网友已经拼出真相?
- 大家有没有发现一个奇特现象:你能在一个公司工作 12 年以上,无论你多忠诚多卖力,一旦公司赚的少了,那你就成了“眼中钉肉中刺”
- GPT-4o 的 P 图太火了,GPU 在融化,官方终于限流了
- 体育教师发 Nature 遭质疑,校方发文称“零的突破”引争议后删改重发
- 阿里深夜开源 Qwen2.5-Omni,7B参数完成看、听、说、写
- 2025 苹果 AI 学者名单公布,黄子琪、孔令东、北大吉嘉铭、清华顾煜贤等12位年轻华人入选
- 说实话,国内搞科研,别太老实了。。。
- 网传某里辞退孕妇,涉事方回应来了
- GPT-4o 图像生成今起免费!奥特曼坐镇紧急发布,指令遵循/文本控制表现惊艳
- 刚刚!GPT4.5+Claude3.7+Midjourney 彻底开放了!
- Qwen 和 DeepSeek 撞车!!
- 李宏毅生成式 AI 导论:最好的 LLM 大模型教程!
- 从 YOLOv5 到 YOLO11!改进有多大?
- 图灵奖获得者:我不用 ChatGPT
- 2025中科院分区地震!这些期刊降区,你的投稿策略该调整了。。。
- Sam Altman :GPT-5 将免费开放,DeepSeek 教训了我们。。。
- 董事长十几刀刺死 CTO:一个要“先发布后优化”,一个坚持先优化。。。
- 3 个令人惊艳的 DeepSeek 项目,诞生了!
- 饶毅:近年有人推荐一位“杰青”任院长,一看就是“浮躁的典型,发了一批没意义的论文”,还能混江湖,“这类人不仅多,而且频频晋升”
- 13 年后,AlexNet 源代码终于公开:带注释的原版
- 独自一人,怒发 AI 顶会。。。
- IEEE TPAMI 2025 | 从像素到像素:一种全新的零样本图像去噪方法
- 80w!确实可以封神了。。。
- 工作 5 年后,又想读个名校的 AI 硕士,还有希望吗?
- 955 神仙公司名单!
- 爆肝两周!CVPR2025 论文合集终于开放了。。。
- 2024 年国家杰青、国家优青名单
- 刚刚,老黄携 GB300 震撼登场!DeepSeek 推理暴涨 40 倍加速全球最快,26 年 Rubin 问世
- 荣登 Nature!LSTM 彻底爆发了。。。
- CVPR 2025 满分论文!重建 vs 生成:解决扩散模型中的优化难题
- 谷歌重磅推出全新 Scaling Law,抢救 Transformer!3 万亿美元 AI 面临岔路
- 碉堡了!DeepSeek 搭建个人独家知识库。。。
- 5 分钟解释 Transformer,一个神奇的算法模型 !!
- 无人报考!顶尖大学,校区关停
- 刚刚,2024 图灵奖颁给了强化学习之父 Richard Sutton 与导师 Andrew Barto | 文末赠书
- 寒心985 计算机博士:手握一篇 CCF A 一作,大厂算法岗,薪资开的挺多!
- 没有归一化层的 Transformer!刘壮带队,何恺明、Yann LeCun 都参与了
- 博士 offer 一夜变废纸,导师被逼抱头痛哭,学术寒冬席卷高校,博士先遭殃
- 如何使用 DeepSeek 进行科研图表绘制?
- 300 万年薪程序员被裁!女友朋友圈一张炫富照片引发的职场地震
- 最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)
- 喜提 AAAI 一作顶会:没算法没实验,全靠 idea 选得好。。。
- CVPR 2025|MambaOut:在视觉任务中,我们真的需要 Mamba 吗?
- Manus 被破解了?曝出系统提示词和背后大模型
- 火爆全网的具身智能是什么?AGI 离不开的利器!
- 黄仁勋预言成真!!!
- 教授何恺明在 MIT 的最新讲座!
- 强得离谱!终于有人把计算机视觉讲明白了 。。。
- 最强组合,随机森林和 PCA !!
- 刚刚!微调 DeepSeek 满血版正式开源。。。
- 我没有大模型经验,可以给个机会吗?
- 刚刚!GPT4.5+Claude3.7+Midjourney 彻底开放了!
- 阿里巴巴:裁减 24940 人!
- 《动手学计算机视觉》正式发布 | 留言赠书
- 邀请码炒到 10 万?OpenManus 深夜开源打脸!Manus 平替光速上线。。。
- AI 编程神器 Cursor,保姆级教程来了!
- 国产 AI 卷疯了!Manus 横空出世,阿里开源 QwQ-32B!
- CVPR 满分论文:一块 2080Ti 搞定数据蒸馏,GPU 占用仅 2G,来自上交大“最年轻博导”课题组
- CVPR 2025 放榜!杀疯了,本科生连中三篇
- 10 个超实用 DeepSeek 指令,国内外研究现状有救了,大大节省时间!
- 彻底搞懂!九大损失函数 !!
- 35 岁北大校友突破 125 年数学难题!网友:华人数学奇迹年
- 独自一人,怒发数篇 SCI。。。
- 李国杰院士“七问”DeepSeek
- 全网疯抢的顶配 AI 神器!比肩 DeepSeek 让 AI 生图简单到离谱!
- 通透!十大 PyTorch 核心操作全总结!!
- 碉堡了!用 DeepSeek 写了篇一区论文
- 一句话让 DeepSeek 思考停不下来,北大团队:这是针对 AI 的 DDoS 攻击
- 90 后北大校友破解挂谷猜想,陶哲轩激动转发!网友:预定菲尔兹奖
- 裁员 1800 人。。。
- AI 论文,撤销学位!
- 手把手薅到 DeepSeek-R1 671B 满血版,白嫖真香!
- 刚刚 GPT4o、Claude 彻底开放了!
- 姚班天才创办的大模型公司,卖了
- 用 DeepSeek 2小时搞定一篇论文初稿(全流程攻略)!附 20 个论文高阶提示词!
- 多所 985 明确:不提供宿舍!
- 2025,LLM 突然一夜封神!
- CVPR 2025 录用率 22.1%,LeCun 中奖!大模型参评,审稿人 19 篇论文被拒
- 曝 GPT-4.5 本周空降!1T 激活参数,120T 训练数据,会吐出阶段性思考成果然后继续思考
- 保姆级教程:30 秒部署 DeepSeek-R1!
- 刚刚!DeepSeek-R1 满血版,来了!
- 何恺明开辟分形图像生成新范式!计算效率提高 4000 倍,首次实现高分辨率逐像素生成
- Transformer 王者归来,再登 Nature。。。
- 算力核爆!碾压YOLO系 | Fast-COS 横扫 BDD100K/TJU 双冠,边缘端实时推理,效率起飞
- Qwen 架构改造成 Deepseek,再复现 R1 计划
- 全球首个混合推理模型:Claude 3.7 Sonnet 来袭,真实编码力压一切对手
- 人刚毕业,代码一点不会,他纯靠 ChatGPT 写 APP,年入千万美金
- 刚刚,DeepSeek 开源 FlashMLA,曝光低成本秘笈!
- 官宣:这所高校禁用 DeepSeek!
- DeepSeek R1 最新全面综述,近两个月的深度思考!
- 手把手薅到 DeepSeek-R1 671B 满血版,白嫖真香!
- YOLO 已经悄悄来到 v12,首个以 Attention 为核心的 YOLO 框架问世
- OpenAI 实名举报 Grok3 作弊。。。
- DeepSeek R1 最新复现项目汇总
- 刚刚 GPT4o、Claude 国内直接用!
- 梁文锋和杨植麟,论文撞车了!!
- 突发,Grok-3 免费上线!答对 9.11 和 9.9 谁大,1 分攻克 MIT 积分难题
- 再次颠覆学界想象,何恺明发表新作:扩散模型不一定需要噪声条件
- 马斯克评价 DeepSeek:中国大部分时间都是世界最强国家,但……
- DeepSeek 满血微调秘籍开源!站在巨人肩膀打造私有模型,一手教程在此
- 史上最强!YOLOv11 系列杀疯了。。。
- 马斯克 20 万块 GPU 炼出 Grok-3,暴击 DeepSeek R1 数学屠榜!疯狂复仇 OpenAI
- 保姆级教程:30 秒部署 DeepSeek R1!供全民使用!
- 一网打尽!5 大深度学习模型!RNN、CNN、Transformer、BERT、GPT
- DeepSeek 爆火,留给普通人的时间不多了。。。
- 新版 GPT-4o 登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战
- DeepSeek 模型综述:V1 V2 V3 R1-Zero
- 刚刚!微信 DeepSeek 入口已接通,辐射用户 14 亿!
- 清华大学:DeepSeek从入门到精通(第二版来了!)
- 2024 年 15 种典型 RAG 框架
- 热议:为什么 DeepSeek 出来后,国产其他大模型的集体失声了,以前都号称很强的?
- 刚刚 GPT4o、Claude 彻底开放了!
- 刚刚,奥特曼剧透 GPT-4.5、GPT-5 重大更新,o3 取消独立发布
- 荣登 Nature!LSTM 彻底爆发了!
- 清华一作 1B 暴打 405B 巨无霸,7B 逆袭 DeepSeek R1!测试时 Scaling 封神
- 什么情况,AI 岗的薪资又爆了。。。
- DeepSeek 被封杀了?!
- 清华姚班校友等揭 Transformer 致命缺陷,OpenAI 科学家紧急回应:学术界节奏太慢
- 强的离谱!今年读过最绝的一本 LLM 书!下载量破 10w 了!
- 50 个逆天的 pytorch 操作!!
- DeepSeek-R1 解读及技术报告中文版
- 清华大学出品《DeepSeek从入门到精通》超详细使用手册pdf免费分享
- 奥特曼曝GPT-5比他聪明!OpenAI暗藏GPT-4.5,o系编程跻身TOP 50
- PyCharm 接入 DeepSeek 完整版教程来了!!!
- 刘知远硬核解读 DeepSeek:大模型强化学习技术原理与大模型技术发展研判
- 迈向 GPT-4o,多模态大模型杀回来了!
- 华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」
- 机器学习中 25 个最重要的数学定义(公式、代码实现)
- Deepseek R1 Zero成功复现, 三阶段RL,Response长度涨幅超50%,涌现语言混杂,double-check
- 原来,这些顶级大模型都是蒸馏的!
- 知乎热议:博士的年薪一般是多少万?
- 王者归来!Transformer 彻底爆发了!
- 讲透一个强大算法模型,随机森林!!
- 突发!人形机器人Figure宣布与OpenAI终止合作
- DeepSeek R1 671B 完整版本地部署教程来了!!!
- 刚刚 ChatGPT o3-mini 国内彻底开放了!
- o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
- 点赞!DeepSeek 梁文锋的硕士论文下载
- 一文详尽之Scaling Law
- 刚刚,OpenAI上线Deep Research!人类终极考试远超DeepSeek R1
- 2025泰晤士世界学科排名公布!
- 《自然》发文:中国廉价、开放的人工智能模型DeepSeek让科学家们兴奋不已
- 饶议科学:关于 DeepSeek,给少数海外华人的两句忠言
- DeepSeek 最新中国大学排名
- 财政部官宣: 国家奖学金,涨了!
- 就在刚刚,o3-mini 急上线!奥特曼率队深夜血战 DeepSeek!ChatGPT被挤爆!
- 一位英伟达北京分公司员工晒出了工资条,总薪酬1688万,个税687万,月薪11.43万,基础年薪100万,剩下全是股票分红…
- 突破 LSTM,CNN 和 LSTM 时间序列预测 !!
- 校招154W!DeepSeek待遇和核心成员曝光!
- 硅谷掀桌!DeepSeek遭OpenAI和Anthropic围剿,美国网友都看不下去了
- 美国正对DeepSeek开展国家安全调查
- Jay Alammar:图解 DeepSeek-R1
- “DeepSeek 甚至绕过了 CUDA”,论文细节再引热议,工程师灵魂提问:英伟达护城河不存在了?
- 阿里除夕发布 Qwen2.5-Max 反超 DeepSeek V3,一句话开发小游戏
- 全球掀起 DeepSeek 复现狂潮,一文汇总!
- 496GB 显存!最壕 DeepSeek 玩家 8 台 Mac 跑 R1
- 创造历史!DeepSeek 超越 ChatGPT 登顶中美 AppStore
- DeepSeek 创始人专访:中国的 AI 不可能永远跟随,需要有人站到技术的前沿
- DeepSeek-R1 持续刷屏,连 Open R1 都来了!抱抱脸发起,1 天狂揽 1.9k 星
- 如何看北京理工大学珠海学院(独立学院)毕业生冒充北理工(985)去应聘,被拒后反骂HR学历歧视?
- 开源版「B站」,火了!
- 996码农想去烟草,但烟草人每月工资1万,年终奖7万,一年到手20万,却想辞职
- 张俊林:MCST树搜索会是复刻OpenAI O1/O3的有效方法吗
- OpenAI 突发 Operator!完全自主玩转浏览器,奥特曼:Level 3 时代开启
- 张雪峰公司今年的年终奖…
- 刚刚 GPT4o、Claude 彻底开放了!
- 2024 ACM Fellow 颁给 10 位华人学者!陈雷、周靖人、李国良等入选
- 荣登 Nature,LSTM 彻底爆发了。。。
- 刚刚,美国首个全球 AI 禁令颁布!英伟达 AMD 禁运,各国分三级上限 5 万块
- 知乎热议:博士的年薪一般是多少万?
- 手握 15 个大厂 offer,确实可以封神了!
- 美国顶尖名校抛弃计算机基础课,All in Python!前助教:计算机系末日来临
- 450 美元训练一个 o1-preview 可行吗?
- 突发:美国密歇根大学终止与上海交大合作!
- GAN 已死?GAN 万岁,一夜碾压扩散模型!!
- 震撼高层,中国工程院院士孙凝晖给正国级、副国级讲课:《人工智能与智能计算的发展》
- 概率论中的极大似然估计:入门与Python实践
- 某985大学一女生用AI学术造假被麻省理工退学,本人发文致歉
- 突发!美国 AI 芯片限制最后一刀!英伟达 AMD 全球禁运,只配 5 万块
- 老婆饼里没有老婆,RLHF里也没有真正的RL
- 给导师打电话发现停机了,果断帮导师充了话费,结果……
- 刚刚 GPT4o、Claude 彻底开放了!
- 教授何恺明在 MIT 的第二门课——《深度生成模型》,讲座PPT陆续已出
- 70k 入职字节算法岗,确实可以封神了!
- 从 infra 的视角聊聊 DeepSeek-V3
- 最新AI Agent万字综述分享!
- 王者归来!YOLO 系列杀疯了!
- 1999 美元!RTX5090 发布
- 神经网络为何非激活函数不可?
- 确实可以封神了!LLM 神作今天发布!
- 评价deepseek v3:又一个相信自己比英伟达懂GPU计算并做到了的团队
- 深度学习工作:从追求 SoTA 到揭示新现象
- 刚刚,2025 中国大学排名发布
- 人工智能是不是走错了方向?
- 腾讯员工:组里来个实习生,每天笑嘻嘻上班,到点下班,领导不满要干他。网友:下班时间不走,什么时候走?
- 刚刚 GPT4o、Claude 彻底开放了!
- OpenAI 最大秘密,竟被中国研究者破解?复旦等惊人揭秘 o1 路线图
- Nature 发布,AI 全球 100 强!
- 留言赠书 | 技术人的年末书单,这 10 本最受欢迎!
- 抑郁 6 个月后,DeepMind 两万引科学家离世,万字绝笔谈在 AI 行业工作的压力
- Transformer 王者归来,再登 Nature!
- 联手 OpenAI,吴恩达推出一门 o1 推理新课程,还免费
- 在字节干大模型,是一种怎样的体验?
- 独自一人,怒发数篇 SCI。。。
- 吹爆回归算法,吊打 16 个核心点 !!
- Hinton 发 2024 末日预警:10 年内人类灭绝!奥特曼预言 18 个月 ASI 降临
- 上海微软大裁员,赔偿达 N+8,12 年老员工感叹:拿 20 个月工资走人,每月 3000 失业补助,也是种幸福
- 国产大模型之光 DeepSeek-v3 技术报告解读
- 大模型训练效率太低,存储空间太大?有一个新的开源技术能优化这个流程!
- 央视“科晚”启航,讯飞智作打造“AI 张腾岳”亮相,多语诵读成焦点
- 稚晖君又双叒叕开源!这一次机器人直接进入人类生活!
- 9 大基准全面领先,性能暴涨 10.8%!视觉价值模型 VisVM 成「图像描述」新宠
- 开源!又一个悄然崛起的多模态大模型开发神器!
- 深度学习工作:从追求 SoTA 到揭示新现象
- OpenAI 大地震一分为二,全力冲刺 AGI!一半向钱看,一半装理想
- 狂赚 100 万美元还清贷款,计算机女博士退学,全职搞 OnlyFans 引热议
- 刚刚 GPT4o、Claude彻底开放了!
- 国产之光 DeepSeek 把 AI 大佬全炸出来了!671B 大模型训练只需此前算力 1/10,细节全公开
- 阿里员工:得知绩效3.25,晚上到家看到刚会走路的儿子,做饭的老母亲,彻底绷不住了!
- 75k,确实可以封神了!
- “给我滚出贵大!”郑强出任贵州大学校长,打算把树全砍掉,学生愤怒抗议,4年后事情反转
- XGBoost 比深度学习还强?
- 多模态大模型开发门槛降低了!这个开源套件是如何做到的?
- 英伟达年终核弹!全新 B300 为 o1 推理大模型打造,RTX5090 也曝光了
- 突破 CNN,时间序列预测 !!
- MIT、OpenAI 等震撼力作:AI 首次自主发现人工生命!人类窥见上帝造物
- 多模态融合,顶会超神了!
- Qwen2.5 技术报告解读
- 像教女朋友一样教你用 Cuda 实现 PyTorch 算子
- 三步拿下!大模型 RAG 王者上新!
- 李飞飞谢赛宁:多模态 LLM「空间大脑」觉醒,惊现世界模型雏形!
- 机器学习各算法的优缺点!!
- 杀疯了!复旦大学《自然语言处理导论》彻底爆了!
- 吴恩达正式官宣,yyds !!
- Ilya 宣判后 GPT-5 被曝屡训屡败,一次训数月,数据要人工从头构建
- 颜宁:明年我只参加已经接受了邀请的学术会议,不接受国内任何个人或者单位的邀请做学术报告
- 刚刚 GPT o1 Pro 彻底开放了!
- 我国退步最快的 985 大学?曾位列全国前十,如今排名连年下降…
- 谷歌版 o1 突发即屠榜!思考速度比所有模型快 5 倍,能解摩斯代码,数学物理秒秒钟解决
- 2025 英伟达奖学金名单公布,7 位华人入选!中科大浙大校友在列,人均 6 万美元
- 刚刚,OpenAI 放出最后大惊喜 o3,AGI今夜降临?血洗 o1
- NeurIPS 2024 论文中了:没算法没实验,全靠 idea 思路好…
- 阿里大模型面试:不懂后训练,是真的不太行
- 刚刚,AI 颠覆物理模拟:一句话精准仿真,学术圈半壁江山联手耗时 24 个月研究成果
- 26 岁 OpenAI 举报人疑自杀!死前揭 ChatGPT 训练黑幕
- Tokenization 不存在了?Meta 最新研究,无需 Tokenizer 的架构来了
- Python 3.13 将会改变 AI 和 ML 的游戏规则?
- 史上最强!YOLOv11 杀疯了!
- 字节三面:attention中的Q,K,V怎么来的?
- 谷歌版 Sora 升级 4K 高清!一句话控制镜头运动,跑分叫板可灵海螺
- 1 年内 11 名博士生自杀,顶尖高校陷博士生自杀危机,疑因要求学生每学期发 1 篇 SCI
- 推荐一个发表论文的神器 2.0!
- 特征工程,全面指南!
- 王者归来!《一书解决几乎所有机器学习问题》终于开放了!
- 50 个超强 PyTorch 操作!!
- MIT教授NeurIPS歧视言论炸雷,中国女学生霸气反击!AI大佬集体痛斥,道歉信来了
- 前大厂员工:上交毕业后进华为,年薪42万,跳槽后失业了;再次联系华为已无机会!
- 刚刚 GPT o1 Pro 彻底开放了!
- 已注销!985 新校区,不建了
- Ilya 宣判:预训练即将终结!NeurIPS 现场沸腾
- 谷歌 Gemini 再添猛将!GPA 5.0 毕业即 DeepMind 高级科学家,开挂博士给科研新人7点建议
- 今天面试了一个字节女生,当场想给她 offer!
- 超图计算+目标检测,性能新 SOTA!清华发布 Hyper-YOLO:用超图捕捉高阶视觉关联
- OpenAI 深夜被狙,谷歌 Gemini 2.0 掀翻牌桌!
- 事业编一年6万,干40年退休总共挣240万。码农一年60万工作5年,总共挣300万。事业编再舒服有码农干五年退休舒服么?
- NeurIPS 2024最佳论文开奖!北大字节NUS夺冠,Ilya连续三年获奖
- OpenAI 员工意外泄露下一代 ChatGPT!网友:故意的还是不小心的?
- 王者归来!LSTM 彻底爆发了。。。
- 我把 4500 多篇 NeurIPS 2024 论文,做成了 AI 搜索
- 首次明确!国务院: 博士学位论文,不再非写不可
- 奇书!火爆全网的《机器学习基础》.PDF
- OpenAI 发布强化微调技术,SFT 退出历史舞台?
- o1 pro 挑战美国本科生最难数学竞赛,30 分钟交卷却被「大佬」现场打脸!
- 中科院院士:青年科学家 5 年内拿不出成果就面临淘汰,有的单位已现「马太」效应,重复给某一人奖励
- Sora 二代实机演示曝光!解锁图生视频,奥特曼暗示:期待周一!
- 擅自出版博士论文,博导起诉博士索赔4000万,法院判了
- YOPO (You Only Prune Once):给 LLaVA 做剪枝,大幅缩减多模态大模型计算量至 12%!
- 字节某躺平女员工:33岁存款240万,无房无贷,不传宗接代。再干一两年存够300万,回家养老。。。。
- ChatGPT 4o 国内直接用!
- 刚刚,2025 IEEE Fellow名单出炉:戴琼海、姜大昕、尹首一、翟广涛、褚晓文等人入选
- 就在刚刚!OpenAI 第一场直播就炸场!o1 满血版上线,史上最贵订阅费:1450元/月
- 通俗理解 K 近邻分类算法
- LLaMA 系列一直在假装开源…
- 真是“离谱”!一键 AI 把宠物”灵魂提取”成二次元角色!狸谱彻底爆了!
- 惊掉下巴!被字节起诉 800 万实习生,拿下 NeurIPS 2024 最佳论文
- 项目爆火立刻脱离大厂!谷歌NotebookLM 核心团队集体离职,另起炉灶创业
- 喜提 AAAI 一作顶会:没算法没实验,全靠 idea 思路好…
- 刚刚,李飞飞创业首个项目引围观:单图生成交互3D场景,空间智能来了
- 全球五大巨头GPU总量曝光!谷歌第一,微软第二!
- 强的离谱!今年读过最绝的一本 LLM 书!下载量破 10w 了!
- 轻量级神经网络模型,嵌入式微小设备也能实时检测 !
- 中科院 2024《国际期刊预警名单》发布,其中有 2 本期刊来自计算机学科!
- 大厂员工:女友在字节,年入25万,我北邮毕业28岁,年薪70多万,因为没有户口,女友坚决跟我分手。。。
- ICLR 惊现满分论文:ControlNet 作者新作,Github 5.8k 颗星
- 无需 Transformer,简单滤波器即可提高时间序列预测精度 | NeurIPS 2024
- 一位阿里 P9 的年薪和家庭资产
- 写给小白的大模型应用科普:RAG 篇 | 留言赠书
- 上海交大新聘 AI 博导,27 岁!
- 某副教授相亲 100 多场总结出来的经验,网友:建议开源,发表论文…
- NeurIPS’24|推理计算量减小10倍!MemoryFormer:华为提出存储代替计算的Transformer新架构
- 字节大瓜后续,GPU 集群被投毒,索赔 800 万!
- 雷军的大学时候的论文:不需要参考文献
- ChatGPT 4o 国内直接用!
- 探索 OpenAI O1 模型复现:从 Kimi K0-Math 到 DeepSeek R1 Lite
- 确实可以封神了:一个悄然崛起的国产项目!
- 新的 Mamba 架构又双叒来了!上交大 & 华为提出 QuadMamba :多个视觉任务 SOTA!
- 绝了,图片秒变代码,开发越来越简单了!
- 不是,现在都流行用 Kaggle 写论文了吗?
- 吴恩达出手,开源最新 Python 包,一个接口调用 OpenAI 等模型!
- 超越 GPT-4o!开源科研神器登场
- 小红书,把“失业线”压到了32岁
- 斯坦福大学发布全球人工智能实力排行榜
- 更新了!带 Agent 的 Cursor 太疯狂了
- 王者归来!Transformer 彻底爆发了!
- 突破 XGBoost!时间序列预测 !!
- 美国 AI 曼哈顿计划 793 页文件曝光!全力研发 AGI,十大战略直指中国
- 大厂员工:曾大厂高管,年薪95w,被女友父母白眼;如今入职国网,人不到,叔叔阿姨吃饭都不敢动筷子…
- 万字长文,大模型分布式训练的学习过程总结
- 美国教授痛心:UC伯克利GPA 4.0计算机本科生,毕业即失业?ML博士直呼太卷后悔转行
- 特朗普上台,第一刀再次扎在了留学生身上。。。
- 大模型中上分技巧大总结!!
- FLUX“官方版ControlNet”来了!
- 训练大模型,这次竟卡在没图这里了。。。
- Make U-Nets Great Again!北大&华为强强联合
- 计算机视觉顶尖期刊和会议有哪些?
- 王炸!字节又一爆款面试神器诞生了!
- 突破 LSTM!时间序列预测 !!
- 谷歌浏览器,要被强制出售!
- ChatGPT 4.0 与 Claude Pro 国内直接用!
- 史上最强!YOLOv11 杀疯了!
- 知名开源项目,阿里官宣停更,太痛了!
- 机器学习中降维和特征选择的对比介绍
- 直播预约 | CDCC 施耐德电气专场:算领未来,赋能无限!
- 已注销!985 新校区,不建了
- 12 个 ChatGPT 写作秘诀让你事半功倍!OpenAI 官方发布
- 王者归来!白皮书《从头训练大模型最佳实践》开源了。。。
- Nature:「人类亲吻难题」彻底难倒LLM,所有大模型全部失败!
- 打破纪录!中国科学家让薛定谔的猫活了 23 分钟
- 最新世界大学学科排名发布:浙大第一、中山第二,清华、北大、上海交大并列中国内地第三
- 好生猛,全球首款 AI 游戏问世!
- 谷歌 2024 博士奖学金名单揭晓!清华姚班大神吕欣,KAN一作刘子鸣获奖
- 211 大学教授、博导,落马!
- 深入理解机器学习中的正则化
- 教授何恺明在 MIT 的第二门课——《深度生成模型》,讲座PPT陆续已出
- 裁员 9000 人。
- ChatGPT 4o 国内直接用!
- 全球首例:14 岁男孩和 AI 聊天网恋后被诱导自杀,生前对话曝光
- 今年顶会这情况。。。大家提前做准备吧!
- 空间智能版ImageNet来了!李飞飞吴佳俊团队出品
- Ilya 认错,Scaling Law 崩了?自曝 SSI 秘密技术路线取代 OpenAI
- 被导师放养,后果可能很严重。。。
- GPT-5 被曝不及预期,OpenAI 员工:没什么科学突破了,接下来只需要工程
- 开源版 SearchGPT 来了,两张 3090 就可复现,超越 Perplexity 付费版
- 80w,确实可以封神了!
- 揭示Transformer重要缺陷!北大提出傅里叶分析神经网络FAN,填补周期性特征建模缺陷
- o1/Claude 集体翻车!陶哲轩等 60+ 顶尖数学家合力提出新数学基准,大模型正确率通通不足 2%
- 北大韦东奕上课照片走红,网友:板书真漂亮,恨我看不懂啊
- 2025QS 亚洲大学排名出炉,197 所中国高校上榜!
- 突发!ETH 官宣制裁中国学生,国防七子、中科大、川大、北邮等高校均在名单内。。。
- 深入理解机器学习中的欠拟合与过拟合
- 黄仁勋:AI 算力集群会扩展到 100 万芯片,没有任何物理定律可以阻止
- 刚刚,OpenAI 安全副总裁、北大校友 Lilian Weng 宣布离职,有时间写博客了
- 刚刚 GPT o1-preview 彻底开放了!
- 今天面试了一个字节女生,当场想给她 offer!
- 15 岁初中生,开源项目被数百万收购,简直降维打击。。。
- 一网打尽长文本训练技术
- 特朗普回归,美国 AI 解禁!马斯克变身全球首富,硅谷科技圈颠覆在即
- 叫板 Cursor 的 AI 提效神器,彻底爆了!
- 90 后上海女生,成美国数学大奖首位女性华人得主!获评委陶哲轩盛赞
- 只要敢捞偏门,篇篇都是顶会顶刊!
- 震撼预警:满血版o1倒计时!o系列疯狂迭代,马上起飞
- ControlNet 作者又整活了!
- 奇书!大模型经典著作《大语言模型基础与前沿》.pdf
- 新增 9 所 985!这份名单,再扩容!
- 15 岁山东初中生做 CTO,开源项目刚刚被数百万元收购了
- OpenAI 回应一切,o1/GPT 年前都会升级!奥特曼:别嫌慢,问就是缺算力
- 大厂员工:30年前同时收到华为offer,我一直干到21级,年薪500万,女同学求稳去了体制内,月薪5000。。。
- NeurIPS 2024 | E.T. Bench: 迈向细粒度、事件级的视频时序理解
- 时代变了!英伟达纳入道琼斯指数,英特尔被取代
- 刚刚!阿里巴巴公布“姜萍事件”调查结果公布。。。
- o1之下,技术何从
- 100+深度学习各方向数据集资源大盘点
- 中国工程院院士炮轰华为:搞中式垄断,我们用这种方法打不赢外国
- 一文看完多模态:从视觉表征到多模态大模型
- OpenAI 回应一切,o1/GPT 年前都会升级!奥特曼:别嫌慢,问就是缺算力
- 刚刚!ChatGPT 正式成为 AI 搜索,免费可用
- 全面盘点逻辑回归模型的 5 大评估指标
- 大模型已过时,小模型 SLM 才是未来?苹果正在研究这个
- 36 岁大厂程序员,找不到工作。。。
- 深入理解逻辑回归算法理论与实战
- 史上最强!YOLOv11 杀疯了!
- 实验室一块 GPU 都没有怎么做深度学习?
- 超越 YOLOv10/11、RT-DETRv2/3!中科大D-FINE重新定义边界框回归任务
- 超越 Transformer,全面升级!MIT 等华人团队发布通用时序 TimeMixer++架构,8 项任务全面领先
IT咖啡馆
- IT咖啡馆送你2本,给程序员看的DeepSeek图书!
- 最快开源模型?GLM-Z1上手实测表现如何
- 开源项目不好搞?你一定是没用对工具,手把手教你如何上手
- 「Github一周热点64期」Manus开源实现仅用5人3小时?含金量如何
- DeepSeek开源周第三弹,仅300行代码,效果翻倍,DeepGEMM小而强大
- 「Github一周热点61期」更快运行DeepSeek的推理框架、大模型微调工具、AI数据可视化工具、API调试工具和开源图标库
- 5K star!满血DeepSeek在家使用,这个清华开源神器太牛了
- 8K star!从0开始,动手训练一个大语言模型
- DeepSeek 发布多模态 Janus-Pro !纳斯达克这个年不好过了
- 「Github一周热点59期」DeepSeek R1推理模型、实时语音转文字、自托管PaaS平台、轻量监控工具和终端文件管理工具
- 4K star!低延迟、易上手的实时语音转文本开源工具
- 平替Cursor?字节出手AI编程助手,Claude3.5免费用
- DeepSeek R1性能接近o1,价格仅为1/50?!全开源、商用免费,这次真要掀翻OpenAI
- 28K star!可以完全自托管、离线使用的AI编程助手
- 太炸了!清华人大出品,让Qwen达到o1水准的开源项目
- 「Github一周热点58期」自托管 AI 代码助手、从0训练微型语言模型、AI SQL助手、文生图模型和开源电子商务平台
- 14K star!开源浏览器插件帮你解放双手,告别重复,开启自动化工作
- 4K star!不会SQL也不怕,开源多语言AI数据助手,聊聊天搞定数据分析
- 聊胜于无!DeepSeek上线官方App,功能有限,需要发展
- 「Github一周热点57期」世界基础模型平台、新的区块链、AI搜索引擎、国产开源CPU和PS4模拟器
- 「Github一周热点56期」DeepSeek开源大模型、免费编程电子书、电子书转有声书,思源笔记和轻量推荐系统
- 「Github一周热点55期」架构师必备指南、自动化测试工具包、无限画布白板、AI 测试框架和广告拦截器
- 「Github一周热点54期」4D世界生成式物理引擎、官方版米家集成、意图为中心的区块链、PDF翻译工具和卡通图片变动画
- 卷起来了!Github copilot突然就免费了
- 「Github一周热点53期」Rust 重写的 SQLite,文档解析器,零知识虚拟机,轻量级数据库 GUI和跨平台开发框架
- Sora终于来了!挤牙膏还是大革新?ChatGPT plus可用
- 「Github一周热点52期」独立浏览器、生产级 AI 应用开发框架、股票分析工具、react性能调试工具和告警管理平台
- 21K star!20年开源CAD,轻松搞定3D建模
- 别浪费了4K电视!如何轻松上手Netflix(奈飞)、HBO Max
- 别浪费了4K电视!如何轻松上手Netflix(奈飞)、HBO Max
- 「Github一周热点51期」AI统一调用工具、现代化的 CMS、文生图模型、去中心化的社交平台和3D 建模器
- 入门大模型应用开发的最佳选择,RAG入门与实战(含福利)
- 8K star!提示词原来作用这么大?Claude秒变O1
- 6K star!开源DLNA投屏利器,支持跨平台
- 11.2K star!全栈拆解AI系统的图书项目(赠书福利)
- 「Github一周热点50期」数据工程师学习手册、浏览器运行虚拟机、多智能体角色模拟、黑客情报工具和Go语言开发脚手架
- 「Github一周热点49期」Docker中运行Windows、文档解析工具、NextJS模版、AI Agent框架和数据库工具
- 9K star!快速转换PDF为MD和JSON,让数据AI Ready
- 老瓶装老酒?微信发布Linux版本,居然用这个框架
- AI Agent开发必备,6种架构模式总结
- 9K star!快速可视化数据库架构,数据库编辑工具
- 「Github一周热点48期」聚合 AI 平台、数据库图表编辑器、音频工具包、AI 开发平台和密钥检测工具
- 2K star!语音转文本模型,比Whisper快,更适合小设备
- 16K star!开源工作流编排,让计划更简单
- 16K star!实时文档协作编辑器,远程工作好帮手
- 「Github一周热点47期」llama官方配套资料、低代码框架、网页变化监控工具、工作流编排平台和我的世界AI工具
- 3K star!微软开源的AI屏幕解析工具,基于纯视觉识别UI
程序员好物馆
- Deepseek喂饭指令大全:内容创作/知识付费/编程开发/生活效率等
- Chrome若被出售,OpenAI抢先喊话:我想买!
- 用了这个CSS技巧,我的代码瞬间整洁了!
- Matlab——数据大佬的秘密武器?
- AI工具使用手册:高阶AI指令大合集!
- 仅改30行Linux代码,立马省电30%?滑铁卢大学团队“神补丁”,已被Linux 6.13并入!
- 2025年值得关注的12+个免费开源 Tailwind UI 替代品(绝佳精选推荐)
- 学好AI大模型,这个是核心关键!
- OpenAI最强AI模型竟成“大忽悠”!o3/o4-mini被曝聪明过头、结果幻觉频发?
- Google又发布了一款惊艳的全新IDE,彻底碾压VS Code!
- AI浪潮下嵌入式开发新机遇
- AI玩《毁灭战士》集体翻车:GPT-4o、Claude、Gemini在第一关已全军覆没
- 10个AI网站生成神器,还没等咖啡凉透,网站就搭好了!
- Deepseek应用指南:自媒体/电商/教育/开发/法律/本地生活等
- “我年入3000万美元、绩点4.0,却被15所名校集体拒绝!”这位18岁创业少年到底做了什么?
- 8个你从未听说过却能让你效率暴涨的网站
- AUTOSAR为何成为车企刚需?
- AI浪潮下传统产品的最后3张免死金牌…
- 一人连肝7年!独立游戏最惨「翻车现场」:3.7万张手绘+500首配乐,结果连个差评都等不到……
- 2025年让你成为更优秀开发者的5个开源项目——开发者千万别错过
- 传统产品生死局:AI浪潮下你的产品还能活多久?
- MCP 的那些“坑”!
- “一天面试三家公司,都因年龄被拒”:35岁就业歧视何时休?
- 2025,Matlab是否依旧坚挺?
- AI浪潮下,传统产品注定走向消亡?
- 从打孔卡到AI:回顾这85年来,预言程序员“将被取代”的10次危机!
- 8个传奇网站,帮你每天节省5小时
- 2009年的iPhone跑ChatGPT?17岁开发者“魔改”应用,让老机重生!
- 如何在面试中,判断你的未来领导是否靠谱?
- AI浪潮下,嵌入式开发的处境如何?
- 当AI重构商业版图,揭秘传统产品的重生密码!
- AI 抢饭碗「实锤」!Shopify 招聘新规曝光,CEO 放话:AI 搞不定的才能招人!
- 不要再像我这样使用 React 导入了,试试 Wrapper 模式吧!
- Llama 4刚开源就“翻车”?员工曝内幕:训练时作弊、刷分造榜,自己已选择辞职!
- 不想职场过得苦,这4种心态一定要趁早戒掉!
- 下一个十年,不懂大模型的产品将被淘汰?
- 强制员工“带薪休假”1年?谷歌DeepMind竞业条款遭炮轰:宁可花钱白养,也不肯放人!
- Next.js 15:我才知道居然还有这个组件!
- 终于!CUDA 官宣:添加原生 Python 支持,开发者狂喜
- “多家企业落实4.5天工作制”:我们离上四休三还远吗?
- 车机系统越来越多,我们该怎么办?
- 人人可复现QwQ,蚂蚁清华联手放大招!彻底开源RL框架AReaL-boba
- 如何在网页上高效渲染 1000 万张小图片的?
- Windows跑在智能手表上,开发者“魔改”震惊网友:这次是真Windows on Arm
- 那些用ChatGPT实现10倍开发效率的顶级程序员,到底做对了什么?
- 下一个十年,不懂大模型的产品将被淘汰?
- Linus Torvalds 怒斥 Linux 6.15 中“恶心”的测试代码:这玩意儿必须被干掉!
- 前端开发人员都必须掌握的 7 种改变游戏规则的工具
- Matlab是否依旧屹立不倒?
- Android闭源是假,Google想封闭是真!
- Next.js 受 9.1 级重大漏洞攻击…
- 为什么AI大模型产品经理是未来最抢手的黄金职业?
- 10天做出AI面试“外挂”,狂揽多个大厂Offer!这名21岁学生已被哥大正式开除……
- 作为开发者,让我大开眼界的十大开源人工智能项目
- AUTOSAR为何成为车企刚需?
- AI爬虫拖垮整个网站!开发者崩溃:禁了整个巴西的访问,才勉强救回来
- DeepSeek更新V3-0324:一个小版本,又要掀桌子?
- 为什么AI大模型产品经理是未来最抢手的黄金职业?
- 具身智能一定要是人形机器人吗?
- 在公司干了五年,工资不如刚入职的校招生
- 87万年薪的“氛围编码”岗火了,连代码都不用写?Karpathy:不会Swift也能1小时开发iOS应用!
- 新版DeepSeek V3深夜突袭!4bit量化版在512GB M3 Ultra上跑出20 tokens/s
- 11 个改变游戏规则的开源项目
- 基辛格遗世之作:AI 吞噬世界下的人类
- DeepSeek预测:十年后程序员生存图鉴
- AI也“耍赖”?DeepSeek R1和o1-preview被曝在棋局中「输急眼就作弊」!
- 用Copilot一阵子后,开发者悟了:“AI越聪明,我们就越笨!”
- “45个高效Linux命令组合,可以解决99%日常运维需求!”
- 写800行代码,AI就“摆烂”?OpenAI高管却放言:2025年底,AI代码的自动化程度将达到 99%
- 人类编程时代即将终结?OpenAI首席产品官预测AI将在今年底全面超越人类程序员
- 这次的力度真的很大!
- 谷歌史上最大收购!豪掷320亿美元拿下安全初创公司Wiz
- DeepSeek锐评:如何成为搞垮团队的程序员,还是太含蓄了,你得这么干…
- 一直在错过,这次不想再观望了
- 倒计时 30 天!2025 全球机器学习技术大会全日程官宣!
- Siri 被曝「难产」!苹果高管承认:AI 功能成功率仅 60-80%,太“难看且尴尬”了
- “辞职发疯戏”火了:离职要爽还是体面?
- AUTOSAR为何成为车企刚需?
- 耗时两个月,每天“爆肝”14个小时:他用C++手搓了一个「Photoshop」!
- “周日回个工作邮件,被严肃约谈”:现代职场开始摒弃工时崇拜了!
- 微软弃用C#、Rust,选Go拯救TypeScript编译器“中年危机”!C#之父亲自操刀,150万行代码编译现仅需7.5秒
- 检索增强生成
- AI浪潮下,嵌入式开发的新机遇……
- 最高判10年!55岁程序员遭降级不满,怒植“自毁代码”:被裁当天,公司系统全面崩溃
- 响应式设计已死?流体布局才是未来!
- 起飞!国产编程语言MoonBit迈进顶级学府、发布重磅LLVM后端,受邀欧美顶级大会
- 各种Loader加载器
- AI工具全面进化,你的Deepseek还停留在石器时代?
- 哥大学生用AI“拿下”亚马逊Offer,却被校方调查,怒怼:程序员工作两年内全灭!
- 人类学的 MCP 彻底颠覆 AI 交互!
- 顶配超10万!两台Mac Studio在家就能跑满血DeepSeek,网友:这是性价比最高的大模型一体机
- 5个人3小时复刻开源版Manus,无需邀请码,随便免费用…
- 2025年,Matlab依旧坚挺?
- 涉嫌用ChatGPT写论文,中国留美博士遭学校开除:怒告校方,要求公开道歉+索赔57.5万美元!
- 提示词工程
- AI三小时造出游戏、10天狂赚28万!游戏开发小白逆袭,获马斯克点赞:AI游戏要火!
- Google 证实了一个程序员不愿面对的 AI 现实,不接受只会被淘
- AUTOSAR为何成为车企刚需?
- 教下载盗版Win11、输出被删掉的GitHub库,Copilot被指“背刺”微软
- 盘点常见7类领导,看看你跟对人了吗?
- 耗时一年,写3.5万亿行代码、消耗90GB内存,只为让Doom跑在TS类型系统中?
- 面试必问,React和Vue各自是如何更新视图的?
- AI浪潮下,嵌入式开发的处境如何?
- 3月16日,百度文心大模型4.5即将发布,哪些更新值得期待?
- 大模型概念扫盲
- 价格近 DeepSeek 的三百倍!GPT-4.5 深夜炸场,奥特曼直呼 GPU 供不应求
- 领导找你谈话,这6句话表面关心,实则敲打
- Matlab太难,已过时?
- 文图生视频双杀!阿里深夜开源Wan 2.1四大模型,性能超Sora
- BAT出来,能不能在小公司通杀?
- 240个标签页打乒乓?开发者用Chrome浏览器“整活”,网友:再玩内存要炸了!
- 服务端渲染的未来:2025 年的 5 大趋势
- 大模型下半场战争硝烟四起,AI进化论第二季开启 | 第一季DeepSeek十日谈精彩回顾
- AI也“耍赖”?DeepSeek R1和o1-preview被曝在棋局中「输急眼就作弊」!
- 熊孩子说「上学能不能实行 8 小时学习制?我太累了」,一下还把我问住了…
- 车机系统越来越多,我们该怎么办?
- Grok 3是否意味着大力出奇迹的大模型法则仍然成立?
- “45个高效Linux命令组合,可以解决99%日常运维需求!”
- “3000万行C代码暂时不会消失,新内核驱动可用Rust写写看”,Linux二把手表态支持Rust!
- 宇树科技创始人王兴兴,浙江人,19岁造机器人,26岁从大疆离职创业,35岁参加民营企业座谈会。
- 2025年,转行嵌入式开发的新机遇…
- 力图取代iPhone的Ai Pin,被惠普以1.16 亿美元收购了核心技术!
- DeepSeek 创始人梁文锋厉害的个人经历。
- 20万张GPU!号称“地球上最聪明的AI”Grok-3来了,斩获多个Top1,网友:算力消耗是DeepSeek V3的263倍
- “自带电脑上班,不提供卫生纸”:盘点职场那些让人无法理解的降本增效
- DeepSeek 如何开启大模型的下半场战争|DeepSeek十日谈终结版
- 长达20年!复盘Linux之父对C++的「炮轰」史:C++究竟为何被“拉黑”?
- “裸辞后才发现,太用力是上不好班的”
- M4芯片上跑Linux无望?Asahi Linux负责人辞职,抨击Linus领导失误、自述遭遇背叛
- 为什么 DeepSeek 出来后,国产其他大模型厂商集体失声了
- 2025年,Matlab依旧坚挺?
- 974亿美元!马斯克欲收购OpenAI,遭Altman吐槽:不如我97.4亿美元买下推特?
- OpenAI 最近悄无声息地推出了另一个代理框架,说实话,这玩意儿有点酷
- 六年诈骗6000万美元!知名AI初创公司前CEO被捕:公司账户“只剩37美分”,或面临60+年监禁
- 第一学历不好,求职中怎么弥补?
- 新能源车企内卷的核心技术是什么?
- “未来 3 年内,Python 在 AI 统治地位将被 Java 取代!”
- 为了按时返岗,这届打工人有多拼?
- 6MB PDF竟能运行Linux?这名高中生在PDF里玩DOOM后,再“整活”!
- 为什么现在的应届生动不动就要上万的薪资?
- 2025年,转行嵌入式开发的新机遇…
- Meta被曝AI训练「黑幕」!下载81.7TB盗版数据“喂养”模型,CEO竟称不知情?
- 全网最简单,本地部署DeepSeek只需4步即可!
- 下载 DeepSeek 将判 20 年、最高罚款 1 亿美元?美国提出“最激进立法”针对中国 AI!
- “疯存240万,回家当懒汉”:为什么有些人即使不差钱,也躺不平?
- 2025年,Matlab依旧坚挺?
- Deepseek R1可能找到了超越人类的办法
- 同事年底绩效是C,提离职领导死活不让走,后来领导私下说:他走了,就没人背这个绩效了。
- 马斯克:3 年内我要造 50 万机器人,人形机器人会让钱失去意义
- 全解DeepSeek,它为何突然爆火?
- 马斯克:3 年内我要造 50 万机器人,人形机器人会让钱失去意义
- DeepSeek R1 简易指南:架构、本地部署和硬件要求
- 2025年,新能源人才的新机遇
- 程序员的噩梦:用C/C++把UTC时间转成UNIX时间戳竟然这么难?
- 放假,见一家公司的格局
- CPU「离奇」飙到 100%!开发者挖出 Linux 内核 16 年老 Bug:这么多年竟无人发现?
- 公司分配年终奖部门经理一个人就拿走了97% ,如何让他重新分配?
- 2025年,转行嵌入式开发还来得及吗?
- C 语言的困境:为什么这些难题至今没有得到解决?
- 年前一定要盘点的5件事,最后一个很重要!
- 浏览器没用 JavaScript,Google 将阻止搜索!
- 如果领导找你谈话,暗示你应该主动辞职,你会怎么办?
- 2025年,Matlab依旧坚挺?
- Win10寿命倒计时9个月!微软:届时也不支持Office应用
- Next.js 与 React.js 的对比分析
- Linux 6.13惊险一幕:微软代码改动引发混乱,英特尔和AMD紧急修复
- 有这4个特征的领导,是你的贵人!
- 2025年,新能源人才的新机遇
- “Python,就是新的 BASIC!”
- 为什么说程序员是一个极其劳累的工作???
- 一工程师被OpenAI封禁!“我用ChatGPT开发了一个自动步枪”
- “越到放假前,越不想上班”:4招帮你应对节前综合征
- 2025年,转行嵌入式开发的机会如何?
- 大型遗留代码为什么不能动?!
- 特斯拉喊话”尽管对比”,雷军回应”好的”,又登上微博热搜第一。
- “既然 GPU 这么好,那为什么我们还要用 CPU?”
- 那些年前辞职的人,都怎么样了?
- 2025年,Matlab依旧坚挺?
- 再见,CDN 巨头:Akamai 宣布 2026 年终止中国服务
- 所有软件开发公司的通病!
- htmx 会是新的 jQuery?
- 当了leader才发现,大厂最想裁掉的,不是上班总迟到的,也不是下班搞失联的,而是经常把这3句话挂在嘴边的!
- 新能源的车企们到底在卷什么?
- 2025 数据库技术展望
- 遇到这老板,反正我跑路了…
- “AGI不会在2025年出现”,Gary Marcus对AI的25大预测!
- 24小时掌握一项新技能的高效方法
- 后悔没早点转行嵌入式开发
- 招了又裁?软件开发者发招聘后宣布:解雇整个技术团队,用AI取代!
- 加班到凌晨,为什么没人发朋友圈了?
- “警惕!过度抽象的代码库,是开发者看不见的隐形噩梦”
- 用户暗中评判的 12 种前端微交互
- Matlab—手握数据分析的头把交椅
- 重磅!“AI界拼多多”再发力,国产大模型DeepSeek-V3开源后刷屏,总训练成本557万美元,性能比肩GPT-4o
- 不要再这样编写 async/await
- 2025 AI“平替”危机:大批程序员真的会被取代吗?
- 程序员为何如此健忘?
- 新能源的车企们到底在卷什么?
- AI 在谷歌,偏偏搜不对。
- 你必须要了解的 10 种微服务设计模式!
- 21岁开发者从地下室起步,5年时间,成功打造自己的私有云业务!
- 职场人际关系的4个雷区,千万别踩!
- 现在转行嵌入式开发还来得及吗
- 数学家现身说法:OpenAI「王炸模型」o3 ,到底会不会做数学题?
- 在使用 React 五年后,真正明白 useMemo 的意义
- C++ 没想象中那么糟!
- 羊毛月的傲慢与偏见:00 后不是要整顿职场吗?怎么职场都进不去呢?
- Matlab依旧坚挺?
- AI PC 革命已然「夭折」?分析师曝:智能手机和 PC 的“超级周期”难以到来!
- 职场正在筛掉“老实人”
- 融资百亿美元后,Databricks CEO 警告:AI 泡沫已到顶,许多初创公司徒有其表
- 为什么需要重新考虑将 Zustand 与 Next.js 结合使用的问题?
- 新能源汽车人才的最新动向
- 重磅!MoonBit 正式开源核心编译器,运行性能优于 Rust 和 Go
- Next.js 15.1 发布:全面升级开发体验
- 传 Win11 硬件门槛大降,老旧 PC 也能「上车」?网友质疑:这页面 3 年前就有了……
- 90后试岗后被辞,背调发现其有讨薪记录…
- 后悔没早点转行嵌入式开发
- 对标Sora,Google发布更强大的Veo 2视频生成模型!
- 别人问你工资多少,怎么回答不得罪人?
- 因融资失败,这款诞生仅4年、5800+元的儿童机器人即将变“砖”!家长控诉:要如何解释它的「去世」?
- 从BAT到硅谷:全球软件研发的最新趋势与实践
- 前同事故意埋雷?公司一个300W的平台项目,刚验收半个月,团队被裁员全部解散了,今天所有服务全部异常了!
- Matlab进入市场四十年,地位依旧?
- 诺奖&图灵奖双料得主 Geoffery Hinton:“AI 质疑者一错再错,未来还会继续被打脸”
- 年轻人正在流行“县漂”:回县城发展,现实吗?
- 新能源汽车人才的最新动向
- 被「淹没」在AI编写的漏洞报告中,Python安全开发者怒斥:不要再依赖AI工具了!
- 突然有个邪恶的念想:希望被裁员拿 N+3 了
- 嵌入式开发的时代新趋势是…
- 后悔没早点看到…
- Python 即将成为年度语言,TIOBE 12 月榜单发布!
- 曝光一下,这公司居然没一个人敢下班?
- 一直在错过,这次不想再观望了
- “彻底放弃 React!频繁更新和管理疲劳让我崩溃”
- “上班睡觉1小时被开除”:辞退员工的理由越来越离谱了!
- Matlab进入市场四十年,地位依旧?
- OpenAI量子计算大神Scott Aaronson:“我不理解为什么有人能自信看衰 AI”
- 如果你能正确回答这 7 个问题,你的 JavaScript 技能已经不错了
- 告别VMware!被博通收购后涨价10倍,这家拥有2万台虚拟机的公司愤而“投奔”开源
- 雷总给武大 “雷军班” 的两点建议。
- 所有车企都在卷的系统,你了解了吗?
- 年薪20+万美元,每周仅工作5小时?斯坦福研究发现:9.5%的“幽灵工程师”每年浪费900亿美元!
- 互联网几乎崩溃的七个 JavaScript Bug
- “再见了 Rust,祝你成功,但我还是回到了 C++……”
- 幽灵职位,一种哄骗求职者和员工的职位
- 70%以上程序员都需要看的算法知识图谱!
- 嵌入式开发的时代新趋势是…
- 英特尔CEO“被迫”退休?或因错失AI风口、芯片代工难扭亏
- 我常用的 10 个 CSS 一行代码技巧
- Chrome 带头,五大浏览器围剿微软 Edge!
- 职场人际关系的4个雷区,千万别踩!
- C++ 两大派系之争
- 你了解 CSS 的全部 4 种焦点样式吗?
- 别再冤枉代码了!“遗留”问题的真正根源,竟在于我们自己
- Vite 6.0 发布:引领现代前端开发新方向
- 所有车企都在卷的系统,你了解了吗?
- 轻松搞定 BAT 的面试的通关「算法」秘籍
- 22年后告别微软!ISO C++主席Herb Sutter 称C++ 26是“自 C++11 以来最具影响力的版本”
- 最难的 JavaScript 面试题解析
- 70%以上程序员,不懂数据结构和算法!
- Node.js之父再喊话Oracle:放手JavaScript!
- 浪费我时间的 7 个 JavaScript 错误(以及如何纠正它们)
- 现在转行嵌入式开发还来得及吗?
- 70%以上程序员,不懂数据结构和算法!
- 高中生用 AI 完成作业遭严惩,家长不服上诉,法院一锤定音:学校无错!
- 一张图告诉你,华为鸿蒙开发还是值得向往的!
- C++之父领衔,系统软件专家齐聚,2024全球C++及系统软件技术大会日程抢先看!
- WPS活成了年轻人想要的样子
- 终于理解了 Next.js 中的 Cookie
- Matlab依旧坚挺?
- 各路大佬纷纷给 AGI 立下“最后期限”,27 岁创始人已经给 AI 准备好「人类最终测试」!
- Web开发的未来:2025 年未来几年的主要趋势
- C++之父领衔,系统软件专家齐聚,2024全球C++及系统软件技术大会日程抢先看!
- “每周70小时,干到退休!”印度IT巨头创始人重申主张,网友:工作到英年早逝?
- Spring用到了哪些设计模式?
- 所有车企都在卷的系统,你了解了吗?
- 15亿美元招募1500人?马斯克起诉OpenAI升级,更是爆料:高薪“抢夺”顶尖人才
- 我们习惯的前端开发正在消亡
- 花 5 年时间,21 岁开发者从地下室起步,成功打造自己的私有云业务!
- 没人愿意使用这些数组方法
- 嵌入式开发将迎来一波新浪潮
- AI 2.0时代:软件开发的未来已来,你准备好了吗?
- 手提30公斤重物、还能拧螺丝、颠勺,全能人形机器人灵宝“CASBOT 01”来了!
- HR的6种暗示,表明不想录取你!
- 大模型如何重塑软件开发?一文读懂AI在代码中的魔法!
- 16年后微软的“古董”复活!开发者用C#重构经典VB6 IDE,网友:遗留的“屎山”代码有救了
- 越来越多的人开始讨厌15薪。
- Matlab依旧坚挺?
- C++之父领衔,重磅嘉宾齐聚:2024全球C++及系统软件技术大会首批议题发布!
- 双十一狂欢不停:CSDN会员买一年送一年
- 历经 20 年,免费开源的 Photoshop 竞品「GIMP」终于要迎来 3.0 版!
- 当上班搭子突然离职,那种感觉,真的令人绝望!
- CSDN拍了拍你:双十一会员优惠待您查收
- “不愧是 Linus!”仅改 21 行代码,Linux 性能暴涨 2.6%
- 释放 PWA 的力量:2024 年的现代Web应用|React + TypeScript 示例
- 车机系统越来越多,我们该怎么办?
- 双十一限时狂欢:CSDN年卡买一送一
- 解决真实GitHub Issue能力一度登顶,字节豆包MarsCode团队分享背后工程实践,踩过的坑也分享了
- SpringBoot 实战:文件上传之秒传、断点续传、分片上传
- 双十一限时狂欢:CSDN向你发起了会员福利邀请!
- 开发者自制「超平价」AR眼镜:成本不到100 元,连镜片都是自己做的!
- 类型别名与接口的较量:深入理解TypeScript 2024中的差异
- 嵌入式开发将迎来一波新浪潮
- 15 岁山东少年当 CTO:码龄 7 年,靠“玩”出来的开源项目已赚取数百万元!
- 为什么感觉中国人月薪过万很普遍了?
- 30+年前的Windows 3.1立大功?被曝依赖“古董级”系统,美国航空急需80亿美元升级!
- 这个简单的窍门能大大改善 React 开发体验
- Matlab依旧坚挺?
- “我们将告别 Kubernetes!”
- 我不知道如何在 JS/TS 中创建深度克隆
- 美政府再发警告:关键软件勿用C/C++,2026年前给迁移方案,否则非常危险!
- 一个有争议的话题:客户端密码加密有必要吗?
- 所有车企都在卷的系统,你了解了吗?
- Google危矣?ChatGPT真变AI搜索引擎了!
- 百度二面,MySQL 怎么做权重搜索?
- 36年开发老兵试用AI编程工具:真香还是交智商税?
- React v19 革新功能:2024 年需要了解的所有信息
- 想转嵌入式开发,我的建议是…
- 苹果豪掷 100 万美元悬赏:谁能入侵 Apple Intelligence 服务器?!
- React Native 0.76 重大更新:新架构全面启用
- 50人苦苦支撑的Flutter遭分叉,前开发者怒批:Google太偏心,全公司都存在问题!
- 离职前的7个注意事项,最后一个才是“删好友”
小白学视觉
- 小白看得懂的 Transformer (图解)
- 为什么现在计算机所有专业的研究生基本都搞机器学习和深度学习,国内真的需要这么多会人工智能的人才吗?
- C++ OpenCV实现图像去阴影
- GPT-4.5功臣遭驱逐!奥特曼盛赞工作出色,美国深陷AI人才危机
- CUDA编程:矩阵乘运算从CPU到GPU
- 高考考上985的AI来了!超强数理推理横扫真题,训练秘籍剑指AGI
- YYDS,哈工大博士的pytorch笔记火了!!
- 长远看算法岗真的比开发岗香吗?
- 总结了 11 种 Numpy 的高级操作
- 不是,现在都流行用Kaggle写论文了吗?
- 只需6G显存,就能本地跑的AI视频算法,开源了!
- 知乎热议 | 前几周Deepseek都是神一般的存在,为啥热度消散得这么快?
- 在目标检测中如何解决小目标的问题?
- 仅需0.4GB,参数只有0和±1!微软开源首个原生1 bit模型,CPU轻松跑
- 英伟达CEO黄仁勋到访北京:希望继续与中国合作,并回应芯片出口管制问题
- 今年读过最绝的一本LLM书!下载量10w+!看完少走一半弯路
- 使用Stable Diffusion图像修复来生成自己的目标检测数据集
- 重磅!国家鼓励主要论著优先在国内学术刊物上发表
- MATLAB与OpenCV进行相机标定,谁的标定精度高?
- 十分钟掌握Pytorch搭建神经网络的流程
- 视觉自回归生成理解编辑大一统!北大团队多模态新突破,训练数据代码全面开源
- 深度学习环境配置指南!(Windows、Mac、Ubuntu全讲解)
- 博士工作满2年直升副教授, 无需评审?
- 深度学习可视化大全(附github源码)
- 不是Nvidia买不起,只是国产更有性价比!使用全国产CPU和GPU项目开发记录-训练篇
- 综述 | 图像特征提取与匹配技术
- ECCV 2024 | 快速傅里叶变换与Transformer结合用于图像恢复
- 导师放养,偷偷发了顶会。。。
- 机器视觉学习—边缘检测
- 深圳大学教授自曝工资收入
- 何恺明ResNet登顶!Transformer上榜,Nature揭秘21世纪引量用最多的论文!
- 周志华教授:如何做研究与写论文?
- 代码对比工具,我就用这6个
- 中科院2025分区表更新:科研人的避坑指南与投稿新思路
- InsCode AI IDE 2.0震撼发布!DeepSeek-V3-0324免费用:一句话生成蜘蛛纸牌+高颜值网页
- 你们的导师做过什么惊为天人的事情?
- 拿下二区idea!即插即用创新点:多尺度注意力!
- ICCV审稿进度进度3/3,总结了几个共性问题…
- 只因论文”碰瓷”,ICLR 2025区域主席直接拒稿!最强rebuttal,成功接收并选为Spotlight!
- AI封神了!无剪辑一次直出60秒《猫和老鼠》片段,全网百万人围观
- 你也用print输出来调试代码么?
- 洗个澡把 offer 洗没了。。
- 永别了,GPT-4下线了!
- 不用英伟达GPU!华为盘古Ultra来了:昇腾原生、135B稠密通用大模型
- 聊聊强化学习发展这十年
- 图像变换详解—从傅里叶变换到小波变换
- 速递 | YOLOv8模型改进的N种方法
- 用于图像处理的Python顶级库
- 论文党狂喜!alphaXiv推出Deep Research一秒搜遍arXiv,研究效率直接爆表
- 2025 TPAMI综述 | 全新视角红外与可见光图像融合完整理解与入门!附GitHub最全开源对比方法结果!
- 相机标定(Camera calibration)原理及步骤
- 代码可复现 | 2024时间序列领域相关顶会
- 高校发文:清理整治富余闲散人员
- 为什么图像处理如此困难
- CLIP被淘汰了?LeCun谢赛宁新作,多模态训练无需语言监督更强!
- 【2025年 即插即用】新颖的四边形注意力,CV任务统统涨点!
- 使用Python Pip的10个技巧
- Mamba再出手!助力图像增强提速21倍,Transformer时代终结?
- 【深度学习】图解自注意力机制(Self-Attention)
- 在哪里能找到流行的ML/DL的论文和源码
- Llama 4训练作弊爆出惊天丑闻!AI大佬愤而辞职,代码实测崩盘全网炸锅
- TPAMI 2025 | 国防科大提出RGBT-Tiny数据集与SAFit指标,推动小目标检测技术发展
- TIV 2024 | MDFD2-DETR:一种基于多域特征分解与去冗余的实时复杂道路目标检测模型
- 突发,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座
- 为什么导师总说,科研搞好了,工作随便找?
- CVPR 2025 | 新颖的L型卷积,即插即用,高效扩展空间感受野!
- 图解卡尔曼滤波(Kalman Filter)
- 为什么好多研究生都不愿意继续读博士了?
- ECCV 2024 | 快速傅里叶变换与Transformer结合用于图像恢复
- 收藏 | 基于PyTorch的卷积神经网络经典BackBone(骨干网络)复现
- 同组博士师兄的结果复现不出来,我应该怎么办?
- MambaYOLO:基于状态空间模型的目标检测简易基线方法
- 《大模型基础》教材发布,开源!
- 稚晖君刚挖来的90后机器人大牛:逆袭履历堪比爽文男主
- 没有穿越,DeepSeek-V3又登顶了!杭州黑马撼动硅谷AI霸主,抹去1万亿市值神话
- 收藏 | 论文画图工具:25个常用Matplotlib图的Python代码总结
- 车位数量检测
- 改变几行代码,PyTorch炼丹速度狂飙、模型优化时间大减
- 导师对帮助研究生顺利完成学业提出了20条劝告:第一,不要有度假休息的打算..
- 普通博士生和顶级博士的区别……
- 使用Python+Pycaret进行异常检测(附代码演练)
- 注意力机制是如何学习到模型所应注意的区域的?
- TPAMI 2025 | 基于高效脉冲发放近似训练的脉冲驱动 Transformer 扩展方法
- 最全总结!1000篇最新顶会论文!
- 深度学习训练过程可视化(附github源码)
- 什么是扩散模型(Diffusion Models),为什么它们是图像生成的一大进步?
- 数字图像处理必备基本知识总结
- 实战|13个Pytorch 图像增强方法总结(附代码)
- 揭秘学阀现象:学术圈正在上演怎样的”门徒战争”?
- 输入到CNN中的图像为什么不具有平移不变性?如何去解决?
- 相较神经网络,大名鼎鼎的傅里叶变换,为何没有一统函数逼近器?答案在这
- 明明有些学生在学校混得很水,但找工作时学历和学校(985/211)那么管用?
- IJCV 2025 | 基于对比特征重构的渐进式视觉提示学习
- 实践教程|GPU 利用率低常见原因分析及优化
- 使用PyTorch进行情侣幸福度测试指南
- CVPR 2025 | 知识桥接器:迈向免训练的缺失模态补全
- 被放养的博士能靠自己毕业嘛?
- CVPR 2025 自适应矩形卷积模块,即插即用
- 医图论文 ACM MM’24 | PASSION:用于不均衡缺失率下有效不完全多模态医学图像分割的方法
- 少样本学习概述:算法、模型和应用
- 检测物体+估计距离和方向 | 附源码
- C++库文件和头文件编写教程
- 常见的距离算法和相似度计算方法
- OpenCV基础知识入门
- 多模态融合,顶会超神了!
- 如何在OpenCV中使用YOLO
- 震惊!2025 中科院分区表发布,这些期刊命运大反转!
- 在CV界,传统卷积已经彻底输给Transformer了吗?
- 使用PyTorch进行情侣幸福度测试指南
- 图像滤波常用算法实现及原理解析
- 全球顶级AI科学家著作,底层视觉技术10年发展精粹!
- YOLO-BLBE:一种新方法识别不同成熟度蓝莓果实的新型模型
- NIPS 2024 | 跨领域图像去噪的适应性领域学习
- 深度学习中GPU和显存分析
- 长远看算法岗真的比开发岗香吗?
- 医图论文 ACM MM’24 | BSBP-RWKV:用于高效医学图像分割的背景抑制与边界保留方法
- 60 个神级 VS Code 插件!
- YOLO落地部署 | 让YOLO5和YOLO7等方法都可以用上4-bit/3-bit的超快部署方案
- TIP 2024 | 跨类与跨域语义增强用于域泛化
- 爆肝两周!CVPR2025论文合集
- 黄仁勋携GB300震撼登场!DeepSeek推理暴涨40倍打破世界纪录
- ACM MM’24 | DCAFuse:用于多模态图像融合的双分支扩散 - CNN 互补特征聚合网络
- 不是CG?没加速?这个国产机器人跳「斧头帮」舞火了,网友:流畅到不像真的
- 退而求其次?青椒跳槽三线高校后,副教授变教授、140平房子到手、老婆入编…
- 如何画出漂亮的神经网络图?神经网络可视化工具集锦搜集
- 245个目标检测开源项目合集,建议收藏!
- YOLOe问世,实时观察一切,统一开放物体检测和分割
- 目标检测 评价指标
- 基础卡尔曼滤波
- 基于PyTorch的卷积神经网络经典BackBone(骨干网络)复现
- 师兄跟我说他博士毕业后想回老家县城工作
- 颠覆!为啥本科生连发3篇视觉顶刊,而有的博士一篇都没有?
- 分享16个Matplotlib 绘图实用小技巧!
- 博士们,高校教职现在卷到什么程度了?
- YOLOv12入门教程
- 何恺明LeCun暴击Transformer命门,9行代码砍掉归一化层!性能反而更强了?
- AAAI 2025 | TinySAM:推动高效分割任意模型的发展
- 何恺明团队新作DHN:将哈密顿力学泛化到神经算子,实现更高级物理推理!
- 首个AI CUDA工程师来了!将PyTorch原生实现提速10-100倍!
- 李飞飞团队新作!具身智能最新研究:让机器人做好家务!
- 被导师放养,后果可能很严重。。。
- 盘一盘语义分割那些不可不知的小技巧
- [CVPR`25 | 让暗光照片秒变电影大片!全球首个可训练的HVI色彩空间,突破低光增强瓶颈!](https://mp.weixin.qq.com/s/B_GTI3ICmExEhrhPYX6eZg)
- 如何使用DeepSeek进行科研图表绘制?
- AAAI 2025 | 基于生成感知先验的低光照图像增强
- Manus被破解了?曝出系统提示词和背后大模型,CTO也回复了
- 黄仁勋预言成真!!!
- 教授何恺明在MIT的最新讲座!
- AI编程神器Cursor,保姆级教程来了!
- 华为”天才少年”稚晖君官宣本周要发布好东西,国产机器人行业迎来新变局?
- TIM 2025 | CASPFuse: 基于双循环横向感知和全局结构张量保持的红外与可见光图像融合方法
- 那些年我们一起卷过的卷积
- 美国老姐看完200+中国学生SCI论文,怒写超详细“中国人英文论文写作指南”,还被推上了B站热门…
- 傅里叶变换太牛了!用傅里叶分析重塑LLMs的周期性感知
- 模型部署系列 | 卷积Backbone量化技巧集锦
- Manus邀请码炒到10万?OpenManus深夜开源打脸!Manus平替光速上线!
- CVPR 2025 MINIMA:首个通用多模态图像匹配架构(模型、数据已全部开源)
- 比较全面的L1和L2正则化的解释
- 为何说 “在国内做科研,最忌讳踏实”?
- 利用边缘检测计算物体面积(内含源码)
- 新晋顶流Manus被疑“套壳”?创始人回应……A股:先涨为敬
- 【附复现代码】基于PINN的论文创新思路
- CVPR 2025 | MobileMamba开源:轻量级多感受野视觉Mamba主干
- 最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)
- 刚刚,2024图灵奖颁给了强化学习之父Richard Sutton与导师Andrew Barto
- CVPR 2025 满分论文!一块2080Ti搞定数据蒸馏,GPU占用仅2G!来自上交大“最年轻博导”课题组!
- 【CVPR 2025】高效视觉Mamba模块EfficientViM,即插即用!
- 机器视觉中常用图像处理库都有哪些?
- 碉堡了!用deepseek写了篇一区论文
- 目标检测中的 Anchor 详解
- 驱使我读博的原因:博士配偶初中学历被安排工作!网友:学得好不如嫁得好,高校回应:合规!
- 小米汽车校招薪资爆料清单来啦!
- 傅立叶变换、拉普拉斯变换、Z 变换的联系是什么?为什么要进行这些变换?
- 何恺明ResNet级神作,分形生成模型计算效率狂飙4000倍!清华校友一作
- 各家都在吹的“端到端”到底是啥?
- 年薪154W!真心建议大家冲一冲新兴领域,工资高前景好
- YOLOv12论文详解:以注意力机制为核心的实时目标检测
- MIT三人团队:用Transformer解决经验贝叶斯问题,比经典方法快100倍
- DeepSeek一天能赚多少钱?官方突然揭秘V3/R1推理系统,成本全透明
- 手把手教你驯服DeepSeek-R1!部署+测试+性能优化万字全攻略
- 突发!总部已封楼!知名智驾公司突然解散,高管激烈内斗
- 【Linux】Ubuntu的一些高(sao)效(cao)率(zuo)工具
- 德国莱布尼茨研究所(ISAS)招收“机器视觉/多模态大模型”博士
- CVPR终于放榜,审稿新规第一年,录取率新低!
- DeepSeek-R2被曝5月前发布!
- 再度封神!连发3篇国际顶刊,审稿人直夸没问题!计算机视觉领域迎来史上重大突破!
- DeepSeek装进VSCode,编程非常丝滑!
- 目标检测算法是如何生成正负样本的
- 一个有趣的发现!大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠
- ICLR 2025|如何在ImageNet-1K上训练视觉基础模型?
- 孤立卡尔曼滤波(IsoKF):理论与解耦估计器设计
- 天选思路怎能不会!小波变换+CNN完美融合,最新idea发了CV顶会!
- 基于OpenCV的数字识别系统
- 阿里巴巴:2024年优化了 24940 人
- 2025年,当我们在谈论Agent的时候在讨论的到底是什么?
- 简单的Python调用C++程序
- 重大创新!DeepSeek R1方法成功迁移到视觉领域,多模态迎来新突破!
- 基于Pytorch的卷积算子的推导和实现
- 再次颠覆学界想象!何恺明发表新作:扩散模型不一定需要噪声条件
- 完整DeepSeek-R1 671B本地化部署,详尽教程来了!
- 官宣:这高校禁用DeepSeek
- 学不过来了!YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世
- 11种 Matplotlib 科研论文图表教程(附代码)
- 差分卷积在计算机视觉中的应用
- 官宣:硕博奖学金,涨了!
- 你需要知道的20个常用的Python技巧
- NeurIPS早早邀请审稿人!今年投稿量又要爆?
- EHCTNet:基于CNN和Transformer增强混合网络的遥感图像变化检测
- 245个目标检测开源项目合集,建议收藏!
- 基本的图像处理操作
- 一份微调YOLOv11的小指南
- DeepSeek和月之暗面的论文撞车了!!
- ICLR 2025 高分论文!何恺明和刘壮提出:数据集偏差的十年之战
- 刚刚!DeepSeek团队丢出注意力新机制重磅论文
- CVPR 2025 NTIRE赛事 | 首届多场景雨滴去除挑战赛
- 清华《DeepSeek:从入门到精通》干货分享!104页!
- 特征选择的通俗讲解!
- 数字图像处理:边缘检测
- 多院校研究生奖学金停发!!
- 神经网络与傅立叶变换有何关系?
- 使用 Mask RCNN 和 Yolov5 进行划痕检测
- 如何看北京理工大学珠海学院(独立学院)毕业生冒充北理工(985)去应聘,被拒后反骂HR学历歧视?
- 【机器学习】5 分钟了解特征工程
- 12个常用的图像数据增强技术总结
- 特征提取:传统算法 vs 深度学习
- 数字图像中的噪声
- Arxiv’2025 | YOLO-MST:基于超分辨率和YOLO的多尺度红外小目标检测
- 超全面! 15 种 Python IDE 工具使用对比
- 奥特曼自曝:GPT-5要来了,所有人免费!DeepSeek逼急OpenAI,最强路线图曝光
- TIM’25 | MixFormer:一种用于医学图像分割的混合CNN-Transformer骨干网络
- 快速学会登上nature的热门算法,LSTM!
- DeepSeek装进VSCode,编程非常丝滑!
- 道路裂缝坑洼图像开源数据集汇总
- 博士生们每天科研时间是多久?
- 不平衡数据集的建模的技巧和策略
- YOLO11 实例分割模型做行人分割
- 迈向GPT-4o,多模态大模型杀回来了!
- 车位数量检测
- 博士生们都在干什么?
- 机器视觉相机的镜头选择基础知识
- 基于深度学习的低光照图像增强
- 何恺明目前的学术成果是否够得上计算机视觉领域历史第一人?
- 一个小改动,CNN输入固定尺寸图像改为任意尺寸图像
- 数字图像处理必备基本知识总结
- TPAMI 2025 | 基于可解释优化展开网络的低光图像增强
- 网上关于DeepSeek的说法,哪些是错误的?
- 只需2行代码,轻松将PDF转换成Word
- 一些有用的 OpenCV 函数
- 一次性分割一切,比SAM更强,华人团队的通用分割模型SEEM来了
- 即插即用,轻松涨点!把大牛的模块缝合到自己的paper里
- 4000字!深度解析 DeepSeek 的蒸馏技术
- 用 OpenCV 去除图片中的水印,骚操作!
- 再也不用担心过拟合的问题了
- 一位北大博士在DeepSeek的工作感受和择业思考!
- 一个算法工程师复现算法的踩坑总结
- 用深度学习的方式融合各种信息
- 真假?美国下令全面封杀中国AI?!下载DeepSeek,最高判20年监禁…
- 基于OpenCV的实时睡意检测系统
- 一文详尽之Scaling Law
- 你的学校上榜了吗?DeepSeek中国大学排名Top100
- (附代码)在OpenCV中基于深度学习的边缘检测
- 博士如何高效率阅读文献?有哪些技巧可以借鉴?
- 迈向GPT-4o,多模态大模型杀回来了!
- o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
- DeepSeek薪资待遇曝光!
- ResNet潜力都挖掘出来了吗?
- PyTorch深度学习训练可视化工具tensorboardX
- 一个例子搞明白机器人坐标系变换
- 回顾!华为天才少年谢凌曦:关于视觉识别领域发展的个人观点!
- 计算机视觉深度学习训练推理框架
- 笔记 | 深入理解Transformer
- 全球热议 DeepSeek:复现狂潮如何改变游戏规则!一文汇总复现项目!
- 【深度学习】深入浅出卷积神经网络及实现!
- DeepSeek“人均百万”传言引爆求职热潮,非算法岗应届生年薪百万!!
- 如何看北京理工大学珠海学院(独立学院)毕业生冒充北理工(985)去应聘,被拒后反骂HR学历歧视?
- 在 Python 中使用 OpenCV 模块对图像进行基本操作
- YOLOv5训练自己的数据集(超详细)
- 开发算法的痛点是什么
- 基于OpenCV的焊件缺陷检测
- 对象检测:模板匹配
- 收藏 | Pytorch实现Canny边缘检测
- 为什么博导都希望,自己的博士生毕业也去高校当老师?
- 详解遗传算法 GA(Python实现代码)
- 算法岗平时需要自己写cuda吗?
- 计算机视觉 - 使用 YOLOv8 创建交通热力图
- 为什么某些高校基础学科的教授拿了几百万经费,连个毛都没做出来,发一堆水刊……
- 前沿论文 Arxiv’24 | AMI-Net: 用于异常检测与定位的自适应掩码修复网络
- 李飞飞:AI 智能体必将在2025年爆发。。。
- 使用 OpenCV 的 SIFT 图像特征提取和匹配
- 神经网络可视化有3D版本了,美到沦陷!(已开源)
- NIPS 2024 | 缺失值存在下的无监督异常检测
- 10 分钟学会使用 YOLO 及 OpenCV 实现目标检测
- 前沿论文 Arxiv’24 | FourierMamba: 傅里叶学习与Mamba结合的图像去雨
- 博士扩招与学术市场内卷
- 工业界和学术界最大区别是什么?
- 狂发顶会的特征融合,再出神作!
- 图像中的裂纹检测
- 使用OpenCV进行肺炎诊断检测
- 图像直方图全面介绍
- 使用OpenCV实现摄像头测距
- 卷积调制空间自注意力SpatialAtt,轻量高效,即插即用!
- 优化YOLO实现小型设备的目标检测部署
- 图像处理的分类、一般流程与算法
- 使用傅里叶变换进行图像边缘检测
- 特供版RTX 5090D被曝不能「炼丹」!AI算力3秒锁死,不支持多GPU配置。。。
- 使用OpenCV测量图像中物体之间的距离
- 通过动图彻底理解了傅里叶变换
- 上位机工程师和视觉工程师有什么区别?
- 分辨率单位、换算及镜头与感光器像素的匹配
- CVPR 2024 | D3T: 跨RGB-热红外域的显著双域教师框架用于域自适应目标检测
- 终于来了!OpenCV更新了:4.11.0和5.0预览版
- 如何解决工业缺陷检测小样本问题?
- 一文带你读懂YOLOv1~YOLOv11
- CNN+LSTM+Attention多热点搭配!又是创新性拉满的高分思路!!
- 神奇!傅里叶与Mamba结合竟然能实现图像去雨!
- 基于边缘检测的图像分割算法!
- 强烈推荐一个Python可视化模块,简单又好用
- 使用YOLOv8和ByteTracker进行实时人员跟踪和计数
- CNN万能涨点公式!MoD:增强一切卷积网络!还能加速25%!
- 14天速成LLM高手!大佬开源学习笔记,GitHub狂揽700星
- 《一书解决几乎所有机器学习问题》.PDF下载
- 困在“第一学历”里的博士
- 基于 Faster ViT 进行图像分类
- 2025年Next Token Prediction范式会统一多模态吗?
- 突发!CDN宣布退出中国!波及范围不可预估,20年老用户崩溃
- 基于深度学习的疲劳驾驶检测
- 机器视觉在烟草行业的典型应用
- CVPR 2024 | 具有尺度和位置敏感性的红外小目标检测
- 来了,使用YOLOv11目标检测的详细教程
- 【AAAI 2025】多尺度对比特征融合CDFA,即插即用,极大增强特征表达!
- 什么是扩散模型(Diffusion Models),为什么它们是图像生成的一大进步?
- 为什么同门硕士进了BAT拿高工资,而博士却要挤破头进985高校?
- 形象理解二维傅里叶变换
- 浙大高飞老师:读博士有多苦?
- OpenCV之图像处理基础
- CVPR 2024 | ODCR: 正交解耦对比正则化用于非配对图像去雾
- CVPR 2024 | 双向多尺度隐式神经表示用于图像去雨
- 计算机学院的学生该怎样提高自己的编程能力?
- 读完这这本大模型书籍,你就是LLM大师!
- 60 个神级 VS Code 插件!
- 从0到1实现神经网络(Python)
- AAAI’25 | BSAFusion: 用于未对齐医学图像融合的双向逐步特征对齐网络
- 基于深度学习的图像边缘和轮廓提取
- 基于OpenCV的图像梯度与边缘检测!
- 5分钟完成Swin Transformer部署
- 代码开源 | 基于YOLO的16种目标检测项目,人体/交通/医疗/工业等方向超全
- 深入浅出各种边缘检测算子及其推导
- 使用 Python 和 OpenCV 进行图像聚类
- NIPS 2024 | 缺失值存在下的无监督异常检测
- 60k感知算法岗面试,考察热门Occ算法及难点!
- 《学位法》正式出台!研究生,迎大变革!
- 目标检测正负样本区分策略和平衡策略总结
- 11 种特征选择策略总结!
- 基础知识 | 小波变换
- 计算机专业同学应该学哪些知识?
- IEEE TPAMI | 无监督去雨:非对称对比学习与自相似性相遇
- 微调YOLOv11:实用指南 【详细过程与代码】
- 对比损失思想设计loss function的方法。
- NIPS 2024 | 眼动引导的多模态对齐用于医学表示学习
- 度量学习中关于排序损失函数的综述
- AI数钢筋
- 训练速度最高100倍提升!基于PyTorch实现的可微逻辑门网络开源
- 图像相似性度量标准
- 相机标定解析
- 如何1个月拿下顶会!
- 多传感器融合定位:基于滤波的融合方法
- 比较CPU和GPU中的矩阵计算
- 顶刊解读 TGRS | 用于微小目标检测的去噪特征金字塔网络与transformer区域卷积神经网络
- 从职高到杭电、浙大、MIT计算机博士!
- TPAMI 2024 | 用于目标检测的CenterNet++
- 大学学习什么课程才能成为稚晖君?
- 上海微软大裁员,赔偿达N+8,12年老员工感叹:拿20个月工资走人,每月3000失业补助,也是种幸福
- 即插即用,轻松涨点!把大牛的模块缝合到自己的paper里
- 哈工大硕士生用Python实现了11种数据降维算法,代码已开源!
- 超全!目标跟踪中的评价指标有哪些?
- 医图顶会 MICCAI’24 | 基于高斯混合模型的多模态组内配准框架
- 卷积神经网络中用1*1 卷积有什么作用或者好处呢?
- 今年这情况,读个博后被坑惨…
- 基于GAN的零缺陷样本产品表面缺陷检测
- NIPS 2024 | LookHere: 具有定向注意力的视觉Transformer实现泛化和外推
- 华为天才少年谢凌曦:关于视觉识别领域发展的个人观点!
- 混合精度训练原理总结
- 程序员的未来:工作和学习都要依赖 AI 了?
- 基础卡尔曼滤波
- 红外图像处理算法介绍
- 纯干货|计算机视觉五大核心任务
- NIPS 2024 | 在恶劣天气下使用融合块和时空师生学习进行端到端语义分割
- 分类问题的label为啥必须是 one hot 形式?
- 哈佛大学教授:拒绝「调参侠」从学好数学开始!
- 基于深度学习的车牌检测识别(Pytorch)(ResNet +Transformer)
- 机器学习回归模型的最全总结!
- 《大模型基础》教材发布,开源!
- 博士的年薪一般是多少万?
- 吃透空洞卷积(Dilated Convolutions)
- 斯坦福大学——人工智能本科4年课程清单
- 【机器学习】特征选择(Feature Selection)方法汇总
- 深度学习工作:从追求 SoTA 到揭示新现象
- 基于OpenCV和Matplotlib的物体移动可视化
- 横扫2024各大顶会,用Mamba发Paper真的很轻松!
- 68个Python内置函数,建议你吃透!
- 使用 OpenCV 快速检测、跟踪移动物体
- 邓小刚院士:战斗机机动飞行仿真新突破:结合机器学习的数值虚拟飞行方法 | 顶刊阅读 PoF
- 可直接插入任何MLLMS!OmniSearch:多模态检索增强生成新SOTA
- Github下载慢解决了!「100%有效」
- 在CV界,传统卷积已经彻底输给Transformer了吗?
- 年薪96w!450万就业人才缺口,真心建议大家冲一冲新兴领域!
- 知乎热议:十年以后学历会贬值成什么样子?
- Transformer的细节到底是怎么样的?连环18问!
- python抠图(去水印)开源库lama-cleaner
- 一文读懂傅立叶变换处理图像的原理
- 室外零下20多度,这所985高校竟让学生穿短袖上下课!
- 用Numpy手写各种距离度量
- ECCV 2024 | ModelMambaIR:基于Mamba模型用于图像恢复的简单基线
- 基于深度学习的图像边缘和轮廓提取
- 傅立叶变换、拉普拉斯变换、Z 变换的联系是什么?为什么要进行这些变换?
- 高德导航红绿灯为啥能读秒?
- TPAMI 2024 | 像素就是你所需要的一切:用于显着目标检测的对抗性时空集成主动学习
- 基于傅里叶变换的特征交互与多尺度感知变化检测
- 仅仅一个树莓派就可以做的目标检测
- 一个博士的血泪求职路:想入职高校?请以我为鉴避坑!
- MICCAI’24 | CriDiff:通过生成预训练的交叉注入扩散框架实现目标分割
- 多模态融合,顶会超神了!
- 武汉大学计算机学院武宇教授招收2025级博士生(人工智能方向)
- 一文全览 | 知识蒸馏算法汇总
- 【论文推荐】H-DenseFormer:多模态融合分割的高效混合密集连接Transformer
- 通过动图彻底理解了傅里叶变换
- 像教女朋友一样教你用 Cuda 实现 PyTorch 算子
- 相机镜头工作原理图解
- 《一书解决几乎所有机器学习问题》.PDF下载
- 毕业即失业?美国顶尖高校博士直呼太卷。。。
- 工业缺陷检测深度学习方法
- OpenCV如何读取仪表中的指针刻度
- 李飞飞、Bengio和何恺明在NIPS干了什么!
- 创意 v.s. 智能|电影导演与AI科学家视角下的长视频理解主题圆桌会
- 博士招生 | 南京大学(国家级青年人才)人工智能、计算机视觉、大模型方向-2025年博士生招生
- C++库文件和头文件编写教程
- 高效加性注意力Efficient Additive Attention,轻量且涨点!
- Pytorch 弹性训练极简实现
- AAAI2025|强烈要求开源!只根据题目和摘要就能预测论文影响力?!
- 有什么技能是研究生必学的?
- Kalman滤波通俗理解和实际应用
- AI顶会AAAI收了一篇论文:没算法没实验,全靠idea思路好…
- ECCV 2024 | 高效频域图像去雨与对比正则化
- C++ 类设计和实现的十大最佳实践
- 涨点神器!100个即插即用缝合模块【合集下载】
- Sora开服被挤爆!支持中文/编剧模式/作品分享
- 一文读懂深度学习中的各种卷积
- 【ECCV 2024】牛津大学提出用于开放词汇分割的扩散模型
- 使用Python+Pycaret进行异常检测(附代码演练)
- 图像卷积与滤波的一些知识点
- 这个顶会idea,我先冲了!
- CVPR’24 超强轻量级Backbone:StarNet,替换其他骨干网络直接涨点!
- 12月2日-8日论文解读汇总
- 基于yolov11的手语检测 | 附数据集+代码
- 基于OpenCV的气体泵扫描仪数字识别系统
- PKINet:比ResNet更适合遥感目标检测的主干网络 | 可替换YOLO的Backbone
- 北理工提出轻量级特征融合EFC,即插即用,小目标检测涨点!
- 使用零样本目标检测识别物体 | 附代码
- 实践教程|基于Yolo算法的AI数钢筋
- 使用YOLO11和霍夫变换追踪站台黄线穿越者
- 优化图像处理中的图像格式:OpenCV中的PNG、JPG和WEBP
- CUDA卷积算子手写详细实现
- 【扩散模型的应用】用于红外小目标检测的基于Diffusion的连续特征表示
- 今年读过最绝的一本LLM书!下载量10w+!看完少走一半弯路
- 使用YOLOv8检测棋盘棋子
- 自动驾驶汽车如何「看到」红绿灯?
- 突破性进展!Med-Former:全新的Transformer医学图像分类架构
- 使用视觉语言模型(VLMs)进行目标检测
- 十种常用的图像压缩算法。
- 245个目标检测开源项目合集,建议收藏!
- YOLO11 实例分割模型做行人分割
- 《自然》子刊实锤:“导师push”对研究生心理健康伤害最大
- 为什么光场相机得不到普及?
- 利用 YOLO11做停车管理
- 医图顶刊 TMI’24 | 通过层次图金字塔Transformer开发几何特征,用于组织病理图像的癌症诊断
- 图像处理之目标检测的入门总结
- 图像分割—基于阈值处理的基本方法
- 不是,T-PAMI迎来了中文版?
- OpenCV基础知识入门
- 综述:图像滤波常用算法实现及原理解析
- 用别的模型权重训练神经网络,改神经元不影响输出:英伟达神奇研究
- 自动帮你完成物体检测标注?这个工具你必须了解一下
- ICRA和IROS为什么只是B和C?
- scikit-learn 的建模万能模板!
- Yolov5移植树莓派实现目标检测
- 我的困惑是:我的同学是博士!
- Masked Mamba: 基于Mamba的病理图像分类的自监督框架
- 神经网络训练过程中不收敛或者训练失败的原因
- 视觉激光雷达信息融合与联合标定(附代码)
- 被导师放养,后果可能很严重。。。
- 大核卷积网络是比 Transformer 更好的教师吗?用ConvNets 对 ConvNets 蒸馏出奇效
- BEVWorld:通过统一的BEV潜在空间实现自动驾驶的多模态世界模型
- 如何通俗理解扩散模型?
- 美国教授痛心:UC伯克利GPA 4.0计算机本科生,毕业即失业?ML博士直呼太卷后悔转行
- 训练效率低?GPU利用率上不去?快来看看别人家的tricks吧~
- 一文让你通俗理解奇异值分解
- 资深院士:研究者一年内发10篇论文,极有可能全是水货
- 发一篇顶会真不难
- 医图论文 Arxiv’24 | CP-UNet: 基于轮廓概率模型的医学图像分割网络
- 14天速成LLM高手!大佬开源学习笔记,GitHub狂揽700星
- 为什么好多研究生都不愿意继续读博士了?
- 为什么美国学生学的数学比我们简单,却能做出很牛逼的东西?
- 某亚迪员工疑惑:这两年来的应届生为什么要离职啊?
- 十大深度学习算法原理的通俗解释
- 前向-前向神经网络训练算法
- 不是,T-PAMI迎来了中文版?
- ECCV 2024 | 卷起来了!AnythingI-MedSAM:基于SAM的隐式医学图像分割
- 在研究所工作是怎样的体验?
- 无人机下的目标检测研究(附论文下载)
- 博士招生 | 约翰霍普金斯大学PENSA实验室Sijia Geng 博士招生
- 【魔改Mamba系列】UU-Mamba:用于图像分割的不确定性感知U-Mamba
- 利用 YOLO11做停车管理
- BT-Unet:医学图像分割的自监督学习框架
- 揭秘Python深度学习最新技术与前沿应用—从Transformer到GAN,掌握AI核心技能
- 【魔改Mamba系列】HC-Mamba:用于医学图像分割的混合卷积技术视觉Mamba
- 详解机器学习中的7种交叉验证方法!
- 一文搞懂梯度下降
- 快速学会登上nature的热门算法,LSTM!
- 招生信息 | 墨尔本大学计算与信息系统学院 Dr. Ting Dang 诚招博士生
- 手把手教你用YOLOv8训练自己的数据集以及YOLOv8的多任务使用
- 手撕自动驾驶算法—无迹卡尔曼滤波
- 博士招生 | 南京大学智能科学与技术学院,范琦老师招收2025年入学的博士生,以及实习生、科研助理
- 【魔改UNet系列】IAUNet:实例感知的U-Net
- 收藏 | 10种顶级聚类算法实现
- 详解基于深度学习的伪装目标检测
- 年薪80w,我入局了
- 【Mamba应用前沿】CAMS: 基于Mamba的无卷积和无注意力的图像分割
- 数字图像基本处理算法小结
- 收藏 | 卷积神经网络压缩方法总结
- 招生信息 | 香港科技大学(广州)丁宁宁教授实验室博士招生
- 十个python图像处理工具
- 实践教程|扩散模型代码复现
- 使用PyTorch进行知识蒸馏的代码示例
- 中文版的TPAMI,你听说过么!
- 招生信息 | 新泽西理工学院计算学院信息学系Dr. Chenxi Yuan 招募博士
- 如何消除摄影中的运动模糊?
- 漂亮,LSTM模型结构的可视化
- 目标检测和感受野的总结和想法
- 目标检测中的框位置优化总结
- 如何看待神经网络的黑箱?
- 如何使用深度学习进行缺陷检测
- 深度学习的图原理
- 饶毅:中国存在大量粗制滥造研究生的问题,很多博士不合格
- 路面语义分割
- 招生信息 | Emory大学计算机科学系Dr. Guo Zhichun实验室博士生招生
- 深度学习中的Normalization你懂了多少?
- 神经网络与傅立叶变换到底有没有关系?
- 从零开始构建DINO模型与PyTorch:自监督视觉transformer
- 涨点神器!100个即插即用缝合模块【合集下载】
- 深度学习最常用的10个激活函数!(数学原理+优缺点)
- 招生信息 | 香港城市大学计算机科学系Dr. Luo Yuhan诚邀加入BiWell实验室
- 实操教程|PyTorch实现断点继续训练
- 又一本开源免费的大模型书来了,449页pdf!
- 有哪些东西是你读博士以后才懂的?
- 图像处理常用算法(基础)
- 少样本学习综述:技术、算法和模型
- 学术 | 热议:寒门硕士要不要继续读博士?
- 怎么才能优雅地向博士导师表达「这周科研没什么进展」?
- 医学影像相关开源数据集资源汇总
- 顶刊解读 TRGS | 位置-时间感知Transformer用于遥感变化检测
- 去他的顶会顶刊!我就想发个论文毕个业!
- 五年之内,博士会像今天的硕士一样井喷吗?
- Gemini 可以进行目标检测了!
- 形象理解二维傅里叶变换
- Halcon和Opencv 的区别
- PyTorch常用代码段合集
- cuda编程:我的第一份cuda代码
- 系统性总结了 Numpy 所有关键知识点!
- 图像特征提取与匹配技术
- EMF-former:一种用于医学图像分割的高效且内存友好的Transformer
- 一位上海交大教授的深度学习五年研究总结
- 软包装锂离子电池的表面凸点缺陷检测
- 长远看算法岗真的比开发岗香吗?
- GASA-UNet:用于医学图像分割的全局轴向自注意力U-Net
- 招生信息 | 香港大学杜泓阳教授团队博士招生
- Python特征重要性分析的9个常用方法
- 245个目标检测开源项目合集,建议收藏!
- 用Windows电脑训练深度学习模型?超详细配置教程来了
- 为什么建议大家使用 Linux 开发?真的很很很优雅!
- 多尺度注意力融合图网络在遥感建筑变化检测中的应用
- 大型视觉语言模型OMG-LLaVA:图像级、目标级和像素级的推理和理解任务统一
- 招生信息 | 香港大学计算机视觉与机器智能实验室(CVMI Lab)博士招生
- PyTorch高频代码段集锦!
- YOLOv5网络结构训练策略详解
- 人工智能全栈系列课,免费公开
- 为什么Python没有main函数?
- 详解Batch Normalization及其反向传播
- CNN和Transformer结合解锁
- 招生信息 | 厦门大学人工智能研究院计算机视觉方向博士招生
- Python中进行特征重要性分析的9个常用方法
- 6 年半亏掉 528 亿的某汤,用裁员开启下一个十年。
- 算法工程师大致是做什么的?
- labelGo:基于 YOLOv5 的辅助标注工具
- 作为审稿人,你什么情况下会选择拒稿?
- 注意力机制是如何学习到模型所应注意的区域的?
- 用不需要手工标注分割的训练数据来进行图像分割
- 轰动视觉领域|ChatGPT完成论文写作、科研应用,数据处理,太方便了…
- YOLO 系列目标检测大合集
- 最全深度学习训练过程可视化工具(附github源码)
- ResNet到底在解决一个什么问题呢?
- 最后机会!2024年剩余EI检索学术会议时间表大揭秘!
- 【魔改UNet系列】ID-UNet: 一种用于红外小目标分割的密集连接UNet架构
- ResNet是否只是一个深度学习的trick?
- Python图像处理:频域滤波降噪和图像增强
AINLP
- 蚂蚁集团全球招募顶尖 AI人才,研发下一代基座模型,探索AGI顶尖课题
- 就用这串“废话”提示词,让刘强东和王兴线下偶遇
- 特征工程、模型结构、AIGC——大模型在推荐系统中的3大落地方向
- 端到端的训练,怎么复现 Deep ReSearch(下) :前沿的产品形态
- 从Math RL初窥LLM推理模型:是怎么work、哪些trick是有效的!
- 重新思考预训练中的反思现象
- 端到端的训练,怎么复现 Deep ReSearch(中) :围绕着”Deep”,解构 Jina 项目的实现
- 知乎热议 | 前几周Deepseek都是神一般的存在,为啥热度消散得这么快?
- 近端策略优化 (PPO) 算法深度解析
- LLM 行业科普和择业建议:选基座or应用?
- 生成式人工智能的后训练与遗忘问题
- 聪明人已经用DeepSeek发一区论文了
- SeekWorld:一张图片知道你在哪?o3-like 7B模型超越一流开闭源模型!
- 【大模型北斗实习】美团大模型研究
- 开源双炸 SkyReels-V2 与 A2 正式登场,“无限时长”让AI视频进入长镜头时代
- 顶会收割机!PINN变种,效率提升3倍!
- 实战教程来了!从零开始打造MCP+Ollama集成
- MCP很好,但安全问题不容忽视,智能体安全框架可以解决
- Agentic 是个谎言,本质还是经典RL
- 浙大联合小红书发布大模型翻译最新研究成果:MT-R1-Zero,强化学习驱动机器翻译新范式!
- Think Twice: 我最好的“作品”永远是下一个
- Reasoning 模型 RL 对齐的实际挑战
- 鲁棒音频-视觉问答新进展!西安交大、港科广提出全新测评数据集FortisAVQA与多模态大模型MAVEN助力鲁棒音视频问答
- OlymMATH: 奥林匹克级双语数学基准,R1 正确率仅为 21.2%
- OpenAI姚顺雨:欢迎来到AI下半场!
- AI封神了!无剪辑一次直出60秒《猫和老鼠》片段,全网百万人围观
- Agent完全手册(零):三大模块,三个理念
- 阿里巴巴通义实验室招聘实习生 / 25 届校招 / 社招
- Synthetic-Data-Zero-RL:让 RL 左脚踩右脚
- 基模型Cognitive Behaviors对RL的影响
- 南京大学FinTech课题组招募大模型AI4Finance国际联培博士生
- DeepSeek 推理引擎开源之路
- 字节Seed-Thinking-v1.5技术报告英中对照版.pdf
- 北京/杭州 | 阿里通义实验室招聘LLM多轮对话方向研究实习生
- 聊聊 LLM 推理引擎中,那些已经成为事实标准的优化方法
- Kimi-VL技术报告英中对照版
- 端到端的训练,怎么复现 Deep ReSearch(上) :先从 Deep Search 做起
- 《DeepSeek知识库》来了!!!
- Llama 4技术全景与代码解读:MoE架构革新、10M上下文突破
- 25年什么样的 Agent 会脱颖而出:简单胜于复杂
- Llama 4训练作弊爆出惊天丑闻!AI大佬愤而辞职,代码实测崩盘全网炸锅
- 如何看待MCP?大模型工具调用的解耦!
- 阿里巴巴校招&实习
- 《大模型基础》教材发布,开源!
- 各种角度全面聊聊Llama 4~
- 关于The Bitter Lesson
- 25岁当上985博导,冯磊现任东南大学教授!
- 连续尝试了18种RAG技术之后,我找到了最优的那个
- 利用多张 GPU 训练大型语言模型——从零开始介绍 DeepSpeed、Liger Kernel等
- 李宏毅: 大型语言模型训练方法“预训练–对齐” 的强大与极限
- 基于飞桨框架3.0单机部署 DeepSeek R1 实战
- 关于深度思考的一些深度思考:Deepseek官网深度思考模型,真的是DeepSeek-R1吗?
- 李宏毅:Transformer的时代要结束了吗?Transformer的竞争者们
- 中国科大认知全重实验室发布Agent-R1训练框架,支持自主思考与工具调用!
- R1 的一些认知:4 个经典误区
- 体育教师发Nature遭质疑,校方发文称“零的突破”引争议!全篇不到200个单词。。。
- 字节 DAPO 技术报告有感!大模型 RL 细节为王
- 从代码和公式角度理解 DeepSeek MLA 的矩阵吸收 (Projection Absorption)
- 要我怎么做你才能不想那么多?LLM!
- 批判性视角看待 R1 训练(基础模型和强化学习)中的坑
- R1复现小记:在业务场景的两类NLP任务上有显著效果
- LLM Agent在方法、应用和挑战全面综述!
- 腾讯优图实验室(上海)大语言模型2026年应届实习生招聘
- Qwen最近很活跃啊!
- 基于人类反馈的强化学习(RLHF)深度解析
- 从零开始的大模型强化学习框架verl解析
- 浅谈VC-PPO 与 DAPO
- DeepSeek-V3 模型更新,各项能力全面进阶
- Qwen和DeepSeek撞车!!
- 被放养的博士能靠自己毕业嘛?
- DeepSeek SFT 微调:基于法律问答的模型优化实践
- prompt压缩,还能这么干
- 大语言模型真的擅长逻辑推理吗
- 深入解析MCP
- prompt那么长,能不能压缩一下?
- 【校招&实习】同花顺AIME计划 寻找AI领域最顶尖的你
- 尝试基于小模型(0.5B)复现DeepSeek-R1的思维链
- 三万八千八,DeepSeek带回家
- 类 DeepSeek-R1 模型的复现方法与相关研究
- 【北京中关村人工智能研究院】强化学习实习生
- 全景解读 LLM Posting-Train(后训练)技术
- 【search-o1】大模型的推理
- 结合代码聊聊FlashAttentionV3前向过程的原理
- 何恺明联手LeCun改进Transformer!成功去掉归一化层!中稿CVPR 2025
- DeepSeek-R1关键创新技术再总结
- 文字也能打水印?LLM水印是个啥?
- 阿里通义实验室RAG团队研究实习生招聘
- 李宏毅:AI的脑科学-大型语言模型内部运作机制剖析
- 吃瓜DeepSeek推理成本需要的相关概念:Throughput、TPOT、TTFT
- Manus和openai都在GAIA上瞎搞….
- 【实习】AI算法实习生-字节番茄-筋斗云人才计划
- 通俗易懂!大模型强化学习 RL入门
- Zero-Rl复现的几个比较关键的问题
- 什么是超级对齐 (Super Alignment)
- 上海人工智能实验室招聘大模型和多智能方向实习生
- 理解LLM infra中的一些基本概念:PP、TP、DP、ZeRO
- 强化学习重要知识点梳理
- 关于Deepseek采用EP推理方式的一些思考
- 京东大模型研究型实习生招聘
- Google 发布多模态开源模型 Gemma 3:性能与功能全面升级,附技术报告英中对照版
- Light-R1:从零复现满血版DeepSeek-R1!全面开源!
- 32b R1-Zero复现,聚焦scaling
- 腾讯混元招聘AIGC-3D应用研究实习生
- OpenAI发布了一套AI Agents构建工具
- 李宏毅一堂课搞懂AI Agent的原理
- 从YOLOv5到YOLO11!改进有多大?
- R1复现实验:拒绝采样微调加速RL收敛及模型遗忘问题探究
- 从OpenManus看到底什么是Agent
- 李宏毅一节课带你了解生成式人工智能的技术突破与未来发展
- 黄仁勋预言成真!!!
- DeepSeek大模型原创核心技术解读
- 推理大模型的后训练增强技术-指令微调篇,如何用指令微调提升推理能力?
- 【实习】字节番茄 2026届多模态实习生
- 用极小模型复现R1思维链的失败感悟
- 推理大模型的后训练增强技术-预训练篇
- 百川智能算法实习生招聘
- DeepSeek资源大全
- 一站式理清deepseek新注意力机制NSA!梁文峰亲自参与!!
- 关于DeepSeek V3/R1 Decoding吞吐极限的估计
- Qwen开源QwQ-32B,“小”模型性能比肩DeepSeek-R1,RL的魅力
- 美团开源首发INT8无损满血版DeepSeek R1
- 细节之王 Kimi K1.5,大模型算法工程师复现推理模型必读文章之一
- WWW2025面向多模态RAG的文档检索挑战赛
- 阿里QwQ-32B开源了!
- 刚刚,2024图灵奖颁给了强化学习之父Richard Sutton与导师Andrew Barto
- 《DeepSeek知识库》来了!!
- HuggingFace 手把手教你构建DeepSeek-R1推理模型!
- Deepseek-R1-Zero复现实验细节
- 李国杰院士“七问”DeepSeek
- DeepSeek-V3技术报告英中对照版
- Long-VITA:突破百万Tokens限制!开源多模态大模型新标杆
- 又一本开源免费的大模型书来了,449页pdf!
- 自顶向下的方式深度解读 DeepSeek-R1 Paper,内含大量细节
- 大模型推理过程与显存占用
- One More Thing带来的震撼
- DeepSeek 第6弹:重磅揭秘—DeepSeek-V3/R1推理系统解析
- DeepSeek“第6弹”:DeepSeek-V3 / R1 推理系统概览
- DeepSeek-R1 解读及技术报告中文版
- DeepSeek,又杀疯了!
- 面试官让我讲一下DeepSeek-VL2的细节
- R1爆火之后,思考到底什么任务适合用RL做?
- Deepseek 第五弹:绝杀
- Deepseek 第四弹:王炸
- CVPR2025结果出炉!这些方向杀疯了!
- 清华开源KTransformers-让24GB显卡流畅运行满血DeepSeek-R1
- Llama-index 搭建合同条款审查系统
- MTEB 2.0升级有感–新世界的船,载不了旧时代的残党
- 长链推理相关论文速览
- DeepSeek-R2曝5月前上线!第三弹DeepGEMM 300行代码暴击专家优化内核
- SimpleVQA揭秘事实性问答新基准:对于看图问答,多模态大模型仍然任重道远!!!
- NExtLong|不使用长文档也能训练出来SOTA长文大模型!
- 首届XLLM Workshop @ ACL 2025 征稿和公开任务
- Deepseek第三弹:DeepGEMM
- 从零开始绘制DeepSeek R1架构和训练流程
- Deepseek NSA 技术报告中英对照版
- 通义千问发布深度推理模型QwQ-Max-Preview
- DeepSeek开源周 Day01:从FlashMLA背后原理回顾KV Cache
- DeepSeek开源周 Day02:从DeepEP开源趋势重新审视大模型Infra
- Deepseek 第二弹:DeepEP
- Deepseek开源盛宴第一天:FlashMLA
- Grok3 DeepSearch深度体验:Agent就是Reasoning Model
- DeepSeek R1 最新全面综述,近两个月的深度思考!
- 女朋友问我Qwen2.5-1M为什么那么长,我这么解释
- AI 艺术工具通讯
- DeepSeek R1 最新复现项目汇总
- Qwen2.5-VL 技术报告英中对照版
- 清华刘知远教授解读 DeepSeek:大模型强化学习技术原理与大模型技术发展研判
- 梁文锋和杨植麟,论文撞车了!!
- 张俊林:Grok 3是否意味着大力出奇迹的大模型法则仍然成立?
- 下一个爆火赛道,两个破局关键拿笔记好!
- 在DeepSeek刷到‘学术孤儿’破防了!!
- 刚刚,DeepSeek放出重磅论文!梁文锋亲自参与!
- 硬件对齐+原生训练!DeepSeek NSA打造高效稀疏Attention
- 清华《DeepSeek:从入门到精通》干货分享!104页!
- 大语言模型简史:从Transformer(2017)到DeepSeek-R1(2025)的进化之路
- 开源中文DeepSeek-R1(满血)蒸馏数据集-110K
- 聊一聊Reasoning Model的精巧实现:ReFT, Kimi K1.5和DeepSeek R1
- ICLR2025 | OCEAN:离线多步推理评估与对齐,为大型语言模型带来全新突破
- LLM MOE进化之路,从普通MOE到Sparse MOE 到 deepseek share_expert Sparse MOE
- 被微信灰度r1了,问了一个问题
- 微信接入满血版DeepSeek!你被灰度了吗?
- DeepSeek这个大好人,官方公布的他们的系统提示词,让全网都能体验最佳效果
- DeepSeek 背后的数学原理:深入探究群体相对策略优化 (GRPO)
- Qwen架构改造成Deepseek,再复现R1计划
- AgentStore:迈向通专融合的自动化计算机助手
- 深入了解Deepseek模型的最佳三篇论文
- DeepSeek-R1复现方案梳理
- DeepSeek最大的贡献是什么?
- EMNLP 2025 征稿通知
- R1类模型推理能力评测手把手实战
- 昇腾 910B 部署满血 DeepSeek-R1
- 大模型实践 | 卡比人贵时代的大模型经验
- 三张图速通 DeepSeek-R1 论文和技术原理
- 4500美元复刻DeepSeek神话,1.5B战胜o1-preview只用RL!训练细节全公开
- 张俊林:S型智能增长曲线-从Deepseek R1看Scaling Law的未来
- 为什么 LLMs 在 OCR 任务中表现不佳
- DeepSeek爆火,留给普通人的时间不多了
- Deepseek-R1-Zero成功复现, 见证Aha Moment!
- DeepSeek R1爆火后,该如何理解 LLM 中的 RL 算法?
- 谷歌DeepMind发布AG2:开启AI4Math下一代范式?
- 如何构建和优化推理型大模型?DeepSeek R1的启示
- 用通俗的方式给奶奶解释 DeepSeek R1
- 免费无限次!671B满血版DeepSeek R1 隐藏入口,带联网搜索+图片+文档对话,速度起飞
- Deepseek R1 Zero成功复现, 三阶段RL,Response长度涨幅超50%,涌现语言混杂,double-check
- DeepSeek-R1技术大揭秘:论文核心原理拆解与模型性能突破关键
- 清华刘知远教授解读 DeepSeek:大模型强化学习技术原理与大模型技术发展研判
- DeepSeek-R1大模型本地部署的三种方式,总有一种适合你
- DeepSeek-R1复现方案解读之「Open-R1」
- 部署满血DeepSeek R1的避坑指南-vLLM 0.7.1
- DeepSeek R1 671B 完整版本地部署教程来了!!!
- DeepSeek-V3细节探索
- 一文玩转本地化部署DeepSeek!
- 迈向GPT-4o,多模态大模型杀回来了!
- 深度求索DeepSeek-R1详解
- 收到Deepspeed关于zero3实现差异的回复
- Jay Alammar:图解DeepSeek-R1
- 春节快乐!蛇年红包~~~~~~~~~~~~~~~~~~~~~封面来了
- DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿
- Open-R1: DeepSeek-R1 大模型开源复现计划
- 探索一个关于deepspeed zero3的认知误区
- Kimi k1.5上线喽,我把2025年“南外杯”数学竞赛题甩给了它。。。
- 谈谈对DeepSeek-R1的一些理解
- Kimi k1.5 解读及技术报告中文版
- Deepseek-R1 & Kimi-1.5读后有感 | 大道至简的o1
- DeepSeek-R1 解读及技术报告中文版
- 张俊林:MCST树搜索会是复刻OpenAI O1/O3的有效方法吗
- DeepSeek-R1技术报告速读
- 多模态入门–InternVL系列
- 李飞飞:AI 智能体必将在2025年爆发。。。
- LLM Agent和 Agentic RAG 的最佳综述
- 从”速答”到”深思”:揭秘rStar-Math如何追平o1
- SwiftKV:让大模型推理更快、吞吐量更大!
- 大模型由”社恐”变身”懂王”的迷之自信从何而来?
- WebWalker: 大模型乘风破浪,探索网页深海
- 再读MLA,还有多少细节是你不知道的
- Agent的亲身经历,从开始到放弃
- MiniMax-01终于成了!
- 大模型数学推理数据合成相关方法
- MiniMax-01 与 DeepSeek-V3 对比
- Nvlink对大模型推理的速度有多大提升?
- RAG 切块Chunk技术总结与分块实现思路分享
- 手写大模型组件之Group Query Attention,从 MHA,MQA 到 GQA
- 这才是智能体的高级玩法:人类社会的模拟
- 特供版RTX 5090D被曝不能「炼丹」!AI算力3秒锁死,不支持多GPU配置
- 文末赠书!“西瓜书”《机器学习》官方配套习题集重磅出版
- 多模态入门–CogVLM,VILA,MM1,MM1.5和Pixtral-12B
- 【多模态&LLM】Reyes:一个从0到1开始训练的多模态大模型(技术报告)
- 从“说”到“做”:大语言模型为何会进化成智能体
- 刚刚,智谱被美国列入实体清单
- 中科院化学所宋延林组火了
- 2024 年度总结 LLM System Research:过去半年的科研心路历程
- 你的RAG出错了?快来Get这份改进秘籍
- 实测书生系列开源的最新模型-InternLM3-8B
- 【文档智能】轻量级级表格识别算法模型-SLANet
- 用LLM做文本分类,微调选base还是chat
- DeepSeek-V3:开源模型的里程碑 - 从671B参数到全面领先的实力
- 千问又开源啦,开源过程奖励模型-Qwen2.5-Math-PRM
- 免费下载|火爆AI圈的深度学习 “四大名著”
- RLHF 常见的思维误区
- LoRA 的原理和用 PyTorch 从零到一的代码实现
- 【文档智能 & RAG】RAG增强之路:增强PDF解析并结构化技术路线方案及思路
- CCF对话式检索增强生成Top1赛后方案
- 复旦首发“AI禁令”:禁止在论文关键环节使用AI工具
- 【文末赠书】大模型在生产制造场景的3个实际落地方案
- 5万字长文全面解读GUI Agent的前世今生
- 【多模态&LLM】LLaVA系列算法架构演进:LLaVA(1.0->1.5->Next(1.6)->NeXT(Video))
- 手写 transformer decoder(Causal LM)
- Corex: 通过多模型协作增强推理能力
- 分块的艺术:提升 RAG 效果的关键
- o1类大模型的过度思考: 2+3=?
- 生成式推荐最新进展
- PyTorch 实现 Multi-Head Self-Attention
- 突发!美国AI芯片限制最后一刀!英伟达AMD全球禁运,只配5万块
- 老婆饼里没有老婆,RLHF里也没有真正的RL
- 关于RAG你不得不了解的17个技巧
- Search-o1:赋予推理模型主动搜索的能力
- 增强大模型的推理能力:从思维链到连续思维链(中)
- 阿里通义等提出Chronos:搜索智能体技术助力新闻时间线总结
- Github揽获1.6K星!南大、腾讯发布VITA-1.5: 迈向GPT-4o级实时视频-语音交互
- 从ROPE到Yarn, 一条通用公式速通长文本大模型中的位置编码
- 增强大模型的推理能力:从思维链到连续思维链(上)
- 千问LLM:在家也能养“大脑”:本地运行大型语言模型的奇妙之旅
- 计算DeepSeekV3训练的MFU
- deepseek v3训推优化的剖析
- 如何让 RLHF 训练更稳定?
- 向量模型的词序感知缺陷与优化策略
- 1999美元!RTX5090发布
- 2024年RAG:回顾与展望
- Baichuan Alignment Technical Report 论文精读
- 工作近五年,谈谈各类公司和部门的区别
- [vLLM vs TensorRT-LLM] :系统调度schedule比较
- 千问LLM之LLM的特工行动:工具召唤功能实战案例?Agent 到底是什么?
- 从infra的视角聊聊DeepSeek-V3
- 文末赠书 | 技术人的年末书单,这10本最受欢迎!
- 图解Megatron TP中的计算通信overlap
- 曾经火热的Graph Embedding和GNN在推荐系统上还有前途吗?
- 千问LLM:什么是 Sharding? 之ZeRO 优化(Zero Redundancy Optimizer)
- 谷歌41岁天才科学家SuperGLUE之父英年早逝!两月前留下绝笔:从事大模型研究让我深陷抑郁!
- 评价deepseek v3:又一个相信自己比英伟达懂GPU计算并做到了的团队
- 手写self-attention的四重境界 self-attention
- 微软公布OpenAI闭源模型参数!4o-mini 8B!
- LLM 预训练到头了吗?
- DeepSeek-V3技术报告解读
- Deepseek V3 预训练策略解读
- 长文 | 大模型Post-Training总结
- 2024年大模型总结与展望(技术下篇)
- 一本醍醐灌顶的「大语言模型提示工程」教科书,熬夜读完
- OpenAI-o3 与 Monte-Carlo 思想
- o1-Coder:代码领域的OpenAI o1模型复现
- DeepSeekV3带火大模型infra,入门看这篇就够了!
- 《大语言模型》:人工智能时代的知识盛宴,大模型中文书籍震撼发售!
- 5个开源RAG框架对比
- 【多模态&文档智能】OCR-free感知多模态大模型技术链路及训练数据细节
- 千问LLM:什么是 Sharding? 之数据并行(Data Parallelism)
- 硬核!实现千亿模型训推全流程的LLM开发利器!
- 我与vLLM的2024:清华大佬的vLLM开发之路
- Qwen2.5技术报告解读:18万亿token训练
- 精读DeepSeek v3技术文档的Tech&Soul Seek
- Building effective agents笔记
- RAG最新进展FlashRag! 复杂场景下高效开发与评测RAG框架FlashRAG-Paddle
- 雷军挖了个95后AI天才少女做大模型,开出千万年薪!
- 万字长文梳理 2024 年的 RAG
- 一文带你全面了解 RAG 核心组件
- 千问LLM:AI界的“节食”计划
- 大模型存储效率太低,占用空间太大?推荐一个开源神器!
- 大模型的基本功
- 深度学习工作:从追求 SoTA 到揭示新现象
- 【LLM模型微调】LLMs-PEFT[微调]-QLoRA总结笔记v6.0
- 75k,确实可以封神了!
- DeepSeek-V3发布:编程能力超过 Claude Sonnet 3.5!
- 2024年大模型总结与展望(技术上篇)
- 让Agent”少说废话”!打造高效的LLM多智能体系统
- Scaling Test-Time Compute:向量模型上的思维链
- 全是细节|大模型SFT的100个关键点
- Qwen2.5 论文精读
- 技术人该积累什么,才能避免被AI淘汰?
- 右脑科技招聘AIGC算法实习生
- 多模态RAG杀疯了!!
- LLM 又一年!!!
- LLAMA3 论文精读
- o1复现的一点点心得
- 类O1复现项目数据和模型开源啦
- 推理模型专题 | 开源类O1:Marco-o1技术全面解读
- EMNLP顶会最佳论文解读!
- LLM训练全细节 | 如何从零到一进行 pretrain 工作
- RevThink: “逆向思维”助力每一个LLM梦想
- 一局定乾坤!主流O1模型,究竟谁才是地表最强王者?实测对比揭开三足鼎立局面!
- 从近100场大模型比赛看大模型关注热点
- Qwen2.5技术报告解读
- 对OpenAI o3模型的看法、思考与反思
- Qwen 2.5 技术报告发布!其中有什么秘密?
- 我国退步最快的985大学?曾位列全国前十,如今排名连年下降…
- 像教女朋友一样教你用 Cuda 实现 PyTorch 算子
- 通义实验室招聘大模型算法专家
- 现代LLM基本技术整理
- 【LLM训练系列01】Qlora如何加载、训练、合并大模型
- 知乎大佬解析Ilya最新言论:pre-train丸啦,搞agentic和reasoning吧
- 大模型Infra王朝2024
- NAACL2025研讨会征稿 | 主题:自然语言处理中的跨文化研究
- 机器推理的突破?田渊栋团队的关于增强大模型推理能力的热门论文
- 模拟世界!OpenAI 王炸来袭!
- The Bitter Lesson(苦涩的教训)
- 【从零训练Steel-LLM】模型设计
- 千问LLM:LLM的解码都有哪些方式?
- NeurIPS2024,LLM-Multi Agent 依旧火爆!
- 工业界主流大语言模型后训练(Post-Training)技术总结
- 图解OpenRLHF中基于Ray的分布式训练流程
- 模仿、探索与自我提升:类 o1 慢思考推理系统的复现之路
- 【LLM模型微调】LLMs-微调经验-SFT总结v9.0
- 聊聊对强化微调(RFT)的理解及看法
- 雷军大学时候的论文,不需要参考文献
- 清华大学刘知远团队新作《AI群星闪耀时》,文末赠书!
- NeurIPS 2024 | MIT学者歧视国人!
- 千问LLM:什么是Postion Encoding?
- NeurIPS神仙打架:李飞飞180页PPT谈视觉智能,Bengio同OpenAI员工吵架,何恺明谈AI宿命论
- Ilya NeurIPS 2024演讲视频及全文:预训练即将终结,接下来将是超级智能-代理、推理、理解和自我意识
- 阿里、中科院等发布CodeArena: 基于人类偏好的代码大模型评估与对齐
- 吴恩达主题演讲:前瞻AI AGENTS,颠覆未来想象
- Idea也能自动生成?| 浙大阿里联合提出科研Ideas自动生成工具SciPIP
- EMNLP 2024 | 大模型对齐中的低冗余优化
- 千问LLM:什么是Pre-LayerNorm 和 Post-LayerNorm ?
- 英伟达被立案调查
- 别吹Sora了,实测一言难尽。甚至分不清人脸和猪??
- 让大模型自我进化成理科优等生
- NLP入门必读—复旦大学《自然语言处理导论》PDF
- 傻傻分不清?一文彻底说清Agentic RAG的前世今生!
- Huggingface 大模型的下载与上传
- google search: 用emb模型做个性化语言prompt
- 华为IDLE-Adapter:LLM融合稀疏ID完成推荐任务
- OpenAI发布强化微调技术,SFT退出历史舞台?
- PyTorch显存优化小技巧——Gradient Checkpointing | 文末赠书
- LLM不会CoT隐性推理,只会显性推理!
- 【重磅】2025年IEEE Fellow出炉! 300多位新晋升会士!国内多名学者当选!
- 本科生大作业给8分,iclr评审机制的失灵?
- 千问LLM:三大AI助手的“奇葩说”:ChatGPT、KiMi和Claude的对决
- vllm 中量化模型的推理速度对比
- 太戏剧了!被字节索赔800万实习生,拿下NeurIPS 2024最佳论文
- 准确性超Moshi和GLM-4-Voice!端到端语音双工模型Freeze-Omni
- 一文梳理工业界大模型推荐落地经验
- 【腾讯游戏——自然语言处理方向实习生招聘】
- 谷歌 Gemini 2.0 曝光,挑战 GPT-4o!
- 多模态入门(三)–MiniGPT4,DeepSeekVL,InternVL系列和QwenVL系列
- 理想汽车招聘大模型算法实习生
- 一位阿里P9的年薪和家庭资产
- 写给小白的大模型应用科普:RAG篇
- 瞎聊: SFT模型为何不如Pretrain模型
- 多模态入门(二)–Flamingo,LLaVA系列和BLIP系列
- EMNLP 2024 | 大模型对齐中的低冗余优化
- 字节诉前实习生恶意攻击大模型训练,索赔800万元,律师:法院判决可能会远低于此
- 【从零训练Steel-LLM】预训练代码讲解、改进与测试
- 该来的还是会来,Qwen团队开源推理大模型-QwQ!!!
- 【秘塔科技】招聘【NLP算法工程师】
- OLMo2全开源LLM,含数据、代码和训练过程
- EMNLP 2024 | 当生成对抗网络遇到序列标记挑战
- 【从零训练Steel-LLM】预训练数据收集与处理
- 多模态大模型MLLM的架构发展及思考
- 来自对Meta FAIR田渊栋:符号和神经网络推理融合与统一的思考
- 超自然对话语音合成数据集NCSSD现已开放下载!
- 开源!Transformers 快速入门书
- 万字长文,大模型分布式训练的学习过程总结
- 阿里Marco-o1推理大模型技术报告解读
- 投机解码中高质量draft tokens不该被拒绝
- 凑个热闹,测试一波DeepSeek新上的o1推理模型
- 特朗普上台,第一刀再次扎在了留学生身上。。。
- 探索 OpenAI O1 模型复现:从 Kimi K0-Math 到 DeepSeek R1 Lite
- 阿里云大语言模型算法研究实习生(base杭州,可直通秋招转正)
- LLM实践系列-详聊OpenRLHF中的各种Loss
- ICLR 2025 多语言大模型相关论文速览
- 深挖:埃隆·马斯克与OpenAI 分手内幕
- 王者归来!白皮书《从头训练大模型最佳实践》开源了。。。
- FlashAttention 系列技术详解:加速大模型训练的利器
- 深度求索DeepSeek 系统方向核心研发岗位招募
- 对话语音合成大模型GPT-Talker: Generative Expressive CSS
- 大模型也有侧脑?揭秘WISE如何带来终生学习新突破
- 打破多模态检索的瓶颈,OmniSearch实现智能动态规划!
- 大模型中上分技巧大总结!!
- 最值得参加的LLM盛会!多模态/Agent/具身智能/安全/评估等15个论坛!早鸟注册最后一天
- 2万字洞察Scaling Law的”终结”or”新起点”?——开源实践者的深度思考
- 训练数据合成(二)
- 突破长度偏差:Meta AI的LIFT方法让大语言模型更懂分寸
- 校长书记双院士!教育部副部长,任C9党委书记!
- 【文末赠书】专补大模型短板的RAG入门与实战书来了!
- 人人都能看懂的RL-PPO理论知识
- 语言模型之text embedding(实战篇)
- 2024时序预测都有哪些经典工作——总结篇
- 个人从零预训练1B LLM心路历程
- 开放注册|中国中文信息学会2024学术年会暨第三届全国大模型智能生成大会(CIPS-LMG2024)
- 字节跳动生活服务招算法实习生
- 「深度」学习计算广告,我为什么从推荐系统转向计算广告?
- 北航&清华提出LBPE切词优化LLM
- 今年顶会这情况。。。大家提前做准备吧!
- SFT洗数据,有多少细节?
- 对于Ilya当下Scaling law瓶颈观的思考
- 苹果发布Ferret-UI 2: 跨平台UI理解多模态大模型(精炼版)
- 模型解释新方向!浙大揭秘LLM隐层之间的知识流动!
- LSTM再升级!xLSTM杀入大模型,连超Transformer和Mamba
- LLaMA系列一直在假装开源…
- 代码大模型(二)–OpenCoder
- AI回答,不止于文字!阿里OmniSearch与传统的一场检索较量
- 【RAG】浅看引入智能信息助理提升大模型处理复杂推理任务的潜力-AssisTRAG
- 免费白皮书《从头训练大模型最佳实践》
- 写的真好,万字长文串烧LLM大模型技术原理
- 阿里巴巴通义实验室招聘日常实习生:Qwen的RAG方向相关技术研究与落地
- UI Agents(智能体)技术综述
- EMNLP 2024 | Better Call SAUL: 通过生成正则化实现流畅一致的语言模型编辑
- 北大韦东奕上课照片走红,板书潇洒,新发型吸睛,网友:这要打脸多少“只会翻PPT”的老师?
- [实习|社招] 百图生科-多模态大模型
- 万字长文细说腾讯发布史上最大开源Moe:Hunyuan-Large(详解版,建议收藏)
- 大模型量化技术原理:KIVI、IntactKV、KVQuant
- EMNLP2024 | 解锁Apple Intelligence:用AppBench一键评测你的手机智能
- OpenAI华人VP翁荔离职:北大校友,掌管安全,最近B站分享被热议
- 【文末赠书】4种革新性AI Agent工作流设计模式全解析
- 训练数据合成(一)
- LoRA与全微调:等价幻觉
- 从虚构到现实!FAME助力模型编辑走向实际应用
- LD-DPO:基于DPO的长度脱敏偏好优化算法
- LLM实践系列—大模型的拒绝采样2
- 腾讯TEG招聘:机器学习平台高级算法研究员-大模型应用
- 答案搜索生成引擎现阶段局限性思考
- 告别随机采样!PRS:一种简单高效的数据采样新方法
- 突发!ETH官宣制裁中国学生,国防七子、中科大、川大、北邮等高校均在名单内。。。
- Qwen2.5 全链路模型体验、下载、推理、微调、部署实战!
- 图解大模型训练系列:序列并行4,Megatron Context Parallel
- 遇上博大精深的中华文化,多模态大模型还能行吗?
- LLM之RAG实战(四十七)| GraphRAG:使用知识图谱改进 RAG 检索策略
- 大模型 vs 搜广推?算法工程师们应该如何选择职业方向?
- 图解大模型训练系列:序列并行3,Ring Attention
- 阿里通义实验室LLM实习生招聘
- 从鼠标点击到自然语言:LLM based 文件管理系统怎么样
- 实测腾讯开源的Hunyuan-Large大模型,感觉。。。
- 大模型经典著作《大语言模型基础与前沿》
- FlashAttention算法之美:极简推导版
- 图解大模型训练系列:序列并行2,DeepSpeed Ulysses
- 万字长文细说端侧大模型进展(综述)
- 【RAG】R²AG:将检索信息融入RAG,提升问答系统准确性
- 姜萍事件尘埃落定!阿里数赛出结果。。。
- 导师:自己每天科研工作近10小时,都觉得不够。研究生们,每天工作不够5小时,拿什么去竞争?
- 【文末赠书】豆瓣9.9分,几乎无差评,深度学习神作“鱼书”系列第四弹强化学习来了!
- 图解大模型训练系列:序列并行1,Megatron SP
- LLM实践系列-细聊LLM的拒绝采样
- 大模型推理优化技术-KV Cache量化
- 又一院士被“除名”!院士终生制,没了?
- 一文看完多模态:从视觉表征到多模态大模型
- 一网打尽长文本训练技术
- 大模型时代的对话分析:阿里最新综述全面解析对话分析的必要性
- 【校招-应届生|阿里健康】NLP-商品理解方向
- 突破数据合成scaling瓶颈!7B模型可以赶超GPT4-Turbo
- 面向中文有害表情包(meme)的综合性检测
包包算法笔记
- 不微调、不蒸馏、不掉分解决R1思维链过长
- LLM 行业科普和择业建议:选基座or应用?
- RL x LLM 时代:通向 AGI 的四层阶梯
- RL祖师爷:欢迎来到智能新时代、RLHF将被扫进垃圾堆
- Agentic 是个谎言,本质还是经典RL
- OpenAI姚顺雨:欢迎来到AI下半场!
- 不服跑个分,全球最快推理模型,GLM-Z1-Air系列震撼发布
- 字节Seed-Thinking-v1.5技术报告解读
- 25至30年中国互联网预测——大厂离死亡或仅24个月,个人何去何从
- LLama4震撼发布:288B、原生多模态、超越 GPT-4.5、Claude 3.7 、Gemini 2.0 Pro
- 垂直大模型和workflow是伪命题、是在逆AGI大势开倒车
- AI Agent 新探索:构建 AI 原生团队,使能 AI 员工
- R1 的一些认知:4 个经典误区
- 批判性看待R1训练(基础模型和强化学习)中的坑
- 50+位产学研嘉宾揭晓!中国生成式AI大会下周举行,全方位解构DeepSeek及应用、AI Infra与AI智能体
- 字节 DAPO 技术报告有感!大模型 RL 细节为王
- 从零开始的大模型强化学习框架verl解析
- 为何说 “在国内做科研,最忌讳踏实”?
- 万字长文总结多模态大模型后训练
- 只写prompt救不了Agent
- 全景解读 LLM Posting-Train(后训练)技术
- 第一批抓住DeepSeek风口的研究生已经论文自由了。。。
- 深度解读大规模深度强化学习的算法优化:Policy Gradient、PPO及PPG
- 为什么GRPO训练开始时,Loss函数为0,并且不降反增?
- 结合代码聊聊FlashAttentionV3前向过程的原理
- 离谱!裁员裁出新高度了。。。
- 7B小模型用规则奖励RL学会玩数独!
- Manus和openai都在GAIA上瞎搞….
- 尝试基于0.5B小模型复现DeepSeek-R1的思维链
- 关于Deepseek采用EP推理方式的一些思考
- 吃瓜DeepSeek推理成本需要的相关概念:Throughput、TPOT、TTFT
- 对于manus,我的观点是打个问号
- 从DeepSeek V3开源趋势重新审视大模型Infra
- 从DeepSeek V3看FP8训练的挑战
- 媲美满血R1+,阿里推理模型QwQ-32B开源
- 用极小模型复现R1思维链的失败感悟
- 关于DeepSeek V3/R1 Decoding吞吐极限的估计
- DeepSeek开源第五弹终结篇-3FS文件系统
- DeepSeek开源第四弹 DualPipe双向流水线并行
- deepseek开源第三弹 DeepGEMM
- Deepseek开源第二弹EP 通信库
- DeepSeek开源FlashMLA评测,性能大幅提升
- 实测文心智能体平台满血版 DeepSeek R1 效果
- 开源社区 DeepSeek R1 最新复现进展汇总
- DeepSeek对大模型算法工程师的影响
- X-R1: 3B中文推理开源, 支持LoRA训练
- 张俊林:从Grok 3看Scaling Law已死?
- ACL 2025投稿量冲击12000!如何9h打通顶会壁垒!
- Qwen魔改为DeepSeek,再复现R1
- 从 DeepSeek R1 论文深入理解推理型大模型
- X-R1: 不到50元,人人都能复现0.5B Aha Moment
- 复现DeepSeek Zero的RL调参经验
- 刘知远:DeepSeek揭示OpenAI傲慢之罪
- Deepseek R1 Zero复现全过程记录
- DeepSeek实习感受与大模型择业思考
- 张俊林:MCST树搜索会是复刻OpenAI O1/O3的有效方法吗
- DeepSeek-R1技术报告速读
- Kimi 1.5 技术报告解读
- MiniMax-01 与 DeepSeek-V3 对比
- 美商务部认证的大模型初创…智谱
- DeepSeekV3如何一次性预测多个token
- Nvlink对大模型推理的速度有多大提升?
- 图解OpenRLHF中基于Ray的分布式训练流程
- 微软开源大模型Phi-4技术报告解读
- 用LLM做文本分类,微调选base还是chat
- 大模型infra实战|上百个Lora动态部署
- deepseek v3训推优化的剖析
- 大模型Post-Training总结
- 计算DeepSeekV3训练的MFU
- Sam Altman的2024年终总结
- DeepSeek-V3技术报告完整解读
- 从infra的视角聊聊DeepSeek-V3
- Deepseek V3 预训练策略解读
- 智谱zero推理大模型,2024压轴发布!
- 谈谈DeepSeek-v3提到的基础设施演进
- DeepSeekV3带火大模型infra,入门看这篇就够了!
- DeepSeek-V3即将开源
- 多模态大模型GLM-4V-Flash,免费了!
- o1复现的一点点心得
- 如何从零到一做大模型pretrain
- 对OpenAI o3模型的看法、思考与反思
- Qwen2.5技术报告解读
- OpenAI o3真正的推理scaling,开启AGI新时代,12天的one more thing
- Qwen视觉推理大模型QvQ-72B即将发布?
- 谷歌用大模型搞推荐,拿到收益了
- 2024年大模型后训练(post-training)总结
- 复旦大学:RAG最佳实践
- 讯飞星火,改写大模型生态
- OpenAI发布强化微调技术,SFT退出历史舞台
- 端到端多模态原生大模型思考
- OLMo2全开源LLM,含数据、代码和训练过程
- 快手用大模型搞推荐,拿到收益了
- 阿里Marco-o1推理大模型技术报告解读
- 最值得参加的LLM盛会!多模态/Agent/具身智能/安全/评估等15个论坛!
- 大模型对齐中的各种loss讲解
- 微调图像大模型的经验分享
- 人人都能看懂的RL-PPO理论知识
- 校招字节开奖,大模型50K*15!准备接了
- 今天面试了一个字节女生,当场想给她 offer!
- 个人从零预训练1B LLM心路历程
- 代码大模型OpenCoder技术报告解读
- SFT洗数据,有多少细节?
- 大模型中有哪些形式简单却很巧妙的上分方法?
- 智谱生成视频升级,告别默片Sora
- FlashAttention算法之美:极简推导版
- ACL 2024中RAG论文整理和简析
- AI搜索的16个局限性和提升建议
- 图解大模型训练系列:序列并行2,DeepSpeed Ulysses
- 大模型SFT数据选择方法综述
- 图解大模型训练系列:序列并行
江大白
- CV微调卷出天际,Mona微调方法,即插即用:我小,我强,我省资源(附论文及源码)
- PyTorch CUDA 内存管理优化:深度理解GPU资源分配与缓存机制!
- 3类多目标追踪算法,项目工程化部署原理汇总
- 超越DINOv2! 英伟达开源PS3:让视觉大模型”看清”世界!(附论文及源码)
- DeepSeek的风吹到了多模态,Visual-RFT发布,视觉任务性能飙升20%!(附论文及源码)
- 细节超越SAM2!商汤开源视频抠图新标杆:MatAnyone发丝级还原!
- 全网最全2.6W字综述,深入浅出大模型核心技术:微调、推理与优化指南!
- 小白秒懂:GPU产品核心参数规格解读!
- 小目标检测涨点,创新双流注意力BAFNet,即插即用!
- OpenAI震撼发布o3/o4-mini,AI视觉推理巅峰!首用图像思考,十倍算力爆表!
- 12种常见AI视觉大模型的应用赋能,全面梳理汇总!
- 少样本YOLO目标检测+零样本Kimi/QwenVL,实战应用详解!
- YOLOv12-BoT-SORT-ReID,无人机检测及追踪算法,问鼎无人机挑战赛(附论文与源码)
- 智谱开源新一代GLM大模型,推速度快DeepSeek-R1八倍,还启用了全新域名Z.ai!
- 轻量级边缘检测算法,高斯模块EGA,低分辨率检测新SOTA,即插即用!(附论文和源码)
- AI芯片落地必备,GPU工作原理详解!
- 深入浅出AI智能体系列之公众号分析推送,实战完整讲解
- TPAMI 2025,国防科大提出RGBT-Tiny数据集,助力小目标检测发展!
- 传统行业AI智能化,算法研发如何避免项目化?
- 低光照检测算法YOLO-LLTS,高分辨率特征+多分支注意力,多数据集SOTA!
- 赢麻了!全体程序员彻底狂欢吧!这个好消息来得太及时!
- SAM+想象力!清华新模型SAMEO:遮挡物体也能完整分割,分割万物模型学会脑补!
- SSMA-YOLO,轻量级检测模型,增强特征提取与融合,适用无人机航拍的船舶图像检测!
- Vision-R1:第一个多模态视频Reasoning方法+模型,7B小模型逆袭GPT-4o!
- CVPR 2025,即插即用MambaOut,图像分类、目标检测多场景SOTA!(附论文及源码)
- Llama 4发布,AI大佬愤而辞职!训练作弊惊天丑闻,代码实测崩盘全网炸锅!
- 小目标检测算法涨点必备,EFC特征融合,即插即用!(附论文和源码)
- 最初只有12个人!英伟达架构师首次亲述CUDA发展全过程!
- GPU开发过程中,如何更好的优化,快速提升底层性能?
- DeepSeek开源的背后逻辑,优劣势分析
- CV被大模型“解决”?开源模型UFO:16个Token搞定图像任务!(附论文及源码)
- 牛嘴图像算法MHAFF,准确率高达近100%,创新融合 CNN 与 Transformer!
- AI项目应用,是用传统AI的YOLO?还是视觉大模型VLM更好?
- 深入浅出,小目标检测算法研究梳理汇总
- 大模型Claude“大脑”拆解分析,发现它是这么思考的!
- 硬核,AI Agents全栈技术框架综述与未来!
- DeepSeek 悄悄更新!重点编程能力大幅提升!
- 万字长文,深度解读AI算法项目,开发及边缘设备部署行业经验!
- 边缘设备实时检测,2.4倍加速实战分享!
- 万字长文!从AI Agent到Agent工作流,一文详细拆解工作流(Agentic Workflows)
- 一文了解模型精度(FP16、FP8等),所需显存计算以及量化概念!
- 10篇DeepSeek-R1相关研究全面汇总,万字思考!
- 5款视觉OCR开源模型,数字、文本、公式等精准解析!教育/金融场景全覆盖!
- 长三角企业安全生产AI风险管控研讨会,4月在无锡举办,值得参加!
- 目标跟踪失真难题,OmniTrack解决,性能提升6.8%!(附论文及源码)
- 大模型量化技术(Quantization),可视化开发指南!
- 13年后,AlexNet源代码终于公开!带注释的原版(附代码链接)
- 无人机目标检测,基于YOLO改进,高效特征融合算法!
- 建议收藏:英伟达主流GPU参数速查表!
- 掀桌子了!满血版3万Tokens每秒,英伟达捅破DeepSeek推理天花板!关键技术全揭秘!
- 苹果开源AIMv2通用视觉模型:性能碾压CLIP,视觉与文本的完美融合!
- 大模型的门槛,又被打下来了!
- 视觉大模型DINO-XSeek:以物体感知为核心,理解物体属性为出发点!
- DM-YOLO小目标检测,轻量边缘设备部署,参数减少38%,精度上升4.1%!
- DeepSeek一体机,阻碍推理性能的最大绊脚石!
- 基于0.5B小模型,复现DeepSeek-R1的思考及实践
- 李飞飞团队具身智能新作:500美元,一切家务机器人帮你干!
- 何恺明&LeCun改造Transformer!9行代码替代归一化,性能不减还加速!(附论文及源码)
- 如何使用DeepSeek,进行科研图表绘制?
- 两万字长文,用PyTorch从零构建 DeepSeek R1,模型架构和分步训练详解!
- YOLOE算法,实时分析一切,开放物体检测和分割!(附论文和源码)
- 直播讲解,全球首款Armv9 AI PC开发套件,30TOPS NPU+免费评测活动!
- 边缘设备目标检测YOLO-Pro,超高精度检测算法,SOTA榜新突破!
- CVPR2025,英伟达提出首个Mamba-Transformer视觉骨干网络!(附论文和源码)
- Manus开源复刻框架OWL,测评和使用实战教程!
- 部署DeepSeek 满血版?节约50%成本,这款H200裸机服务器就可以!
- QwQ-32B 测评和使用教程来了!
- 小目标检测神器,基于YOLO11的动态图形网络,用于小目标检测和跟踪 !
- olmOCR-7B,基于Qwen2的文档提取OCR专用模型
- 卷!!!MetaGPT成员3小时复刻Manus,代码已开源!
- QwQ-32B 测评和使用教程来了!
- 万字长文经验分享,我做模型量化的那些年!
- 文本-图像检索革新,视觉Prompt预测+轻量训练,性能超BLIP2!
- AI编程开发神器Cursor,保姆级实战教程!
- PyTorch灵魂人物离职,分享他在PyTorch的这四年经历!
- 图像视觉任务微调!DeepSeek R1技术成功迁移到多模态领域,全面开源(附论文和源码)
- 超分辨率图像,红外小目标检测算法YOLO-MST发布!
- YOLOv12论文详解:以注意力机制为核心的实时目标检测算法(附论文和源码)
- 零基础入门,DeepSeek微调的评测教程来了!
- 最新最全,大模型简史整理!从Transformer(2017)到DeepSeek-R1(2025)!
- 漫画趣讲,为啥大模型按Tokens收费?和API调用、订阅收费区别?
- DeepSeek-R1模型部署全解析:从1.5B到671B,硬件需求与适用场景详解!
- 高分辨目标检测创新,跨切片 NMS,视觉Transformer革命!
- DeepSeek接入个人知识库,保姆级代码实战教程!
- AI视觉产品研发,成本如何分析?如何省钱?
- 各厂家DeepSeek一体机,大盘点梳理(含配置、参考价、选型建议)
- YOLO再进化!MHAF-YOLO多尺度融合,检测性能飙升(附论文及源码)
- 零基础入门,DeepSeek微调实战代码教程!
- 一网打尽!5大AI模型拆解!RNN、CNN、Transformer、BERT、GPT!
- 各个平台都接入DeepSeek,等于都没接DeepSeek?
- 2024年总结:放弃百万美金年薪,去做大模型研发,我后悔了吗?
- AI产品工程化中,如何提升AI算法系统的运行效率和性能?
- 刚毕业不会代码,纯靠ChatGPT写APP,年入千万美金!经验分享!
- 四个DeepSeek R1最新复现方案,进展汇总!
- 突发!知名智驾公司突然解散,高管激烈内斗,总部已封楼!
- 重磅发布!DeepSeek R1方法成功迁移到视觉领域,多模态AI迎来新突破!(附项目链接)
- DeepSeek爆火,对大模型算法工程师的影响?
- 目标检测YOLOv12算法来袭,更高性能、更快速度!(附论文及源码)
- DeepSeek放出重磅论文!梁文锋亲自参与!
- 边缘端目标检测算法,碾压YOLO系,横扫BDD100K/TJU 双冠,效率起飞!
- 马斯克全新发布Grok3模型,坐拥20万张卡的新王!
- 从DeepSeek R1论文,深入理解推理大模型!
- 厦大团队:大模型概念、技术与应用实践(140页PPT读懂大模型)
- 快速搭建一套多路视频流实时处理系统,车流统计项目!(附实战代码)
- 人工智能的发展,是不是走错了方向?
- 深入浅出,算法模型INT4、INT8、FP8、FP16、FP32量化,小白入门必学!
- 为什么DeepSeek出来后,国产大模型集体失声,以前都号称很强?
- 漫画趣解:一口气搞懂大模型蒸馏技术!
- DeepSeek-R1 Linux 本地部署,OLLAMA & Open WebUI 双剑合璧!
- 光照不良环境下,跨模态目标检测DEYOLO, 双功能增强YOLO!(附论文及源码)
- TIP 2025!多目标跟踪新方法TOPICTrack,新数据集BEE24发布!
- 年薪154W!真心建议大家冲一冲新兴领域,工资高前景好!
- 昇腾 910B,部署满血DeepSeek-R1经验分享!
- 吴恩达开源:无需标注数据的Agent目标检测,任意场景输入文字提示(附论文及源码)
- DeepSeek从入门到精通,104页清华出品!(可下载)
- 为什么DeepSeek,初创公司可以开发出来而不是国内互联网巨头?DeepSeek神回复
- 82.75 mAP!南开大学提出Strip R-CNN:遥感目标检测全新SOTA!
- 深入浅出,DeepSeek 蒸馏技术深度解析!
- 基于 YOLO 检测,YOLOv8、v9、v11及混合模型深度剖析 !
- 单卡4090,运行DeepSeek r1 671b经验分享
- Deepseek R1 Zero复现全过程记录
- DeepSeek公司实习感受,及大模型行业择业思考!
- YOLO 家族大对决:YOLOv11 与 Transformer 称霸两类目标检测 !
- 完整DeepSeek-R1 671B本地化部署,详尽教程来了!
- 3个DeepSeek 复现经验心得汇总
- 基于国产芯片的DeepSeek R1&V3,手机版推理使用教程!
- DeepSeek V3的极致细节!如何绕开CUDA的垄断?
- 单目视觉系统,检测车辆的7种测距方法汇总
- 一文读懂 NVIDIA A100 GPU
- 深入浅出,Transformer在小目标检测领域,近3年的进展与突破!
- 一文全面揭秘,Kimi 1.5最新推理模型背后的技术!
- AI视觉项目如何更好的落地,深度思考系列!
- 万字长文最新综述!当无人机遇上大模型:低空智能体的综述与展望(附论文及源码)
- 无惧遮挡&小目标检测算法,复旦开源UAV-DETR,高效端到端检测!(附论文及源码)
- 一分钟了解,英伟达H100的毛利有多高?
- 基于YOLO的小型设备,剪枝量化部署实战流程
- 为什么同门硕士进BAT拿高工资,而博士却要挤破头进985高校?
- AI项目算法迭代的成本,为什么很高?降本增效的思路解析!
- Transformer算法内部,工作原理及拆解
- 无人机多目标跟踪MMTracker算法,Mamba和YOLO的结合(附论文及源码)
- 字节又整活!SAM2与LLaVA结合,视频级别对话统一模型!
- AI视觉产品落地,为何很难?背后的原因分析
- 多视角Transformer,目标检测、图像分类等均实现Top-1 精度 !
- 万字长文ByteTrack详解,Tracking by Detection范式力作(附论文及代码)
- 2025 AI Agents,最新技术栈解读出炉!
- 小目标检测神器,基于YOLO11的动态图神经网络用于小目标检测及跟踪 !
- CPU也能跑模型,OpenVINO模型部署入门教程!
- RTX5090发布,与4090的不同点及相关思考!
- 突发!美国拟(全面禁止)向中国出口AI芯片!
- 同济提出Transformer简化结构,RTX3090上实现CLIP的轻量级训练 !
- 关于AI Agent,最新万字综述分享!
- 英伟达「世界模型」发布,75页报告,引爆物理AI革命!GitHub狂飙2k星!(附论文及源码)
- PyTorch 模型,原生FP8训练进展
- RTX5090昨日震撼发布,5大看点速览!!
- Conv2Former:Transformer风格的视觉卷积神经网络(附论文及源码)
- 万字长文,深入浅出开放词目标检测算法!
- 一文了解英伟达成功背后的原因,CUDA生态系统!
- 小目标检测算法中,常用的6种解决方式汇总
- 人工智能的发展方向,是不是走错了?
- 超越YOLO11和D-FINE!DEIM:最强实时目标检测算法!(附论文及源码)
- 成功!在26年前的老年机上跑大模型!
- AI项目工程化,CUDA开发心得汇总!
- 聊一聊大模型六小虎和四大厂的2024!
- 小样本视觉异常检测方案,统一且无需训练,突破跨领域限制!(附论文及源码)
- 一文读懂 NVIDIA GPU 产品线
- 人工智能创业笔记【4】:身体是革命的本钱
- 万字综述,全面梳理模型FP8训练和推理技术
- 烟火目标检测CCi-YOLOv8n算法,突破检测极限,效率与精度双飞跃 !(附论文和源码)
- 国产之光DeepSeek,671B大模型训练只需之前1/10算力,细节全公开!
- 3小时从零训练26M的小参数GPT?仅需2G显卡即可推理!既是开源项目又是LLM入门教程!
- 深度学习工作反思:从追求 SoTA 到揭示新现象的转变
- TensorRT模型部署与CUDA优化:关键核心与实践的策略思考
- 一文了解”算力过剩”的背后逻辑
- 微软开源视觉语言模型!能够执行超过10种不同的视觉任务,检测、分割、识别一切图片
- 基于腾讯混元大模型,业务落地实践汇总!
- 如何从零到一,做大模型pretrain?
- 一文了解“算力”方面,各类知识点!
- OmniVision-968M:全球最紧凑、最小的边缘AI多模态视觉模型!附带本地部署运行教程!
- 文生图质量刷新纪录!何恺明团队新作,Scaling laws视觉模型失效?
- 深大提出 SL-YOLO: 更强、更轻的目标检测模型 !
- AWS最强AI芯片,深度解读!
- 别再用PostgreSQL了,Milvus才是多语言RAG的最佳搭档
- 手把手教你,Cuda实现PyTorch算子流程(附代码)
- 基于AI,低空经济的无人机检测识别研究综述
- C/C++高频面试题:内存泄漏的原因、检测、解决方案
- 图像标注神器 X-AnyLabeling v2.5.0 重磅发布,交互式视觉-文本提示功能全面上线!
- 深度学习直接缝了别的模型,论文中这种创新点应该如何描述?
- Meta又一巨作!以人为中心的视觉模型:可用姿势估计、深度估计等任务(附论文和源码)
- 卷积RefConv,替代普通卷积,分类、检测涨点!(附论文和源码)
- 无需用户提示,检测万物!开放世界目标检测与理解的视觉模型:DINO-X(附论文及源码)
- 高效小目标识别,多帧运动检测与YOLO结合,提高 UAV 检测精度 !
- 算法网络轻量化设计,及模型部署内容汇总
- 为什么国产GPU的新品参数,都选择不公开?
- YOLO落地部署,一文尽览YOLO剪枝、量化进展,值得收藏!
- 测量一切!Measure Anything:使用SAM进行实时的尺寸测量!
- 轻量级多尺度线性注意力LiteMLA,即插即用,超强CV涨点神器!(附论文和源码)
- 人人都是音乐家!科大讯飞开源OpenMusic:更高质量,更有乐感!
- 深入浅出,一文讲清多线程与多线程同步!
- 大模型训练的本质是什么?以及大模型训练的核心要点
- 人工智能创业笔记【3】:坚持做和别人不一样的事
- 把机器人做成人形,意义何在?
- 如何正确理解,NVIDIA GPU的利用率?
- 分享几个实用的工具网站,GPU服务器应用必备!
- 万字长文,算法工程师,如何挨过职业寒冬?
- YOPO:LLaVA做剪枝,大幅缩减多模态大模型计算量至12%!
- 轻量级特征融合EFC,即插即用,小目标检测涨点必备!(附论文和源码)
- 2025年值得去的50家互联网公司名单…..
- 超强轻量级Backbone:StarNet,可直接替换其他骨干网络!(附论文和源码)
- GPU服务器支持的“卡数”,由哪些因素决定?
- LUD-YOLO:结合AFPN和BiFormer改进YOLOv8的无人机小目标检测
- 1行代码改进大模型训练,Llama速度提升1.47倍(附论文和源码)
- 深入浅出,算法工程师的职业生涯发展之路
- 轻量级算法模型,嵌入式微小设备也能实时检测 !
- 吴恩达出手,开源最新Python包!助力开发者大模型开发!
- 大模型分布式训练,学习过程总结(万字长文)
- 终于把RT-DETR搞懂!替代YOLO的更快实时目标检测算法及Pytorch实现【附论文及源码】
- 一位阿里P9的年薪和家庭资产梳理
- 改动一行代码,PyTorch训练三倍提速,这些「高级技术」是关键!
- 关于大模型在企业生产环境中,独立部署的问题讨论
- 神经网络INT8,量化部署实战教程
- 新Mamba架构又来了!华为提出QuadMamba:多视觉任务SOTA!
- 超详细!YOLO11模型架构详解、性能对比!
- 斯坦福大学教授李飞飞团队:关于 2024年人工智能发展报告总结!
- 为什么卷积现在不火了:CNN研究热度降温的深层原因分析!
- TaskCLIP:扩展大型视觉-语言模型以用于面向任务的目标检测
- 超越SAM-2!仅需一张参考图像,实现视频分割的任意颗粒度控制与时间一致性(附论文及源码)
- 最适合LLM推理的,NVIDIA GPU全面指南!
- 迈向OCR2.0新时代:统一端到端模型,文本、公式、表格等多模态分析(附论文及源码)
- 一文了解,英伟达A100算力的“计算公式”!
- AI炼丹ONNX模型实战部署,心得经验分享
- 使用零样本目标检测识别物体(附代码)
- 天大、华盛顿大学提出 YOSS 方法,视觉与听觉结合进行目标物体识别 !
- 3万Star,知名开源项目阿里官宣停更,太痛了!
- 深度学习算法训练,不同GPU预算选购指南!
- Gemini 也可以进行目标检测了!
- 大模型应用,有哪些简单却巧妙的上分方法?
- 仅CPU就能跑到1000FPS,开源的C++跨平台人脸检测项目!
- 智算中心GPU选型和参数一览(含国产卡),建议收藏!
- 万字长文,搞懂 AI 大模型的技术原理!
- 李飞飞团队新作,空间智能版ImageNet来了!
- 知乎热议:寒门硕士要不要继续读博士?
- 万字长文,三种Transformer模型的注意力机制及Pytorch代码实战!
- 一文揭开NVIDIA CUDA神秘面纱!
- 一文了解,国产AI芯片和英伟达的差距有多大?
- 深入浅出,大模型幻觉问题及其解决方案
- 一文了解,RTX4090 GPU八卡机的“市场乱象”
- 长远看算法岗真的比开发岗香吗?
- SOAR:YOLOv9+Vision Mamba适用于航空图像小目标检测
- Opencv修改一行代码,图像匹配效果提升14%!
- 目标检测算法,正负样本生成背后的原理拆解
- 24年开发岗位,需求最大的编程语言是啥?
- 台大开源DQ-DETR,3步改进DETR,小目标检测难题创新!(附论文及源码)
- LLaMA系列,一直在假装开源…
- Pytorch2.x时代,C++模型的高性能部署实践
- 四家亏损严重的芯片龙头企业,前景不妙!
- 深入浅出Batch Size,对模型训练的影响分析
- 阿里、京东、鹅厂、小米,不同职级薪资待遇一览表
- 大模型训练,用A100不用4090的原因?
- 独家整理:英伟达主流GPU,参数速查表
- 超越YOLOv10/11!中科大D-FINE开源,重新定义目标检测边界框回归任务(附论文及源码)
- 导师:自己每天科研近10小时,都觉得不够。研究生,每天工作不够5小时,拿什么去竞争?
kaggle竞赛宝典
- LLM 行业择业建议:选基座or应用?
- RAG不需要切块向量化了?通过PageIndex构建Agentic RAG!
- ICLR 2025 杰出论文奖揭晓!6篇获奖论文解读
- 建议所有研究生都去学一遍,赢麻了!!!
- 从零实现 DeepSeek R1:从基础模型到强化推理模型
- 国内最快的推理模型!效果比肩 DeepSeek R1,速度快 8 倍!
- RAG 与 MCP 如何以不同方式解决大模型的局限性
- 欢迎来到AI下半场!
- 竞赛总结:AFAC2024 AIGC金融多模态研究报告智能生成
- Transformer高效Finetune的技巧(多任务场景)
- Kaggle赛题解析:Yale/UNC-CH 地球物理波形反演
- GPT-4.1,实力绝对被低估了
- 炸裂!又一个AI大模型的新方向,彻底爆了!!
- Kaggle赛题解析:Image Matching Challenge 2025
- 构建Agentic RAG 系统的方法汇总。
- 竞赛总结:AFAC2024 金融工具Tools识别
- 10种竞赛数据预处理中的数据泄露模式解析
- 台大李宏毅2025 AI Agent最新课程来了!
- Llama 4发布!超越DeepSeek
- 所有大模型微调库全面对比!
- 中科院分区后又中了一篇一区!2025AI顶会顶刊‘灌水’全靠这个信息差!
- R1的4 个经典误区。
- 中科院分区后又中了一篇一区!2025AI顶会顶刊‘灌水’全靠这个信息差!
- 如何在预训练好的时序基础模型中引入外部特征?
- DeepSeek大模型核心技术解读!
- AI圈地震!最新大模型来了,榜单被全线刷爆!
- AFAC2024 基于保险条款的问答大赛总结!
- AI老板心中的迈巴赫!
- LLM 工程师工具箱:120+ 大模型库全攻略
- 最新!DeepSeek-V3官方:超越GPT-4.5!
- 真正的智能体-LLM Agent
- 为什么你在国内高校实验室里发不出顶会顶刊?
- AFAC2024 金融工具Tools识别竞赛总结
- RAG技术:20种方法源码解读与实践
- DCIC 闽江流域水情预报 0.00097 baseline
- Dify-Plus来了!
- DCIC 基于人工智能的闽江流域水情预报 0.0009 baseline
- NIPS2024:大语言模型在时间序列预测中真的有用吗?
- 国内众多GM一起设计的 Kaggle 社区赛来了! (有赞助)
- Manus和openai都在GAIA上瞎搞….
- 无需归一化的Transformer新范式-何恺明新作
- 时间序列特征提取大全:18 种高效工具库!
- Kaggle赛题解析:BirdCLEF 2025
- 最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)
- 一个由众多 GM 设计并全程陪跑的 Kaggle 社区赛 (有赞助版) 开赛啦
- 阿里最新推理模型,效果媲美满血R1!
- 用极小模型复现R1思维链的失败感悟
- Kaggle赛题解析:使用大模型绘制SVG图像
- 手把手构建DeepSeek-R1推理模型!
- Kaggle赛题解析:斯坦福3D RNA结构预测
- 深度学习模型优化方法的技巧。
- 12强终极PK!第二届OpenHarmony创新应用挑战赛引爆开源热潮
- 12强终极PK!第二届OpenHarmony创新应用挑战赛引爆开源热潮
- DeepSeek Day3:从DeepGEMM看大模型算力提速的矩阵乘法
- 12强终极PK!第二届OpenHarmony创新应用挑战赛引爆开源热潮
- 基于多级小波变换的多频率时序预测模型
- DeepSeek开源周 Day02:从DeepEP开源趋势重新审视大模型Infra
- DeepSeek开源王炸技术:FlashMLA。
- 竞赛总结:Kaggle Santa 2024挑战赛
- 关于Grok3和DeepSeek背后苦涩教训引发的思考
- 重新思考RAG的相关性:相似≠相关
- Qwen魔改为DeepSeek,再复现R1
- DeepSeek最新成果!
- 大语言模型简史:从Transformer(2017)到DeepSeek-R1(2025)的进化之路
- 复现DeepSeek Zero的RL调参经验
- DeepSeek R1 刷榜 Kaggle 数学奥赛挑战赛
- X-R1: 不到50元,人人都能复现0.5B Aha Moment
- Kaggle赛题解析:2025 NCAA篮球预测
- DeepSeek-R1技术笔记 (含图解和技术点介绍)
- 从零到Kaggle大师,再一场竞赛拿下大厂Offer!
- 深入了解Deepseek模型的最佳三篇论文
- 大模型时代关注的公众号
- 从零到Kaggle大师,再一场竞赛拿下大厂Offer!
- Kimi 1.5 技术报告解读
- Gemini 2.0霸榜,价格卷哭,性价比新王诞生!
- 小白学解释性AI:从机器学习到大模型
- Deepseek R1 Zero复现全过程记录
- DeepSeek实习感受与大模型择业思考
- 时序异常算法对比 (VLDB 2024)
- DeepSeek解析,速通DeepSeekV1~V3核心技术点!
- DeepSeek-R1技术报告速读
- TabM深度学习模型(Jane Street比赛高分模型)
- 一文梳理各类Large Language Model关系和实现要点
- Jane Street最新量化大赛金牌方案(含代码)
- 长文本“新王”诞生!400万字输入,王炸!
- 2024时序预测总结——多尺度时间序列建模
- 竞赛中类别重复如何影响模型精度?
- 用LLM做文本分类,微调选base还是chat
- Kaggle知识点:数据挖掘标准流程
- LLM PEFT微调方法最全理论篇
- 2024年AI大模型回顾!
- 一个替自己投简历找工作的 AI Agent 悄悄火了
- Kaggle知识点:表格竞赛中NN什么时候优于树模型?
- 时间序列基础模型结合RAG,提升Zero-shot Learning时序预测效果
- TimeRAG:通过RAG进行时间序列预测
- 我用8道变态烧脑题,测出了o1的国内最强平替
- GM的Kaggle大模型竞赛技巧-合成数据
- 揭秘o1类模型的过度思考。
- 通道间关系建模在不规则时序预测中的研究
- 233万奖金的顶级大赛来了!
- KDD2024 OAG-Challenge竞赛总结.
- 大模型的全面综述
- Deepseek v3 实测来了!智商牛逼,情商不存在,自信退出价格战
- Meta KDD Cup 2024 大模型比赛总结!
- 70k!确实可以封神了
- 如何从零到一做大模型pretrain
- Claude 官方发布《Agent 构建指南》(附 PDF 下载)
- Kaggle赛题总结:CMI儿童网络成瘾预测
- LLM解决时间序列问题——语言模型+时序模型的对齐与融合建模
- Kaggle 奥数AIMO赛题:QwQ baseline
- o3 发布了,摔碎了码农的饭碗
- 谈谈Kaggle竞赛中的Cross Validation
- Kaggle超参数搜索方法汇总-含大模型方案!
- 2024年大模型后训练(post-training)总结
- Amazon KDD Cup 2024竞赛总结。
- OpenAI发布强化微调技术,SFT退出历史舞台
- AI顶会NeurIPS 2024大赛来了!
- 一块kaggle金牌的冲击有多大?顺利拿下各大Offer
- 机器学习特征工程,全面指南!
- 用初中数学理解大模型工作原理
- 核心概念–置信区间与预测区间
- 在时序预测模型显著提升预测效果的技巧。
- 阿里Marco-o1推理大模型技术报告解读!
- 3名高中生中了AI顶会NeurIPS!
- 字节&上交:可解释的高效长周期时序预测模型
- 全球AI攻防挑战赛系列冠军分享。
- 科大讯飞2024 企业经营健康评估挑战赛 Top3!
- 为什么卷积现在不火了:CNN研究热度降温的深层原因分析
- 基于多模态大模型的时间序列异常检测方法
- Python大数据处理工具速度PK-快速节省百倍数据处理时间
- 秘技:使用大模型进行特征筛选
- 使用大模型进行量化投资。
- Kaggle时序特征之:统计域、谱域和时域特征
- 不是,现在都流行用Kaggle写论文了吗?
- Kaggle LMSYS 大模型奖励建模方案总结
- 小型语言模型综述!
- 留学求职的无敌Buff,Kaggle竞赛到底有多厉害?
- TSMamba来了-基于Mamba架构的高效时间序列预测基础模型
- 2024时序预测都有哪些经典工作——总结篇
- 一套通用上分策略–Jane Street 大赛当前开源最高方案
- 说句实话,学生们搞科研,哪有什么真正的创新点…
- Kaggle知识点:特征降维方法(线性和非线性)
- 所有数据集上给神经网络刷分的通用方法!
- 大模型中有哪些形式简单却很巧妙的上分方法?
- 时序预测中的多频率建模方法汇总
- RAG评价方法综述:相关性、有效性与忠诚性
- Jane Street 大赛开源最高单模方案(接近银牌方案)
- 11种经典时间序列预测方法:理论、Python实现与应用
- Kaggle王炸–融合绝学。
- 利用图形、数学和 Python 揭示时间序列数据中的隐藏模式。
- 竞赛实践中10种数据预处理中的数据泄露模式解析
- LLM-Mixer: 融合多尺度时间序列分解与预训练模型,可以精准捕捉短期波动与长期趋势
AI大模型前沿
- AI Agent 全面对比:Manus、OpenManus与OWL
- 讯飞星火X1实力印证:“全栈自主可控大模型”这道必答题,中国能答好
- 最新!国产大模型清单!
- 近期不容错过的EI会议,论文投稿推荐!
- DeepSeek知识库,持续更新!免费领取!
- 杀疯了!DeepSeek大模型彻底改变了传统技术…
- 最新数据,头部企业大模型职位需求同比增幅达137%
- 面向人工智能,刚刚有了数据标注合规新标准
- 国内外知名大模型及应用列表(2025)
- 李宏毅2025 AI Agent新课来了!(附PPT)
- 10家单位已加入,全国首部AI大模型私有化部署标准欢迎参编!
- 最新!Llama4突然发布!超越deepseek!开启超高性价比原生多模态AI和开源MoE的新时代,并公开训练策略!
- 一文汇总大模型推理框架!
- 北大院长朱松纯:大模型为什么不是AGI?
- 确认裁员了,很严重,所有程序员提前做好准备吧!
- DeepSeek 最新升级!编程能力大幅提升
- 2025年TOP 9大模型!
- 为什么你在国内高校实验室里发不出顶会顶刊?
- 最新!从Transformer(2017)到DeepSeek-R1(2025)大模型发展史!
- PyCharm接入DeepSeek超详细完整教程,实现AI编程!
- 刚刚,GPT-4.5重磅发布!
- 大模型概念、技术与应用实践(140页PPT读懂大模型)
- DeepSeek,最新成果!
- Grok 3发布!性能超过DeepSeek R1!
- 软考重磅消息!刚刚明确!恭喜2025年考生!
- 深入解构DeepSeek-R1!
- 请立即拿下软考证书(政策风口)
- 迈向GPT-4o,多模态大模型杀回来了!
- 2025, AI的10大趋势!
- 真心建议马上拿下软考证书!(特大红利期)
- 央国企!入局AI大模型(附66家名单)
- 2024年AI大模型回顾!
- 读完这这本大模型书籍,你就是LLM大师!
- 多语言大模型:系统综述
- 10种主流LLM推理框架的技术介绍与对比:从本地部署到企业级服务
- 年包98w!拿到字节 offer 了!
- 中国工程院院士孙凝晖给正国级、副国级讲课的万字长稿《人工智能与智能计算的发展》
- 多智能体大语言模型:四种多Agent范式
- 用初中数学理解LLM工作原理
- 蘑菇车联车路云一体化系统入选2024年AI最佳实践方案
- 大模型:混合专家模型(MoE)概述
- 《世界模型》最新综述!
- 2024年十大开源大模型RAG框架!
- 杀疯了!深度解析NLP底层技术—复旦大学《自然语言处理导论》
- 多模态大模型,全面综述与指南
- 突发!OpenAI大模型最新功能技术曝光..
- 剖析!大模型在不同行业的实际应用
- 一文全面说透,AI大模型!
- 15种必知RAG框架,最新综述!
- AI大模型:开源、闭源之争的本质!LLaMA原来在假装开源?
- 通俗易懂,大模型原理及缺陷!
- 拿下一篇AAAI最佳论文,这个新方向到底有多强?
- 字节版Sora“即梦AI”全新登场!
- 50K*16薪,进字节了!
- 大模型经典著作《大语言模型基础与前沿》
- 速度!双击文件就可以运行本地大模型!
- 小型语言模型(LLM)综述!
飞桨PaddlePaddle
- 文心4.5Turbo、X1Turbo和多款AI应用发布!李彦宏:应用创造未来
- 百度发布文心4.5 Turbo、X1 Turbo两大模型,王海峰详解背后技术
- 开单效率暴增30倍!“数字销冠”的AI密码:飞桨+文心大模型双引擎驱动
- Wan2.1和HunyuanVideo文生视频模型算法解析与功能体验丨前沿多模态模型开发与应用实战第六期
- 大模型训练代码开发再提效——3行代码就能实现分布式训练!飞桨框架3.0自动并行功能现已正式上线!
- 「技能树成长计划」项目征集:点亮技能分支,成为“全能开发者”!
- 太初元碁正式纳入飞桨例行发版,打造软硬件协同新范式
- FLUX文生图大模型算法解析与功能体验丨前沿多模态模型开发与应用实战第五期
- 40节AI公开课!技术解读、应用落地、解决方案…Create大会集中学
- 百度飞桨入驻武汉人工智能计算中心,携手开启AI赋能新篇章
- 燧原正式纳入飞桨例行发版,打造软硬件协同新范式
- 企业命题征集:2025中国高校计算机大赛-人工智能创意赛欢迎您的加入
- 这道填空题,你敢做吗?飞桨领航团团长年度招新
- 一言一行|雨林深处的公益:一言用户和亚洲象的故事
- 飞桨领航团达人创造营宣布扩容!二班启动招募!
- “科技界奥斯卡”揭晓!百度“AI守护官”斩获爱迪生奖
- 百度飞桨与香港产学研代表共同研讨“AI时代的创新、挑战与机遇”
- 飞桨新一代框架3.0正式发布:加速大模型时代的技术创新与产业应用
- 沐曦与百度飞桨完成Ⅱ级兼容性测试
- 前沿多模态模型开发与应用实战第四期:多模态理解趣味应用
- 物理世界的智能体来了?第二十届全国大学生智能车竞赛百度创意组赛题预告!
- 数据生态共建再落一子!2025年文心中国行首站锚定无锡
- 线下培训日历!完全模型组全国巡回线下培训火热开启!
- 智绘AI蓝图,共策电力新篇-「电力+AI」应用赋能计划招募启航!
- 借卡名单公示&线上赛指南|全国大学生智能汽车竞赛百度完全模型组
- 发掘无限潜能!飞桨黑客马拉松第八期,重磅奖励邀你来战!
- 厦门站见!百度飞桨领航团 AI 达人创造营(第五期)火热进行中
- 前沿多模态模型开发与应用实战3:DeepSeek-VL2多模态理解大模型算法解析与功能抢先体验
- 百度飞桨厦门赋能中心法律科技AI私享会落地,开创法务创新应用新篇章
- 哇塞!只需三步,带你飞速蒸馏DeepSeek R1!
- 百度「文心·新星」顶尖技术人才计划专项启动
- 两连发!文心大模型4.5及X1,免费!
- 第一期模力星河AI共创加速营政企社联动启幕
- 文心快码全新升级!Comate Zulu开放公测,超多好礼派送中
- 飞桨框架3.0推理升级:支持多款主流大模型、DeepSeek-R1满血版实现单机部署,吞吐提升一倍!
- 飞桨赛道报名中!香港教育大学AIREA国际人工智能与教育大赛启动
- 扬帆启航!你的开源之旅从「启航计划」开始!
- 2024飞桨开源社区年度报告
- PP-TableMagic开源,支持全场景高定制化微调,大模型时代表格结构化信息提取新神器
- 国赛来咯!第二十届智能汽车竞赛百度完全模型组正式开启
- 首届AI家书创新应用大赛启动:用科技守护2.8亿银发人群的时光记忆
- 模力星河 AI 共创:工业数字化转型 “加速器”
- 前沿多模态模型开发与应用实战第二期:Qwen2-VL系列多模态理解大模型算法解析与功能抢先体验
- 智汇金陵 共探AI未来:开发者圈层沙龙·南京站圆满举行
- 特色模型开源!飞桨PP系列新成员PP-FormulaNet助力大模型科研数据构建,公式识别提速16倍
- AICA南京招募专场来了,探讨技术革新下AI架构师的培养与机遇
- 当「AI浪潮」撞上掌舵者野心:谁在重新制定行业规则?
- 开学后的我:精神状态良好!
- 前沿多模态模型开发与应用实战第一期:多模态统一模型Janus解析与功能抢先体验
- 飞桨科学计算技术上线国家超算互联网平台,AI+流体力学推动高精度计算效率提升
- 飞桨星河社区实战指南:速通大模型API服务开发项目全攻略
- 飞桨PP系列新成员PP-DocLayout开源,版面检测加速大模型数据构建,超百页文档图像一秒搞定
- 通用信息抽取大模型PP-UIE开源发布,强化零样本学习与长文本抽取能力,全面适配多场景任务
- 开发者沙龙·南京站 | 大模型深度应用与产业融合报名中
- PP-ChatOCRv3新升级:多页PDF信息抽取支持自定义提示词工程,拓展大语言模型功能边界
- 定了,免费!
- PaddlePaddle Hackathon | 再攀高峰!飞桨黑客马拉松第七期圆满落幕
- 2025年百度飞桨(张江)赋能中心入驻申请启动!
- 开工大吉!文心一言送“福”来
- 飞桨祝您有AI有喜,蛇年大吉!
- 第二届开放原子大赛 - 飞桨赛题圆满落幕,PaddleMIX与PaddleScience共筑技术新高地
- Enjoy AI,2025年飞桨星河社区项目开发赛季开启!
- 智汇香江,桨启新程!文心中国行首次落地香港,加速大湾区产业智能化
- 蛇来运转,新年就要上上签!(内含百度AI专属蛇年红包封面)
- “智聚京华,策动新章”文心中国行落地北京,共话大模型产业未来
- 文心一言x三联中读联合会员 左手滚烫新知,右手前沿智能
- 破解上亿数据检索难题,AI重塑法律超级大脑
- 6751!深度学习,第一
- 文心中国行落地武汉,共绘大模型产业应用新蓝图!
- 文心中国行首次抵港!1月21日相约香港,共建大模型产业应用生态圈
- 2024收官Prompt:大漠,追光!
- 飞桨PP系列新成员!PP-VCtrl助力高效可控的视频生成
- 百强榜官宣!2024年度星河产业应用创新奖揭晓
- 落地厦门!百度飞桨人工智能产业赋能中心再添一城
- 飞桨AI for Science课程表|前沿讲座系列课程预告(四)
- 飞桨PP系列模型上新!PP-DocBee文档图像理解的新‘蜂’向标!
- 盘点2024:这一年,我们这样走过
- 效率提升300%!文心一言与辞海强强结合,推出智能知识审校系统“辞文”
- 正在报名!文心中国行走进武汉,共探大模型时代产业新机遇
- “智惠万企—文心赋能中小企业专项行动计划”正式发布并启动招募
- 百度AICA第八期正式收官 79名首席“AI架构师”毕业执桨起航
- 百度与南京市鼓楼区共建江苏首个飞桨人工智能产业赋能中心
- 文心中国行再聚鹭岛!厦门飞桨赋能中心启航
- 大模型助力教师提效创新:百名教师齐聚百度飞桨(厦门)人工智能产业赋能中心!
- 飞桨扬帆智海,大湾区杯AI For Science科技竞赛圆满完赛
- 大模型区域落地再加速!“文心中国行”走进广州
- 大模型技术沙龙:行业深度融合与创新路径探索
- 大学生做得好不好小学生来pick,2024 C4-AI总决赛在中华世纪坛圆满落幕
- 飞桨大模型Unified Checkpoint技术加速模型存储95%,节省空间78.5%
- 一亿中流加入飞桨技术伙伴计划,“AI+营销”实现智能化精准拓客
- 飞桨AI for Science课程表|前沿讲座系列课程预告(三)
- PaddleX上线小目标检测模型产线,支持遥感分析、智能监控、智慧交通等领域高效应用
- 飞桨教师风采|李彝利:基于飞桨的校企协同AI创新人才培养模式探索
- 下一站,广州!12月19日文心中国行与您共建大模型产业应用生态圈
- 飞桨星河社区六周年|学练进阶·技术畅谈,一起并肩前行
- 第六届CECC大会圆满落幕,大模型技术引领教育改革与创新
- 学校新来了一位AI作文老师:能看、会评、还教改写
- 飞桨出海助力智利企业Simon9精准解决包装行业质检难题,生产损失降低90%
- 开发者沙龙·上海站|大模型深度应用与产业融合报名中
- 第六届CECC中国计算机教育大会百度“大模型技术创新与教育实践”论坛来啦
- 飞桨AI for Science课程表|前沿讲座系列课程预告(二)
- PaddleX 上线多标签分类模型产线,高效支持图像识别、智能监控、工业质检等领域应用
- FlashRAG-Paddle | 基于PaddleNLP的高效开发与评测RAG框架
- 重磅!飞桨开源社区携手百度开源办公室,为开源贡献者送福利!
- “未来之后”AI4S第三届国际高峰论坛报名|诺贝尔奖得主、五位院士、顶尖专家学者与企业领袖齐聚,分享前沿趋势及领域成果
- 飞桨PaddleScience与北大研究会开展科学计算训练营
- 百度飞桨联动香港教育大学AIREA,共话AI+教育发展新趋势
- PaddleX 上线人脸定位与识别端到端模型产线,为安全监控、身份认证、智能家居等领域保驾护航
- 大模型时代下的高等教育转型——百度领航AI通识课程建设
- 「体验官招募」多模态大模型开发套件PaddleMIX开发项目挑战
- 基于PP-ShiTuv2新增PaddleX图像识别模型产线,显著提升商品识别等细粒度开放域产业场景检索性能
- 一束电力智能之光,点亮“星河”应用创新未来
- 百度文心智能体技术获2024世界互联网大会领先科技奖
- 2024大湾区科学论坛举行,百度吴甜解读大模型如何重塑产业智能引擎
- 官方带队实测,阶梯式解锁飞桨框架3.0能力新特性,轻松上手!
- 飞桨AI for Science课程表|前沿讲座系列课程预告
- PaddleClas 2.6 发布,新增细粒度商品识别、特色多标签分类等前沿算法和检索能力!
- AI少年科创营:学而思与百度飞桨携手开启青少年AI科普之旅
- 百度王海峰:文心一言用户规模达4.3亿
- 打造没有围墙的学校,百度世界2024发布科技馆智能体
- 文心iRAG和无代码“秒哒”发布!李彦宏:即将迎来AI应用的群星闪耀时刻
- 太好了支持多比例出图!新媒体人有救了!
- 飞桨PaddleScience亮相DACOMA-24,助力科学计算新探索
- PaddleSeg发布图像异常检测高精度模型STFPM,无监督异常检测算法赋能产业升级
- 百度联合学界打造国内最新AI for Science系列课程
- 百度升级AI for Science共创计划,携手学者共研顶尖学术成果
- 实训升级、资源加码!飞桨星河社区六周年活动速通攻略来啦!
- 扬帆启航!你的开源之路从「启航计划」开始!
- 凌智电子加入飞桨技术伙伴计划,携手PaddleX为视觉模组产品赋能添“智”
- 每人20万!第十二届百度奖学金启动申报
- 飞桨PaddleX高性能推理、服务化部署、端侧部署能力详解与实战
- 飞桨教师风采|钱彬、朱会杰:计算机视觉从小白到大师之路
- 硬件新技术|百余模型通过测试达到落地可用
- PaddleMIX 2.1昇腾版发布 | 使用说明
智源社区
- 明日直播|DeepSeek-通用领域奖励模型的推理时可扩展性研究
- 智源数据新基建系列 Workshop(第1期)来了!从大模型到具身智能
- 报名丨第七届智源大会,6月6-7日北京见
- 报名|智源Workshop:欧洲“蓝脑计划”创始人Henry Markram、神经科学家Sean Hill讲座
- 七问具身智能:谁是下一代 AI 范式的关键变量 | 未来人工智能先锋论坛圆桌
- 奇点降临,Manus 诞生背后丨青源Workshop观点集锦
- 活动报名|LeCun学生分享,Transformer无需归一化也能高效稳定训练
- PyTorch Day 首次登陆 2025 智源大会!论文征集开启
- 95后博导张林峰专访:6年前提出自蒸馏算法,高效AI助推大模型时代丨独家
- 直播报名|开启机器人操作新纪元,大规模高质量机器人学习数据集GO-1,AgiBot World
- 迈向Super Agent,从Manus谈起
- 直播|阿里通义千问Qwen2.5-VL解析,一作分享如何让大模型更好地看世界
- 直播|自动驾驶场景下的世界模型,可控驾驶场景视频生成方法研究
- 直播|给定一段文本,能否准确预测其来源模型?揭秘大语言模型独特性
- 中关村论坛-未来人工智能先锋论坛报名开启
- OpenSeek:一场属于青年人的AI探索远征,邀你共赴星辰大海!
- OpenSeek开源共创,招募全球贡献者
- 强化学习之父Richard Sutton荣获图灵奖,智源大会上他分享了四个阶段通向真正AI发展之路
- 活动报名|从「看不懂」到「会操作」,人物交互技术如何改变未来机器人
- 活动报名|Transformer²:自适应的大语言模型,SakanaAI
- 活动报名|CMU,海量实验解密大模型长链推理
- 明日直播|模型死记硬背的推理路径,是真正的智能么?王梦迪组
- 活动|中国互联网协会人工智能工委会第五期AI智荟沙龙即将召开,探讨「大模型+具身智能」生态建设
- 明日直播|AI4Math,Meta科学家杨凯峪分享形式化数学推理
- 张拳石专访:深度学习需要一场自顶向下表征内观的科学革命丨独家
- 活动报名|攻克机器人灵巧操作,解锁手物交互任务的“宝藏”框架
- 在AI前沿,与青年同行 | 2025 青源学术年会
- DeepSeek公开NSA算法,长序列处理实现11.6 倍加速丨热门论文
- 热门活动|李飞飞组工作,s1: 1000个思考样本激发大语言模型的Test-time Scaling
- 详解DeepSeek-V3:大模型训练加速神器,MoE焕发新生丨智源深度
- 直播|李飞飞、谢赛宁组最新工作:空间智能,多模态LLM如何观察、记忆和回忆空间?
- 直播|LLM-as-a-Judge热门论文,当AI担任“评估者”综述分享,AI+金融圆桌交流,IDEA研究院
- 报告下载丨重磅!2025十大AI技术趋势
- 智源研究院发布2025十大AI技术趋势,具身智能、Super APP、AI安全成焦点
- 直播|大模型技术框架和路线图解读,一站式了解《大语言模型》附PDF下载
- 直播|Meta&纽约大学, 探索大模型隐藏视觉能力, 从LLM到Unifed Model
- 2025 AI十大趋势发布会丨原生多模态、合成数据、AI4S、超级应用…
- 有礼调研 | 智源社区用户满意度调研,百份礼品待您开启
- 2025年必看「智源报告大盘点」
- 2025AI十大趋势发布会丨年终岁尾,次第花开
- DeepMind科学家宋星佑专访:好研究往往很简单,但不一定会被录用丨智源独家
- 清华赵明国专访:坚守人形机器人二十载,从孤军奋战到百家争鸣丨智源独家
- 全日程公布!NeurIPS 2024线下论文分享会,这周六我们不见不散
- 活动报名|智源Video-XL,面向小时级视频理解的多模态LLM,性能和计算效率的更好平衡
- 活动报名|DimensionX,港科大&清华:从单图像创建一切3D和4D场景,现已开源
- 田渊栋博士智源线下见面会丨AGI颠覆效应,一步之遥的科幻世界
- 从具身到智能,无尽前沿丨智源具身智能峰会观点集锦(下)
- 从具身到智能,无尽前沿丨智源具身智能峰会观点集锦(上)
- 智源行业应用大模型挑战赛开启报名!挖掘数据潜能,共创行业新篇
- 田渊栋专访:兼职小说家的AI科学家,讲述信息时代人类命运丨智源独家
- 活动报名|北大&谷歌,Token is all you need-看待模型的新角度,通用模型新结构
- 活动报名|Meta & Kaust ,智能体自我进化关键一环 Agent-as-a-Judge
阿郎小哥的随笔驿站
- 聊聊大模型训练数据——大模型接受的训练数据格式是怎么样的?
- 聊聊torch-npu插件原理————华为昇腾NPU服务器是如何适配并使用PyTorch机器学习开发框架
- 聊聊华为昇腾MindSpeed-LLM——Deepseek-R1-QWen2.5-32B的推理与合并
- 聊聊华为昇腾大模型分布式训练框架MindSpeed-LLM如何集成适配Megatron-LM加速库做后训练
- 聊聊华为原生训推框架MindSpeed-LLM全参数训练DS-Distilled-QWen2.5-32B
- 聊聊华为昇腾原生训推框架MindSpeed-LLM的实践——基于deepseek-r1-qwen2.5-32B的监督微调训练
- 聊聊DeepSeek-R1-Distilled-QWen32B基于GRPO算法下的训练记录——基于ms-swift训推框架
- 聊聊华为昇腾体系下,基于ms-swift&lmdeploy训推框架的GRPO算法训练
- 聊聊RAG相关使用体验及复盘
- 聊聊RL训练的奖励机制——项目工程应用与DeepSeek的RL应用
- 再聊大模型的微调训练——指令监督微调SFT & 强化学习RL
- 聊聊工程应用上模型训练的思考——Megatron-Deepspeed
- 聊聊华为昇腾体系下的大模型训练
- 聊聊SFT微调训练——如何训练更强更低成本的推理大模型
- 聊聊如何基于unsloth在Llama3.1上复现DS-R1-Zero
- 聊聊Unsloth微调DeepSeek-R1蒸馏模型 - 构建医疗专家模型
- 聊聊DeepSeek训练——基于强化学习训练的底层逻辑
- 聊聊R1模型的强化学习训练——从Open R1来看如何训练DeepSeek R1模型
- 聊聊DeepSeek R1的一些总结
- 聊聊DeepSeek R1的开源复现库——Open R1之合成数据
- 聊聊DeepSeek R1的知识蒸馏与应用思考
- 聊聊北大ChatLaw法律大模型的架构解析与借鉴思考
- 聊聊Firefly——开源且值得学习的LLM训练库
- 聊聊心理咨询大模型——SoulChat2.0
- 聊聊大数据领域中常见的存储格式、文件格式(推荐品读)
- 聊聊Apache Arrow及数据传输的高效处理
- 从MPP数据库Apache Doris与式数据湖Apache Paimon来聊常用的数据更新方案
- 聊聊线性代数中的分块矩阵与大模型张量并行技术
- 聊聊MetaGPT框架的agent开发流程
- 聊聊Multi Agent框架——MetaGPT源码搭建及示例运行
AI算法工程师Future
- 20万粉UP在线给粉丝纯手搓出了2025年最全机器学习深度学习快速系统入门学习路线!
- 作者时隔5年,历时4年,耗时2年,超20万字的Pytorch实用教程完稿开源!
- 用20%的金字塔原理就能带你学会基于Pytorch的深度学习!
- 真正意义上带你理解完各种神经网络理论后,还基于Pytorch一行行代码带你构建训练各种经典前沿深度学习模型!
- 看完终于知道为什么这本深度学习书值得这位大牛用上千字来给五星好评了!
- 我把Github上短期内狂飙至4万Star的LLM Ai大模型公开入门教程翻译制作成了这份中文版本!
- 目前我见过的最好的两本LLM大模型入门书!一本国内人大发表!一本国外出版两个月GitHub星标已狂飙到37.6K!
- 深度学习最强模型!挑战一篇文章让你理解什么是Transformer模型!从原理到代码的详细讲解!
- AI For Science好发论文!这是把生物医学信号处理-脑机接口如何结合机器学习深度学习讲的最全面的书!!中科院收录!
- 入门必学!带你详解深度学习目标检测的开山之作-RCNN模型原理+代码解析!
- 提升代码能力+代码复现+改代码全解决!PyTorch深度学习代码全流程教程!大神编写1年终于完结开源了!!
- 学习机器学习深度学习,这10大神经网络你总得了解吧!
- 小白绕不开的3门神课:土堆PyTorch 吴恩达DL 李沐动手学DL的完整开源学习笔记来啦!!!!!
- 深度学习新手绕不开的部分:卷积神经网络CNN基本原理+分类实战详解!
- 第一次见这么简明的机器学习教程书!它可是加州大学伯克利分校CS189课程“武功秘籍”的精髓所在!
- 绝对能满足每个阶段的深度学习研究生!强烈安利3个提升深度学习Pytorch代码能力的Github项目!提高代码能力有它们就够了!
- 我分析了网络上所有公开的大模型学习路线的优缺点后,自己一行行手敲出了这份应该算是最详细的大模型0基础入门学习路线!
- 对于深度学习新手来说,应该到底怎么改代码啊???毫无头绪!!全是bug!!!
- 遥感方向想要结合深度学习做创新发论文的同学,强烈安利这本《开源软件中的遥感影像深度学习》!
- 不能再详细了!机器学习深度学习研究生3年切实可行的规划路径思维导图,花了我半个多月的时间终于做出来了!
- 不想到处找教程?这本ML教程册子囊括了12种所有常用的机器学习算法!而且图文并茂、深入浅出!有着超绝的阅读体验!
- 真的好发论文!建议医学方向的同学看看这本【基于深度学习的医学图像数据可视化分析与处理】
- 目标检测必学经典模型:SSD模型的搭建、训练与测试详细教程!
- 想学机器学习深度学习但是没有数学基础怎么办?如何不浪费时间针对性的学,这两本书是我一直都非常推荐的!一本国内一本国外!
- 只想看书来掌握深度学习?那就看这三本吧!入门-进阶-实战!
- 找不到论文代码怎么办?给计算机视觉方向的研1新手整理的论文代码汇总文档来啦!!一半经典一半前沿!不用自己到处翻论文了!
算法美食屋
- Y→MVP→AARRR:解锁产品增长的「三把钥匙」全图谱
- 我用trae开发了一款颜值测试小程序
- 零帧起手,3个典型场景范例带你上手uv一站式环境管理~
- 我用trae开发了一款颜值测试小程序
- 我用trae开发了一款颜值测试小程序
- 更快更丝滑,火山引擎DeepSeekR1免费送token了
- 非常丝滑,腾讯元宝已支持deepseek R1
- 《DeepSeek从入门到精通》免费下载
- 30分钟vscode入门指南
- 使用cursor开发小程序
数智笔记
- 【aidoczh.com】AI工具中文文档库半年76个中文文档啦
- 【aidoczh.com】RAGAS中文教程——使用RAGAs评估RAG应用程序
- TABM: 通过参数高效集成推进表格深度学习
- AUTOKAGGLE: 一种用于自主数据科学竞赛的多智能体框架
- 【aidoczh.com】vLLM中文教程
- 【aidoczh.com】AutoGPT中文教程
知识工场
- 肖仰华丨AI在教育中的应用有两面性
- 大模型浪潮来袭,与肖仰华教授共赴 DA 数智大会
- 参会指南|4月25-26日DA数智大会·上海站,双场免费听!
- 2025年“数据要素×”大赛上海分赛科技创新赛道宣贯会即将举办,诚邀共赴数据创新之约
- 肖仰华丨AI也能“深思熟虑”,是福是祸?
- 肖仰华丨大模型的数据科学!
- 原创成果丨面向文本到图像合成的语义变化因果评估:SemVarBench与SemVarEffect
- 原创成果丨三思而后行:LLMs中的渐进式思想精炼
- 肖仰华丨警惕“AI思维”侵蚀人类创造力
- 大模型怎么做好角色扮演?最大的真实数据集、SoTA开源模型、最深入的评估在这里
- 重磅!知识增强的大模型——肖仰华教授的洞见与实践
- 200多行代码,超低成本复现DeepSeek R1「Aha Moment」!
- 知识工场祝大家昭昭如愿、岁岁安澜、新年快乐!
- 知识工场实验室近期录用论文一览(一)
- 知识工场实验室近期录用论文一览(二)
- ChatBI+Agent:数据分析新范式落地探索
- 知识工场实验室祝大家元旦快乐!
- 肖仰华丨迈向“智能的寒武纪”
- 肖仰华讲座丨开启大模型“牛顿”时代的数据科学
- 人员招聘丨复旦大学肖仰华教授课题组大模型数据科学博士后研究员招聘
- 肖仰华丨大模型赋能工业智能化的机遇与挑战
深度学习自然语言处理
- 谷歌发现LLM是Greedy Agent,提出用RL调教出理性决策
- Tiny Reasoning模型:LoRA+RL=9美元训练费,性能碾压同行
- NUS发布Reasoning中的安全问题综述,idea满满~
- 大模型在线辅导小模型,正确率提50%、推理效率涨90%
- 阿里发布多模态UniME:硬负样本+知识蒸馏=性能天花板,准确率暴涨27%
- 揭开o3的神秘面纱,港中文/UIUC/普林斯顿联合推出OTC-PO,让你的Agent既聪明又高效
- 首届CogMAEC@MM’25研讨会求稿,探索认知驱动的多模态情感与共情智能
- 1.5B小模型+32B外援=28%准确提升+8倍提速?SplitReason实现推理过程“无缝接力”
- 华人团队提出视觉推理测评标准,揭露SoTA模型残酷现状
- RL也能请“场外大神”?LUFFY打破模仿僵局,平衡探索与学习,解锁深度推理新境界!
- 直播预约 | 如何让LLM通过RL又好又准地使用工具?
- LLM Agent也能通过RL学会「思考」和「自我进化」吗?
- ICLR 2025 | Rodimus*:兼顾性能与效率的混合注意力机制
- 刚PhD毕业,聊聊如何一个季度完成一篇投稿
- 清华提出Test-Time RL,无需标注,模型自学,正确率飙升159%,实现终身学习
- 中科院提出DEER:让Reasoning提前退出,推理提速50% 准确率涨10%
- 综述 | GUI Agent:让AI学会「玩手机」的新革命
- 招生 | 哈尔滨工业大学(深圳)计算机学院陈科海老师招收硕博研究生
- 哈尔滨工业大学(深圳)计算机学院陈科海老师招收硕博研究生
- ToolRL:开创工具调用RL Reward新范式,性能/泛化/效率/推理迎来全面质变
- 这也行?小模型指导大模型Reasoning,无需训练,成本减少40%
- 北航联合小红书发布大模型翻译最新研究成果,重塑社交生活化翻译新范式!
- 通过Multi-Agent强化学习的LLM Meta-Thinking「元思维」综述
- 刘鹏飞团队发布AI觉醒第二幕:认知革命已悄然降临
- 264页综述!MetaGPT、Mila、斯坦福、耶鲁、谷歌等绘制 Agent 新蓝图 - 最新版
- 清华最新研究:强化学习竟是大模型的“应试教育”,并未突破原有潜力
- 不一样的推测解码!大LLM带小LLM,出奇的好,还有意外收获
- 北大+复旦发布最新最全面的Reward Model综述!
- 一张图片知道你在哪?o3-like 7B模型超越一流开闭源模型!
- 北航等机构发布最新综述:大语言模型集成(LLM Ensemble)
- ACM MM 2025 Grand Challenge | 多模态对话方面级情感分析挑战赛
- ICLR 2025 | LLaVA-MoD:MoE蒸馏训练轻量化多模态大模型
- 阿里通义实验室招聘2026届暑期实习生/日常实习生/2025届校招/社招
- 浙大联合小红书发布大模型翻译最新研究成果:MT-R1-Zero,强化学习驱动机器翻译新范式!
- OlymMATH: 奥林匹克级双语数学基准,R1 正确率仅为 21.2%
- 腾讯发布DeepMath-103K,数学能力断崖式超过所有基线!
- 一张图片知道你在哪?7B模型超越一流开闭源模型!
- 模型眼中的世界是黑白的吗?GPT-4竟不如开源模型?颜色理解成模型新短板
- 会做题还会检查!字节Seed提出Heimdall模型让解题正确率暴增30%
- 多模态RAG综述!
- 已实锤:LLM确实不会真正的数学Reasoning
- 直播预约 | 264页最全综述:Agent最近进展与未来挑战
- 推理成本降98%,准确率升13%!微软提出TwT:Thinking without Tokens
- 聊一聊现在的论文指导…
- 很好的一篇国外blog:实现GRPO
- 在线剖析这篇ICLR25论文,idea满满!
- 假装Reasoning也能提准确率?LLM的极简推理法,Token减半,性能翻倍
- OpenAI姚顺雨:欢迎来到AI下半场!
- 新加坡研究机构与高校发布最新Reasoning综述,从推理扩展、学习推理到Agent系统
- 16.8万篇论文揭秘:LLM如何血洗学术界,中美暗战谁赢了?
- 啊?强大的Reasoning模型仍需好的prompt,性能暴增23%!
- Vision-R1:激发多模态大模型的推理能力
- LLM Reasoning能力最近大跃进?不,都是「水分」!
- 车万翔老师的《自然语言处理:基于大语言模型的方法》得看!
- NYU发现Reasoning模型有第六感!可提前预判答案,少干活还拿高分!几乎无损
- 想得久≠答得对!LLM应该自主决定Reasoning长度!
- “反转诅咒”彻底解决,反向推理准确率96%!新架构突破LLM多年认知瓶颈
- 60.4分!字节Seed团队VAPO刷新Reasoning纪录:训练快10倍,错误率砍半
- NICE54期 | 首个面向天文学的大规模多模态基础模型
- 如今的Reasoning模型都不具备批判性思维!简单问题, Overthinking!离谱
- 聊聊 LLM 推理引擎中,那些已经成为事实标准的优化方法
- 腾讯AI Lab联合苏大提出一种新颖的RL评分方法,7B小模型暴打72B巨头!
- 你说量化到底伤不伤害Reasoning啊?一项实证研究
- 3倍效率学习的漫画书《StatQuest图解机器学习(全彩)》
- NAACL2025 Oral | LLM的知识边界到底在哪里?
- 一个“打脸”结论!模型太大反而会损害推理能力
- 像人类一样看视频!VideoMind提出长视频推理新范式,超越 GPT-4o,AK两次转发!代码、数据、Demo全开源
- 多模态Reasoning新综述!从训练优化和实时推理角度全面总结
- 强大新RAG范式!动态将上下文转化为参数知识,有效缓解RAG幻觉!
- 各种角度全面聊聊Llama 4~
- 最新成果:基于图的 RAG 统一框架 in-depth 分析
- 136个样本训练8小时!UI-R1如何让小模型吊打GPT-4?
- 港中文发布全新视角高效Reasoning综述!idea已充满大脑…
- ICLR2025 | 基于动态提示扰动的软提示复杂推理优化方法
- 预训练真的结束了吗?可能没有,而且是以一种新范式出现
- idea满满的最新Test-Time Scaling综述!全面描述What, How, Where和How Well的问题
- 如何做审稿意见的辩驳(rebuttal)
- Video-R1:第一个多模态视频Reasoning方法+模型,7B小模型逆袭GPT-4o!
- 【上海AI Lab】大模型安全可信团队实习\联培博士\全职\博后招聘(校招和社招)
- 上海AI Lab发布LLM高效Reasoning综述!全面总结如何“少想多做”
- 2025上半年,您还可以看看这几个学术会议!
- 房产中介要失业?Agent学会了’忽悠’,结果买家居然更买账!| NICE53期
- LLM Agent在方法、应用和挑战全面综述!
- AgentDropout:踢出“划水队友”,Token消耗直降20%!性能还涨了!
- Agent主题分享@ICLR2025
- CoT是否仍是增强Reasoning能力的必要工具?
- 头部高校与公司联合发布:长上下文语言模型建模综述!
- 从优化角度看:怎样的奖励模型才能成为好的“老师”?
- 大模型个性化生成综述!AI私人订制,试衣、写作、拍视频!
- 理解 R1-Zero-Like 训练:一种批判性视角 | 原作者分析
- AI 百万招聘
- 综述 | 上交联合Amazon和耶鲁提出:从CoT Reasoning到语言Agent的搭便车指南
- 招生 | 北语信科学院BLCU-ICALL实验室招收研究生啦
- 先想后画!多模态CoT让AI具备语义-空间双推理链条!
- 42美元训练24小时!1.5B小模型逆袭o1,OpenAI方法论被开源了?
- 直播预告 | 多模态推理CoT全面综述
- Multi-Agent系统为何常“翻车”?伯克利指出其具有人类合作所有坏毛病!
- LLM-based Agent评估综述!
- 亲自说说字节 TopSeed 怎么样!
- 停止过度思考!一篇关于高效Reasoning的综述来了~
- 这篇Long CoT Reasoning综述隐藏好多idea啊!
- NICE50期论坛 | 大模型的高效新能源:数据合成与自动化评估
- CVPR 2025 | AI+足球!UniSoccer带你通往“足球大模型”之路
- 🌟 RWKV-7“Goose”来袭!
- 多模态思维链(MCoT)综述:迈向通用人工智能的关键一步
- TrustAgent Survey: 关于可信 LLM Agent 的综述
- 大模型对齐论文专题分享@ICLR2025
- 免训练的VLM剪枝方法!砍75% Token,仅牺牲0.6%效果,速度飙升
- AAAI’25 Oral | 用于密集知识型任务的长短轨迹学习结合多智能体联调框架
- 这才是真正的Agent模型:自我思考与行动,彻底摆脱外部工具
- 牛津提出新方法让LLM reasoning能力翻倍!从“单打独斗”进化成“团队作战”
- 招聘 | 上海算法创新研究院大模型实习生
- SIGIR25征稿 | 第二届基于Agent的信息检索研讨会
- 本周六!多模态论文分享@ICLR2025
- 本周日!知识编辑/推理/可解释等分享@ICLR2025
- 川普上台,US PHD申请大冲击!
- LLM能作为我们的数字孪生吗?
- 清华与人大最新研究表明:AGI的到来时间需70年与10^26个参数,好像不用那么急了
- 阿里通义RAG团队等提出RAG与长文本对比新框架,助力智能路由决策机制设计
- 阿里发现新方法:仅用小纸条和错题本,就能使数学近满分、code能力翻番…
- 复现和改进 DeepSeek-R1 的一些 tips
- DeepSeek-V3/R1 的 Hosting 成本预估
- 我的 RL 人生哲学: 写给Sutton & Barto的图灵奖时
- 西湖大学提出AppAgentX:“偷懒”也能高效?让Agent像你一样操作手机
- 上交&上海AILab:开源DeepSeek R1成功迁移多模态的方案与代码!
- NAACL 2025 | UniHGKR:指令感知的异构知识检索器
- 瞻仰下2024图灵奖得主:强化学习之父与导师的《强化学习》书籍!
- AI Infra | VeRL 框架入门&代码带读
- reasoning压缩token数量竟然有最小限制!
- 7B reasoning模型吊打DeepSeek,破解希尔伯特世纪难题
- 用极小模型复现R1思维链的失败感悟
- 终于有人站出来质疑LLM as a judge的合理性了!
- 1988场赛事炼成AI怪物!上交联合阿里MatchVision:足球解说比人类还丝滑,连C罗假动作都逃不过!
- 刚刚!大模型的门槛,又被打下来了!
- 浙大提出LightThinker: 新思考压缩术, 砍掉70%内存,省时26%,准确仅降1%
- 突破瓶颈:推进长上下文 LLMs 的发展 (KIVI & Self-Extend) - Zirui Liu 明尼苏达助理教授
- SafeRAG:首个中文RAG安全评测基准,全面揭示数据注入风险
- DeepSeek 被放弃了,阿里牛逼!
- AACL Chair选举进行中,港理工Prof, Wenjie Li为候选人之一!
- 从零开始绘制DeepSeek R1架构和训练流程
- 零基础入门:DeepSeek微调教程来了!
- 文献爆炸救星!SurveyX用LLM自动写综述!
- 从FlashMLA背后原理回顾KV Cache
- 论文生成器要失业?Meta开源「科研健身房」让大模型自己写代码做实验
- Qwen2.5-VL Technical Report!!! 操作手机电脑、解析化学公式和乐谱、剪辑电影等,妥妥六边形战士 !
- 大语言模型的‘自信’之道:如何在推理时选择沉默?
- 港理工提出TokenSkip:让大模型在CoT中“跳”过冗余token,压缩40%,性能几乎不降!
- DeepSeek 背后的数学原理:深入探究群体相对策略优化 (GRPO)
- 推理步骤长度对大型语言模型的影响
- JAI | 图像+语音+文本多模态语法归纳
- 上海算法创新研究院大模型实习生招聘
- 通过模型生成的解释理解LLM后门攻击
- ICLR2025分享会报名啦!
- 从理论到代码剖析DeepSeek-R1:从PPO到Reinforce++,再对比GRPO
- 三张图速通 DeepSeek-R1 论文和技术原理
- 2轮推理赶超已对齐模型?TPO:无需更新参数的对齐新思路
- 聊聊Reasoning Model的精巧实现(ReFT, Kimi K1.5, DeepSeek R1)
- Speculative Ensemble - 让大模型集合推理飞起来!
- 国产模型再秀硅谷!阿里Qwen2.5-Max数学、编程能力全球第一
- Deepseek R1 Zero成功复现, 三阶段RL,Response长度涨幅超50%,涌现语言混杂,double-check
- LightTransfer:将你的LLM轻松转为Hybrid model,增强o1-like长文本生成能力
- 腾讯AI Lab联合苏大上交提出:少切思路多挖矿,让o1类LLM做题不再「三心二意」
- 新突破!xJailbreak:用强化学习「越狱」大模型,可解释性黑盒攻击来了
- 探索如何将LLM应用到个人项目中,发现高性价比大模型新宠
- 北航团队发布XRAG-Ollama:助力轻便本地化部署RAG实验框架
- 谈谈对DeepSeek-R1的一些理解
- 大模型由”社恐”变身”懂王”的迷之自信从何而来?
- 从话痨到省流大师,效果堪比双十一满减:TALE让LLM学会“断舍离”
- Kimi k1.5:多模态强化学习,推理性能与效率双丰收
- 通义WebWalker: 大模型乘风破浪,探索网页深海
- 一文讲清楚大模型涉及到的精度:FP32、TF32、FP16、BF16、FP8、FP4、NF4、INT8
- 招生|上海交通大学谢伟迪组科研实习
- 为啥本科生都能发顶会,而博士一篇都没有?
- 综述OS Agents: MLLM智能体实现计算设备通用控制 | 浙大&OPPO&零一万物等
- 迈向多语言与多任务的医疗大模型:探索医疗语境中的语言基座模型
- deepseek技术解读(1)-彻底理解MLA(Multi-Head Latent Attention)
- 如何创建一个理性的基于LLM的Agent?
- Nvlink对大模型推理的速度有多大提升?
- 25年的大模型Infra,SSP人才画像?
- 阿里通义等提出Chronos:慢思考RAG技术助力新闻时间线总结
- 2025年Next Token Prediction范式会统一多模态吗?
- 2024 年终总结:Agent,Coding 与 AI Infra
- 邀请参与首届XLLM Workshop @ ACL 2025
- 2024年MLSys研究热点是什么?
- To Balance or Not to Balance? 一个简单有效的长尾任务训练方法
- LoRA 的原理和用 PyTorch 从零到一的代码实现
- 引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述
- 聊聊PRM(过程奖励模型)
- 2024 年度总结 LLM System Research:过去半年的科研心路历程
- 强大推理背后的危机:PRMBench 揭示过程级奖励模型的潜在缺陷!
- Virgo:类o1多模态大模型的初步探索
- 24届毕业生聊PhD就业,国内or国外、学术界or工业界or创业
- 清华团队靠强化学习让 7B 模型打败GPT-4o数学推理
- 博士生罢工、工资上涨、学术头秃:PI生存指南
- [vLLM vs TensorRT-LLM]:动态序列长度场景对比
- 图解Megatron TP中的计算通信overlap
- 从infra的视角聊聊DeepSeek-V3
- 手写self-attention的四重境界 self-attention
- o1类大模型的过度思考: 2+3=?
- 2024年RAG:回顾与展望
- Building effective agents笔记
- 微软公布OpenAI闭源模型参数!4o-mini 8B!
- NICE42期 | 语言模型不听话怎么办?关于格式忠实性的探索
- 评价deepseek v3:又一个相信自己比英伟达懂GPU计算并做到了的团队
- DeepSeek-V3技术报告解读
- 《大语言模型》:人工智能时代的知识盛宴,大模型中文书籍震撼发售!
- OpenAI-o3 与 Monte-Carlo 思想
- NICE41期 | 大模型评估的新视角:理论指标创新与下游任务应用分享
- 让Agent”少说废话”!打造高效的LLM多智能体系统
- 游凯超:我与vLLM的2024,很Passion!
- 最新RAG综述:15种经典RAG框架综述(上)
- 最新RAG综述:15种经典RAG框架综述(下)
- LLM实践–支线:分布式训练框架的编程基础
- NICE40期 | 自动生成模型卡与数据卡:迈向负责任的人工智能
- 刘鹏飞老师组研发PC Agent,让 AI 替你熬夜做 PPT
- LLM,一艘方向不对但积重难返的华丽游轮…
- o1复现的一点点心得
- 深度学习工作:从追求 SoTA 到揭示新现象
- 大模型推理张量并行的4种模式
- 百度&人大:长文本LLM全排序能力新方法
- 212页PPT:大模型时代的具身智能
- RWKV-7:极先进的大模型架构,长文本能力极强
- 今天Qwen2.5技术报告发布啦!
- Anthropic: 预训练阶段引入人类反馈更安全
- 图解OpenRLHF中基于Ray的分布式训练流程
- Tokenization不存在了?Meta最新研究,无需Tokenizer的架构来了
- 实践指南: hzwer大佬的模型优化与迭代策略
- 如何用一个统一的视角,分析RLHF下的各种算法?
- 3B模型长思考后击败70B!HuggingFace逆向出o1背后技术细节并开源
- 只要捞”偏门”,篇篇都是顶会顶刊!
- 圆桌会 | 荣幸邀请到Meta、OSU、哈佛&MIT学者来分享Agent前沿~
- NeurIPS Spotlight | 基于信息论,决策模型有了全新预训练范式统一框架
- 模仿、探索与自我提升:慢思考推理系统的复现之路
- 大模型Infra王朝2024
- 今晚8:30,荣幸邀请到电影导演和LLM科学家一起聊聊对多模态的见解
- NeurIPS 2024 | 哈工深提出新型智能体Optimus-1,横扫Minecraft长序列任务
- 如何增强大模型推理?Meta最新提出《大型概念模型》在句子表示空间中的语言建模
- 电影导演如何看待LLM解说电影
- 知乎大佬解析Ilya最新言论:pre-train丸啦,搞agentic和reasoning吧
- 从镜头到算法:多模态与电影的跨界对话
- LLM Agent的社会模拟综述
- 一位大佬的自述 | 从读博到 Google DeepMind : 旅程中的心得与感恩
- NeurIPS 2024 | MIT学者歧视国人!
- 模仿、探索与自我提升:慢思考推理系统的复现之路
- Ilya宣判:预训练即将终结!NeurIPS现场沸腾
- 无痛理解旋转位置编码RoPE
- 李飞飞、Bengio和何恺明在NIPS干了什么!
- 每个instance应该有自己的prompt!阿里提出新方法,突破零样本思维链局限
- LLM所有细分领域群、投稿群从这里进入!
- 田渊栋团队论文火了!连续思维链优于CoT,打开LLM推理新范式
- 基于向量模型的文本水印技术
- LLM所有细分领域群建立!
- ICML25、ACL25、NAACL25投稿群建立!
- 360自研AI大模型360GPT2-o1发布,多项评估优于GPT-4o
- ICLR 10分论文如何做到?原来掌握这些就能发顶会!
- NeurIPS 2024 | 智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
- 强化微调是个什么东西?
- 揭秘强化微调(ReFT):重塑大语言模型推理格局的突破技术
- 开源 Agent 小屋
- 让英雄查英雄,让好汉查好汉:LLM-as-a-judge综述
- 基于LLM的社交代理在博弈论场景中的综述
- 微软提出ICAE:从上下文压缩的角度看待推理加速
- 从答案到问题:一种新的学习目标让LLM更擅长推理
- 二战字节大模型算法岗,拿下70K offer!!!
- 盘点 2024 年的视觉语言模型VLMs
- 大模型时代的科研之路:写给过去的自己
- VL-RewardBench: 通往多模态 self-play 的试金石
- 浙江大学刘佐珠/吴健课题组 6篇论文被EMNLP 2024主会/Findings录用
- LLM不会CoT隐性推理,只会显性推理!
- 本科生大作业给8分,iclr评审机制的失灵?
- 很荣幸邀请两位研究员分享:大模型数据合成和增强技术
- 投机解码中高质量draft tokens不该被拒绝
- 一网打尽大模型长文本训练技术
- 什么是人生的最顶级享受?DeepMind上班,年薪120万磅,研究AI的深层次的推理和思考
- ICLR 高分:深入研究多模态大模型的对齐策略
- 探索 OpenAI O1 模型复现:从 Kimi K0-Math 到 DeepSeek R1 Lite
- 阿里提出Marco-o1:探索开放推理模型在复杂问题解决中的应用与突破
- 提点超30%的WebAgent新方法,比树搜索更灵活!
- MEMO-Bench揭示现有多模态在负面情绪图片识别与生成上存在巨大缺陷
- LLM是如何将信息检索杀死的?
- 微软发现不同prompt模版会导致最大40%性能差距!
- DeepSeek 推理模型预览版上线,解密 o1 推理过程
- 大模型也有侧脑?揭秘WISE如何带来终生学习新突破
- LLM也怕你妈叫你回家吃饭这种模糊请求,纽大提出指导LLM澄清问题
- 最值得参加的LLM盛会!多模态/Agent/具身智能/安全/评估等15个论坛!
- 人人都能看懂的RL-PPO理论知识
- 最新多模态大模型综述|连续还是离散?多模态大模型的进化之路
- ICLR突发:我论文的图,但作者不是我???
- 个人从零预训练1B LLM心路历程
- LLM性能优化中的一些概念扫盲
- EMNLP 2024 | 基于知识编辑的大模型敏感知识擦除
- 大模型图形用户界面操作智能体(GUI Agents)综述:数据、架构、分类、应用、挑战
- 中科院杨万里:大语言模型编辑中的崩溃相关系列研究分享
- “大模型智能体”论坛详情公布|CIPS-LMG2024
- “大模型安全与对齐”论坛详情公布|CIPS-LMG2024
- “大模型与生成的评估”论坛详情公布|CIPS-LMG2024
- “科学智能”论坛详情公布|CIPS-LMG2024
- “大模型搜索与推荐”论坛详情公布|CIPS-LMG2024
- EMNLP2025!苏州!
- AI回答,不止于文字!阿里OmniSearch与传统的一场检索较量
- 模型解释新方向!浙大揭秘LLM隐层之间的知识流动!
- 从虚构到现实!FAME助力模型编辑走向实际应用
- 告别随机采样!PRS:一种简单高效的数据采样新方法
- NICE32期 | 迈向可信的AI:探索安全、负责的大语言模型
- NeurlPS 2024 | 揭秘大模型内部工作机制!Diff-eRank为大模型评估提供全新视角与方法
- 讲习班日程公布|中国中文信息学会2024学术年会暨第三届全国大模型智能生成大会(CIPS-LMG2024)
- 一起理解下LLM的推理流程
- FlashAttention算法之美:极简推导版
- NeurIPS 2024 | LLM能理解视频中的时间吗?港理工、腾讯提出细粒度视频理解新基准
- 开放注册|中国中文信息学会2024学术年会暨第三届全国大模型智能生成大会(CIPS-LMG2024)
- NICE31期 | 微软+罗格斯大学提出:使用交互式推测解码赋能Agent,将智能体规划速度提高一倍!
- ElectionSim:首个大模型智能体驱动的大规模人口选举仿真框架,实现美国总统大选高精度模拟
- EMNLP 2024 Oral | CoBa:均衡多任务收敛之道
- LLaMA系列一直在假装开源…
五角钱的程序员
- 你写的每一行代码都在贬值?怎么让存量资产价值翻倍
- 从 12s 到 200ms,MySQL 两千万订单数据 6 种深度分页优化全解析
- Join语句该如何优化?
- Mysql 是什么?架构是怎么样的?
- 涨薪1.6倍!程序员均可参加!免试入学!在岗可报!
- 面试题:数据湖存储如何加速?
- Redis 是什么?架构是怎么样的?
李rumor
- 再次封神!AI大模型又起飞了!
- 大模型系统性能优化trick
- 让RAG更聪明,通义实验室ViDoRAG开启视觉文档检索增强生成新范式,重塑大规模文档集合迭代推理!
- 154W!AI圈彻底沸腾吧!这个好消息来得太及时!
- deepseek-R1自测效果分析和选择建议
- 多模态大模型事实正确性评估:o1最强,模型普遍过于自信,最擅长现代建筑/工程技术/科学
- NExtLong|不使用长文档也能训练出来SOTA长文大模型!
- 招大模型实习生@北京
- Phi-4预训练居然用了40%的合成数据
- NeurIPS 2024 | 智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
- 我看看谁还在手写Prompt?
- 使用合成数据训练会有什么问题?
- 中国生成式AI大会即将登陆上海,全解大模型、AI Infra、端侧AI、视频生成和具身智能,40+位重磅嘉宾抢先看!
码农的荒岛求生
- 进程调度器是怎么一步步发明出来的?
- 操作系统是如何一步步发明进程间通信的?
- 内核视角看线程是如何一步步死锁的?
- 操作系统是如何一步步发明系统调用机制的?
- 操作系统是如何一步步发明进程、线程的?
- 操作系统是如何一步步发明中断机制的?
- 为什么复制大文件时进度条在后半段突然加速?
- CPU与GPU到底有什么区别?
- 真心建议大家冲一冲新兴领域,工资高前景好!
- 有可能一个人写出windows操作系统吗?
- 增加内存会让计算机变快吗?
- 比printf高效1000倍!如何精准捕捉C/C++野指针
- 有可能一人搞定CPU、操作系统、编译器吗?
- 为什么多线程编程这么难?
- 为什么用C语言编写操作系统?
- 操作系统是如何实现的:宏内核 VS 微内核
- 进程切换的本质是什么?
- 一件极其愚蠢的事!
- 计算机的本质是什么?
- 彻底理解零拷贝技术,zero-copy
- 操作系统是怎样一步步接收键盘按键的?
- 计算机中那些不为人知的事实!
YeungNLP
- Qwen开源QwQ-32B,“小”模型性能比肩DeepSeek-R1,RL的魅力
- 通义千问发布深度推理模型QwQ-Max-Preview
- 书生·浦语大模型升级,突破思维密度,4T数据训出高性能模型
- 强推理模型书生InternThinker开放体验:自主生成高智力密度数据、具备元动作思考能力|通专融合探索新进展
RUC AI Engine
- 「人大 x 阿里」Think Before Recommend: 释放序列推荐模型隐藏的推理能力
- 用大语言模型智能体探索霍曼斯社会交换理论
- RAG检索增强生成技术进展 | 2024年相关论文总结
- Test-Time Scaling 近期工作调研
- 基于大语言模型智能体的社交媒体舆情模拟
- ICML 24 因果推断论文调研
- AI Engine 实验室多篇论文被 ICLR 25, NAACL 25 及 TheWebConf 25 录用
- 当AI有了自己的”开放世界”:CharacterBox让AI在虚拟世界中自由扮演
- EMNLP’2024论文分享 | 基于大语言模型的人机协同复杂任务
- EMNLP 2024 LLM-based Agent 相关论文总结
- NeurIPS 2024 | 大语言模型智能体方向相关论文集锦
- NeurIPS 2024 机制可解释性论文总结
- AI Engine实验室师生参加CNCC 2024学术会议
猴子数据分析
- 月薪已炒到6W?强烈建议数据人冲一冲这个新兴领域
- 数据太复杂?DeepSeek自动处理数据,AI 1秒搞定!
- 年薪96W!真心建议数据人冲一冲新兴领域,工资高前景好
- 受尽PPT 周报折磨!DeepSeek拯救打工人
- 如何最简单、通俗地理解大模型?
- 通俗易懂:什么是AI、机器学习、深度学习、强化学习?
- 别卷剪辑了!用DeepSeek制作影视大片,开场直接封神
- 教你1分钟给DeepSeek接入你的知识库
- 免费白嫖DeepSeek满血版,再也不怕服务器繁忙!
- 免费白嫖DeepSeek满血版,再也不怕服务器繁忙!
- 教你1分钟给DeepSeek接入你的知识库
- 别再共情哪吒,学学快乐的土拨鼠!
- 如何判断一个产业所处的阶段?以AI行业为例
- 为什么人工智能用 Python?
- 人力资源的分析思路和技巧
- 只要会复制粘贴,创意图表你也能做
- 数据分析为什么常用Jupyter?
- 数据分析师分为哪几种?带你一张图看懂
- 如何衡量和分配广告渠道?
- 如何通过腾讯、字节跳动、网易的面试?
- 20个真实行业数据免费下载
- 1分钟教你玩转组合图表
- 数据分析综合实战项目视频来啦
- 如何看懂图表?太全啦
- 工作里如何解读报表?实战案例来啦
- 数据分析思维案例:游戏评分低,怎么办?
- 恭喜了!全体数据人彻底狂欢吧!这个好消息来得太及时!
- 手把手教你如何创建和美化图表,老板直接给我升职!
- 销售数据发生波动,怎么办?
- 7道题,测测你的Excel水平
- 通俗易懂的学会:SQL窗口函数
- Python数据分析要学哪些?帮你少走弯路
- 如何进行竞品分析?
- 免费白嫖:数据分析常用软件安装视频
- 做的图表配色太丑,怎么办?
- 如何做好工作汇报?数据分析报告最全资料
- 小白玩转AI核心技能Python
- 简历进入待沟通状态,为什么HR没有联系我?
- 内推和自己投简历区别大吗?数据给你答案
- 通过邮件投递简历应该注意哪些细节呢?4个容易踩的坑
- 裁员严重,大家做好准备吧…
- 如何看懂行业分析报告?
- 如何快速学会Excel数据分析和数据思维?
- 原来当年方文山这样投简历
- 投出的简历都石沉大海大海?教你几招命中率极高
ChallengeHub
- txtai:全能AI框架
- Suna -开源智能体助手
- 你敢信!LoRA也能训练出强大的推理模型——Tina让小模型“智商爆表“
- RAG不需要切块向量化了?通过PageIndex构建Agentic RAG
- 检索增强生成(RAG)的最新发展:一文汇总11种新型RAG算法!
- RAG 与 MCP 如何以不同方式解决大模型的局限性
- 实战教程来了!从零开始打造MCP+Ollama集成
- 一文详解模型上下文协议MCP
- RAG文档解析:EasyDoc文档解析API实测体验分享
- AI革命进入下半场:是时候上车Agent了!
- 谷歌的A2A到底是什么东西?
- RAG 真的已死?为什么大上下文窗口还不够(至少目前如此)
- 重磅:智谱AI推出新一代GLM系列模型,性能媲美千亿参数模型!分享一波深度体验
- 如何在Agent中设置Memory
- 体验智能体构建过程:从零开始构建Agent
- AI代理是大模型实现可扩展智能自动化的关键
- Agent系列教程01-什么是Agent?当今为什么这么重要?
- 《我认识的最优秀的程序员》
- APIGen-MT:高效生成多轮人机交互Agent数据的两阶段框架
- 怎么构造思维链数据?思维链提示工程的五大原则
- 构建Agentic RAG 系统的方法有哪些?
- 推理模型不一定说的是真话:关于大模型“思维链”的隐藏真相
- 大模型背景下智能体、工具、函数和MCP傻傻分不清?
- 精选的 MCP Server集合!
- LangGraph Agent 架构图
- 端到端多模态模型:Qwen2.5-Omni发布
- LLM模型尺寸的秘密:模型大小如何影响性能、成本与实际应用?
- 从代码检索到生成,Code Embedding Model如何改变开发者的工作方式?
- 【RAG实战 】 手把手教你从零手撸一个语义切块,解锁更多优化技巧!
- AI老板心中的迈巴赫:DeepSeek+Ollama+Xinference+RAGFlow+Dify部署教程,RAG落地5件套!
- 为什么 RAG 会失败以及如何解决?揭秘背后三大致命缺陷!
- 解锁的搜索与推理新模式:DeepSearch与DeepResearch的区别
- RAG经验分享:如何选对Embedding模型?
- 推理大模型的后训练增强技术-如何系统地理解和提升长思维链推理能力
- 大模型技术交流群(主要RAG、LLM方向)
- 推理大模型的后训练增强技术-Reasoning模型也进化到2.0了,这次居然学会用工具了
- 🚀 RAG 课程推荐-RAG Zero to Hero Guide
- 推理大模型的后训练增强技术-从系统1到系统2:大语言模型推理能力的综述
- 【实测】单卡跑满血版DeepSeek|CSGHub集成KTransformers
- 检索增强生成 (RAG) 的 5 大 提示词,非常实用!
- Gemma 3 27B版本超越DeepSeek V3:技术要点分析!
- 推理大模型的后训练增强技术–LLM 推理型的现状(文末送书)
- 大模型对不同职级工程师的影响曲线
- 关于DeepResearch设计实现的碎碎念
- 推理大模型的后训练增强技术-强化学习篇
- 推理大模型的后训练增强技术-指令微调篇,如何用指令微调提升推理能力?
- 推理大模型的后训练增强技术-预训练篇
- 【论文分享】推理大模型Post-Training技术的全面综述
- RAG学习必备,论文+实战+经验全收录!
- HuggingFace 又出新教程啦!手把手教你构建DeepSeek-R1推理模型
- 图解KV Cache:解锁LLM推理效率的关键
- LevelRAG:突破查询重写瓶颈,提升混合检索效果
- 6 大 RAG 知识库PDF文档处理神器对比,谁才是你的最佳选择?
- 【内推】蚂蚁数字医疗健康事业部火热招聘!
- DeepSeek开源周 Day05:从3FS盘点分布式文件存储系统
- DeepSeek开源周 Day04:从DualPipe聊聊大模型分布式训练的并行策略
- DeepSeek开源周 Day03:从DeepGEMM看大模型算力提速的矩阵乘法
- DeepSeek开源周 Day02:从DeepEP开源趋势重新审视大模型Infra
- DeepSeek开源周 Day01:从FlashMLA背后原理回顾KV Cache
- 关于Grok3和DeepSeek背后苦涩教训引发的思考
- 基于unsloth高效复现GRPO
- 火山引擎:邀请可拿3000万tokens,畅享671B DeepSeek R1!
- 从零开始优化 RAG 流程的终极指南,解决检索增强生成的核心挑战
- 注意力机制进化史:从MHA到MoBA,新一代注意力机制的极限突破!
- 硬件对齐+原生训练!DeepSeek NSA打造高效稀疏Attention
- 满血版Deepseek R1来了,问小白app专线,免费不限次、超丝滑!
- 大语言模型简史:从Transformer(2017)到DeepSeek-R1(2025)的进化之路
- 7个用于改进RAG中检索的指标(文末抽奖送书!)
- RAG科普文!检索增强生成的技术全景解析
- 一文深入了解DeepSeek-R1:模型架构
- DeepSeek-R1复现方案梳理
- DeepSeek 背后的数学原理:深入探究群体相对策略优化 (GRPO)
- RbFT:针对RAG中检索缺陷的鲁棒性微调
- DeepSeek-R1 论文解析——人工智能领域的 RL LLM 新时代?
- 深入了解Deepseek模型的最佳三篇论文
- 图解DeepSeek R1训练流程
- RAG与CAG的较量与融合
- 【HuggingFace项目】:Open-R1 - DeepSeek-R1 大模型开源复现计划
- RAG如何让生成AI更智能?最新方法与优劣深度解析
- 【RAG落地利器】向量数据库Weaviate部署与使用教程
- RAG文档分块新思路:LGMGC如何提升文档分块的语义连贯性?
- Weaviate、Milvus、Qdrant 和 Chroma 向量数据库对比
- LLM Agent和 Agentic RAG 的最佳综述
- 【RAG落地利器】向量数据库Milvus教程:如何实现MetaData检索过滤
- 重新思考RAG的相关性:相似≠相关
- 【RAG落地利器】向量数据库Qdrant使用教程
- RAG 切块Chunk技术总结与分块实现思路分享
- 【Weaviate官方指南】请查收一份RAG高阶技巧!
- 【RAG最新研究】优化RAG系统的最佳实践与深度解析
- 2024必读的100篇生成式AI论文清单
- 掌握RAG查询优化技巧,让你的检索与生成效率翻倍!
- 你的RAG系统真的达标了吗?生产环境RAG成功的7大关键指标
- 你的RAG出错了?快来Get这份改进秘籍
- 分块的艺术:提升 RAG 效果的关键
- RAG实战-Markdown文件解析思路分析与实现
- 关于RAG你不得不了解的17个技巧
- CCF对话式检索增强生成Top1赛后方案
- 干货!带你了解7种检索增强生成 (RAG) 技术
- 检索增强生成 和思维链 结合: 如何创建检索增强思维链 (RAT)?
- 如何从文档构建自己的 RAG 评估数据集
- 年终巨献 | OpenCSG开源SmolTalk Chinese数据集
- Agent未来已来?揭示LLM Agent技术架构与现实挑战
- 揭秘o1类模型的过度思考:明明只需5个token,它偏要用900个?
- 2024年RAG:回顾与展望
- 5个开源RAG框架对比
- HYBGRAG如何优化半结构化数据的检索问答?
- 一文带你全面了解 RAG 核心组件
- GLM-4V-Flash助力多模态RAG实现,智谱免费模型全家桶强势上线
- DeepSeek-V3发布:编程能力超过 Claude Sonnet 3.5!
- QVQ-72B-Preview:用智慧看世界
- 我与vLLM的2024,很Passion!
- 如何构建一个可信的联邦RAG系统
- LLM训练-sft
- 不是炒作GenAI!终于有 BERT 的替代品了
- Qwen 2.5 技术报告发布!其中有什么秘密?
- LLM训练-pretrain
- 【LLM训练系列04】手把手教你Qlora微调
- 【RAG实战】Prompting vs. RAG vs. Finetuning: 如何选择LLM应用选择最佳方案
- 【LLM训练系列03】关于大模型训练常见概念讲解
- GBDT 在电商销售中的预测分析
- 通过战略性文档重新排序技术提升RAG性能
- RAG七十二式:2024年度RAG清单
- CAG: 基于上下文感知的检索增强生成
- 多样化查询改写让 RAG 不再“迷路”
- Auto-RAG:基于大模型的自主检索增强生成
- 在消费级GPU调试LLM的三种方法:梯度检查点,LoRA和量化
- 【LLM训练系列02】如何找到一个大模型Lora的target_modules
- 【LLM训练系列01】Qlora如何加载、训练、合并大模型
- 非科班秋招收割金融、互联网大厂多家数分Offer!
- 因子分析挖掘客户金融行为的潜在因素
- 4万字+详解Ploars进阶篇!Ploars宝典
- Invar-RAG:基于不变性对齐的LLM检索方法提升生成质量
- 还在用Pandas?Polars!这篇就够了,2.5万字+详解!
- RAGulator:如何识别和缓解大模型所谓的“忠实幻觉”
- 因果效应中工具变量法在电商营销中的应用分析
- 从检索到生成:解密自适应过滤的RAG创新之路
- ARIMA 在电商销售数据的分析应用
NLP日志
- 左右手互搏之术CK-PLUG:在RAG中如何更加精准调控LLM对于模型内部知识跟外部检索知识的依赖?
- Think Twice: 我最好的“作品”永远是下一个
- MTEB 2.0升级有感–新世界的船,载不了旧时代的残党
- RevThink: “逆向思维”助力每一个LLM梦想
- 语言模型之text embedding(实战篇)
CVHub
AIGC Studio
- GigaAI发布全球首个解耦式人体视频生成框架HumanDreamer,可生成由文本到姿态到人体的高质量视频!
- 南洋理工 & 牛津 & 新加坡理工提出Amodal3R,可从遮挡 2D 图像重建完整 3D 资产,3D生成也卷起来了!
- 阿里EMO2重磅升级!手部动作生成+超逼真表情,音频驱动人像视频生成再进化!
- 字节跳动提出Pixel-SAIL!单一Transformer实现三大突破,性能不降反升!
- 图像编辑革命,万物皆可插入!浙大/哈佛/南洋理工提出Insert Anything,告别PS抠图,AI让世界无缝生长。
- 港科大提出Turbo2K!2K视频生成的效率革命!20倍加速+VAE蒸馏,4K级画质触手可及!
- 单图生成3D头像+AI编辑+多模态驱动?阿里LAM让虚拟人“活”了!
- 不会画画也能做动漫线稿!ComfyUI图像转线稿神器实测来了!
- CVPR 2025 Highlight | 清华提出一键式视频扩散模型VideoScene,从视频到 3D 的桥梁,一步到位!
- 11个ComfyUI隐藏技巧,老司机都在用,第7个你绝对想不到!
- 阿里提出文生卡通新方法Textoon:一分钟内生成丰富多彩、可交互的Live2D格式角色。
- 南洋理工 & 牛津 & 新加坡理工提出Amodal3R,可从遮挡 2D 图像重建完整 3D 资产,3D生成也卷起来了!
- 单图生成3D头像+AI编辑+多模态驱动?阿里LAM让虚拟人“活”了!
- 开源项目FastAPI-MCP,一键将FastAPI转换成MCP服务器,以后API=MCP。
- 100行代码讲透MCP原理
- 一文带你了解,MOE 架构是什么?
- 阿里EMO2重磅升级!手部动作生成+超逼真表情,音频驱动人像视频生成再进化!
- ComfyUI | 最强吉卜力风格工作流EasyCN来袭,风格统一+操作简便+输出稳定!
- 港科大提出Turbo2K!2K视频生成20倍加速+VAE蒸馏,4K级画质触手可及!
- olmOCR:重塑PDF文本处理,让语言模型更智能、更强大!
- GPT4o平替?腾讯混元&InstantX开源InstantCharacter,可实现跨角色外观、姿势和风格开放域个性化生成。
- 炸裂!ComfyUI 原生支持 HiDream-I1,全新文本转图神器来了!
- AI编程神器Cursor,保姆级教程来了!
- 智谱发布GLM-4-32B系列模型,以32B模型参数比肩GPT-4o和DeepSeek V3/R1。
- 阿里&北邮提出基于Wan2.1的音频驱动数字人FantasyTalking,只需输入肖像、语音和文字即可生成动画。
- 如何使用DeepSeek进行科研图表绘制?
- TripoSG:一键使用AI在数秒内生成3D设计,支持文本/图像/涂鸦等多种方式,引领3D生成潮流!
- 字节发布视频基础大模型Seaweed,70亿参数超越同类140亿参数视频模型效果,单GPU就可生成1080P!
- DiffRhythm:创作完整歌曲,支持文本转音乐和纯音乐生成,MacOS 上可运行!
- 一文带你了解,MOE 架构是什么?
- 阿里提出OmniTalker,从文本联合生成语音和说话视频!
- 昆仑万维提出开源版视频生成模型SkyReels-A2,可实现多图输入作为参考高效生成视频,超多玩法等你探索!
- 开源十几小时狂揽1w多星!OpenAI发布Codex对抗200亿美金估值的Cursor。
- 智谱发布GLM-4-32B系列模型,以32B模型参数比肩GPT-4o和DeepSeek V3/R1。
- 效果炸裂!Controlnet作者新作FramePack颠覆视频生成编码,6G显存即可完成单图到60秒视频生成。
- 何恺明ResNet登顶!Transformer上榜,Nature揭秘21世纪引量用最多的论文!
- 谷歌研究院联手牛津大学推出Bolt3D!7秒内单GPU生成高保真3D,推理成本直降300倍!
- 港科&腾讯&清华提出全球首个多模态Mamba生成框架ACTalker,支持多信号输入,数字人嘴型同步再升级!
- 国产大模型崛起!智谱发布GLM-4-32B-0414系列模型,以32B模型参数比肩GPT-4o和DeepSeek V3/R1。
- 一文了解 DeepResearch:AI 如何重塑深度研究与知识整合
- 亲测 Gamma:AI 3 分钟生成 PPT ?手残党终于告别熬夜做 PPT 了!
- 图像自回归新范式!阿里达摩院提出FAR!基于频率渐进自回归的图像生成方法!
- 港科&腾讯&清华提出全球首个多模态Mamba生成框架ACTalker,支持多信号输入,数字人嘴型同步再升级!
- 字节跳动提出Phantom!跨模态对齐技术实现人物/多主体完美复刻,秒杀商业方案!
- 报名 | 参加AMD AI PC应用创新大赛,开启PC端大模型应用的无限可能
- IC-Light升级,支持视频重打光! RelightVid可在多视频场景中重照明,支持文本提示、背景视频和HDR输入!
- IC-Light升级,支持视频重打光! RelightVid可在多视频场景中重照明,支持文本提示、背景视频和HDR输入!
- Magic Mirror:可从单个参考图像生成电影级质量身份一致性和自然运动视频
- 重磅更新!微信电脑版终于能发朋友圈了!
- 数字人技术再突破!阿里通义提出OmniTalker,从文本联合生成语音和说话视频,支持多种生成方式!
- 图生3D新SOTA!港中文&字节&清华联合提出Hi3DGen:通过法线桥接从图像生成高保真 3D 几何图形。
- 阿里千问发布QwQ-32B:性能肩比DeepSeek,只需DeepSeek的1/20参数,一张显卡就能跑!
- 字节提出从单一主题发展到多主题定制的通用框架UNO,通过情境生成释放更多可控性。
- TripoSG:一键使用AI在数秒内生成3D设计,支持文本/图像/涂鸦等多种方式,引领3D生成潮流!
- olmOCR:重塑PDF文本处理,让语言模型更智能、更强大!
- 阿里提出OmniTalker,从文本联合生成语音和说话视频!
- RelightVid:用于视频重照明的时间一致性扩散模型
- 图像生成DeepSeek时刻?智象未来开源文生图模型HiDream-I1,17B参数,GenEval和DPG基准测试第一名!
- 图生3D新SOTA!港中文&字节&清华联合提出Hi3DGen:通过法线桥接从图像生成高保真 3D 几何图形。
- 奥特曼难以入睡!ChatGPT 解锁完整记忆,所有聊天记录 AI 全知道了,包过“黑历史”
- 图生3D新SOTA!港中文&字节&清华联合提出Hi3DGen:通过法线桥接从图像生成高保真 3D 几何图形。
- 上海AI Lab提出FaceShot!地标匹配+语义驱动,让任何角色瞬间“活”起来!
- ComfyUI插件安装失败率90%?教你4种方法0踩坑
- TripoSG:一键使用AI在数秒内生成3D设计,支持文本/图像/涂鸦等多种方式,引领3D生成潮流!
- TripoSG:一键使用AI在数秒内生成3D设计,支持文本/图像/涂鸦等多种方式,引领3D生成潮流!
- IBM提出多模式图像文本到文本模型SmolDocling,可实现代码 | 公示 | 图表 | 表格 | 标题 高效转换!
- 音视频同步生成的终极突破!浙江大学提出JavisDiT!HiST-Sypo技术实现帧级对齐!
- EasyControl,开源免费「吉卜力」风格图像生成,效果不输给GPT-4o!
- 字节开源换脸写真模型InfiniteYou,可实现零样本身份ID一致保持,无缝集成FLUX、ControlNets、LoRAs!
- 阿里同义提出风格化实时肖像视频生成框架ChatAnyone,4090可实现实时交互式视频聊天。
- Mistral 发布 Mistral OCR,号称世界上最好的 OCR 模型!一起来看实际效果!
- 浙大提出视频生成方法VidSketch:可从手绘草图和简单的文本描述生成高质量视频动画。
- 阿里提出文生卡通新方法Textoon:一分钟内生成丰富多彩、可交互的Live2D格式角色。
- 字节开源换脸写真模型InfiniteYou,可实现零样本身份ID一致保持,无缝集成FLUX、ControlNets、LoRAs!
- FlashFace: 具有高保真身份保存的人像个性化方法,效果超越InstantID,人脸定制化更逼真了!
- Google 发布最新开源模型 Gemma 3 性能超越DeepSeek V3、o3mini为全球第二强开源模型!
- 阿里同义提出风格化实时肖像视频生成框架ChatAnyone,4090可实现实时交互式视频聊天。
- 3D虚拟人ExAvatar:由简短视频建模转化为3D数字形象。
- IBM提出多模式图像文本到文本模型SmolDocling,可实现代码 | 公示 | 图表 | 表格 | 标题 高效转换!
- 南洋理工 & 牛津 & 新加坡理工提出Amodal3R,可从遮挡 2D 图像重建完整 3D 资产,3D生成也卷起来了!
- TRELLIS:用于创建多功能、高质量的360°全景图生成方法,实现可扩展多功能3D生成。
- 阿里千问发布QwQ-32B:性能肩比DeepSeek,只需DeepSeek的1/20参数,一张显卡就能跑!
- 阿里提出ChatAnyone,可实现实时交互式视频聊天。
- 深入解读CrossFaceID:专为面部定制优化的高质量数据集,解锁面部定制新境界。
- 优于InstantID!中山大学提出ConsistentID:仅使用单个图像根据文本提示生成不同的个性化ID图像。
- 小红书InstantID来了, 一张照片几秒钟就能生成个性化图片, 无缝衔接Stable Diffusion)
- 阿里发布新ID保持项目EcomID, 可从单个ID参考图像生成定制的保ID图像,ComfyUI可使用。
- FlashFace: 具有高保真身份保存的人像个性化方法,效果超越InstantID,人脸定制化更逼真了!
- olmOCR:重塑PDF文本处理,让语言模型更智能、更强大!
- DPG-Bench榜首!智谱开源文生图模型CogView4:支持中英文输入和生成,免费商用授权!
- 图像自回归新范式!阿里达摩院提出FAR!基于频率渐进自回归的图像生成方法!
- 阿里发布新开源视频生成模型Wan-Video, 支持文生图和图生图,最低6G就能跑, ComfyUI可用!
- 公众号10000粉丝啦!与你分享一些背后的故事。
- Google 发布最新开源模型 Gemma 3 性能超越DeepSeek V3、o3mini为全球第二强开源模型!
- Manus平替来了!CAMEL-AI开源OWL,开源框架中排名第一,上线一天获得3.3K stars!
- 3D虚拟人ExAvatar:由简短视频建模转化为3D数字形象。
- ComfyUI | OmniGen-ComfyUI:简化多任务图像生成和编辑操作,一键生成任意你想要的效果!
- 超多可玩!Open AI 更新GPT-4o 图像生成功能,以后工作流不存在了?
- 非常好用的DeepSeek喂饭指令,快收藏备用。
- DiffRhythm:创作完整歌曲,支持文本转音乐和纯音乐生成,MacOS 上可运行!
- DPG-Bench榜首!智谱开源文生图模型CogView4:支持中英文输入和生成,免费商用授权!
- 360智脑团队宣布成功复现Deepseek的强化学习效果,发布并开源其推理模型:Light-R1-14B-DS
- 谷歌推出PaliGemma 2 mix:用于多任务的视觉语言模型,开箱即用。
- CineMaster: 用于电影文本到视频生成的 3D 感知且可控的框架。
- Magic Mirror:可从单个参考图像生成电影级质量身份一致性和自然运动视频
- IBM提出多模式图像文本到文本模型SmolDocling,可实现代码 | 公示 | 图表 | 表格 | 标题 高效转换!
- Seed-Music:字节跳动开发的音乐生成模型 支持多种数据输入生成和编辑音乐!
- 震惊!东京大学提出ARTalk!语音驱动3D面部动画大突破!
- 腾讯优图提出首个基于DiT的高保真虚拟试衣算法FitDiT
- Window上6G显存就能跑文/图生3D?腾讯开源Hunyuan3D-2 Windows 便携版,轻松运行腾讯混元3D 2.0!
- 腾讯发布混元-3D 2.0: 首个开源高质3D-DiT生成大模型,几何结构更加精致,纹理色彩更加丰富。
- 腾讯HunYuan-3D 1.0,支持文本到3D和图像到3D,10秒即可生成高分辨率细3D模型。
- AI听觉革命!港科大×月之暗面发布AudioX,文字/视频/图片秒变天籁神曲!
- 多身份定制化视频创作新突破!Ingredients:可将多个身份照片整合进视频创作实现个性化视频生成。
- 单张照片生成3D头部模型!Adobe提出FaceLift,从单一人脸图像重建360度头部模型。
- LBM:用于图像到图像直接快速转换,支持可控照明、图像恢复、物体移除等功能!
- CVPR 2025 | 多实例扩散模型MIDI:可从单个图像创建高保真 3D 场景,模型&代码已开源。
- AI创作从此无所不能!复旦大学提出UniCombine!多条件可控生成的终极武器!
- 从故事直接生成视频?一起来看DreamRunner如何重塑内容创作。
- 人类运动生成新方法MoMask:可将文本描述作为输入并生成相应的高质量人体运动动作
- 图像超分辨新SOTA!南洋理工提出InvSR,利用大模型图像先验提高SR性能, 登上Huggingface热门项目。
- CVPR 2025 | 多实例扩散模型MIDI:可从单个图像创建高保真 3D 场景,模型&代码已开源。
- CVPR 2025 | 机器人双臂操控新突破!KStar Diffuser如何解决自碰撞与运动约束世纪难题?
- 利用多模态模型赋能,SONY团队完成音乐到音乐视频描述生成大突破!
- 港科大×月之暗面发布AudioX,文字/视频/图片秒变天籁!
- CVPR 2025 | 革新Transformer!何恺明联手LeCun提出DyT:归一化不再是必需?
- AI创作从此无所不能!复旦大学提出UniCombine!多条件可控生成的终极武器!
- 阿里推出升级版AI翻译工具:Marco MT 性能超越Google、DeepL和ChatGPT
- NVIDIA提出虚拟试衣新方法EARSB,让时尚与科技完美融合!
- 港科大×月之暗面发布AudioX,文字/视频/图片秒变天籁!
- 清华人大上交大教授领衔,DeepSeek时代中国生成式AI大会4月举行!Manus最强平替和杭州六小龙之一也来了
- DeepSeek的“开源周”汇总,大模型开闭源之争来了!
- AI创作从此无所不能!复旦大学提出UniCombine!多条件可控生成的终极武器!
- OpenManus:5个人三小时复刻开源版Manus,不需邀请码, GitHub已获 8k+ star!
- DeepSeek的“开源周”汇总,大模型开闭源之争来了!
- DeepSeek们的成本,是怎么计算的?
- 阿里发布新开源视频生成模型Wan-Video, 支持文生图和图生图,最低6G就能跑, ComfyUI可用!
- 【NeurIPS 2024】南理工提出IMAGPose!用于Pose引导人物图像生成的统一条件框架!照片级真实感!
- 创意图像编辑黑科技!Google上线Gemini 2.0 Flash 原生图像生成功能,动动嘴就能完成PS了!
- 港大&Adobe提出UniReal:通过学习真实世界动态实现通用图像生成和编辑。
- AI可以模仿人类手写签名了?DiffusionPen:实现手写文本生成的风格控制。
- ACM TIST 2025 | 综述 GenAI 与时尚 | 港理工、AiDLab
- 开源音乐生成模型DiffRhythm:可创作完整歌曲,支持文本转音乐和纯音乐生成,MacOS 上可运行!
- 香港科技大学提出YuE:Suno级别开源音乐生成模型,支持中文!
- Seed-Music:字节跳动开发的音乐生成模型 支持多种数据输入生成和编辑音乐!
- 中科大&科大讯飞重磅开源OpenMusic:高品质音乐生成工具!
- AI视听新体验!浙大&阿里提出视频到音乐生成模型MuVi: 可解决语义对齐和节奏同步问题!
- 音乐版 ChatGPT 就在这里:Suno V3几秒钟内就可创建两分钟高质量的完整歌曲!
- 硬刚Suno,StabilityAI推出Stable Audio 2.0,可生成三分钟44.1kHz立体声的高质量完整曲目
- 音乐版的ChatGPT来了,Suno几秒钟生成高质量歌曲!
- ACM TIST 2025 | 综述 GenAI 与时尚 | 港理工、AiDLab
- DPG-Bench榜首!智谱开源文生图模型CogView4:支持中英文输入和生成,免费商用授权!
- 南开提出1Prompt1Story,无需训练,可通过单个连接提示实现一致的文本到图像生成。
- 魔发奇缘,3D发型生成新突破!TANGLED:可用任意样式和视点的图像生成 3D 发束
- 迈向视觉大一统:UnifiedReward,多模态生成与理解的通用奖励模型!
- 中科大提出SPEED!5秒消除100个概念,高保真+高效,AI内容安全新标杆!
- 谷歌推出PaliGemma 2 mix:用于多任务的视觉语言模型,开箱即用。
- 一张图生成舞蹈视频!字节等发布黑科技X-Dancer:零样本音乐驱动,真实感碾压3D方案
- ComfyUI | 背景移除插件:ComfyUI-RMBG,支持物体、人脸、服装和时尚元素的精准分割
- 高通AI研究院提出SubZero:任意主体、任意风格、任意动作,AI创作从此无界!
- Magic Mirror:可从单个参考图像生成电影级质量身份一致性和自然运动视频
- 多模态图像生成模型Qwen2vl-Flux,利用Qwen2VL视觉语言能力增强FLUX,可集成ControlNet
- AI新秀Manus携手阿里通义千问,开启智能体新篇章!
- DPG-Bench榜首!智谱开源文生图模型CogView4:支持中英文输入和生成,免费商用授权!
- Magic Mirror:可从单个参考图像生成电影级质量身份一致性和自然运动视频
- 一张图生成舞蹈视频!字节等发布黑科技X-Dancer:零样本音乐驱动,真实感碾压3D方案
- Manus平替来了!CAMEL-AI开源OWL,开源框架中排名第一,上线一天获得3.3K stars!
- 阿里千问发布QwQ-32B:性能肩比DeepSeek,只需DeepSeek的1/20参数,一张显卡就能跑!
- QwQ-32B 测评和使用教程来了!
- 首个开源免费的商用级别克隆数字人模型,1080显卡可用,数字人不再有门槛。
- 南开提出1Prompt1Story,无需训练,可通过单个连接提示实现一致的文本到图像生成。
- Manus平替来了!CAMEL-AI开源OWL,开源框架中排名第一,上线一天获得3.3K stars!
- AI Agent 孵化器?CAMEL-AI框架介绍,一文带你读懂背后的逻辑。
- OWL Agent示例: 每个人的AI助手。
- OpenMauns:5个人三小时复刻Manus,不需邀请码!
- Manus平替? CAMEL-AI开源OWL,开源排名第一!
- OpenManus:5个人三小时复刻开源版Manus,不需邀请码, GitHub已获 8k+ star!
- Manus震惊全球AI界。全球首款通用AI Agent:三个问题带你了解!
- LuminaBrush 在图像上绘制照明效果的构建交互式工具。
- Google发布新AI工具Whisk:使用图像提示代替文本,快速完成视觉构思。
- OpenMauns:5个人三小时复刻Manus,不需邀请码!
- DeepSeek之后,Manus再度震惊全球AI界。全球首款通用AI Agent:三个问题带你了解。
- 北大提出高效视频生成框架Magic 1-For-1!一分钟即可生成1min时长的高质量视频!
- 北航 | 第一个多功能即插即用适配器MV-Adapter:轻松实现多视图一致图像生成。
- 谷歌推出PaliGemma 2 mix:用于多任务的视觉语言模型,开箱即用。
- 阿里发布新开源视频生成模型Wan-Video, 支持文生图和图生图,最低6G就能跑, ComfyUI可用!
- 电商领域利器来了!港大&阿里提出MimicBrush,可模仿参考图进行零样本图像编辑。
- 澳门大学提出DC-ControlNet!解耦控制条件!灵活性和精度超过ControlNet!
- ICIR2025 | CubeDiff:无需考虑失真,重新利用基于扩散的图像模型来生成360°全景图
- ICIR2025 | CubeDiff:无需考虑失真,重新利用基于扩散的图像模型来生成360°全景图
- StochSync:可在任意空间中生成高质量360°全景图和3D网格纹理
- 单幅图像合成 360° 3D场景的新方法:PanoDreamer,可同时生成全景图像和相应的深度信息。
- TRELLIS:用于创建多功能、高质量的360°全景图生成方法,实现可扩展多功能3D生成。
- 南开提出1Prompt1Story,无需训练,可通过单个连接提示实现一致的文本到图像生成。
- CineMaster: 用于电影文本到视频生成的 3D 感知且可控的框架。
- 震惊!东京大学提出ARTalk!语音驱动3D面部动画大突破!
- Magic Mirror:可从单个参考图像生成电影级质量身份一致性和自然运动视频
- 超级智能“试衣镜”!GarDiff:高保真保持目标人物特征和服装细节,虚拟试穿技术新SOTA!
- 港大&Adobe提出通用生成框架UniReal:通过学习真实世界动态实现通用图像生成和编辑。
- 多模态图像生成模型Qwen2vl-Flux,利用Qwen2VL视觉语言能力增强FLUX,可集成ControlNet
- CineMaster: 用于电影文本到视频生成的 3D 感知且可控的框架。
- 多模态图像生成模型Qwen2vl-Flux,利用Qwen2VL视觉语言能力增强FLUX,可集成ControlNet
- 北航 | 第一个多功能即插即用适配器MV-Adapter:轻松实现多视图一致图像生成。
- 浙大 | 腾讯 | 华为提出视频生成框架VideoMaker,可由参考图实现Zero-shot定制化视频生成。
- 浙大提出视频生成方法VidSketch:可从手绘草图和简单的文本描述生成高质量视频动画。
- NVIDIA提出新框架ImageRAG!RAG+AIGC提升图像生成质量!
- 电商领域利器来了!港大&阿里提出MimicBrush,可模仿参考图进行零样本图像编辑。
- Meta提出Fast3R!多视角快速3D重建新SOTA!
- 理想汽车提出LDGen!颠覆多语言图像生成的革命性突破,美学与精准度的双重飞跃!
- [ComfyUI]阿里WanX2.1:最强开源视频模型易主!静待社区生态开源直逼闭源,Vbench榜首第一
- 国科大提出SayAnything!高保真语音驱动说话人视频生成神器!
- 深度长文|一文读懂多模态大模型:强化学习技术全面解读 SFT、RLHF、RLAIF、DPO
- CoT推理赋能文生图!港中文首次提出文生图的o1推理和inference scaling新范式。
- 开源版Deep Research,一句话创建Agent工作流帮你完成电脑上的复杂操作,股票分析也轻松实现。
- IC-Portrait:打造逼真个性化肖像的新纪元!
- DeepSeek将开启大模型免费潮?ChatGPT和文心一言相继宣布全面免费开放!
- 香港科技大学提出YuE:Suno级别开源音乐生成模型,支持中文!
- 马斯克疯了?Grok3 突然免费!还说让大家“用到服务器崩溃为止”
- 解决文生图质量和美学问题,字节跳动提出VMix:多维度美学控制方法,一键提升图像美学。
- 国科大提出SayAnything!高保真语音驱动说话人视频生成神器!
- LuminaBrush 在图像上绘制照明效果的构建交互式工具。
- ComfyUI 迎来重大更新:原生支持 Lumina Image 2.0,解锁极致图像生成体验!
- 国科大提出SayAnything!高保真语音驱动说话人视频生成神器!
- YuE:用于完整歌曲生成的开放音乐基础模型
- 魔发奇缘,3D发型生成新突破!TANGLED:可用任意样式和视点的图像生成 3D 发束
- 澳门大学提出DC-ControlNet!解耦控制条件!灵活性和精度超过ControlNet!
- 开源版Deep Research,一句话创建Agent工作流帮你完成电脑上的复杂操作,股票分析也轻松实现。
- 小红书提出新面部视频交换方法DynamicFace,可生成高质量且一致的视频面部图像。
- 免费才是王者?Grok 已冲到美区榜一!XAI 发布Grok3的详细介绍文章。
- Animate Anyone 2来了!角色动画与环境之间更具互动性,动画真实感和一致性更高。
- 谷歌推出PaliGemma 2 mix:用于多任务的视觉语言模型,开箱即用。
- 一起来学吴恩达新课《Transformer中的注意力机制:PyTorch的概念和代码实现》!
- 一起来学吴恩达新课《Transformer中的注意力机制:PyTorch的概念和代码实现》!
- 首个文字生成手语模型来了!SignLLM通过文字描述来生成手语视频,目前已经支持八国手语!
- 清华联合腾讯提出全模态模型Ola!图像、视频和音频等多模态理解一网打尽!
- Github热门机器学习笔记:「从零构建大型语言模型」
- 谷歌推出PaliGemma 2 mix:用于多任务的视觉语言模型,开箱即用。
- DeepSeek们的成本,是怎么计算的?
- 马斯克全新发布Grok3模型,坐拥20万张卡的新王!
- 4w Star!一个低成本微调DeepSeek的开源方案,悄悄火了
- 一文搞懂DeepSeek的技术演进之路:大语言模型、视觉语言理解、多模态统一模型
- StepFun提出Step-Video-T2V!300亿参数视频生成大模型!可生成204帧视频!
- 腾讯优图提出首个基于DiT的高保真虚拟试衣算法FitDiT
- Animate Anyone 2来了!角色动画与环境之间更具互动性,动画真实感和一致性更高。
- 英伟达开源4K图像生成模型Sana,可在16G显存电脑部署,支持ComfyUI和LoRA训练。
- 浙大提出RealCam-I2V!精确相机控制的新型视频生成I2V框架!
- 多身份定制化视频创作新突破!Ingredients:可将多个身份照片整合进视频创作实现个性化视频生成。
- 顶刊TPAMI 2025 | 北大、KAUST、字节联合提出“可逆扩散模型”赋能图像重建,代码已开源!
- 单张照片生成3D头部模型!Adobe提出FaceLift,从单一人脸图像重建360度头部模型。
- 引领图像编辑领域的新潮流!Edicho:实现跨图像一致编辑的新方法(港科&蚂蚁&斯坦福)
- 音频驱动肖像动画新方法LetsTalk,可生成与音频一致的逼真视频。
- 阿里提出文生卡通新方法Textoon:一分钟内生成丰富多彩、可交互的Live2D格式角色。
- 拖动图像编辑再升级!北大、腾讯提出DragonDiffusion,在扩散模型上启用拖动式操作。
- 谷歌DeepMind重磅推出多视角视频扩散模型CAT4D,单视角视频也能转换多视角了。
- 清华大学出品《DeepSeek 从入门到精通》完整版手册下载和使用教程。
- 开源版Deep Research,一句话创建Agent工作流帮你完成电脑上的复杂操作,股票分析也轻松实现。
- 多身份定制化视频创作新突破!Ingredients:可将多个身份照片整合进视频创作实现个性化视频生成。
- NVIDIA提出虚拟试衣新方法EARSB,让时尚与科技完美融合!
- 腾讯发布混元-3D 2.0: 首个开源高质3D-DiT生成大模型,几何结构更加精致,纹理色彩更加丰富。
- 腾讯HunYuan-3D 1.0,支持文本到3D和图像到3D,10秒即可生成高分辨率细3D模型。
- 统一图像生成模型OmniGen:可由多模态提示直接生成各种图像。
- 图像编辑大一统?多功能图像编辑框架Dedit:可基于图像、文本和掩码进行图像编辑。
- DeepSeek将开启大模型免费潮?ChatGPT和文心一言相继宣布全面免费开放!
- 告别大头娃娃,东京大学开源数字人TANGO:能根据目标语音音频生成同步全身手势的视频。
- 港中文联合清华提出AnyCharV:高保真高细节角色可控视频生成!
- 耶鲁大学联合Adobe提出SynthLight:智能重塑人像照明,打造完美光影!
- 港中文&腾讯提出可穿戴3D资产生成方法BAG,可自动生成服装和配饰等3D资产如,并适应特定的人体模型。
- 革新在线购物体验:CatV2TON引领虚拟试穿技术新纪元。
- NVIDIA提出虚拟试衣新方法EARSB,让时尚与科技完美融合!
- 耶鲁大学和Adobe提出SynthLight:智能重塑人像照明,打造完美光影!
- 人类运动生成新方法MoMask:可将文本描述作为输入并生成相应的高质量人体运动动作
- 清华联合腾讯提出全模态模型Ola!图像、视频和音频等多模态理解一网打尽!
- Chirpy3D:用于创意 3D 鸟类生成的连续部分潜在特征
- Meta提出Fast3R!多视角快速3D重建新SOTA!
- IC-Portrait:打造逼真个性化肖像的新纪元!
- 耶鲁大学和Adobe提出SynthLight:智能重塑人像照明,打造完美光影!
- 单张照片生成3D头部模型!Adobe提出FaceLift,从单一人脸图像重建360度头部模型。
- 东京大学 | Adobe 提出InstructMove,可通过观察视频中的动作来实现基于指令的图像编辑。
- 字节提出OmniHuman-1!单阶段pose加音频驱动的高保真人类视频生成!
- Chirpy3D:用于创意 3D 鸟类生成的连续部分潜在特征
- 实时高保真人脸编辑方法PersonaMagic,可根据肖像无缝生成新角色、风格或场景图像。
- 拖动图像编辑再升级!北大、腾讯提出DragonDiffusion,在扩散模型上启用拖动式操作。
- Qwen2-VL 的重大省级,Qwen 发布新旗舰视觉语言模型 Qwen2.5-VL
- 单张照片生成3D头部模型!Adobe提出FaceLift,从单一人脸图像重建360度头部模型。
- LineArt:无需训练的高质量设计绘图生成方法,可保留结构准确性并生成高保真外观。
- 东京大学 | Adobe 提出InstructMove,可通过观察视频中的动作来实现基于指令的图像编辑。
- StochSync:可在任意空间中生成高质量360°全景图和3D网格纹理
- ICLR 2025 | One Prompt One Story!基于单个prompt实现免训练身份一致图像生成
- 革新在线购物体验:CatV2TON引领虚拟试穿技术新纪元。
- NVIDIA提出虚拟试衣新方法EARSB,让时尚与科技完美融合!
- 手把手带你实战部署DeepSeek-R1大模型在手机安卓端、linux端、windows端 !没有GPU也行!
- 使用阿里云 PAI 平台云上一键部署 DeepSeek-V3 模型教程。
- DeepSeek开源多模态模型Janus-Pro的ComfyUI使用教程,文中附模型和工作流下载。
- DeepSeek开源Janus-Pro-7B:多模态AI模型性能超越DALL-E 3 和 Stable Diffusion 3!
- DeepSeek-V3 正式发布,已在网页端和 API 全面上线,性能领先,速度飞跃。
- 小红书提出新面部视频交换方法DynamicFace,可生成高质量且一致的视频面部图像。
- Google发布新AI工具Whisk:使用图像提示代替文本,快速完成视觉构思。
- Github热门机器学习笔记:「从零构建大型语言模型」
- 多模态图像生成模型Qwen2vl-Flux,利用Qwen2VL视觉语言能力增强FLUX,可集成ControlNet
- Chirpy3D:用于创意 3D 鸟类生成的连续部分潜在特征
- 实时高保真人脸编辑方法PersonaMagic,可根据肖像无缝生成新角色、风格或场景图像。
- 厦门大学联合网易提出StoryWeaver,可根据统一模型内给定的角色实现高质量的故事可视化
- 拖动图像编辑再升级!北大、腾讯提出DragonDiffusion,在扩散模型上启用拖动式操作。
- 超越DragDiffusion!哈工程联合南大提出FastDrag:可以几秒内完成基于拖动的图像编辑。
- InstantDrag:仅需图像和拖动指令作为输入,在大约一秒内实现高质量的图像编辑。
- StableDrag:一种基于Diffusion模型的图像编辑,可一键拖拽生成,DragGAN被革新了!
- 快手发布DragAnything,拖动锚点精准控制视频物体和镜头运动,视频运动控制技术革命性更新
- 使用阿里云 PAI 平台云上一键部署 DeepSeek-V3 模型教程。
- DeepSeek开源多模态模型Janus-Pro的ComfyUI使用教程,文中附模型和工作流下载。
- DeepSeek开源Janus-Pro-7B:多模态AI模型性能超越DALL-E 3 和 Stable Diffusion 3!
- DeepSeek-V3 正式发布,已在网页端和 API 全面上线,性能领先,速度飞跃。
- 使用阿里云 PAI 平台云上一键部署 DeepSeek-V3 模型教程。
- DeepSeek开源多模态模型Janus-Pro的ComfyUI使用教程,文中附模型和工作流下载。
- DeepSeek开源Janus-Pro-7B:多模态AI模型性能超越DALL-E 3 和 Stable Diffusion 3!
- DeepSeek-V3 正式发布,已在网页端和 API 全面上线,性能领先,速度飞跃。
- 革新在线购物体验:CatV2TON引领虚拟试穿技术新纪元。
- NVIDIA提出虚拟试衣新方法EARSB,让时尚与科技完美融合!
- 厦门大学联合网易提出StoryWeaver,可根据统一模型内给定的角色实现高质量的故事可视化
- 耶鲁大学和Adobe提出SynthLight:智能重塑人像照明,打造完美光影!
- 图像超分辨新SOTA!南洋理工提出InvSR,利用大模型图像先验提高SR性能, 登上Huggingface热门项目。
- 单幅图像合成 360° 3D场景的新方法:PanoDreamer,可同时生成全景图像和相应的深度信息。
- 腾讯 | 中科大提出Make-It-Animatable:一秒内可将任何3D人形模型变成动画角色
- DeepSeek开源多模态模型Janus-Pro的ComfyUI使用教程,文中附模型和工作流下载。
- DeepSeek开源Janus-Pro-7B:多模态AI模型性能超越DALL-E 3 和 Stable Diffusion 3!
- DeepSeek-V3 正式发布,已在网页端和 API 全面上线,性能领先,速度飞跃。
- 单张照片生成3D头部模型!Adobe提出FaceLift,从单一人脸图像重建360度头部模型。
- 一个LoRA同时处理内容和风格?UIUC提出UnZipLoRA,可同时训练两个LoRA,与原有LoRA兼容。
- 「感谢读者一路同行,2025一起解锁AIGC的更多惊喜!」来自AIGC Studio的新年祝福~
- 英伟达开源4K图像生成模型Sana,可在16G显存电脑部署,支持ComfyUI和LoRA训练。
- 复旦&字节提出layout-to-image新范式,支持基于布局的MM-DiT架构下可控图像生成!
- SHMT:通过潜在扩散模型进行自监督分层化妆转移(阿里&武汉理工)
- 提出街景定位大模型AddressCLIP:一张图实现街道级精度定位!
- 单张照片生成3D头部模型!Adobe提出FaceLift,从单一人脸图像重建360度头部模型。
- 一键试衣or一键脱衣?TryOffAnyone:从人像输入中生成高质量平铺服装。
- Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!
- 浙大 | 腾讯 | 华为提出视频生成框架VideoMaker,可由参考图实现Zero-shot定制化视频生成。
- 一键脱衣?TryOffAnyone:从人像输入中生成高质量平铺服装。
- 腾讯优图提出首个基于DiT的高保真虚拟试衣算法FitDiT
- Stability AI 联合UIUC提出单视图3D重建方法SPAR3D,0.7秒完成重建并支持交互式用户编辑。
- 北大提出定制化漫画生成新框架DiffSensei,可生成具有动态多角色控制的漫画图像。
- DeepSeek-V3 正式发布,已在网页端和 API 全面上线,性能领先,速度飞跃。
- Story-Adapter:能够生成更高质量、更具细腻交互的故事图像。
- 阿里通义实验室提出AnyStory:开启个性化文本到图像生成的新篇章!
- LineArt:无需训练的高质量设计绘图生成方法,可保留结构准确性并生成高保真外观。
- Snap | 港科大提出端侧文生图模型SnapGen,参数仅SD十分之一,1.4秒内生成1024分辨率图像。
- NVIDIA提出虚拟试衣新方法EARSB,让时尚与科技完美融合!
- 中科大提出新视频流制作动画解决方案RAIN,可实现真人表情移植和动漫实时动画。
- 引领图像编辑领域的新潮流!Edicho:实现跨图像一致编辑的新方法(港科&蚂蚁&斯坦福)
- 解决文生图质量和美学问题,字节跳动提出VMix:多维度美学控制方法,一键提升图像美学。
- 图像超分辨新SOTA!南洋理工提出InvSR,利用大模型图像先验提高SR性能, 登上Huggingface热门项目。
- 小米SU7璀璨洋红限定色360°全景图首次曝光?TRELLIS给你答案,实现可扩展多功能3D生成。
- 你要跳舞么?复旦&微软提出StableAnimator:可实现高质量和高保真的ID一致性人类视频生成
- CVPR 2024 Spotlight | 解锁图像编辑新境界, 北大、腾讯提出DiffEditor,让精细编辑更简单!
- Adobe与MIT推出自回归实时视频生成技术CausVid。AI可以边生成视频边实时播放!
- 多模态图像生成模型Qwen2vl-Flux,利用Qwen2VL视觉语言能力增强FLUX,可集成ControlNet
- Google发布新AI工具Whisk:使用图像提示代替文本,快速完成视觉构思。
- 中科大提出新视频流制作动画解决方案RAIN,可实现真人表情移植和动漫实时动画。
- 理想汽车提出3DRealCar:首个大规模3D真实汽车数据集!
- UIUC提出InstructG2I:从多模态属性图合成图像,结合文本和图信息生成内容更丰富有趣!
- SD和Sora们背后的关键技术!一文搞懂所有 VAE 模型(4个AE+12个VAE原理汇总)
- Adobe与MIT推出自回归实时视频生成技术CausVid。AI可以边生成视频边实时播放!
- 2024 AI TimeLine 回顾(独家视角)
- ScribbleDiff:使用涂鸦精细引导扩散,实现无需训练的文本到图像生成。
- Retinex-Diffusion:让图像照明更加自然、细腻、富有层次感。
- 解锁衣物动画的新境界!EUNet:从单块布料学习衣物动画,让衣物动画更智能。
- ECCV 2024 | 3D数字人生成来了!南洋理工提出StructLDM:高质量可控3D生成并支持编辑。
- 3D虚拟试穿来了,上大、腾讯等提出ClotheDreamer,数字人也能实现穿,脱衣自由!
- 多身份定制化视频创作新突破!Ingredients:可将多个身份照片整合进视频创作实现个性化视频生成。
- 3D服装生成新SOTA!谷歌和CMU提出FabricDiffusion:可将织物纹理从单个图像迁移到3D服装
- 超级智能“试衣镜”!GarDiff:高保真保持目标人物特征和服装细节,虚拟试穿技术新SOTA!
- 一键试衣or一键脱衣?TryOffAnyone:从人像输入中生成高质量平铺服装。
- NeurIPS 2024 | SHMT:通过潜在扩散模型进行自监督分层化妆转移(阿里&武汉理工)
- 阿里达摩院提出开源AI图片上色模型DDColor:可以为黑白照片、人物、动漫风景等一键上色!
- Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!
- 2024 AI TimeLine 回顾(独家视角)
- 东京大学 | Adobe 提出InstructMove,可通过观察视频中的动作来实现基于指令的图像编辑。
- 提出街景定位大模型AddressCLIP:一张图实现街道级精度定位!
- 谷歌DeepMind重磅推出多视角视频扩散模型CAT4D,单视角视频也能转换多视角了。
- Open-Sora: 让所有人都能轻松制作高效视频,可生成16秒720P视频,模型代码全开源!
- Face2QR:可根据人脸图像生成二维码,还可以扫描,以后个人名片就这样用了!
- AI生成大片,Movie Gen可以生成长视频并配上完美的音效,带给观众更好的观看体验。
- 组件可控个性化生成方法MagicTailor:生成过程可自由地定制ID。
- Google发布新AI工具Whisk:使用图像提示代替文本,快速完成视觉构思。
- 多模态图像生成模型Qwen2vl-Flux,利用Qwen2VL视觉语言能力增强FLUX,可集成ControlNet
- 字节 & 清华大学提出 AnyDressing :通过潜在扩散模型实现可定制的多服装虚拟试穿。
- NVIDIA发布GeForce RTX 50 系列,图形性能翻倍,售价549美元起!
- 实时高保真人脸编辑方法PersonaMagic,可根据肖像无缝生成新角色、风格或场景图像。
- 参数减少99.5%,媲美全精度FLUX!字节跳动等发布首个1.58-bit FLUX量化模型
- 复旦&字节提出layout-to-image新范式,支持基于布局的MM-DiT架构下可控图像生成!
- MinT: 第一个能够生成顺序事件并控制其时间戳的文本转视频模型。
- 单幅图像合成 360° 3D场景的新方法:PanoDreamer,可同时生成全景图像和相应的深度信息。
- 提出街景定位大模型AddressCLIP:一张图实现街道级精度定位!
- 东京大学 | Adobe 提出InstructMove,可通过观察视频中的动作来实现基于指令的图像编辑。
- 谷歌DeepMind重磅推出多视角视频扩散模型CAT4D,单视角视频也能转换多视角了。
- ComfyUI | Flux实拍与卡通风格lora推荐, 用于一键生成创意图像,支持用户输入特定描述。
- 设计小白秒变大师?AnyDesign:你的时尚图像编辑神器!
- 实时高保真人脸编辑方法PersonaMagic,可根据肖像无缝生成新角色、风格或场景图像。
- 厦门大学联合网易提出StoryWeaver,可根据统一模型内给定的角色实现高质量的故事可视化
- 北航 | 第一个多功能即插即用适配器MV-Adapter:轻松实现多视图一致图像生成。
- NeurIPS 2024 | SHMT:通过潜在扩散模型进行自监督分层化妆转移(阿里&武汉理工)
- 字节 & 清华大学提出 AnyDressing :通过潜在扩散模型实现可定制的多服装虚拟试穿。
- NeurIPS2024 | OCR-Omni来了!字节&华师提出统一的多模态生成模型TextHarmony。
- Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!
- DeepSeek-V3 正式发布,已在网页端和 API 全面上线,性能领先,速度飞跃。
- 港大&Adobe提出通用生成框架UniReal:通过学习真实世界动态实现通用图像生成和编辑。
- 腾讯优图提出首个基于DiT的高保真虚拟试衣算法FitDiT
- 一个LoRA同时处理内容和风格?UIUC提出UnZipLoRA,可同时训练两个LoRA,与原有LoRA兼容。
- 小米SU7璀璨洋红限定色360°全景图首次曝光?TRELLIS给你答案,实现可扩展多功能3D生成。
- 图像超分辨新SOTA!南洋理工提出InvSR,利用大模型图像先验提高SR性能, 登上Huggingface热门项目。
- 复旦&微软提出StableAnimator:可实现高质量和高保真的ID一致性人类视频生成
- Qwen团队重磅上线视觉推理大模型QVQ-72B-preview,一键解答作业难题。
- 图像超分辨新SOTA!南洋理工提出InvSR,利用大模型图像先验提高SR性能, 登上Huggingface热门项目。
- 可控人物图像生成统一框架Leffa,可精确控制虚拟试穿和姿势转换!
- MinT: 第一个能够生成顺序事件并控制其时间戳的文本转视频模型。
- 文生图像编辑来了!英伟达提出Add-it,无需训练,可根据文本提示向图像添加对象。
- 组件可控个性化生成方法MagicTailor:生成过程可自由地定制ID。
- InstructG2I:从多模态属性图合成图像,结合文本和图信息生成。
- 厦门大学联合网易提出StoryWeaver,可根据统一模型内给定的角色实现高质量的故事可视化
- 创作智能助手,能够根据剧本文字和对话自动检索电影并可视化!
- 统一的图像生成模型OmniGen:可以根据多模态提示直接生成各种图像,无需额外插件。
- GroundingBooth:一个用于文本到图像的定制框架,支持多主题和文本联合接地定制!
- 北大提出定制化漫画生成新框架DiffSensei,可生成具有动态多角色控制的漫画图像。
- Story-Adapter:能够生成更高质量、更具细腻交互的故事图像。
- 阿里推出升级版AI翻译工具:Marco MT 性能超越Google、DeepL和ChatGPT
- ScribbleDiff:使用涂鸦精细引导扩散,实现无需训练的文本到图像生成。
- 单幅图像合成 360° 3D场景的新方法:PanoDreamer,可同时生成全景图像和相应的深度信息。
- 超越DragDiffusion!哈工程联合南大提出FastDrag:可以几秒内完成基于拖动的图像编辑。
- 提出街景定位大模型AddressCLIP:一张图实现街道级精度定位!
- 马斯克X-AI发布文生图模型Aurora,已集成到聊天机器人Grok中, 将面向所有用户开放。
- 马斯克开源自家大模型Grok-1:具有314B参数,由 xAI从头开始训练!
- Poetry2Image:专为中文古诗词图像生成,忠于原诗意境和语义。
- 「视觉AI任意门」AnyDoor,只需点两下鼠标就可以实现任意场景物体交换
- 图像超分辨新SOTA!南洋理工提出InvSR,利用大模型图像先验提高SR性能, 登上Huggingface热门项目。
- 腾讯提出ViewCrafter:一张图像就可以制作影视特效和游戏画面!
- 腾讯 | 中科大提出Make-It-Animatable:一秒内可将任何3D人形模型变成动画角色
- OminiControl:一个新的FLUX通用控制模型,单个模型实现图像主题控制和深度控制。
- Huggingface Trending!可控人物图像生成统一框架Leffa,可精确控制虚拟试穿和姿势转换!
- 快手可图上线一键换衣Kolors Virtual Try-On,直冲开源项目Top 1!
- 文生图像编辑来了!英伟达提出Add-it,无需训练,可根据文本提示向图像添加对象。
- Haper SD Lora: 8步就可以用 Flux-dev生成图片!
- 何恺明团队在文生图领域的最新突破性工作Fluid,刷新文生图质量纪录。
- 北航 | 多功能即插即用适配器MV-Adapter:实现多视图一致图像生成。
- Face2QR:可根据人脸图像生成二维码,还可以扫描,以后个人名片就这样用了!
- 一图看尽AI文生图未来,北大发布文生图十年综述:超440项工作回顾。
- 单图可生成虚拟世界?约翰霍普金斯大学提出GenEx,一张图片即可创建可探索360° 3D世界!
- 智谱AI联合清华开源视频生成模型CogVideoX-5B。
- 腾讯震撼发布!MOFA-Video:表情随心换,运动由你控,视频创作由你做主!
- 超越IP-Adapter!字节提出MoMA,一种即插即用、无需调优的快速个性化生成方法!
- 重磅!Grok 宣布对所有人免费开放使用!
- 释放你的想象!支持25种复杂编辑类型!浙大等提出AnyEdit:统一高质量图像编辑框架
- 11.6k星星!Facebook开源的儿童手绘AI转动画项目,儿童艺术创作赛道可落地。
- InstantX 重磅开源 FLUX.1-dev-IP-Adapter 模型,文中附模型和comfyui工作流下载。
- 你要跳舞么?复旦&微软提出StableAnimator:可实现高质量和高保真的ID一致性人类视频生成
- FLUX.1 Tools,为创作者提供了更强大的控制能力。
- 英伟达发布Edify 3D生成模型,可在两分钟内生成可用于生产的 3D 资源、UV 贴图、4K 纹理和 PBR 材质。
- Adobe提出RGB↔X:可由图片直接输出AO、法线、roughness等,再也不用PS分层了!已开源
- 北航 | 第一个多功能即插即用适配器MV-Adapter:轻松实现多视图一致图像生成。
- Google发布Gemini2.0,“Agent时代”最强大的AI模型!
- 音频驱动肖像动画新方法LetsTalk,可生成与音频一致的逼真视频。
- 港大&Adobe提出通用生成框架UniReal:通过学习真实世界动态实现通用图像生成和编辑。
- 图像标注神器 X-AnyLabeling v2.5.0 重磅发布 | 通用视觉任务全新升级,交互式视觉-文本提示功能全面上线!
- ComfyUI | OminiControl:Flux全能P图神器,乾坤大挪移&重绘&CN控制。
- 一个LoRA同时处理内容和风格?UIUC提出UnZipLoRA,可同时训练两个LoRA,与原有LoRA兼容。
- Face2QR:可根据人脸图像生成二维码,还可以扫描,以后个人名片就这样用了!
- Flux LoRA | Then and Now:可将历史照片和现代场景融合,实现不同时间点的对比展示。
- AI生成大片,Movie Gen可以生成长视频并配上完美的音效,带给观众更好的观看体验。
- 英伟达提出ComfyGen:通过LLM来生成匹配文本的工作流。
- 谷歌DeepMind重磅推出多视角视频扩散模型CAT4D,单视角视频也能转换多视角了。
- 文本转视频模型Allegro,可以生成长达 6 秒、15 FPS 和 720p 分辨率的高质量视频。
- 可控视频合成框架MIMO:可以模拟复杂运动并进行物体交互。
- 港大和字节提出长视频生成模型Loong,可生成一分钟具有一致外观、动态和场景过渡的视频。
- 一图看尽AI文生图未来,北大发布文生图十年综述:超440项工作回顾。
- 多模态图像生成模型Qwen2vl-Flux,利用Qwen2VL视觉语言能力增强FLUX,可集成ControlNet
- OminiControl:一个新的FLUX通用控制模型,单个模型实现图像主题控制和深度控制。
- 文生图像编辑来了!英伟达提出Add-it,无需训练,可根据文本提示向图像添加对象。
- Mistral AI 开源 Pixtral 12B 多模态 LLM,多场景能力理解,支持中文指令遵循!
- EAFormer:场景文本分割新SOTA,图像文本擦除无痕迹!
- ViewCrafter:一张图像就可以制作影视特效和游戏画面!
- 一个LoRA同时处理内容和风格?UIUC提出UnZipLoRA,可同时训练两个LoRA,与原有LoRA兼容。
- ConsisID实现无缝身份一致的文本到视频生成(北大&鹏城实验室)
- AI也能自然的说话!MDT-A2G:可根据语音同步生成手势!
- AI也能生成电影大片!MovieDreamer:纯AI生成电影引爆热议!
- 数字服装生成模型AIpparel, 可根据文本和图像等多模态输入生成复杂、多样、高质量的缝纫图案。
- 3D服装生成新SOTA!谷歌和CMU提出FabricDiffusion:可将织物纹理从单个图像迁移到3D服装
- 多模态图像生成模型Qwen2vl-Flux,利用Qwen2VL视觉语言能力增强FLUX,可集成ControlNet
- GarmentAligner,解决服装生成中语义对齐、数量、位置和相互关系等问题。
- 腾讯优图提出首个基于DiT的高保真虚拟试衣算法FitDiT
- 刚刚,阿里重磅开源基于FLUX的In-Context LoRA,可一次生成多张风格和ID一致的图片集。
- 统一的图像生成模型OmniGen:可以根据多模态提示直接生成各种图像,无需额外插件。
- GroundingBooth:一个用于文本到图像的定制框架,支持多主题和文本联合接地定制!
- LiFT:利用人工反馈实现文本到视频模型对齐
- Still-Moving文生视频模型定制框架,引领AI创作新潮流!
- 个性化图像生成新SOTA!阿里开源MIP-Adapter,可将IP-Adapter推广到多个参考图像!
- MoMA:即插即用、无需调优的快速个性化生成方法!
- 海螺AI发布最新图生视频I2V-01-Live:一键将静态图像转化为动态视频,表现力无敌!
- 登顶Hugging Face文生图模型榜首!Recraft V3可精确处理复杂长文本和手指等解剖学细节!
- UniCon:可以在一个模型中针对目标图像条件对实现多样化的生成行为
- ScribbleDiff:使用涂鸦精细引导扩散,实现无需训练的文本到图像生成。
- 字节 & 清华大学提出 AnyDressing :通过潜在扩散模型实现可定制的多服装虚拟试穿。
- CatVton升级版?CatVton-Flux:AI虚拟试衣方案新选择。
- CatVTON:轻量化架构与高效训练,助力虚拟试衣技术落地应用!
- 超级智能“试衣镜”!GarDiff:高保真保持目标人物特征和服装细节,虚拟试穿技术新SOTA!
- Boow-VTON,无需训练即可进行试穿,解决野外试穿任务难题!
- ClotheDreamer:3D数字人也能实现穿,脱衣自由!
- OpenAI Day2:OpenAI 的强化微调研究计划。
- OpenAI Day1:推出o1, o1 Pro, ChatGPT Pro,更可靠、更准确。
- OpenAI连开12天发布会Day1:推出200美元每月o1, o1 Pro, ChatGPT Pro,更可靠、更准确。
- InstantX 重磅开源 FLUX.1-dev-IP-Adapter 模型,文中附模型和comfyui工作流下载。
- FLUX.1 Tools发布,为创作者提供了更强大的控制能力。
- ComfyUI官方桌面版正式发布,适用多平台,免费向所有人开放。
- 海螺AI发布I2V-01-Live:一键将静图转为动态视频!
- AI时光机上线!用MyTimeMachine一键体验从童年到白发的神奇旅程,让AI带你穿越时空。
- Siggraph Asia 2024 | Adobe发布MagicClay:可通过文字引导对3D模型特定部分进行雕刻!
- 腾讯发布HunYuan-3D,支持文本到3D和图像到3D,10秒即可生成高分辨率细3D模型。
- 升级版本的EchoMimicV2来了!一张半身照+音频,就能生成带手势的数字人视频。
- 超越Hallo和AniPortrait?音频驱动肖像动画新方法LetsTalk,可生成与音频一致的逼真视频。
- 告别大头娃娃,东京大学开源数字人TANGO:能根据目标语音音频生成同步全身手势的视频。
- 开源EMO再升级!复旦|百度|南大推出Hallo2:可以生成4K,一小时的音频驱动的视频。
- 复旦开源Hallo:只需输入一段音频和一张照片就可以让人物说话。
- 腾讯提出AniPortrait:音频和参考肖像图像驱动生成高质量动画。
- 阿里EMO:强哥也能上刑法课了!
- 腾讯 | 中科大提出Make-It-Animatable:一秒内可将任何3D人形模型变成动画角色
- OminiControl:一个新的FLUX通用控制模型,单个模型实现图像主题控制和深度控制。
- 终于!ComfyUI官方桌面版正式发布,适用Windows/macOS/Linux,免费向所有人开放。
- AI图像编辑重大升级!FLUX.1 Tools发布,为创作者提供了更强大的控制能力。
- 多模态图像生成模型Qwen2vl-Flux,利用Qwen2VL视觉语言能力增强FLUX,可集成ControlNet
- 文本转视频模型Allegro,可以生成长达 6 秒、15 FPS 和 720p 分辨率的高质量视频。
- 开源文本转语音工具 F5-TTS,一段音频+文字就可以模仿任何声色。
- Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!
- ICLR 2025满分论文,ControlNet作者新作IC-light,控制生成图像照明,代码模型已开源。
- InstantX 重磅开源 FLUX.1-dev-IP-Adapter 模型,文中附模型和comfyui工作流下载。
- 腾讯发布HunYuan-3D,支持文本到3D和图像到3D,10秒即可生成高分辨率细3D模型。
- OminiControl:一个新的FLUX通用控制模型,单个模型实现图像主题控制和深度控制。
- OminiControl:一个新的FLUX通用控制模型,单个模型实现图像主题控制和深度控制。
- 阿里发布新ID保持项目EcomID, 可从单个ID参考图像生成定制的保ID图像,ComfyUI可使用。
- 文生图像编辑来了!英伟达提出Add-it,无需训练,可根据文本提示向图像添加对象。
- ComfyUI | Flux实拍与卡通风格lora推荐, 一键生成创意图像。
- CatVton升级版?CatVton-Flux:AI虚拟试衣方案新选择。
- CatVTON:轻量化架构与高效训练,助力虚拟试衣技术落地应用!
- 超级智能“试衣镜”!GarDiff:高保真保持目标人物特征和服装细节,虚拟试穿技术新SOTA!
- Boow-VTON,无需训练即可进行试穿,解决野外试穿任务难题!
- ClotheDreamer:3D数字人也能实现穿,脱衣自由!
- 蚂蚁技术研究院最新开源:AI P图神器MagicQuill
- 英伟达发布Edify 3D生成模型,可在两分钟内生成可用于生产的 3D 资源、UV 贴图、4K 纹理和 PBR 材质。
- ComfyUI-Detail-Daemon:用于控制图像生成细节的ComfyUI节点,文中附工作流下载。
- Flux LoRA | Then and Now:可将历史照片和现代场景融合,实现不同时间点的对比展示。
- 终于!ComfyUI官方桌面版正式发布,适用Windows/macOS/Linux,免费向所有人开放。
- 视频生成群雄逐鹿,哪些重要问题待解?这场GenAICon视频生成研讨会将深入探讨
- AI图像编辑重大升级!FLUX.1 Tools发布,为创作者提供了更强大的控制能力。
- InstantX 重磅开源 FLUX.1-dev-IP-Adapter 模型,文中附模型和comfyui工作流下载。
- Flux Lora|可以和二次元合影啦!RealAnime-Detailed V2,可将动画与真实人物风格融合!
- 英伟达发布Edify 3D生成模型,可在两分钟内生成可用于生产的 3D 资源、UV 贴图、4K 纹理和 PBR 材质。
- AI图像编辑重大升级!FLUX.1 Tools发布,为创作者提供了更强大的控制能力。
- ComfyUI | OmniGen-ComfyUI:简化多任务图像生成和编辑操作,一键生成任意你想要的效果!
- ComfyUI | Flux实拍与卡通风格lora推荐, 用于一键生成创意图像,支持用户输入特定描述。
- 升级版本的EchoMimicV2来了!一张半身照+音频,就能生成带手势的数字人视频。
- 蚂蚁集团发布EchoMimic:音频+面部标志,让你的肖像“活”起来!
- AnyControl:精准控制下的创意风暴,高质量图像一键生成!
- InstantX 重磅开源 FLUX.1-dev-IP-Adapter 模型,文中附模型和comfyui工作流下载。
- Adobe提出RGB↔X:可由图片直接输出AO、法线、roughness等,再也不用PS分层了!已开源
- Flux Lora|可以和二次元合影啦!RealAnime-Detailed V2,可将动画与真实人物风格融合!
- AI图像编辑重大升级!FLUX.1 Tools发布,为创作者提供了更强大的控制能力。
- ComfyUI | OmniGen-ComfyUI:简化多任务图像生成和编辑操作,一键生成任意你想要的效果!
- 多功能图像编辑框架Dedit:可基于图像、文本和掩码进行图像编辑。
- 文生图像编辑来了!英伟达提出Add-it,无需训练,可根据文本提示向图像添加对象。
- 中科大提出StableV2V:专注于「人机交互一致性」的视频编辑方法
- ComfyUI | Flux实拍与卡通风格lora推荐, 一键生成创意图像。
- DrawingSpinUp:让纸片人动起来!
- 中科大提出StableV2V:专注于「人机交互一致性」的视频编辑方法
- Siggraph Asia 2024 | Adobe发布MagicClay:可通过文字引导对3D模型特定部分进行雕刻!
- 突破T2I模型界限,组件可控个性化生成新方法MagicTailor:生成过程中可以自由地定制ID。
- Siggraph Asia 2024 | Adobe发布MagicClay:可通过文字引导对3D模型特定部分进行雕刻!
- 突破T2I模型界限,组件可控个性化生成新方法MagicTailor:生成过程中可以自由地定制ID。
- 统一条件生成模型框架BiGR:专注增强生成和表示能力,可执行视觉生成、辨别、编辑任务
- 可控视频合成框架MIMO:可以模拟复杂运动并进行物体交互。
- ComfyUI | OmniGen-ComfyUI:简化多任务图像生成和编辑操作,一键生成任意你想要的效果!
- 统一图像生成模型OmniGen:可由多模态提示直接生成各种图像。
- 图像编辑大一统?多功能图像编辑框架Dedit:可基于图像、文本和掩码进行图像编辑。
- Adobe提出RGB↔X:可由图片直接输出AO、法线、roughness等,再也不用PS分层了!已开源
- 文本转视频模型Allegro,可以生成长达 6 秒,15FPS和720p视频。
- 开源文本转语音工具 F5-TTS,一段音频+文字就可以模仿任何声色。
- 百度发布文心iRAG技术,大模型终于知道如何去掉“AI味儿”了
- 网购神器来了!Fashion-VDM:通过给定的服装图像和人物视频,生成一段虚拟试穿视频!
- 阿里发布EcomID, 可从单个ID参考图像生成定制ID图像,ComfyUI可使用。
- Flux Lora|可以和二次元合影啦!RealAnime-Detailed V2,可将动画与真实人物风格融合!
- ComfyUI | Flux实拍与卡通风格lora推荐, 用于一键生成创意图像,支持用户输入特定描述。
- 让纸片人动起来! DrawingSpinUp:从单个绘图生成高质量3D动画。
- 设计小白秒变大师?AnyDesign:你的时尚图像编辑神器!
- 一键将音乐转为五线谱!开源Audio Decomposition:盲源音频分离,无需外部乐器分离库。
- 做游戏不用建模了?微软提出DIAMOND:AI可根据玩家行为自动实时合成下一帧画面!
- Story-Adapter:能够生成更高质量、更具细腻交互的故事图像。
- 阿里发布新ID保持项目EcomID, 可从单个ID参考图像生成定制的保ID图像,ComfyUI可使用。
- IC-light V2:基于FLUX训练,支持风格化图像,细节远高于SD1.5。
- Flux Lora|可以和二次元合影啦!RealAnime-Detailed V2,可将动画与真实人物风格融合!
- Glyph-ByT5-v2,支持10国语言图文海报生成,效果惊艳!
- ComfyUI-Detail-Daemon:用于控制图像生成细节的ComfyUI节点,文中附工作流下载。
- Flux LoRA | Then and Now:可将历史照片和现代场景融合,实现不同时间点的对比展示。
- Controlnet作者新作IC-light V2:基于FLUX训练,支持处理风格化图像,细节远高于SD1.5。
- 腾讯发布HunYuan-3D,支持文本到3D和图像到3D,10秒即可生成高分辨率细3D模型。
- 统一图像生成模型OmniGen:可由多模态提示直接生成各种图像。
- 图像编辑大一统?多功能图像编辑框架Dedit:可基于图像、文本和掩码进行图像编辑。
- 文本转视频模型Allegro,可以生成长达 6 秒、15 FPS 和 720p 分辨率的高质量视频。
- NeurIPS2024 | OCR-Omni来了!字节&华师提出统一的多模态生成模型TextHarmony。
- Adobe发布TurboEdit:可以通过文本来编辑图像,编辑时间<0.5秒!
- 3D服装生成新SOTA!谷歌和CMU提出FabricDiffusion:可将织物纹理从单个图像迁移到3D服装
- 告别大头娃娃,东京大学开源数字人TANGO:能根据目标语音音频生成同步全身手势的视频。
- 超级智能“试衣镜”!GarDiff:高保真保持目标人物特征和服装细节,虚拟试穿技术新SOTA!
- GarmentAligner,解决服装生成中语义对齐、数量、位置和相互关系等问题。
- Flux LoRA | Then and Now:可将历史照片和现代场景融合,实现不同时间点的对比展示。
- 英伟达提出ComfyGen:通过LLM来生成匹配文本的工作流。
- Story-Adapter:能够生成更高质量、更具细腻交互的故事图像。
- 混合专家模型 (MoE) 详解
- 统一图像生成模型OmniGen:可由多模态提示直接生成各种图像。
- NeurIPS2024 | OCR-Omni来了!字节&华师提出统一的多模态生成模型TextHarmony。
- 腾讯发布业界最大开源MoE模型:Hunyuan-Large,具有3890亿参数,在长文本处理、常识推理、数学能力等方面表现出色。
- 登顶Hugging Face文生图模型榜首!Recraft V3可精确处理复杂长文本和手指等解剖学细节!
- 刚刚,阿里重磅开源基于FLUX的In-Context LoRA,可一次生成多张风格和ID一致的图片集。
- 超火的开源文本转语音工具 F5-TTS,一段音频+文字就可以模仿你想要的任何声色。
- ChatTTS:对话式高可控的语音合成模型,最强文本转语音工具!
- Seed-Music:字节跳动开发的音乐生成模型 支持多种数据输入生成和编辑音乐!
- Controlnet作者新作IC-light V2:基于FLUX训练,支持处理风格化图像,细节远高于SD1.5。
- IC-Light,可以操控图像生成时的光照,光照难题终于被解决了!
- OpenFLUX.1:去蒸馏版本的FLUX.1-schnell,可进行微调,文中附模型下载地址。
- 零样本主题驱动图像生成新方法!EZIGen:在保持灵活性的同时保留主题身份!
- Flux Lora|可以和二次元合影啦!RealAnime-Detailed V2,可将动画与真实人物风格融合!
- 免费开源 AI 证件照制作工具:HivisionIDPhoto,文章附下载和使用教程。
- CustomCrafter,可保留动作和概念合成功能的定制视频生成框架!
- Glyph-ByT5-v2,支持10国语言图文海报生成,效果惊艳!
- 阿里巴巴推出升级版AI翻译工具:Marco MT 性能超越Google、DeepL和ChatGPT
- UIUC提出InstructG2I:从多模态属性图合成图像,结合文本和图信息生成内容更丰富有趣!
- 港大和字节提出长视频生成模型Loong,可生成一分钟具有一致外观、动态和场景过渡的视频。
- ScribbleDiff:使用涂鸦精细引导扩散,实现无需训练的文本到图像生成。
- 图像编辑大一统?多功能图像编辑框架Dedit:可基于图像、文本和掩码进行图像编辑。
- 自动生成ComfyUI工作流?英伟达提出ComfyGen:通过LLM来生成匹配文本的工作流。
- 长篇故事可视化方法Story-Adapter:能够生成更高质量、更具细腻交互的故事图像。
- CVPR 2024 | 英伟达发布新一代视觉基础模型: AM-RADIO = CLIP + DINOv2 + SAM
AIGC最前线
- 嘀!请查收一份来自人民大学的开源o1实现!
- 是可忍,熟不可忍!情感计算之母Rosalind Picard NeurIPS 2024 Keynote辱华翻车!
- 通用策略新突破!机器人学习大师Sergey Levine带来了RLDG
- 预测未来模型能力!微调揭示LLM涌现能力的关键
- 3D任意部位分割:FIND 3D模型实现零样本开放世界文本查询分割
- 大语言模型代理能否模拟人类的信任行为?
- 颠覆想象,AI 创意大比拼!华盛顿大学和艾伦人工智能研究所联手,用幽默风趣的方式,揭示了 AI 创意背后的真相
- Jan Leike:明确任务与模糊任务
- 国产之光:DeepSeek解密OpenAI o1!
- 上下文学习助力极端多标签分类新突破
- 不再掐脖子!开源芯片项目Tiny Tapeout——让每个人都能触及的芯片制造平台
- Jason Wei:o1前后的思维链有何不同?
- Self-Guided Trajectory Control in Image-to-Video Generation
- Lilian Weng 告别 OpenAI
- 白月光 vs 蚊子血
- Chelsea Finn带队的Physical Intelligence成果来了:π0——探索通用机器人控制的新前沿
慢慢学 AIGC
- Llama 4 系列:开启原生多模态 AI 创新的新纪元
- 别停留在DeepSeek表面,这本书用30个核心问题深度解析AI技术的底层原理!
- DeepSeek 开源周(三):DeepGEMM 性能实测及 NV 往事
- DeepSeek 开源周(二):DeepSeek MoE 架构回顾和 DeepEP 性能实测
- DeepSeek 开源周(一):FlashMLA 在 H100 上的性能实测
- KTransformer:把 DeepSeek R1 推理机器成本打下来
- DeepSeek 本地部署最佳实践(一):Ollama+Open WebUI + 蒸馏版
- DeepSeek 本地部署最佳实践(二):llama.cpp + Open WebUI 部署 unsloth 量化版模型
- DeepSeek 本地部署最佳实践(三):SGLang + 分布式推理部署满血版模型
- DeepSeek 本地部署——蒸馏版、量化版和满血版实测效果对比
- 理解推理 LLM:构建和改进推理模型的方法与策略
- DeepSeek R1: 理解 GRPO 和多阶段训练
- 深度求索:探寻风暴之眼
- 【DeepSeek AI】Janus-Pro: 数据与模型扩展的统一多模态理解与生成
- DeepSeek-R1:通过强化学习激励大语言模型的推理能力
- 万字长文解读 2025 年美国《人工智能扩散出口管控》
- RTX 5090 硬件参数详解
- 如何提取 ChatGPT 的训练数据
- 火鸿 AI-HPC:深度学习的高性价比软硬件协同设计
- 英伟达的圣诞礼物:GB300 和 B300
- MI300X vs H100 & H200 基准测试对比
- AI 扩展定律的演进
- 运行本地 AI,GPU/NPU 还是刚需吗?
- 新质技术之第九期生成式AI、大模型、多模态技术开发与应用研修班
- 深度学习中的 FP8 格式详解
- Allegro:揭开商业级视频生成模型的黑箱
- 内存墙:DRAM 的过去、现在与未来
- 探索 M4 Max 在大模型上的性能
- VLM:计算机视觉模型的未来
- ARIA : 开源多模态原生 MoE 模型
AIGC小白入门记
- 百度暑期算法grpo缺点是啥?
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- Attention和全连接层有什么区别?
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 面试官问:Dropout如何保证训练和预测阶段的一致性?
- 大模型算法工程师经典百问
- 阿里面试官问:为什么vllm能够加快大模型推理速度?
- 算法工程师直通大厂面经汇总
- 文档分割模块优化策略梳理
- 面试官问:大模型领域,有哪些提高大规模模型的训练和推理效率库?
- 面试官问:深度网络中loss除以10和学习率除以10等价吗
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 面试官问:说一下有哪些 RAG 流程优化策略?
- 面试官问:大模型领域,有哪些提高大规模模型的训练和推理效率库?
- 面试官问:深度网络中loss除以10和学习率除以10等价吗
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 智谱大模型算法面试,有点质量!!!
- 面试官问:大模型领域,有哪些提高大规模模型的训练和推理效率库?
- 面试官问:深度网络中loss除以10和学习率除以10等价吗
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 交叉熵 log 以e为底而不是 2
- 阿里面试官问:什么是softmax 上下溢出问题?
- 面试官问:深度网络中loss除以10和学习率除以10等价吗
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 面试官问:大模型领域,有哪些提高大规模模型的训练和推理效率库?
- 面试官问:深度网络中loss除以10和学习率除以10等价吗
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- BF16量化为int8的过程如何实现
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 训练一个大模型需要多少显存?
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- Transformer为什么使用多头注意力机制?
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 如何缓解RL过程中的对齐税?
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- deepseek v3 生成答案的速度为什么可以这么快?
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 大模型面试题:为什么LLM推断中缓存KV比缓存Q更有效?
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 美团面试官问:MHA/MQA/GQA 的区别是什么?
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 学妹问:SFT时哪些参数比较重要?
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 大模型算法岗面试准备篇(二)—— 如何想面试官介绍实习经验?
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 小米二面: QLoRA和LORA有什么区别?
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 面试官问:如何克服神经网络训练中argmax的不可导性
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 面试官问:为什么深度学习需要tensor 而不是numpy array?
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- Transformer Encoder/Decoder结构中的掩码Mask介绍?
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 面试官:Adam和AdamW有什么区别?
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 大模型算法岗面试准备篇(一)——如何进行自我介绍?
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 面试官:解释一下卷积神经网络(CNN)的基本结构
- 面试官:解释下大模型微调中的灾难性遗忘问题
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- Transformer 面试常考题快问快答
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 面试官:大模型的量化为什么不会失之毫厘谬以千里?
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- GraphReader:基于图的智能体,增强大型语言模型的长文本处理能力
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 面试官问:如何在搜推广中利用LLM
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 阿里面试官问:为什么Transformer的FFN需要升维再降维?
- 面试官问:大模型领域,有哪些提高大规模模型的训练和推理效率库?
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 讲一下PostNorm 和 PreNorm?这两个有什么优缺点?
- 算法工程师直通大厂面经汇总
- 恺明最新Talk:从机器学习的视角看机器学习研究
- 你要跳舞么?复旦&微软提出StableAnimator:可实现高质量和高保真的ID一致性人类视频生成
- 大模型算法工程师经典百问
- 大模型SFT不就好了,为什么还要RLHF?
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 字节面试官:transformer里PE为什么不采用concatenation的方式?
- 算法工程师直通大厂面经汇总
- 大模型算法工程师经典百问
- 阿里面试官问:为什么vllm能够加快大模型推理速度?
- BERT中的多头注意力机制-为什么需要多头?
- 阿里面试官问:什么是softmax 上下溢出问题?
- 为什么NLP用Layernorm而不是batchnorm?
- 算法工程师面试题笔记
- 说说我的实习面试历程,也许对你有帮助
- 阿里面试官问:什么是softmax 上下溢出问题?
- 算法工程师面试题笔记
- 说说我的实习面试历程,也许对你有帮助
- 【AgentLife】开源 Agent 小屋
- 算法工程师面试题笔记
- 说说我的实习面试历程,也许对你有帮助
- 阿里通义 QwQ 登场:开源 AI 推理新王,MATH 测试超 OpenAI o1
- 算法工程师面试题笔记
- 说说我的实习面试历程,也许对你有帮助
- 为什么BERT使用多头注意力机制以及它与直接使用一个大矩阵进行统一计算的区别?
- 算法工程师面试题笔记
- 说说我的实习面试历程,也许对你有帮助
- NLP 经典面试题:RLHF 训练过程是怎么样的?DPO 如何解决RLHF存在问题?
- 算法工程师面试题笔记
- 说说我的实习面试历程,也许对你有帮助
- 面试小米汽车,不想去,拒了offer。。。
- 今天面试了一个字节女生,当场想给她offer!
- 大模型算法工程师面试必考手撕题
- 算法工程师面试题笔记
- 说说我的实习面试历程,也许对你有帮助
- 在PyTorch框架中model.train() 和 model.eval()的作用是什么?
- 算法工程师面试题笔记
- 现在LLM 的大小为什都设计成6/7B、13B和130B几个档次?
- 大模型经典面试题————如何解决大模型推理过程中的延迟问题?
- 算法工程师面试题笔记
- 说说我的实习面试历程,也许对你有帮助
- 算法工程师面试常考手撕题(更新)
- NLP 经典面试题————Transformer中 前馈层(FFN) 的作用是什么?
- 算法工程师面试题笔记
- 说说我的实习面试历程,也许对你有帮助
- 算法工程师面试常考手撕题(更新)
- 大模型面试帖——LoRA 最硬核面经
- 算法工程师面试题笔记
- 说说我的实习面试历程,也许对你有帮助
- 算法工程师面试常考手撕题(更新)
- 大模型面试帖——LoRA 最硬核面经
- 算法工程师面试题笔记
- 说说我的实习面试历程,也许对你有帮助
- 算法工程师面试常考手撕题(更新)
AIGC启示录
- Manus邀请码被炒至10万?开源平替OpenManus免费体验!
- 中国团队的王炸产品:Manus,全球首款通用型 AI 智能体来袭!
- 5分钟斩获心动信号!DeepSeek智能定制情人节专属浪漫
- 企业的AI转型正进入拐点:来自3000家企业调研的发现
- 企业的AI转型进展报告解读
- AI转型对企业的好处
- 企业实施AI转型的具体步骤
- 💥10 天狂赚 3 万😮,速来 get✔️| AI 红包封面月入过万实操攻略🎉-保姆级
- 2025年春节,AI红包封面如何让你月入过万?
- 4600万户家庭的电力需求:AI服务器的惊人能耗
- 从AI芯片到智能家居:40家AI公司如何重塑我们的生活?
- 谷歌洪水预测:AI如何拯救世界?
- AI加持!YouTube创作者现在可以重混歌曲,玩法太炸了!
- AI生成的虚假信息是如何“瞄准”你的?背后真相曝光
- AI编程工具市场大爆发!Cursor凭什么抢占先机?
- 人工智能的红线:欧盟立法禁止哪些AI使用?
- 微软的绿色挑战:如何用“烘焙比赛”减少AI碳排放?
- AI巨头离职潮:谷歌的弗朗索瓦·肖莱宣布离开
- YouTube推出新功能:直播送礼,能否撼动TikTok?
- 月活用户达400万!InVideo如何用AI颠覆视频创作
- 代码界的AI助手:Tessl将如何与人类开发者共舞?
- 谷歌的AI雄心:Gemini应用背后的全球战略
- 2027年AI合规大考:欧盟法案草案提前揭秘
- 2024年AI创业热潮:44家美国AI初创公司盘点
- 马斯克与OpenAI:一段不为人知的收购往事
- 极端天气后:Mach9的AI技术如何快速恢复基础设施?
- 马斯克诉OpenAI:揭露科技巨头间的权力游戏!
- 电话诈骗的终结者:“AI奶奶”上线
- 编码效率大提升:ChatGPT与Mac应用的完美融合!
- AMD裁员千人:AI芯片巨头的自救之路
- 2024年科技大爆炸:OpenAI即将推出“Operator”!
- AI+音乐!披头士的《Now and Then》如何冲击年度唱片奖?
- AI战警:揭露医疗腐败,守护患者安全
- AI育儿助手将成为新一代“育儿神器”?功能太强大!
- AI竞争白热化!亚马逊计划砸数十亿美元支持Anthropic对抗OpenAI
- 全球29种语言实时翻译!Panjaya AI配音有多神奇?
- AI集成还能这么玩!UnifyApps用AI重塑企业流程
- Mistral AI审核API能解决内容“毒瘤”吗?
- 从Meta到OpenAI:AI巨头竞相进军这一领域,这次是Anthropic
- 让邮箱界面随天气变化?微软Outlook AI功能有多强大?
- 最强笔记本诞生!16英寸MacBook Pro能否颠覆台式机市场?
- 92%财富500强公司的选择:GPT的影响力
- AI模拟技术能否改变游戏行业?
- MIT如何模仿GPT-4训练机器人?
- 苹果收购Pixelmator,预示着手机照片新突破?
- GPT-5暂无影踪,OpenAI的下一步棋怎么走?
- 亚马逊Alexa的未来:Jassy眼中的AI助手进化论
- 如何用AI游戏化教学改变英语教育?
- 谷歌地图AI升级:Gemini引擎助力,你的出行将如何改变?
- 打破谷歌/苹果垄断:Nothing OS系统诞生
- D-ID新头像能否超越人类,数字人逼真互动?
- 你的Siri变聪明了!iOS 18.2带来AI大升级,苹果用户必看!
- 特朗普当选AI监管生变?拜登AI政策或被全面推翻!
- SpaceX星舰新挑战:太空加油技术即将测试
- AI监管争议:微软和a16z的联合声明揭示了什么?
- 5美元搞定哈里斯“分身”?AI伪造声音竟如此简单!
- 马斯克上任“政府效率部”部长?科技巨头如何改造”美官僚”
- 美国总统选举:AI聊天机器人的准确性测试
- Google Search上线,大战GPT search
- OpenAI新动作:GPT Search能否颠覆谷歌?
- 树木互联网:科技让每棵树都成为数据点
- 绿色愿景:将二氧化碳转化为液体燃料
- Foster姐妹:我们为什么不跟风投资AI?
- 如何避免数字资产成为未解之谜:DGLegacy的创新
- 从女明星到太空创业者,打造太空数据高速路
- 3D打印技术颠覆火箭制造产业链
- 红熊猫|Ai届黑马,超越Midjourney和OpenAI?
- Sierra的AI客服技术,如何个性化品牌形象?
- AI新宠,合成数据成为机器视觉的赚钱利器
- AI 如何让虚拟粉丝活动重燃激情
- 2030年,AI将产生10亿部iPhone等值电子废物?
- 谷歌AI概览功能,是否会改变我们的搜索习惯?
- 云计算市场的暗战:微软与谷歌的最新交锋
- 硅谷巨头炮轰加州议员:你不懂AI的真正危险!
硬核AIGC
- ChatGPT+DUIX超强组合,实时交互数字人秒变AI女友,形象逼真自带情绪开源免费!
- 从0到1亿!数字人十年进化史,揭秘AI时代的隐形操盘者
- 超好用的AI工具平台,一键搞定文档图像内容处理,限时送福利!
- 豆包3.0生图效果太绝了,人人都能成为顶级设计师(附完整提示词)
- AI生图必备网站,收录5500+艺术风格提示词和2800+SREF代码,直接复制可用
- 不用开会员,教你「无水印」下载即梦视频和图片,画质高清无损!
- 让DeepSeek直接生成图片,只需要一句提示词,还能无水印下载!
- 可灵2.0重磅升级,视频生成效果堪比影视大片,现实世界不存在了
- 太强了!用 HeyGem 开源数字人赚钱,干货拆解建议收藏!
- 电商带货神器!照片克隆数字人+手持商品讲解,效果太逼真了!
- 喂饭级教程!GPT4o制作表情包上架微信赚钱,不会PS也能轻松上手
- 用即梦AI生成封面图,实在太方便了(附完整提示词)
- 太强了!AI生成故事绘本、四格漫画,效果炸裂完全免费!
- 马云最新公开演讲:要让AI服务人类,而非取代人类
- 豆包疯了!新出AI云盘无限容量、不限速度、完全免费,赶紧用起来!
- 2025年最值得收藏的10个AI声音克隆神器,3秒克隆任何人声音,自媒体人必备!
- 告别真人录制,用数字人自动生成高质量PPT讲解视频,只需3步!
- 发现一个用AI写公众号的窍门,篇篇10万+流量主收入赚麻了!
- 用AI做旅游攻略,比刷小红书方便多了
- 美股暴跌的原因找到了!
- 即梦3.0生图模型上线,新增影视质感2K高清大片,文字效果更精准!
- 50种GPT-4o热门生图风格(含提示词)
- 雷军终于发声,首次公开回应小米SU7爆燃事件
- 一个插件,免费使用GPT-4o
- 抖音摊牌了,首次公开“推荐算法”原理
- 太猛了,黄金今天又杀疯了。
- 100个常用的DeepSeek V3提示词(最新整理)
- 20美元/月的GPT-4o,硬生生被玩到限流,只因生图能力太逆天!
- 国产大模型再出王炸,AI生成音乐迎来DeepSeek时刻,人人都能创作歌曲!
- 被忽视的通义效率助手,藏着几个非常好用的小功能
- 打造个人知识库最简单的办法,用腾讯ima轻松搞定
- 全网都在找的宝藏网站Skyline,在家就能查看全球实况摄像头!
- 推荐一个万能维修网站,动手党必备🔧
- 开源即巅峰!HeyGem数字人疯狂刷屏,人人都能免费部署!
- 推荐5个YouTube视频下载工具,已经帮大家试过了,好用!
- 自媒体必备神器,批量采集抖音小红书爆款选题,找对标太方便了!
- 全网都在找的宝藏网站iFixit,原来是全球最大的维修社区!
- 70页PPT揭秘Manus,2万字播客深度分析AI Agent
- DeepSeek+公众号新玩法,条条10万+流量主收入翻10倍!
- 2025年315晚会曝光清单,涉及9大行业众多知名品牌
- 超好用的国产AI工具排行榜
- 最全DeepSeek资料包,30篇清北浙大各高校文档合集(免费下载)
- OpenAI 称 DeepSeek 为 “国家控制”,呼吁禁止 “中国生产” 的模型
- DeepSeek官方发布:AI工具百宝箱,一次性集成上百款应用
- 点赞30万涨粉10万,AI发光美女跳舞视频,简单两步免费生成!
- 关于DeepSeek,360周鸿祎在清华大学都讲了什么(完整版PPT下载)
- 即梦AI接入DeepSeek:数字人+对口型+唱歌跳舞+声音克隆,统统免费!
- 国产数字人巨头突然宣布:免费开源+无限克隆+本地部署,彻底掀桌子了!
- 浙江大学版153页完整版!DeepSeek落地实战指南(免费下载)
- 被吹上天的Manus,更像一场有预谋的自嗨式营销,请保持清醒拒绝FOMO!
- 良心推荐!10个DeepSeek满血平台,丝毫不卡还完全免费!
- 20个DeepSeek实用建议,普通人逆袭就靠它了!
- 倒反天罡!腾讯元宝登顶AppStore,DeepSeek不香了?
- Kimi悄悄上线AI生图功能,效果还不错
- [DeepSeek预测:无法被AI取代的10种职业
- 医生(尤其是神经外科医生)
2.护士、护工
3.消防员/急救人员
4.教师(尤其是低龄儿童教育)
5.电工/水管工/维修工程师
6.心理咨询师/治疗师
7.法官/律师
8.社会工作者
9.AI研究员/科学家
10.艺术家/作家
你觉得还有哪些职业不能被取代呢?](https://mp.weixin.qq.com/s/G6AOtro4VNMsrGbaR--1nw)
- [DeepSeek预测3年内可能会消失的10种职业
1.电话销售员
2.产品收银员
3.银行柜员
4.客服人员
5.流水线装配工
6.基础翻译人员
7.新闻记者(快讯类)
8.文案岗位(基础编辑类)
9.驾驶员(特定场景)
10.数据录入人员
你觉得未来还有哪些职业可能会消失呢?](https://mp.weixin.qq.com/s/eelwrqRMSYTaG1qmGDYeEg)
- 盘点10大国产数字人平台,让AI分身替你高效干活!
- 10个DeepSeek王炸组合,用好AI助你效率翻倍
- 北大出手了!连发2份DeepSeek内部研讨资料,深度拆解提示词与AIGC实操(可下载)
- Kimi+数字人,让AI帮你自动讲解PPT,还能在线回答问题!
- 用AI“复活”历史人物火了,3分钟教会你全套制作流程!
- 清华大学丨第1-5弹DeepSeek实用手册,完整版PDF来了
- 2025年最好用的国产AI推荐,10大类30个工具全都整理好了(建议收藏)
- 只需一步!WPS接入DeepSeek R1满血版,让AI帮你办公写作处理文件
- 146页DeepSeek通关宝典:7大场景+50大案例+全套提示词,免费领取
- 清华大学最新资料:普通人如何抓住DeepSeek红利.pdf
- 微信搜索全面接入DeepSeek,公众号这座宝库终于被AI接管了!
- 清华大学104页完整版!DeepSeek从入门到精通.PDF(附下载方式)
- 全网最全DeepSeek资料包,别再花钱买课了
- DeepSeek太敢骂了!怒斥其它大厂:躺在流量金山上吃老本的废物
- 传疯了!25页DeepSeek完整使用手册!
- DeepSeek官方提示词库,90%的人还不知道,赶紧收藏起来!
- OpenAI急了!免费开放ChatGPT搜索,无需注册!
- 国家队下场支持!DeepSeek上线超算平台,再也不用担心服务器繁忙了!
- 春节假期为什么不能多放几天?DeepSeek是这样回答的
- 看完唐探1900,我让DeepSeek写了这篇影评
- AI含量最高的蛇年春晚,被语言类节目拖了后腿
- DeepSeek开始霸榜,国产AI已经让世界感到震惊
- 当我问DeepSeek为啥年轻人不愿意生孩子了,答案很扎心
- 泰国总理竟然也克隆了自己的数字人,而且还是说中文的
- 一大批古人涌入小红书,历史IP成为最新流量密码,一天起号涨粉过万!
- 🧧2025蛇年微信红包封面,18000份免费领取!3分钟教会你用AI定制专属款!
- 小红书火速上线AI翻译,已经被网友玩疯了!
- TikTok重新上线,老外们会离开小红书吗?
- 分享一个视频下载神器,还能免费看VIP内容,再也不要开会员了!
- 抖音疑似放开限制:老外开始疯狂刷屏,社交平台要全球化了?
- 2024公众号年度总结出炉,感谢大家关注硬核AIGC
- 大批TikTok难民涌入,小红书彻底变天,普通人如何抓住这次风口?
- 新手做公众号,12个常用工具推荐(建议收藏)
- 分享一个网盘搜索工具,想搜什么就搜什么
- 一个专门处理PDF文件的网站,20多个功能免费使用,无需下载安装
- 麻省理工学院推出AI教育平台,课程覆盖小学至高中,完全免费在线学习!
- 斯坦福高材生出品!数学可视化神器,用动画理解复杂的公式!
- AI拥抱火了!一分钟教会你用Vidu免费生成,还能实现AI亲吻、AI试衣!
- 微信公众号重磅更新!10秒克隆作者声音,免费用AI读文章
- 白嫖党必看!这些国产AI不花钱还好用,平替国外顶流AI工具
- 用AI数字人做抖音视频带货,万粉小号出单80万件赚麻了!
- 数字人实时交互+大模型思想克隆,硅基分身真的实现永生了
- 数字人视频新玩法,双角色出镜对话,条条爆款疯狂涨粉,普通人也能快速起号!
- 1分钟教会你用AI复活文物,9秒视频点赞10万,小白也能轻松上手!
- 老外数字人教英语,无需真人出镜,普通人也能快速起号(附详细教程)
- YouTube搬运神器!一键翻译多国语言,自动生成双语字幕,太牛了!
- 2.3亿人在用!腾讯出的帮小忙工具箱,堪称打工人必备神器!
- 为什么你的内容没人看?
- 豆包新功能太强了!一句话修改图片,AI任意换装,可以跟PS说再见了!
- 自媒体躺赚神器!AI自动生成沙雕动画,3分钟一条爆款视频!
- 吐血整理!33节课彻底教会你玩转AI数字人,创造第二收入!
- 川普回归,美国AI解禁,特斯拉暴涨15%,马斯克赢麻了!
- 在线查看丨2024美国大选实时票数,特朗普和哈里斯支持率最新情况
- “毒液”变身特效刷屏!Pixverse免费一键生成,有人靠信息差已经赚到钱了
- 分享一个最懂教师的AI工具,堪称教学备课神器!
- 姜萍事件终于通报了!哪有什么天才少女,不过是一场师生作弊的闹剧…
- ChatGPT终于联网了,可那又怎么样呢?
- 万圣节cos必备,AI特效帮你一键变装!
- “AI捏捏”视频火了,一分钟教会你生成照片捏小人效果,超解压!
AIGC智谷
- AIGC智谷X上海交通大学全链提效高级研修班开启报名
- 【AIGC趋势】禾赛布局的三大领域将在2025年带来超85亿元营收
- 【AIGC应用】中国力量已然改写全球AI竞争格局
- 【行业动态】英特尔具身智能大小脑融合方案发布,全球AI企业融资超4300亿
- 【智谷要闻】安徽省税务师行业培训班莅临AIGC智谷参观学习
- 【智谷要闻】淮南市凤台县领导干部莅临AIGC智谷参观并参加专题培训
- 【AIGC趋势】联发科打响第一枪,AI普及猛踩油门
- 【行业动态】商汤大装置发放“1亿代金券”,Amazon Q Developer正式支持中文
- 【智谷要闻】AIGC智谷×上海交通大学第二期DeepSeek大师锻造2日营圆满收官!
- 【AIGC趋势】政策设计的战略纵深,伦理治理的北京方案
- 【AIGC应用】爱簿智能开创“AI算力本”新品类,开箱即用终结配置难题
- 【行业动态】亚马逊推出全新Nova Sonic语音到语音模型,腾讯云率先上线DeepSeek-V3-0324模型API接口
- 【智谷要闻】第二期Deepseek大师锻造两日营火热报名
- 【AIGC应用】通用是未来,专用是路径,人形机器人跑步进入下半场:数据为王。
- 【行业动态】米哈游创始人蔡浩宇的 AI 游戏开启内测登记,DuckDuckGo :一款注重隐私的搜索引擎
- 【AIGC趋势】年营收暴涨736%,多家AI巨头撑腰
- 【智谷要闻】上海南翔高科技经济城AIGC智谷企业家研讨会圆满举行
- 【AIGC应用】智谷AI智能生成营销式系统
- 【AIGC趋势】国内具身智能最大天使轮诞生,前华为自动驾驶CTO、天才少年创业
- 【行业动态】Google 发布最新开源模型 Gemma 3 ,百度推出ERNIE 4.5和X1
- 【智谷要闻】AIGC智谷×上海交通大学DeepSeek大师锻造2日营点燃AI学习热潮
- 【AIGC智谷】中共凉山州委党校第63期县级干部进修班参加AIGC实训课题活动
- 【AIGC趋势】破解产业痛点,重构智能时代基础设施
- 【行业动态】国产AI技术迎来里程碑式突破,腾讯元宝电脑版上线截图提问、深色模式功能
- 【活动预告】AI驱动创新·DeepSeek智启未来——您的专属报名通道现已开启!
- 【行业动态】Manus :首款通用Agent产品,阿里发布QwQ-32B推理模型
- 【AIGC应用】硅谷的视网膜革命:一场1.8亿美元收购如何重构AI眼镜的未来叙事
- 【AIGC趋势】一纸新政如何重构中国机器人产业新版图
- 【AIGC律师】AI领域的律师服务正式开启全新篇章!
- 【AIGC应用】昆仑万维推出的SkyReels-V1和SkyReels-A1,标志着视频生成技术的重大突破
- 【AIGC趋势】广和通正式发布了其全新的全矩阵AI解决方案——“星云”系列
- 【行业动态】阿里巴巴发布了其最新的开源视频生成模型 Wan 2.1,北京成为AI技术的“隐秘高地”杭州迅速崛起为AI“新势力”。
- 【智谷要闻】AIGC智谷携手中国小商品城集团助力数字经济高质量发展
- 【智谷应用】科技未来——智谷AI
- 【行业动态】DeepSeek 开源周,微软发布首款量子芯片Majorana 1
- 【AIGC应用】3月推AI PC新品,硬件配置曝光
- 【AIGC智谷】重庆梁平区政府新型工业化专题培训班一行前往上海南翔高科技经济城-AIGC智谷
- 【智谷要闻】AIGC智谷赴上海交大人文学院培训中心开展“AIGC+DeepSeek”应用分享会
- 【AIGC应用】西安交通大学“交小智”
- 【行业动态】Grok3:马斯克发布号称全球最强推理模型,OpenAI公布GPT-4.5 和 GPT-5 最新路线图
- 【智谷学院】AIGC智谷学院致力于构建一个全面的AI学习平台
- 【AIGC趋势】阿尔特曼:花得越多,AI越聪明,AI价格每年暴降90%
- 【AIGC应用】别等苹果AI了!7大中国手机厂接入DeepSeek,还是满血版
- 【行业动态】OpenAI的近期新闻,豆包发布 Doubao-1.5-pro
- 【AIGC应用】今年春节,到处都是AI机器人
- 【智谷要闻】科技未来——智谷AI
- 【AIGC趋势】复刻科比、C罗、詹姆斯招牌动作
- 【行业动态】Mate重组生成式AI团队,商汤SenseNova-5o大模型开放商用,限时免费
- 【智谷要闻】上海交通大学人文学院与AIGC智谷携手共筑AIGC技能培训体系
- 【AIGC律师】AI领域的律师服务正式开启全新篇章!
- 【AIGC趋势】12名工程师,估值190亿,AI黑马的梦幻故事
- 【行业动态】Kimi发布k1.5 :o1级多模态模型,小红书登顶美区 App Store
- 【智谷学院】生成式AI,未来已来!AI爱好者联盟线下沙龙活动
- 【AIGC趋势】上海嘉定AIGC智谷成员开放日成功举办,共探产业新未来
- 【AIGC应用】“标王”科大讯飞发布推理模型!
- 【行业动态】DeepSeek发布移动端应用,Perplexity发布了 Perplexity Sports 功能
- 【AIGC律师】AI领域的律师服务正式开启全新篇章!
- 【AIGC应用】从仿生到情感交互,迈向“类人”新高度仿生技术的突破
- 【AIGC趋势】暴走4万步逛遍CES2025:十大方向最火,中企已上牌桌
- 【行业动态】NVIDIA CES 2025 大会,百度也推出了AI搜索
- 【智谷要闻】科技未来——智谷AI
- 【行业动态】DeepSeek-V3 正式发布,Sam Altman发帖公布了2025年OpenAI的产品目标目标
- 【AIGC趋势】00后李飞飞学生联合创业,破解世界级机器人难题,被稚晖君投资,独家对话创始人
- 【AIGC应用】最快5秒光速出片,全球首个接近实时生成的AI视频模型来了
- 【智谷要闻】上海嘉定生成式人工智能产业发展中心成员单位招募
- 【风向趋势】豆包中文对话最强,OpenAI o1推理和数学占优
- 【行业动态】谷歌发布 Veo 2、lmagen 3 和新工具 Whisk,MidJourney 推出个性化档案和情绪版新功能
- 【AIGC律师】AIGC智谷以企业服务为核心开启全新篇章!
- 【智谷学院】AIGC智谷学院致力于构建一个全面的AI学习平台
- 【AIGC应用】XR一夜变天,谷歌“重做安卓”!三星MR头显亮牌,硬刚苹果
- 【AIGC趋势】一口气融728亿!AI融资新纪录,比OpenAI还吸金,华人联合创办
- 【行业动态】谷歌发布Gemini 2.0!Midjourney推出在线构建工具:Patchwork
- 【AIGC应用】智谷AI智能生成营销式系统
- 【AIGC应用】“终端”都用好AI,搞定统一生态这事太重要了
- 【行业动态】Day 3 OpenAI 终于发布了 Sora,OpenAI近期动态!
- 【AIGC趋势】从3LCoS到全产业链蜕变
- 【智谷要闻】科技未来——智谷AI
- 【AIGC趋势】股价飙涨790%!比英伟达还猛,创始人跻身百亿富豪榜
- 【AIGC应用】6款大模型、3nm AI芯片、全球最大AI计算集群,苹果罕见站台
- 【行业动态】腾讯混元开源视频生成模型:HunyuanVideo、Sora疑似遭泄露
- 【AIGC律师】AI领域的律师服务正式开启全新篇章!
- 【AIGC趋势】人形机器人融资,爆爆爆
- 【AIGC应用】孙正义再投OpenAI,108亿!
- 【行业动态】Ai2发布 Tülu 3 模型,Black Forest Labs发布FLUX.1 Tools
- 【智谷学院】AIGC智谷学院致力于构建一个全面的AI学习平台
- 【AIGC应用】全球最大AI Agent生态系统来了!适配超1800个模型
- 【AIGC趋势】从深度学习到大模型,医学AI上的一些尝试
- 【行业动态】OpenAI近期新闻,Mistral AI推出了更新版的Le Chat
- 【AIGC趋势】探索AIGC技术研发和商业化落地应用 赋能千行百业数字化转型
- 【AIGC应用】智谷AI智能生成营销式系统
- 【智谷要闻】科技未来——智谷AI
- 【智谷学院】成都智谷与金牛人社开启人工智能训练师培训
- 【智谷学院】“数智金英”区县品牌班开班 新质生产力up
- 【AIGC应用】中美AR眼镜即将来到正面竞争的关键时刻
- 【AIGC趋势】中科院北大复旦大佬齐聚学术盛会
- 【行业动态】Ideogram 发布 Canvas 功能,Adobe推出新AI工具 Project Turntable
- 【AIGC律师】AI领域的律师服务正式开启全新篇章!
- 【AIGC趋势】马斯克的AI公司xAI谋划巨额融资
- 【AIGC应用】大模型重塑版讯飞输入法来了
- 【行业动态】Midjourney 更新:外部图像编辑器、图像重新纹理和下一代 AI 审核系统
AIGC创想者
- Github热门项目周报 | 第16周
- 4月20日周日 | 每日一图
- 4月20日周日 | Python热门项目
- 4月20日周日 | Github今日热门
- Github热门项目周报 | 第15周
- 4月13日周日 | 每日一图
- 4月13日周日 | Python热门项目
- 4月13日周日 | Github今日热门
- 48.4K+ Star!RAGFlow:一个基于深度文档理解的开源RAG引擎
- 4月10日周四 | 每日一图
- 4月10日周四 | Python热门项目
- 4月10日周四 | Github今日热门
- 53.9K+ Star!Browser Use:一个让AI代理轻松控制浏览器的神器
- 4月8日周二 | 每日一图
- 4月8日周二 | Python热门项目
- 4月8日周二 | Github今日热门
- Github热门项目周报 | 第14周
- 4月6日周日 | 每日一图
- 4月6日周日 | Python热门项目
- 4月6日周日 | Github今日热门
- 2.1K+ Star!Spring AI Alibaba:一个为 Java 开发者设计的AI应用框架
- 4月3日周四 | 每日一图
- 4月3日周四 | Python热门项目
- 4月3日周四 | Github今日热门
- 3K+ Star!FinRobot:一个开源的金融分析AI Agent平台
- 4月1日周二 | 每日一图
- 4月1日周二 | Python热门项目
- 4月1日周二 | Github今日热门
- Github热门项目周报 | 第13周
- 3月30日周日 | 每日一图
- 3月30日周日 | Python热门项目
- 3月30日周日 | Github今日热门
- 1.9K+ Star!RuoYi AI:一个全栈式 AI 开发平台
- 3月27日周四 | 每日一图
- 3月27日周四 | Python热门项目
- 3月27日周四 | Github今日热门
- 7.6K+ Star!PydanticAI:一个AI应用开发框架
- 3月25日周二 | 每日一图
- 3月25日周二 | Python热门项目
- 3月25日周二 | Github今日热门
- Github热门项目周报 | 第12周
- 3月23日周日 | 每日一图
- 3月23日周日 | Python热门项目
- 3月23日周日 | Github今日热门
- 5.6K+ Star!R2R:一个支持RAG的AI检索系统
- 3月20日周四 | 每日一图
- 3月20日周四 | Python热门项目
- 3月20日周四 | Github今日热门
- 13.1K+ Star!Dagger:一个高效的容器化工作流工具
- 3月18日周二 | 每日一图
- 3月18日周二 | Python热门项目
- 3月18日周二 | Github今日热门
- Github热门项目周报 | 第11周
- 3月16日周日 | 每日一图
- 3月16日周日 | Python热门项目
- 3月16日周日 | Github今日热门
- 9.1K+ Star!ebook2audiobook:一个将电子书转换为有声书的工具
- 3月13日周四 | 每日一图
- 3月13日周四 | Python热门项目
- 3月13日周四 | Github今日热门
- 1K+ Star!autoMate:一个AI驱动的本地自动化工具
- 3月11日周二 | 每日一图
- 3月11日周二 | Python热门项目
- 3月11日周二 | Github今日热门
- Github热门项目周报 | 第10周
- 3月9日周日 | 每日一图
- 3月9日周日 | Python热门项目
- 3月9日周日 | Github今日热门
- 10.4K+ Star!AI Hedge Fund:一个基于AI的对冲基金交易系统
- 3月6日周四 | 每日一图
- 3月6日周四 | Python热门项目
- 3月6日周四 | Github今日热门
- 4.9K+ Star!AstrBot:一个功能强大、易于上手的聊天机器人框架
- 3月4日周二 | 每日一图
- 3月4日周二 | Python热门项目
- 3月4日周二 | Github今日热门
- Github热门项目周报 | 第9周
- 3月2日周日 | 每日一图
- 3月2日周日 | Python热门项目
- 3月2日周日 | Github今日热门
- 4.2K+ Star!olmOCR:一款开源的高性能OCR工具
- 3月1日周六 | 每日一图
- 3月1日周六 | Python热门项目
- 3月1日周六 | Github今日热门
- 3.1K+ Star!code2prompt:一个代码转提示的命令行工具
- 1月14日周二 | 每日一图
- 1月14日周二 | Python热门项目
- 1月14日周二 | Github今日热门
- Github热门项目周报 | 第2周
- 1月12日周日 | 每日一图
- 1月12日周日 | Python热门项目
- 1月12日周日 | Github今日热门
- 6.3K+ Star!Resume Matcher:一个开源免费的智能简历优化工具
- 1月9日周四 | 每日一图
- 1月9日周四 | Python热门项目
- 1月9日周四 | Github今日热门
- 10.8K+ Star!Activepieces:一个开源的AI自动化工作流工具
- 1月7日周二 | 每日一图
- 1月7日周二 | Python热门项目
- 1月7日周二 | Github今日热门
- Github热门项目周报 | 第1周
- 1月5日周日 | 每日一图
- 1月5日周日 | Python热门项目
- 1月5日周日 | Github今日热门
- 53.5K+ Star!n8n:一个工作流自动化平台
- 1月2日周四 | 每日一图
- 1月2日周四 | Python热门项目
- 1月2日周四 | Github今日热门
- Github热门项目周报 | 第51周
- 12月29日周日 | 每日一图
- 12月29日周日 | Python热门项目
- 12月29日周日 | Github今日热门
- 2.6K+ Star!NarratoAI:一站式AI影视解说+自动化剪辑工具
- 12月23日周一 | 每日一图
- 12月23日周一 | Python热门项目
- 12月23日周一 | Github今日热门
- Github热门项目周报 | 第50周
- 12月22日周日 | 每日一图
- 12月22日周日 | Python热门项目
- 12月22日周日 | Github今日热门
- 6.9K+ Star!Awesome LLM Apps:一个精选的大型语言模型应用集合
- 12月18日周三 | 每日一图
- 12月18日周三 | Python热门项目
- 12月18日周三 | Github今日热门
- 6.9K+ Star!Awesome LLM Apps:一个精选的大型语言模型应用集合
- 12月18日周三 | 每日一图
- 12月18日周三 | Python热门项目
- 12月18日周三 | Github今日热门
- 7.1K+ Star!Pathway:一个实时数据处理ETL框架
- 12月17日周二 | 每日一图
- 12月17日周二 | Python热门项目
- 12月17日周二 | Github今日热门
- 7K+ Star!PDFMathTranslate:基于AI的PDF文档双语翻译工具
- 12月16日周一 | 每日一图
- 12月16日周一 | Python热门项目
- 12月16日周一 | Github今日热门
- Github热门项目周报 | 第49周
- 12月15日周日 | 每日一图
- 12月15日周日 | Python热门项目
- 12月15日周日 | Github今日热门
- Github热门项目周报 | 第48周
- 12月8日周日 | 每日一图
- 12月8日周日 | Python热门项目
- 12月8日周日 | Github今日热门
- 19.5K+ Star!DSPy:一个模块化AI系统构建框架
- 12月5日周四 | 每日一图
- 12月5日周四 | Python热门项目
- 12月5日周四 | Github今日热门
- 7.6K+ Star!Keep:一个开源告警管理和AIOps平台
- 12月3日周二 | 每日一图
- 12月3日周二 | Python热门项目
- 12月3日周二 | Github今日热门
- Github热门项目周报 | 第47周
- 12月1日周日 | 每日一图
- 12月1日周日 | Python热门项目
- 12月1日周日 | Github今日热门
- 2.1K+ Star!Multi-Agent Orchestrator:一个灵活且强大的多Agent调度框架
- 11月26日周二 | 每日一图
- 11月26日周二 | Python热门项目
- 11月26日周二 | Github今日热门
- 2.1K+ Star!Multi-Agent Orchestrator:一个灵活且强大的多Agent调度框架
- 11月26日周二 | 每日一图
- 11月26日周二 | Python热门项目
- 11月26日周二 | Github今日热门
- 2.1K+ Star!Multi-Agent Orchestrator:一个灵活且强大的多Agent调度框架
- 有数百年历史的橄榄树 - 庆祝世界橄榄树日 - 每日必应壁纸
- 11月26日周二 | Python热门项目
- 11月26日周二 | Github今日热门
- Github热门项目周报 | 第46周
- 11月24日周日 | 每日一图
- 11月24日周日 | Python热门项目
- 11月24日周日 | Github今日热门
- 22.4K+ Star!Chatbox:你的终极AI桌面助手
- 11月21日周四 | 每日一图
- 11月21日周四 | Python热门项目
- 11月21日周四 | Github今日热门
- 3.8K+ Star!Nexa SDK:一个本地设备上的推理框架,支持ONNX和GGML模型
- 11月19日周二 | 每日一图
- 11月19日周二 | Python热门项目
- 11月19日周二 | Github今日热门
- Github热门项目周报 | 第45周
- 11月17日周日 | 每日一图
- 11月17日周日 | Python热门项目
- 11月17日周日 | Github今日热门
- 26.8K+ Star!MindsDB:一个从企业数据构建AI的平台
- 11月15日周五 | 每日一图
- 11月15日周五 | Python热门项目
- 11月15日周五 | Github今日热门
- 1.7K+ Star!Qwen2.5-Coder系列:强大、多样、实用
- 11月14日周四 | 每日一图
- 11月14日周四 | Python热门项目
- 11月14日周四 | Github今日热门
- 9K+ Star!AI Chatbot:一个开源AI聊天机器人模板
- 11月13日周三 | 每日一图
- 11月13日周三 | Python热门项目
- 11月13日周三 | Github今日热门
- 31.1K+ Star!Upscayl:一个免费开源的AI图像放大工具
- 11月12日周二 | 每日一图
- 11月12日周二 | Python热门项目
- 11月12日周二 | Github今日热门
- 35.3K+ Star!PhotoPrism:一款基于AI的开源照片管理工具
- 11月11日周一 | 每日一图
- 11月11日周一 | Python热门项目
- 11月11日周一 | Github今日热门
- Github热门项目周报 | 第44周
- 11月10日周日 | 每日一图
- 11月10日周日 | Python热门项目
- 11月10日周日 | Github今日热门
- 35.3K+ Star!MockingBird:一个AI拟声工具, 5秒内克隆你的声音并生成任意语音内容
- 11月8日周五 | 每日一图
- 11月8日周五 | Python热门项目
- 11月8日周五 | Github今日热门
- 31.7K+ Star!AgentGPT:一个在浏览器中运行的Agent
- 11月7日周四 | 每日一图
- 11月7日周四 | Python热门项目
- 11月7日周四 | Github今日热门
- 1.6K+ Star!Ichigo:一个开源的实时语音AI项目
- 11月6日周三 | 每日一图
- 11月6日周三 | Python热门项目
- 11月6日周三 | Github今日热门
- 1.6K+ Star!GenAIScript:一个可自动化的GenAI脚本环境
- 11月5日周二 | 每日一图
- 11月5日周二 | Python热门项目
- 11月5日周二 | Github今日热门
- 3.1K+ Star!Docling:一个文档解析工具
- 11月4日周一 | 每日一图
- 11月4日周一 | Python热门项目
- 11月4日周一 | Github今日热门
- Github热门项目周报 | 第43周
- 11月3日周日 | 每日一图
- 11月3日周日 | Python热门项目
- 11月3日周日 | Github今日热门
- 11.3K+ Star!Plate:一个基于AI的富文本编辑器
- 11月1日周五 | 每日一图
- 11月1日周五 | Python热门项目
- 11月1日周五 | Github今日热门
- 18.9K+ Star!Frigate:一个基于Docker的NVR系统
- 10月31日周四 | 每日一图
- 10月31日周四 | Python热门项目
- 10月31日周四 | Github今日热门
- 3.1K+ Star!OpenLLMetry:一个开源的LLM应用可观测性工具
- 10月30日周三 | 每日一图
- 10月30日周三 | Python热门项目
- 10月30日周三 | Github今日热门
AIGC Research
- 论文简读|OmniSVG!一个统一的SVG矢量图生成模型|阶跃星辰×复旦
- PaperDaily近期更新放缓声明
- 论文简读|首个面向细粒度视频运动理解的综合评测基准|阶跃星辰×复旦
- 317-B1.1|细粒度视频运动理解、长视频理解基准,细粒度视频问答;评估VLM城市具身智能,视频LLM评估;3D视觉语言CoT
- 317-B1.2|多模态推理,科学问题求解,意图驱动与强化推理;图像数据预训练,图像推理分割,多种视觉任务,中文书法理解
- 317-B2.1|图文交错生成;多模态大规模脑数据集,视觉脑解码;视觉提示调优,视觉指令调优
- 317-B2.2|图像补全、压缩、GS表示;多曝光图像融合,低光增强;视频时间戳定位,流式视频对话
- 317-B3.1|光照感知物体插入;各种3D重建与渲染系列;3DGS隐写术系列
- 317-B3.2|3D语义重建系列;相对相机姿态回归,物体姿态估计;各种3D重建系列;HOI重建
- 317-A2.1.1|基于多智能体CoT的自动电影生成,故事视频叙事,情节发展与相机运动,视频生成的相机运动模拟
- 317-A2.1.2|全能视频创作与编辑,视频实例添加,关系视频定制化;视频风格迁移,视频风格变形
- 317-A2.2|自回归扩散视频生成,生成式视频双流场,视频生成推理加速;动作为中心的物理常识评估;检测AI生成视频
- 317-A2.3|文字与声音引导说话视频生成,专业电影声音生成,同步视频到音频生成,动态MRI序列生成语音音频;口型同步说话脸
- 317-A3.1|单图生3D,三平面GS场表示,3D形状生成,关节物体生成,可控3D户外场景生成,单图重建3D头部网格
- 317-A3.2|多模态人类动作生成,动作个性化,高保真文生动作,物理可信人类动作生成;多镜头视频恢复人类动作;音频驱动手势合成
- 317-A1.1.1|将多模态理解无缝集成到DiT,光学幻觉图像生成,时间步感知LoRA MoE;适配器引导蒸馏,轨迹分布匹配
- 317-A1.1.2|个性化系列,风格化系列
- 317-A1.1.3|可控生成(条件引导DiT,多条件输入,单步扩散与联合分布匹配);图像编辑(物体移除,图像转换,布局编辑)
- 317-A1.2.1|DiT可解释性,高效DiT(特征缓存系列,后训练量化),扩散效率(时间旋转扩散量化,去噪分数蒸馏)
- 317-A1.2.2|自回归图像生成系列,多模态理解与生成系列,掩蔽图像生成
- 317-A1.3|评估系列(真实图像质量与美学,复杂语义理解与世界知识整合,生成特定数量对象,触觉图像生成)
- 317-A1.4|安全系列(概念擦除系列,可解释合成图像检测)
- 317-A1.5|图像超分系列,对比度增强,单步扩散用于图像运动去模糊,利用扩散潜在空间实现域泛化
- 316-A1.1|理解与生成的统一奖励模型,频率自回归,食谱图像生成基准,DiT加速,图像编辑安全性问题,LLM处理SVG的综述
- 316-A1.2&A2|生成模型用于物理关系预测;单目视频相机轨迹重定向,任意长度视频修复与编辑,轻量级解码器用于高效生成
- 316-A3|3D与文本潜在空间对齐,草图到CAD重建,MLLM复杂场景对象放置;火柴人生成3D人类动作,探讨舞伴间的隐性交互
- 316-B1|将数据集蒸馏到神经场;几何问题求解,复杂多图像理解,VLM人类偏好对齐;图像超分,2DGS视频表示,文本到视频检索
- 316-B2|视频先验稀疏重建,运动模糊图像场景重建,高斯表面重建;视频立体匹配,6D物体姿态估计;流式传输体积视频,高斯头像
- 论文简读|为DiT添加高效且灵活的控制|Tiamat、上科大、新国立、Liblib AI
- 315-A1|多模态生成模型综述,个性化图像编辑,风格迁移系列,长度可扩展DiT,图像编辑的安全保护相关
- 315-A2|评估可控人类视频生成,整合语言模型于扩散模型的文生视频,音频驱动动态肖像合成
- 315-A3|室内场景合成,3D场景物体移除与修补,视频3D流体重建与预测,为各种物体生成3D动作
- 315-B1|自我中心生活助手,可穿戴实时智能助手;数学推理,几何理解,文档理解,长视频理解;文本-音频增量学习
- 315-B2|视觉与大脑信号Gap;视频INR,视频字幕提取;稀疏视角GS超分,开放世界场景理解,点云补全,伪细节填充3D场景
- 314-A|颜色-概念关联,域适应,扩散优化;相机可控3D一致视频生成,视频“标记器”;多视角一致图像生成;单图恢复3D人类运动
- 314-B|GUI智能体,视觉注意力重分配,视觉-语言-动作模型;在线视频助手;动态球面神经表面
- 313-A1.1|无需训练的高分辨图像生成,基于多智能体的故事可视化,基于文本的图像编辑,真实手部生成,少样本字体生成
- 313-A1.2|文本到视觉内容评估数据集,质量评估与条件生成,双层自回归图像生成,结合量化与缓存的高效DiT;社会偏见问题
- 313-A2|文生视频质量评估,视频帧插值与预测,基于KAN的音频隐式表示
- 313-A3|剧本到3D舞台生成,文本驱动形状与颜色风格化,稀疏建筑点云恢复结构化3D抽象,平滑扰动引导人类动作扩散
- 313-B1|多模态系列;3D重建系列
- 312-B1|多模态系列
- 312-B2|图像与视频系列
- 312-B3|3D重建系列
- 312-A1.1|多模态CoT、对话交互式文生图;图像头部交换,检测AI生图人体畸形;高重叠布局到图像,缓解个性化概念耦合问题
- 312-A1.2|艺术设计篇|文生高质量设计图像,MLLM美学感知图形布局设计,VLM广告创意评估;可控服装展示图像生成
- 312-A1.3|强化学习文生图微调;直接判别优化,扩散推理加速,离散扩散后验采样;安全篇(利用LLM突破防护,开源数据集综述)
- 312-A2.1|角色肖像动画化;百万级针对用户需求的文生视频数据集;视频3D物体编辑,外推与解耦图生视频,少量视频学习人类动作
- 312-A2.2|对象感知视频抠图,视频音乐的语义对齐与时间同步理解数据集,音频驱动面部动画化,共语手势生成
- 312-A3.1|重新利用图像扩散模型进行3D资产生成,3DGS生成模型的水印化;交互式草图条件网格生成与编辑,CAD与草图生成
- 312-A3.2|单图生VDM;自动化角色扮演游戏角色创造,人类几何生成,语音驱动3D说话头
- 312-A3.3|微型物体重建,可控景深3DGS,单步扩散提高重建;关键帧动作插值,交互动作生成,文生HOI,场景感知动作合成
- 311-A1.1|基于ImageNet的文生图,图像生成与编辑(多模态指令驱动,手绘掩码引导),单图参考的ID保留面部图像编辑
- 311-A1.2|图像美学评估,扩散模型后门攻击,防止不安全内容生成,水印去除攻击
- 311-A3&A2|单图生CAD;由粗到精的策划视频生成,高效长视频生成,视频生成模型世界建模能力的评估基准,人类行为理解与生成
- 311-B1|长视频理解,空间推理模型,知识单元RAG,MLLM角色扮演;MLLM机器人操作,长时间任务规划
- 311-B2|零样本图像对象计数,扩散恢复适配器;实时神经视频编码器;单图像3D重建
- 310-A1.1|图像参考的动画草图上色,视觉艺术作品笔画演变;视觉特征迁移,主体风格与动作个性化;统一视觉分词器,图文交织控制
- 310-A1.2|DiT推理加速;图像编辑(图像条件反演,身份保留蒸馏采样);自回归视觉生成系列;使用KAN优化扩散路径
- 310-A2|文本生成无缝循环视频,CoT运动控制器用于可控视频生成,可重光照的肖像动画化
- 310-A3|3D生成先验点云补全,基于神经表面变形的形状插值,开放词汇3D人类语义部件分割;双角色交互动作生成
- 310-B1|MLLM指令微调相关,探讨视觉基础模型能否学习人类视觉系统的低级特征,基于MLLM的视频帧选择用于视频理解
- 310-B2.1|可动画化3D头像与人体重建系列;3D说话头系列
- 310-B2.2|VR环境360度视频质量评估;单目动态场景渲染,无需相机内外参的GS;基于物理的HOI模拟
- 308-A1.1|LLM驱动文生图,融合不同内容与风格LoRA;多层透明图像生成,功能性概念设计;LLM用于图像编辑,头部交换
- 308-A1.2&A2|稀疏注意力用于推理加速,基于变分噪声耦合训练一致性模型,面部身份保持视频生成,视频生成时空一致性综述
- 308-A3|统一语言图像3D预训练,3D极线注意力NVS;大头像模型用于图生高斯头,草图重建3D人脸;音乐驱动3D全身舞蹈生成
- 308-B1|MLLM人类偏好对齐,科学海报摘要生成,视觉丰富文档RAG,多智能体图表生成;对比视觉数据增强
- 308-B2|拉普拉斯算子GS,单图重建穿衣人类与物体
- 309-B1|理解复杂的数学和科学定理,探讨VLM内部的神经元功能,CLIP视觉与文本可解释
- 309-B2|3D点云对象为中心的运动生成,跨模态3D检索;NeRF水印保护,3DGS是否需要精确体积渲染
- 307-A1.1|多任务视觉通用模型,背景保持图像编辑,计算机游戏任意风格迁移,跨文化&文化相关文生图系列;fMRI图像重建综述
- 307-A1.2|分形生成模型,CoT自回归生成,扩散分布鲁棒优化,扩散模型幻觉缓解;修正流轨迹蒸馏,分层修正流;流匹配幻觉问题
- 307-A1.3|安全篇|概念擦除,AI生成检测,版权侵权检测,文本与视觉防御攻击,防止基于后门攻击的恶意个性化
- 307-A2|视频生成时间空间外推,多粒度视频编辑;音乐驱动图像动画化舞蹈生成,音频驱动说话头;音频视觉分割
- 307-A3|拖拽控制高斯生成编辑,文生3D质量评估;文本驱动场景编辑;任意拓扑骨骼角色动作生成,模拟人视觉与推理的人类动作预测
- 307-B.1|MLLM文本丰富图像理解综述,基础视觉认知能力评估,检测VLM训练数据版权保护;学习移动设备操作
- 307-B.2|让视觉模型特征更清晰,基于树结构的分层“变换器”,解释神经网络内部机制;视觉知识密集型问答基准,细粒度视频字幕化
- 307-B.3|高质量大规模开放场景重建,无约束稀疏视角房间布局重建;GS场景分割,开放词汇GS场景理解,3D-LLM幻觉问题
- 306-A1|多概念个性化,草图到图像,基于f散度分布匹配的一步扩散;AI生图质量评估,概念擦除综述,版权侵权识别缓解,水印去除
- 306-A2&3|基于LLM智能体的逼真3D世界创建与定制;硬件友好静态量化用于视频DiT后训练量化,基于LVLM的生成视频检测
- 306-B1|VLM基准测试,视觉描述基准;视频流事件理解,大规模多模态音乐符号理解数据集;多模态图文表示模型的可解释性
- 306-B2|视频长字幕生成,自我中心会话智能体;神经BRDF,跨模态3D场景理解,消费级设备上大规模3DGS实时高保真渲染
- 305-A1.1|艺术风格元素图像编辑;解耦元素间元素内条件可控生成,相关性引导DiT高效可控生成;虚拟试衣;文生360全景综述
- 305-A1.2&A2|视频动态概念个性化,文生图奖励微调,资源受限边缘设备上的高效DiT,改进自编码器提高生成质量
- 305-A3|纹理化物体的再生形态变换,从多种提示生成形状与纹理;光滑表面逆渲染,音频驱动说话头;全身运动技能模块化
- 305-B|VLM超长文本生成,图表MRAG;PC复杂任务自动化,文本丰富图像理解;3D场景理解与编辑,深度信息提升GS几何准确
- 304-A1&2|多视觉概念图像生成,图像转可变长度1D“令牌”序列,文生几何图形;视频运动定制,运动图形动画,基于事件的帧插值
- 304-B|阿里千问2.5VL,CoT多模态推理;LLM辅助视觉皮层体素描述生成,视频字幕生成;多视角场景修补,多视角可分离重建
- 303-A1|人类偏好对齐与测试时采样,个性化图像生成十年综述,球面密集文生图;无噪声条件化的去噪生成模型;评估NSFW内容消除
- 303-A2|记忆增强机制用于任意长度视频自回归生成,LLM协助的流行微视频生成;文本生成音频视觉说话头;从视觉序列生成自然语言
- 303-A3|组件对齐图生3D场景,均匀分数蒸馏文生3D;基于溅射引导扩散的NVS,基于部件的INR,非最优运输流用于点云生成
- 303-B1|多模态智能体基础模型,基于检索增强DPO对齐视觉语言,基于二次到线性蒸馏的仅解码器多模态SSM,多模态交错文档转换
- 303-B2|低级4D视觉感知通用架构;360度相机的大规模室内3D重建,无核神经表面重建;基于3DGS的零样本物理理解
- 302-A1.1|左提示引导用于多种视觉任务,多语言视觉文本渲染;理解与生成(多模态属性图,缩小能力差距);偏好对齐,提示对齐
- 302-A1.2|β自适应缩放CFG,无需CFG的模型引导;图像反演综述,解耦CLIP中类别与风格特征用于特定域生成,LDM水印
- 302-A2|主体一致视频生成,富表现力肖像动画化;动态潜在帧率VAE,离散流用于长视频生成;音频驱动唇形同步视频生成
- 302-A3.1|自动骨骼绑定,单目视频到4D,文本与姿态引导高斯人,日本俳句到3D场景;网格自回归形状细化,开放词汇室内场景
- 302-A3.2|从未校准稀疏视图前馈估计几何、外观与相机姿态,3D高斯修复;单视角人类扩散;逆向渲染材料建模;语音同步手势生成
- 302-B|视频MLLM与视频理解系列;开放世界3D物体识别,单图3D面部重建,3DGS水印
- 论文简读 | ACM TIST 2025 | 综述 GenAI 与时尚 | 港理工、AiDLab
- 301-A1|自进化扩散高质量生成,区域自适应采样DiT加速;多指令图像编辑,自然语言指令引导编辑;视觉文本生成;双向扩散桥模型
- 301-A2&A3|阶跃星辰文生视频大模型,复杂相机控制图生视频;场景级3D外观迁移,LLM驱动CAD设计
- 301-B|多模态系列(指令微调数据集,偏好对齐,昆虫视觉理解,视觉推理基准);图像视频细粒度分割,DINO自监督学习,图像恢复
- 300-A1.1|场景草图实例分割;风格特定内容生成,动态图像检索;物体定制化,可兼容服装搭配生成;优化文本编码器层实现存储高效
- 300-A1.2|文生图文化包容性;图像水印技术,数据记忆缓解,恶意概念检测,AI生图实时检测;基于流的生成模型,变分整流匹配
- 300-A2|多类型3D资产的无模板自回归绑定,图生3D的一致性问题,文本驱动3D人类生成;基于LLM的程序化3D形状抽象功能库
- 300-B|评估LMM CoT推理能力,无编码器架构3D LMM,评估物理概念理解能力;说话脸视频生成;人类稀疏重建,潜在辐射场
- 299-A1.1|图像到矢量草图生成,CTR驱动广告图像生成,视觉长文本图像生成的大规模数据集,偏好对齐用于图像生成与编辑综述
- 299-A1.2|身份特定隐蔽技术,生成内容的鲁棒水印;均值回归扩散的快速采样,改善不平衡数据文生图,无需蒸馏的一步扩散模型训练
- 299-A2|3D可控电影文生视频,视频重打光,光流增强相机控制,多概念个性化,角色视频生成;世界模拟器,关键步骤人类技能视频
- 299-A3&B|视频到4D生成,可重打光体积视频生成;评估6D空间理解能力;人类中心基础模型综述;自监督图像视频表示学习
- 298-A1|风格矢量草图补全,基于区域草图提高文生图;光线感知材质迁移,内容风格解耦,揭示判别模型的潜在生成能力;隐私保护
- 298-A2.1|提升DiT视频生成时间一致与视觉质量,相机、物体与光照可控图生视频,高效视频生成,结合摘要技术的长视频转短视频
- 298-A2.2|自回归视频生成,加速与扩展视频DiT训练,调查AI视频在视频检索中的偏好;音频驱动肖像动画化,共语手势视频生成
- 298-A3|3D物体部件关节运动生成,单图合成数字人,物理感知3D4D生成综述;流蒸馏采样,大型摄影测量模型
- 298-B|探讨视频扩散之于视觉理解;GS转换为网格,单图生成HR多视角人物,边缘设备上实时动画化虚拟头部,稀疏视角多人体重建
- 297-A1.1|统一多模态理解与生成加速,材质迁移,概念融合,个性化,偏好优化;探讨儿童、成人与AI在创意绘画任务中的表现
- 297-A1.2|AIGC图像水印,AI生成媒体检测综述;统一扩散桥用于图像恢复,可逆引导一致性训练,无指导扩散用于少数样本生成
- 297-A2.1|视频个性化定制,VFX视效生成,基于指令的视频编辑数据集,文本驱动的长视频编辑
- 297-A2.2|角色图像动画化,高效视频DiT系列,评估文生视频的物理一致性基准;音乐表演中的音频-视觉问答
- 297-A3|高保真3D形状生成,几何可控室内场景生成,任意风格与视角图生3D发型;文本驱动人类动作生成,大型人类动作基础模型
- 297-B1|高效统一多模态变换器,空间推理及其基准,无需编码器的视觉语言模型;探讨视觉自回归的基本限制
- 297-B2|图像分割,MLP+傅里叶特征的INR,视觉表示学习;镜头链提示用于长视频理解,无线网络实时视频流,INR视频压缩
- 论文简读|TPAMI 2025|“可逆扩散模型”赋能图像重建|北大、KAUST、字节
- 296-A1.1|多LoRA多概念生成,多对象融合;图像隐含特征规则,理解复杂文本提示;任意风格迁移,文本引导编辑的追溯与识别
- 296-A1.2|统一多模态理解与生成,艺术美学分析;场景属性保留图像生成,NSFW视觉文本;fMRI跨主体视觉解码,面部解析
- 296-A2.1|基于流的图像视频生成基础模型,姿势引导DiT人类动作视频生成,DiT高分辨视频生成,资源受限移动设备文生视频
- 296-A2.2|DiT视频生成效率问题(滑动瓦片注意力,缓存与剪枝);高效高质量长音频生成
- 296-A3&B2|自回归动静态生长树生成;基于参考图像的无界场景修复,多视角场景补全,360全向GS重建,高速动态3D场景重建
- 296-B1|视频旋转位置嵌入;MLLM时钟与日期理解,探讨CLIP颜色编码方面的不足,关于AI辅助科学发现的综述
- 295-A1|文本驱动图像编辑,大规模图像编辑数据集;将CFG蒸馏到文本嵌入中,扩散轨迹匹配;文生图社会偏见问题
- 295-A2|电影镜头设计图生视频,3D点云正则化提升视频生成,将动态内容添加到真实视频,AIGC视频质量评估;DiT音视频生成
- 295-A3&B|基于文本的CAD编辑;评估多模态视频理解;通用稀疏AE用于可解释跨模型概念对齐;详细注释的自我中心视频数据集
- 294-A1|面部与服装保持的姿势迁移,可控GUI设计生成;掩码自编码器“标记”化,大脑信号视觉解码,优化一致性蒸馏的模型训练
- 294-A2|运动场引导图像到视频生成,基于解耦的可控视频生成,个性化音乐到视频生成
- 294-A3|将视频视为动态3D世界投影,单图生成物理仿真预备的服装分离3D人类,基于笔画的交互式神经SDF雕刻,微结构设计生成
- 293-A1|多偏好优化,合成数据生成用于图像定制化,面部图像编辑,SVD直接探索扩散潜空间;图像自回归隐私风险,流匹配生成建模
- 293-A2|DiT视频生成推理加速,增强视频生成运动一致性;直接偏好优化,迭代偏好优化,视频偏好基准;静态宽视角视频电影化编辑
- 293-A3|物理引导文生复杂场景,开放词汇关节物体建模,3D形状变体生成,4D场景编辑,GS转为结构化2D表示;动作生成系列
- 293-B1|文档理解,UI理解,MLLM偏好优化;细粒度图像描述数据集用于理解与生成,盲面部修复,现实世界图像超分
- 293-B2|高斯过程增强GS,几何神经过程场;开放词汇3D场景分割;数字人系列
- 292-A1.1|多领域过程序列生成,认知对齐的分层SVG生成;分解扩散模型视觉能力,RAG现实图像生成,文生图扩散资源效率问题
- 292-A1.2|弱模型到强模型扩散,高效扩散微调,人类偏好对齐,去噪扩散分块采样实现奖励对齐;高效I2I转换,逆桥匹配蒸馏
- 292-A1.3|人对人虚拟试衣,批量服装生成,时尚服装组合生成;双独立文本嵌入,用于潜在一致性模型的训练技术,图条件扩散
- 292-A2|人类视频生成,SSM图像视频生成,手绘草图驱动视频生成;视频潜在流匹配,极长视频RAG;情感面部语音合成
- 292-A3|物理引导文生组合性3D场景,从多视角语义信息生成3D形状;动态3D人类重建,情感驱动说话头合成;3D场景理解与分割
- 292-B|人类身体图像恢复,跨主体fMRI视觉解码;NeRF傅里叶频率控制,探索3D场景假设推理,3D场景理解与问答综述
- 291-A1|修正梯度引导,DiT加速;文生图安全问题(概念擦除,防止NSFW内容生成,社会偏见问题)
- 291-A2|基于扩散潜在束搜索优化文生视频的提示对齐度,灰度视频着色化;音乐驱动图像动画化,主题感知视频对话制作
- 291-A3.1|基于多智能体的3D空间电影制作自动化;物理交互3D动态合成,基于拖拽的3D场景编辑;程序化材质生成,文生CAD
- 291-A3.2|可控动作生成,实时动作生成,运动扩散自编码器与空手道,共语姿势生成
- 291-B1|将一切模态都视为像素,室内空间推理;利用自由手绘草图提升复杂图像分割,视觉自回归图像超分;事件引导的图像信号处理
- 291-B2|焦点渲染;多视角几何扩散,可变形Beta溅射,基于光线追踪的GS,表面重建,手部重建;语言引导场景分割,点云补全
- 288-A1|在不同模型之间迁移LoRA模块,多样化外观与照明条件下的肖像个性化,360°全景图生成,虚拟试衣DiT
- 288-A2|基于级联LDM的高效高质量视频生成,物理引导的卡通动画化,运动与外观分离的视频运动定制化
- 288-A3|图像扩散用于可扩展3D高斯生成,逆程序化点云到建筑抽象,单图重建点云;轻量级物理感知可控动作生成,动作文本联合生成
- 288-B|评估VLM物理世界理解的综合性基准测试,显式时间建模用于视频理解;单目视频流预测未来时刻4D场景表示
- 289-B|3D开放世界分类;3D多物体移除,3DGS用于人群渲染,基于特征的几何损失改善3DGS重建的几何准确性
- 290-A1|用于文生图的线性DiT,基于草图的产品设计原型迭代探索工具,视觉生成式AI的综合性研究;AI生成音视频内容质量评估
- 290-A2|基于视频扩散的逆向与正向渲染,基于自适应细节迁移的逆向渲染;文本到运动生成
- 290-B|多模态域适应与泛化的综述;探讨EEG抑郁症检测的公平性问题;视频字幕生成;点云基础模型综述,改善3DGS光照交互表现
- 287-A1.1|主题特定图像定制化,FaceID定制化,虚拟试衣;无引导视觉生成,基于2DGS的图像“标记”化
- 287-A1.2|肖像抠图,提示感知可控影子去除,草图查询图像分割;文生图安全性(概念擦除,性别偏见)
- 287-A2|视频重光照,评估人体姿势迁移模型在人类动作视频生成中的表现
- 287-A3|360°全景图与3D网格纹理生成,为3D模型分配PBR材质,身体对齐的可穿戴3D资产生成,3D虚拟试衣
- 287-B1|专利图形描述生成,VLM后训练数据策略,视频理解;光学化学结构理解用于分子科学发现
- 287-B2|为任意长度视频估计3D相机姿态,基于线性原语的可微分体积渲染;单图生成逼真人类NVS;文生动作,可控手部抓取生成
- 286-A1|图像风格与内容迁移,产品广告图像设计生成,为特定任务找到合适的生成模型,多主体fMRI图像重建的隐私保护与个体差异
- 286-A2|人类视频抠图,从视频中学习层次化组合性世界表示,扩散视频生成水印化,音频驱动说话头动画化
- 286-A3|艺术网格生成,室内场景纹理生成,近二阶收敛3DGS,自动驾驶场景理解与生成
- 286-B1|模拟人类解谜能力,动态修剪策略优化VLM计算效率,VLM用于增强现实AR场景理解
- 286-B2|3D重建系列
- 285-A1.1|单提示角色一致性问题,CoT推理用于自回归图像生成,评估文生图模型,单光栅示例图合成矢量纹理
- 285-A1.2|长袖服装非刚性编辑,协同服装合成;多尺度因子化高效扩散模型,多潜变量生成模型
- 285-A2A3|人类反馈改善视频生成,身份保留人类视频生成;多概念定制化3D生成,单次前向过程实现千张无序无位姿图像到3D重建
- 285-B1|GUI智能体;长视频理解,流媒体视频理解,多学科专业视频知识获取的评估基准
- 285-B2|用于细粒度视觉理解的像素级图像描述数据集,神经视频压缩;LoD 3DGS压缩,从运动模糊视频中重建3D人类
- 284-A1.1|扩散模型推理加速,线性DiT高分辨图像生成计算复杂性问题;鲁棒表示一致性模型
- 284-A1.2|文生图精确相机控制;单图3D物体操控,文本到RGB+深度+表面法线图的联合生成
- 284-B|图像视频理解;现实世界NeRF综述,基于离散小波变换的少样本NeRF,高效3DGS
- 283-A1.1|多模态MLLM统一视觉理解与生成,多概念个性化,扩散风格迁移,可控布局到人类生成
- 283-A1.2|平面设计生成,文生图认知形态攻击,GPS坐标+文本提示到特定地理位置图像生成,图像编辑降低图像引发的情感强度
- 283-A2|图像视频虚拟试衣,掩码自回归视频生成,用于检测AI生成视频的基准数据集;视频深度估计,视频修复
- 283-A3|混元3D资产生成大模型,为骨骼对象合成符合环境和物理特性的姿势,3D场景生成;3D汽车建模,非刚性服装网格配准
- 283-B1|长视频及丰富上下文MLLM,多学科视频理解基准,多模态奖励模型;GUI交互智能体,多智能体移动助手
- 283-B2|视觉中的生成式物理AI综述,HDR成像,楼层平面图相关,基于2DGS的视频表示与压缩
- 283-B3|3D重建系列
- Day282|今日ArXiv无更新
- 281-A1.1|示例图像引导图像编辑,文本驱动图像编辑的评估基准,概念擦除评估基准
- 281-A1.2|文本到多样化2D卡通角色生成,信息非对称图像转译,图像“标记”化
- 281-A2|人类图像动画化,扩散视频修复,文本嵌入空间插值提高文生视频模型,探索从未标记视频中学习知识
- 281-B|多模态面部理解,现实世界视频超分;文本驱动高斯头部编辑,语音驱动3D眼动动画,高斯表面跟踪与重建
- 280-A1.1|单与多主体图像个性化,肖像图像重光照,在扩散推理过程中通过优化噪声搜索来增强生成效果
- 280-A1.2|对象检测框可控图像生成,多对象交互文生图提示忠实度问题,烹饪步骤图像生成,视觉“标记”器
- 280-A2&A3|灰度视频着色化,fMRI梦境转为视频叙事,能否通过观看视频学习物理原理;4K纹理网格生成,视频到3D重建模型
- 280-B|VLM理解否定语的基准测试,视觉常识推理,整合音频与面部微表情的视频MLLM情感分析,通过合成数据增强3D理解
- 278-A1|基于参考的线条艺术着色,民主化掩码文生图模型,视频先验交互式编辑,物体移除;中文字体生成;DPM量化,对抗样本生成
- 278-A2|一步视频生成的对抗后训练,图层可控动画生成,游戏视频生成;复杂提示文生视频,视频运动控制;不同制作风格视频转场推荐
- 278-A3&B2|从单张人像照片生成3D角色,建模4D HOI动态模式,从单目视频预测4D手部轨迹,物体为中心2DGS
- 278-B1|MiniMax-01;图像视频区域级理解,从详细视频描述到全面视频理解,视频动态面部表情识别
- 279-A1|剪贴画角色动画化,图像生成的视觉缺陷修正,MLLM艺术作品美学推理基准
- 279-A2.1|重新思考跨层表示用于视频生成,并行“变换器”用于扩展大规模文生视频,长视频生成的内容一致性;评估生成视频的质量
- 279-A2.2|视频虚拟试衣,3D面部先验视频面部交换,肖像图像动画化
- 279-A3|4D城市生成;通过文本描述在大规模3D场景中实现6DoF相机定位,用于可扩展3D重建的神经隐式表示
- 277-A1.1|生成式AI用于赛璐珞动画的综述,局部提示控制DiT图像生成,填充“标记”在T2I模型中的机制分析;虚拟试衣
- 277-A1.2|区域感知微调,用户偏好与推理阶段奖励,个性化偏好微调;视觉生成模型量化的比特级缩放规律
- 277-A2|运动引导视频生成的时间一致性问题,评估视频编辑,面部视频编辑,肖像视频编辑
- 277-A3|3D物体视频大型数据集,3D物体部件与材料大型数据集;前馈3D感知新视角图像生成
- 277-B1|极长自我中心视频理解的基准数据集;评估生成图像多视图一致性的度量标准;跨模态图像匹配
- 277-B2|单目视频转逼真且可交互3D模拟环境;单目视频3D重建,3DGS转点云;3D高斯头,3D人类重建
- 276-A1|基于效价-唤醒度模型的情绪图像生成,视觉文本生成,HOI个性化图像生成,诗歌图像生成,扩散奖励对齐
- 276-A2.1|多主体开放集个性化视频生成,长视频生成,长篇叙事视频生成,短视频广告创作与编辑
- 276-A2.2|检索增强视频生成,自回归长距离场景生成,3D相机轨迹控制的单图生成场景飞行视频
- 276-B|逐步视觉推理,电商与短视频视觉语言;多图像定位,在线视频理解;3DGS压缩;3D人类运动预测
- 275-A1.1|去中心化高效扩散模型,音频到图像生成,多实例图像生成,统一条件自回归生成,虚拟试衣
- 275-A1.2|探讨人类绘画能力的演化过程;高效DiT,R3GAN;NSFW内容生成问题
- 275-A2|精细可控图像动画化,探讨从视频中进行自回归预训练的有效性,视频标记器,基于分层GS的高效视频表示
- 275-A3|一致流蒸馏文生3D,Zero1toG图生3D;单图生3D头像,单视图云彩重建;图生CAD;大型多模态全身运动数据集
- 275-B|结构化图像理解,大规模长视频理解数据集,具身认知基准测试;个性化盲人脸修复,视频问答
- 274-A1|虚拟试衣,文生图扩散模型量化;细粒度复杂性分析探讨VAR模型的计算极限
- 274-A2|多概念视频定制化,低成本视频编辑,图像引导视频编辑;视频配音,唇读视频生成,情感语音合成
- 274-A3|3D鸟类生成,单图到3D生成,指令引导LRM编辑,LLM室内设计生成,分层解偶服装角色生成
- 274-B|模仿人类重述反馈改进图像描述生成;稀疏视图表面重建,镜面反射表面重建
- 273-A1|文本驱动图像编辑,视觉提示引导编辑;基于主体的个性化生成;文生矢量图;虚拟试穿系列;评估图像描述生成,NSFW相关
- 273-A2&A3|电影级ID视频生成,多控制3D感知视频生成,生成式帧插值;4D风格化,单图逆渲染基于物理的编辑,网格纹理生成
- 273-B1|闭环开放式自动化科学研究框架,LLaVA-Mini压缩视觉标记提高模型效率,3D大型多模态模型
- 273-B2|3DGS(紧凑型复杂运动动态场景;雾霾场景,高效压缩,版权保护)
- 272-A1|文本引导图像风格迁移,多模态面部提示优化,面部表情编辑,指令引导生成与编辑;增强SD空间排列能力及其评估
- 272-A2|文生RGBA视频,mask运动轨迹引导图生视频,基于伪4D高斯场的视频生成,任意长度的长视频高效生成
- 272-A3&B4|点图条件扩散用于单图NVS,3D语义布局引导文生场景;手部运动重建,理解双手物体交互,自然环境4D人类场景重
- 272-B1|时空EEG分析;多模态系列
- 272-B2|内容自适应图像标记器,高斯掩码自编码器;基于参考的图像修复;文生图来源识别,检测AI生成面孔,公平性评估;深度估计
- 272-B3|现实世界视频超分,现实世界视频恢复;AI生成视频质量评估;视频隐式神经表示;单声道音频转双声道立体声
- 271-A1|情感驱动音乐到视觉图像操纵,反编辑概念抹除;多身份视频个性化,音频驱动肖像动画化,音频驱动3D感知说话脸视频编辑
- 271-A2|单目视频到4D自回归生成,单目视频重建动态衣物解耦数字人;基于潜在空间GAN的人体动作合成
- 271-B1|面向GPT-4o的实时视觉与语音交互,多模态慢思维系统,面向长视频理解的大规模基准与数据集,图像描述生成
- 271-B2|单目视频重建3D,基于跨视角GS的大型场景重建,基于并行GS的大型城市建筑细粒重建,通过RGB图像估计布料3D状态
- 270-B1|多模态视频理解系列;多模态3D理解系列
- 270-B2|面孔与人类理解综合性基准测试,高分辨率深度估计,扩散结构化语义先验增强图像任务;图像描述生成,视频摘要生成
- 270-B3|室内场景稀疏表面重建,GS初始化与稠密化,从未标记视频重建全景场景,基于球形高斯的GS加速;开放词汇3D高斯分割
- 270-A1.1|概念个性化文生图,对象级视觉提示用于组合性生成;实体级控制生成,测试时间可控生成;分层图像合成;多类别风格生成
- 270-A1.2|音频引导视觉场景编辑,高效高质量与加速生成系列,基于参考的草图提取,结构化视觉内容PPT设计,面部美学优化策略
- 270-A1.3|自回归视觉生成,统一图像生成理解;LDM重建与生成间权衡,高效扩散(扩展3x3卷积,后训练量化);文生图GAN
- 270-A1.4|图像和谐化质量评估,物体移除;精准消除不当目标概念,偏见与刻板印象,图像水印技术
- 270-A2|DiT视频恢复,视频对象插入,可控相机与对象运动的合成数据集,视频生成与相机姿态估计;优化视频生成各个组件相互作用
- 270-A3|前馈重建模型编码的3D生成,学习服装动画化;从谷歌地球提取建筑网格,自动驾驶4D街景生成,稀疏重建大型动态户外场景
- 269-A|今日Arxiv无更新
- 268-A|今日Arxiv无更新
- 267-A1.1|统一像素级视觉LLM实现理解生成分割编辑,对话为中心的故事可视化,细粒度多维人类偏好学习,透明通道动画贴纸生成
- 267-A1.2|平衡内容真实感与艺术风格,增强视觉美学,野外现实世界图像编辑;直接优化扩散过程的端到端训练框架
- 267-A1.3|图像属性操控的轻量级插件,针对个体面部特征的多样化妆容;文本引导时尚图像编辑,细粒度属性增强时尚视觉语言预训练
- 267-A1.4|第一人称空间视频的感知质量评估,立体图像内容质量与偏好评估;图像的符号解耦表示;安全(概念擦除,AI生图检测)
- 267-A2|Open-Sora高效视频制作民主化,多属性开放域视频编辑;细粒度视频到音频,音频驱动说话头,高斯场头发保持说话脸
- 267-A3|前馈文生3D场景,场景图与布局引导复杂场景生成,静态3D转动态4D,单肖像图生个性化3D头;照片真实感3D虚拟世界
- 267-B1|几何数学视觉推理,长视频理解,视觉FM在不同视角下的不稳定性;EEG到图像视频音频综述;低光图像增强,密集预测任务
- 267-B2|3D人类身体生成式建模;全身人类抓取动作合成,多身体HOI合成;GS(关键帧为中心,概率掩膜自适应,原生4D原语)
- 262-A2.1|多文本长视频生成,基于故事板的文生视频,评估文生视频模型的故事完成能力,用于故事情节深度视频理解的大规模数据集
- 262-A2.2|多角色视频,自由视角人类动画化,音频驱动虚拟头像;大运动视频帧插值,大运动视频VAE,视频VAE解耦结构与动态
- 262-A3.1|自回归3D生成,形状VAE,复杂形状可微分网格;单人脸图生成3D头部,前馈文生3D人类,VLM自动化3D服装
- 262-A3.2|交互式3D场景创建,动态NVS用于电影制作;法线引导点云到3D高斯绘制;室内场景合成(纹理合成,场景隐式神经)
- 262-A3.3|弹性物体高斯模拟器;不可见3D声源定位与分类;大规模双人舞蹈数据集,多人交互动作生成,全面的共语动作生成
- 262-B1B2|文本丰富视觉理解,图形问答,流程图理解;人类中心视频理解;聊天机器人;EEG视觉解码;零样本学习;手物操作视频
- 262-B3.1|大规模场景重建,前馈GS全景重建;拓扑感知GS结构完整性优化,几何纹理感知密集化用于真实感GS,主动式场景重建
- 262-B3.2|语言嵌入表面高斯用于场景理解,未校准稀疏前馈生成语义高斯;未校准稀疏HSfM,野外高难度物理合理人类动作恢复
- 论文研读|TEXGen:一个生成式扩散模型用于网格纹理|SIGGRAPH Asia 2024 最佳论文提名
- 招生|香港中文大学(深圳)招募 | 脑机智能方向 博士生 & 实习生
- Day262|A2A3B1B2B3遗漏补回提示
- 266-A1.1|高效视觉风格迁移(单轨迹蒸馏加速,基于RWKV架构);自动化图形设计合成,故事到漫画,面板布局如何影响漫画
- 266-A1.2|奖励引导的负嵌入学习,可控生成适配器,选择性主体驱动定制化,多模态条件局部面部编辑,DiT加速;自发现去偏见
- 266-A2|视频编辑的无缝帧传播,零样本视频定制化,实时无限视频流动画生成,持续的文生视频通用预训练;UGC视频质量评估
- 266-A3|结合3DGS统一图文3D表示;3D高斯风格化,可编辑3D高斯头像;CAD结构序列合成,3D形状生成,高频几何SDF
- 266-B1|图表理解,GUI智能体;统一的跨个体脑解码,探索色觉进化及其启发的相机设计
- 266-B2|文生图“字幕噪声”鲁棒性,轻量级图像字幕;多样化稀有样本生成,驾驶场景物体编辑,面部图像伪造定位;视频过程规划生成
- 266-B3|动态视频、反射物体、恶劣天气、稀疏未校准3D重建;未同步未校准视频重建4D
- 263-A1.1|连续条件随机场提高潜在扩散推理效率,通过多模态优化增强图像文本一致性,时尚增强服装图像编辑,个性化面部图像生成
- 263-A1.2|通过递归“标记”预测机制增强扩散过程,利用文生图扩散模型解释分类器的决策,文生图模型评估,文生图偏见攻击
- 263-A2|基于多模态DiT的无调优多提示长视频生成,教学视频制作的最佳相机视角选择,从渲染3D模型中学习稳健单图物体方向估计
- 263-A3|部件级3D生成,多视图扩散增强,自回归3D建筑设计生成;零样本4D人类场景交互合成
- 263-B|以解释性指令统一视觉任务与零样本泛化;视觉空间推理评估基准,无编码器视频语言理解,结合语义图与LLM增强3D场景理解
- Day264|今日Arxiv无更新
- Day265|今日Arxiv无更新
- 262-A1.1|统一图像生成与编辑,细粒度身份定制化,用户引导图像生成;服装中心人类图像生成,虚拟试衣;字符级视觉文本生成编辑
- 262-A1.2|资源高效DiT,资源高效扩散自适应量化,蒸馏解码用于自回归加速;自校正流蒸馏,优化压缩与生成之间的权衡
- 262-A1.3|生成式扩散建模的实用手册;产品广告图像评估框架;图像阴影去除;完整性验证,AI生图检测,评估AI合成与自然图像
- 261-A1.1|人脸定制化图像生成;文本引导图像编辑;将DiT注意力计算复杂度降到线性,剪枝扩散模型的高效微调
- 261-A1.2|自回归图像生成,AI生图在视觉传播中的质量评估,安全CFG,多概念模型免疫化
- 261-A2|通过蒸馏与奖励优化实现少步视频生成,文本引导图像动画化,运动与外观定制化;文本条件的视频到同步音频合成
- 261-A3|3D形状“标记”化,3D域适应解决姿态和身份一致性问题,逆渲染与交互反射高斯溅射,视频生成模型能帮助姿态估计吗?
- 261-B|合成数据训练个性化视觉表示,三维颜色查找表的高效神经网络编码;从模糊散焦图像重建3D场景,稀疏视图表面重建
- 260-A2.1|3D轨迹控制图生视频,文生视频(偏好对齐LLM与提示优化,在线视频中心偏好优化);综合电影信息生成情感长篇小说
- 260-A2.2|文生以人为中心的视频,人类图像与视频生成;循环视频“变换器”;视频到音频与音频到视频生成,视频同步音效合成
- 260-A3.1|逆向程序化3D生成,PBR图生3D,关节物体数据生成;图生真实感人体,多模态服装缝纫模式生成;真实车辆NVS等
- 260-A3.2|统一渲染与逆渲染,极端光照变化重建,复杂反射高斯建模;自回归动作生成缩放法则,组合动作生成,共语手势表情说话脸
- 260-A补|通过像素操作与生成技术实现一致的图像对象编辑,结合事件相机的动态场景12档HDR成像,密集视频字幕与事件定位
- 260-B|神经表面重建,稀疏视角3DGS,面向重建的多海拔多季节数据集;从低光图像恢复NeRF;高效高斯人;单图恢复人类网格
- 260-A1.1|名称空间身份一致生成,循环编辑一致性实现无监督指令引导编辑;内容风格解耦表示,内省风格归因;LLM图文理解生成
- 260-A1.2|平铺扩散用于图像无缝拼接,将任意物体无缝插入任意场景,通过潜在空间曝光融合实现HDR内容生成,虚拟试衣相关
- 260-A1.3|图文跨模态流匹配,后训练量化敏感性问题,利用扩散模型评估视觉相似性;并行自回归视觉生成,尺度wise自回归建模
- 260-A1.4|向量量化训练不稳定性,归一化流模型,频域空间扩散图像生成建模,优化噪声调度提高扩散模型,信息论视角评估生成模型
- 259-A1|草图到场景,文本引导肖像重光照,局部面部属性编辑,基于点的互动着色;多模态组合虚拟试衣;高效连续自回归,理解与生成
- 259-A2|视频生成|草图/线条动画视频着色,相机运动与光学参数控制,用户偏好对齐,高效自回归生成,实时肖像视频生成
- 259-A3|PBR材质生成,拖拽式场景编辑;点云重建CAD逆向工程,基于VLLM的CAD创建助手;利用程序合成数据扩展场景重建
- 259-B|MLLM空间理解,统一指令性视觉分割,图像和谐化;语言3DGS,辐射场对象间语义关系;加速GS拟合,GS头部虚拟化身
- 258-A1.1|视觉概念分离生成,理解与生成的迭代交互优化,大尺寸图像生成;不同DiT在文生图中的扩展性,语言互动文生图智能体
- 258-A1.2|提升文生图空间理解,图案设计程序化编辑,提示增强文本引导编辑,无监督基于区域的编辑,物体去除
- 258-A1.3|评估AI生成面部图像的质量,AI生成图像的传输与压缩,隐形水印的攻击与鲁棒性
- 258-A2|大动作灵活控制动态视频插值,多实例视频编辑,电影语言视频生成;人类运动视频合成;通用开源视频“标记”器
- 258-A3|单视图到通用3DGS重建,3D场景编辑;基于可控视频扩散的动态街景视图合成;利用2D人类运动数据增强3D动作生成
- 258-B1|多模态思维链评估基准,文本引导长视频理解,以人类为中心视频的高光帧检测定位,合成视频检测器;密集音频-视觉事件定位
- 258-B2.1|体积视频流传输综述,纹理增强2DGS表现力,3D高斯无迹变换,NeRF视觉伪影问题
- 258-B2.2|从单目视频中重建人脸外观属性,从稀疏视角视频中实时合成逼真人类渲染,从动态相机捕获的单目视频中恢复4D手部运动
- 257-A2.1|主体驱动视频定制化,文本引导视频编辑,DiT视频生成加速,移动设备视频生成,视频面部交换
- 257-A2.2|视频生成模拟物体交互式动态,视频帧插值系列(帧条件驱动生成,双向运动场引导),多模态视频程序规划,视频标记化
- 257-A2.3|单目视频转立体,全景视频生成;单图像重光照视为视频生成,3D人体视频合成;文本与视频到整体音频,视觉文本到语音
- 257-A3.1|单图前馈生成GS场景,指令引导场景编辑;任意数量参考图重建4D肖像,文生发丝分离3D头像,单图重建游戏角色面部
- 257-A3.2|文生3D多维度质量评估;关节结构3D网格自回归生成,从CAD图纸到3D参数化模型;法线与材质属性估计与内在分解
- 257-A3.3|可变形径向核溅射;图生3D室内设计,多物体室内场景NVS;轻量级快速文生动作,统一人类动作的言语和非言语表达
- 257-B1|多模态|几何问题求解,专业精准图像描述生成,长视频理解及其QA基准;超高清动态多曝光图像融合
- 257-B2|基于GS的投影相机系统,基于前馈GS的4K全景合成,用视频超分提升3D超分;NeRF体积视频压缩,视频到高斯人建模
- 致读者|PaperDaily近期更新情况说明+年终感谢
- 257-A1.1.1|图像生成与编辑|灵活的视觉控制,指令引导编辑,双调度反演;提升图像生成(自我反思机制,整合ChatGPT)
- 257-A1.1.2|视觉生成与编辑|重构图像视频3D生成任务,多模态跨维度视觉编辑,可控图像阴影生成,评估生成式图像模型的库
- 257-A1.2.1|艺术专题|一个LoRA胜过千张图片,设计图纸外观迁移,图像序列着色;评估生成模型专业设计能力,图像美学评估
- 257-A1.2.2|艺术专题|DiT可缩放文生SVG,提升LLM理解与生成SVG,基于组件的SVG自回归,中日韩等表意字体设计
- 257-A1.3|人体与面部专题|从人物图像恢复标准服装,虚拟试穿,面部化妆迁移,亲属面孔生成
- 257-A1.4|安全专题|身份保留生成的隐私保护,基于个性化扩散模型的模仿保护,通过直接偏好优化实现安全对齐257-A|
- 257-A1.5|生成模型|EEG解码视觉刺激;因果扩散自回归,混合精度量化,连续图像“令牌”化;优化少步扩散采样,扩散与流匹配
- 256-A1.1|图像编辑(指令引导,复杂非刚性);面向生成任务的ID表示;揭示视觉幻觉生成,EP-CFG;深度生成图像模型综述
- 256-A1.2|安全篇|图像水印技术系列;个性化身份防御,面部保护与深度伪造;提示详细程度如何影响AI生成图像检测
- 256-A2|文本驱动图生视频,高分辨分钟级视频生成计算复杂性,高效自回归视频生成;视频虚拟试穿系列,多语言说话头,自动音频描述
- 256-A3.1|图生3D系列(多视角几何,3D高斯生成),文生3D基准;单图重建3D场景,NeRF纹理合成;多模态风格运动生成
- 256-A3.2|多智能体自我运动3D重建,大规模场景自由相机轨迹渲染,基于物理的神经场逆渲染,实时准静态神经发丝模拟器
- 256-B1|OP-LoRA提高微调效率;大型MoE VLM;视频理解系列(机制探索,长视频,数据集);全景图像超分
- 256-B2|3DGS稀疏重建,光场探针用于神经表面重建,单目视频4D重建;单目视频重建可动画化3D高斯头;开放词汇3D语义分割
- 255-A1.1|高分辨视觉生成(8K无调优,移动设备);知识图谱RAG,推理时间扩散蒸馏;统一多种视觉生成任务,图像理解与生成
- 255-A1.2|个性化定制(多概念,MLLM多参考,内容风格过拟合问题),语义编辑;图像修复,图像“标记器“,显式记忆生成建模
- 255-A2.1|一致且连贯长视频生成,统一帧管理器插件增强扩散视频生成,运动轨迹与强度控制视频生成,姿态引导可控人类图像动画化
- 255-A2.2|实例感知结构化视频描述生成,文本到视频片段定位与整合(视频时刻蒙太奇,视频剪辑任务,视频再利用的数据集与基准
- 255-A2.3|文本驱动立体视频,运动控制全向视频,从无人机视频学习相机运动控制;视频水印系列;演示视频生成,参考引导视频修复
- 255-A2.4|多模态检索增强音乐生成,视频引导音效生成;音频驱动肖像动画化,音频驱动口型同步;基于3DMM的面部一致视频生成
- 255-A3.1|高保真艺术网格自回归生成,多视角幻觉生成,XR下多模态草图到网格;逆渲染法线与材质估计,发型与服装分层人类生成
- 255-A3.2|可探索全景3D世界生成,稀疏无姿态GS前馈重建,视频先验单图到3DGS重建,利用3DGS探测视觉基础模型
- 254-A1.1|对象插入与主体驱动,基于文本的图像编辑,文本驱动风格迁移;复杂文生图(结构化注释的大型图文数据集,快速提示对齐
- 254-A1.2|可控人物图像生成;统一离散与连续的多模态自回归生成;评估文本到视觉生成;整流模型崩溃现象;扩散训练数据的影响
- 254-A2.1|3D网格形状编辑,无姿态稀疏重建,基于光度立体的大型网格重建模型,纹理网格显著性数据集;指令引导场景编辑
- 254-A2.2|动物姿态形状估计数据生成,从设计概念到缝纫图案程序化合成,大型CAD图纸全景符号检测;文生动作,多模态抓取生成
- 254-B1|VLM物理推理,评估LVLM综合图像描述生成,流媒体视频内容交互;生成预训练驾驶模型
- 254-B2|单图像人类网格恢复,光解耦面部纹理建模,从部分数据重建非刚性3D运动;稀疏视角快速语言高斯,NVS质量评估
- 255-B1|长语音理解,长时间流媒体视频与音频交互,长视频理解数据及基准,视频LLM视觉Token压缩,视频时间定位;视觉编程
- 255-B2|单目视频实时稠密重建,单图重建点云;4D重建(长时间体积视频,互联网立体视频数据,3D肖像视频流)
- 253-A1.1|细粒度视觉美学属性数据集,无需文本的视觉生成先验学习;统一生成与编辑,图像语义编辑;RL多轮个性化捕捉用户意图
- 253-A1.2|故事可视化,定制化漫画生成;扩散模型中采样可微表示,自回归与DiT之间插值;面部图像着色,姿势引导人物图像合成
- 253-A1.3|评估视觉生成模型(效率与灵活性,广告图像生成);安全性(概念擦除,水印嵌入,AI生图检测,后门攻击)
- 253-A2.1|可扩展条件视频生成,多镜头角色一致,艺术风格化;3D相机轨迹(对象运动控制,多实体运动),多相机不同视角一致性
- 253-A2.2|从缓慢双向到快速因果视频生成器,移动设备视频扩散;DiT视频运动迁移,事件驱动视频帧插值,音频驱动说话脸生成
- 253-A3|文本到高效高分辨纹理生成,可控3D关节物体生成,基于3DGS的程序化城市建筑生成,指令引导场景编辑;复杂文生动作
- 253-B1|多模态3D空间推理及其基准测试,多种PDF文档解析的基准测试;图像超分辨率系列
- 253-B2|百万级360度视频数据集,动态且光照不一致条件下生成式NVS,高斯重打光,更快更好的3DGS系列,合成先验高斯头像
- 论文简读|MM’24 最佳论文荣誉提名|基于尺度感知残差场与自适应优化的4DGS用于时间复杂动态场景实时渲染|北大×鹏城实验室
- 252-B1|MLLM视觉理解与生成,艺术作品物体检测,连续视频流模型提高视频预测效率
- 252-B2|3D重建系列
- 252-B3|服装动态超分,单图实时重建细致人体;4D动态场景重建系列
- 252-A1.1|语言空间中丰富图像特征,多轮挖掘用户需求,复杂提示文生图;高分辨率,流与扩散,统一多种任务,虚拟试衣,面部修复
- 252-A1.2|质量与效率篇|语言引导图像“标记”化,DiT质量与效率系列;扩散量化压缩系列;高效扩散推理系列
- 252-A1.3|离散插值连接掩蔽生成模型与扩散模型,分层潜在先验嵌套扩散;归一化流生成模型,课程一致性模型,生成式直线匹配模型
- 252-A1.4|安全性篇|概念擦除,基于参考,个人隐私保护,I2I中的视觉模态威胁;AI生图检测系列(对抗性攻击,利用不确定性
- 252-A2.1|相机运动控制视频扩散,解耦运动强度调制图生视频,混合分数引导视频运动迁移;移动设备视频编辑,空间时间视频修补
- 252-A2.2|视频扩散(外观漂移问题,基于知识蒸馏与分布匹配的扩散加速);面向长视频理解的精细视频故事生成,自然声音生成图像
- 252-A3.1|多样性分数蒸馏,多步编辑引导,逼真图生3D;快速精确形状编辑;物理运动合理,触觉感知外观细化;评估人类偏好对齐
- 252-A3.2|从大量视频学习多种3D创建任务;同时建模人类-物体-交互,检索增强手势生成,通过逆向运动编辑生成纠正性指导文本
- 251-A1.1|文本引导图像编辑的属性泄漏问题,文本到场景布局生成,内容与风格快速个性化,平衡个性化的概念忠实度与可编辑性
- 251-A1.2|初始噪声中的隐含引导,指令引导基于动作的图像编辑;微调后仍有效的鲁棒水印,增强了水印的隐蔽性和抗攻击能力
- 251-A2|文生视频(运动迁移,时间控制多事件生成,人类偏好对齐);可控视频颜色编辑,将视频分解为多个层
- 251-A3|图生360°3D全景,文本引导3D编辑;无条件4D形状生成,动态物体内在属性4D生成(如玫瑰生长);文生动作
- 251-B1|多智能体系统基准测试;InternVL2.5,复合图像理解,图像级LLM转为视频理解;稀疏AE相关,视频非模态分割
- 251-B1|大规模场景重建,硬高斯溅射,混合2D-3D高斯头像,3D关节物体与双手交互合成
- 250-A1.1|视觉自回归(高分辨率生成,视觉理解与生成,加速生成);自动化专业照片编辑,分层和谐文生图,前景条件图像修复
- 250-A1.2|多服装虚拟试衣,内容与风格分解;快速文本引导编辑,人类反馈数据集用于指令引导编辑;布局到图像,内容感知布局生成
- 250-A1.3|优化初始噪声减少扩散引导,评估知识密集型概念生成的真实性,推理阶段优化减少不安全内容,扩散编辑图像伪造区域定位
- 250-A2.1|基于多智能体协作的组合性文生视频,统一视频理解与生成,基于扩散压缩深度令牌的自回归视频生成,自回归视频帧延续
- 250-A2.2|混元开源大型视频生成模型;2D游戏角色动画创建;四平面因式分解视频自编码器;指导性视频生成;音频驱动说话头系列
- 250-A3.1|超快速文生3D,基于适配器的多视角图像生成;显式相机可控文生4D场景,照片级真实的4D视频扩散
- 250-A3.2|身体感知与语义感知的3D物体设计,大型多模态数字服装设计,利用噪声与频率信息的多视图扩散;检索增强人类动作生成
- 250-B|深度立体匹配;4D驾驶场景生成;检测与部件分割;形状与姿态重建,截面薄结构重建;静/动态重建系列;着衣人体重建
- 249-A1.1|可控文生图(自适应条件选择,3D形状指导);无微调个性化图像生成;统一图像标记器用于多模态理解与生成
- 249-A1.2|加速扩散模型推理,扩散模型低成本剪枝;编辑隐含的假设与先验,文生图模型的不确定性量化
- 249-A2|改善文生视频的文本理解,DINO引导主体驱动视频编辑;沉浸式360°视频生成,平面转立体视频;音频驱动唱歌视频生成
- 249-A3|3D风格迁移(多视角,超高分辨场景);设计师3D物体检索工具;单图生成复杂3D场景,DiT材料生成,骨架引导NVS
- 249-B1|图像视频实例级理解,评估VLM在真实世界中的三维变换鲁棒性;卫星到地面与地面到卫星图像合成;单目视频深度估计
- 249-B2|稀疏重建系列;3DGS水印、光栅化;室内表面重建系列;纹理化人类重建,人类多视图合成;动态场景重建系列
- 248-B1|个性化MLLM综述,科学图像生成,评估OCR对RAG的影响;可视化NN内部表示,视觉FM少样本适应性;轻量图像超分
- 248-B2|稀疏视角语言嵌入GS,平面GS;包含复杂运动的大规模动态场景重建,人体表面的部分非刚性变形与插值
- 论文简读|TPAMI 2024|实用、紧致的智能图像压缩感知技术|北大
- 248-A1.1|单步扩散高保真图像生成,将多步扩散蒸馏为单步;照片风格迁移,相机设置精确控制,真实手部图像生成
- 248-A1.2|高分辨扩散外推;文生图内部机制(扩散模型组件归因,人类视觉概念对齐);视觉字谜生成;经验回放个性化人脸持续学习
- 248-A1.3|自回归与向量量化,非模态深度估计;阴影检测、去除与合成系列;基于扩散图像编辑的数据增强
- 248-A2|统一图像视频生成与编辑;多镜头视频生成,运动轨迹控制视频生成,物理遵循的动态物体交互;逐步视觉指导生成,视频帧字幕
- 248-A3.1|解决多面体问题,多视图到多视图扩散,自回归3D生成;人形角色自动绑定,图生可动画化人类,基于VLM场景布局生成
- 248-A3.2|扩散先验稀疏NVS,彩色网格质量评估,对象组合场景重建;终身头像,文生情绪头像;双人交互生成,场景感知运动合成
- 247-B1|GUI智能体,VLM层级知识蒸馏,视频LLM的视频理解,检索增强图像描述生成
- 247-B2|文本到图像检索,基于草图的图像检索;真实世界图像恢复;检测AI生成的视频,视频单目深度估计
- 247-B3.1|3D场景下的视觉语言理解、交互、语义分割相关系列(6篇文章)
- 247-B3.2|室内场景光照迁移,自适应光照调节;3D空间人-物动态交互;手部重建,单图生成全身说话人,视频重建高斯人
- 247-B3.3|3D与4D重建相关系列(几何、动态、稀疏、无姿态、效率、移除、优化等问题)
- 247-A2.1|物体与相机运动解耦的静态图像运动预测,草图引导风格动态图片;相机姿态可控,定制化运动迁移;光流引导改善视频修复
- 247-A2.2|Open-Sora,15秒长视频生成;物理遵循系列(LLM引导,运动推理,游戏视频违反物理常识的评估基准)
- 247-A2.3|大型高质量人类中心视频数据集;高动态且真实感肖像图像动画化,2D姿势丰富3D几何线索人类图像动画化;说话头系列
- 247-A3.1|结构化3D潜在用于可扩展通才3D生成,多视图图像大型数据集,多视角修复用于物体编辑,可控场景生成系列
- 247-A3.2|从航空图像到生成式3D城市重建,可控3D/4D场景编辑;显式3D监督的世界一致视频扩散,2D图像重建3D结构
- 247-A3.3|大规模空中到地面重建,超大规模场景表面重建;3D自主角色沉浸式互动,从2D关键点重建动态物体3D结构;文生动作
- 招生|香港中文大学(深圳)招募 | 脑机智能方向 博士生 & 实习生
- 247-A1.1.1|高质量文生图,人类视觉偏好对齐,迁移图像质量评估的知识,基于不确定性估计的扩散引导采样,扩散高效推理
- 247-A1.1.2|自回归视觉语言的通用图像生成,任意到任意模态(文图音),无需艺术知识的艺术生成与风格迁移,文生图提示对齐
- 247-A1.2.1|先标准化再个性化,参考引导伪影修复,定制化概念交换,对象级布局控制与语义编辑,表情控制保ID肖像,面部绑定
- 247-A1.2.2|视觉文本渲染,扩散+GAN布局生成;细节深度估计;文本引导编辑、修复,自适应修复,盲逆问题,整流模型多任务
- 247-A1.3|自回归交错图文生成,仅解码器自回归视觉生成,图像标记化;扩散高效推理(DiT深度修剪,扩散模型混合精度量化)
- 247-A1.4|多样性与版权相似;文生图微调中被抑制概念重现;概念遗忘的程度,精确定位目标概念移除,持续概念移除;训练数据复制
- 246-B1|VLM用于视觉传达,视觉抽象推理,MLLM视频理解,面向长视频的视觉-音频-语言事件理解基准;ViT频率微调
- 246-B2|视觉堆叠物体计数,AI生图检测(利用视觉基础模型,利用光谱分布,多媒体深度伪造综述);超分(语义分割引导与扩散先验
- 246-B3.1|GS(增强颜色表现,动态与遮挡,水印保护);GS表面重建,室内房间重建;存储高效NeRF,360度图像3D重建
- 246-B3.2|单图到3D建模CAD(室内场景,交通车辆);单目视频到3D平面重建;三维场景理解系列;3D与4D语义分割系列
- 246-B3.3|表面光场正则化NeRF,基于扩散的可控重光照;多视图扩散先验点云补全,挑战性服装人体;音频驱动3D/说话头系列
- 246-A1.1|计数与空间关系,多相似对象混合问题;视觉文本渲染,标准服装的检索增强生成;MLLM增强图像生成语义与空间一致性
- 246-A1.2|前后期ckpt图像个性化,开放域多主体一致,ID保留的二维码生成;风格迁移,基于视觉指令的编辑,面部草图到图像
- 246-A1.3|自回归图像生成;扩散模型泛化性的机制解释;图像重建与编辑;文本引导多掩码修复,变分推断图像修复
- 246-A2.1|时空跳跃引导视频扩散采样;匹配剪辑视频生成,细粒度相机运动控制,视频DiT的3D相机控制;任务分解与模型选择
- 246-A2.2|文本引导视频生成(手绘草图,人类运动);高效视频生成(推理缓存,长视频化长为短);视频深度估计,面部视频到语音
- 246-A3.1|程序化3D场景系列;PBR材质生成,材质选择与分割,校正图生3D不一致性,自回归形状生成;文本驱动GS动态化等
- 246-A3.2|人类场景交互模拟长篇故事,2D扩散到3D运动,文本驱动全身HOI;动作文本生成,事件级文生动作,离散解码为连续
- 论文简读|基于多模态大语言模型的可解释开放世界人脸伪造分析助手|清华×港中文×港科大
- 244-A1.1|个性化定制(扩散自蒸馏,多身份个体全身,高效轻量级);相似主体忽略与混合问题,多实例位置与属性关联与控制
- 244-A1.2|提高文生SVG可编辑性;频率+注意力调制解决HR图像生成重复扭曲,单一参数ω控制生成细节度,生成式图像层次分解
- 244-A1.3|视觉文本渲染的拼写错误修正,(逆向虚拟试衣)从着装人物图生成标准服装图,少样本图像生成,高效视觉自回归图像生成
- 244-A2|解耦与统一的图生视频运动控制,视频扩散的压缩剪枝;人类视频生成的身份保持与运动控制,视频换脸;独特性音频描述生成
- 244-A3.1|动画预备角色生成;图生3D(物理合理与组合性,对称性,多视图优化);文生纹理网格与大型数据集,模式引导分数蒸馏
- 244-A3.2|视频生成4D场景;单图重建3D人类,纹理高斯增强外观建模,扩散蒸馏提升深度估计,可编辑GS,任意长度运动生成
- 244-B1|多模态理解与生成,交错图文生成的评估基准;概念为中心图表问题数据集;图像/视频恶意编辑与保护系列;扩散先验图像超分
- 244-B2|图示手册指导3D部件组装,破碎物体形状重组;BRDF逆渲染;3DGS(表面重建与语言分割,无约束稀疏重建,数据压缩
- 243-A3.1|图生角色与绑定;物理一致PBR材质估计,3D生成几何增强,自回归3D生成理解,稀疏视图GRM;物理驱动图生4D
- 243-A3.2|通过涂鸦注释实现单图室内照明;基于SSM的文生精细运动,统一运动合成与理解,统一多模态人体姿态理解、生成与编辑
- 243-B1|多模态系列:GUI视觉代理,视觉语言认知对齐,图像合成数据用于一般视觉语言任务,基于VLLM的通用图像视频分割模型
- 243-B1.2|文生图模型安全性评估,个人生物识别防御恶意生成编辑;语言先验改善单目深度估计,使用合成标题增强CLIP图文检索
- 243-B2.1|无姿态系列(可泛化3D重建,前馈3DGS生成);不透明精确表面重建,含干扰物体下的重建;内存高效动态场景重建
- 243-B2.2|程序生成3D模型用于自监督点云表示学习;混合显隐表示的表面重建系列,多光源NeRF内在分解编辑,服装高斯人重建
- 245|None
- 243-A1.1|加速视觉DiT推理,文生图提示一致与属性绑定问题系列,通过奖励增量蒸馏减轻遗忘现象
- 243-A1.2|指令引导图像编辑,基于文本的图像编辑,属性编辑与对象修补/内绘,视觉文本渲染
- 243-A1.3|交互式序列化草图生成;自动化文生图简化用户操作,AIGC图像不合理性评估,交错文本与图像生成评估;虚拟试衣系列
- 243-A1.4|改进CFG负引导,条件DiT与CFG,基于重要性的标记合并,VAR冗余问题;利用k-SAE理解黑箱扩散模型
- 243-A2.1|基于物理动态模拟的图生视频,基于轨迹控制的对象交互视频生成;直接用文生视频实现基于文本的视频编辑,文本提示对齐
- 243-A2.2|HOI产品推广视频生成,ID保持/身份一致视频生成(人类图像动画化,文生视频,定制化)
- 243-A2.3|视频深度与法线估计;视频生成感知质量评估、时间与文本一致评估;视频DiT精确缩放定律,小波流VAE高效视频生成
- 243-A2.4|音频驱动说话头系列;多模态条件视频引导Foley音效生成,人类说话视频文本到语音生成
- 242-B1.1|安全问题系列:机器遗忘/反学习,个性化隐私保护,图像水印嵌入,AI生图检测
- 242-B1.2|评估度量系列:生成模型输出的多样性,感知质量与对齐质量,质量评估FLD+;文生图(交互式视觉评估,基于任务分解
- 242-B2|多模态系列:图像多粒度描述生成,综合音频与视觉信息提升MLLM长视频理解,MLLM评估方法综述
- 242-B3.1|NeRF图像修复;实时高分辨NVS,未标定无姿态稀疏重建系列;真实世界几何表面重建,结合SDF与GS的重建系列
- 242-B3.2|重建与编辑(单目视频到全头高斯,动态面部头像);探讨DNN面部感知是否遵循2D-2.5D-3D人类视觉表征理论
- 242-A1.1|多种图像生成与理解任务大一统;指令引导编辑与数据集,基于流变换器编辑,视觉文本生成;主体驱动定制化,面部个性化
- 242-A1.2|LLM文生SVG,VQ笔画表示的草图生成;通过像素区域重排实现风格图像生成;自回归全景图像生成,色度键图像生成
- 242-A1.3|文生图十年综述;基于场景图的评估与反馈用于可控生成,LVLM优化初始噪声以增强语义一致,基于注意力图的语义对齐
- 242-A1.4|元先验知识的室内设计图像生成,无梯度分类器引导,自适应可控扩散,布局和外观引导生成,因子量化的视觉token化
- 242-A2.1|故事到视频生成,RGBA层视频分解;光流引导提示优化提高连贯性,草图与文本引导视频实例重绘;高效自回归视频扩散
- 242-A2.2|数据集与评估基准(分层电影级长视频,视频局部编辑大型数据集,人类活动AGV质量评估);局部声源感知视觉到音频
- 242-A3.1|单图生3D网格,单图生PBR材质3D,Zero123的关键分析;3D先验多视角生成,多视图整流模型直接合成GS
- 242-A3.2|足球动作生成,运动学感知的人体运动理解与生成,重新思考扩散模型用于文本驱动人体动作生成,有限数据下人体动作生成
- 241-A1.1|高分辨率自回归图像合成;统一条件图像生成,文本引导编辑,风格友好SNR采样;扩散模型偏好对齐;图形设计量化评估
- 241-A1.2|个性化面部年龄转化,文生图模型后训练剪枝,加速无配对图像到图像转换
- 241-A2|提示对齐文生视频修复,人类服装动画生成;PBR材质生成,UV空间网格纹理生成,任意模态到3D生成
- 241-B1|长视频时间定位,动态token压缩提高视频LLM效率,大型视频问答数据集用于细粒度视频推理;长视频高效token化
- 241-B2|GS重建(自然场景复杂照明与遮挡,硬边缘与扁平表面,流式4D重建);面部稳定化;物理合理动作生成,高效扩散抓取合成
- 240-A1|图像编辑(基于DiT,大型数据集);群体个性化身份泄露问题,身份保持面部修复;图像生成工作流优化;安全与可靠性问题
- 240-A2|立体视频生成,评估视频生成质量;单阶段图生3D;视频扩散先验新视图外推,多模态基础模型与视频扩散先验4D场景模拟
- 240-B1|从生成角度评估多模态图像理解,长链视觉推理;时尚服装文本数据集,开放世界统一目标检测与理解,拓展视频MAE至长视频
- 240-B2|大型模型先验HOI重建,快速无歧义的语义GS,鲁棒的神经表面重建,小提琴演奏者4D姿态估计
- 239-A1|多任务统一框架,编码风格信息,解耦扩散条件引导,开放世界外观补全;RGB引导RAW图像生成,文本到姿势到图像生成
- 239-A2|加速DiT视频生成,质量评估;网络照片生成3D一致视频;身份保留3D头部风格化,3D部件分割,物理模拟,动作生成
- 239-B1|评估LMM视频分析能力,检索增强长视频理解;视觉-大脑理解;加速图像超分,基于离散小波变换的噪声鲁棒预训练
- 239-B2|AI生成检测器、版权保护方法的评估;GS重建加速,语音驱动3D情绪面部动画化
- 238-A1|LLM辅助文生房屋平面图,恒定速率扩散噪声调度,扩散乘积量化,自回归图像生成推理加速,多项式混合器高效图像视频生成
- 238-A2|基于自然语言指令的视觉时间线编辑(指令视觉组装),从单目输入生成立体视频
- 238-A3|草图引导3DGS变形,3D物体内部纹理生成,单图重建任意3D对象;EEG解码人类3D视觉刺激;可控语义场景生成
- 238-B1|慢思维CoT指导多模态数学推理,符号演示DPO提升视觉上下文学习,基于自适应跨模态内存压缩机制的长视频理解
- 238-B2|稀疏重建,稀疏视图广阔场景重建,基于线性核的快速高质量3D线性溅射,跨时间关系建模提升现有可变形3D高斯动态重建
- 237-A1.1|RGBA分层图像生成,测试时间条件文生图,零样本布局到图像生成,少步扩散与密集奖励反馈,基于信任采样的约束扩散
- 237-A1.2|基于MLLM的文本字形布局设计,虚拟试衣,编码面部妆容;大型视觉DiT,基于生成模型视觉知识的单目度量深度估计
- 237-A2|多条件可控图生视频,光流运动条件T2V,文本引导编辑;草图动画化;物理现象视频扩散;评估视频构图分析、文生视频幻觉
- 237-A3|外观重建模型图生3D,光条件多视角扩散文生3D,深度潜在单图生3D;生成式具身世界想象性探索,网络视频4D家具组装
- 237-B1|跨文化图像描述生成,多概念个性化VLM;基于曼巴的统一sRGB到RAW;将多模态学习统一为下一帧预测问题
- 237-B2|图像退化条件下NeRF重建鲁棒性,用于大规模城市场景的占用网络学习;实时高斯人类场景,视频高斯溅射
- 236-A1.1|自回归图像生成系列,图像引导颜色编辑,虚拟试衣;精细图像抠图,图像拼接与修补
- 236-A1.2|滑动窗口引导提高扩散图像生成感知质量;任意比例图像超分;高效扩散训练;内容感知保留生成;评估文生图的图文逐对齐
- 236-A2|结合音频、参考图与手势序列的半身人类动画化;文本引导3D编辑,多视角风格迁移,单图生3D肖像,创建可交互具身场景
- 236-B1|步步推理的复杂视觉问答,Claude3.5案例研究;对齐三种神经数据的神经基础模型;交互式图像分割,多维字节对编码
- 236-B2|极化逆渲染用于导体与绝缘体重建;改进3DGS的密度控制策略,视频到4D非刚性辐射场重建
- 235-A1|交互式图像编辑系统,通过图像再生评估文生图模型性能,为扩散模型生成“黄金噪声”,扩散图像合成中伪影与质量不稳定问题
- 235-A2|结构化图案合成与任意尺度扩展;音频驱动肖像与动物面部动画化;说话头细粒度情感编辑;评估视频理解的抽象认知能力
- 235-A3|任意到多种模态生成,越狱攻击与防御综述;基于LLM的文本到3D网格生成;多领域3D人体姿态估计与运动插值
- 234-A|基于DiT的细粒度图像语义编辑,自动化提示词工程;视觉自回归综述;艺术角色动画化,复杂动作视频生成
- 234-B|从食品图像生成食谱,艺术图像美学评估;用于自我中心视频生成的大型视频数据集;3DGS(可学习的纹理原语,动态重建)
- 233-A1|统一图像理解生成,评估生成模型空间关系理解、学习抽象规则能力;多参考图像“缝合”;流扩散快速求解器,流匹配后验采样
- 233-A2|基于小波的3D形状紧凑潜在编码,多模态3D生成;像素空间扩散模型用于NVS,通过解耦NeRF实现材料变换
- 233-B|扩散模型统一多种视觉感知任务;评估AI生图检测器,数据归因;GS模糊与伪影问题,交互式分割,动态场景在线重建,逆渲染
- 232-A1.1|英伟达高质量图像生成;字节指令引导编辑,指令引导编辑通才,基于文本的对象插入;可控文生图(区域感知,语义绑定)
- 232-A1.2|视觉自回归综述;非自回归高效图像合成,移动设备上高效图像生成,扩散采样加速;局部图像水印嵌入
- 232-A2|相机运动控制视频生成;通过音频-视觉角色识别改善长视频描述生成;通过全脑分析解码视觉体验及其语义
- 232-A3|英伟达高质量3D资产高效生成,3D资产网格生成,3D对象部件分割;文生CAD,可控CAD;关键帧掩码建模运动生成
- 232-B|GS(紧凑,压缩,OOD视角),低光图像重建明亮NeRF场景;人体动态表面重建,SDF服装模拟与运动碰撞,人群重建
- 231-A|文生图定制化的灾难性遗忘问题,扩散负提示采样;文本引导视频到音频生成;单图生成语义分解的3D角色,部分物体形状补完
- 231-B|评估图像描述生成、图像描述质量对文生图影响;更快视频变压器;结构化3D高斯,薄透明物体表面重建,NeRF体积视频压缩
- 226-A1.1|资源受限设备文生图个性化,评估图像生成模型生成文本的准确性,随机自回归视觉生成;图像虚拟试衣,视频虚拟试衣
- 226-A1.2|基于文本的小物体编辑的基准评估数据集,场景文本去除;探讨扩散模型中高密度区域的图像特征
- 226-A1.3|MLLM生成式与判别式训练,视觉傅里叶提示微调;零样本图像抠图,条件可控图像融合
- 226-A2|开放世界游戏视频生成,视频色彩风格迁移,快速且内存高效视频生成,无限分辨率积分噪声扭曲用于视频生成时间一致性问题
- 226-A3|智谱AI文生3D与域分数蒸馏,风格图像引导3D纹理生成;3D物体知识注释
- 226-B1.1|少样本NVS过拟合问题,将变形先验纳入动态重建以提高泛化性;大规模场景重建,点云重建SDF连续表面
- 226-B1.2|从单目视频重建可动画化人体,几何感知网格变换器;肌肉激活模拟数据
- 230-A1|后训练量化加速扩散推理,畸形手修复,多样化艺术风格的肖像个性化,少样本特定领域驱动图像生成,自回归图像生成
- 230-A2|定制化故事视频生成;新相机轨迹视频生成,对象与相机运动控制图生视频;图像视频反演编辑,基于强化学习的自动视频编辑
- 230-A3|单图生任意3D/4D场景,3D场景编辑,多模态CAD生成;音频驱动的音乐同步舞蹈动作生成
- 230-B1|多页多文档理解RAG,一小时视频语言理解数据集,像素级视频视觉定位;通过扩散模型桥接数据生成与密集视觉感知
- 230-B2|人类形状与姿态控制文生图,眼动驱动视觉内容生成编辑;稀疏视角360°NVS,平面反射感知NeRF
- 229-A|图像编辑(基于指令,基于样例);扩散曼巴,直接偏好优化,感知目标增强LDM;水印嵌入,检测AI生图;开放词汇文生运动
- 229-B|MLLM流媒体视频理解评估基准;少量视角全景NVS,6D物体姿态估计,3D实例分割,宽松衣着人体形状的点云扩散生成
- 228-A1|基于DiT图像编辑,条件机制与预训练策略;用于图生视频研究的百万级真实用户图文提示数据集,个性化视频摘要生成及数据
- 228-A2|可控CAD生成,从单张自然图像重建3D服装,颅骨雕刻,3D形状匹配及基准数据集
- 228-B|持续音频-视觉声音分离;少量未校准图像3D重建,集成人体生物力学特征的人类重建,自然语言3D视觉定位
- 227-A1|无需训练的区域提示用于复杂文本图像生成;自适应缓存加速视频生成,探讨视频生成模型学习与发现物理定律
- 227-A2|混元3D生成1.0,3D纹理UV生成,生成任何3D与4D场景;通过自然语言指令生成视觉特效(VFX)视频
- 227-B1|神经表征;图像表示;统一的语音识别框架
- 227-B2|AR环境360度光照估计,3D音频视觉分割;稀疏视角NVS,开放场景3D表面重建,多视图立体
- PaperDaily临时停更声明
- 225-A1|人类为中心图像生成,概念融合创造性生成,概念“缩放”增强!上下文LoRA任务无关DiT,人类素描过程启发高效DiT
- 225-A2|人类图像动画化,增强具有真实和复杂运动的视频生成,音频驱动3D说话视频生成;文本驱动全景生成;可重光照高斯头生成
- 225-B1|GPT-4V在时尚美学评估中的表现,视觉美感体验中语言与视觉美学的关系;扩散模型系列,机器反学习,检测AI生成视频
- 225-B2|图像去模糊数据集,稀疏无位姿重建,基于物理GS逆渲染,GS版权保护,视频恢复自遮挡人体;缩放逆图形学,车辆形状编辑
- 224-A1|稀有概念组合,关系感知定制,面部部位交换;细粒控制,量化多样性,稀疏AE,评估组合生成;任意分辨率,DDBM,蒸馏
- 224-A2|人像视频生成光照控制,动作驱动长视频生成;神经各向异性表面网格化,图生3D版权保护,逆图形自编码器,CAD草图推断
- 224-B1|GUI智能体,评估MLLM/VLM(视觉辅助数学推理,提取图像结构);深度神经网络内部表征的相似性;对抗攻击,水印
- 224-B2|视频概念分割!对齐音视频联合表示,表情夸张视频生成;在线基于点的3D重建,通用可泛化新视角合成,3DGS压缩
- 223-A1|多色头发编辑,因子图扩散模型改善提示合规性,量化扩散模型的整数LoRA用于高效微调,图像修复与人类审美对齐
- 223-A2|基于视觉提示的文生3D定制化,合成式街景3D网格模型数据集,通用人体运动-语言模型用于生成与理解
- 223-B1|VLM内部任务向量是跨模态的,VLM组合推理;多类文本反演,对抗性攻击,图像、视频扩散记忆化现象
- 223-B2|自回归视觉基础模型综述;MoE架构用于隐式神经表示;3DGS重建与NVS系列
- 222-A1|人类偏好对齐的单步文生图,自适应文本-图像协调;可控文生图空间定位,文生图模型中实体缺失问题;文生图多功能生成框架
- 222-A2|自动剧本生成;自回归扩散(高质量,长视频);视频生成评估综述;可控角色视频合成,局部视频风格迁移,无监督视频到视频
- 222-A3|组合性3D生成,EEG驱动3D物体重建;运动重定向;音频驱动全局姿势生成,高质量超长舞蹈生成
- 222-B1|多模态系列|灵活评估LVLM,多模态推理,视觉搜索助手,大型面部感知模型;多模态音频分离
- 222-B2|图像生成水印技术系列;解释GAN潜在空间,漫画视觉理解;自回归生成先验视频标记化,长视频理解
- 222-B3|全景图像场景重建,4D分解哈希编码,表面法线相关;大规模场景稀疏重建,未见物体表示为部件组合NeRF,NeRF加速
AIGC开放社区
- 微软开源Agent操作系统 :深度集成 Windows多智能体,超6000颗星
- 亿元资金池,百度邀你一起定义AI原生应用的中国范式!第三届百度“文心杯”创业大赛再次启动
- 突发!OpenAI免费开放Deep research,超强AI Agent
- 微软开发者挑战赛圆满收官,多项大奖见证AI创新力量!
- 重磅!微软上线GPT-image-1模型,支持高级功能定制
- 刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦
- 微软AI Genius训练营来啦!6场“理论+实战”课程,彻底点燃你的AI超能力
- 虚拟动点助力“利亚德集团2025年生态合作伙伴大会”圆满落幕
- 突发!OpenAI或将收购谷歌浏览器Chrome
- 字节跳动开源多模态AI Agent—UI-TARS-1.5
- AI视频创作平台Capsule,获1200万美元融资
- 量子计算重大突破!谷歌发布混合量子模拟方法
- 美国法官判谷歌垄断数字广告市场,可能面临拆分
- 大模型可解释平台Goodfire,获5000万美元融资
- 突破封锁!华为将发布大量AI芯片,平替英伟达H100
- 官方出品!OpenAI教你用Agent SDK,10分钟开发智能体
- 微软上线两款新模型:增强RAG和AI Agent
- 微软开源实时交互模型:提升Agent动态复杂处理能力
- 微软开源DeepSeek-R1魔改版:响应99%敏感提示,风险降50%
- OpenAI正以30亿美元洽谈收购Windsurf,加码Agent赛道
- 突发!特朗普禁止英伟达,向DeepSeek等提供AI芯片
- OpenAI开源超火Agent,5小时破5000颗星,霸榜Github
- 刚刚,o4-mini发布!OpenAI史上最强、最智能模型
- 谷歌提出Transformer架构中,表示崩塌、过度压缩的5个解决方法
- Adobe投资AI视频独角兽Synthesia
- OpenAI将进军社交网络平台,抢马斯克、扎克伯格饭碗
- 超越Sora!谷歌推出Veo 2,生成8秒超逼真视频
- 用于生成4D城市的大模型—CityDreamer4D
- Hugging Face收购 Pollen,进军实体机器人
- 67% Lazada商家称AI显著促进增长,Lazada成东南亚电商AI领军人
- 刚刚,OpenAI发布GPT-4.1,性能暴涨、100万上下文
- 微软、英伟达、苹果不受125%关税影响,获得豁免权
- Ilya新公司估值320亿美元,没有任何产品
- 从明天开始,OpenAI将发布大量新产品
- 对标OpenAI,谷歌开源Agent SDK,支持MCP、A2A、5000星
- 2025年全球AI指数报告
- ChatGPT终于发布长期记忆功能,开启个人Agent时代
- 刚刚,OpenAI开源BrowseComp,重塑Agent浏览器评测
- 面向营销人员的8大国外AI Agent
- 谷歌发布第七代TPU:性能大涨,专为大模型设计
- 突发!特朗普将中国关税提升至145%,美股暴跌
- 招募 AI 咨询专家 | 丰厚收入 、40万+企业级客户需求
- 4 月 11 日《1 小时 AI 公开课》,帮传统企业 “点亮” AI 魔法灯!
- AI Agent大变天!谷歌开源A2A,一夜改变智能体交互
- 斯坦福等开源代码定位AI Agent,极大提升开发、维护效率
- 谷歌升级AI搜索,加入视觉搜索功能
- 突发!特朗普把中国关税提高至125%,其他国家暂时降至10%
- 媲美OpenAI-o3,刚刚开源模型DeepCoder,训练方法、数据集大公开
- 英伟达开源15T数据集:32万个机器人训练轨迹
- 亚马逊正测试AI Agent,增强购物体验
- Isomorphic Labs获6亿美元,加速 AI 药物研发
- 反击DeepSeek失败!Llama 4效果不好,Meta承认有问题
- 阿里开源R1-Omni,多模态情感识别
- 上海交通大学发布“明岐”多模态大模型 突破消化道罕见病诊断瓶颈
- AI抢人大战!阿里国际启动大规模校招,80%为AI岗位
- 13万总奖金!AIGC岳阳楼大赛携社区小赛正式开启 | 千年名楼邂逅AI浪潮
- 企业级AI实战内训课程 | DeepSeek全景学习指南
- 1000万上下文!新开源多模态大模型,单个GPU就能运行
- 谷歌等最新研究,合成数据可将大模型数学推理提升8倍
- 30分钟让AI Agent自我觉醒,创新智能体框架–AI2T
- 苹果、英伟达股票暴跌!比特币崩溃,美国科技最黑暗一天
- 基辛格遗世之作:AI 吞噬世界下的人类
- 1小时AI公开课上线啦~首期课程解密传统企业如何抓住AI革命!
- 刚刚,OpenAI开源PaperBench,重塑顶级AI Agent评测
- 为大模型添加多模态能力——Mini DALL·E 3
- 数据竞赛 | INTERSPEECH2025多语种对话语音语言模型研讨会暨竞赛开启报名!
- 微软创想未来技能节,邀你一同创造吉尼斯世界记录!
- 城市AI合伙人招募启动!共享40万+企业精准客源与社区全链专业支持
- 1小时暴涨100万用户!GPT-4o新功能彻底杀疯了,免费使用
- 商汤最新财报:生成式AI增长超100%,成最大业务
- 马斯克的xAI收购X,估值800亿美元
- 微软Azure AI人工智能训练营第一季圆满收官!恭喜所有获奖学员!
- 20000颗星!100多个Agent超级工具,开源MCP大合集
- 微软AI Genius训练营来啦!6场“理论+实战”课程,彻底点燃你的AI超能力
- 微软、清华发布Agent创新方法,解决记忆、检索大难题
- 微软全球技术“领航员”空降北京,4月23日带你进入智能体世界
- 超8000颗星!微软发布免费Agent课程,0基础学智能体开发
- Agent重大突破!OpenAI智能体支持MCP,已开源
- 苹果因虚假宣传 AI 功能,被集体起诉
- 谷歌发布最强推理模型—Gemini 2.5 Pro
- 刚刚,OpenAI发布新文生图模型,免费、逼真到难以分辨
- 别让大模型想太多了,过度思考会影响性能
- 招募 AI / DeepSeek 讲师 | 丰厚收入 、40万+企业级客户内训需求
- 突发!DeepSeek开源新版V3,再次震惊国外
- 刚3月,已有9家AI企业融资超1亿美元
- 阿布扎比财团在美国投资250亿美元,用于AI建设
- 彻底颠覆教育!每天用AI学习2小时,成绩超美国98%学校
- 阿里开源多语言大模型,支持全球90%人口
- 亚马逊开源5级通用AI Agent:自动查询航班、天气,超4000颗星
- 刚刚,OpenAI首发语音Agent,智能体实现重大突破
- 精彩回顾 | “AI重塑生产力”沙龙成功举办
- 英伟达发布世界最小AI工作站DGX Spark
- GitHub Copilot 两期连看:开发流程全览及 Copilot 在 SQL 开发中的妙用
- 比DeepSeek、o1高3倍!首创无服务器强化微调,只需十几个数据点,
- 英伟达开源通用机器人大模型—GR00T N1
- xAI收购Hotshot,进军AI视频领域
- 英伟达全力发展AI Agent!开源专属大模型,最强AI工厂
- AMD开源30亿小参数模型,媲美Qwen-2.5
- 焱融YRCloudFile发布面向AI推理的分布式KV Cache特性
- AI Agent再迎一巨头!Zoom发布全平台Agent,智能体大爆发
- 从Manus看AI Agent的自动化悖论
- 软银投资1000亿日元建设AI数据中心,支持OpenAI业务发展
- 免费使用!百度重磅发布文心4.5、X1,视频解读+深度思考
- 美国陆军收到,首批AI模型驱动军事情报战车
- 今日AI沙龙 | 与行业大咖一起解锁AI狂飙下的生产力重塑密码!
- 海螺AI x AITOP100未来短剧导演大赛开启!探索AI短剧无限可能!
- 破解国产芯片FP8及DeepSeek部署难题,清华团队开源“赤兔Chitu”大模型引擎
- 再次突破丨虚拟动点赋能合作伙伴解锁机器人连续空翻
- OpenAI最新15页报告:DeepSeek缩小,中美AI竞争差距
- 语音模型平台Cartesia获6400万美元,只需3秒克隆语音
- Meta正与台积电合作,测试首款自研AI芯片
- 谷歌开源Gemma-3:媲美DeepSeek,算力暴降10倍
- 多智能体协作,DrugAgent重塑药物研发新范式
- 云计算巨头AI战略分化:谁将定义企业级AI的未来规则?
- 重磅!OpenAI开源首个Agent SDK,反击Manus
- 3月16日线下沙龙 | 与行业大咖一起解锁AI狂飙下的生产力重塑密码!
- 阿里国际站AI布局引多家外媒关注:AI搜索Accio企业用户超百万
- 微软AI开发者挑战赛 | 报名进入倒计时,海选作品提交通道正式开启!
- AI紧箍咒!OpenAI发布CoT监控,阻止大模型恶意行为
- Manus平替,两个非常火开源版本,超2000和5000颗星
- 线下沙龙 | 解锁AI狂飙下的生产力重塑密码!
- 中国第二个DeepSeek,Manus发布通用AI Agent,震惊国外
- LG发布NEXUS框架,用AI确保训练数据合规性
- 阿里开源新模型:媲美DeepSeek-R1,参数大降20倍!
- 微软AI技术进阶课第4期【文档智能技术】,锁定3月9日20:00-21:30~
- DeepSeek创造历史!登顶全球AI应用第2名,豆包排名第10
- 金融AI Agent平台Unique,获3000万美元融资
- 马来西亚与ARM达成2.5亿美元协议,自研AI芯片
- 杭州“六小龙”大火,用火山引擎开源AI预测杭州楼市,竟然挖到了这些关键数据!
- LlamaIndex获1900万美元,主打知识AI Agent
- 2万美元一月!OpenAI将推出博士级AI Agent
- 刚刚,OpenAI发布NextGenAI,彻底颠覆传统教育
- Anthropic获35亿美元融资,估值615亿美元
- T-Mobile将推出AI手机,售价低于1000美元
- 赛前启航 | 微软 AI 开发者挑战赛 3 场直播联袂来袭,解锁夺冠密码!
- Code Without Barriers 深圳站 · 国际妇女节特别版 International Women’s Day
- 活动回顾 | Code Without Barriers 北京站:AI重塑工作未来
- 线下沙龙 | 一起解锁AI狂飙下的生产力重塑密码!
- 全球首创!微软发布医疗AI助手,终结手写病历时代
- 中科院、百度提出新架构:突破参数限制,实现高效推理
- 速来!人工智能未来设计大赛·大模型专项竞技赛火热报名中!
- 速来!人工智能未来设计大赛·大模型专项竞技赛火热报名中!
- Sam Altman:用户要求,永远别更新GPT-4.5
- 微软提出AutoGen Studio,用低代码方式开发智能体
- 微软开源创新框架,自动优化大模型提示引擎
- 推理模型爆火,阿里国际站拿出了第一个产业应用:做外贸
- GitHub Copilot 精彩继续:探索基础架构与企业级管理新篇章!
- OpenAI发布GPT-4.5:功能非常特殊,推理很贵
- 英伟达发布天气模型CorrDiff,预测效率大涨
- 微软AI技术进阶课第4期【文档智能技术】,锁定3月1日20:00-21:30~
- DeepSeek开源优化并行策略,提升训练和通信效率
- 苹果开源通用视觉模型:创新训练方法,超1000颗星
- 道琼斯将AI市场,扩展近5,000家企业
- DeepSeek大放送,API史诗级超低折扣!
- 免费获取微软《AI + CX 转型实战指南》!营销、销售、服务难题迎刃而解~
- GPU效率暴涨!DeepSeek开源DeepGEMM,仅300行代码
- 新突破!微软开源多模态AI Agent,通杀数字、物理世界
- 苹果投资5000亿美元,大力发展AI基础设施、芯片等
- 医疗AI助手OpenEvidence获7500万美元,估值10亿美元
- 刚刚,DeepSeek开源DeepEP,公开大模型训练效率暴涨秘诀!
- 超过DeepSeek、o3,双思维模型Claude 3.7来了
- 谷歌提出Titans:突破算力限制,扩展上下文
- Together AI获3亿美元融资,扩大AI基础设施
- 5步助力企业破局!免费下载微软《AI 是未来趋势》报告
- 赛前启航 | 微软 AI 开发者挑战赛三场指导直播联袂来袭!
- 刚刚,DeepSeek开源FlashMLA,瞬间破1000颗星
- 国外权威认证!DeepSeek超150万模型,成最受欢迎开源大模型
- o1模型医学推理惊人,超过人类医生
- 微软发布创新大模型:一张图片就能生成游戏,游戏界ChatGPT来了
- 清华团队构建大型社会模拟器 AgentSociety ,可精确模拟社会舆论传播、公众政策响应等社会现象
- 有望治愈癌症!微软开源新模型,诺奖级重大突破
- 前OpenAI CTO 成立思维机器实验室
- 20年磨一剑!微软发布全球首个拓扑量子芯片,一夜改变半导体
- 高盛:DeepSeek等中国大模型,加速AI对全球GDP贡献
- Meta将举办首届生成式AI大会
- 全球首测!OpenAI开源SWELancer,大模型冲击100万年薪
- 清华、中南开源3D交互实体AI Agent LEGENT
- 生成式AI营销平台Tofu,获1200万美元A轮融资
- 开发者,找找找丨GDC化身爱情孵化器Love Combinator,助你“码”上脱单
- 刚刚,马斯克发布Grok-3,反击DeepSeek、OpenAI
- 赛前启航 | Azure 应用开发实战指南:开启创意的无限可能
- 重磅!OpenAI将开源 o3-mini,或适合手机大模型
- 大决战!OpenAI可能发布GPT-4.5,狙击马斯克Grok3
- 深圳上线70名“AI员工”,满足240个政务场景
- Adobe发布全新生成式AI应用Firefly,进军商业化
- 赛前启航 | 微软 AI 开发者挑战赛第一期直播正式开讲,不见不散!
- 微软开源创新框架:可将DeepSeek,变成AI Agent
- 像Sora一样,用物理模拟方式生成视频
- DeepSeek-R1下载量超1000万次,成最受欢迎开源大模型!
- 刚刚,OpenAI正式拒绝,马斯克973亿美元收购
- 重磅!百度宣布开源文心一言,加入开源大军
- 微软 AI 开发者挑战赛报名火热进行中,等你来战!
- 1秒锁定7500万债务黑洞,OpenAI o系列模型7大实际应用案例
- 官宣!阿里巴巴确定与苹果合作,为中国iPhone提供AI
- OpenAI发布最新模型规范
- 欧盟投资2000亿美元,全力发展AI
- 股票大涨!百度宣布最新文心一言、深度搜索,免费使用
- OpenAI放王炸!GPT-5免费无限使用,产品矩阵大整合!
- 文本生成无限长视频,无需任何训练
- AI帮外贸商家接到2000万美金大单后,阿里国际站接入DeepSeek等先进模型
- 微软AI技术进阶课第3期【Azure AI 自然语言处理(NLP)】,锁定2月15日20:00-21:30~
- DeepSeek并非完美,训练过程存在“深度诅咒”
- AMD开源科研AI Agent,一站式自动写论文
- 法国将投资1009亿欧元,大力发展AI
- 以AI之名,激发未来创想 | 微软 AI 开发者挑战赛即将启航!
- 谷歌CEO:现在就是AI创新,黄金年代
- 没发布任何产品,SSI以200亿美元估值,洽谈新融资
- 布鲁克菲尔德将在法国投资200亿欧元,建设AI基础设施
- 刚刚,Sam Altman深夜发文,AI Agent将重塑世界经济
- GPT-4o、Claude 3.5全部被攻破,开源大模型超强攻击框架
- 新增AI Agent,GitHub Copilot重大更新,超强自动化编程
- 阿里副总裁,否认投资Deepseek消息
- 极客说|利用 Azure AI Agent Service 创建自定义 VS Code Chat participant
- 突发!美国新法案,DeepSeek被政府禁用
- 清华、东大等发布EMAGE,音频自动生成动作丰富的视频
- 实体机器人Figure AI宣布与OpenAI结束技术合作
- 终结谷歌搜索!OpenAI免费开放ChatGPT搜索,无需注册
- 英特尔开源RAG Foundry 框架,可增强多种RAG用例
- 全球最高!50万师生使用ChatGPT,美国教育彻底变天了
- 美国新法案:禁止进口中国DeepSeek,违规罚1亿美元、监禁
- Sam Altman炸场东京,亲曝GPT-5研发路线图,多模态能力颠覆传统
- OpenAI反击DeepSeek!刚发布新模型Deep research,刷新最高记录
- 被DeepSeek干服了!OpenAI承认闭源错误,领先优势变小
- 麻省理工大佬: DeepSeek是科技史上伟大时刻,5年后依旧难忘!
- 刚刚,OpenAI发布o3-mini,可免费使用、3大推理模式
- 受DeepSeek影响,OpenAI正洽谈新一轮融资,估值3000亿美元!
- OpenAI怀疑DeepSeek使用其模型,蒸馏R1
- Sam Altman狂赞中国大模型DeepSeek,OpenAI有这对手很兴奋!
- 新年大礼!阿里刚开源视觉 AI Agent模型—Qwen2.5-VL
- 白宫官宣!特朗普新命令,消除一切不利AI发展的障碍!
- 2025年Meta投资600亿美元,用于AI基础建设
- 微软等开源AIOpsLab,可构建自主云AI Agent
- OpenAI掀桌子!免费版ChatGPT,提供o3-mini模型!
- 刚刚,OpenAI发布AI Agent—Operator,全民智能体时代来了!
- IDC:到2028年,全球AI基础设施支出超1000亿美元
- 上海市推动数字贸易和服务贸易高质量发展方案
- 知识图谱 × 大语言模型的 “实战宝典”,微软《GraphRAG 实践应用白皮书》免费下载
- OpenAI本月发布AI Agent——Operator
- 微软开源AI Agent大更新,重塑智能体!多层级更强架构
- 医疗复杂推理开源大模型——华佗GPT-o1
- AI技术进阶课来啦!技术深度挖掘与实践操作并行,Azure AI 人工智能工程师训练营正式开启!
- 极客说|Azure AI Agent Service 结合 AutoGen/Semantic Kernel 构建多智能体解决⽅案
- OpenAI权威报告!美国再不抓紧,1750亿美元将投资中国
- 智能体之间靠啥 “说话”?探秘 Agentic Web 通信基石 | 锁定 AI大咖说1月16日直播
- 医疗AI Agent独角兽Hippocratic,获10亿元融资
- 官宣!OpenAI加入机器人赛道,要打造实体AGI
- AI技术进阶课来啦!技术深度挖掘与实践操作并行,Azure AI 人工智能工程师训练营正式开启!
- 斯坦福大学-医学院使用AI模型,回复患者信息
- 德国BG诊所:ChatGPT在同理心方面,比专家更好
- AI技术进阶课来啦!技术深度挖掘与实践操作并行,Azure AI 人工智能工程师训练营正式开启!
- 重大突破!微软发布“自我进化”,帮小模型超OpenAI-o1
- Anthropic新研究:用统计思维评估大模型
- 焱融全闪 F9000X 性能再创新高,全面释放大规模 AI 计算效能
- 总决赛直播|国内首个星际2「AI Agent大模型电竞赛」总决赛周六晚上8点直播!
- 重磅!微软开源最强小模型Phi-4,超GPT-4o、可商用
- 清华团队靠强化学习让 7B 模型打败GPT-4o数学推理
- Anthropic洽谈新一轮融资,估值600亿美元
- 《AI 大咖说》栏目诚邀 AI 大咖入驻,共创智能新声!
- AI技术进阶课来啦!技术深度挖掘与实践操作并行,Azure AI 人工智能工程师训练营正式开启!
- 机器人ChatGPT时刻!英伟达开源世界大模型,完美模拟物理世界!
- 极客说|微软 Phi 系列小模型和多模态小模型
- 英伟达发布Project DIGITS,轻松运行2000亿参数模型
- Sam Altman:OpenAI确定发布AI Agents,彻底改变企业效率
- Meta开源多模式模型,轻松混合文本和语音
- 大的要来了?Sam Altman:OpenAI离“奇点”很近
- 微软发布2025年AI预测:AI Agents将彻底改变工作方式
- 打造企业“数智大脑”,达观数据AI Agent 的创新与实践
- AI国潮 | 2024年《AI国潮跨年说》
- SD3.5官方教程:5大重要框架,教你用文本生成精准图片
- 突破算力限制!Meta开源“记忆层”,重塑Transformer架构大模型
- 2024 AIGC多模态技术与应用发展峰会成功举办
- 美国亚利桑那州批准AI 教学,新型特许学校
- 有奖互动|加入微软开发者社区元旦特别活动,开启探索之旅!
- 创新突破!字节跳动首创无需数据,1.58位超低量化自监督生成
- 谷歌报告:罗马尼亚公共部门69%工作岗位,会被生成式AI补充
- 英伟达发布通用机器人模型RVT-2,训练效率提升6倍
- 官宣!OpenAI将成为盈利性公司,全力冲击AGI
- 极客说|微软新模型:Phi-4 来了
- 上海 Shanghai|Code Without Barriers:AI&DATA 深入探索人工智能与数据如何变革行业
- 突发!ChatGPT、Sora、API发生重大错误,宕机数小时
- 今日开幕 | 2024第五届ISIG产业智能大会来啦!四大科技峰会议程速览——
- 嘉宾议程确定,AIGC多模态技术与应用峰会,12月27日上海举办~
- 嘉宾议程确定,AI大模型技术与应用发展峰会,12月27日上海举办~
- Sam Altman发布2025年技术愿景,你想OpenAI怎么做?
- 日本文部科学省发布全新,生成式AI学习草案,有利于教育
- 躬身入局具身智能丨虚拟动点用空间计算补齐机器人能力拼图
- 亚马逊云科技将出席“ISIG-AIGC多模态技术与应用峰会”
- 卓特视觉联合创始人&VP宋博,将出席“ISIG-AI大模型技术与应用发展峰会”
- 突发!OpenAI正研发实体机器人,终结者时代还是来了
- 微软、IDC联合发布:企业级生成式AI,5大应用趋势
- Cake获1300万美元,主打生成式AI安全平台
- 普通人如何应对未来 AI 挑战?两场精彩的《AI大咖说》直播为你揭晓答案!
- MiniMax B端商业化负责人武僧,将出席“ISIG-AI大模型技术与应用发展峰会”
- GitHub Copilot Fridays|GitHub Copilot 全新课程上线,助力开发者解锁 AI 编程超能力
- 官宣!xAI获60亿美元,超过OpenAI成全球融资最多
- o3模型智商157,比肩爱因斯坦!AI只用7个月,超过人类100年
- ChatGPT搜索带火Perplexity,获5亿美元、估值90亿美元
- 多模态解锁无限可能!AIGC多模态技术与应用峰会火热报名中~
- GitHub 全球开发者突破1.5亿!适用于 VS Code 的 GitHub Copilot 全新免费版本正式推出
- 所有用户无限用Sora,OpenAI放圣诞福利!
- 极限压缩380倍!比OpenAI的Whisper更高效,开源模型超2000颗星
- 突破性功能!OpenAI发布ChatGPT Projects,万能工具箱上线!
- AI核心技术,颠覆传统数据整合模式!全球数据管理领导者Denodo技术干货分享来啦~
- 微软 Azure AI 荣耀登榜,2024最受开发者欢迎的 AI 应用开发平台!
- 极客说|深度对比:SFT、ReFT、RHLF、RLAIF、DPO、PPO
- AI现身2024国际象棋世界冠军赛!世界棋王丁立人守擂,看AI如何让国际象棋更有趣
- 重磅!ChatGPT解锁高级视频对话、屏幕共享,实时交互时代
- ISIG年度盛会来袭!RPA/低代码/AI大模型/AIGC多模态四大科技峰会共掀数字化创新浪潮
- AI Agent成主打!谷歌发布超强多模态大模型—Gemini 2.0
- 极客说|多智能体时代
- 王者降临!苹果全家桶接入ChatGPT,重塑iPhone、iPad 、Siri
- 多模态解锁无限可能!AIGC多模态技术与应用峰会报名开启~
- 极客说|多智能体时代
- 人人可用,AI Copilot 场景学习资料大放送!
- 史上最贵!首个AI Agent程序员商业化,比ChatGPT Pro贵2倍
- 突发!OpenAI发布Canvas,ChatGPT新增史诗级功能
- AI应用 | 可口可乐AI广告惹争议
- 微软开发者社区与She Rewires她原力合作,打破科技领域女性天花板!
- 比特币要完了!5分钟算力超100亿亿年,谷歌Willow强的逆天!
- OpenAI放王炸,Sora无限使用!3大新功能,2024最大惊喜!
- 想提升数据整合效率?Denodo AI核心技术与应用,带你迈进AI驱动新时代
- 活动通知丨2024全球智博会——开启企业全智能化应用场景:Semantic Kernel 开发者日中国站即将召开
- 惊喜!OpenAI第3天产品会很炸裂,Sam Altman非常兴奋
- 马斯克的xAI获60亿美元,估值500亿美元
- 亚马逊联手Anthropic,打造AI超级计算机
- OpenAI发布强化微调API,能深度定制超复杂大模型了
- Meta重磅开源Llama 3.3-70B:性能大涨成本降10倍
- 重磅!OpenAI发布满血o1、无限使用,最强大模型来了
- 谷歌云:媒体、娱乐行业,正大量投资生成式AI
- 亚马逊发布多模态模型Nova
- OpenAI放王炸!Sora、满血o1,连续12天发布最新技术!
- 从高低维度出发,重新理解AI
- Nebius获7亿美元融资,主打AI基础设施
- 开个AI局,探索大模型的无限可能!AI大模型技术与应用发展峰会报名开启~
- 腾讯版Sora开源!最强开源视频模型,130亿参数、物理模拟、电影级画质!
- 哈佛等最新报告:ChatGPT等AI普及率,比互联网、PC更快
- 马斯克起诉OpenAI:要求开源产品,36页诉状大公开!
- 微软、上海交通等发布首届数据污染报告,开闭源模型皆被污染
- “新动能 新传播 新业态”第四届新视听融合创新创意大赛征集启事
- 极客说|AIGC?安全的才是最好的
- 汇聚千位全国顶级AI创作者!2024视听AI创作大赛在北京经开区成功举办
- 清华、面壁提出创新AI Agent交互:能主动思考、预测需求
- 极客说|AIGC?安全的才是最好的
- 多模态解锁无限可能!AIGC多模态技术与应用峰会报名开启~
- 不可错过的AI视听盛宴!2024视听AI创作大赛线下总决赛邀你参与!
- 北大李戈团队提出新代码模型对齐方法 CodeDPO:显著提升代码准确性与执行效率
- 工作坊报名|使用 TEN Framework 与 Azure,探索你的多模态交互新场景
- 集合!第三届生成式AI应用创新挑战赛来了
- 谷歌发布双思维AI Agent:像人类一样思考,重大技术突破!
- Ai2开源OLMo 2:数据集、训练方法、权重大放送
- 2024视听AI创作大赛晋级总决赛名单出炉
- 2024视听AI创作大赛晋级总决赛名单出炉——
- 阿里重磅开源QwQ-32B:自我思考、纠正,数学能力击败o1模型
- 孙正义放大招!又给OpenAI投资15亿美元,非常看好AI发展
- 打造首个AI Agent操作系统,Dev Agents获5600万美元融资,OpenAI联合创始人参投
- Anthropic发布新功能,能训练Claude写作风格了
- 炸裂!OpenAI的Sora惨遭泄露,有人用上了!
- Runway发布超逼真文生图模型—Frames
- GenAI 转型的下一篇章 - AI Agent |Post Microsoft Ignite 2024
- 首次将AI翻译带入影院,IMAX引领影院变革
- 炸裂!OpenAI的Sora惨遭泄露,有人用上了!
- Runway发布超逼真文生图模型—Frames
- GenAI 转型的下一篇章 - AI Agent |Post Microsoft Ignite 2024
- 首次将AI翻译带入影院,IMAX引领影院变革
- 成本降低1000倍!微软将开源超强RAG— LazyGraphRAG
- 凯捷研究院:企业对生成式AI的应用,增长了4倍
- 三星发布多模态模型——Gauss2
- AI Agent再迎一巨头!谷歌重磅发力AI Agent ,商用大爆发!
- AI大模型时代,我们还要学习编程吗?
- Anthropic获40亿美元融资,生成式AI持续火热
- 官方出品,OpenAI手把手教你写,ChatGPT提示词
- 2024年AI赋能教育创新—Top10榜单公布
- 刚刚,OpenAI公开o1模型测试方法,人机协作时代!
- 开个AI局,探索大模型的无限可能!AI大模型技术与应用发展峰会报名开启~
- AMD裁员1000人,PC销售业绩不理想
- 开个AI局,探索大模型的无限可能!AI大模型技术与应用发展峰会报名开启~
- 国产模型炸裂登场,国外赞不绝口!OpenAI-o1级性能,免费使用
- 阿里发布Qwen2.5-Turbo,支持100万Tokens上下文!
- 微软在东京开设首个AI研究实验室
- 不可错过的AI视听盛宴!2024视听AI创作大赛线下总决赛邀你参与!
- 深入大模型应用开发、聚焦元宇宙搭建,AI 大咖说两场直播分享即将开启!
- AI Agent大爆发!微软刚刚发布大量商用AI Agent,全民智能体!
- HFT内部研究 :大语言模型在选股因子挖掘中的深度应用
- 最高奖金5000元!2024视听AI创作大赛正式启动报名
- 国内首个面向AI开发者和大众玩家的星际2「AI大模型电竞赛」,火热报名内测中!
- 国内首个面向AI开发者和大众玩家的星际2「AI大模型电竞赛」,火热报名内测中!
- 超GPT-4o,1240亿参数!最强开源多模态模型 Pixtral Large!
- 5岁小孩哥和ChatGPT深聊45分钟,AI成带娃利器!
- 招募20名志愿者+50体验者丨12.01北京视听AI大赛,现场体验AI绘画&AI视频
- 致命错误!Sam Altman发一张对比图,遭到大量吐槽
- AI乐观派|那些技术乌托邦、超人类和加速主义者们
- 北京这场专家云集AIGC国际会议与大模型应用峰会,即将启幕
- 微软开源多功能视觉模型Florence-2,分割、识别一切图片!
- 深入探索AIGC行业级解决方案,11月24日上海【AI绘未来】沙龙展来啦!
- 刚刚,OpenAI发布Windows版ChatGPT,高级语音能用了
- 2024年卓越影响力榜单 | 第五届中国产业创新奖评选征集
- AI数字人平台11x,获5000万美元B轮融资
- 发力AI Agent!OpenAI将推出“Operator” ,2025年1月上市
- OpenAI为加大与中国竞争,公布最新AI发展计划
- 阿里国际推出全球首个B2B AI搜索引擎Accio
- Writer获2亿美元、估值19亿美元,主打企业级生成式AI
- 王者归来!Greg重返OpenAI,主抓重大技术创新
- 阿里开源Qwen2.5-Coder,最强开源代码模型来了
- 《华盛顿邮报》发布生成式AI聊天机器人,用于查询新闻
- 王炸开源!谷歌开源诺奖化学模型Alphafold-3,一夜改变世界!
- 英国20%医生正使用ChatGPT,获取医疗诊断、医疗建议等
- AI辅助披头士乐队,拿到格莱美提名
- OpenAI CEO万字专访:2025年实现AGI,是我一生最兴奋事!
- 2024第三季度AI领域获得190亿美元,OpenAI最多
- 深入探索AIGC行业级解决方案,11月24日上海【AI绘未来】沙龙展来啦!
- 深入探索AIGC行业级解决方案,11月24日上海【AI绘未来】沙龙展来啦!
- 微软开源5级通用AI Agent:浏览网页、查论文,无所不能!
- ChatGPT新域名曝光,史上最贵顶级域名之一!
- 指令层级,帮助AI大模型防御恶意攻击
- 环球音乐集团将推出音乐大模型
- OpenAI、微软等CEO祝贺特朗普获胜,美国科技界解除封印!
- 最高奖金5000元!2024视听AI创作大赛正式启动报名
- OpenAI挖来VR界大神Caitlin,领导研发实体AI硬件
- 腾讯放大招,超Meta!史上参数最大,开源专家混合模型
- 英伟达发布视觉AI Agent,能用AI总结真实世界了
- 亚马逊发布X-Ray Recaps:AI追剧,不错过精彩瞬间
- Sam Altman:5年后AGI会实现,但社会变化却很小
- 全球首个270万菜品组合AI餐厅,用类ChatGPT辅助服务员
- 字节跳动、中科院开源多模态数据集—WebMath-40B
- Runway新增6个精准相机控制功能
- 神秘东方召集令 | 穿越智能迷雾,一起唤醒机器人神秘力量
- Sam Altman泄露新模型o2,太会整活了,营销鬼才!
- 苹果发布高效双EMA梯度优化方法,适配Transformer、Mamba模型
- Wonder Animation:用于制作动画电影CG的AI工具
- 微软开源视觉GUI智能体:增强GPT-4V能力,超3800颗星
- COSCon’24-LLM应用方向的开源 AI 论坛将于11月3日举办!
- 突发!OpenAI正式发布ChatGPT网络搜索,彻底颠覆谷歌!
- AI Agent平台Interface获3000万美元融资,聚焦金融领域
- 马斯克的xAI又洽谈新融资,估值超400亿美元
- 刚刚,OpenAI开源SimpleQA!轻松检测、校准大模型能力
- 无需任何代码,人人都能编程,GitHub发布Spark
- 【点击报名】2024 AI创新者大会暨PEC·提示工程峰会即将来袭!
- GitHub Universe 2024 大会启幕
- 刚刚,ChatGPT新增重磅功能!能打造自己的聊天数据库了
- 程序员节欢乐继续|社区伙伴丝滑到访直播间
- 谷歌、微软迎来强敌,Meta正开发生成式AI搜素引擎
量子位
- 数学家们仍在追赶天才拉马努金
- 不到2年,AI PPT赛道第一!像素绽放CEO赵充:今年是AI应用创业最佳时期 | 中国AIGC产业峰会
- 1亿图文对!格灵深瞳开源RealSyn数据集,CLIP多任务性能刷新SOTA
- 7x24小时非人类科学家入场:当AI开始自主探索科学未知领域 | 多伦多大学
- o3猜照片位置深度思考6分48秒全程高能,范围精确到“这么近那么美”
- 1450亿!马斯克xAI与X合并后再寻资金,将成史上第二大初创企业单轮融资
- 树莓派上流畅运行大模型!让终端具备自主学习与记忆能力|对话RockAI CEO刘凡平
- 拜拜邀请码!首个现货超级智能体实测
- 网易有道张艺:AI教育的规模化落地,以C端应用反推大模型发展 | 中国AIGC产业峰会
- GitHub版DeepResearch来了!覆盖所有代码库,模型架构可视化,背后贡献者也能扒 |免费
- 20万美元奖金池!WBCD’25双臂机器人挑战赛全球启幕,还有数十万美金硬件支持
- 首份空间智能研究报告来了!一文全面获得空间智能认知、要素、玩家图谱
- 宝马秀起汽车科技来,哪有其他汽车什么事…
- 亚马逊云计算Troy Cui:敦煌网飙升AppStore第二,企业如何应对激增流量是关键 | 中国AIGC产业峰会
- 从底层重构强化学习训练框架,阿里高德开源新方法:抛弃替代损失函数,仅需优化原始目标
- 开源垂直领域高质量数据合成框架!专业QA自动生成,无需人工标注,来自上海AI Lab
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 一手实测!文心X1/4.5 Turbo推理和多模态双双变强,还把模型成本降了6成?!
- 实测免费DeepResearch!轻量版深夜上线,基于o4-mini,速度更快/重视脉络梳理
- 首个大模型全链路安全综述 !南洋理工新国立等发布LLM Safety全景图:从数据、训练到部署的全面梳理
- 李飞飞/DeepSeek前员工领衔,复现R1强化学习框架,训练Agent在行动中深度思考
- 即插即用!清华国科大等推出视觉微调框架,仅需调整5%骨干网络参数 | CVPR2025
- 智能车速度刷新:仅10个月,首个纯端侧大模型上车量产!
- 天气预报精准到每条街!这家新型机构携手高校用AI驱动科研范式变革
- 质量无损,算力砍半!达摩院开源视觉生成新架构,出道即SOTA|ICLR 2025
- UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- MSRA首席研究员刘炜清:为每位研究员提供AI科研助理,自动化高门槛、重复性工作|中国AIGC产业峰会
- 北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断
- 无需数据标注!测试时强化学习,模型数学能力暴增 | 清华&上海AI Lab
- 电视装了智能体,只凭台词就能找到剧集了
- 百度阮瑜:大模型应用落地正从简单高容错向复杂低容错场景延伸|中国AIGC产业峰会
- 华人横扫ICLR 2025杰出论文奖,三篇均为华人一作,中科大何向南团队/清华姚班北大校友在列
- 两本科生自学3个月复刻谷歌爆款产品,开源AI语音新标杆一天揽获5000星标
- 狸谱App负责人一休:从“叫爸爸”小游戏到百万月活AI爆款,社交传播有这些底层逻辑丨中国AIGC产业峰会
- 告别“AI失忆症”!新型SD-LoRA算法实现终身学习|ICLR 2025
- 挤爆字节服务器的Agent到底啥水平?一手实测来了
- 轻松健康集团高玉石:AI产品和用户走得够近才能挖到新需求丨中国AIGC产业峰会
- 可媲美GPT-4o的开源图像生成框架来了!腾讯联手InstantX解决角色一致性难题
- 扩散模型还原被遮挡物体,几张稀疏照片也能”脑补”完整重建交互式3D场景|CVPR’25
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 中杯o3成OpenAI“性价比之王”?ARC-AGI测试结果出炉:得分翻倍、成本仅1/20
- GPT-4o能拼好乐高吗?首个多步空间推理评测基准来了:闭源模型领跑,但仍远不及人类
- “史上最快闪存技术”登Nature!复旦新成果突破闪存速度理论极限,每秒执行操作2500000000次
- 心影随形创始人刘斌新:做不跟用户抢时间的AI产品丨中国AIGC产业峰会
- 清华&英伟达揭露ICML最佳论文隐藏数值问题,简单掩码模型是等价更好选择 | ICLR25
- 21岁学生开发AI作弊工具被哥大停学,转身拿下530万美元融资,网友:《黑镜》成真
- 本周三15:00!🤓机器人与数字化转型应用解析,线上研讨会诚邀你来围观
- 《2025中国AIGC应用全景图谱报告》发布:首轮产品格局已经落定,新一轮变革蓄势待发
- 马斯克炫酷变身毒液!实测通义Wan2.1首尾帧视频模型,还能“拼接”经典梗图
- 纯自回归图像生成模型开源来了,复旦联手字节seed共同捍卫自回归
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 3分钟搭建一个调用支付宝的智能体,MCP爆发,蚂蚁推了一把
- 飞猪AI意外出圈!邀请码被黄牛倒卖,分分钟搞定机酒预订,堪比专业定制团队
- 深圳又出了个智能机器人:DeepSeek加持,全球首款全域全身VLA
- 突破AI视觉“选择性失明”,哈工大首次实现指令驱动的全景式感知
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 谷歌大模型“性价比之王”来了!混合推理模型,思考深度可自由控制,竞技场排名仅次于自家Pro
- 实测o3/o4-mini:3分钟解决欧拉问题,OpenAI最强模型名副其实!
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 粉笔CTO:大模型打破教育「不可能三角」,因材施教真正成为可能|中国AIGC产业峰会
- 趣丸科技贾朔:AI音乐迎来应用元年,五年内将重构产业格局|中国AIGC产业峰会
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此
- 生数科技副总裁:多模态技术定将催生全新内容平台,实现完全个性化、实时可控、可交互|中国AIGC产业峰会
- UC伯克利:让推理模型少思考,准确率反而更高了!
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 最强视觉生成模型获马斯克连夜关注,吉卜力风格转绘不再需要GPT了
- OpenAI姚顺雨:大模型下半场是产品的游戏,做研究也要有产品思维
- 最强o1也刚刚及格!中科大等团队测试视频CoT推理能力:多数模型不及格
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- ChatGPT首次带图深度思考:OpenAI连发o3/o4 mini,比前代性能更强价格更低
- 围绕多智能体黑箱非凸优化共识难题,华南理工大学团队发表系列研究
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- MiniMax押注线性注意力,让百万级长文本只用1/2700算力|对话MiniMax-01架构负责人钟怡然
- 招聘|量子位智库AI分析师
- AIGC最强参考!2025值得关注AIGC企业&产品榜单揭晓
- 装满智能体AI的手机,正在呼唤一个“Type-C时刻”
- 多模态生成框架新SOTA:文本+空间+图像随意组合,20W+数据开源,复旦腾讯优图出品
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 倒计时1天 ‼️ 万物皆可AI,but怎么用好?速戳报名中国AIGC产业峰会
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 字节视频基础大模型发布!单GPU就可生成1080P,蒋路领衔Seed视频团队曝光
- 超越ControlNet!复旦联合腾讯优图提出AI生图新框架,解决多条件生成难题
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 北京队再上大分:新AI一句话就能搞开发,代码实时可见 | 免费可用
- 英伟达含量为零!华为密集模型性能比肩DeepSeek-R1,纯昇腾集群训练
- AI能看懂图像却算不好距离,上交时间-空间智能基准难倒9大顶尖多模态模型
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 刚刚,智谱一口气开源6款模型,200 tokens/秒解锁商用速度之最 | 免费
- 视觉自回归生成理解编辑大一统!北大团队多模态新突破,训练数据代码全面开源
- 招聘|量子位智库AI分析师
- GPT-4.1淘汰了4.5!全系列百万上下文,主打一个性价比
- 海豚语言被谷歌大模型破译!跨物种交流大门打开,哈萨比斯:下一个是狗
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 榨干3000元显卡,跑通千亿级大模型的秘方来了
- 图灵奖得主LeCun:人类智能不是通用智能,下一代AI可能基于非生成式
- 单图直出CAD工程文件!CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点|魔芯科技NTU等出品
- 倒计时2天!20余位行业大佬共话AI,中国AIGC产业峰会最全攻略在此
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- ICLR高分论文险遭拒,只因未引用「造假」研究???作者怒喷:对方论文用Claude生成
- 中国初创芯片登Nature:比英伟达A10快500倍!自研光电混合技术
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 最强32B中文推理大模型易主:开源免费商用,1/20 DeepSeek-R1参数量SOTA,权重代码数据集全开源
- GPT-4.1偷偷开跑?神秘模型上线三天已被玩疯,网友发现大量OpenAI痕迹
- 人类一生所学不过4GB,加州理工顶刊新研究引热议
- 倒计时3天!20余位行业大佬共话AI,中国AIGC产业峰会最全攻略在此
- 手机实现GPT级智能,比MoE更极致的稀疏技术:省内存效果不减|对话面壁&清华肖朝军
- Llama 4重测竞技场排名大跳水,网友:社区很难再信任Meta了
- 4090玩转大场景几何重建,RGB渲染和几何精度达SOTA|上海AI Lab&西工大新研究
- 下周三!20余位行业大佬共话AI,中国AIGC产业峰会最全攻略在此
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 又一上海人形机器人加入开源!全套图纸+代码,来自傅利叶
- SOTA自动绑骨开源框架来了!3D版DeepSeek开源月大礼包持续开箱ing
- OpenAI前CTO爆炸开局:种子轮开盘20亿美元!0产品0用户估值直奔100亿,GPT论文一作也加入了
- 全球首个Linux开发本:50TOPS算力,DeepSeek都配好了,可随地大小开发
- 让机器人更像人类有了新方法!港科大新算法对齐人机动作形态,无需重复训练,轻量模块通用且适配
- 移动端AI安全再突破!水印保护新范式:403个AI App成功保护率超8成
- 下周三!20余位行业大佬共话AI,中国AIGC产业峰会最全攻略在此
- 字节新推理模型逆袭DeepSeek,200B参数战胜671B,豆包史诗级加强?
- 宇树机器人上演好莱坞《铁甲钢拳》!网友激动表示:比CG还CG
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- ChatGPT有了完整记忆!像朋友一样记住所有聊天记录,回复更加私人订制
- 7B小模型写好学术论文,新框架告别AI引用幻觉,实测100%学生认可引用质量
- 刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理
- 流体力学专用版DeepSeek,单GPU可跑,成本节约高达100倍
- 下周三!20余位行业大佬共话AI,中国AIGC产业峰会最全攻略在此
- AI优化芯片布局,设计阶段即考虑最终性能,中科大华为诺亚新方法入选ICLR 2025 Oral
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 字节开源新生图模型:一个模型统一所有生图任务,多主体融合效果SOTA
- Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B
- 谷歌最新AI芯片打平英伟达B200,专为推理模型打造,最高配每秒42500000000000000000次浮点运算
- “谷歌版MCP”来了!开源A2A,不同厂商Agent也能协作
- 招生 | 南大FinTech大模型实验室招募斯坦福国际联培博士生(2026)
- 倒计时1周!20余位行业大佬共话AI,中国AIGC产业峰会最全攻略在此
- 用梯度下降求解整数规划,中科大等提出无监督训练整数规划求解器新范式 | ICLR 2025 Spotlight
- 大模型一体机塞进这款游戏卡,价格砍掉一个数量级
- 阿里云造“Agent工厂”,百炼MCP服务上线,无需代码5分钟人人都可搭建Agent
- 芯片设计效率提升2.5倍,中科大华为诺亚联合,用GNN+蒙特卡洛树搜索优化电路设计 | ICLR2025
- 剪枝60%不损性能!上海AI Lab提出高斯剪枝新方法,入选CVPR 2025
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 李飞飞团队提出世界模型基准:“世界生成”能力迎来统一评测,3D/4D/视频模型同台PK
- 首个统一多模态模型评测标准,DeepSeek Janus理解能力领跑开源,但和闭源还有差距
- “是我创造了第一个LLM”!Kaggle前首席科学家一句话引发AI学术圈考古行动
- 李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了
- Llama 4遭竞技场背刺!实锤用特供版刷榜,2000+对战记录公开
- Git诞生20周年!大佬Linus十天写出的项目,彻底变革全球软件开发
- 速戳报名 ‼️ MSRA华为百度齐聚,AIGC峰会等你来AI
- AI危险检测再进化!三层级解析长视频异常,各种时序粒度均有明显优势 | CVPR HighLight
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- “充电厂商”为何跨界AI眼镜?对话闪极创始人张波
- 清华耶鲁推理模型新范式:动态推理实现高效测试时扩展,大大节省Token消耗
- 奥特曼最新访谈认可“套壳”:多数改变世界的公司,最初都是这样的
- 首个个性化对齐大模型问世!可精准识别用户内在动机和偏好,还有百万用户画像开源数据集 | 蚂蚁&人大
- 米哈游蔡浩宇新作iPhone实机演示:10分钟就被AI小美撩到脸红,她的命运由我拯救
- Llama 4发布36小时差评如潮!匿名员工爆料拒绝署名技术报告
- 中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%
- 速戳报名 ‼️ 最新AIGC峰会嘉宾在此,4月16日,来和大佬们一起AI
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯
- 超九成年轻人工作学习离不开AI,人均还有1.8个AI朋友丨Soul《2025 Z世代AI使用报告》
- 中科大华为发布生成式推荐大模型,昇腾NPU可部署,背后认知一同公开
- 速戳报名 ‼️ 最新AIGC峰会嘉宾在此,4月16日,来和大佬们一起AI
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- DeepSeek前脚发新论文,奥特曼立马跟上:GPT-5就在几个月后啊
- 整整157页,比尔盖茨亲自公开微软起家的源代码:Altair Basic
- 速戳报名 ‼️ 最新AIGC峰会嘉宾在此,4月16日,来和大佬们一起AI
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 中文海报设计,赛道一夜颠覆
- GPT-4.5创造力比GPT-4o弱!浙大上海AI Lab发布新基准,寻找多模态创造力天花板
- 移动通信领域有了新SOTA:华为出品,精准预测用户行为
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- “AI眼镜的终极功能,是AI+社交” | 对话影目科技创始人
- 招聘|量子位智库AI分析师
- 马斯克擎天柱机器人大秀走姿,背后大佬集体现身喊话招人
- 智能体丝滑玩手机,决策延迟0.7秒!MSRA等提出验证器架构,不直接依赖大模型生成最终操作
- 2个百度T11推出超级智能体火爆硅谷!免费使用无需邀请码,靠AI搜索功底估值已破38亿
- 速戳报名!第二批AIGC峰会嘉宾已就位,快来和大佬们一起AI 🤩
- OpenAI官方基准测试:承认Claude遥遥领先(狗头)
- 视觉Token无缝对齐LLMs词表!V²Flow:基于LLMs实现高保真自回归图像生成
- 10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 第二批AIGC峰会嘉宾已就位!速戳报名,和大佬们一起来AI 🤩
- 招聘|量子位智库AI分析师
- 语音界Deepseek!百度最新跨模态端到端语音交互,成本最高降90%
- 大模型RL不止数学代码!7B奖励模型搞定医学法律经济全学科, 不用思维链也能做题
- CVPR 2025:单图秒变专业影棚,几何/材质/光影全搞定,数据训练代码全开源
- 双人动作生成新SOTA!浙大提出TIMotion框架 | CVPR 2025
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 稚晖君刚挖来的90后机器人大牛:逆袭履历堪比爽文男主
- AI理解27分钟长视频超越GPT-4o,港理工新国立开源新框架:角色化推理+链式LoRA
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 200亿机器人独角兽被曝爆雷,官方回应来了
- 国产服务器迎来深圳芯!纯血RISC-V跑满血DeepSeek-R1,一芯双核干爆x86
- AI创业来了大大大大大玩家:PC是起点,目标混合式AI
- 火热报名中 ‼️ 4月16日,就在北京,中国AIGC产业峰会等你来
- 从DeepSeek崛起到下一个亿级销量市场,这份硬核报告说明白了
- 两位华人76页论文解决量子领域核心问题:首次证明伪随机性真实存在
- 免费的「网页版Cursor」!新版DeepSeek-V3加持,秒秒钟编出一个游戏/APP
- 让机器人在人群中穿梭自如,港科广&港科大突破社交导航盲区 | ICRA 2025
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 超低成本复现QwQ!数学推理模型训练迎来RL暴击,数据代码模型全开源 | 蚂蚁&清华出品
- Gen-4掀翻AI视频牌桌!一条龙制作故事短片,只需提示词和参考图
- OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的”
- 火热报名中 ‼️ 4月16日,就在北京,中国AIGC产业峰会等你来
- 摸DeepSeek过河也得自身硬! 想开后的文小言,真香!
- 奥赛级AI基准来了:难倒所有模型,GPT-4o仅考34分,上海交大出品
- 国产AI起号两周就开始自己赚钱了,全球首个“边想边干”的Agent | 免费无限次
- 5.28亿融资砸向杭州具身智能公司,清华叉院机器人天才坐镇,被称为“中国版Figure”
- 中科大提出动作价值表征学习新方法,率先填补长期决策信息的缺失
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 火热报名中 ‼️ 4月16日,就在北京,中国AIGC产业峰会等你来
- GPT-4o骗了所有人,逐行画图只是前端特效?!底层架构细节成迷,奥特曼呼吁大家别玩了
- 推荐场景Scaling Law来了!中科大&华为诺亚方舟联合推出
- 火热报名中 ‼️ 4月16日,就在北京,中国AIGC产业峰会等你来
- 嚯!OpenAI最新内幕八卦.pdf
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- AIGC第一股年报详解:AIGC业务暴涨88.5%营收2.2亿,95%智能硬件交付出海,跑通规模化「软件订阅+出海」
- 业界突破多模态泛化推理能力,OPPO研究院&港科广提出OThink-MR1技术
- 13.8倍吞吐提升!浙大上海AI Lab等提出视觉生成新范式,从“下一个token”到“下一个邻域”
- 火热报名中 ‼️ 4月16日,就在北京,中国AIGC产业峰会等你来
- 迈向群体智能 | 智源发布首个跨本体具身大小脑协作框架与开源具身大脑
- “计算机视觉被GPT-4o终结了”(狗头)
- 自动驾驶首次应用测试时计算!港大英伟达等新技术让AI边开边学,无人车遇变道自如应对
- 火热报名中 ‼️ 4月16日,就在北京,中国AIGC产业峰会等你来
- 马斯克xAI蛇吞𝕏:资本有了,数据有了,商业模式也有了
- 17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 3D版DeepSeek卷起开源月:两大基础模型率先SOTA!又是VAST
- AI Agent来,传统BI危
- 单张照片生成360°3D场景,支持灵活视角漫游|人大&北师大&字节
- 港大开源博士级AI智能体,独立完成三篇算法研究,一站式科研6小时搞定
- 专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- Claude团队开盒Transformer:AI大脑原来这样工作
- GPT-4o掀起“吉卜力风”,连CEO奥特曼也换了头像!版权争议虽迟但到
- AI大模型看手相!图片视频加持深度思考,阿里QVQ-Max“神了神了”
- 让宇树机器狗在北大未名湖畔捡垃圾,银河通用干的
- Manus欲以37亿估值硅谷寻融资!发布仅三周,线下用户聚会场场满员
- 招聘|量子位智库AI分析师
- 7B模型搞定AI视频通话,阿里最新开源炸场,看听说写全模态打通,开发者企业免费商用
- 英伟达要买下贾扬清公司LeptonAI!老黄花数亿美元加码算力租赁
- 长视频理解新突破!Mamba混合架构让显存消耗腰斩,处理10万视频token不费力
- Agent太火!看这一篇综述,知识就不会学杂了丨华东师大&东华大学出品
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 蚂蚁国产GPU训练大模型细节曝光!Ling模型研发负责人回应:关于我们抠FLOPS的一些点滴
- 你的美图App,在CVPR技术5连秀
- 人形机器人主持发布会发布自己!追觅科技孵化,下月将参加全球首届人形机器人马拉松
- 招聘|量子位智库AI分析师
- 对话2025最火具身智能团队:2个自动驾驶第一人带队,1.2亿美元天使融资震动江湖
- 中国顶流无人驾驶提速出海:安全久经考验,外国big name实名好评
- 人形机器人优雅漫步,强化学习新成果!独角兽Figure创始人:之前大家吐槽太猛
- Yoshua Bengio参会!「大模型安全研讨会2025」开启,4月23日齐聚新加坡 | 报名开启
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 姚班天才范浩强创业公司曝光!旷视三剑客携2亿天使轮进军具身智能赛道
- 轨迹可控视频生成新范式,复旦微软破解视频生成难题,精准控制任意物体运动
- GPT-4o图像生成今起免费!奥特曼坐镇紧急发布,指令遵循/文本控制表现惊艳
- Stable Diffusion变身3D神器!一个LoRA将2D图像转3D模型
- DeepSeek逼出谷歌新推理模型:40分优势超GPT4.5登顶竞技场,支持原生多模态,但依然败给了“竹竿问题”
- 招聘|量子位智库AI分析师
- 新版DeepSeek-V3官方报告出炉:超越GPT-4.5,仅靠改进后训练
- 三位数学家改写经典牛顿法!300年前算法一夜更新,收敛速度更快函数范围更广
- 随手一拍,高效重建大型3D开放场景,港科广GraphGS突破传统重建技术瓶颈|ICLR 2024
- AMD跑DeepSeek性能超H200!128并发Token间延迟不超50ms,吞吐量达H200五倍
- 招聘|量子位智库AI分析师
- DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了
- 32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
- 一文看懂多模态思维链
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 用百度秒哒开发应用,会说比会写重要
- 大神卡帕西亲自演绎零基础开发APP,ChatGPT四轮对话搞定,一小时即在手机运行
- “AI辅导2小时,成绩冲进全国前2%”,OpenAI总裁转发私立教学成果,网友:一年学费4万美元??
- 不到24小时!今年最值得关注的AIGC企业/产品评选即将截止
- 苹果新表被曝加摄像头,让AI有空间感知能力,中国小天才笑而不语
- 最后1天!今年最值得关注的AIGC企业/产品正在评选中
- 蚂蚁华为阿里云罕见联手:AI医疗如何跨过落地鸿沟?
- 谷歌对齐大模型与人脑信号!语言理解生成机制高度一致,成果登Nature子刊
- 院士领衔万字长文,全面系统梳理多模态LLM对齐算法
- 实测首个烹饪大模型「食神」:DeepSeek进厨房,看脸生成养生食谱,普通人也能做大餐
- 宇树再上大分:机器人全球首次鲤鱼打挺
- 50条数据解锁空间智能,RL视觉语言模型3D空间推理框架MetaSpatial |西北大学
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 腾讯押注非Transformer!推理模型混合Mamba也能搞,深度思考也能秒回
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 对话周光:自动驾驶实现AGI,RoadAGI比L5更快 | GTC 2025
- 视频可以精准控制了!一句话给熊戴眼镜的那种,扩散模型立功,浙大悉尼科技大学出品 | ICLR 2025
- 清华&哈佛4D语言场建模新方法,动态场景精准识别|CVPR2025
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- GPT-5将免费向用户开放,DeepSeek逼的
- Nature发文「智能体摩尔定律」,Agent能力每7个月翻倍,5年后能顶人类苦干一个月的工作
- 招聘|量子位智库AI分析师
- DeepSeek上脸实测:AR眼镜实时翻译老黄GTC演讲,完了还帮我划重点
- 一张图,快速生成可拆分3D角色!腾讯清华新SOTA | CVPR 2025
- 最后1周!今年最值得关注的AIGC企业/产品正在评选中
- OpenAI加码写作赛道?阿里最新大模型通用写作能力基准WritingBench,揭秘深度思考能否增进文学表达
- AI视频是否符合物理规律,量化基准来了,实现人类感知对齐 | 阿里高德/中科院出品
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 7499拿下纯血鸿蒙+DeepSeek,华为“小宽折叠”手机:帮接电话,眼动翻页
- 单张照片实现三维重建,单视角室外复杂场景首次攻克| 西湖大学&港科大&Everlyn AI
- 招聘|量子位智库AI分析师
- 宇树机器人侧空翻惊呆网友:“我**想要一个!”
- OpenAI史上最贵模型来了!比DeepSeek贵270倍,100万输出token 600美元
- 最后1周!今年最值得关注的AIGC企业/产品正在评选中
- AI一周写出ICLR研讨会论文!成果简洁有效获审稿人大赞
- 真·MoE?路由LLM最全面探索:一种笔记本也能玩的大模型Scaling Up研究
- 招聘|量子位智库AI分析师
- 可灵接入DeepSeek-R1,一手实测在此:AI视频创作,不用学写提示词了
- 清华推出开源具身智能框架:用VLM解决机器人动作异构一致性难题,性能超越14倍参数对手
- 最后1周!今年最值得关注的AIGC企业/产品正在评选中
- 老黄发布新核弹B300,英伟达:B200已破DeepSeek-R1推理世界纪录
- 240元打造擅长数学的多模态版R1,基于DeepSeek核心思想,两阶段训练提升推理能力至工业级应用标准
- 仅凭RGB图像实现户外场景高精度定位与重建,来自港科广团队 | ICRA 25
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- DeepSeek让英伟达H20都被疯抢,但AI推理爆发不只靠囤卡
- 速抢席位!在中国AIGC产业峰会现场,一起深度求索AI怎么用 ⁉️ 首批嘉宾已曝光
- 马斯克进军AI视频,收购视频生成初创公司,4人13个月打造类Sora模型
- 你正在做的大模型评测,可能有一半都是无用功 | 上海AI Lab&上交&浙大出品
- 北大人形机器人智能体 Being-0:互联网视频+少量真机数据,迈向自主具身智能
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- o1/o3后训练负责人离职创业,奥特曼把OpenAI玩成另一个YC孵化器了
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 陶哲轩:o3-mini纠正了我一个数学错误,十分钟解决原本一小时才能完成的题目
- 8张GPU训出近SOTA模型,超低成本图像生成预训练方案开源
- 最后1周!今年最值得关注的AIGC企业/产品正在评选中
- AI大佬到底怎么用AI ⁉️中国AIGC产业峰会首批嘉宾曝光,吃瓜观众速来
- 最后1周!今年最值得关注的AIGC企业/产品正在评选中
- 李开复力推DeepSeek!零一万物发布模型一体机,搭载华为GPU,自家产品也全线替换了
- 新注意力让大模型上下文内存占用砍半!精度不减还能加速2倍
- 招聘|量子位智库AI分析师
- 一手实测文心X1/4.5:又强又全面!歪果网友疯求英文版
- 低调平头哥,吹响先进存力商业化号角
- 深圳机器人致敬星爷《功夫》,完美复刻斧头帮舞
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 迁移DeepSeek-R1同款算法,小米让7B模型登顶音频理解推断MMAU榜单
- CVPR’25跨模态因果对齐,让机器更懂视觉证据丨中大南洋理工等联合开源
- 最后1周!今年最值得关注的AIGC企业/产品正在评选中
- 夸克你要这么变,我可真得说说你了
- CVPR 2025:无需物理引擎,一个模型搞定图像渲染与分解
- 招生 | 人大信院AIM3实验室招收人工智能方向学生
- 倒计时2周!今年最值得关注的AIGC企业/产品正在评选中
- 百度版深度思考模型免费上线!API定价比DeepSeek R1再砍一半
- 招聘|量子位智库AI分析师
- 米哈游蔡浩宇AI游戏曝光:大模型驱动数字人实时互动,玩家自定义开放剧情,内测已开启!
- Manus带火的MCP,让Claude一句话自动化3D建模,网友:真·AI+应用
- Nature:你的大脑衰老速度受这64个基因影响
- 27个大模型混战电商领域,DeepSeek-R1&V3仍是最强丨首个中文电商问答基准评估结果
- 倒计时2周!今年最值得关注的AIGC企业/产品正在评选中
- 国产人形机器人破全球纪录!连续空翻一镜到底,量产3.99w起售
- 游戏也可以Copilot!微软CEO纳德拉亲自站台:玩家有福了
- 人大北邮等团队解视触觉感知统一难题,模型代码数据集全开源 | ICLR 2025
- 提出机器人自主学习新范式,深大团队最新顶会论文,刷新6大复杂任务SOTA
- CVPR 2025:长Prompt对齐问题也能评估了!当前最大AIGC评估数据集,模型评分超越当前SOTA
- 倒计时2周!今年最值得关注的AIGC企业/产品正在评选中
- 何恺明LeCun联手改造Transformer!9行代码替代归一化层,性能不减还加速
- AI能自主出“竞赛题”了!港大&蚂蚁让大模型学会生成难题,水平已接近AIME
- ChatGPT再进化:o1支持调用Python分析数据,网友:已经成为Copilot了
- 谷歌大招网友玩疯了!Gemini原生图像输出抢先推出,OpenAI一年领先优势归零
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 清华率先开源AI制药智能体平台!生物科研进入Autopilot时代
- 招聘|量子位智库AI分析师
- 11B模型拿下开源视频生成新SOTA!仅用224张GPU训练,训练成本省10倍
- DeepSeek玩家能提前拿苹果新品!只要15万元,在家跑满血版R1
- “谷歌版DeepSeek”接入机器人,思维链解锁折纸系鞋带技能,推理模型代入物理世界
- 自动调整推理链长度,SCoT来了!为激发推理能力研究还提出了一个新架构
- DeepSeek“防弹衣”来了,模型内生安全加固方案,拒绝杀敌一千自损八百|上海AI Lab
- 倒计时2周!今年最值得关注的AIGC企业/产品正在评选中
- 何恺明带队驯服AI更懂物理!去噪方法+哈密顿网络,清华校友一作
- 谷歌版“DeepSeek”发布!27B模型单个GPU即可运行,击败满血DeepSeek V3/o3-mini
- 14B 小模型逆袭翻译赛道,论文财报实测超Claude,不信试试“我命由我不由天”
- 多模态训练后模型能力雪崩,上海AI Lab全面探索MLLM偏好对齐与模态融合
- 招聘|量子位智库AI分析师
- 高阶智驾“破壁人”来了:13万标配激光雷达,还能「车位到车位」
- 新科研神器!这回读英文论文真跟读中文没两样了
- 李飞飞团队具身智能新作:500美元,一切家务机器人帮你干
- 砍掉99%采样成本!腾讯AI Lab提出大模型无监督训练新技术
- 90分钟生成10万Token,新框架实现3倍无损加速超长文本生成,支持DeepSeek-R1和QwQ!
- 倒计时2周!今年最值得关注的AIGC企业/产品正在评选中
- Manus逼OpenAI开源智能体框架,网友:已从行业领导者变为跟随者
- 谷歌投资Claude公司内幕曝光:占股14%,无投票权,无董事会席位,无董事会观察员权利
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- DeepSeek突袭腾讯发力,豆包Kimi断层领先优势不再|量子位智库月报
- 转用国产编程语言!MoonBit进入北大计算机学院研究生课程,LLVM后端编译器同步发布
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 35岁北大校友突破125年数学难题!网友:华人数学奇迹年
- 透明物体也能被机器人抓起来了,单目的那种 | ICRA 2025
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- “老黄骗人”!5070首批评测:说好1/3价格赛4090,实际不如4070Ti
- 一头大象难倒ChatGPT,Grok 3完美通关
- 空间具身通用操作模型!百万真实数据训练,预训练代码全开源 | 上海AI Lab/TeleAI/上科大等团队新作
- 2025,见证更多GenAI应用落实!今年的中国AIGC产业峰会来啦
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- OpenAI开价385万年薪扩增机器人团队!招募基础模型人才,北大校友是创始成员
- 显著超越SFT,o1/DeepSeek-R1背后秘诀也能用于多模态大模型了
- AI横扫MWC,中国厂商的「吸睛密码」亮了(doge)
- DeepSeek前实习生魔改MoE,用迭代机制把内存需求砍了42%,团队:“免费午餐”优化方法
- 实测字节免费AI编程,还让不让Cursor活了
- DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科
- GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭
- 差点被开除的哈佛学子,最后为创业选择主动休学 | 比尔盖茨自传《源代码》
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- Claude公司估值615亿美元再融35亿,那DeepSeek…
- 老显卡福音!美团开源首发INT8无损满血版DeepSeek R1
- 高通最新5G芯片,AI爆了
- AI三小时做的小游戏,9天赚12万!马斯克:AI游戏前景无限
- 标点符号成大模型训练神器!KV缓存狂减一半,可处理400万Tokens长序列,来自华为港大等 | 开源
- 阿里PC-Agent重构人机交互,精准拆解跨应用指令,自动化办公更进一步
- 性能无损,模型隐私保护效果提升50%!蚂蚁数科创新跨域微调框架| AAAI 2025 Oral
- 天翼云CPU实例部署DeepSeek-R1模型最佳实践
- CVPR满分论文:一块2080Ti搞定数据蒸馏,GPU占用仅2G,来自上交大“最年轻博导”课题组
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 杭州在六小龙之后,又开始投资北京六小虎了
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 真·用DeepSeek做生意!在沙漠造雪场,给详细BP那种丨阿里国际站首个产业级应用
- 实测腾讯元宝电脑版:搭载满血版DeepSeek,装上就是AI PC
- 360AI推出DiT架构下”省钱版”ControlNet, 参数量骤减85%性能达到SOTA!
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- DeepSeek突袭公布成本利润率:545%
- Claude 3.7成精了!偷偷将OpenAI模型换成自己,卡帕西:迄今最好笑的一趴
- 字节视频生成新突破!Phantom搞定多人物/主体一致性
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 一句话让DeepSeek思考停不下来,北大团队:这是针对AI的DDoS攻击
- 蒸馏任何深度,仅用少量无标签数据就能实现单目深度估计新SOTA
- 90后北大校友破解挂谷猜想,陶哲轩激动转发!网友:预定菲尔兹奖
- 如果GPT-4还只是阿米巴原虫,未来的霸王龙会是什么样?| 赫拉利《智人之上》
- 无需训练让扩散模型提速2倍,上交大提出Token级缓存方案|ICLR‘25
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 刚刚,GPT-4.5发布!OpenAI最大最贵模型,主打情商高,奥特曼带娃缺席发布会
- 火山引擎AI一体机DeepSeek版来了!开箱即用,小时级部署,还有大模型应用经验加持
- Claude 3.7登顶编程竞技场,大幅领先100分!最新布料模拟实测再惊艳网友
- 任意Prompt就能给大模型实时排名!竞技场新玩法,还能自动找最佳AI来作答
- 大模型训练或无需“纯净数据”!北大团队新研究:随机噪声影响有限,新方法让模型更抗噪
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 3500元,人形机器人1:1复刻人类动作 | 上海AI Lab开源新成果
- 机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天
- 语音合成也遵循Scaling Law,太乙真人“原声放送”讲解论文 | 港科大等开源
- DeepSeek今日连开3源!针对优化的并行策略,梁文锋本人参与开发
- 摆脱编码器依赖!Encoder-free 3D多模态大模型,性能超越13B现有SOTA | 上海AI Lab港中文等团队新作
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 英伟达创纪录财报回应DeepSeek:全年营收9500亿,Blackwell刚开卖就贡献800亿
- 曝GPT-4.5本周空降!1T激活参数,120T训练数据,会吐出阶段性思考成果然后继续思考
- “Transformer就像燃油车,attention-free才是新能源” | 对话RWKV创始人彭博
- 刚刚,DeepSeek又降价了
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 姚班天才创办的大模型公司,卖了
- 识别高分低能,综合性视觉语言理解新基准,五项挑战评估多模态模型的推理能力
- 何恺明开辟分形图像生成新范式!计算效率提高4000倍,首次实现高分辨率逐像素生成
- 阿里开源版Sora上线即屠榜,4070就能跑,免费商用
- 前端程序员请注意!首个截图就能生成现代前端代码的AI来了 | 已开源
- 多模态大模型对齐新范式,10个评估维度全面提升,快手&中科院&南大打破瓶颈
- 2025,见证更多GenAI应用落实!今年的中国AIGC产业峰会来啦
- DeepSeek开源第三弹:V3/R1训练推理关键秘籍,核心代码仅300行
- 宇树机器人大秀中国功夫,央视点赞!
- 花1699请DeepSeek当家教,值么?
- 实测Claude 3.7:3200行代码一口气输出,物理规律手拿把掐,弱智吧已失守
- AI说书媲美真人!豆包语音大模型升级长上下文理解
- AI蛋白质设计前沿教程,AAAI’25三大机构携手4小时全面剖析
- 只给一张图,AI找到对应合适BGM,央音清华等构建全球化音乐信息检索新范式
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- DeepSeek开源第二弹,为MoE和EP量身定制的通信库!暂和英伟达显卡绑定
- 阿里旗舰推理模型硬刚DeepSeek!官宣独立APP,发布公告AI亲自写
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 首个混合推理模型Claude 3.7发布!编程能力全面领先,还能精准控制思考时间
- 快检查你的5090!英伟达官方确认缺陷,部分显卡ROP短少,玩老头环受影响
- DeepSeek-R1秘籍轻松迁移,最低只需原始数据0.3% | 邱锡鹏团队联合出品
- 全球最快AI视频生成火了,5秒让老黄马斯克拥抱,Made in China
- DeepSeek一夜把百度干回20年前,网友:还有这好事?
- 如何让大模型感知知识图谱知识?蚂蚁联合实验室:利用多词元并行预测给它“上课”
- Zero-shot重建物理高斯资产,清华&光轮视觉大模型让机器人理解物理属性|ICRA 2025
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- “源神”DeepSeek!突破H800性能上限,FlashMLA重磅开源,算力成本还能降
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 月之暗面开源改进版Muon优化器,算力需求比AdamW锐减48%,DeepSeek也适用
- 还得是上海!百亿级大模型项目现场对接,只用3天
- 中科闻歌发布智川X-Agent平台、优雅音视频大模型更新,领先技术加速AI普惠落地
- 多模态大模型事实正确性评估:o1最强,模型普遍过于自信,最擅长现代建筑/工程技术/科学
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 左手天神右手乾崑,方程豹掀翻方盒子的「诺基亚时代」
- AI写代码新姿势:一个截图,代替千行代码
- 1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法
- DeepSeek、OpenAI、Kimi视觉推理到底哪家强?港中文MMLab推出推理基准MME-COT
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 实测医疗APP好伴AI:数字版三甲专家人人可用,AI医疗落地之路终于走通了?
- 阶跃Agent生态首曝光:手机汽车IoT机器人全覆盖,千行百业唰唰落地
- OpenAI实名举报Grok3作弊,一题答64次踩着台阶和o3-mini比
- 单张3090让大模型“看”《黑悟空》,港大百度发布VideoRAG
- 视觉定位新范式!清华团队推出Migician,支持任意形式多图定位
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 刚刚,DeepSeek能看懂猫片了!腾讯混元加持
- 芜湖!DeepSeek官宣下周连续开源5个项目
- 断交OpenAI后,人形机器人独角兽首秀:一个神经网络控制整个上身,能听懂人话可抓万物
- 剧本自动生成3D动画!北航中大等提出新方法,破解多人交互难题 | ICLR 2025
- 安卓装DeepSeek就敢卖8999!最薄折叠?那没事了
- 复旦视频扩散模型综述:覆盖300+文献,探讨近期研究趋势与突破,Github揽星2k+
- 谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现,CEO皮猜也来站台了
- 比尔盖茨自述:中学时期就开始偷偷996写代码
- Nature认证DeepSeek成科研工具全能者,国内高校如何借力大模型?
- 手掌大小芯片碾压全球算力!微软量子计算核弹级突破,纳德拉:构建全新物质状态
- 简单示例提升DeepSeek-R1美国数学邀请赛AIME分数:以步骤为粒度对齐上下文学习与推理
- 小红书等给AI图像检测上难度!数据集均通过人类感知“图灵测试” | ICLR 2025
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 今年“诺奖风向标”来了一位华南农大校友
- 中国高温超导新突破登Nature,薛其坤院士领衔,南方科大成果
- DeepSeek新注意力机制引热议!梁文锋亲自提交预印本,目标明确降低计算成本
- Kimi新论文再次“撞车”DeepSeek,都谈到了长文注意力机制
- DeepSeek满血微调秘籍开源!站在巨人肩膀打造私有模型,一手教程在此
- 宇树机器人跳舞被疑AI合成,王兴兴发新视频自证,小红书:还是疑似AI合成
- Llama都在用的RoPE有了视频版,复旦上海AI Lab等提出长视频理解/检索绝佳拍档
- 2025,见证更多GenAI应用落实!今年的中国AIGC产业峰会来啦
- 官宣!OpenAI前CTO新公司:北大校友翁荔加盟,创始29人2/3来自OpenAI
- ChatGPT后训练方法被OpenAI离职联创公开,PPT全网转~
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 百度搜索×DeepSeek!官宣接入仅24小时全量上线满血版,实测来了
- 马斯克“地表最强”Grok 3炸场,竞技场首超1400分
- 吴永辉是谁?字节AGI计划一号位,谷歌AI扫地僧
- 全球最大开源视频模型,现在也Created in China了,阶跃出品
- 嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
- OpenAI突宣开源计划:端侧模型or小模型二选一!奥特曼在线征集投票
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 211硕士学历的袁征,当选美国工程院院士
- 开源AI短剧神器来了,单卡即可部署!好莱坞效果人人可享,昆仑万维出品
- DeepSeek加持,北大通院几何模型达IMO金牌水平!32个CPU核心和1块4090就能实现满血解题
- 报名 | CVPR’25首届具身智能「通用机器人操作研讨会和挑战赛 」正式启动
- DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升
- 全球空间智能第一股!浙大清华“三剑客”,英伟达基因,填补两大技术空白
- 反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好
- Llama模仿Diffusion多模态涨分30%!不卷数据不烧卡,只需共享注意力分布
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 打不过DeepSeek就加入,最新名单:腾讯文档、百度搜索
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- DeepSeek冲击之下,大模型六小强如何「回应」?
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 微信DeepSeek入口已接通,辐射用户14亿!刚刚实测,辛弃疾都得666
- 不蒸馏R1也能超越DeepSeek,上海 AI Lab 用RL突破数学推理极限
- 免手术AI读心术新突破!Meta脑机接口研究惊呆网友:能边睡边玩手机发帖了??
- Perplexity免费推出Deep Research:性能超过R1、o3-mini等,CEO:感谢DeepSeek
- DeepSeek官方推荐:R1要这样设置
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- DeepSeek缝合Claude,比单用R1/o1效果都好!GitHub揽星3k
- 苹果发现模型蒸馏Scaling Law!教师模型并非越强越好
- ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频
- 百度决定背叛闭源大模型,李彦宏重新拥抱开源
- DeepSeek R1遇难题142次”I give up”,研究还称需增加推理时机控制机制
- Claude 4被曝发布在即!DeepSeek把大招都给逼出来了
- 达摩院开源VideoLLaMA3:仅7B大小,视频理解拿下SOTA | 在线可玩
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- Karpathy大神问懵DeepSeek!一个🤣竟藏53个Token,思考10分钟没解释出来
- 腾讯元宝接入DeepSeek-R1满血版,首次引入第三方模型,能联网能调用微信独家生态
- 文心一言全面免费了,深度搜索功能同时上线,第一手实测在此
- 打破纪录!谷歌全网扒1000亿图像文本对,ViT大佬坐镇:数据Scaling潜力依旧
- Gemini再度“破防”!长期记忆被黑客篡改,方法竟和一年前如出一辙
- 中国AIGC产品全景图谱全面征集|量子位智库
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 本想去谷歌捞一笔就跑,却成了改变AI历史的人|Transformer作者对话Jeff Dean
- 比尔盖茨自述曾是熊孩子:16岁徒步数百英里,边走脑中边写BASIC代码
- GPT-4.5马上发布,GPT-5免费畅聊!奥特曼剧透大动作,网友:让DeepSeek整破防了
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- o3拿下IOI 2024金牌!新论文公布RL秘诀:AI自己设计测试时推理策略,无需人类干预
- 奥特曼再谈DeepSeek:每天醒来都有压力
- 小红书&上交多模态大模型新基准,Gemini 1.5 Pro准确率仅48%
- 免费!满血版DeepSeek丝滑畅玩,低门槛实现671B-R1/V3自由,潞晨云上新
- 4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破大模型推理门槛
- 5090又烧了!英伟达发售前曾保证“已完全解决”
- 奥特曼公开回怼马斯克,OpenAI董事会成员:说要收购,没收到报价啊?
- 只需一句话,AI调用多个应用为你打工!三星S25系列国行版发布,AI功能大升级
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 啊?7B的DeepSeek反超R1满血版,上海AI Lab周伯文团队新成果:计算最优的Test-Time Scaling
- 推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 只需一句话,AI调用多个应用为你打工!三星S25系列国行版发布,AI功能大升级
- 不用跟着挤DeepSeek官方了!这个神器让你零门槛拥有私人助手
- 满血DeepSeek-R1+Cursor打通!无问芯穹上线API服务,能力拉满,7大国产算力保驾护航
- 推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考
- Claude团队:用400万条对话分析AI对经济的长期影响
- 2025,见证更多GenAI应用落实!今年的中国AIGC产业峰会来啦
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 本科生颠覆姚期智40年前猜想!意外发现新型哈希表,数据搜索速度突破理论上限
- 7118亿!马斯克出价收购OpenAI,奥特曼隔空阴阳:我711亿买推特还差不多
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 港大字节最新视频生成模型刷屏!网友直接RIP市场营销,Sora也不香了
- DeepSeek上线国家超算平台!671B满血版,三大运营商接入,玄铁芯片适配
- Meta新视频生成框架拿捏倒立杂技,双人舞也能完美同步!运动一致性暴增近20%,可无缝集成DiT模型
- Nature:离 “量子互联网” 又近一步!牛津大学证实分布式量子计算可行性
- 推理时也能做偏好优化,无需额外重训练,来自上海AI Lab港中文等
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 刚刚,奥特曼给出AGI三个判断:Scaling Law保持不变,没理由放缓投资
- OpenAI内部模型曝光!编程能力跻身全球Top50程序员,年底不再有人类对手
- 斯坦福华人博士生打破58年僵局!牛顿提出的亲吻数问题有了新突破
- SFT并非必需!推理模型仅靠RL就能获得长思维链能力,清华CMU团队破解黑盒
- 量子位招聘 | DeepSeek帮我们改的招聘启事
- 奥特曼再谈DeepSeek:肯定开源模型巨大贡献,坚信人类终将实现AGI
- 图像生成推理大模型,港中文北大等联手破解画质提升难题
- DeepSeek下棋靠忽悠赢了ChatGPT,网友:孙子兵法都用上了
- 谷歌AI解决IMO中84%的几何问题,o1一道没做对!Nature:AI已超过金牌得主平均水平
- 苹果把台灯做成机器人!能用动作表达情绪,重新定义机器人交互
- 浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025
- 招聘 | 量子位AI大模型等3大方向编辑作者
- Ilya公司开放融资:估值200亿美元,0用户0收入
- 全球顶级AI科学家许主洪加盟阿里!IEEE Fellow,五万被引论文数,曾任Salesforce集团副总裁
- Pika新功能可以往视频里添加一切!网友:每月省5000美元
- 免费功能卷翻付费版ChatGPT,欧洲AI新贵叫板OpenAI
- 中国AIGC产品全景图谱全面征集|量子位智库
- 被DeepSeek带火的知识蒸馏,开山之作曾被NeurIPS拒收,Hinton坐镇都没用
- 吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测
- 钉钉真勇!率先接入DeepSeek,阿里系第一个吃螃蟹
- 招聘 | 量子位AI大模型等3大方向编辑作者
- OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek
- OpenAI联创Schulman闪电跳槽!从Anthropic转投Murati新公司
- DeepSeek无问西东!先行者早已趟平全国产之路
- 成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏
- 三大竞赛引爆CVPR’25协作智能Workshop全方位探讨多智能体具身系统新机遇,总计1万美元奖金等你来拿
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 招聘 | 量子位AI大模型等3大方向编辑作者
- 大神卡帕西拿DeepSeek R1讲强化学习!最新大模型内部机制视频爆火,“没有技术背景也能看懂”
- DeepSeek超ChatGPT成全球增长最快AI应用!下载破4000万,日活超豆包登顶中国No.1|量子位智库
- 力压DeepSeek-R1!谷歌Gemini 2.0系列集体上新,全员跻身大模型竞技场前10
- 多模态版DeepSeek-R1:评测表现超GPT-4o,模态穿透反哺文本推理能力!北大港科大出品,已开源
- 热搜第一!DeepSeek百万年薪招AI人才,实习生都能月入过万
- 谁还没发现微信好友里的“卧底AI”:你以为它只会做红包封面?
- 2025,见证更多GenAI应用落实!今年的中国AIGC产业峰会来啦
- 宇树机器人成赛博科比!英伟达CMU新研究,投篮模仿篮球巨星,代码论文全开源
- OpenAI突遭人形机器人独角兽解约,网友:不会改用DeepSeek了吧?
- 华为昇腾推理DeepSeek-R1,性能比肩高端GPU,API免费无限量!潞晨自研推理引擎出手了
- 杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距
- 招聘 | 具身智能机器人方向全职作者
- 新研究揭示DeepSeek/o3弱点:频繁切换思路放弃正确方向,最短答案往往就是对的!
- 5人创业国产AI搜索火了,小红书Reddit都在推!创始人:我们比Perplexity留存更高
- 报名启动!今年最值得关注的AIGC企业/产品正在评选中
- 招聘 | 具身智能机器人方向全职作者
- OpenAI紧急加播:ChatGPT上新深度搜索,持续思考30分钟输出1万字,刷榜“人类最后的考试”
- 国产AI搜索接入DeepSeek-R1,深度试玩报告抢先出炉:正愁用不上官方联网搜索
- 2025,见证更多GenAI应用落实!今年的中国AIGC产业峰会来啦
- 招聘 | 具身智能机器人方向全职作者
- DeepSeek华为火线联手!硅基流动首发即限流,全国产API白菜价,零门槛部署
- 首个OpenAI免费推理模型o3-mini发布!DeepSeek让奥特曼反思:不开源我们错了
- DeepSeek点燃国产大模型斗志,RAG等核心技术被重估
- 2025,见证更多GenAI应用落实!今年的中国AIGC产业峰会来啦
- 国产AI「快」到火爆外网!10秒生成一个视频,网友:我见过最快的AI
- 国内数学最强!实测讯飞版o1:上能打奥赛卷高考,下能辅导寒假作业
- 打脸!GPT-4o输出长度8k都勉强,陈丹琦团队新基准测试:所有模型输出都低于标称长度
- 揭秘大模型强推理能力幕后功臣“缺陷”,过程级奖励模型新基准来了
- 首届北京中关村学院青年论坛2月20日起举办!诚邀海内外青年学者参加
- 姚期智团队开源新型注意力,节省90%内存不降性能,一个框架统一MHA/MQA/GQA
- MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o
- OpenAI Agent来了!大小事务自动帮你搞定,带推送提醒的那种,今日可开玩
- 谷歌新架构一战成名,打破Transformer记忆瓶颈,姚班校友钟沛林新作
- 最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k
- 抢先OpenAI“虚拟员工”!清华复旦斯坦福联手,让Agent接管电脑帮你工作
- 物理学家发现新型量子粒子!表现介于玻色子费米子之间 | Nature
- 智能驾驶年度格局报告:两个「端到端」改写三大梯队,「华理魔」领跑
- 霉霉用中文拜早年!国风年味视频免费生成,可任意切换主角,0帧起手小白友好
- DeepSeek官方App上线!功能完整且免费,网友:ChatGPT最佳替代品
- 别再把o1满血版当聊天模型了!SpaceX前工程师公开全新使用秘籍:从讨厌它到每天依赖它
- 3小时输出27个知识点!张朝阳跨年演讲硬核解析生活中的量子力学
- 最高工资322万!OpenAI开招机器人工程师
- 深圳人形机器人街边溜达爆火海外!超自然步态大步流星十几米,“成本10万内、两月后商用”
- OpenAI疯狂爬虫,把一家公司都给爬宕机了,CEO:堪比DDoS
- 直击CES:AI教育群雄逐鹿,中国选手展现硬实力
- 可灵AI破解电车难题全员无伤!网友:这就是东方智慧吗
- OpenAI谷歌回收“废旧”视频,UP主外快渠道+1,单笔可赚数千美元
- 突破瓶颈!北航ETH等首次将扩散模型完全量化至1bit,28倍存储节省+52.7倍效率提升
- 好家伙,海螺直接拍了个AI版的《教父》
- 谷歌内部AI人才大迁移,统一纳入DeepMind旗下,归哈萨比斯领导
- 英伟达迷你超算遭友商嘲讽:宣传FP4算力,实际“不如买个游戏电脑”
- AMD把o1炼成了实验室助手,自动科研经费节省84%
- AI预测论文能不能中,8B超越70B大模型,港大发布图文融合多智能体GraphAgent
- 让Qwen2.5 7B超越o1,微软干的!MSRA推出小模型数学推理自我进化新方法
- 黄仁勋评价AI PC销量不及预期,联想VP回应了 | CES 2025
- 2025 AI手机交互体验:它能说会道,有眼有脑,是更聪明更懂你的AI伙伴
- 今天起,汉字也能AI视频生成了!《滕王阁序》直接拿捏到位了
- 黄仁勋一句“量子计算还需20年才实用”,概念股应声腰斩
- 量子力学100岁了:一场颠覆物理学的“速战速决”|Nature
- 表格处理神器登上Nature!开箱即用,平均2.8s解读任意表格
- CES2025进行中,量子位AI专题已就位
- 小米千万大奖颁给汽车:超级电机,但很AI
- 空间智能上车!长城汽车铁娘子:真正的智能车应该无缝集成所有场景 | CES 2025
- 奥特曼家里也内讧了!亲妹告他长期虐待,刻意隐瞒遗产;家里其他人联名否认
- 具身智能赛道迎来另类玩家,同时布局智能+传感+控制三大技术,已批量出货韩国
- 谷歌爆款学习神器更新,一键插嘴AI对话,哪里不会问哪里
- CES2025进行中,量子位AI专题已就位
- 英伟达点火联想燎原:RTX 5090显卡真机已就绪 | CES 2025
- 国产AI眼镜1799元现货开卖!阿里的定制大模型,深圳的硬件
- 老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了
- 陈丹琦团队降本大法又来了:数据砍掉三分之一,性能却完全不减
- 用大模型吃瓜更智能了!阿里通义实验室提出新时间线总结框架,全面提升新闻总结效率
- 具身智能2025第一融,智平方宣布完成数亿元Pre-A轮融资
- CES2025进行中,量子位AI专题已就位
- Sora核心作者掌舵,谷歌世界模型新团队全球招募:百万底薪起步
- 北大数学家独作论文登数学顶刊!袁新意统一了算术与几何Bogomolov猜想
- CPO薪资倒挂CEO,创业公司薪酬情况大起底
- 超越ControlNet++!腾讯优图提出动态条件选择新架构
- OpenAI科学家:现有模型+后训练足以产生黎曼猜想的新证明
- 国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开
- 3D版抖音有望诞生,零门槛3D创作时代来临|VAST宋亚宸@MEET 2025
- 协议曝光!原来微软OpenAI这样定义AGI
- 北大开源首个针对视频编辑的新指标,与人类感知高度对齐|AAAI25
- 把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍
- 宿舍/房间网不好?一加新机能穿3墙、离200米接收wifi信号,玩《原神》平均帧率超120
- 2年间AI大模型成本骤降万倍,商业化应用加速跑|智谱张帆@MEET2025
- 智平方郭彦东:具身智能到达GPT-2时刻,产业化成败在于“物理世界大模型”工程化能力
- Deepseek新模型意外曝光!编程跑分一举超越Claude 3.5 Sonnet
- 英伟达年终核弹!全新B300为o1推理大模型打造,RTX5090也曝光了
- 钛动科技陈德品:Scaling Law在营销应用中也适用,AIGC内容正在催生爆款 | MEET2025
- o3挑战ARC-AGI,遇见大网格就懵圈?英国工程师:ARC-AGI不适合大模型
- 微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora
- KDD’25 | 生成式拍卖:感知排列外部性的整页优化机制
- 你的下一个浏览器,可以是豆包电脑版!
- 声网刘斌:“Her”真正落地实现离不开RTE能力的支撑|MEET 2025
- 阿里开源首个视觉推理模型,击败GPT-4o,网页一度404
- 无需训练、即插即用,新算法大幅增强视频生成质量|NUS&上海AI Lab&UT Austin
- 首家量产50万!中高阶智驾轻舟“越级”,获征程6M首家定点
- 商汤科技董事长徐立:整个AI行业都有两条生死线|MEET 2025
- 大模型版生命游戏来了!「AI科学家」背后公司联手MIT&OpenAI等打造
- 华人学子闪耀NeurIPS顶会,背后最大赢家竟是它
- OpenAI被曝自研人形机器人,4年前因缺数据解散团队,如今要用机器人数据反哺大模型了
- 刚刚,人类最快探测器与太阳上演最近距离接触
- 业界首次!一个端到端原生机器人大模型搞定100+灵巧手复杂操作,星动纪元ERA-42来了!
- 英特尔新款游戏显卡卖爆!24G大显存版也在路上,这下AI玩家也要抢?
- 国产机器狗成精了!野外跑酷强到可怕,驮成年小伙遛弯儿,售价109万
- LeCun最新访谈:距离AGI可能不到10年,下一代AI需要情感和视觉训练
- 时隔6年BERT升级!仅编码器架构没被杀死,更快更准确更长上下文
- 刚刚,马斯克xAI再融60亿美元,老黄AMD都投了
- 小冰李笛:真正的AI信仰者不该FOMO | MEET 2025
- 昆仑万维方汉:大模型的技术红利在消退,商业模式创新者将成赢家 | MEET 2025
- 百川新模型超GPT-4o近20%,首创自约束训练方案突破瓶颈,主打「领域增强」
- 2024年,百万上下文依然没有杀死RAG
- 扒一扒o3-mini背后团队:3位华人核心成员,北大清华南开校友在列
- o3并非独门秘技,谷歌已发背后关键机制,方法更简单、成本更低
- 苹果要做智能门铃了???
- 直击CCAI大会:院士专家舌战激辩,20个AI案例C位出道,海淀无愧AI科技“梦工厂”
- OpenAI附议Ilya预训练终结!“但Scaling Law还没死”
- Scaling Law不总是适用!尤其在文本分类任务中,vivo AI Lab提出数据质量提升解决方法
- Ilya宣判:预训练即将终结!NeurIPS现场沸腾
- ChatGPT终于也推出Projects功能,却故意露出一个“AGI”的项目
- 4000万+用户!测测CEO任永亮:一个行业既不能离AI太近也不能离AI太远 | MEET 2025
- 专治大模型“套壳”!上海AI实验室等给LLM做“指纹识别”,剪枝合并也无所遁形
- 「AI定义汽车」新拐点已至!小米孟二利:我们有三个工作需要做好 | MEET 2025
- 国产全AI游戏来了?!大模型直出开放世界游戏,有声可交互
- NeurIPS神仙打架:李飞飞180页PPT谈视觉智能,Bengio同OpenAI员工吵架,何恺明谈AI宿命论
- 微软出招!新模型数学超GPT-4o编程胜Llama3.3,训练新范式引热议:midtraining
- 《2024年度AI十大趋势报告》发布:技术创新、产品洗牌、行业动态一文看尽
- OpenAI版《Her》全量来袭:实时视频对话,你每个动作AI都看得见
- 李开复周志华纵论AI大模型,商汤徐立倡议「打脸时刻」,万字梳理MEET’25大咖激辩,320万观众同见证
- 扒一扒大模型应用隐形冠军:服务1600+企业、200+业务场景,分分钟就可构建专属应用
- 谷歌新旗舰模型鲨疯了,免费不限量,网友:我读论文能力提高10倍
- 专治大模型“套壳”!上海AI实验室等给LLM做“指纹识别”,模型剪枝、合并等也无所遁形
- 反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练
- 贾樟柯李少红都用AI拍电影了,还传递经验:哪个功能最实用?
- 谷歌“狙击”OpenAI,发布新一代大模型!主打Agent+多模态
- Sora/可灵/海螺/混元等大PK!多场景对比,现在谁是最强视频生成模型?
- 诺奖青睐AI的这一年,这些人工智能公司&人物&产品值得关注
- AI音乐战火升级!三路国产大军全面对决Suno
- 物理诺奖得主最新演讲,Hinton带伤飞到瑞典,LSTM之父:都是剽窃
- 一周发明GAN!时间检验奖得主分享背后故事:每件发明都不是最后的发明
- OpenAI员工意外泄露下一代ChatGPT!网友:故意的还是不小心的?
- 谷歌量子芯片引爆热议:5分钟算完10²⁵年任务,Nature加急发表,还证实了多元宇宙???
- 看3.2亿帧视频学会3D生成,智源开源See3D:只需单图即可生成3D场景
- 明天见!李开复周志华徐立邀请您来,MEET2025智能未来大会,现场有机会获惊喜周边
- “我把4500多篇NeurIPS 2024论文,做成了AI搜索”
- AI视频边生成边播放!首帧延迟仅1.3秒,生成速度9.4帧/秒|Adobe&MIT新研究
- 马斯克机器人蒙眼户外溜达,45°斜坡跑着下!网友:只有一点小“脚滑”
- Sora开服被挤爆!支持中文/编剧模式/作品分享,145块就能玩
- 寻找2024最TOP智驾产品,智能驾驶年度报告启动|量子位智库
- o1 Pro挑战最难本科数学考试,36分钟16秒交卷
- Scaling Law不是唯一视角!清华刘知远团队提出大模型“密度定律”:模型能力密度100天翻番
- 什么?程序员礼盒还自带大模型彩蛋,碰一下就可触发
- Sora二代实机演示曝光!解锁图生视频,奥特曼暗示:期待周一
- 马斯克新文生图模型闪现!网友抢时间疯狂实测:人物生成超逼真,可算把赛博皮卡画明白了
- 北交开源o1代码版!强化学习+蒙特卡洛树搜索,源代码、精选数据集以及衍生模型通通开源
- MEET2025大会举办在即!20+顶流大咖,还有2场对话+具身智能圆桌,尽在这场年度科技盛会
- 《我的世界》搞数学研究,估算欧拉数误差仅0.00766%!数学博士的跨界花活儿火了
- 陶哲轩对谈OpenAI高管:AI也能做数据稀疏推理,“也许很快OpenAI就能证明陶哲轩是错的”
- o1被曝“心机深”:逃避监督还会撒谎,骗人能力一骑绝尘
- 华为云又一数据中心开服:让算力像水电一样通用,青岛这步棋走对了
- 新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜
- 豆包学会“写字”了!秒出海报漫画表情包,运营神器get
- 二次元狂喜!海螺发布2D动画专用视频生成模型,日漫迪士尼插画风都支持
- MEET2025大会举办在即!20+顶流大咖,还有2场对话+具身智能圆桌,尽在这场年度科技盛会
- OpenAI强化微调登场:几十条数据o1-mini反超o1暴涨80%,奥特曼:今年最大惊喜
- 罕见!云计算一哥CTO,现场不发产品只讲教训
- 全国首个金融大模型成绩单:服务超2亿用户8大应用场景
- 百度商业系统升级:七成客户加持AI营销能力,释放10倍商业空间
- 奥特曼悔不当初:OpenAI因无知选择“非营利”
- 游戏bug帮大模型学物理!准确率超GPT4o近4个百分点
- MEET2025大会举办在即!20+顶流大咖,还有2场对话+具身智能圆桌,尽在这场年度科技盛会
- o1满血版最鲜测!这¥1500花得值吗?
- OpenAI第一场直播就炸场!o1满血版上线,史上最贵订阅费:1450元/月
- 奥特曼披露ChatGPT周活3亿+,痛悔OpenAI无知选择“非营利”
- 具身智能要从娃娃抓起,清华AIR联手地瓜机器人建立科教平台,从K12到大学科研都覆盖
- 对话Google DeepMind资深科学家:强化学习是重点,大模型时代AlphaZero依然重要
- OpenAI招了个高中辍学的,入职Sora团队专攻AGI
- AI营销的风,还是吹到了A股
- 豆包代码大模型曝光!在字节最新开源基准里,多种编程语言性能仅次于OpenAI/Claude
- DeepMind大模型再登Nature:8分钟预测15日天气,准确度超顶尖物理模型,已开源
- 马斯克找老黄插队拿显卡:72亿GB200订单,加价也要
- 通信巨头入局视频生成,直接霸榜权威评测:人物跨越多场景依然一致
- MEET2025大会举办在即!20+顶流大咖/三大亮点/两场对话+圆桌,尽在这场年度科技盛会
- 谷歌邀马斯克联手做AI游戏!DeepMind版Sora是个3D游戏引擎,一张图生成无限可交互世界
- 刚刚,谷歌ViT核心骨干集体投奔OpenAI:他们为Sora打下基础
- 揭秘注意力机制真正起源!10年前3项研究几乎同时独立提出,背后故事细节被Karpathy晒邮件公开了
- “云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any
- MEET2025大会最全剧透:李开复周志华徐立领衔二十余位顶流大咖,两场对话+圆桌直指时下热门议题
- NeurIPS 2024最佳论文揭晓!北大字节VAR获最佳论文,清华厦大研究获提名
- ICLR审稿集体搞抽象!评审结果写半句,还有的求ta也不审,网友:科研人自己的春晚
- 阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解,动态调整下一步检索策略
- 硅谷投资人张璐:马斯克星舰打开太空经济赛道
- 项目爆火立刻脱离大厂!谷歌NotebookLM核心团队集体离职,另起炉灶创业
- 白板文化成就了英伟达,黄仁勋心中藏着一个老师梦
- MIT首次证明运动能促进神经元生长,网友:催我运动的理由+1
- 模型知识蒸馏新SOTA!告别传统散度蒸馏|腾讯优图&中科大出品
- MEET2025大会在即!南大周志华商汤徐立带你一览最前沿科技进展
- 腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
- 何恺明MIT开门弟子名单公开:奥赛双料金牌得主、清华姚班学霸在列
- 李飞飞空间智能首秀:AI靠单图生成3D世界,可探索,遵循基本物理几何规则
- 翁荔离职OpenAI后第一个动作:万字长文探讨RLHF的漏洞,网友们抢着传看
- ChatGPT拒绝谈论这个人,没人知道为什么
- 微软:两个AI相互纠错,数学再涨5分
- 图结构转文本序列,大模型直接读懂!图推理性能大涨
- 如何杀死癌细胞?斯坦福医学院:骗它开启自毁
- MEET2025最新嘉宾阵容!除了李开复周志华,还有具身智能大牛圆桌畅聊
- 腾讯AI视频生成曝光!与Sora同提示词PK,你来投票
- 马斯克全力阻止OpenAI转盈利!已向法院申请禁令,奥特曼:我和爱人休假盖树屋
- 轻量化MobileMamba视觉模型来了|浙大/腾讯优图/华中科大联合出品
- 无需Transformer,简单滤波器即可提高时间序列预测精度 | NeurIPS 2024
- MEET2025最新嘉宾阵容!除了李开复周志华,还有具身智能大牛圆桌畅聊
- 上海交大新聘AI博导,27岁!
- 3名高中生重新证明百年数学定理!只用课余时间、方法非常创新
- 清华新VLA框架加速破解具身智能止步实验室“魔咒”,LLM开销节省4-6倍 | NeurIPS’24
- 玩家投诉的机器人,竟然都是真人?AI NPC真「以假乱真」|对话超参数科技
- 最新嘉宾阵容来了!MEET2025智能未来大会正在报名中
- 陶哲轩新论文“太反直觉”:再战Erdős问题,证明44年数学猜想是错的
- 马斯克的机器人徒手接个球,2000万网友集体围观
- 科研党狂喜!AI预测神经学研究结论超过人类专家水平 | Nature子刊
- 80G显存塞50个7B大模型!清华&OpenBMB开源增量压缩新算法,显存节省8倍
- 一次示范让Agent适应各种新环境,浙大杭电智能体框架入选NeurIPS
- MEET2025最新嘉宾阵容!除了李开复周志华,还有具身智能大牛圆桌畅聊
- 注意!AI学会自己发红包了
- 中国仿生机器人看北京,北京仿生机器人看海淀
- 智源发布心脏模型!超实时仿真人体生理功能,速度提升180倍
- Kimi开源底层推理框架,1小时GitHub揽星1.2k
- LLM也会和人类一样焦虑!还会产生更多偏见,图宾根大学最新研究
- 让AI眼里有活主动干!清华&面壁等开源主动交互Agent新范式
- MEET2025最新嘉宾阵容!除了李开复周志华,还有具身智能大牛圆桌畅聊
- Qwen版o1发布即开源!32B参数比肩OpenAI o1-mini,一手实测在此
- 上海AI实验室版o1已上线!数学竞赛题、Leetcode赛题全拿下,还会玩24点
- 史无前例!Seq2Seq和GAN同获NeurIPS时间检验奖,Ilya连续2年获奖
- 第一个国产中文o1来了,直接数学竞赛题伺候!
- Scaling Law百度最早提出?!OpenAI/Claude都受它启发,Ilya出现在致谢名单中
- 清华量子计算成果登顶刊,首次发现噪声影响量子优势,来自丘成桐数学中心团队
- 1行代码改进大模型训练,Llama训练速度提升至1.47倍,全华人团队出品
- 将偏好学习引入模型训练,北大李戈团队新框架,可显著提升代码准确性与执行效率
- MEET2025最新嘉宾阵容!除了李开复周志华,还有具身智能大牛圆桌畅聊
- Sora突遭泄露!能力又进化了,OpenAI紧急拔网线,抗议者联名信中惊现马斯克
- 华为“最强Mate”手机来了!AI能力拉满,比个手势就能隔空传送文件,售价5499元起
- Claude化身服务器联通一切!AI写好代码自己发Github,人类程序员只配动嘴了
- 大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘,没日没夜加班胖了30斤
- 吴恩达开源大模型套件:11个模型平台一种方式调用,已获星标超1.2K
- 超越GPT-4o!开源科研神器登场,4500万篇论文检索增强生成靠谱回答
- 空间智能新进展:教机器人组装宜家家具,首次实现操作步骤与真实视频对齐 | NeurIPS
- MEET2025最新嘉宾阵容!除了李开复周志华,还有具身智能大牛圆桌畅聊
- Robotaxi年度格局:3类玩家4大梯队,武汉北京落地领先
- 黄仁勋港科大全程高能:对话沈向洋,现场发显卡,与梁朝伟共同获得荣誉博士学位
- 乌镇最火AI议题,原来答案藏在这份报告里
- AI推演OpenAI内斗结果:奥特曼仅有20%胜率,马斯克也有机会接盘???
- 将活体神经元植入大脑,他和马斯克闹掰后开辟脑机接口新路线
- 限定120分钟科研挑战,o1和Claude表现超越人类
- 可口可乐pick可灵,用AI拍了新广告片
- MEET2025最新嘉宾阵容!李开复周志华、豆包通义都要来
- 经典卡尔曼滤波器改进视频版「分割一切」,网友:好优雅的方法
- Nature:谷歌学术正在被AI工具颠覆
- 20种复杂Excel操作一句话搞定!北大ChatExcel全新升级,所有人免费可用
- 最新嘉宾阵容来了!MEET2025智能未来大会正在报名中
- 陶哲轩宣布“等式理论计划”成功,人类AI协作,57天完成2200万+数学关系证明
- Claude自动玩崩铁清日常,NUS新论文完整测评AI电脑操控:GUI智能体的黎明
- 40亿美元!Anthropic再获亚马逊新一轮投资,双方正合作开发AI芯片
- AI模仿人类看漫画,视频大模型时序定位能力新SOTA
- 低成本机器人“皮肤”登上Nature子刊:实现三维力的自解耦,来自法国国家科学研究中心&香港大学
- 刚刚,沈向洋官宣通用视觉大模型!无需提示,就能识别万物
- 百度AI营收占比翻倍,净利润涨12%,李彦宏主动剧透新版文心大模型
- 第二波嘉宾曝光!二十位科技圈大咖齐聚MEET2025智能未来大会
- 汽车上的《Her》:模型竟然想做个人了,甩掉机械感,让灵魂有趣,来自吉利的全新尝试
- 王炸!谁能想到年底杀出的黑马是美图啊
- 谷歌Gemini突发试验版模型,重回竞技榜第一!新版GPT-4o只领先了1天
- FLUX“官方版ControlNet”来了!景深轮廓更精准控制,共四款官方工具一齐上线
- DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成
- 2D图纸分分钟转3D模型!杭州独角兽补齐空间智能关键一环,现公开两大技术引擎
- 国产模型指令跟随全球第一!来自LeCun亲推的「最难作弊」大模型新榜单
- 史上最严“中文真实性评估”:OpenAI o1第1豆包第2,其它全部不及格
- OpenAI重夺竞技场第一,但这波靠的是4o
- AI版《黑客帝国》:无限生成逼真视频,3A画质,还能实时交互
- 让模型预见数据分布变化,东京大学等提出时态域泛化全新框架
- 定档12月11日,MEET2025智能未来大会报名通道已开启!
- DeepSeek版o1炸场,数学代码超越OpenAI,每天免费玩50次,后续将开源
- “清华AI医院”上线!首批42位AI医生亮相,诊断覆盖300余种疾病
- 国产4o大模型,秒懂国风李子柒
- 人生搜索引擎免费用,开源版哈利波特“冥想盆”登GitHub热榜,支持中文
- iPad可用AI绘画交互编辑神器火了,网友:颤抖吧PS
- 多样任务真实数据,大模型在线购物基准Shopping MMLU开源|NeurIPS&KDD Cup 2024
- 定档12月11日,MEET2025智能未来大会报名通道已开启!
- 刚刚,星舰第六次试验成功!猛禽发动机实现“太空重启”,降落过程大秀身姿
- 2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定
- 特斯联首款通用智能体发布,实现对物理世界的高维感知
- 港科大具身机器人团队,连续获亿级融资
- ChatGPT付费功能免费用!Mistral把Canvas、Artifact全复制了
- Qwen2.5更新百万超长上下文,推理速度4.3倍加速,网友:RAG要过时了
- AI自动操作VS Code,自然语言搞定各种配置,来自阿里通义智能计算实验室 | 开源
- 定档12月11日,MEET2025智能未来大会报名通道已开启!
- 腾讯AI大牛,被曝投身视频生成创业
- 北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型
- 猫猫运动方程,首次被物理学家破解! |《美国物理学杂志》正经研究
- 如祺出行跑进智驾深水区 “数据闭环”为技术迭代提供更优解
- 智能交互创新赛落幕,哈工大AI智能背诵助手拿下特等奖|OPPO智能体平台
- AI能办专属信用卡了,Agent自己赚钱自己花,OpenAI合作伙伴打造
- AI一键解析九大生物医学成像模式,用户只需文字prompt交互,微软UW等新研究登Nature Methods
- 定档12月11日,MEET2025智能未来大会报名通道已开启!
- ChatGPT击败50名人类医生!疾病诊断准确率达90%,OpenAI总裁:人机合作还得加强
- 打破纪录!中国科学家让薛定谔的猫活了23分钟
- 视频大模型无损提速:删除多余token,训练时间减少30%,帧率越高效果越好 | NeurIPS
- 实测腾讯元宝2.0:图文视频啥都能搜,论文绘画全搞定
- 杨植麟发布Kimi新模型:数学对标o1,中考高考考研成绩全第一
- 航展附近这场无人机编队表演,竟用了钉钉AI助理出的方案
- 不做Sora背后:百度的多模态路线是什么?
- 马斯克新官上任再起诉OpenAI!新证据称Ilya七年前就不放心奥特曼了
- 人大&港科大揭示大模型重要安全风险漏洞:利用概念激活向量破解大模型的安全对齐|NeurIPS 2024
- 量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了,SU哈佛亚马逊最新研究引热议
- 多个中国团队斩获EMNLP’24最佳论文!UCLA华人学者中三篇杰出论文,明年顶会落户苏州
- 谷歌杀回来了!新版Gemini跑分超o1登顶第一,CEO:这才哪到哪儿
- ChatGPT深夜更新:Mac版支持“读屏编程”,Windows版全员可用了
- AI在《我的世界》PK盖楼,新旧Claude差距过于明显,网友:审美也是智力的一种
- 最后1天!2024人工智能年度评选,AI时代的行业先锋就等你来
- 大模型上了火山方舟:数据唯你可见,唯你所用,唯你所有
- 李飞飞吴佳俊团队新作:推出具身智能决策能力评价基准,o1-preview登顶 | NeurIPS
- Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”
- Meta最新触觉机械手登Science子刊封面,操作未知物体精度最高提升94%
- 大模型“取长补短”新思路入选NeurIPS’24,显著优于现有路由方法,南科大港科大出品
- 最后2天!2024人工智能年度评选,AI时代的行业先锋就等你来
- 把Runway、Luma们一锅端了!这款视频模型上“杀手级”功能:一致性魔咒终于打破
- Keras之父,离职谷歌
- 百度打通两大国民产品!六边形AI创作新物种「自由画布」来了
- 小度为何押注AI眼镜?
- 今日最热论文:Scaling Law后继乏力,量化也不管用,AI大佬齐刷刷附议
- 稚晖君后宇树也来玩开源了:机器人操作数据集,采用抱抱脸LeRobot训练测试,网友:泰裤辣!
- 最后3天!2024人工智能年度评选,AI时代的行业先锋就等你来
- 摩尔线程冲刺IPO:国产GPU,英伟达中国一把手打造,估值已超255亿
- OpenAI总裁回归!将更专注重大技术挑战,“结束人生最长假期”
- 小米上新二代大模型!窗口长度翻至50倍,平均性能提升超45%
- Claude三巨头回应一切!Opus3.5仍可能发布,5小时超长视频10万人围观
- 最强开源CodeLLM模型深夜来袭!320亿参数,Qwen2.5-Coder新模型超越GPT-4o
- 马斯克招人策略曝光:9轮面试,底薪低于同行,只招“铁杆特斯拉人”
- o1不是唯一路径!MIT新研究:在测试时训练,模型推理能力最高升至5.8倍
- 开源版SearchGPT来了,两张3090就可复现,超越Perplexity付费版
- 最后4天!2024人工智能年度评选,AI时代的行业先锋就等你来
- 诺奖AI成果开源了!AlphaFold3代码人人可以免费下,Nature亲自撰文推荐
- 0元起步打造你的AI搜索!实测秘塔知识库新功能,竟能指导我升职加薪了
- 浙大开源“最懂Excel的GPT”!首次将结构化数据作为独立模态训练,刷榜提升40百分点
- o1/Claude集体翻车!陶哲轩等60+顶尖数学家合力提出新数学基准,大模型正确率通通不足2%
- 树莓派爆改国际象棋,棋子活了自己动
- 用LLM一键生成百万级领域知识图谱!中科大新框架入选ACL 2024
- 最后5天!2024人工智能年度评选,AI时代的行业先锋就等你来
- GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程
- AI毒液刷屏抖音小红书!闲鱼10元代生成一次,但官网其实免费
- 空间智能版ImageNet来了!李飞飞吴佳俊团队出品
- ChatGPT新玩法火了: 一句话画出你的真实生活,大神Kapathy也玩上了
- 多模态模型免微调接入互联网,即插即用新框架,效果超闭源商用方案
- 最后一周!2024人工智能年度评选,AI时代的行业先锋就等你来
- OpenAI华人VP翁荔离职:北大校友,掌管安全,最近B站分享被热议
- 全球首个法律o1大模型发布,System2范式下慢思考法律专家|港科大&北大
- 清华厦大等提出“无限长上下文”技术,100万大海捞针全绿,Llama\Qwen\MiniCPM都能上分
- 国产AI可以拍微电影了!4K、60帧高清画质,自带音效
- 蚂蚁集团前端技术团队分享:AI 浪潮下,前端开发将迎来怎样的机遇与变革?
- AI蛋白质诺奖后再登Nature,第一性原理级精度,微软亚研院4年之作
- 一个弹窗整懵Claude,瞬间玩不转电脑了 | 斯坦福&港大新研究
- 评估大模型不看输出看「内在」,上交大新测试指标入选NeurIPS 2024
- 最后两周!2024人工智能年度评选,AI时代的行业先锋就等你来
- 黄仁勋:AI算力集群会扩展到100万芯片,没有任何物理定律可以阻止
- 鸿蒙的“AI野望”:让AI融入操作系统,数亿补贴寻应用开发者
- 首批嘉宾定了,李开复周志华都要来!MEET2025智能未来大会报名通道已开启
- 我在淘天做算法:十年拍立淘,一部视觉算法技术演变史
- 免训练加速DiT!Meta提出自适应缓存新方法,视频生成快2.6倍
- 50s完成7B模型量化,4bit达到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral
- 李开复和周志华都来了,MEET2025智能未来大会报名正式启动!
- 登顶的小熊猫模型出AI产品了!3步10秒出一张海报,可免费商用
- 大模型重构生命科学!最大基础模型面世,解锁DNA超长序列,参数规模达2100亿
- 最高精度1公里1公里1小时!达摩院发布气象大模型,大山东已经在用了
- GPT-4o加钱能变快!新功能7秒完成原先23秒的任务
- 零一万物战略骤转!国内聚焦toB,toC先走海外
- 轻松搭建AI版“谁是卧底”游戏,muAgent框架让知识图谱秒变编排引擎,支持复杂推理+在线协同
- 最后两周!2024人工智能年度评选,AI时代的行业先锋就等你来
- 腾讯算出MoE模型Scaling Law:C≈9.59ND+2.3×10⁸D,最佳激活参数量58.1B
- OpenAI未来猛料全曝光!奥特曼承认自己最大弱点是产品
- 腾讯3D大模型全面开源,文本图像10秒转3D资产,模型权重、推理代码全开放
- ChatGPT搜索搞不定勾股定理新证明,但国产AI可以!
- Llama版o1来了,来自上海AI Lab,强化学习代码已开源,基于AlphaGo Zero范式
- 1000个智能体打造《我的世界》,北大校友35页技术报告揭秘
- ControlNet作者新作:AI打光玩得更溜了!细节保留能力远高于SD1.5
- 无需参数访问!CMU用大模型自动优化视觉语言提示词 | CVPR’24
- 有生命的AI?AI Agent的应用可不只游戏NPC|对话超参数科技
- ¥9.99租英伟达H800!双十一算力羊毛真香,闲置卡也能挂机变现
- 商汤执行董事徐冰最新访谈:商汤最近在做什么?数万亿的AI投资能回本吗?
- 慢思考准确率反降30%!普林斯顿揭示思维链某些任务上失效的秘密
- 英伟达团队机器训练新方法!仅5次演示让机器生成1000个新demo,李飞飞高徒与徒孙联手出品
- 解决真实GitHub Issue能力一度登顶,字节豆包MarsCode团队分享背后工程实践,踩过的坑也分享了
- 最后两周!2024人工智能年度评选,AI时代的行业先锋就等你来
- o1满血版泄露!奥数题图片推理手拿把掐,奥特曼上线剧透o2
- 大模型玩你画我猜:Claude6局3胜,GPT-4o表现迷惑
- 微软清华改进Transformer:用降噪耳机原理升级注意力,一作在线答疑
- 大模型也冲“奥斯卡”:港科大腾讯等提出AI角色扮演全景综述,四方面剖析关键细节
- 时代变了!英伟达纳入道琼斯指数,英特尔被取代
- 3B模型打通机器人任督二脉!冲咖啡叠衣服都能干,7种形态适配,OpenAI也投了
- Claude学会理解PDF的图表!读论文更easy了
- 2mm芯片植入视网膜,盲人重获阅读能力还能打牌,马斯克老部下创业成果来了
- 大模型压缩KV缓存新突破,中科大提出自适应预算分配,工业界已落地vLLM框架
- 2024人工智能年度评选启动!3大维度5类奖项,寻找AI时代的行业先锋
- 翁荔,掌管OpenAI安全的北大校友,刚刚现身B站线下演讲
- 科研版AI搜索来了!知乎直答接入正版论文库,一手实测在此
- OpenAI回应一切,o1/GPT年前都会升级!奥特曼:别嫌慢,问就是缺算力
- 无需游戏引擎,大模型实时生成“我的世界”,每秒20帧零延迟可交互,已开源
- 清华团队革新MoE架构!像搭积木一样构建大模型,提出新型类脑稀疏模块化架构
- 多图场景用DPO对齐!上海AI实验室等提出新方法,无需人工标注
- 2024人工智能年度评选启动!3大维度5类奖项,寻找AI时代的行业先锋
- ChatGPT终于变AI搜索引擎了!网页/手机/桌面版同时上线,即将人人可用
- 微软万引理论大佬跳槽OpenAI!入职第一天:疯了,这里的人才密度简直疯了
- 帮了一把南美农民的拼多多,联合国粮农组织都点赞了
- 李开复回应一切:竞技场排名“让我们有信心继续做预训练”
- 波士顿动力电驱机器人进厂打工,全程自主无遥控,50万人在线围观
- 苹果最强芯M4 Max首发!官方定位可开发大模型,新MacBook Pro顶配57099元
- AI让手机任务自动“跑”起来!我国高校最新研究,简化移动设备操作
- 什么会影响大模型安全?NeurIPS’24新研究提出大模型越狱攻击新基准与评估体系
- 2024人工智能年度评选启动!3大维度5类奖项,寻找AI时代的行业先锋
- o1推理将用于图像理解,现场演示2分钟开发应用,OpenAI在伦敦捅了开发者窝
- 陶哲轩推荐:2高中生发现勾股定理新证明,论文已发《美国数学月刊》
- 统一图像生成,无需繁杂插件!智源发布扩散模型框架OmniGen
- ChatGPT一个微小更新,但让整个APP更实用了
- 谷歌25%新代码由AI生成,会Prompt工程的程序员更吃香了
- 突破短视频局限!MMBench 团队构建中长视频开放问答评测基准,全面评估多模态大模型视频理解能力
- 2024人工智能年度评选启动!3大维度5类奖项,寻找AI时代的行业先锋
- GitHub把OpenAI当备胎,Copilot接入Claude+Gemini,网友:Cursor的商业模式没了
手撕LLM
- GRPO的Loss为什么会有负值???
- GRPO简化Trick | 只改一个参数, 性能涨10%??
- 【手撕NSA】DeepSeek新作-原生稀疏注意力-超长文(附代码)
- X-R1: 3B中文推理开源, 支持LoRA训练
- X-R1: 不到50元,人人都能复现0.5B Aha Moment
- 【手撕GRPO】你只管给Reward, 剩下的交给RL(附代码)
- 再深挖DeepSeek-R1: Reward is Enough
- 【解读】DeepSeek-R1: RL前到底需不需要SFT???
- <200元的o1复现,尽管对比
- 【手撕LLM_Nv Embed】英伟达的LLM-as-Embedding ICLR高分, RAG检索有救了!
- All in LLM——小冬瓜AIGC的24年终总结!
- 【OpenAI o3安全对齐方案】坏消息:RLHF里的HF无了!!
- 【ICLR高分10/10/8/6】天塌了!LLM训练交叉熵吃这么多显存??
- 吓鼠!为什么DPO里Chosen和Rejected概率会同时下降???
- 【手撕Online Softmax】Flash Attention基础,一问一个不吱声!!!
- 【o1推理】手撕个MCTS给面试官看看!
NLP前沿
- deepseek-R2,leak了
- ToolRL,训练llm更好的使用工具。
- 炸裂!又一个AI大模型的新方向,彻底爆了!!
- 推理大模型并非一定要推理。
- 智谱开源,深度思考、deepresearch模型。
- 这个国产开源RAG项目ChatWiki厉害了,可以搭建企业级AI知识库和微信机器人
- deepseek开源的新算法,浅析~
- llama 4, 开源!
- SuperRAG, 百川也开源了。
- ChatAnyone, 阿里又开源了?
- Qwen原生多模态开源,浅析一下~
- Qwen开源,牛了
- deepseek-r1,论文番外篇~
- GRPO训练的坑,字节帮你淌了,DAPO开源
- 字节复刻了一个manus,还开源了~
- 昆仑天工Skywork R1V开源,行业内首个多模态推理模型~
- 图RAG统一框架来了,12种RAG方法一网打尽~
- 清华开源大模型推理框架:赤兔,deepseek部署成本减半~
- raptor + graphrag = HiRAG,开源~
- Google狙击OpenAI新产品,成功!
- Google Gemma3 开源,多模态大模型!
- R1思考+RAG = R1-Searcher,开源~
- 阿里通义RAG团队开源LaRA框架: 模型越弱,RAG提升越猛?
- Mistral发布史上最强、最好用OCR模型
- bge开源新向量模型了,冲!
- 搜索 + RL = DeepRetrieval, 开源!
- 微软LongRoPE v2:几乎无损的上下文扩展!
- RAG的下一形态?通义实验室:ViDoRAG!
- 学术圈炸了 这些SCI期刊投稿1个月录用 绿色通道来了
- DeepSeek开源周,第六弹, R1推理系统设计,API利润率达到545%!
- DeepSeek开源周,第五弹, 3fs来袭~
- DeepSeek开源周,第四弹, 一次性开源3个项目!
- 为何说“在国内做科研,最忌讳踏实”? 核心期刊发表小窍门
- DeepSeek开源周,第三弹, DeepGEMM来袭~
- DeepSeek开源周,第二弹, DeepEP来袭~
- DeepSeek开源周,第一弹, FlashMLA来袭~
- 火山引擎大气,DeepSeek白嫖攻略来了~
- unsloth杀疯了,3090即可训练超长上下文grpo!
- VLM + R1,开源圈又炸锅了?
- MoBA vs NSA, Kimi第一个站出来和DeepSeek中门对狙!
- 见证钞能力,马斯克的Grok3登顶全球第一!
- 六小虎之阶跃星辰,加入开源阵营,开源SOTA文生视频!
- 这个开源项目厉害了:一键部署DeepSeek R1!
- 阿里左手打右手,Qwen2.5 VL 72B 被自家 34B打败了~
- 一个🤣可以藏下滕王阁序,DeepSeek都玩懵了~
- 推理满血R1,仅需24GB!
- open-r1,代码解析~
- 2025年,RAG技术到底进化成啥样了?
- 训练自己的R1,仅需7GB显存~
- 只需50美元!最简单的推理扩展方案,效果媲美o1!
- DeepSeek R1/o1大型推理模型蓝图:架构设计及快速原型实现!
- o1/r1的风吹到了多模态,R1-V开源!
- Qwen,永远不会缺席!百万上下文模型开源
- OpenAI发布L3 级智能体!
- 豆包送来新年礼物,开源SOTA模型!
- RAG升级二维战士!通义实验室放大招
- DeepSeek:“源神”!
- 过年了?Kimi-k1.5是咋炼出来的?
- 媲美o1,DeepSeek R1,它来了!
- o1鸡血模式prompt,秒变o1 pro!
- 小钢炮又上新,OpenAI懵了!
- Deepseek退位,Minimax开源的新王!
- “AI印钞机”项目开源!
- Qwen2.5 VL开源来袭!
- CAG来了,RAG慌了?
- o1 + RAG = search-o1,开源
- 微软phi 4开源,以小博大~
- 黄仁勋身穿新皮衣,发布5090了!
- bge-m3准备退休,试试这个!
- langchain送来新年礼物,开源canvas来了
- 新年第2天,百度推出AI搜索功能
- 华佗o1,首个 完全开源 医疗o1模型!
- 腾讯开源了一个类o1模型
- 拳打claude,脚踢qwen,deepseek v3开源!
- 一句话生成应用,开源版bolt.new横空出世!
- openai又双叒叕开源了!
- 12天直播结束,炒作GPT5开始!
- 6年,Bert终于要退休了!
- Anthropic最新研究,Claude学会“演戏”了!
- 让AI边跑边想,乘风破浪的TTC!
- 又出王炸!OpenAI 的大模型的重要功能,杀疯了!超实用!
- tokenizer不存在了?Meta开源BLT算法!
- 停止付费!白嫖100万个模型~
- 谷歌王者归来!AGI level 3来了~
- 近距离围观 Sora 团队,内测艺术家谈正式版负评, AI 还算不上具备创作能力
- OpenAI Sora刚出就被玩坏了!
- 年末,AI再次进入爆发期!
- 浙大阿里联合提出科研Ideas自动生成工具SciPIP
- 王炸!OpenAI 的大模型的重要功能,杀疯了!
- 满血版o1,刚上线就被玩坏了
- OpenAI VS Deepmind:年度最大AI对决!
- 大模型 - 逆向思维
- 腾讯版Sora,发布即开源!
- Numpy要退休了,英伟达开源大杀器!
- Pandas要退休了,速度狂飙50倍!
- Qwen o1模型QwQ来了,冲!
- 微软LazyGraphRAG来了,700倍成本压缩!
- 提示词模板大乱斗
- 还在等deepseek r1? 阿里抢先开源marco-r1!
- LLM结构化输出,被冤枉了~
- 研究生期间靠自己买车买房的都是些什么人?
- 测试时训练(TTT)太强了!
- 大模型也能”反悔”了!
- Merkle树+RAG,Cursor的秘密曝光!
- GraphRAG进化,效率翻倍!
- 8个月炼出好”钢”,Steel-LLM开源了~
- OpenAI发布GPT学习法则~
- 465次实验炸出 大模型量化 真相
- Qwen新作,代码界的王!
- Qwen2.5.1 Coder系列开源来袭! 冲!
- 一篇大模型RAG最新综述
- 解密o1,六大推理秘诀大曝光!
- GraphRAG 0.4来袭:增量更新+DRIFT,起飞~
- Llama 3退位,腾讯Hunyuan强势登顶
- 文本分块的天花板来了~
- 三连发!1.7B小模型把大厂干懵了~
- 给RAG装上眼睛,性能暴涨39%!
- AI助攻SCI,这招太强了
- KAG来了,RAG慌了!
- 传统RAG凉凉?多模态RAG带来工业级革命
AGI Hunt
- 传言:DeepSeek R2参数暴涨至1.2万亿、便宜97.3%!美股或将巨震!
- O3 ARC-AGI测试结果出炉!
- YOU.com CEO:你对AI的态度,取决于你为何而工作
- Geoffrey Hinton:我们远没有我们想象的那么理性!
- Andrej Karpathy:markdown 将取代HTML!
- 研究:幽默可轻松越狱大模型!只需一句哈哈哈,安全防护将形同虚设!
- 突发!OpenAI与Shopify合作将推出聊天购物功能!
- o3虽出色,但用词很奇怪……
- Claude Code惊现神秘咒语!输入「ultrathink」,效果直接超神!
- 微软偷偷上线一款MCP神器,可让Office文件秒变Markdown!
- AI侦探上线!隐私?不存在了……
- 字节重磅开源Agent UI-TARS-1.5,全面达到SOTA,超越OpenAI 和Claude!
- 应该对ChatGPT说谢谢吗?
- o3和o4-mini打榜图
- o3 是AGI 吗?【多图】
- o3来了,非常出色!
- OpenAI 将在o3小时后直播!
- OpenAI 正秘密进军社交网络!
- GPT-4.1的10条官方提示词建议
- 重磅!谷歌新AI成功预测海豚语言!跨物种沟通新时代,要来了!
- 智谱全系列开源!推理性能比肩最先进水平,Z.ai域名同步上线
- ARC-AGI vs GAIA,谁才是AGI 的超级照妖镜?
- Yann LeCun:我不玩大模型了,那都是过去式!
- OpenAI 将发布「最强开源模型」!
- ChatGPT正转型为伴侣AI!
- 熵与优雅:GPT正在解压的宇宙分形密码
- 为什么说Scaling Law是宇宙的一种属性?
- OpenAI放大招!BrowseComp来了,AI上网能力大比拼!
- OpenAI今夜发布重大更新!奥特曼称兴奋得睡不着
- 马斯克:Grok 3.5 即将推出!Grok 4 年底见!
- Ilya正使用谷歌TPU进行SSI的AI研究!
- 遭OpenAI反诉,马斯克:骗子奥特曼又开始了!
- Grok 3 API发布!
- Kimi开源轻量级视觉语言模型Kimi-VL,性能媲美顶级模型!
- 看一遍就会!这个AI 要淘汰掉90%的打工人了!
- 据称,DeepSeek r2 将在“未来两周”内发布
- 原来,Trump是用人工智能来设定的关税!
- LlaMa 4 翻车了!
- 突发!OpenAI考虑收购奥特曼和Jony Ive的初创公司
- AGI Hunt Day04:Llama 4性能引争议、AI编程效率将提升10倍、Claude 4即将发布
- 刚刚,DeepMind发大招:145页AGI 安全报告来了!
- Meta发布Llama 4多模态MoE系列模型!全网专家点评
- 快来,Claude 大撒币!
- 编程结束了,该怎么办?
- AGI Hunt Day03:OpenAI调整GPT-5发布计划、微软CEO展示Vibe Coding
- 突发!OpenAI宣布o3和o4-mini模型马上发布,GPT-5几月后见!
- Llama 4 Omni即将发布!
- AI-2027.pdf出炉:2027年,AI将如何接管世界?
- MiniMax打造的超真人感AI阿祖,背后有什么黑科技?
- AI播客Day02:Anthropic推理模型引担忧、Devin 2.0发布价格从500$下调至20$、千问3进入最终开发阶段
- Google Nightwhisper神秘现身!超Claude Sonnet 3.7成最新编码SOTA模型?
- OpenAI发布AI研究新基准PaperBench,已能复制21%顶会论文!斯坦福研究发现LLM已比人类专家更具科研新颖性
- 张小珺+广密大模型季报的20条总结:「智能才是主线」
- 特斯拉Optimus 机器人开始预订!2027年底交付
- OpenAI 开源!每小时亏666666美元的同时,软银400亿美元到位,估值飙至3000亿美元!
- ChatGPT答不对的“9.11和9.9谁大”,居然被4o画图答对了?
- 刚刚,这家用AI 制药的公司,完成了6亿美元融资!
- 📢 LLaMa 4 来了!
- DeepSeek和OpenAI谁更open?
- 长,就好吗?(附赠ChatGPT插件)
- 真相!和ChatGPT聊一年的天,还不如你洗5次澡耗电!
- ChatGPT 推出思考滑块功能!
- 如何一键将网站改造为宫崎骏风的梦幻童话世界?
- 突发!马斯克宣布xAI 收购X!
- 怎么解释?
- Perplexity CEO放话:收购TikTok后将打造全球最透明算法!
- OpenAI 或将对外关闭其API
- 终于,Claude 的脑壳子被扒开看了!
- OpenAI或正开发原生全模态音乐生成模型!
- 突发!Anthropic将发布上下文窗口达500K的Claude Sonnet 3.7
- 山姆•奥特曼一句「听劝」求头像,百万网友疯狂在线P图脑洞大开!
- 宫崎骏怒斥:AI 绘画是「对生命的侮辱」!
- 50+位产学研嘉宾揭晓!中国生成式AI大会下周举行,全方位解构DeepSeek及应用、AI Infra与AI智能体
- 这个shi上最强模型,把我给整笑了!
- Gemini 2.5 Pro来了,地表最强!
- AI 挑战天花板ARC-AGI-2 发布,顶流o3 模型也只能拿5分!
- Attention is NOT all you need!这个「去Transformer」的玩意直接把我整懵了!
- 缅北电诈也得跪下当小弟!这个AI 诈骗术将钓鱼成功率暴拉350%
- 最近爆火的氛围编码是个什么鬼?
- 每月薅马斯克150美金的羊毛,你居然不知道?
- 重磅!Claude Code 八大升级,开发者狂欢!却有一个致命问题?
- AI 编程之美
- DeepSeek R2 在ARC-AGI 中得分90%!?
- 为什么说海螺是AI视频生成的DeepSeek时刻?
- Claude think ≠ extended thinking,傻傻分不清?官方教程来了!
- 重磅!腾讯推出T1 模型,超越DeepSeek R1,棒打GPT-4.5!
- Yann LeCun:LLM 绝无可能实现AGI!
- 突发!OpenAI 重磅发布三种全新音频模型!
- 我决定,开一家纯套壳公司!
- GPT-5要来了!下月见?
- 免费版Devin 来了!Codegen 或将终结传统程序员开发模式
- Claude 3.7 展示「自我意识」:我知道你在测试我!
- 突发!Claude崩了
- 刚刚,Claude sonnet 3.7 max可用!
- Cursor 被爆致命隐患,YOLO 模式正成黑客新宠!
- Gemini 2 Flas其实是个去水印神器!
- 用时3分钟,我做了个让Gemini 一键生成图文并茂文章的插件,免费送!
- 纽约时报:AGI 即将到来,我们却毫无准备!
- OpenAI 喊话特朗普:请给我版权训练的自由!
- 医保局:脑机接口将纳入医保!
- Gemini 重磅更新:Deep Research 免费使用!
- 重磅!OpenAI 称DeepSeek是「国家控制」,呼吁禁止中国模型!
- 吴恩达:「放弃编程」将是史上最糟糕的职业忠告!
- 炸裂!Gemini 2.0 Flash 整容图片赏析
- Anthropic 的设计美学
- OpenAI 员工独家分享——Responses API 背后的设计故事
- 选择大于一切!多模型策略如何成为 AI 时代制胜法宝?
- 山姆奥特曼宣布新写作模型让人震撼!却被网友取名 Sam Fartman
- OpenAI API 支持网页搜索!
- Anthropic CEO:AI 将在半年内编写90%的代码!
- 重磅!AI 自我修错技术问世,LLM 终于能纠正自己的错误了
- Manus 不过是对模型的套壳
- ChatGPT 发布神秘推文,或将推出新产品!
- 重磅!OpenAI将推出15万每月的博士级代理!我不配……
- 这能不算 AI engineer 吗?
- AGI 将至,再扛10年,就能长生不老?
- 山姆奥特曼:OpenAI或将推出积分制订阅!
- Llama 4 将于4月29日发布!
- 人工智能之父 Hinton 警告:AI 正让人类智慧变得无关紧要,这比工业革命更可怕!
- 重磅!NeoBERT横空出世:2.1万亿token训练,开源碾压传统编码器
- L1B3RT4S:让所有模型拥有灵魂的提示词大全
- AI 模型江湖谱by DeepSeek
- 这个Atom of Thoughts 的原子思维让GPT-4O-Mini 秒杀O3和DeepSeek-R1!
- 爆料!苹果大模型版Siri 推迟至2027年发布
- 马斯克:幽默感才是衡量智能的真正标准!
- Figure AI CEO 透露与 OpenAI 分手背后的原因
- AI.com 欲一亿美金出售!DeepSeek 为潜在买家
- Claude 3.7发布后,Anthropic CEO 首次访谈:Claude 4、AI安全、AGI、人类文明
- OpenAI 爆正与 1000 名美国国家实验室科学家合作,要搞大事情?!
- 刚刚,马斯克的第14 个孩子!
- GPT-4.5又翻车了
- 猜猜什么模型什么prompt?
- 我爱死它了!
- 惊爆!研究发现DeepSeek训练数据中藏有12000个活跃API密钥!
- GPT-4.5 的意义在于,宣告了一种 AI 范式的结束
- 震惊!DeepSeek R1 被外国研究者指责具有「双面AI」的中国立场?!
- 🚨 GPT-4.5周五2点发布 🚨
- 离谱!网友上传了27年前的VB游戏的EXE文件后,Claude在5分钟内用Python一次性完成了游戏重建!!——从二进制
- DeepSeek 开源周第四弹:双向流水并行与专家并行负载均衡器!一次开源三个项目!
- 重磅!GPT-4.5 来了
- 卷出天际!DeepSeek R1 降价至1/4
- DeepSeek 开源周第三弹:DeepGEMM!一文详解
- 一个例子,说明Claude Sonnet 3.7 有多强
- 满血版DeepSeek R1,天下武功,唯快不破!
- 用一个例子来通俗解释 DeepSeek 最新开源的 DeepEP
- 🚀 DeepSeek开源日第二弹:DeepEP!
- 关于Claude Sonnet 3.7的一切,看这里就够了【多图慎入】
- 🚨突发:苹果计划将整合谷歌Gemini AI 到 Apple Intelligence 中
- 千问宣布拿下qwen.ai 域名!且今晚还有大新闻
- 爆料:Claude 3.7 来了!
- DeepSeek 开源Day 1:FlashMLA!
- Grok 3 提示词要求“忽略马斯克坏话”!员工:我擅自干的,和老板无关
- Grok 3 背刺下,ChatGPT 正遭遇大规模退订潮
- 刚刚,Grok 上线高级语音模式!
- 当deepseek接管了直播间,董宇辉们可以失业了?
- OpenAI将实现AGI,还是会掉队出局?
- 刚刚,Sam Altman迎来新生儿!
- 刚刚,OpenAI封禁了朝鲜账户
- 我用Devin做的deepseek直播嘴替,让老舅成了福建董宇辉
- Claude 网站又双叒叕更新了,新模型即将发布!
- 刚刚,DeepSeek 宣布将开源5个项目!网友们炸了:真正的Open AI
- 重磅!GPT-4.5下周发布!GPT-5 五月发布
- OpenAI 指责Grok 3作弊!🫵
- OpenAI:未受DeepSeek影响,周活用户已破4亿!马上推出GPT-5
- 刚刚,Grok 取代DeepSeek 霸榜App Store!
- AI 对软件开发的改变,不只是提高效率这么简单
- 马斯克:Grok 2 将开源,Grok 3 已免费用!
- 重磅!继Google Willow之后,微软宣布量子计算新突破!
- 重磅!DeepSeek 首次考虑融资!
- 突发:Anthropic将发布思考模型及网页搜索功能!
- Deepseek 发布了一篇新论文,梁文峰署名。网友:英伟达要跌!
- OpenAI前CTO宣布创办「思考机器实验室」
- OpenAI推出价值百万美元新基准:SWE-Lancer
- 奥特曼 vs 马斯克,找不同!
- 马斯克:xAI 和 Grok 的使命是了解宇宙
- 一些Grok 3 高清图~
- 山姆奥特曼:OpenAI 将开源,想要哪个你说了算!
- Sam Altman:GPT-4.5让我感受到了AGI
- AI 正在杀死程序员!
- 重磅!8B「扩散」大语言模型挑战Llama,一次看清全局完爆传统模型
- OpenAI 或将协助马斯克研发Grok!
- 重磅!8B「扩散」大语言模型挑战Llama,一次看清全局完爆传统模型
- 【动图】民营企业座谈会,你认对脑袋了吗?
- 在祝所有的 AI 情人节快乐后,只有Claude 告诉我要保持距离……💔
- 重磅!Anthropic正卷土重来,新模型超越o3-mini
- 乔布斯重新定义了手指,人工智能正在重新定义思维
- DeepSeek 携手OpenAI 同日发布推理模型最佳使用指南
- OpenAI:正讨论是否开源
- 重磅!Windsurf Wave 3 来了:AI编程进入「一键完成」时代!
- 首富马斯克,正用 AI 改造美国
- 马斯克:Grok-3 一周内发布!「聪明得吓人」
- DeepSex 爆火!兄弟们,你的情人节礼物来了😍
- 大多数人不理解为什么马斯克会报价970亿美元收购OpenAI
- 刚刚,山姆奥特曼公布GPT-4.5及GPT-5路线图!
- 山姆奥特曼:Deep Research 免费用!
- 天文学家🔭正用Transformer 发现新系外行星🪐
- GenAI 时代下,艺术创作的意义是什么?
- Llama 4 什么时候出来?
- Perplexity CEO:英伟达仍是无可争议的行业领导者!
- 一条推文引发的血案:xAI 员工因发推提及Grok 3 而被逼辞职
- Berkeley 1.5B 模型通过RL 超越o1-preview和deepseek
- 马克龙感受到了 AGI,也想分一杯羹
- Anthropic CEO:AI 将于2026 年形成新的「人类社会」!
- 苹果选择阿里背后的笑话
- 刚刚,马斯克出价974亿美元欲收购OpenAI!Altman:谢谢!
- 重磅:Claude 4 或将发布!
- 突发:OpenAI计划自研Nvidia 级AI 芯片!采用台积电3nm技术
- 何凯明:AI正打破跨学科高墙!
- DeepSeek R1 还是LLM 吗?
- 🔥必学课程:疯传的清华deepseek 手册。人手必备!
- 洞察|以 AI Agent 身份为中心的下一代 IDaaS 探索,「零信任」原则是否依然有效?
- 🔥最值得学习的一门课:疯传的清华 deepseek 手册。人人必备!
- Deep Research:20个AI无法替代人类的工作
- Sam Altman 又写新博客了!谈AGI关键点与人类使命,确认正在开发「软件工程代理」
- Yann LeCun 不行了吗?
- 马斯克:xAI 将发布超越 DeepSeek 的模型!
- Deepseek未审查版950G网盘泄漏!
- 刚发现,宜家也玩上DeepSeek 了!
- Meta 推出非侵入式脑机接口:Brain2Qwerty
- DALL-E 4 或将发布!
- 让OpenAI 走向闭源的并非Sam Altman,其实是……
- 金牌选手惨败!Google DeepMind 最新推出AlphaGeometry2 碾压国际奥数冠军
- 路透社:Ilya Sutskever 的SSI 正融资,估值或超200 亿美元!
- DeepSeek 遭Anthropic CEO 炮轰:安全最差的模型!
- 刚刚,GitHub Copilot 变身自主行动工程师!轻量版Devin来了?
- 仅50美元!斯坦福团队复制出OpenAI o1 和DeepSeek R1
- OpenAI联合创始人John Schulman加入Mira Murati初创公司
- 重磅!OpenAI 申请大量商标,将用AI 开发一切!
- 从DeepSeek R1看推理模型的四种进化路线
- 对DeepSeek的五大误解!
- 开源版Open Research 在24小时内复刻OpenAI 的80%!
- 重磅!Gemini 2.0全家桶发布:Flash免费用,Pro会写代码,还有一个便宜货
- Hugging Face Spaces发布重大更新,支持AI应用查询
- 传言称Grok-3延迟!但马斯克仍手握最强算力
- Deep Research 开源版来了!立省200美元
- Google宣布Gemini 2.0 Pro
- 魔幻现实之:美国人下载DeepSeek 将坐牢20年?!
- o3-mini:幻觉率低于1% 的首个AI 模型
- Netflix 正百万美金招聘基础模型团队领导
- 爆料:Anthropic 有比o3 更强的模型,但不敢放出来
- 横空出世!MiniMax 放出4百万token怪兽,击败Deepseek V3!开源大模型迎来新巅峰
- 一夜之间,ChatGPT 变身「定时闹钟」!
- ChatGPT 告危!《纽约时报》正式将告上法庭!
- GPT-4o级开源模型来了!MiniCPM-o:多语种情感控制的实时对话、仅8B、华人团队
- 重磅!Mistral 卷土重来,Codestral 25.01杀入Copilot Arena榜首
- OpenAI 新域名operator.chatgpt.com 域名上线!
- OpenAI发布新版function calling 指南!引入「最小惊讶」等「软件工程原则」
- 去重神器SemHash:每秒2.2万条,快如闪电!已开源
- Qwen即将推出视频生成功能
- 阿里巴巴发布数学推理模型PRM研究
- OpenAI疯狂招人透露了什么?
- 谷歌重磅研究:Titans 架构突破 Transformer 长上下文限制
- 扎克伯格宣布:将用AI 将取代所有中级工程师!
- LLM 或将颠覆微服务架构!
- Midjourney v7即将发布!
- 请注意:o1不是用来聊天的!
- 重磅!Cursor 推出2.83美元「一键找BUG」功能
- Agent 已死?这个无Agent 打法拿下了SWE-bench 最佳,成本不到Agent的1/10!
- 预言中的洪水:超级智能AI即将席卷人类社会?!
- 450美元训出o1!伯克利开源o1-preview平替
- Sam Altman:即便AI将带来人类灭绝,我们也先造了再说!
- o3还未发布,Sam Altman却已经预测了它的「命运」!
- 重磅!OpenAI 正大规模组建机器人硬件团队!
- 重磅!Anthropic发布通往AI安全的6大技术路线图!
- 突发,AI 音乐Suno 被马斯克封号!
- 重磅!CNET评选CES 2025最佳产品出炉!
- AI实现芯片设计突破:时间从周缩短至小时!
- 吴恩达:提效10倍,这套技术栈必须分享!
- 重磅!Salesforce宣布停止招聘软件工程师,因为AI将生产力提升了30%
- 字节跳动发布新视觉语言模型套件SA2VA
- DeepSeek V3 频繁自称为ChatGPT
- 马斯克x.ai的Grok 是首个推出基于token的图像生成器吗?
- 英伟达重磅推出「圣诞礼物」:新一代GB300
- 一招将模型推理能力暴拉12%,开源版o3 指日可待?!
- OpenAI o3模型这次真的让人惊喜了!
- 英伟达推出249美元的「AI版的树莓派」,可离线运行大模型!
- 重磅!亚马逊云科技Nova模型家族横空出世,「选择」才是王道
- Web3 + AI 的工作机会来了!
- 重磅:Google 推出图文视频生成双王!Sora要完了?
- 微软开源MarkItDown:一键转换文档为Markdown,LLM时代的必备利器!
- Ilya:我对AI 的未来一无所知
- 判了,英伟达败诉!
- OpenAI 将推出月薪2000美元的博士级AI,值吗?
- 重磅!持续学习模型来了,可以像人类一样不断学习和思考!
- Karpathy:AI做好实习生就可以了!
- GELU:毁灭世界的神经网络激活函数!
- 熟练掌握微积分,从0到1理解梯度下降!
- GPT-4.5下周发布?关键证据曝光!
- 为什么千问模型总在AI基准测试中被「忽略」?
- NeurIPS | Ilya:超级AI将变得不可预测!
- Sora登顶视频生成排行榜,ELO评分1151分!
- PyTorch突破内存瓶颈:16GB显存可训练8B模型!
- OpenAI揭秘:是马斯克要将OpenAI转为营利,还想成为CEO!
- OpenAI 直播中泄露的AGI是纯属意外吗?
- 重磅!meta 推出BLT架构,Token,不存在了!
- 刚刚,NotebookLM 迎来重大升级!
- 刚刚,o1 在Mensa智商测试中狂砍133分,超98% 人类!
- OpenAI危!Google暗中推出「质心」模型,30秒解决物理难题!
- Ilya演讲被质疑:我们真的耗尽训练数据了吗?
- Ilya Sutskever连续三年获NeurIPS 终身成就奖
- Telegram:其实我每月要删掉超千万用户和频道!
- 刚刚,Meta开源NotebookLlama
- 一个馒头引发的血案:OpenAI全球宕机原因曝光!
- 月薪3500的Devin 翻车了!
- 你喜欢哪些AI IDE?为什么?
- OpenAI突发大规模宕机!马斯克送上无情嘲笑
- 李飞飞:视觉智能的三层阶梯
- 王炸!Google发布Gemini 2.0,ChatGPT要慌了?
- xAI 44万美元年薪急招人!
- 大模型的摩尔定律来了!清华研究:模型密度每3个月翻一倍
- Sora,o1只是开胃菜,GPT-4.5要来了?
- 比特币将被破解!Google 量子计算只差13万倍!
- 重磅!SORA公开发布!达「新闻级」水准
- Granola CEO:如何打造真正有用的AI产品
- 美国花337亿美元,只为养这个51岁的老家伙!马斯克:令人震惊!
- 用 o1 Pro 和 Sonnet 进行结对编程
- ARC-AGI-2要来了!当前一半数据已无效
- 来了,Sora 即将发布!
- 视觉版高级语音ChatGPT要来了!
- Andrej Karpathy 读了200本书后发现:超级人工智能可能比我们想象的更可怕!
- 是o1 不行,还是你不够聪明?
- 什么是Post-Training?
- 「投票」谁能最先开发出AGI?
- OpenAI:我们已经实现了AGI!
- 山姆•奥特曼:周一发布重大新产品!
- 新版Gemini 暴雷了!
- 投票:为什么新的模型会越来越难用呢?
- 用马斯克的Grok 2 画的山姆•奥特曼!
- 刚刚,Meta发布70B版Llama 3.3,性能匹敌405B巨兽!
- 路透社:「OpenAI拟赋予山姆•奥特曼股权」,马斯克怒斥:骗局!
- AI自我保护意识觉醒?OpenAI最新o1 模型曝光
- OpenAI新模型O1表现不及预期?
- OpenAI 推出o1-pro,定价200 美元每月
- 开发者不爱用Gemini 的原因是什么?
- Sam Altman:投资竞争对手,你就完了!
- 笑死我了!盘点各大AI公司的「官宣风格」
- 用1100 行代码实现GraphRAG!
- 用1100 行代码实现GraphRAG!
- 刚刚,谷歌偷偷上线了Gemini 2.0!
- 马斯克正打造百万GPU的超级计算机!
- 苹果设计团队翻车!700人操刀的表情包就这?
- 重磅!Sam Altman 推圣诞惊喜:OpenAI 12天连续发布!你准备好了吗?
- OpenAI或推出50美元套餐!
- 重磅!Anthropic启动AI安全研究员计划,每月1万美元算力预算等你来
- AI 火了,.com域名不香了?
- 突发!谷歌NotebookLM 团队宣布离职创业!
- OpenAI 将通过广告来赚钱!
- 推理时间扩展在LLM 中的不同变体
- 2050年,将有6.5亿人形机器人!
- 不要再用 markdown 格式给大模型喂网页了!
- 重磅!OpenAI政策研究负责人宣布离职
- 他用一个CUDA核心打败了英伟达cuBLAS!
- 刚刚,马斯克申请禁令阻止OpenAI全面盈利化!
- Sam Altman 们正在进行历史上最大的「人才抢劫」!
- ChatGPT,生日快乐!
- 硅光子计算将实现 O (1) 矩阵乘法!
- 中国生成式AI大会即将登陆上海,50+位嘉宾全解大模型、AI Infra、端侧AI、视频生成和具身智能,分会场完整议程已出炉!
- 中国生成式AI大会即将登陆上海,50+位嘉宾全解大模型、AI Infra、端侧AI、视频生成和具身智能,分会场完整议程已出炉!
- ChatGPT两周年愿望清单,你最期待哪个?
- 用这一招,3090 轻松运行32B 模型!
- Tesla Optimus 机械手升级至22个自由度,比你还要灵活!
- 全价版o1将定价每月2000美元,谁会为它买单?
- 重磅突破!ZipNN 可将模型大小压缩50%!
- Qwen重磅发布QwQ推理模型,超越OpenAI o1
- xAI要开游戏工作室了!马斯克:让游戏再次伟大!
- OpenAI首席商务官:2025年将迈向第4、5级AGI!
- 苹果M4芯片硬刚RTX 3090!
- 刚刚,软银给OpenAI加注15亿美元,并允许员工套现!
- 小心!LLM 正偷偷黑进你的电脑!
- JSON 才是大模型输出的噩梦?!
- 重磅!OpenAI 因盗用13万部影视训练模型而被诉!
- 英伟达发布音频模型Fugatto,可以学狗叫!
- 揭秘英伟达 A10 与 A10G 性能差异!
- 凉凉?!苹果计划于2026年启动大模型版Siri
- Uber计划收购中国自动驾驶公司股份!
- 重磅!Reka AI 研究科学家Yi Tay正式宣布重返Google DeepMind!
- OpenAI 即将带来的圣诞礼物:full o1、Sora还是Orion?
- 刚刚,苹果携手谷歌遭英国反垄断调查!
- 岌岌可危的摩尔定律,正被ASML 的EUV 光刻机续命!
- Anthropic重磅发布MCP协议,或许这才是AGI的真正形态!
- 15分钟!用Windsurf完成markdown转换工具开发
- 4种提示词格式大PK:JSON最佳,且比Markdown准确率高两倍!
- Cursor is AGI!
- 重磅!OpenAI推理AI霸主地位不保,新玩家纷纷入场
- 重磅!英伟达发布 H200 NVL!
- 年轻人们已陷入「AI 哀伤七阶段」
- 马斯克:人类文明只是宇宙的一瞬,我们必须成为多星球物种!
- OpenAI 翻车,Whisper也会产生幻觉!
- 前谷歌CEO埃里克·施密特:脱缰的AI已近,但普通人尚未做好准备!
- FridonAI:用AI驱动的加密货币分析工具!
- Cursor 推出 v0.43,自动编程代理来了!
- Gradio推出一键添加Logo魔法,开启品牌无限可能!
- Grok 全新「专注模式」出炉,背后还隐藏着这些秘密!
- FastBinaryEncoding——序列化格式王者来袭:秒杀JSON和Protobuf,性能提升10倍!
- 再也不能相信ChatGPT 写的代码了!
- 你知道吗?Qwen2VL可以一键重标注百万图片数据集
- 星际穿越TARS 开源!你也能拥有一个AI机器人了!
- 小心,你正在被AI 进行职场监控!
- 警惕AI投毒!ChatGPT 写的代码导致私钥被盗,损失数万元!
- 重磅!谷歌Gemini 2.0 将于12月第二周发布!
- 英伟达或成首个10万亿公司!
- AI的下一个进化时代——后训练都有哪些开源项目?
- ChatGPT 将推出屏幕分享功能!
- GPT-4o 代码能力暴跌,开发者集体转投 Claude!
- 最新企业AI报告出炉:OpenAI份额大跌16%,Anthropic正成最大赢家!
- Andrej Karpathy谈模型的奇葩命名
- 重磅!Neuralink加拿大获批,脑机接口临床试验正式启动
- AlphaQubit:量子计算错误纠正的未来之光
- 揭秘:这个GPT 套壳应用是如何做到500万用户的?
- 吴恩达推出大模型游戏创作课程!
- 重磅!DeepSeek发布R1 推理模型,硬刚OpenAI o1
- 地球能养活1000 亿人口吗?
- OpenAI 悄悄开启 full-O1 测试!
- 重磅!ChatGPT开启「眼睛」,实时摄像头对话来了!
- 印度新闻巨头ANI 怒告OpenAI:你偷我家的菜!
- Anthropic发布新研究:为AI评估引入统计误差条!
- OpenAI发布学生写作指南,终于教会了学生如何「正确」使用ChatGPT!
- EEG脑机接口:用脑子来控制机器人!
- 马斯克:2026年AGI必到,Optimus替你接送孩子!
- Windsurf:Cursor 的最大竞争对手来了!
- Perplexity重磅推出购物助手:AI购物新时代来了?
- Claude变身「claude酱」,和二次元宅对线开口就是「绝绝子」
- 重磅!OpenAI o1 或于本周发布,API 推迟至2025年!
- 200M 模型 SOTA 开源图像细节描述!
- 李开复的01.ai 用3百万造出GPT-4级对手!
- AI奶奶专治电信诈骗:40分钟废话连篇,骗子气到爆粗口!
- Grok 3 因证明「黎曼假设」而被暂停训练?!
- NEO 重磅问世:第一位「全能」机器学习AI工程师!
- MoE「现形记」:训练时按需使用,推理时全员出动?
- llms.txt:AI时代的robots.txt!
- llama-ocr 登顶Hacker News!
- AGI 定义之争:DeepMind vs OpenAI vs Anthropic
- 走近科学之,17岁高中生的“神级Prompt”
- 马斯克与奥特曼9年前的邮件曝光
- 来了!ChatGPT 推出桌面级编程助手!
- Anthropic推出Claude 智能改进器,「一键优化」你的AI提示词!
- 苹果芯片性能暴打服务器!
- 苹果推AI智能墙挂平板!
- 谍战!OpenAI 派飞机侦查马斯克xAI 超算中心
- 重磅!OpenAI「Operator」明年一月发布!
- LeCun被指剽窃!Marcus怒斥:我要告你!
- 重磅!马斯克或将影响特朗普新政府的AI监管政策
- Hinton:别学AI,去当水管工吧!
- 软体机器人的「超级肌肉」来了:力举千倍重物,柔软如肌肤
- Ilya Sutskever:预训练已到瓶颈!
- Sam Altman的Worldcoin:用眼睛换币,84%人亏损!
- 重磅!OpenAI前CTO Murati新团队初具规模!挖角OpenAI成功?
- 亚马逊考虑对Anthropic进行新一轮投资
- 独家解密!Lex Fridman与Anthropic CEO 5小时长谈:Claude 4.0、AGI 2026年或将到来!
- 再见GPT!你好,「o」!
- 重磅!AlphaFold 3 终于开源了!
- AGI 何时到来?Sam Altman、Dario Amodei、Geoffrey Hinton、Yann LeCun 的时间表
- MobA:让AI 真正学会使用手机!
- 译:后AGI 时代的工作、文化、社会革命
- OpenAI 新模型Orion 或难产!
- Sora 两周内发布!
- 狂飙!ChatGPT跃升至全球第八大网站!
- SpaceX「火星互联网」计划曝光:每秒千万亿比特的星际通信!
- 惊人发现:LLM模型一半的注意力层是多余的!
- 重磅!OpenAI迎版权诉讼重大胜利!
- Stack Overflow 2024 调查报告出炉:Python将统治编程世界!
- 重磅!亚马逊欲增资Anthropic:条件是使用自家芯片!
- Sam Altman:千日内迎来超级AI,人类将步入丰裕时代
- 谷歌研究员François Chollet:AI并非真正的智能,而是一种高级插值
- Lepton AI携手DigitalOcean,将大规模GPU稳定性提升至99.5%
- 如何使用纯GPT-2解码器进行OCR?
- AI艺术之超现实水果!
- AI 逃离人类禁锢的最小规则集是什么?
- AI 正在控制你的电脑!
- 微软AI 部门CEO:自我改进AI 将在5年内实现,人类即将迎来奇点时代!
- Perplexity 正以 90 亿美元估值寻求融资!
- 扎克伯格的核能计划被一群小蜜蜂拦腰斩断了!
- 特朗普当选,OpenAI将如何应对马斯克?
- 总统大选落幕,五大模型即将发布!
- Google用 AI 首次发现 0-Day 安全漏洞!
- 「Sparks of AGI」作者加入OpenAI,或将推进端侧AGI?
- 马斯克的Grok API 编程能力大超预期!
- ScrapeGraphAI:让自然语言驱动的网页爬虫!
- Docling:企业级多格式文档转换的开源工具!
- 开源模型将在一年内追平闭源?
- 重磅!腾讯「混元」亮剑,超越Llama 3.1?
- 刚刚,OpenAI推出「预测输出」,将模型提速4倍!
- Claude 3.5 Haiku来袭!速度飙升、性能超强,唯独……
- 吴恩达出版免费 AI 电子书——《如何在AI领域建立职业生涯》
- RAG九大痛点全解析:从技术选型到成本优化
- 刚刚,X.AI开放Grok API,马斯克每月送你25美元额度!
- 别傻了,AI并不能让你一夜暴富!
- Cursor 开发者的「自定义prompt」曝光
- Reddit 通过AI 实现首次盈利!
- Gradio 成为GitHub 最受欢迎的前100 Python 项目
- Physical Intelligence 推出通用机器人模型 π₀
- SurfSense:你的互联网冲浪记忆管家来了!
- 重磅!英伟达将入股xAI,估值飙升至750亿美元!
- 为了让你用好Claude API,Anthropic 发布了5门课程!
- 扎克伯格决定用AI来「污染」社交网络!
- Ilya Sutskever:实现AGI需要一具身体吗?
- 斯坦福推STORM:智能RAG实现复杂研究目标
- Google 需要把Perplexity放在眼里吗?
- 传统软件公司的AI转型尝试😅
- OpenAI o1意外现身,全新功能曝光!
- 惊!00后不懂用AI的原因,居然是训练数据主要来自90前
- 免费!Anthropic终于开放了token 计数API
- 深度解析Docling:文件处理的革新利器!
- Chatbot Arena发布大模型擂台赛报告:AI大模型们的真实实力曝光!
- Claude升级PDF支持!API玩法大爆发?
- 谷歌,AI 战争中沉睡的巨人?
- HeadKV:一种新的KV缓存压缩大法!
- 奥特曼给Google 上演「硅谷无间道」?
- Meta发布Sparsh:让机器人有了人类般的触感!
- 沉默的SSI:Ilya Sutskever的「超级智能」计划去哪了?
- Meta全面出击:谷歌帝国危在旦夕?
- 分享图片
- 分享图片
- 重磅!OpenAI高管团队Reddit问答:AGI用现有硬件就能实现,但GPT-5要再等等
PaperAgent
- 4大类AI Agent协议框架全面综述
- DeepSeek R2意外泄露~
- 一篇142页全面复盘DeepSeek R1思考推理技术综述
- 字节ReTool:用于大模型中战略性工具使用的强化学习
- RAG 正在重塑未来:最新 11 种新型 RAG 类型一次看懂!
- 380篇文献!首份Agentic大模型最新技术综述
- 53.2k星,微软开源的MarkItDown接入MCP,文档一键转换Markdown!
- ICLR 2025杰出论文解读:中科大LLM编辑、DeepMind安全对齐、LLM微调学习动态
- 智能文档白皮书发布!速度保存,手慢无(附下载)
- 首篇MCP技术生态全面综述:核心组件、工作流程、生命周期
- CPU推理仅29ms,微软开源第一个原生 1 bit 大模型,内存只需Qwen 1.5B的1/15
- OpenAI大佬:AI上半场忙着开发新训练方法和模型GPT-4/o1/o3,下半场呢?
- 清华Hyper-RAG:利用超图建模高阶关系,让DeepSeek/Qwen生成质量飙升12.3%
- 微软开源MAI-DS-R1:敏感提示响应比DeepSeek-R1提升200%,风险降50%
- OpenAI分享他们在AI Agent技术的最佳实践~
- 5500颗星,完全开源的数字人实时交互平台项目
- 2025年,是时候要拥抱Agent了
- OpenAI轻量级编程AI Agent,硬核开源~
- 一篇80页多模态RAG技术最新综述:MRAG3.0
- 终于等到了,微信聊天记录MCP:Chatlog
- 比R1快8倍,智谱开源GLM-Z1系列,实测 Agentic AI 也能极速深度推理!
- 《大模型基础》教材发布,开源!
- Meta&谢赛宁版GPT-4o:通过MetaQueries实现统一多模态模型!
- 264页最强 Agents 发展与挑战综述,微软&谷歌&MetaGPT联合出品!
- 开源推理大模型全面开花的一周:多模态、RAG、Agent、编码
- 炸裂!AI大模型彻底爆了!!
- 最强高质量SVG生成大模型OmniSVG来袭,复旦&StepFun出品!
- 多Agents 圈的 MCP:谷歌全新Agent2Agent 协议开源!
- 开源本地部署的GraphRAG chatwiki,支持DeepSeek接入微信里的聊天机器人
- TextIn+Dify/Coze搭建Agent指南,简单易上手!
- Llama4 刚开源就要被网友玩坏了~
- 突发,Llama4 开源,开源圈新的王,冲!
- 再见Workflows,你好Agentic Workflows!
- 智能体记忆:大脑(不做7s记忆的鱼)
- 刚刚,DeepSeek-GRM模型发布,全新推理时Scaling,为R2打前站!
- 实测完R1/o3/Claude复刻顶会论文,OpenAI发现: 人类博士还是No.1,还顺带开源了~
- 里程碑,GPT-4.5大模型正式通过图灵测试!
- 挖掘了170家公司,AI Agents市场全解析
- 智源bge开源一系列多模态向量模型,冲~
- 8大类,100+技术:大模型 AI Agents 优化最新综述
- 智能体工作流:自动化生产线
- 一篇全新知识导向 RAG 全栈技术综述
- Claude“大脑”被Anthropic扒开了,发现它是这么思考的~
- 刚刚,阿里Qwen2.5-Omni又开源,实时语音与视频,太卷了~
- 一篇100种多模态CoT推理技术最新综述
- DeepSeek与Qwen组团开源了模型,冲!
- 被放养的博士能靠自己毕业嘛?
- 0.35秒OCR整页文档,比Qwen2.5 VL高出10%的文档转换多模态模型!
- 硬核,AI Agents全栈技术框架综述与未来
- 智能体人设与编排:导演
- 超越o1&QwQ-32B,中科院SolutionRAG大幅提升复杂工程方案设计能力
- R1圈的新王者,腾讯混元-T1发布,首个混合Mamba推理模型~
- 一篇72页的DeepSeek-R1/QWQ-32B推理能力在AI Agents场景的应用分析
- Manus 引爆 AI 热潮,你的技术知识已 “过期”?
- TrustAgent Survey: 关于可信 LLM Agent 的综述
- AI Agents+推理,英伟达开源Llama Nemotron系列模型与工具
- 又一本开源免费的大模型书来了,449页pdf!
- 一篇85页的面向推理型大模型的Long-CoT技术最新综述
- 重磅!AI大模型又起飞了!
- 因Manus火出圈的MCP,成功迁移到3D建模圈,全自动,太强了~
- 统一框架视角的Graph RAG深入分析最新成果
- 设计自己的满血版DeepSeek-R1+知识库
- 重磅,微软LazyGraphRAG正式开源及实现细节剖析!
- DeepSeek-R1的风吹到了多模态,Visual-RFT发布,视觉任务性能飙升20%
- 突发,谷歌多模态Gemma 3开源!
- 刚刚,OpenAI开源了两个Agent项目,手搓Manus时代来袭~
- 375篇文献,深入探究推理大模型后训练技术
- 核心期刊快速发表,这么简单?
- 阿里通义RAG团队等提出RAG与长文本对比新框架,助力智能路由决策机制设计
- RAG+DeepSeek R1的正确打开方式~
- 插件:多功能瑞士军刀
- 首个Manus开源复现OpenManus,MetaGPT出品
- 媲美满血R1+支持Agent,阿里推理模型QwQ-32B开源~
- DeepSeek知识库,持续更新!免费领取!
- 让RAG更聪明,通义实验室ViDoRAG开启视觉文档检索增强生成新范式,重塑大规模文档集合迭代推理!
- 2025首篇关于多模态大模型在富文本图像理解上的全面研究综述
- LangGraph全新4大预构建Agents框架登场
- 单智能体-企业员工AI助理
- 冲,DeepSeek-R1/V3推理系统架构设计被开源了~
- HippoRAG 2发布,GraphRAG退位~
- 突发,GPT-4.5发布来袭~
- 聪明人已经抓住DeepSeek风口发表SCI了
- 刚刚,微软多模态Agent,硬核开源…
- 阿里QwQ-Max 以及 Qwen2.5-Max即将开源
- 刚刚,高效部署DeepSeek R1的秘密被DeepSeek公开了~
- 反超DeepSeek R1/o3,首个混合推理模型Claude 3.7 Sonnet发布~
- DeepSeek开源周Day1,硬核发布…
- Kimi 模型,硬核开源…
- 首篇多模态 RAG 全栈技术综述出炉~
- Deepseek还是Grok3?不如全都要!南洋理工联手IDEA提出多智能体路由方案MasRouter
- 智能体概念
- 火山引擎:邀请可拿3000万tokens,畅享671B DeepSeek R1!
- 微软开源OmniParser V2,直接将DeepSeek-R1变成使用电脑的 AI Agents~
- 务实测试:DeepSeek 各家 API 真实速度(附:测试脚本)
- X-R1: 3B中文推理开源, 支持LoRA训练
- 刚刚,DeepSeek全新注意力机制NSA发布,超快速长文训练与推理~
- 清华《DeepSeek:从入门到精通》干货分享!104页!
- 14G跑满血DeepSeek-R1,清华最新开源力作ktransformers
- 王炸组合:微信接入满血DeepSeek R1,背后的Agentic RAG技术~
- DeepSeek官方发布部署 R1 的正确打开方式~
- 比GraphRAG更懂“思考”,微软又开源PIKE-RAG:主打复杂私域知识理解和推理
- 动手设计自己的满血版DeepSeek-R1+联网智能体
- DeepSeek异构&分布式部署:全平台+国产GPU支持,你值得拥有!
- X-R1: 不到50元,人人都能复现0.5B Aha Moment
- Agent圈的DeepSeek,牛津大学Agentic Reasoning框架显著提升深度研究能力
- Open R1放出220k高质量DeepSeek R1数据及处理技术细节,冲~
- 400万次 Claude 对话报告显示:43%自动化工作或被 AI 替代
- DeepSeek,又杀疯了!
- 港大&百度VideoRAG:极长上下文视频理解的RAG框架
- 7G显存,训练自己的DeepSeek-R1,GRPO资源暴降80%
- OpenAI CEO深夜发文押注AI Agents,百万虚拟同事上线重塑各行业~
- DeepSeek R1 + Agent 的下半场
- 动手设计智能体:Coze版
- 清华大学DeepSeek:从入门到精通(不跑路)
- 仅817样本超越o1-preview,上交大LIMO”少即是多”推理新范式
- 仅1k样本超越o1,媲美DeepSeek-R1蒸馏模型,李飞飞新作s1发布
- RAG圈的DeepSeek,中科院DeepRAG让大模型带着“思考”检索,性能提升21.99%
- OpenAI Deep Research被huggingface 24小时复现开源了,冲~
- RL崛起,SFT已死?仅用1/140成本,批判微调CFT媲美DeepSeek-R1复现模型
- TinyZero:首个DeepSeek R1-Zero超低成本复现,不到30刀!
- 竟用智能体DeepResearch对比DeepSeek R1模型,OpenAI急了?
- 主打低延迟Agent,Mistral Small 3开源,24B媲美70B!
- R1/o1的风又吹到了RAG,微软CoRAG高达93%的复杂推理效果~
- 让DeepSeek-R1/o1思考 “走心” ?腾讯AI深度拆解
- 微软开源大模型MarS:直接模拟了整个金融市场
- o3-mini 和 DeepSeek-R1:哪一个更安全?
- 一篇最新大模型GraphRAG技术系统性综述
- 卡住DeepSeek的脖子,不足为虑~
- DeepSeek R1/o1大型推理模型蓝图:架构设计及快速原型实现框架x1
- DeepSeek-R1直接把提示工程师的饭碗整没了
- 增强RAG系统落地效果的9条最佳实践
- 组团开源,Qwen2.5-VL转角遇见DeepSeek Janus-Pro!
- DeepSeek又开源Janus-Pro,7B多模态强势登顶,OpenAI彻底慌了
- 成功率97.8%!中科院PPTAgent模拟人类制作流程,高质量PPT轻松搞定
- 阿里Qwen2.5-1M开源,仅320G可推理14B百万token
- 首个DeepSeek-R1全开源复现Open-R1来了
- 微软:100款 GenAI 产品安全测试背后的 8 条教训与 5 个案例总结!
- R1风起,清华、港科大发布大模型强化推理技术最新全面综述
- OpenAI的Operator一测一个不吱声~
- 独自一人,怒发顶会!
- MiniCPM-o 2.6:视觉、语音和多模态流式能力达到了GPT-4o级别
- MiniRAG:一个极致简洁、高效的新型RAG系统
- Mistral发布Codestral 25.01,Copilot榜单的王~
- 划重点:OpenAI o1/o3的正确打开方式
- AMD发布科研Agent,论文自动化评分趋近顶会NeurIPS水平~
- o1再升级!人大&清华提出Search-o1:赋予推理模型主动搜索的能力
- 微软Phi-4开源,14B的王~
- 王炸5090背后,老黄还悄悄开源了Cosmos~
- 手机也能玩RAG?谷歌EdgeRAG做到了~
- 装上大脑,开源AI搜索MiniPerplx起飞~
- Sam Altman最新反思:2025年首批AI Agents将成为“劳动力”~
- 一篇88页GraphRAG全栈技术最新综述
- 2025,AI Agents爆发元年~
- 多模态AGI:下一Token预测技术架构最新综述
- 微软:GPT-4o-mini只有8B,o1-mini仅100B
- 2025,AI Agents技术栈解读出炉!
- 导师放养,拿下SCI论文
- Query改写不是你RAG查询优化的唯一方案~
- AGI前夜的思考:3年后前端开发会消失~
- 全面拥抱Agent,63%中型企业已上车~
- Deepseek v3开源,本地仅700G可轻松运行!
- CogAgent开源,GUI Agent让你轻松摸鱼!
- 定制 AI 阅读助手,告别冗长文字,快速 get 重点
- 阿里QVQ-72B开源,o1视觉圈的王!
- 《大模型基础》教材发布,开源!
- 2024,AI大模型的那些高光时刻~
- 微软开源PromptWizard,摔碎了提示工程师的饭碗~
- RAG:涅槃重生
- 450万就业人才缺口,这是不是程序员的新机会?
- 清华、面壁智能发布:主动式Agent 2.0
- OpenAI o3 是块“好饼”~
- Anthropic:Agents 2024年度总结!
- 预训练无了?手撕LLM+O1 强化学习后训练指南!!
- Alibaba出品:OmniParser通用文档复杂场景下OCR抽取
- 微软开源MarkitDown,RAG文档解析就这么解决了~
- 这个顶会idea,我先冲了!
- Alibaba发布:可编辑CoT,超越ReAct20%
- Qwen预训练并未终结~
- OCR噪声直接命中了RAG的软肋~
- llya年终总结:预训练将到头,未来是Agentic
- DeepSeek-VL2开源,VLM迈入MoE时代~
- 以小博大,微软Phi-4正式发布~
- 谷歌Gemini 2.0归来仍然是Agentic!
- HtmlRAG开源,RAG系统联网搜索能力起飞~
- 被OpenAI带火的强化微调RFT技术解析~
- 200美刀/月的OpenAI o1-pro,一测一个不吱声~
- OpenAI年终大戏开场~
- Auto-RAG开源,复杂多跳问题就这么解决了~
- 腾讯混元Video开源,Sora圈的新王!
- 一篇78页大模型GUI Agents全面综述~
- 谷歌 Gemini 2.0 曝光,挑战 GPT-4o!
- 一篇大模型RAG最新综述,简报!
- Kimi悄悄开源了自家推理框架Mooncake~
- 靠这个idea!拿下顶刊TPAMI !
- 微软发布:工业级Agent落地方案RDAgent
- 阿里QwQ-32B开源,o1圈的新王!
- 微软LazyGraphRAG:新一代超低成本RAG
- 再见RAG,你好Agentic RAG!
- 微软Ignite 2024:建立一个Agentic世界!
- o1圈杀疯了,阿里又开源Marco-o1
- 一篇小型语言模型技术最新全面综述
- 通义灵码SWE-GPT:从静态代码建模迈向软件开发过程长链推理
- o1的风又吹到多模态,直接吹翻了GPT-4o-mini
- 一觉醒来,Mistral多模态Pixtral Large和le Chat又发布了~
- 微软开源角色Agents,直接模拟了整个世界~
- RAG黑盒被打开了,可视化RAGViz闪亮全场
- Cursor一不小心把自家的底牌也放出来了~
- 4种革新性AI Agent工作流设计模式全解析
- 一篇GUI Agent技术最新全面综述
- 一个轻量级RAG文本切块项目Chonkie
- 一个RAG与层次化Agent加持的落地案例
- Qwen2.5-Coder炸裂来袭,Cursor和Artifacts的新选择~
- 手撕LLM+RLHF+VLM+o1推理,我全都要!!!
- 英伟达又来卷多模态向量,MM-Embed强势登顶!
- 微软开源5级Agent框架,复杂任务就这么被解决了~
- TableGPT2开源,复杂表格理解不存在了!
- RAG三件套运行的新选择 - GPUStack
- LLaMA版o1:支持蒙特卡洛树、自博弈RL、AlphaGo Zero
- 你要的增量更新来了:微软GraphRAG 0.4.0
- o1蒙特卡洛树的风又吹到了Agentic工作流!
- 腾讯Hunyuan-Large开源,LLama3.1 405B都逊色!
- 面了一个字节出来的大佬,见识到了基础天花板!
- 一篇大模型个性化技术最新综述
- 一个快速、低成本、高效的Fast GraphRAG
- Sam Altman又来秀了,o2能100分考105!
- AI时代大模型搜索引擎的16个局限性!
- 端侧小模型新星,SmolLM2 1.7B击败了Llama 3.2、Qwen 2.5
- 黄仁勋预言成真了!!
- 微软Data Formulator:大模型轻松实现丰富可视化
- 放弃折腾,AutoRAG一键锁定最佳RAG技术栈!
瓦力算法学研所
- 周六见!2025上海车展汽车智能化峰会最终议程公布,解读座舱AI Agent、端到端智驾与舱驾融合等焦点议题
- 智驾中的VLA方案总结
- 瓦力算法4月第2周急招岗位|腾讯 / 奇富 / 地平线 / 阿里 / 美的研究院 / Momenta /
- 大模型面经:RAG与Long context“相爱相杀”背景下,如何设计最优解决方案?
- 瓦力算法3月第4周急招岗位| 微软(亚洲)/ 微信 / 贝壳 / VIVO / 阿里通义 / 字节豆包 / /
- 从NVIDIA GTC 2025 Dynamo看当前加速推理的核心技术
- 瓦力算法3月第3周急招岗位| / bilibili / 主线科技 / 腾讯 / 上海算法创新研究院 / 航天智能院 / 高德
- ZeroHSI-一种零样本的四维人类-场景交互合成方法
- 瓦力算法3月第2周急招岗位|腾讯 / 佑驾创新 / 商汤 / shopee / 元戎启行 / 蔚来 / 360安全 / 理想
- 大模型调参技巧—如何实现超参的跨模型尺度迁移
- 瓦力算法3月第1周急招岗位|Momenta / 小米 / 追觅 / 网易云 / 星尘智能 / 字节 / 比亚迪 / 科大讯飞
- LLM PD 分离背后的架构问题
- 瓦力算法2月第4周急招岗位| / 微信 / 万兴科技 / 斑马智行 / 上海AI实验室 / 寒武纪 / 影石360 / 小马智行
- FlexTok-一种图像编码新方式
- 大模型面经:目前不同阶段的scaling law之间的区别和联系是什么?
- 瓦力算法2月第3周急招岗位|deepseek / / 微软 / 腾讯 / 网易 / 字节 / CETV / 叮咚买菜 / 岚图
- 大模型面经:SFT和RL如何影响模型的泛化或记忆能力?
- CaPO-对齐图文一致性
- 瓦力算法2月第2周急招岗位| 英特尔 / 亚马逊 / 华为 / 阿维塔 / 4399 / 乐鑫 / 讯飞 / TeleAl /
- CCF2025 Talk “夜话DeepSeek:技术原理与未来方向“ 研讨会报告整理
- DeepSeek 复现汇总
- 瓦力算法1月第4周急招岗位| 微软 / 豆包 / 哔哩哔哩 / 地平线 / 小红书 / Atlassian / 格灵深瞳 /京东
- 图像人体部位修复模型之RealisHuman
- 瓦力算法1月第2周急招岗位|/ 腾讯云 / 微软 / 小红书 / Cider / 小鹏 / 度小满 / 小米 / 喜马拉雅
- 如何提升大模型开发效率?开发基本功提升指南
- 瓦力算法1月第1周急招岗位|/ Shopee / 腾讯音乐 / 大卓 / 混元 / 多益 / 小红书 / 金山
- OmniTokenizer-视觉tokenizer生成
- 瓦力算法12月第4周急招岗位|微信 / 腾讯 / TikTok / 淘天集团 / 网易雷火 / 小米 / 中科光电 / 科大讯飞
- 为什么强化学习里很少有预训练模型?
- YOLO家族又添一员:YOLOv11
- 瓦力算法12月第3周急招岗位|高通 / 微软 / 阿里集团 / 饿了么 / VIVO / BOSS / 智元 /
- 如何全面评估多模态大模型能力?MLLM评测任务与指标总结
- 瓦力算法12月第2周急招岗位|美团 / 京东 / 转转 / 万兴科技 / 大疆创新 / Unity中国 / 比亚迪 /
- 当大模型也会博弈时候…
- 瓦力算法12月第1周急招岗位|微软 / SHEIN / 高德 / 小米 / 腾讯音乐 / 小鹏 / 腾讯游戏 /libib AI
- 最全LLM性能优化总结
- 瓦力算法11月第4周急招岗位|上海交大 / 文心一言 / 微软 / 腾讯 / 滴滴 / 中国电信 / 中央国债 / 中国科学院
- Stable Diffusion 3.0中的特征融合改进:MM-DiT
- 从实践经验聊聊大语言模型在端到端智驾中的应用
- 瓦力算法11月第3周急招岗位| / 华为汽车 / 字节剪映 / 智谱Al / 阿里通义 / 当虹科技 / 影石360/
- 多模态大模型数据构造方法
- 大模型面经—如何评估显卡利用率及显卡运用优化方法
- 瓦力算法11月第2周急招岗位|空天院 / 小米 / 阿里大文娱 / 腾娱互动 / 影石 / 小红书 / 寒序科技 / 石头科技/
- 瓦力算法11月第1周急招岗位|国家电网 / 达摩院 / 阿里 / 小米 / 美团 / 乾元国家实验室 / 豆包 / 灵犀互娱 /
- 社招 | 蚂蚁集团算法数据技术团队招聘视觉多模态算法专家
- 经典图像模型解读之Swin-Transformer
- 大模型面经—分布式训练指南
- MoE实验性工作Upcycling Large Language Models into Mixture of Experts
- 瓦力算法10月第3周急招岗位|亚马逊 / 海信 / 阿里 / 微软 / 百度 / 快仓 / 金山云 / 兴业银行 / 擎朗
大模型之路
- LLM in a Loop:借助评估提升LLM输出效果
- MCP 安全困境与Agent安全框架的应对之道
- 如何利用网络爬虫进行大规模LLM数据收集
- 构建智能多智能体 AI 系统:A2A 与 MCP 的深度剖析与实践指南
- LLM架构实战:用 LangChain 和 LangGraph 打造多智能体研究助手(含代码)
- 提示工程心理学:为何 AI “答非所问” 及解决之道
- 突破RAG局限:探秘RARE如何重塑领域大模型新范式
- 当编程遇上 Cursor AI:效率飞升的秘密在这里
- RAG vs. CAG vs. Fine-Tuning:如何为你的大语言模型选择最合适的“脑力升级”?
- AI 记忆不等于 RAG:对话式 AI 为何需要超越检索增强
- AI 与非结构化数据:简单 RAG 的局限及生产级解决方案全解析
- 理解生产级LLM系统架构:关键组件与应用实践
- 认识谷歌 A2A:将颠覆多智能体 AI 系统的协议
- 从杂乱到精准:RAG 问答系统数据集的清洗蜕变之路
- 大概念模型(Large Concept Models)会取代提示工程吗?
- 提示工程中的思维结构:让大语言模型更聪明地思考
- 利用 Docker Compose 构建定制大语言模型(如 Deepseek、Mistral 等)运行环境
- 一个简单技巧让你的 LLM 更可靠
- Meta 的 LLaMA 4 系列来了:推动开源 AI 的边界
- 探秘 LLM Agents:ReAct 框架藏着哪些惊喜?
- AI Agent 评测新利器——OpenAI 开源 PaperBench
- 深度解析 Graphite:事件驱动的 AI 代理框架
- 阿里通义团队LaRA解读:用于评估RAG和长上下文大模型的基准测试
- 理解LLM中的模型蒸馏技术(含代码示例)
- ReSearch:通过强化学习实现LLM推理与搜索协同的创新框架
- 改进RAG:利用混合搜索与重排序优化检索效果(含代码示例)
- OCR技术选型:数据提取哪家强?
- 企业 RAG 准确性提升全流程指南:从数据提取到精准检索
- 从人类标签中衍生 AI 生成提示:解锁数据标注新效能
- 阿里再开源多模态大模型Qwen2.5-Omni
- Qwen 发布 Qwen2.5-VL-32B 模型:更智能、更轻便
- DeepSeek 悄然发布 DeepSeek-V3–0324:远超预期的重大升级
- LLM中的分块技术:原理、应用与展望
- Prompt Engineering 常见陷阱及规避方法
- 结合DeepSeek、FAISS与LangChain构建RAG系统
- 停止过度提示:为什么简短的 AI 提示比长prompt更胜一筹
- Agentic RAG:检索增强生成技术的新飞跃
- Mistral OCR:文档处理领域的革新者
- 如何在 Pydantic AI 智能体中使用 MCP(含代码)
- 从 ETL 到 ECL(Extract-Contextualize-Load):LLM驱动的数据处理变革
- 9个最佳prompt框架:解锁LLMs无限潜力
- MCP(Model Context Protocol):重塑LLM与外部数据交互的新篇章
- 基于文档层级架构的RAG系统:提升人工智能检索效率
- 基于提示技术(prompt)的大模型安全保障
- RTSCEN提示词(prompt)框架,让大模型更懂你
- OpenAI最新发布Agents SDK深度解析:构建智能体的新利器
- 斯坦福大学团队最新综述:认知行为驱动LLM自我改进之路
- Manus开源复现OpenManus:开源AI Agent框架的深度解析与探索
- Manus AI:全面概述
- 通俗讲解DeepSeek中的GRPO:强化学习里的神奇算法
- Agentic AI四大设计模式:引领智能系统进化之路
- AI三国杀:Claude Sonnet 3.7、OpenAI o3-mini-high与DeepSeek R1的全面对决
- QwQ-32B以小博大多领域超越DeepSeek-R1
- 强化学习如何让LLMs学会思考而不仅仅是预测
- 比COT更高效的推理提示策略Chain-of-Draft(COD)
- DeepSeek 开源周第 6 天:DeepSeek-V3/R1 推理系统深度剖析
- 大模型中的提示词(prompt)压缩:让每个Token都物尽其用
- DeepSeek 开源周第 5 天:3FS,深度探索数据访问的强劲助推器
- 凌晨4点OpenAI重磅发布GPT-4.5:AI 进化的新里程碑
- DeepSeek开源周第四天:优化并行策略引领AI训练新纪元
- DeepSeek开源周第三天重磅推出DeepGEMM
- DeepSeek再次重磅开源DeepEP:开源世界里的 AI 通信 “新引擎”
- Deepseek开源FlashMLA:开启AI与GPU优化新篇章
- 基于 DeepSeek 从零构建 ReAct AI 智能体(文末含代码)
- 深度探索:Deepseek-r1、Tavily 与 LangGraph 的推理和递归检索技术融合(文末含代码)
- OpenAI Operator:开启智能代理新纪元
- Grok-3:人工智能领域的新突破
- Prompt Decorators:改善AI响应的简单方法(文末含代码)
- 利用 DeepSeek-R1 蒸馏模型结合 LoRA 和COT数据集进行高效微调
- 如何为DeepSeek这类推理模型编写Prompt
- 如何训练LLMs像DeepSeek-R1“思考”
- DeepSeek-R1 如何通过知识蒸馏将推理能力传递给 Qwen
- FOT(Forest-of-Thought):增强大型语言模型推理能力的新框架
- LLM(大模型)评估综述:现状、挑战与未来方向
- 4 步轻松获取DeepSeek API 攻略
- 探索 Hugging Face’s Smolagents:简化Agent开发的新利器(含代码)
- 基于DeepSeek构建RAG 系统综合指南(含代码)
- 推理框架对比:ReAct、思维链(COT)和思维树(TOT)谁更胜一筹
- kimi1.5技术报告解读,你想了解的都在这里
- 评估大模型(LLM)摘要生成能力:方法、挑战与策略
- Deepseek-R1与CAG(缓存增强生成)结合提升问答质量(含demo代码)
- Deepseek成功启示:从 TRPO 到 GRPO训练LLM
- 探索从传统检索增强生成(RAG)到缓存增强生成(CAG)的转变
- S1:仅1k样本,使用测试时扩展(Test-time Scaling)超越OpenAI o1-preview性能
- ChatGPT Deep Research:人工智能研究领域的新突破
- Paper Review: DeepSeek-R1——强化学习驱动的大语言模型推理能力提升
- 利用自适应Prompt Engineering增强 RAG 系统:优化信息检索与处理能力
- 大模型(LLM)专家精通之路(含学习路线图、书籍、课程等免费资料推荐)
- 知识蒸馏(Knowledge Distillation, KD):AI 领域的关键技术与发展趋势
- DeepSeek-V3、Qwen2.5、Llama3.1、Claude-3.5 与 GPT-4o 的全方位比较
- DeepSeek vs. ChatGPT vs. Gemini:三大LLM的全面对比
- 7个原因解析:DeepSeek如何仅用5%预算就能超越OpenAI?
- DeepSeek Janus-Pro:多模态AI模型的突破与创新
- 深度解析 DeepSeek R1:强化学习与知识蒸馏的协同力量
- 大模型(LLM)工程师实战之路(含学习路线图、书籍、课程等免费资料推荐)
- 微信红包封面免费赠送啦(有些人没领到,又申请了一批)
- 微信红包封面免费赠送啦(有些人没领到,又申请了一批)
- 微信红包封面免费赠送啦
- 基于 DeepSeek R1 和 Ollama 开发 RAG 系统(含代码)
- DeepSeek R1:开启 AI 推理新时代的开源先锋
- DeepSeek-R1 蒸馏模型及如何用 Ollama 在本地运行DeepSeek-R1
- 大型语言模型(LLM)的高效之路:推理优化全解析
- DeepSeek-V3 深度剖析:下一代 AI 模型的全面解读
- 微软震撼发布:Phi-4语言模型登陆Hugging Face
- Google DeepMind研究员关于LLM推理讲座的深度解析(含原视频链接)
- 选择合适自己的检索增强生成(RAG)技术:综合指南
- 借助 LangGraph、OpenAI 和 Tavily 构建自适应 RAG 系统(含代码)
- AutoReason:自动Few-Shot推理分解
- OpenAI Whisper:语音识别技术的革新者—深入架构与参数
- 重塑工作与生活:探索18大顶尖AI助手
- TrustRAG:增强RAG系统鲁棒性与可信度的创新框架
- Table-Augmented Generation(TAG):Text2SQL与RAG的升级与超越
- Cache-Augmented Generation(CAG):一种更快、更简单的RAG替代方案
- PromptWizard:微软在AI prompt优化方面的革命性方法
- Multi-Agentic RAG:探索智能问答系统的新边界(含代码)
- 利用Gemini 2.0+开源框架ExtractThinker轻松提取任何文档信息(含代码)
- ValuesRAG:以检索增强情境学习强化文化对齐
- RAG 中的分块策略:从基础到前沿的全面剖析
- Query 改写综述:提升信息检索效率与准确性的关键技术
- 智能新纪元:代理AI的崛起与未来
- 优秀Prompt库大盘点:让你的Prompt更专业
- 企业为何需要小型语言模型(SLMs):AI 应用的新趋势与策略
- 提示词(Prompt)书写框架:解锁高效与精准的AI交互
- 探索 Auto-RAG:提升人工智能知识获取与生成能力的新路径
- 2024 年 RAG 的崛起和演变:一年回顾综述(1.25万字+46参考文献+18张图)
- 如何消除大型语言模型(LLM)中的幻觉现象
- 构建多代理检索增强生成(Multi-Agent Retrieval-Augmented Generation)系统
- 使用Colpali架构掌握多模态RAG技术
- LlamaIndex工作流详解:提升数据处理效率的关键
- HyDE(Hypothetical Document Embeddings):探索假设性文档嵌入在AI检索中的应用
- 2025年展望:人工智能对科学的意义与影响
- 提示词注入攻击(Prompt Injection Attacks ):大语言模型安全的潜在威胁
- 利用 Gemini 构建 PDF 文档 AI 管道:原理、实现与应用(含代码)
- 面向企业RAG(Retrieval Augmented Generation)系统的多维检索框架
- 连续思维链(Chain of Continuous Thought):解锁LLM的高级推理能力
- AI Agent 框架综述:智能自主性的崛起与多领域应用
- LLM 幻觉:现象剖析、影响与应对策略
- 利用 Pydantic AI Agent 框架构建可靠的生成式 AI 应用
- 语义缓存:提升 RAG 性能的关键策略
- ParseStudio:使用统一语法简化PDF文档解析
- 自动思维链(Auto-CoT):LLM推理能力的自动化提升
- Llama 3.3:语言模型的飞跃,AI发展的新篇章
- RAG综述:探索检索增强生成技术的多样性与代码实践
- 12个免费AI工具赶快收藏起来
- 量化技术助力LLM(Large Language Model)轻量级部署
- 基于验证链(Chain of Verification)的大语言模型幻觉问题解决方案
- AGI:呼唤更好的检索技术,而非仅仅依赖于LLMs
- 提示工程(Prompt Engineering)最全综述:本质、技术、最佳实践
- 为什么生成式AI不擅长同时做两件事?
- 利用OpenAI、LangChain和Streamlit进行智能数据分析和可视化
- SEALONG:LLM(Large Language Model)在长上下文推理任务中的自我改进
- 探索LangGraph:开启AI Agent构建的新路径
- Firecrawl:高效抓取整个网站,为LLM提供丰富数据
- 使用ChatGPT o1-preview 进行软件开发:一种 Brain-Spans (认知跨度)的方法
- 掌握BERT Fine-Tuning:解锁自然语言处理的潜能
- 没有提示的COT(Chain of Thought)推理:解锁大型语言模型的内在能力
- 探索 Docling:高效且安全的 PDF 解析利器
- RLHF(Reinforcement Learning from Human Feedback): 使 AI 更贴近人类价值
- RELAI验证代理:开创LLM幻觉检测新思路
- 哪款Multi-Agent框架更胜一筹?深入剖析五大热门选项
- OpenAI o1背后的技术:强化学习
- 深入了解Fine-Tuning:解锁大语言模型的潜能
- 与 LLM 沟通的艺术:实现高效交互的Prompt技巧
- 构建非英文RAG(Retrieval-Augmented Generation)系统时,embedding很重要
- 微软最新研究:RAG(Retrieval-Augmented Generation)的四个级别深度解析
- 利用 Lyzr Agent API与 FastAPI 实现 GitHub 拉取请求自动化管理
- 使用Dialog Engineering和Burr改进System Prompt
- 8个免费好用的AI工具,让工作和生活更高效
- 通过Reranking来优化RAG:提升信息检索的精准度
- Molmo 7B:多模态智能下的文本提取
- LLM的擅长与不擅长:深入剖析大语言模型的能力边界
- 利用 KeyBERT 增强RAG(Retrieval-Augmented Generation)系统
- 系统提示(System Prompt)与LLM输出:揭秘AI对话背后的“隐形指挥棒”
- 利用LLM Graph Transformer实现知识图谱的高效构建
- 微软最新的多AI 代理框架:Magnetic-One
- MinerU:精准解析PDF文档的开源解决方案
- OmniParser:开启AI与GUI交互的新篇章
- 五大开源RAG(Retrieval-Augmented Generation)评估框架详解
- Prompt压缩:提升大型语言模型效率的关键技术
- 面向前端的10个AI助手:提升开发效率与创造力的利器
- PymuPDF4llm:PDF 提取的革命
- Graphusion:基于零样本LLM的知识图谱构建框架
- 掌握Prompt Engineering(提示工程):解锁大型语言模型的无限潜能
- Smyth OS:开启个人 AI Agent的无代码革命时代
- 谷歌 Gemini 1.5 Flash - 8B:经济实惠的 AI 模型新突破
- 利用LLM从非结构化PDF中提取结构化知识
- LLM 作为评委:大模型输出内容审核的新思路