【行业动态】全球AIGC大事日报


【行业动态】全球AIGC大事日报

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

AIGC行业动态
全球AIGC大事日报
1、夸克已累计生成超1000万份志愿报告
2、大鱼半导体正式宣布入局安防市场
3、阿里副总裁:夸克已生成志愿报告超300万份
4、阿里开源音频生成模型能看懂画面为视频配音
01
夸克已累计生成超1000万份志愿报告
阿里巴巴AI旗舰应用夸克已累计为考生和家长生成超1000万份专业级志愿报告。这些报告由今年推出的“志愿报告”Agent生成,采用了具备“任务规划—执行—检查—反思”能力的深度研究技术。业内认为,这一成果已成为国内最大规模的深度研究技术应用。
“志愿报告”是今年夸克针对志愿填报推出的核心功能,是夸克“深度研究”技术在垂类场景中的代表应用,也是国内唯一可以生成完整志愿报告的Agent。Agent具备高度个性化与策略性,能够基于用户信息规划思考路径,调用搜索工具进行信息收集,通过志愿工具进行志愿表操作,过程中不断进行检查和反思。Agent底层由夸克高考志愿大模型与专业的高考知识库提供支持,具备接近专家水平的决策能力
02
大鱼半导体正式宣布入局安防市场
今日,在刚刚开幕的深圳国际安防展上,深耕无线通信领域多年的芯片设计公司南京大鱼半导体,正式宣布其首入局安防市场,并发布了全新的“大鱼安防通讯解决方案”。大鱼半导体确立了“开放协作”的战略:专注解决底层的通信难题,将稳定、强大的连接能力赋予安防合作伙伴,帮助安防行业产品实现在任何严苛环境下都能稳定可靠的连接。
在展会现场,大鱼半导体全面展示了其安防生态的核心优势:
(1)依托自研FishLINK技术,提供最远可达100公里的无线传输通道;
(2)功耗控制表现优异,实现了覆盖“图传、对讲、传感”的全链路低功耗;(3)20个前端摄像头可共用一个中心接收端,将监控中心的硬件数量和部署复杂度都降低近一个数量级,运维压力也随之大幅减小,实现高效费比。
03
阿里副总裁:夸克已生成志愿报告超300万份
随着全国各地高考成绩陆续公布,志愿填报进入高峰期。今日,多位用户在社交平台反馈,使用夸克生成志愿报告时出现排队等待现象,多次出现排队超万人的情况。对此,阿里巴巴集团副总裁吴嘉在朋友圈发文,截至今日15:15,夸克系统已累计生成超300万份志愿报告,当前的排队情况主要由于多个省份集中出分,用户需求在短时间内集中爆发。
夸克团队已紧急扩充算力,全力压缩等待时间,力争让每一位考生都能顺利拿到专属的志愿报告。据了解,夸克是当前国内唯一可生成专家级志愿报告的AI应用。此前,阿里巴巴已预先调配了比去年多100倍的算力资源支持夸克,但在河南、湖北、山东等高考大省出分时,算力依旧吃紧。
04
阿里开源音频生成模型能看懂画面为视频配音
阿里通义实验室开源了旗下首个音频生成模型ThinkSound。该模型首次将CoT(思维链)应用到音频生成领域,让AI可以像专业音效师一样逐步思考,捕捉视觉细节,生成与画面同步的高保真音频。ThinkSound的代码和模型已在Github、HuggingFace、魔搭社区开源,开发者可免费下载和体验。
在开源的VGGSound测试集上,ThinkSound的核心指标相比MMAudio、V2A-Mappe、V-AURA等现有主流方法均实现了15%以上的提升。例如,在openl3空间中Fréchet距离(FD)上,ThinkSound相比MMAudio的43. 26降至34.56(越低越好),接近真实音频分布的相似度提高了20%以上;在代表模型对声音事件类别和特征判别精准度的KLPaSST和KLPaNNs两项指标上分别取得了1. 52和1.32的成绩,均为同类模型最佳。
目前,通义实验室已推出语音生成大模型Cosyvoice、端到端音频多模态大模型MinMo等模型,全面覆盖语音合成、音频生成、音频理解等场景。
开源地址:
https ://github. com/liuhuadai/ThinkSound
https ://huggingface. co/liuhuadai/ThinkSound
https ://www. modelscope.cn/studios/AudioGeneral/ThinkSound


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录